Wintel联盟忙着定义AI PC，但各做了一半-虎嗅网

大模型与生成式AI已经炫技一年多，吊足了普通消费者的胃口，一千个用户心中有一千个AI PC。在不同厂商数次“发布”AI PC这款全新形态的个人计算平台之后，上一代PC行业的主导者，决定收敛对AI PC的定义——更多的是从自己的能力出发，而不是从用户体验。

微软与英特尔是传统的Wintel联盟的核心，这几天在中国台湾举办的一场AI PC峰会上，联合宣布了AI PC至少要满足如下特征：带有NPU（神经处理单元）、CPU与GPU、Copilot及其物理按键。但英特尔此前又有自己的定义，非常简洁，只要带有NPU即可。

它们正在做的事，正好印证了未尽研究上周发布的《AI大模型亢奋一年多，该上终端设备了？》核心观点之一：AI PC的两大杀手级应用，一个是基于大模型和智能体技术的AIOS，另一个是基于混合算力的推理引擎。只不过，微软更强调让Windows与Copilot融合起来，构建自然交互的AIOS；英特尔则侧重NPU+CPU+GPU的异构算力组合，让本地承担更多AI加速任务，打造云端混合的推理引擎。

Wintel联盟是PC行业从垂直整合走向分工合作的产物。而AI PC则是大模型的小型化与个人化所催生的一次产品革命，仍处于早期，需要有人完成整合，将AIOS与混合推理引擎完整有序地塞进PC里。苹果有机会在自己的封闭系统中这么做，那么，苹果之外的更大的市场呢？

一、Chat with Chips

芯片厂商对AI PC的定义普遍较为简洁，在传统的CPU与GPU（包括集成显卡）之外，搭载了自家AI加速的芯片即可。三类芯片都具有一定AI处理能力，可根据不同算力需求，来调用最合适的AI工作负载。不同来源的本地算力的异构组合，加上云端算力支持，构成了AI PC混合推理引擎。

目前，在本地消费级设备上，英特尔主要是Meteor Lake的Ultra芯片，AMD主要是Phoenix的Ryzen 70系列与Hawk Point的80系列，高通主要是骁龙8与X Elite。研究机构Canalys将2020年苹果的M1视为最早的AI芯片，但英伟达表示2018年起的GeForce RTX已经称得上专为AI打造。

英伟达已经吃下了几乎所有的大模型训练市场，还计划将成功复制到推理市场。推理目前占它业务构成的40%，但主要在云上。用户手上的终端，芯片厂商都还有机会，但先要把用户与开发者生态吸引到自己周围。

英伟达的GTC刚过去不久，英特尔与AMD就马不停蹄地在世界各地宣讲自己的AI PC蓝图。上周，AMD的CEO苏妈现身北京，表示将为用户提供从云到PC的无缝AI体验，还展示了一把阿里的Qwen 1.5（通义千问1.5版）跑在本地的样子。英特尔则在中国台北宣布新的开发者计划，还发布了适用它NPU芯片的开发套件，预装软件堆栈、编程工具、编译器和启动所需驱动程序。

它们也都希望直面用户。今年年初，英伟达推出Chat with RTX（简称 ChatRTX）是一个信号，这款程序允许用户加载Llama2、Mistral与Gemma等当前主流高性能开源模型，帮助分析文档其他文件，但只能在英伟达指定性能的GPU上运行。未来，中国用户可以选择加载ChatGLM。英特尔、AMD与高通，也都在跟进推广本地部署大模型，它们给出的解决方案，基本只适用于自家的芯片。

AI PC的各项技术仍处于发散式创新的阶段。英特尔正在推广OpenVINO，AMD的是ROCm，英伟达建立了CUDA生态。今年年中，搭载高通ARM架构的X Elite芯片的AI PC即将上市，NPU算力高达45 TOPS；今年年底，x86阵营的英特尔将会迭代它的NPU，AI 性能是目前的三倍。芯片架构、AI框架与API接口，标准各异，稳定性不足，无形之中抬升了开发与部署的门槛。

混合推理引擎才是AI的未来。去年，高通提出了在云服务或用户终端分布式处理AI工作负载的三种机制。今年，英伟达推出NIM服务，野心昭然，希望从开源模型到专有模型，都能跑在任何有英伟达GPU的地方。

二、Copilot不能成为Clippy

微软的AI PC之年，始于它最近推出两款新的Surface设备。它们面向商业用户，配备了Ultra芯片，以及Copilot物理按键。微软要求OEM商在AI PC中配备专门物理按键，方便一键弹出这个入口，Copilot之于微软AI PC的重要性可见一斑。

微软希望Windows系统深度融合Copilot。这是微软眼里的下一代AI驱动的操作系统。也可以称之为AIOS，将改变用户与硬件、软件的交互方式，未来还将改变硬件与硬件、软件与软件之间的交互方式。

为了让Copilot逐步接管Windows系统，微软下了狠功夫，也招惹了用户不满。许多人认为这项功能并不好用，不值得放到Windows任务栏正中央如此显眼的位置。还有一些好事者很想知道，在无法安装Copilot的地区，用户按一下这个物理按键，会弹出什么内容，整机厂商的智能助手，还是OpenAI的竞争对手？

微软不希望Copilot成为曾经的Clippy，显眼但没什么大用，尤其是在更强调本地算力的AI PC上。英特尔客户端计算事业部副总裁Todd Lewellen透露，微软坚持让Copilot本地运行时只跑在NPU上，而不是包括CPU与GPU的异构算力上。GPU虽然强大，英伟达新一代GPU的AI算力已经覆盖了从200 TOPS到1300 TOPS，但那是功耗换来的。微软希望GPU和CPU能干好自己该干的，减少对电池寿命的影响。

事实上，英特尔与AMD只是异构算力整体接近40 TOPS，前者NPU算力10 TOPS，后者的16 TOPS。只有今年晚些时候的X Elite芯片的NPU算力达到了45 TOPS。也许微软眼里真正的AI PC会在5月20日现身，纳德拉会在这场有关Windows和Surface AI的特别活动上，分享公司的“人工智能愿景”，涵盖软件和硬件。

这将为微软争取到宝贵的2个月时间。Copilot目前还只能跑在云上，混合算力引擎尚没有实战。即使跑在云上，微软也对Copilot并不满意，上周挖空了自己投资的AI独角兽Inflection AI。该公司创始人苏莱曼（Mustafa Suleyman）带着一班人马，突然加入微软新设的“Microsoft AI”部门。他本人是新部门的CEO，独揽Copilot、Bing和Edge等产品的研发。苏莱曼此前还是DeepMind的联合创始人及首席产品主管，经验丰富。纳德拉还找刚从Stable Diffusion离职的创始人Emad Mostaque聊了聊。

这被外界视为微软开始对面向消费者的AI业务失去了耐心。去年二月，纳德拉还称要让谷歌这个搜索的大猩猩起舞，但一年过去，生成式AI加持的Bing并没有太大起色。据Statcounter统计，它的全球全平台市场占有率，仅增长了约0.5个百分点。

微软充满了紧迫感。它对Copilot最大的底气在于OpenAI。但这几天，在大模型竞技场（Arean Elo）上，Claude 3的排名反超GPT-4成为第一。ChatGPT访问量增长也已经放缓，皮尤研究中心调查发现，曾经用过ChatGPT的美国用户，从去年7月的18%增长到今年2月的23%。

三、4月，谁准备好了

芯片厂商常年面向企业客户，不擅长开发面向消费者的软件产品，几家Chat With Chips的解决方案，至今还是粗糙的交互页面，没有用户期待的AIOS的样子。微软还指望着混合算力引擎准备就绪，高通的ARM架构虽然做到了高性能低功耗，但缺少Wintel联盟长期形成的软硬件生态。

这个时候，就像克里斯坦森所说的，行业需要站出来垂直整合者，向市场作出创新者的解答，“改刀”“缝合”这些核心技术组件与模块，将其收敛为可以最终交付的完整的产品。

以往扮演这个角色的是苹果。它拥有自己的芯片，自己的操作系统，还拥有自己的PC品牌，已经从十年造车的“坑”里爬出来，回归它最熟悉的个人计算（Personal Computing）。最近，库克先后拜访了谷歌与百度，寻找合作机会。

在6月10日的WWDC上，苹果可能透露AI PC的进展。该公司营销主管已经“确认”WWFC将是关于AI，称这场活动“绝对不可思议”（Absolutely Incredible，简写成AI）。而彭博社长期关注苹果动态的马克·古尔曼（Mark Gurman）则认为，届时苹果会更多展示生成式AI如何让日常生活更轻松。

AI PC是新兴的个人AI与成熟的PC相结合的产物。别忘了成熟PC产业中的另一个大玩家。未尽研究的“AI PC报告”认为，整机厂商有机会基于其亿万用户基础，建立起用户反馈驱动的生态，最终在AI PC上，构建出两个“杀手”级应用，一个是基于大模型和智能体技术的AIOS，另一个是基于混合算力的推理引擎。在中国，由于Copilot暂时缺席，整机厂商的作用将尤其显著。

要让两大“杀手”级应用提供完整的个人AI体验，足以容纳完整而又最小可行的通用推理能力的AI PC，至少应该满足以下条件：

40TOPS，AI算力；
70亿，模型参数；
16G，内存；
20 tokens/s，推理速度；
4k tokens，上下文长度。

微软预定了5月，苹果预定了6月。还有4月空着，会有什么大事发生吗？

本文来自微信公众号：未尽研究（ID：Weijin_Research），作者：未尽研究