本文来自微信公众号:机器之能(ID:almosthuman2017),《4亿美元收购案失败的背后:错失AI芯片时代的最好3年》,撰文:盈君,编辑:四月
“现在已经不是属于英特尔的辉煌时代。”很难想象这句老生常谈的话竟然就出自英特尔之口。
近日,英特尔首席财务官 George Davis 向投资者承认,英特尔已经落后多家竞争对手,靠自己追赶至少需要两年时间。
在错过移动计算时代之后,英特尔一直以“花钱买时间”的收购和投资拉拢大量行业的千里马,以期重回行业巅峰。然而,千里马被伯乐纳入麾下并不完全意味着 happy ending 的到来。
迟到三年的 AI 芯片,4.08 亿美元买来的产品线和团队发展失利,于是被搁置、解散、沉寂……英特尔失去的远不止3年时间和真金白银,还有 AI 芯片时代的绝佳位置。
从王位跌落很容易,但要夺回王位可谓是难上加难。
2014 年,三位神经科学博士从高通出走,在探索类脑芯片碰壁后,他们决定自立门户,在加州创立了 Nervana Systems,主攻半导体、软件和 AI 深度学习技术。
一年后,凭借拥有号称最快的深度学习框架 Neon 和首个结合机器智能软硬件云服务的 Nervana Cloud,Nervana Systems 获得市场的关注,并在这一年被 VentureBeat 评为值得关注的五家深度学习初创公司。
当时,同在加州的另一家老牌芯片公司英特尔,刚完成一笔史上最大金额的收购案,以 167 亿美元收购了现场可编程门阵列(FPGA)制造商 Altera。
PC 市场下滑已成定势,在错失移动计算后,英特尔希望在 AI 芯片时代王者归来,摆脱对 PC 业务的依赖。
若能跳跃式地实现进化,即使投入大手笔对英特尔来说也是一笔划算的买卖。
一、4 亿美元,为概念买单
收购了 Altera 之后,英特尔还缺少合适的硬件平台产品。
而正在此时,2016 年 2 月,Nervana Systems 发布基于 Neon 框架,宣称在 GPU 上可以达到 10 倍以上的深度学习训练速度。随后又宣布开发名为 Nervana Engine 的 AI 芯片,刚好与英特尔迫切发展云端 AI 芯片的需求不谋而合。
诞生两年,Nervana 设计出了自己的 AI 芯片架构,还积累了丰富的软件算法经验,这对英特尔来说都是必须拿下的闪光点。此外,Nervana Systems 在自动驾驶,车内语义分析以及传感器数据处理上都有所涉足,这些都将给英特尔带来补充。
向来“财大气粗”的英特尔,早已习惯“花钱买时间”的转型方法论,没有更多犹豫便开始了新一轮的“买买买”。
2016 年 8 月,两家一拍即合,以超出市场预期的 4.08 亿美元(有报道也称 3.5 亿美元)完成“联姻”,Nervana Systems 的 48 人团队加入英特尔。
几个月后,英特尔整合旗下所有 AI 相关业务,成立人工智能产品事业部(AIPG),由 Nervana Systems 联合创始人 Naveen Rao 担任总经理,直接向当时的英特尔 CEO 汇报。
Naveen Rao 已于美国时间 2 月 27 日宣布从英特尔离职
对于并购之后的路线,英特尔设想得很好。
Nervana Systems 在整合进英特尔之后,一方面可以利用英特尔全球的市场渠道,触及所有主流云服务商;另一方面英特尔还有自己的芯片代工厂,有很强的制造能力。
在 Nervana 正式商用之后,英特尔的计算产品线将从 CPU、FPGA、AI 终端芯片延伸至 AI 云端芯片,就可以形成与英伟达、AMD 的全面竞争。
如今看来,英特尔对收购后产品开发的预估过于乐观。Nervana Systems 被收购时还没有成型的产品,没有任何硬件开发,只有 Nervana Engine 的架构。某种程度上,英特尔也是在为一个 idea 买单。
二、艰难的磨合之路
在被英特尔收购之前,Nervana 声称其产品性能将比 GPU 高至少 10 倍,这有利于英特尔与英伟达在 AI 市场的竞争。不过,英伟达随即通过架构以及软件的改进的方式让其 GPU 性能快速提升,致使 Nervana 的 10 倍性能优势消失。
为此,Nervana 不得不重新设计,在与英伟达的你追我赶中,芯片从创意到达到量产级共花费了三年时间,这在分秒必争的芯片市场上沦为劣势。
Nervana Systems 被并入英特尔后,共设计出三款芯片,遗憾的是都未真正达成商业化。
Nervana 第一代产品 Lake Crest,2017 年初被爆出, 是专为训练 DNN 而深度定制的 ASIC 解决方案。英特尔宣布 2017 年上半年将会有芯片成品。
但直到 2018 年中,英特尔才宣布 Lake Crest 只是一个试用版的原型产品,而正式的芯片产品命名为 Spring Crest,将会于 2019 年正式发售。
先安抚后爆料,英特尔吊足了大家的胃口,称 Lake Crest 的性能指标将达到 12 核,32GB HBM 内存,峰值算力为 38TOP/s。据介绍,Lake Crest 使用了 Flexpoint 架构,MCM 多芯片封装,搭载 32GB HBM2 存储,内部互联速度是 PCIe 的 20 倍。
Spring Crest 的两款芯片最终在英特尔人工智能开发者大会(AI DevCon 2018)上首次展示,与初代 NNP 芯片 Lake Crest 相比,产品的训练性能提升了 3-4 倍。
一款是针对服务器端训练应用的 Nervana NNP-T,代号 Spring Crest。它使用的是台积电 16nm 工艺生产,核心面积高达 680mm2,集成 270 亿晶体管,搭配 32GB HBM2 显存,频率 1.1GHz,TDP 150-250W。具有 119TOPS 的峰值算力,并且通过 CoWoS 高级封装技术实现多芯片互联。对标英伟达 Tesla 系列 GPU 加速芯片。
而另一款则是针对边缘计算的 Nervana NNP-I,代号 Spring Hill,功耗 10W,能效比为 4.6TOPS/W。CPU 部分是英特尔的 10nm 工艺 Ice Lake 核心,功耗在 10-50W 之间,有 M.2 及 PCIe 两种规格,更为小巧灵活。
Nervana 第二代芯片:Nervana NNP-T 和 Nervana NNP-I
据市场反馈,第二代 Nervana 设计根本满足不了那些高性能工作负载的要求。整个 2019 年,市面也并未得到 Spring Crest 系列真正商用的消息,直到今年 2 月 3 日,它被 Habana 顶替。
四年的磨合始终未能达成预期的产品线,屡次跳票的 Nervana 使得英特尔选择继续攻克下一个城池。2019 年 12 月,英特尔收购了以色列初创公司 Habana Labs。
Habana Labs 成立于 2016 年,比 Nervana 晚两年,被收购时已经拥有两款产品 Gaudi AI Training Processor 和 Goya AI Inference Processor。
相比 Nervana 迟迟不交付产品,Gaudi 人工智能训练处理器已经在为特定超大规模客户提供样品,Goya 人工智能推理处理器已实现商用。
Habana Gaudi 芯片
Habana 能获得青睐的另一个杀手锏在于其出色的可扩展性——这是云端芯片最关键的门槛。在设计底层编译器和软件架构的时充分考虑软硬件协同,帮助 Habana 芯片取得了更好的可扩展性。
根据官方公布的数字,其分布式总体性能甚至在处理器数量大于 600 的时候也能接近线性,较之英伟达 V100 GPU,训练性能提高了接近 4 倍。
从技术上来说,Nervana 的神经网络处理器(NNP-T)使用专有的互连进行扩展,而 Habana 的 Gaudi 可以通过标准 100Gb 以太网扩展到数千个节点。Gaudi 甚至还支持远程直接内存访问 RDMA,而无需增加远程 CPU 的负担。
这种结构可以显着提高训练大规模神经网络模型的性能,以应对每 3 个半月神经网络模型大小就会增加一倍,处理越来越复杂 AI 任务的趋势。
市场本以为英特尔会手握两张王牌壮大力量,然而 Habana 和 Nervana 和谐共存的局面仅仅维持了不到三个月。
今年 2 月,英特尔决定以 Habana 取代原定的服务器端 AI 加速芯片 Nervana Spring Crest NNP-T,而 Spring Crest NNP-T 系列将停止开发,但会兑现之前推理芯片 Nervana NNP-I(代号 Spring Hill)向客户许下的承诺。Nervana Systems 联合创始人 Naveen Rao 也于上周宣布辞职,Nervana 终成“弃儿”。
Nervana 芯片被 Habana 顶替,除了自身技术不够成熟外,也与团队内部无可避免的内耗脱不开干系。
因出身专业背景不同,Nervana Systems 团队与英特尔的磨合本已耗时,团队多为神经生物学出身、没有半导体背景,在被纳入英特尔麾下后就与英特尔在市场路线、技术路线上产生了不少的矛盾。
Nervana Systems 联合创始人 Naveen Rao 专注于人工系统中的神经计算和学习,在生物系统的神经计算领域发表了多篇论文,还获得了视频压缩技术的专利;负责硬件的 Carey Kloss 是芯片验证出身;主架构师 Andrew Yang 背景是网络通信芯片的 ASIC design。
英特尔因其并购的公司最终结局多销声匿迹,而被坊间称作“硅谷最有名的公司杀手”,初创公司并入并不意味着可以得到足够的发展空间。
2018 年,英特尔此前收购的 Movidius 前 CEO Remi El-Ouazzane 被调入 AIPG,却没有实际的架构和产品路线的管理权。Nervana 被收购后也历经调整,AIPG 的位置也一直在 DCG 内部飘忽不定,同时还面对英特尔的 GPU 部门在产品定位上的全面竞争。
2017 年 5 月,主持收购 Nervana 的 DCG 部门负责人 Diane Bryant 离职,后加入 Google 负责谷歌云。
2017 年 11 月,Raja Koduri 从 AMD 加盟英特尔,主持 GPU 部门,并在 2018 年宣布和 NVIDIA/AMD 正面竞争。
2018 年 1 月,英特尔 CEO Brian Krzanich 因为私生活问题辞职;6 月,CFO Bob Swan 出任临时 CEO,并于 2019 年 1 月转正。
人事调整屡屡滞后,英特尔内部对新鲜血液的接纳程度因此并不如市场期待的那么高。相比看来,英特尔这次迅速扶正 Habana,也是决策执行上的进步。Nervana 与英特尔的四年合作没有挽救颓势,面对落后竞争对手两年的时间差,Habana 这位新宠的胆子更重了些。
三、有伯乐,千里马就能跑得更远?
AI 芯片市场竞争程度不可小觑,据预估,AI 芯片市场规模未来 5 年增长有望达 10 倍。2020 年 AI 芯片全球市场规模将超过 100 亿美元,发展空间巨大。这其中,有英特尔、英伟达、AMD、谷歌等头部公司,有刚刚加入赛道的 AWS 等,还有刚加入赛道的 Wave computing、Groq、寒武纪等初创公司势头正猛。
为了扩展疆域,巨头们在大肆布局自身产业链的同时,也在进行着外部战略性扩张,或出于优势互补的考虑,或为了压制潜在对手。
在收购 Nervana Systems 和 Habana Labs 之前,英特尔就曾部署了数次有价值的并购:为全面布局 FPGA 和 ASIC 而收购了现场可编程门阵列(FPGA)制造商 Altera,为扩展 AI 应用领域收购 Mobileye 和视觉处理器公司 Movidius,后又将开发 AI 模型套件的创业公司 Vertex.ai 收入囊中……
2010-2020 年英特尔并购史 图源:知乎 @ljgibbs
英特尔收购 Nervana Systems 和 Habana Labs,就是出于巩固云数据中心的强势地位打下云计算人工智能芯片市场的重要考虑。同时,Nervana Systems 等公司也需要数千万甚至数亿美元的融资和强大的配套软件支持才能把云端 AI 芯片产品完成。
行业整合并购是大势所趋,初创公司作为被并购方不得不面对各种前途的可能性。此前国内 AI 芯片领域备受关注的明星企业深鉴科技,自 2018 年被赛灵思收购后就无大动静,昔日的明星也身不由己。
初创团队在市场还不成熟时,为获得更大发展转投靠山,不意味着发展的一蹴而就。商业战场上,背靠大树不见得好乘凉,被伯乐赏识只是或好或坏的新起点,被收购后还会面临很多的不确定性。
此次 Nervana 在自研芯片还未流片的节点就被英特尔收购,让投资人以极快的节奏退出拿到回报,从商业上看,不小的成交额对于初创团队来说是成功了。
Naveen Ra 领导下的 AI 业务也实现了快速增长,单在 2019 年就为英特尔创下了 38 亿美元的收入。但从创业初衷层面看,被收购后受制于公司宏观发展战略的限制,Nervana 创始团队离开高通时怀揣的芯片梦,却无法再有实现的可能。
本文来自微信公众号:机器之能(ID:almosthuman2017),撰文:盈君,编辑:四月