本文来自微信公众号:云见 Insight,作者:王海璐,原文标题:《特斯拉把 Robotaxi 想简单了 | 对话轻舟智航联合创始人侯聪》,头图来自:视觉中国
本文来自微信公众号:云见 Insight,作者:王海璐,原文标题:《特斯拉把 Robotaxi 想简单了 | 对话轻舟智航联合创始人侯聪》,头图来自:视觉中国
自动驾驶行业一直存在两种路线之争。以谷歌 Waymo 为代表的自动驾驶公司,和以特斯拉为代表的车企,从同一座山峰的南坡和北坡往上爬。山顶是无人驾驶,其中最有吸引力的商业场景是 Robotaxi(自动驾驶出租车)。
虽然销量和股价都显示,特斯拉爬山的速度更快。但当创始人马斯克提出,将在今年 10 月推出特斯拉 Robotaxi 时,还是引发了不少争议。
轻舟智航联合创始人、总裁侯聪就是质疑者之一。“我一直不太理解。Robotaxi 这个故事讲了这么多年,一直没实现,为什么大家还愿意相信马斯克?” 侯聪说。
虽然特斯拉基于端到端技术的智驾系统 FSD V12 表现优越,但侯聪认为,这距离真正的 Robotaxi 还很远。他随口举出一个系统处理不了的事情:“车卡在路中间怎么办?你让车主打车过去,把车解救走吗?”
城市道路复杂、人车混行,存在着大量的博弈场景,今天的人工智能还应付不来。Waymo 全副武装的 Robotaxi 车队都没能走出示范区,侯聪认为,特斯拉只依靠摄像头,根本不可能达到 Robotaxi 的要求。
轻舟智航的四位联合创始人都来自 Waymo。侯聪一毕业就加入了谷歌,先是做编译器,后来转到了 Google X 实验室的无人车项目组,做感知系统。
轻舟智航的联合创始人、CEO 于骞当时也在感知组,和侯聪是同一个部门的同事。二人还是清华大学的校友。
侯聪本科学自动化,研究生转到了计算机系。但没等拿到学位,就去美国佐治亚理工学院读博了。他形容自己对纯学术研究兴趣不大,更向往技术工程实践,于是博士毕业就去了谷歌。
2016 年,谷歌把无人车项目组分拆,成立了 Waymo,由谷歌母公司 Alphabet 直接控制。侯聪和于骞就成了 Waymo 最早的一批工程师。
侯聪负责性能优化,和各部门接触的比较多,也因此认识了当时在 Waymo 做规划和仿真的大方和汪堃。2019 年,四个华人工程师共同创立了轻舟智航。
当时已经不是自动驾驶行业最火热的时候。中国的自动驾驶公司小马智行已经成立了 3 年,图森成立了 5 年。以 Robotaxi 或无人重卡作为落地场景的自动驾驶公司就已经拿走了市场上大部分资金。轻舟选了一条对手更少、需要的资金也更少的路——无人驾驶小巴。
侯聪说,当时没去做 Robotaxi,是因为认为 Robotaxi 落地太慢。Waymo 2016 年开始在亚利桑那州凤凰城运营 Robotaxi 车队,直到今天仿佛还困在数不尽的 corner case 里面。
国内的人力成本低、道路更复杂,做 Robotaxi 就更难。侯聪今年 6 月去体验了百度的萝卜快跑,感受一般。他直言:“萝卜快跑目前的情况,Waymo 是不可能以这种状态去运营的。”
轻舟做无人驾驶小巴,起初以为这个场景比 Robotaxi 更容易落地。但在苏州、北京、武汉等 10 个城市做了运营试点之后,他们发现还是把问题想简单了。公交车原本就很难赚钱,法规更是迟迟不肯落地。
早期,轻舟凭借着创始团队的背景和技术积累,顺利拿到了 IDG、联想创投、美团龙珠资本、云峰基金等一线资本的投资。但 2021 年,投资人开始关注造血能力,L4 自动驾驶公司的融资之路越来越难走。
与之形成鲜明对比的是,2021 年特斯拉的股价再一次暴涨。中国新能源车的渗透率快速提高,智能驾驶功能则成为了电动车的标配。那年年中,轻舟调转船头,从 L4 转型 L2+,为电动车提供智能驾驶解决方案。
当年 8 月,特斯拉在 AI DAY 上首次介绍了 BEV(Bird'sEyeView,鸟瞰图)和 Transformer 模型结合的感知算法,把不同相机视角下的感知信息融合为一个俯视角图像,让系统更容易理解和预测路况。国内的智能电动车企业纷纷跟进,重写感知算法。轻舟在这个时刻毅然转型,成为了国内第一批把 BEV 做出来的智驾供应商。
这套系统是在地平线 J5 芯片上实现的。地平线 CTO 黄畅和侯聪、于骞三人是清华校友,和于骞是南加州大学的师兄弟。因为这层渊源,及对技术和理念的认可,2022 年地平线寻求生态伙伴合作,与轻舟一拍即合。
2022 年底,轻舟推出了基于地平线 J5 芯片的高速和城市 NOA(导航辅助驾驶系统)测试方案。这之后,地平线把轻舟推荐给了理想汽车。
理想 2021 年开始用地平线的芯片自研智能驾驶系统,后来又基于英伟达 OrinX 和地平线 J5 芯片,规划了 AD Max 和 AD Pro 两个系统方案。
2023 年下半年,理想决定把内部研发资源集中到 AD Max,将 AD Pro 系统交给一家供应商去维护和更新,轻舟抓住了这个机会。
轻舟接手后,和理想团队一起对系统进行了优化,并在今年 5 月向用户推送了基于轻舟算法架构的系统版本。
侯聪终于实现了他想做的,工程实践,把自己开发的产品交付到用户手上。与此同时,他也深刻地感受到责任重大。
到今年 5 月,理想 AD Pro 车型已有 40 万车主。一个系统用的人越多、使用频率越高,暴露出来的问题就越多。但用的人多、使用的频率高,恰恰也说明产品做得越好。
与更早实现无人驾驶、做出 Robotaxi 相比,维护好一个人车共驾的辅助驾驶系统的稳定性,保障几十万用户的驾驶安全,是轻舟今天更愿意去迎接的挑战。
以下是《云见 Insight》与轻舟智航 CTO 侯聪的对话(经编辑):
四个 Waymo 工程师创业
云见 Insight:你们四个联合创始人曾经都是 Waymo 的工程师,为什么会凑到一起创业?
侯聪:一开始于骞(轻舟联合创始人、CEO)找我,我们觉得这事能干。当时 Waymo 的中国人也没那么多,就找了一些我们认为有经验的、能力比较强的人。
我那时候在 Waymo 做性能优化、架构设计,跟于骞是一个组的,跟他们三个人都有业务合作。
云见 Insight:你们是怎么分工、决定谁干什么的?
侯聪:我们四个人的方向特别巧,我和于骞都做感知,但我做系统,他做算法。大方(首席科学家)做规划,汪堃(COO)做仿真,是四个不同方向。
于骞和大方更像科学家。我的兴趣在工程,就是把技术落地,偏实践、偏产品。所以一毕业就到工业界了。
云见 Insight:你的早期经历简单介绍一下?
侯聪:我本科是清华自动化系的,毕业之后去计算机系读研究生,做了一年多视觉,没读完就退学了,之后去美国读博士。2013 年毕业之后就去了 Google。
刚去 Google 的时候做编译器。做了一年之后,被借去基础设施组做 GPU。可能是因为我当时在 CPU 上做了一些优化,得到了 Jeff Dean(谷歌首席科学家)的认可,后来被推荐去了 GPU 组。
那个组后来发展得很好,做 TPU 的一些编译器,加上 Google Brain(谷歌用于训练神经网络的构架)下面一些底层库的开发,XLA(谷歌的深度学习编译器)就是他们做的。
后来 GPU 的工作告一段落,Google X 实验室有个机会,让我们去优化无人车的感知系统。当时有一个叫 “ 20% ” 的项目,就是拿 20% 时间帮它做一个项目。
当时是朱佳俊把我叫过去的。他后来创立了 Nuro(自动驾驶公司)。我在感知组做了三年多。
云见 Insight:在 Waymo 工作是什么体验?
侯聪:跟 Google 比较像。它 2017 年独立以前就属于 Google X。Google 主要做软件, Google X 做硬件,办公室里各种各样奇怪的东西,机械臂、车床,很多设备。
在里边做事情跟 Google 比较像,大家很强调自驱、合作,靠 OKR 驱动。它创造了一个好的文化环境,大家都希望做得更好,绩效体系也会有人去设计,让能力强的人从竞争中体现出来。确实门槛比较高,很多 Google 的人都不一定能进得来。
云见 Insight:Waymo 的工程师卷吗?
侯聪:越往后越卷。最忙的一段时间可能是我们走之后那两年。他们压力非常大,在旧金山一定要做到什么程度。我们在的时候没有人逼你,但是我基本上晚上、中午加班也很常见。有时候半夜大家也会发邮件问一些问题。
云见 Insight:下班时间是几点?
侯聪:没有规定。
云见 Insight:三点半可以下班吗?
侯聪:可以。我属于来得晚、走得晚的那类人。一般 10 点多去,晚上吃了晚饭工作一会再走,基本上朝 10 晚 9 的节奏。
云见 Insight:中国工程师是不是 Waymo 最勤劳的一批人?
侯聪:整体上肯定比较勤劳,但其实美国人也勤劳。它创造出来那种文化环境,让大家在里边做事很舒服,不需要关心很多复杂的事,只要把你的事集中做好。
我觉得工作效率挺高的。有些团队时间长了,会养一些懒人,但是 Waymo 那时候发展比较快,这种情况我没看到。
云见 Insight:让大模型火起来的是 OpenAI 而不是 Google,你觉得是什么原因?
侯聪:大公司内部有一些 policy(政策),很多时候做决策瞻前顾后,有时候不敢赌。我觉得 Google 做什么东西,都特别担心舆论风险,有时候比较保守。
云见 Insight:你们在 Waymo 的工作状态很舒服,2019 年离开 Waymo 去创业,核心的驱动力是什么?
侯聪:有时候太舒服也不好,你会思考很多人生问题。你能看到未来 10 年、 20 年什么样子。在硅谷肯定大家不缺钱,买好房子也能买到。那你到底追求什么?职业上确实有天花板一说,因为文化语言环境的原因,你参与到公司决策层比较难,肯定不像国内这样。如果你想做大事,在美国更多是一个参与者,而不是决策者。
车卡在路口,谁来解救?
云见 Insight:你在 Waymo 的时候,Waymo 已经开始做 Robotaxi 的试运营,当时卡在哪?
侯聪:就卡在一些 corner case 上。它 2016 年去凤凰城,我那时候正好在,那边人少车少,道又宽,天气又好,不会经常下暴雨。但是需求也少。凤凰城算不过账,它是一个测试运营场地,不是一个商业化的场地。所以 Waymo 2018 年全面转向以旧金山为主。
当时在凤凰城跑得很好的一个系统,到了旧金山就完蛋了,接管率巨高无比,根本处理不了。当时技术上还是有天花板的,当然跟数据分配有关系,没有去收集很多旧金山的数据。旧金山有那种很陡的坡,动不动三、四十度。包括它的交通规则(不同),人车互动频繁,所以 Waymo 当时的问题还是处理一些 corner case。
Waymo 很谨慎,保证到了很安全的程度才敢去开放。但是萝卜快跑目前的情况,我也坐过它们的车,Waymo 是不可能以这种状态去运营的。
云见 Insight:你去试乘百度的萝卜快跑,发现了什么问题?
侯聪:我是 6 月去的。它的体感就有问题,有顿挫感。 Waymo 真的比人开的还好,刹车、起步、转弯都很舒服,是礼宾车司机的体验。
第二,萝卜快跑极度保守。比如说掉头的地方,顿挫特别强,不断受到周围车的干扰。还有一个地方是被一辆作业车卡在后面,一直慢速地往下跟,也不绕。
从基本的传感器配置来看,它就不是一个很严肃的做 L4 的方案。Waymo 武装到牙齿,装了 5 颗激光雷达, 30 颗摄像头,6 颗毫米波雷达。萝卜快跑肯定没有这么做。这跟中国的情况也有关系,中国的人力成本太低,它想要实现商业回报就会很远。
可能国内企业被迫要走低成本方案。但是低成本会导致你的技术上限也比别人低,解决 corner case 的难度就变得更高了。
国内就是一个 L4 困境,人便宜,环境复杂。交通参与者的可预测性很差,大量的博弈场。道路设计不是那么规范。
国内做施工也没那么规范。之前美团的车掉坑里边,赖美团吗?施工方不把锥桶摆上,人可能看前面有一坑,美团的车想不到会有一个坑。但是在美国,人掉下去,是要告政府、告这个社会单位的,国内肯定不是那个机制。我觉得国内做 L4 会比美国晚很长一段时间。
云见 Insight:你怎么看特斯拉做 Robotaxi?
侯聪:那我不认。我觉得它有可能推一个车型,比如说没有方向盘了,或者相对于目前这种用户版的车,有一些额外的配置。但是它现在的技术栈不是面向 L4 的。一旦开始运营 Robotaxi,会出现很多问题。
L4 天然是跟运营相关的,它通过运营还能解决掉一些技术问题,特斯拉没有这种运营体系。
云见 Insight:特斯拉设想的场景是车主的车闲置的时候,可以去跑个 Uber。
侯聪:车卡在路中间怎么办?谁去解救这个车?让车主打车过去,把车解救走吗?这都是很实际的问题。
车一定会被卡住,只要你做的多,一定会有些场景。要么过于谨慎,要么跟人之间不知道怎么交互,甚至车与车之间都会卡住。
比如两辆特斯拉 Robotaxi 相互咬住了,这个问题就很难解决。十字路口没有红灯的时候,车都去占路口,最后相互卡死,根本动不了。
其实我一直不太理解。Robotaxi 这个故事讲了这么多年,一直没实现,为什么大家还愿意相信马斯克?我很崇拜马斯克,我觉得其它事情他都做得非常好。但是 Robotaxi 这个事情他有点吹牛了,低估了事情的难度。
云见 Insight:你觉得特斯拉 FSD V12 的效果,距离 L4 级别的 Robotaxi 相差多远?
侯聪:差很远。我反向举个例子。 Waymo 为什么把车设计成那样?它的摄像头有几类,一类是正常的摄像头;一类是夜间用的,夜视能力很强;有看 LED 灯的;有热成像的;还有盲区摄像头,有一个红外线的闪光灯。它有五类相机。
特斯拉只有一类相机。你说 Waymo 傻吗?它不傻,它是看过太多 corner case 之后,没办法,只能从硬件上去解决这个问题。软件你非要去突破,不太好用。尤其美国晚上很黑,很多地方没路灯。
如果特斯拉以当前的配置上路,包括萝卜快跑,一个专业碰瓷儿的,有很多办法碰它瓷儿,因为它的硬件上有太多缺陷了。
云见 Insight:你在美国体验过 FSD V12 了吗?
侯聪:我今年 3 月去就体验了,5 月又去了一次,天天开。
V12 说实话我没有觉得很惊艳,只觉得它实用性变好了。在城市里面,尤其是在路口的处理比 V11 有了明显变化。大部分是好的,但也不完美。
特斯拉 V11 在高速上已经做的很好了。在城市里面的路口很保守,不像人,让它很尴尬。后边堵一堆车,慢慢往前挪。看半天,挪得很慢。因为它有盲区,这种行为不像人。还有在转弯的过程中,它会突然打方向盘,你就会很慌。
云见 Insight:特斯拉现在的端到端技术方案,也需要不断去解决 corner case 吗?
侯聪:一定要解决 corner case。端到端是把传统算法几大模块的信息整合在一起,利用这些信息,寻出一个更好的结果来。
端到端的上限很高,下限一开始比较低,因为它的可控性差。以前系统分模块,每个模块定义了接口。按照标准去做,不会出现一些奇怪的东西。基本上拿规则可以一次性解决一批问题。
端到端没有这样的概念。只能用更多样的数据去解决下限的问题。就是见过足够多的这样的情况,最终知道怎么解决。
云见 Insight:端到端的模型相当于一个黑盒,如果出现问题,怎么发现和解决?
侯聪:它一定不是所谓的黑盒。你从它的输出结果去倒推,感知、规划的结果都在,所以它一定是把之前的经验充分利用起来,形成一个新的模型。这个模型有一定的可控性,比如这块是感知,那块是预测,那块是规划,里边还是要区分不同阶段。
云见 Insight:你预估 FSD 什么时候会在中国落地?
侯聪:明年。它应该做了差不多快一年了。细节我不太清楚,但它开始招算法工程师了,说明这事开始了。它不是说要花 100 亿美元在国内吗?建各种各样的设施。
云见 Insight:所以 FSD 在中国落地,都需要做什么?
侯聪:建数据中心,把它的算法在国内进行适配。因为国内的场景毕竟复杂。我们特别希望看到 FSD 来中国,因为它是标杆,它如果投入比较多的话,应该是最快的。
云见 Insight:国内的车企有什么应对策略吗?
侯聪:只能去追。我觉得毕竟国内玩家装激光雷达,是有些优势的。加激光雷达一定让这个问题变得更简单。
云见 Insight:有没有可能,特斯拉的 Robotaxi 也不是现在的传感器,装上激光雷达或者更多的高清摄像头?
侯聪:对。那样肯定能降低难度,但是可能跟它的理念又不一致。
特斯拉现在只能寄希望于 AI(人工智能)的不断发展。我觉得这种可能性存在,但是人开车,要解决几类问题。你在跟真实世界互动,它考验的不是驾驶能力,而是一些本能的东西。
第二,人开车会检查车的环境,通过自己对周围环境的理解,判断出可能性。比如说发现一条狗,往前走不见了。这时候你可能下车检查一下,狗是不是在前面。像这样的场景,人的感知一瞬间就扩大了。车如果没有相关设计,其实是比较危险的。
云见 Insight:如果只靠软件能力,你认为特斯拉能做成 Robotaxi 吗?
侯聪:这就很有挑战了,把 AI 的要求拔得非常高。我认为往长远看肯定能做到,但过程不是想象中那样。 AI 几十年前就有了,大量的科幻电影里都展现过,但到现在都没有真正解决,有时候你很容易把它想得过于简单。
云见 Insight:特斯拉计划今年 10 月把 Dojo 算力集群扩充到 100 EFLOPS(算力单位),其它车企跟特斯拉相差是数量级。你怎么看这之间的差距?
侯聪:这是重投入的事情。特斯拉之前利润率很高,它在全世界卖这么多车,投得起,它的股价也有比较大的支撑。国内车厂这么卷,资源投入上不可能这么大。这就好比大模型为什么是美国先做出来,国内不行?它投入很大,而且要烧很多年的钱,背后的投资逻辑不太一样。
云见 Insight:你们现在有没有在储备算力做端到端 ?
侯聪:我们也在做,但是要走一条不一样的道路。如果按照特斯拉这种方式,要几万块 A100,我们显然投不起,几千块都是很大的负担。我们会根据我们的产品做一些限定条件,这样投入会少很多。
云见 Insight:如果投资人给你们足够多的钱,你们会选哪条路?
侯聪:如果是说有足够的钱,我们会往这个方向去走。但是没有如果,现在这个情况,大家都比较清楚,市场就是这样。
从无人小巴,到辅助驾驶
云见 Insight:你们起步的时候,自动驾驶在资本市场已经没那么热了。你们的融资有遇到挑战吗?
侯聪:肯定没有早期那么容易。早期融资都是几个亿的融,到我们的时候,一下难很多。不过,这对我们转型做 L2,我觉得算是一件好事。如果你早期融了很多钱,转型做 L2 是很难的,你的估值在这放着。
云见 Insight:当时已经有很多人创业做自动驾驶了,你们为什么认为还有机会?
侯聪:从技术上来讲,我们认为我们有一定的先进性。我们对 L4 的认知比别人更好。第二,L4 有很多场景落地的可能,不仅是 Robotaxi、重卡。那时候你想要融很多钱,要么就做重卡,要么做 Robotaxi。但我们认为其它方向还有机会。这种中低速车,无论小巴还是物流配送、作业车辆、环卫、售卖车,以及一些封闭场景的应用,像矿山码头或者一些厂房里面,虽然说市场相对小,但是我们认为它商业化还是比那个(Robotaxi)更快,对技术的要求会低一些。
云见 Insight:一开始创业为什么做无人驾驶小巴?
侯聪:因为难度低。当时设想的场景是一个微循环,或者是相对固定场景里面的中低速车,不只是小巴,还包括像物流、作业车。
云见 Insight:无人小巴一直没商业化落地,你觉得主要是什么原因?
侯聪:还是商业模式,谁为它付费的问题。
云见 Insight:2021 年你们转型做乘用车辅助驾驶,是什么触动了你们下这个决心?
侯聪:还是觉得 L4 商业落地比较慢,投入大,路径慢,周期长。如果我们一直走这条路,可能资金上会出现一些困难。我们认为应该找一些能快速商业化的方案,能够一直往前走。L2++ 这个市场是适合的。
2021 年新能源发展非常快,特斯拉的股价又一次暴涨,中国新能源车的渗透率不断提升,对于智驾的需求不断提高。正好我们这套技术用到辅助驾驶功能上是比较顺的,能在短期把它商业化。
云见 Insight:创业第一天为什么没想去做 L2 ?
侯聪:没有想到 L2 会这么快。当时特斯拉还没有推出一个很强的方案,那时候刚推出 Hardware 3.0,2019 年我们创始团队汪堃买了辆特斯拉,我(体验后)觉得太惊吓了。说实话,从 Waymo 出来也带了一些对视觉方案的偏见,觉得不靠谱,因为 Waymo 是以激光雷达为主。
其实我们做小巴的技术完全是按照 Robotaxi 去做的。我知道很多友商它们做小巴或者低速物流,跟 Robotaxi 完全是两条技术路线。所以我们转型做 L2 很快。有些公司本身没有这个能力,非要去做这个方向,整个架构上是有很大问题的。
云见 Insight:你们转向乘用车辅助驾驶的时候,这个行业是什么样的格局?
侯聪:我们是在特斯拉第一次 AI Day 之后转型的,所以肯定要做 BEV 这个方向。我们给自己定了几个规则,首先不会去做低端的 L2 ,它是红海,竞争已经很激烈,而且最后竞争的还是成本,跟我们的技术栈完全不匹配。
我们当时转型,也讨论过 planner 到底要不要重新做,结论还是保持我们的优势,不要重新做,因为往未来看,我们做的一定是中高阶方案,算力是有一定保障的。
云见 Insight:从 L4 转到 L2,你们在算法上做了哪些调整?
侯聪:感知的变化会大一些,从激光点云为主,转到视觉为主的方案。好在我们第一时间就用 BEV 做了,所以反倒是全国第一家在 J5 上把 BEV 做出来的。
我们是高速和城市 NOA 一起做的,我们认为对于感知系统来说没区别,高速、城市是一体的,只是配置会不一样。比如说感知范围,以及算力,会做一些简化,但架构、算法都是一样的。
云见 Insight:你们跟地平线是怎么合作上的?
侯聪:我们有些渊源。我、于骞和他们 CTO 黄畅都是清华的。我在清华的视觉实验室做过一年半,跟黄畅在一个实验室。于骞和黄畅都是在南加州读的博士,是师兄弟。
2022 年年初,地平线希望能培养一些生态伙伴,我们就决定一起合作。
云见 Insight:听说余凯把你们力推给理想?
侯聪:对,凯哥对我们很支持,我们对他也足够支持,帮他们把标杆建立起来。
云见 Insight:地平线 J5 做 BEV Transformer 存在 CPU 算力不足的问题,你们是怎么用 J5 做到的?
侯聪:就不要用 Transformer 了。BEV Transformer 是被特斯拉炒起来的,但是学术界有很多办法实现把图像特征映射到 BEV 空间下的功能。 Transformer 只是一种方法,我们用的是更适配 J5 的方法,效果也非常好。
云见 Insight:下一代地平线 J6 会切换成 BEV Transformer 的方案吗?
侯聪:看性价比,如果用 Transformer 消耗的算力很大,但产出很小,我们会综合考虑。但我们一定会用 Transformer 实现一些东西,包括端到端、无图的业务、对地图的一些处理,这块用 Transformer 的价值还挺大的。
用的人越多,挑战越大
云见 Insight:理想的 AD Pro 系统现在是你们在做,有什么挑战吗?
侯聪:最大的难度是它的用户基数很大,要求很高。用的人越多,概率一定的情况下,它暴露出来的问题越多。当你只有几千、几万用户的时候,可能一个月发生一次,或者说几个月发生一次。但几十万人用的话,可能一周或是几天发生一次。这也跟你的用户覆盖范围有关系,产品越好,大家用的越多,暴露的问题越多。要保证系统不出什么稳定性、安全性问题,肯定是有挑战的。
云见 Insight:最近解决的一个比较棘手的问题是什么?
侯聪:识别红绿灯其实是一个很难的问题。全国这么多路口,红绿灯的样子、规则、跟道路之间的关系都不同。有些灯是简单的红黄绿三个灯,有些是两排的,还有很长的灯,里边有箭头,还有里边有自行车、公交车的灯,还有一些灯形状比较奇怪,有些灯是临时的。
还要考虑灯的背景,比如晚上,因为传感器的限制,可能在过曝的情况下很难分辨箭头和圆的形状。以及当背景有很多灯的干扰,会对系统产生比较大的影响。
还有 LED 灯是一直在频闪的,会对识别造成干扰。现在相机已经在做防频闪的功能,但即使这样,依然有些灯的频率可能不匹配。
云见 Insight:识别交通灯的问题应该其他系统也会遇到。
侯聪:一样的。原理类似,但是因为硬件不一样,方法也会有区别。你的硬件能力越强,能用的手段会更多。更重要的一点在数据覆盖了全国多少个不同情况。
云见 Insight: 基于地平线 J5 的 AD Pro 版车型的能力上限是什么?
侯聪:在高速上可以做到最好。
云见 Insight:余凯之前谈到过,J5 芯片的 CPU 算力不足,是因为当年的资源投入不足。但是英伟达每一次都是超前投入的。
侯聪:大家理念不一样,英伟达往高端走,它成本在那放着,做不下去。它更适合自研的模式。生态比较完备,开发成本比较低。但是你要做性价比车型的话,还是要选择一款性价比更高的芯片。
云见 Insight:你们只用地平线的芯片吗?
侯聪:我们系统设计的目标是能够适配多款芯片,为了达到这个目标,也做了一些牺牲,可能不会把每一款芯片的作用发挥到 100% ,但是足够好。再投入可能还会更好一些,但那个边际收益很低了。地平线是我们现在最重要的平台和合作伙伴,我们肯定会在上面建立优势。但我们的系统设计不是只为地平线设计的。
我们的小巴一直用英伟达。早期做 L4 的时候,用过英伟达 Xavier 做 Sensor 的接入,也会跑一些算法。 2022 年英伟达 Orin 出来,我们是最早的用户。当时跟一家厂商合作,在一个月之内就把系统从工控机迁移到英伟达 Orin 上。这个合作方是一家国际知名的企业,它把这个情况汇报给了英伟达,英伟达就在当年 GTC 大会上 highlight 了,我们是跟两家车企(小鹏和极氪)并列,最早把英伟达双 Orin 芯片用起来的。
云见 Insight:你怎么看英伟达从做芯片,到做自动驾驶解决方案?
侯聪:它得打造样板工程,一方面帮它把芯片的未来看得更准确。到底需要算力多少,系统需要什么功能,它们得有认知。
其实它六、七年前就发过端到端的论文,只是一直没有下场去干。吴新宙过去是下场干了,但不是全面下场。我判断它可能还是打造一个样板,如果这块做的比较好,能够做成一个标准化方案,再往前推一步。
打造完样板工程,也可以帮它卖芯片。
云见 Insight:它做每一款车型,需要投入很多人力去交付吗?还是一个通用化的方案可以给所有车用?
侯聪:看系统是怎么识别的,这块其实很关键。像是华为,肯定希望做一家超级供应商,降低交付成本。华为的传感器都是自己定义的,但一般车厂都会根据自己的供应链更换。它首先不会换相机,连安装位置都定义的比较标准,它的车型前边侧、前侧后相机是放在一起的,放在一个模组里面。这样安装位置就比较固定,之后适配成本就低了。SUV、轿车的大概位置是一样的,选型是一样的,那交付成本一定低。
不想做 Tier 1 了
云见 Insight:你刚才说特斯拉做的所有事情都是对的,除了 Robotaxi,包括它自己做芯片吗?
侯聪:对。它自己做两个芯片,一个是车载的,一个是线下的。车载在 2019 年的时候没有那么高算力的芯片,它能够那么早做 BEV,就是因为有这个芯片。
英伟达 Orin 芯片 2022 年才出来,特斯拉 2021 年已经做出来 BEV 了,领先市场一年多。它最早用 Mobileye 的芯片,后来用英伟达的 Drive PX,英伟达的价格一直降不下去,它只能自己做,才能把成本降下去。
云见 Insight:所以车企学特斯拉去自研芯片是合理的吗?
侯聪:特斯拉有这个体量,可以这么做。其它车厂这么学,不见得是正确的。
云见 Insight:车企、芯片公司、自动驾驶方案商现在有一些重复造轮子,你觉得未来行业的分工会如何演变?
侯聪:还是让市场证明一切吧。大家做这个事情的目的不一定那么单纯,可能还有其它目的,塑造科技品牌形象,包括市值管理,人才吸引。
理论上来讲,从供应链安全、成本来讲,车企自研芯片有一定优势,但是要考虑综合成本。做芯片最大的麻烦就是你刚做出来,发现有新的算法了,你的硬件慢了。大家一窝蜂去做那个算法,你的芯片又用不了。
云见 Insight:你说的是地平线 J5 吗?
侯聪:J5 算是一个案例吧。但是我觉得不只是 J5,那代芯片,只要不是通用的,都有这个问题。
云见 Insight:现在技术架构稳定下来了吗?
侯聪:没有。Transformer 现在也在被挑战,又有新的效率更高的技术。还会有一个收敛的过程。
云见 Insight:芯片商做智驾方案,这个事情合理吗?
侯聪:我觉得优势不明显。车厂跟芯片厂家合作,可能希望得到一些帮助,涉及到一些底层的开发,无论是驱动还是底层软件、传感器的信号处理、神经网络的推理,但是芯片厂商提供这样服务的成本挺高的,它不可能服务所有家。
除非你能把供应链做得非常成熟,但这需要时间。芯片创业公司很难把这块做到那么成熟,一定要收敛。要么就由少数几家生态伙伴,把市场全做了。但是车厂这边也有自研的需求,不想靠生态伙伴。生态伙伴成长也需要时间,不可能迅速把这个市场吃完。
这个时候,芯片厂商肯定会觉得,它自己做就能解决这几个问题。
云见 Insight:你们做一个项目需要多少人力?
侯聪:一般来说,第一个项目是耗人最多的,越往后投入越低。
云见 Insight:现在能同时做几个项目?
侯聪:两、三个项目。现在单个项目的投入还不在最优状态。到了第五个项目之后,基本上每个项目只需要投几十个人就能做完,做五、六个项目没问题。
云见 Insight:自动驾驶供应商应该招更多的人去接更多的项目,还是控制人员规模,只接有限的项目?
侯聪:看战略目标。如果要占据市场、扩大规模,不断融资、上市 , 这种高举报打的方式接更多项目。还有一类是先打标杆,培养能力,把产品标准化,之后再去快速复制。它一开始就那么一两个项目,先把标杆做出来,但是产品是标准化的,后边推广就不会做很多定制化,这是另外一个思路。
云见 Insight:你们为什么选择了第二个路线?
侯聪:因为现在接的越多,亏损越多,企业经营压力很大。我们判断,最终市场肯定就几家供应商,产品标准化是一定要做好的。
云见 Insight:在这个行业演进的过程中,你们未来会在链条中扮演什么角色?
侯聪:我们至少在中高阶的某一类产品里面,做好一、两款芯片,提供一个标准化方案,最终可能会成为一家 Tier 2。我们做算法,做软件交付,但是不做全套。有一个系统供应商把这些东西包进去。
云见 Insight:你们为什么不做 Tier 1?
侯聪:我们不做系统 Tier1,但是会做软件 Tier 1(系统 Tier2)。系统 Tier 1 要做很多硬件的东西,投入蛮大的,利润比较薄。这个方向我们也会考虑,但是目前来看 Tier 2 的可行性更高。
云见 Insight:Tier 1 就负责做域控制器吗?
侯聪:还要做交付。它的人力会比较重,这不是我们的优势。
云见 Insight:你们的优势是什么?
侯聪:还是做算法、做产品。我觉得轻舟不是一家基因上能够把硬件 Tier 1 做到非常好的企业,那是另外一种企业,比如像德赛西威、均胜电子。
云见 Insight:但你们跟理想的合作,是你们作为地平线的 Tier 1。
侯聪:我们是作为软件 Tier 1。 Tier 1 在短期还会存在一段时间,但最终一定是标准化,之后要么我们自己做硬件,要么就做 Tier 2。
云见 Insight:所以你判断,智驾方案商未来会是车企、系统 Tier 1、算法 Tier 2 和芯片 Tier 2 几方合作?
侯聪:对。
云见 Insight:芯片 Tier 2 不能把算法 Tier 2 的事情干了吗?
侯聪:你看它是不是比我们更擅长这个事情。
云见 Insight:如果提供的是一个标准化的算法,那芯片 Tier 2 应该也想做。
侯聪:它干嘛要自己做?跟我们合作就可以了。
本文来自微信公众号:云见 Insight,作者:王海璐
支持一下 修改