本文来自微信公众号:果壳 (ID:Guokr42),作者:糕级冻雾,编辑:沈知涵,题图来自:AI生成
本文来自微信公众号:果壳 (ID:Guokr42),作者:糕级冻雾,编辑:沈知涵,题图来自:AI生成
看着别人家的机器人一个个活蹦乱跳,Sam Altman多少有点着急。
过去一年,科技公司们最喜欢的事情,就是隔三岔五地安排自家机器人“登台献艺”——一会儿是叠衣服了,一会儿是削黄瓜皮了,要么就是Say Hi~凹造型,或者派对上斟茶倒水儿。
可OpenAI呢,早在2021年,他们就悄然解散了机器人团队,原因是缺乏训练机器人要用到的数据,导致研发受阻。
“不甘心”是第一生产力。蠢蠢欲动的OpenAI先是投资了现成的机器人公司,又重启了内部机器人团队。就在这个圣诞节前夕,有外媒曝出,OpenAI在考虑开发一款人形机器人(humanoid robot)。
OpenAI,欢迎回到机器人世界
OpenAI在近两年里,投资了三家机器人软硬件公司。
2023年,OpenAI领投挪威机器人初创公司1X,1X主要开发轮式机器人,上半身类人,下半身却好像自动代步车。
产品EVE机器人,主要用于仓储打包。工作起来,脸上挂着清澈但愚蠢的笑容,脚踩风火轮,手上二指禅,就凭不拖延和情绪稳定这两点,我一辈子也学不来。
为了让EVE看起来更“亲民”一点,它被套上了针织连体衣,仔细一看,还有胸肌和翘臀(我十分怀疑里面是不是套了个活人),哪里恐怖谷了,纯纯搞笑男一个。
像极了离职打包东西走的我丨1X-tech
如今EVE内置了更为复杂的指令和动作库系统,也接到了一些室内收纳的活儿。
今年8月,1X推出了新款机器人NEO Beta,集成了GPT-4o的语音模式,就像一个大管家,做饭、冲咖啡、收拾衣服、杂物。
今年2月,OpenAI又注资了另一家机器人公司Figure AI。且很快交出了成绩单。
3月,Figure01在演示视频里,表现出具备了大语言模型的常识和简单的思维链能力,简单说就是,看得懂、听得见、做得到。
全铝合金的“身体”里靠几根黑色电管串联到一起,还没等人类说话,它就用充满磁性的英音罗列了面前桌子上的所有物品。头部显示器里闪烁的加载动画,好像它真的会思考似的。
看得懂、听得见、做得到丨Figure AI
对人类提出的要求,它会转化为机器人指令序列,按步执行,比如“递个苹果”,“收下垃圾”,“冲杯咖啡”——打开咖啡机,把咖啡胶囊对准接口(如果没对准,还会手动摆正,确保胶囊入仓),放好杯子等咖啡冲好后,平稳地端给人类。
放错了,纠正丨Figure AI
操作过程中,还会和人类说话互动一下。反观人类在做什么?他就默默呆在一边,也不搭把手。
家政先锋丨Figure AI
就在上个月,OpenAI又刚刚领投了Physical Intelligence,一家机器人通用模型开发商,要将通用AI带入物理世界,让机器人像人类一样理解环境。
不太能确定它们是否具备了任务泛化能力,但在动作控制上确实做得挺细。两台粗犷、不加修饰的机械臂,能把硬卡纸折成餐盒,把短袖短裤叠得平整,把一打鸡蛋在冰箱里码得整整齐齐。
不是,人,我说你就干看着啊?丨Physical Intelligence
干活儿精细着呢丨Physical Intelligence
这些是OpenAI在外部的动作。而公司内部,机器人团队也已经重启。
原先机器人团队的创始成员Peter Welinder,在团队解散后转为任职OpenAI产品副总裁,负责GPT的API服务。去年8月,Peter成为“新产品探索副总裁”,负责用OpenAI的模型探索硬件产品,其中重点之一就是机器人。
11月,OpenAI把Meta机器人和消费硬件团队的负责人Caitlin Kalinowski挖过来,Caitlin同时也是许多机器人初创公司的顾问。
一切为了数据
与Figure AI等公司的合作,让OpenAI看到高性能多模态模型如何一点一点推高机器人“智力”水平。
非常早期的探索中,OpenAI做了实体机器人,单手拧魔方是研究之一。而重新回来给机器人做“大脑”,最有可能的原因是:为了数据。
上周,OpenAI前首席科学家IlyaSutskever在NeurIPS 2024发表了观点:大模型预训练方式将走向终结。即人类只有一个互联网,而互联网的数据已经被大模型学得差不多了。
上述提到的机器人,都不是(或目标不是成为)执行单一重复性指令的工业机器人。而是在开放环境中,解决开放式问题的可协作的机器人——与机器人协作,与人类协作。
将机器人置于更多真实环境中,它便能获取到更多丰富和多样的数据。
专属于人类的“视觉”、“嗅觉”、“触觉”等五感数据,此前需要可穿戴设备才能收集,现在换由身披无数传感器的机器人来——一边当生产力,一边收集数据,反哺到更灵活大脑的开发中。
人们对于机器人能干什么早就想好了——你看看,大白、哆啦A梦、阿童木……人们只是在等。
另一位人形机器人狂热爱好者马斯克说,别急,他预计,到2040年,世界上将有至少100亿个人形机器人投入使用。这被人说是给特斯拉市值画上有史以来最大的饼。
马斯克恨不得走哪都带着Optimus。而且,Optimus跳起舞来的欢脱劲儿比他本人可一点不差。
不知道,这一次谁会先造出那块通向“通用人工智能”的黑石方碑。
本文来自微信公众号:果壳 (ID:Guokr42),作者:糕级冻雾,编辑:沈知涵
支持一下 修改