时隔2年,谷歌I/O开发者大会回归线下。本文来自微信公众号:新智元 (ID:AI_era),作者:新智元,原文标题:《谷歌I/O大会首秀AR眼镜!最贫的搞笑AI机器人亮相》,题图来自:视觉中国
北京时间今天凌晨,谷歌2022年度全球开发者大会正式开幕!首先我们有请谷歌CEO,桑达尔·皮查伊。(此处应有掌声)
言归正传,本次大会谷歌可谓是“批发式”更新。
硬件方面,从对拼Meta的AR眼镜、到对打苹果的首款智能手表,从高端耳机Pixel Buds Pro,到平价版的新款Pixel手机,还有造型一言难尽的首款平板电脑Pixel Tablet,都在大会上亮相。
软件方面,Android 13操作系统宣布更新了,“沉浸式”搜索的地图、新增24个小语种语言的翻译、多框拍照读图搜索的Lens、不用高叫就能唤醒的语音助手、自动分章节的YouTube,这些软件应用的全家桶也全部得到革新般的升级。
一、硬件“批发式”发布:眼镜手机智能表,一个都没少
十年之后,谷歌再做AR眼镜
此次大会最为重磅的消息可能就是——一个对谷歌未来AR眼镜产品的展示短片了。
这款AR眼镜的功能,是能够让使用者看到在他眼前的会话翻译文本。
不过,谷歌I/O大会没有分享任何关于下代AR眼镜何时上市、具体操作步骤、软硬件技术参数等细节。只在一个录制的短视频中展示了产品效果片段,非常有动画片广告的嫌疑。
而且,部分画面底部有文字,说明它所展示的是一个“模拟的视角效果”。这表明,最终的用户体验可能与谷歌I/O大会的展示短片有很大的不同。
在谷歌下代AR眼镜成为消费者可以尝试的真实产品之前,公众不会知道它们在实践中的效果如何。但视频中所展示的内容为潜在的AR未来描绘了一幅非常酷炫的画面。
短片显示了用户戴上眼镜后可能看到的情况:说话者在你面前,翻译后的各种语言的话语文本实时出现在你的视线中。如果用户是如短片开头人物中患有听力障碍,那效果就更好、更有针对性了。
谷歌本次I/O大会说谷歌翻译现在多涵盖了24个小语种,相较而言,实时将英语、汉语、西班牙语等大语种的文本呈现在虚拟视觉中简直不算事。
在短片之后的部分中,一位谷歌产品经理告诉戴着眼镜的用户:“你应该能看到我说的话,文本是为你实时转录的,这有点像真实世界加了字幕。”这段话是以西班牙文呈现的。
从许多方面来说,这次谷歌的AR展示其实是市场一直期望上一代谷歌眼镜能做到的事情。在谷歌眼镜于2012年I/O大会上首次亮相的十年后,谷歌又再次要试水AR眼镜了。
所以在下代AR眼镜准备就绪之前,谷歌对分享太多细节的谨慎态度是可以理解的。
业界内行人认为,现实对话实时叠加字幕是AR眼镜的一个非常实用的应用。谷歌下代AR眼镜要是真能做到实时口语会话转译,这绝对是一个杀手锏。
一口气发布3款手机,Pixel家族又壮大了
首先是Pixel系列的廉价版本,Pixel 6A。
它采用的是屏下指纹,并配备了稍小一些的6.1英寸OLED 1080p显示屏,刷新率为标准的60Hz。其后置主摄和超广角都是1200万像素(Pixel 6主摄为5000万像素),并带有光学图像稳定功能,此外前置自拍摄像头为800万像素。
硬件上,Pixel 6A搭载了谷歌自研的Tensor芯片,但仅有128GB储存+6GB内存一种可选。
值得一提的是,Pixel 6A的电池比5A还要小。前者只有4400毫安,而后者都有4680毫安。
尽管如此,谷歌在大会上仍然表示,6A能像5A一样,待机一天。同时,在超级省电模式下,6A能用3天,而相比之下5A只能用2天。据称是因为在谷歌控制了新手机软硬件两方面的研发过程后,6A手机拥有更高效的软件和硬件集成。
虽然但是,价格却和Pixel 5一模一样,都是449美元。这可能是一大卖点。
在本次开会者大会上,谷歌还透出了未来会发布的Pixel 7和7Pro的口风。
这两款新手机采用以玻璃为主的设计,并带有更新过的、与Pixel 6相似的铝制摄像头横条设计。Pixel 7的镜头有一个新的药丸形切口。新的切口设计进一步将Pixel 7与Pixel 6 区分开来。Pixel 7将会搭载两个摄像头,而7 Pro将会配备三个。
这两款手机都会在今年秋天问世,搭载谷歌的Tensor处理器、Android 13操作系统和基于Pixel 6优化的外观设计。
除了将要搭载7和7 Pro以外,谷歌对于下一代的Tensor处理器并没有透露太多信息。
是真的?第一款智能手表要来了
还有一个重磅消息。谷歌在大会上终于确认了Pixel Watch的真实性。然而,今天的公告与其说是全面介绍,不如说是一种“挑逗”。
看看上市时间就知道了:这款手表将于今年秋季和Pixel 7手机一起上市,而且将会是一款高价的产品。
Pixel Watch采用圆形+圆顶的设计,具有触屏表冠和侧身按钮。表身由回收的不锈钢制成,并具有可更换的专用表带。
在软件方面,谷歌表示Pixel Watch将拥有用户所期望的原生谷歌应用程序以及全新的Fitbit集成。
Wear OS的另一个亮点功能是紧急 SOS。用户可以使用手表联系朋友或家人,以及呼叫紧急服务电话。
同时,利用Fitbit集成,用户能够随时查看有关心率、睡眠跟踪和活动区域分钟数的数据和分析。
此外,Pixel Watch需要用户有一台Android 8.0或更高版本的手机,并且需要一个Google帐户。也就是说,不会像以前的Wear OS手表那样与iPhone兼容。
显然,谷歌正致力于推动其独有的Pixel生态系统。
硬刚AirPods:定制音频芯片+最强主动降噪
在几次尝试生产无线耳机之后,今天,谷歌终于宣布了其最高端的耳机产品:Pixel Buds Pro,定价199美元。
珊瑚色、柠檬草色、雾色和木炭色,外表看起来,这款耳机着实灵动可爱。
然而,“在温柔的外衣下,其内心却十分强大。”采用谷歌自定义的6核音频芯片,运行谷歌自行开发的算法,由音频工程师团队自定义扬声器,构建了独树一帜的ANC功能。
所谓ANC,即Active Noise Cancellation,主动降噪功能。
长期以来,降噪采取的办法都是耳内密封,但由此会造成耳部不适感。谷歌的关键在于打造了内置的传感器。它可以测量耳道中的压力,主动缓解耳部压力,让人感到更加舒适。
另外,它还有一种音量均衡器(Volume EQ)技术,即耳塞会自动优化频率范围内的音频,确保任何音量都能发出饱满、沉浸的声音。
谷歌设备和服务高级副总裁里克·奥斯特洛(Rick Osterloh)在最近的一次媒体吹风会上表示,“这是我们设计的最好移动音频硬件”。
官方称,在主动降噪功能启用的情况下,可以连续收听长达7个小时,关闭后可长达11个小时。
还有,多点连接功能也毫不逊色。无需打开蓝牙设置,便可以快速配对,音频自动切换,支持多点蓝牙连接,允许你同时连接2个音频源。
平板回归:塑料质感,外形“复古”
就在你以为它已经退出平板市场的时候,谷歌却回来了。
宽大的白色边框,看起来像塑料的哑光背板,厚重的外形,2023年发布,搭载安卓系统……这就是我们对即将推出的Pixel平板电脑的全部了解。
直观来讲,这和“一款搭载自研Tensor芯片的高端设备”毫无联系。(此处省略了一千字吐槽)
显然,与Pixel手机“奢华的金属和玻璃”不同,这款平板电脑打造的却是一种“哑光的塑料美学”。
当然,决定平板电脑成败的不只是硬件,软件也是。谷歌承诺,在未来几周内将更新20多个第一方应用程序,以更好地支持平板电脑显示。与此同时,主要第三方应用程序也支持平板电脑的Android应用程序。
二、最贫的AI机器人LaMDA 2:既能陪聊,又能教学
在AI方面,谷歌公布了最新的LaMDA2对话式AI模型,此外还展示了名为AI Test Ktchen的新应用。
为了演示LaMDA 2的功能,谷歌展示了三个小实验。
第一个演示实验是一次简单的头脑风暴,要求AI帮助用户想象在各种场景中的情况。比如输入“我在海洋的最深处”,AI就以描述性语言回应了一段文字,描述了用户在马里亚纳海沟的潜水艇中的场景。
第二个实验是关于主题讨论的,AI可以与用户就某个话题进行对话,并理解对话的背景。
在演示过程中,AI一开始就问:“你有没有想过,为什么狗这么喜欢玩取物游戏?” 在对“这是为什么呢”等简单后续问题的回答中,AI给出了更多关于狗和狗的嗅觉的信息。
最后一个演示实验,是用AI“试验厨房”让LaMDA 2如何“分解一个杂的目标或话题”。
用户可以提出诸如“我想学习四弦琴”或 “我想学种花”这种问题。AI会将这些话题生成子任务清单,告诉用户应该先做什么,后做什么,甚至可能提出你没有想到的步骤。
桑达尔·皮查伊称,谷歌使用这个应用程序,部分是为了收集对其新AI模型的反馈,并表示,该工具会在未来几个月内开放,听取多方意见,纳入LaMDA的未来更新版本中。
另外,谷歌也提到了近期发布的 PaLM大模型,它包含5400亿参数,理解能力拔群,连笑话都能看懂,还能给看不懂的你解释笑点在哪。
三、应用“全家桶”,几乎全升级了
除了手机、眼镜、手表等新硬件之外,这次I/O大会对谷歌旗下“全家桶”中的软件和应用进行了一次“地毯式”的全面升级。搜索、地图、翻译、语音助手等,你能想到的几乎全升了一遍。
地图:“沉浸式”搜索,就像玩游戏
在本次大会上,谷歌地图推出了一个新模式,让用户在到达想去的地点之前,就能更真实地了解这个地方。
基于街景的沉浸式视图有点像空中的街景:可以从高空俯瞰一个地点,了解附近的情况,然后下降到街道视角,查看可能想去的具体地点。
地图会叠加显示实时的反映交通繁忙程度信息,因此可以实现所看到的任何公园、街角或海滩景点的“准增强现实”体验。
沉浸式视图背后的图像都是计算机生成的,由谷歌的卫星拍摄和街景拍摄组合而成。看起来就像在一个精确比例的真实世界中玩视频游戏。
谷歌表示,“沉浸式视图”功能在大多数设备上都可以使用,虽然到目前为止只在旧金山、纽约、洛杉矶、伦敦和东京等几个街区开放,但很快就会在更多的地方上线。
翻译:新增24种语言
谷歌翻译增加了24种新的支持语言,包括首次增加的美洲原住民语言,如盖丘亚语、瓜拉尼语和艾马拉语等。
其他新增的语言包括:
谷歌表示,新增的24种新语言在全球共有3亿多人使用。在此次升级后,谷歌翻译服务支持的语言总数达到133种。
但谷歌表示,这项服务仍有很长的路要走,因为全球仍有大约7000种不支持的语言是翻译公司没有解决的。
此升级将于今天在谷歌翻译上线,并在不久后面向全球所有用户开放。
搜索:对真实世界来个“Ctrl+F”
作为一家做搜索引擎起家的巨头,谷歌此次对搜索功能进行了两项重大升级。
具体来说,就是一款名为Lens的多重搜索新工具,以及名为“场景探索”的新功能。
Lens为用户提供一个“我的附近”的新搜索模式,用户对某一物体拍照,即可在本地寻找结果。比如可以拍摄一道菜的照片,然后搜索提供这道菜的餐馆,谷歌会显示你附近的相关餐厅列表。
这就像为用户周围的世界提供了一个超强的“Ctrl+F”功能。
另一个新功能叫“场景探索”。比如要在超市里找不含坚果的巧克力棒,就可以利用这个功能扫描整个货架上的巧克力棒,看到一些“有用的观点”,比如关于每个巧克力棒的评论等。
在谷歌看来,这些增强功能未来可以用来做更多事情,而且看起来,这些功能已经开始逐步显现。
语音助手:不用再说“嘿,Google”了
新版谷歌语音助手更容易使用,升级之后,唤醒不再需要用户说出“嘿,Google”。
谷歌在此次大会上为语音助手新增了一项名为“看一眼就开说”(Look and Talk)的新功能。用户只需看着 Nest Hub Max 的屏幕开始说话,就可以实现唤醒。
这项新功能是可选功能,用户需要打开谷歌的面部匹配和语音匹配技术。谷歌没有透露这个功能是否会适配其他设备。
谷歌还为Nest Hub Max添加了快速短语识别功能,便于快速响应用户的常见要求和指令,比如:设置定时器或闹钟、取消定时器和闹钟、开/关灯、调暗/调亮灯光、询问时间/天气等。
谷歌表示,此次更新的总体目标是,让智能语音助理与用户的对话更自然。
“现在和语音助理对话,你必须发出命令,比如说一个人的名字,之后提出问题,然后等待回应,之后再重复这个过程。这有点像打乒乓球,非常不自然,我们正试图改善这一点。”
YouTube:自动翻译字幕,自动分P
说到软件功能升级,怎么少得了Youtube。
谷歌为移动设备上的YouTube应用推出了自动翻译的视频字幕,支持16种语言。该功能现在已经上线,所有安卓和iOS用户现在都可以看到带字幕的YouTube视频。
对YouTube自动翻译功能的更新是2020年推出的,这方便了大量海外用户的访问。2021年,谷歌在YouTube上公开试验自动翻译工具,看起来目前试验取得了很大进展。
另外,为了让Youtube视频的搜索和访问更便捷,谷歌计划大规模扩展目前已有的“自动生成章节”功能,预计到今年年底,将具有自动生成章节的YouTube视频数量从800万增加到8000万。
安卓13:今秋问世,一代更比一代强
Android 13在2022年2月被吹风说要问世,但正式出街是在2022年秋季。
更新功能包括更多的Material You个性化设置、更多的隐私与安全功能、更多的自有聊天软件支持、重新面世的谷歌钱包、和与各种家用车用个人智能设备系统的更好集成。
这些新功能、新支持,将让谷歌与安卓系统的庞大软件生态圈更加有机紧密,与苹果的竞品生态系统相比更有竞争力。
数字可以作证,谷歌史上首次自行公布安卓系统的激活数量。
按负责安卓系统与Google Play的副总裁Sameer Samat称,安卓手机系统的全球激活数在2021年就超过10亿了,每月活跃的安卓移动设备超过30亿,安卓自有的RCS聊天软件有5亿的全球活跃用户。
不过,这些数字,结合三星宣布连续给顾客提供4年免费大型安卓系统更新等动态,让谷歌处于独特处境。谷歌现在在开发安卓系统时必须考虑对大量新旧型号的不同移动设备的普适性支持度。
幸好,Android 13的面世,证明谷歌为了保持这一产品中的王冠明珠,准备充分、用力十足,让各型设备用户都有跨平台的无缝舒适体验。
Android 13现在已有beta测试版可下载了。
四、谷歌重注押AR,原因何在?
作为整个大会的压轴项目,谷歌CEO桑达尔·皮查伊在大会演讲上分享了谷歌公司官方对于AR的看法。
基于演讲内容,可以看出谷歌认为AR产品在很多智能机不能涵盖的功能和领域中都能发挥作用:
对未来展望,可以发现计算科学有一个新的前沿,它有可能将I/O大会其他的新品和新功能扩展得更远,这就是增强现实(AR)。
在谷歌,我们一直在这个领域进行大量投资。我们已经在许多谷歌产品中集成了AR技术,从谷歌Lens到多框搜索、场景探索,以及地图产品中的实时和沉浸式视图。
这些AR功能在手机上已经很有用了,当你能在现实世界中更多使用它们而不被技术所阻碍时,其魔力才会真正发挥出来。
这种潜力是让我们对AR感到最兴奋的地方:能够花更多时间专注于在我们的现实生活、现实世界中重要的事情。因为现实世界是相当精彩的!
所以我们的设计方式是着重以现实世界为导向的——而且不会让用户远离现实世界。而AR为我们提供了实现这一目标的新途径。
业界人士对此分析,认为谷歌多年来一直活跃在VR和AR产品领域。虽然没有一家公司的智能眼镜现在被大众消费者日常使用,但谷歌看起来要再次尝试。
在元宇宙成为热词的当下,谷歌不得不与Meta、苹果争夺这块市场,并提供有不同特色的竞品。不然落后的话,后果比上次谷歌眼镜翻车还要糟糕。
可以看出,这次谷歌在2020年从亚马逊手里买到智能眼镜厂家North后,开发积累了两年后才只放个展示短片探风色。
因为上次谷歌眼镜翻车翻的有点厉害,这次得吸取经验,避免在产品成熟前就有限发布、招来负面舆论、定价无法渐降这些上次谷歌眼镜遇到的困境。
虽然谷歌眼镜仍在向企业客户提供,但可以说该款可穿戴设备从未像谷歌公司设想的那样腾飞过。
除了隐私顾虑外,当年一拿到谷歌眼镜就成天戴着、不管场合适宜与否随地任意拍摄的“谷歌眼镜蛋”(Glasshole)的舆论标签,使谷歌难以在消费者市场铺开推销可穿戴式AR设备。
目前还不清楚这是否是2022年1月份放风的谷歌的Iris项目产品,还是其他完全不同的项目产品。但谷歌在I/O大会上展示的愿景,如果能实现,将是非常有用的。
其AR眼镜短片中最有趣的部分之一,是对实用性的关注。人际间了解和被了解的的能力,是非常现实和有用的。
这些AR眼镜并不特别专注于让用户看见悬浮的恐龙或魔幻的场景,它们是尝试协助现实中遇到困难的人。
Meta公司最近的智能眼镜项目也以实用为愿景,但谷歌的经验和工具似乎更很适合这一目标。谷歌在AR方面的产品最终很可能还是渐进层累式的,但它看起来是先为服务现实世界做尝试。
从这个意义上说,谷歌下代AR眼镜似乎已经与现在其他大厂那种发白日梦一样的魔幻VR套装有很大不同。现在硅谷大企业中很多都在大力投资、研发,使AR眼镜成为现实的消费者商品。
不过到目前为止,除了今天的谷歌,还没有人提出一个真正的杀手锏级别的重磅AR应用,让消费者在购买权衡时忽略该技术固有的各种技术与隐私问题。
参考资料:https://io.google/2022/program/8e80903f-955f-4a5b-9118-b0ce4acdb0e6/intl/zh/
本文来自微信公众号:新智元 (ID:AI_era),作者:新智元