Google I/O,每年不可错过的科技巨头秀之一,昨晚在加州山景城悄然上演。
Google CEO 桑德尔·皮猜
作为Google一年一度的“肌肉秀”,此次I/O大会一反寻常的“多元化”,整场大会甚至可以用“All in AI”来概括。或许正是因为大会走势“至刚至猛”,往年Google不按套路出牌的“惊喜”也没有出现,反倒让人觉得有点“无聊”。
内容除了AI,还是AI
在Google CEO 皮猜短暂的自黑开场之后,本次大会就进入了AI“单曲循环”,各种AI应用创新一个接一个上台。
Google Assistant:真人、机器人傻傻分不清
Google Assistant能够与用户进行流畅的自然对话
其中最令人印象深刻的或许还是要数Google Assistant的“例行升级”,全新的人工智能技术不仅让它请起来更像真人,同时还能更好理解用户的自然语言(你随便说,它都能听懂)。同时还能在与你对话的过程中,联系前后的对话,和你进行真人一般的聊天。
虽然技术进步了,但毕竟大家在使用Google Assitant的时候通常都是对折一台机器,难免会觉得出戏,所以Google这次也给大家带来了一个全新的应用场景。他们尝试着让Google Assistant在获取了一定信息的前提下,去完成诸如餐厅订座、影院订票之类的简单语音沟通。从测试效果看,如果换成我在电话对面,绝对听不出这是个机器人。
当AI驱动的AR遇上地图
除了语音,Google前两年已经开始有所建树的视觉方面也有了新的进展。这次神奇的视觉应用Google Lens获得了Google地图的助攻。从识别地点位置,到显示商家信息,再到与AR宠物狐狸带路,整体实用性很高。
10秒钟写一封邮件
邮件灰色字体内容为推断内容
在继续拓展语音和视觉方面技术应用的同时,Google还带来了终极的英文邮件撰写“作弊器”,用户在敲下前几个字母或者词的时候,系统就会根据上下文推荐最有可能的内容,现场实测只需十来个字母、加上几个空格键就能完成一封邮件。
点开相册,一键修图
照片的灰色背景是一键生成的
如果说前面这些功能还比较“明显”,用户都会有意识地去使用的话,那么Google这次在系统相册中提供的自动修改意见就可以算是“润物细无声”了。哪怕用户只是在浏览相册,都会在下方出现系统的相应修改意见,轻松点击即可修改。
全新的Android系统,最懂你要开啥APP
然后是全新登场的Android P系统,虽然系统改动了不少,但是最吸睛的或许还是要算系统根据用户使用习惯、时间的因素,在应用库的顶层直接进行主动推荐的设置。
Android P系统的首发厂商
值得一提的是,在Android P系统的首发品牌中,有一半来自中国(小米、Oppo、Vivo、一加),而在Google Lens的合作厂家也有小米、TCL、一加的身影。
严格来说,本次I/O大会上登台的应用或多或少都是从前两年发布的新产品延伸而来。但从随着各项技术的不断完善,例如现场演示的Google Assistant与真人对话、相册自动推荐修改等功能,的确能让人感觉到Google的进步。
除了效果更佳之外,这些全新功能与系统的结合程度也颇高,反而降低了用户在这些新功能上的学习成本和使用成本。堪称一整套比较完美的解决方案。
除了往年常见的软件进展外,今年Waymo也来到了大会台上,在现场展示了一把自己的技术实力:不仅对各种“奇异人类”(蹲下、恐龙服)都能识别,还成功地在路口躲过了一辆闯红灯的小轿车。
Waymo官方在现场也透露了目前公司一些关键性的进展数据:公共道路行驶里程已经超过600万英里,利用AI在模拟环境中的行驶距离已经超过了50亿英里。
TPU 3.0来了,移动端平台增强
整体的计算能力对于一家公司的AI能力发展来说尤为重要,同时或许也是为了延续上两届I/O大会都发布新TPU产品的“传统”,本次大会TPU 3.0正式登场。
可惜的是,皮猜并未在现场对TPU 3.0进行详细说明,而只是简单表示:“TPU 3.0的计算能力最高可达100PFlops,相比之下较TPU 2.0提升了超过8倍。”这样的提升幅度,在以高速增长出名的半导体行业中,也非常少见。
从现场的图片上看,TPU3.0采用了与TPU 2.0相似的整体方案,即每块主板4颗芯片。但整体的散热方式从上一代的风冷更换为水冷,整体的工作环境有所提升。
除了最基础的AI硬件之外,Google在开发工具包上也有新品。这款新品名为“ML Kit”,它是一个旨在帮助用户在移动端应用中使用机器学习功能的开发者工具。如果你记忆力不错的话,可能还会记得去年这个时候的WWDC,苹果实际上也发布了一个名为ML Kit的工具,两者定位的确比较相似。
当然,从Logo来看,这两个同名为“ML Kit”的工具并不是同一个东西。而按照Google相应产品负责人现场的介绍,这款工具目前已经能够“身兼数职”:从给图像打标签、到文字识别、脸部识别、二维码读取、信标检测,智能回复等等。
更令人惊讶的在后面,这个开发套件同时还支持针对移动端开发的TensorFlow Lite,还能够跨平台运行在 iOS 和 Android。可以预见,Google ML Kit的出世,将会大大降低手机厂商和软件开发者利用AI技术的门槛。
TensorFlow在本次大会上没有单独拿出来说,这一由Google领衔打造的人工智能开源架构目前采用吕很高,版本已经发展到了1.7.0,在本次I/O大会则是一个“赋能”具体应用的角色。例如它在Waymo中扮演的重要角色。因为自动驾驶过程中要不断预测周围环境的变化,所以自动驾驶汽车不仅需要采集大量数据,同时还要根据环境数据给出行为的预测。
这个问题最终依赖“TensorFlow+TPU”的强力组合解决,也让Waymo得以在模拟环境中完成超过50亿英里的模拟道路测试,这个量级的模拟测试,让Waymo充分模拟了自动驾驶环境的各种场景,大幅降低了自动驾驶过程中发生错误的概率,Google官方给出的错误率变化,下降超过了100倍。
“体系”愈发清晰,Google已定节奏
作为Google第一次“All in AI”的I/O大会,或许会在有些人眼中显得单调,但同时围绕着AI这一个中心展开的内容,也让Google的AI“体系”清晰地现实出来。
不同于别人家的单点突破,Google上来就是一套“AI组合拳”:最靠近用户的是专门针对系统优化的AI应用、AI应用所对应的是最受开发者支持的AI架构、AI架构所对应的是重金打造的高效云处理芯片。最终形成了一个基本全部由Google主导,层与层之间配合默契的一体化“AI体系”。
更重要的是,Google已经沿着这三层结构坚持走了3年。
这3年间,Android系统里面的AI应用越来越多,系统的针对性优化也越做越好;TensorFlow已经成为全球最流行的人工智能架构,成为众多开发者的首选;TPU已经发展到了第三代,整体性能不断倍增。并且根据当下的软硬件技术现状,这种发展目前还看不到停下来的势头。
在尝到AI的甜头之后,Google很明显也已经选定了自己的节奏——在AI尚未成熟之时,直接进行一个完整的体系布局,并且不断推动整个体系的发展。
毕竟,这应该是Google摆脱“超级广告公司”最好的机会了。