用百度搜索“吴恩达”,弹出来的搜索页面除了他个人简介之外,还有大量的媒体采访,事实上,这位斯坦福大学计算机科学系和电子工程系副教授加入百度担任百度首席科学家后,成为了百度对外展示其技术公司底色的一面镜子,吴恩达研究的领域及其广泛,但最重要是还是深度学习这块,而他负责百度研究院后,其重心主要在人工智能和语音识别上,这也和百度的搜索以及无人驾驶技术戚戚相关,这一次接受采访,主要是因为前不久美国权威杂志《麻省理工评论》将语音接口列为2016年十大突破技术,百度的 deep speech 2成为唯一入选的中国企业,而这一项技术,正是由吴恩达负责。
关于百度研究院我们可以再多说几句,目前百度研究院一共有三大实验室,分别在硅谷和北京:美国的人工智能实验室SVAIL,北京的深度学习实验室IDL、大数据实验室BDL,吴恩达除了负责这些实验室之外,还负责语音技术部和汽车计算机实验室,也就是研究百度自动驾驶的实验室,吴本人长居硅谷,不过经常来北京出差,他对于技术的理解,以及对于中美互联网的差异,有着深刻的理解,下文节选自采访速记,虎嗅进行了删减和整理。
关于深度学习
百度深度学习目前的进展,以及取得了哪些进步
A:其实近来我没有算过,不过我觉得我们的神经网络是越来越大。其实我觉得很多进展,就是百度现在越来越多的产品,越来越深刻的用神经网络了。因为我觉得百度一件事做得比较好,就是好几年前百度开发了一个内部平台叫做paddle,一个内部的深度学习平台,那这个平台呢,就是让整个公司某个工程师想用深度学习都可以比较顺利的开始用。
它的影响就是,我们发现整个公司有很多的工程师开始用神经网络来做,有很多是我们做人工智能的人没有想到的产品,比如说我们的杀毒现在也是用,我们的搜索、广告,我们现在在我们的数据中心也有一个神经网络识别硬盘会不会出现故障。所以我觉得有这么多的应用,这么多的产品,我跟我们的人工智能研究院没有想到的,因为我们有这个深度学习平台,就让整个公司很多的工程师,把它用来做一些非常创新的不同的东西。
语音识别是否已经到了可以大规模应用的阶段了?
A:百度去年的语音技术进步了很多,不过还没有达到我们需要达到的效果,有两个原因,语音识别的准确率,只是在一段比较短的语音,电脑才可以超过人的识别准确率,如果是一个比较长的语音,还有很多情况下,我们还没有人做得好。这是一点,另外一点,除了语音识别,我们还是没有太能够理解人在讲什么,语音识别只是你讲的话我们可以写下来,不过你讲的字的意思是什么,我们还有很多研究需要做。
目前语音识别的准确率大概是多少?
A:其实那个数据是很难讲的,我知道去年讲的95%,99%,在不同的情况下,效果会很不一样,比如说如果你用语音,最好手机这样拿着,比较靠近你的口,如果你比较清楚的讲,这个准确率会非常高,而如果手机比较远,而且讲得非常快,讲得不太清楚,那准确率就比较低,所以准确率可能是90%,可能是99%,就是看你怎么样用,不过其实我觉得,我们的语音技术部门,有非常优秀的工程师。他们都是语音技术的专家,他们就习惯了用手机,而且讲话讲得也比较清楚,比较准确,那准确率,现在已经是非常高了。其实我觉得,用户文本输入,还是在手机上不是太方便,所以我觉得在很多不同的产品,手机百度搜索,或者地图,或者有百度输入法,都可以用语音,我觉得现在用语音的效果已经非常好了。如果你没有试过,应该试一试,可能已经是非常方便了。
关于人工智能
百度的人工智能今年会在哪些领域应用?
A:其实现在很多百度的产品已经是用这些技术,因为比如说百度做搜索,很多效果都是靠人工智能。其实给你另外一个例子,百度有很多不同的网站,有很多反对垃圾信息也是靠这些技术。或者是如果你想要产品,然后推荐你一些产品,有很多也是使用的研究院的技术。那你刚才说自动驾驶,我觉得我对自动驾驶,感到非常激动,我觉得这是有非常大的潜力可以改变社会的,救人生命、更便捷,不过我们还没有做完,我们还是刚开始,我觉得这还是有很大潜力和一个非常多工作的一个项目。所以不是说2015年做自动驾驶,2016、2017年做另外的,自动驾驶会变成一个长期的项目。
人工智能PK围棋、象棋高手,人工智能接下来会如何发展?
A:其实我觉得很难讲,其实人工智能也不只是一件事,现在人工智能是用在一个非常多的办法,人工智能是做自动驾驶,语音识别,做搜索,做那些反垃圾邮件,让我们的数据中心变得更依赖,更可靠,这是很多不同的事。百度新的金融事业部,也可以靠人工智能提供更好的金融服务,我们的很多服务,比如糯米,外卖,很多这些东西都是用人工智能来让人的生活变得更好,所以我觉得人工智能不只是一件事,是很多不同的事。
IOT、这些设备,我们的灯、恒温器,都嵌入人工智能,我觉得自动驾驶是非常重要的一部分,我们可以通过人工智能建设一个更好的社会。这在AI的后几年来,也可能是产生一点困难,我觉得最大的挑战是这个可能会威胁到部分人的工作,但是说我们也希望能通过我们的技术来帮助他们。其实不只是技术来帮助他们,我觉得我们的社会是一个充满伦理,道德的。应该用道德和伦理去帮助这些人,我们的社会会越来越好,如果有一部分人的工作受到影响,我们应该去帮助他们。
那么未来三五年人工智能会让哪些人失业?
A:我觉得现在人工智能就是如果你只是做一件事,就有可能人工智能可以自动的做一件事,不过如果你的工作需要你做很多不同的东西,那人工智能自动做那么多不同的东西是比较难。
就是单一重复的那种劳动是吧,但是很难预测是哪些劳动,比较难。
人工智能会通过图灵测试吗?(如果电脑能在5分钟内回答由人类测试者提出的一系列问题,且其超过30%的回答让测试者误认为是人类所答,则电脑通过测试)
A:很难讲,我觉得很多人都没有看那个图灵测试,因为电脑的想法跟人的想法是很不一样的,所以电脑有时很聪明,不过机器智能不同于人类的智能,所以还是有很多东西,电脑不会复制人类。比如说人是有感觉是有情感,比如爱、恨、不耐烦,所以为什么我们会要电脑做这些东西?
霍金、马斯克,他们都提醒我们要警惕人工智能,吴恩达怎么看?
A:其实有一句话,我在一年前讲过,就是对超级人工智能的担心就像担心火星人口过多。就好象火星上有太多人了,其实我觉得可能几百年后有人在火星,可能那时候火星真的是太多人了,被污染,生病,那时候我们真的是应该担心,找一些方法来理解这个问题,但我现在真的不知道。其实我觉得很多人还是不太理解人工智能是什么可以做,什么不可以做。
以及一些好玩的话题……
如何评价谷歌的Atlas机器人(注:Altas是谷歌新一代机器人,能够在各种复杂路况上自如地行走。并且平衡能力惊人,在打滑甚至被踢的情况下仍能维持住姿态,详情可参加youtube视频)
A:我对那个技术不太熟悉,真的不知道他们在做什么,我觉得效果看视频好象不错。
实际成功了吗?
A:我觉得是一个非常成功的Demo(全场大笑)
下个月alphaGo会迎战韩国围棋手,您预测谁会赢?(时间在3月9,10,12,13,15日,具体可参见虎嗅站内文章的介绍,戳这里)
A:很难讲谁会赢。不过我觉得人工智能是做了很多这些演示,比如说我记得好像是1998年,那时候我还是在做博士研究,我记得那时候是IBM的象棋,所以我觉得这些东西,全社会都会有一段时间觉得非常紧张,非常有兴趣,其实我觉得长远来看,这是进步,我很兴奋。
怎么看O2O?为啥美国没有成熟的O2O?
美国O2O不如中国的O2O发展好。我回去美国,告诉我的妻子,O2O在中国是怎么样的,因为她没有来过中国那么多次,我觉得她是对O2O的发展是没办法真实理解的,没办法知道这个感觉是什么样的。就比如说你可以拿着手机点一点,就会有人来帮你洗车,在美国很多人是没有这个经验的,你告诉他,他真的是比较难理解的。或者你拿手机,就有人来你的厨房煮饭给你吃或者来洗你的衣服。在中国,这些我们都知道很普通,要用就用到,在另外的国家,这些东西很多都没有见过。
我跟我的妻子说,我觉得她还是不太理解,用O2O的感觉是什么。所以,几个月前,我在中国的时候,就请我的助理帮我拍了几个短视频,用我的手机来演示不同的O2O在中国使用的视频。外卖、洗车什么都有。然后把这些视频带回去美国放在互联网上,Youtube上,让我的朋友可以看到这些O2O在中国是怎么样的。
为什么会这样呢?
A:我觉得一个原因就是中国是手机使用很成熟的,在美国很多人第一个电脑就是这种laptop或者desktop,他们就习惯用电脑。那电脑和手机的用法是完全不一样的,因为手机的有GPS,每天都在你旁边,知道你在哪,所以很多东西用手机是比较容易做的。在中国很多人是先拿手机,所以他们就很习惯用手机操作。在另外的国家,很多人用电脑,我们还是需要慢慢的培养他们用手机的习惯。另外一个,就是中国的大城市很多,人口密度很高,O2O就会比较便宜,也是一个原因。