虎嗅注:人工智能是计算机科学的一个分支,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。在AI讨论度如此之大的当下,虎嗅2017F&M创新节再次请来了科大讯飞执行总裁胡郁。在10月2号的主会场上,他分享了讯飞超脑最近在人工智能方面做出的成绩。胡郁用时下最具讨论度的话题和深入浅出的演讲引爆了场内观众的掌声,实时弹幕纷纷表示“要延时”、“被圈粉”。
胡郁还介绍了人工智能从“运算智能”到“认知智能”;从计算到会阅读会思考的转变过程,表示将来的产品体验会是自然的人机交互。同时胡郁还向世界的人工智能公司提出,创新是世界技术的要务,人工智能技术创新人员会为社会产生颠覆性的效果。同时,传统产业更需要人工智能来保持自己在行业的领先。
本文由虎嗅整理而成。
大家好,非常高兴又能来到虎嗅F&M创新节。我记得我去年来的时候人工智能可能还没有像今天这么火,今天,无论是从公司的估值还是技术的演变上来讲,人工智能都进入了一个新的高潮。当然,如果大家关心股票就会发现,科大讯飞在今年的股票表现上也非常好,但经常被人诟病的一点是我们的市盈率太高了,其实这也可以看出人工智能当前处于爆炸性的时刻。
今天想跟大家分享两个方面的问题。在过去一年里边我在很多的场合下,我们也宣讲过科大讯飞在人工智能、在讯飞超脑方面已经做出的成绩和一些初期的理念。今天我再想花一部分的时间跟大家分享一下在人工智能大潮的情况下,什么样的创新和什么样机制能够在我们人工智能的大潮中保持领先地位。
“运算智能”到“认知智能”的转变
我们都知道人工智能是处在一个新的宇宙里边,如果说人类是在自然宇宙里边经过了140亿年的孕育产生,那么人工智能是在什么样的宇宙里边?我们把它叫做数字宇宙。
1946年IBM的“ENIAC”数字计算机被发明,到现在71年的时间,人工智能以非常惊人的速度进入到一个非常快速的增长过程之中。在这个过程中我们不能忘记的是在人工智能第一批浪潮,也就是1950年左右的几位大师。大家比较熟悉的两位是冯•诺依曼和图灵,还有像数学家哥德尔,和建立第一台民用的电子计算机(在普林斯顿大学建立的MINIAC的计算机)的毕格罗,是真正将电子计算机带入了现代社会的人,并且也促进了IBM成为电子计算机开创性的技术公司。
在过去几年当中,科大讯飞一直致力于把人工智能这件事情讲清楚,我们也提出了像运算智能、感知智能、运动智能和认知智能这样的人工智能区分体系,同时也非常荣幸的得到了大家广泛的支持。
我们都知道认知智能是人类是区别于动物非常重要的方面,包括语言的理解,知识的表达、复杂逻辑的推理和最后的执行。现在AlphaGo和AlphaGo Zero其实是计算机原来就非常擅长的计算智能,是以他们本身的语言作为表现的。通过不断的研究,我们期待着计算机能够从运算、认知不断的进行演化。
但就现在来看,其实认知还是一个非常艰巨的过程,人类在过去的七万年至二十万年之间实现了我们自己的认知革命,我们成为地球上的主宰,人类创造的机器人是不是能够实现他们的认知能力这一点让我们拭目以待。
人工智能的的三个路径
再说到人工智能采用什么样的路线来实现?我们也提出了三个非常明确的观点。
深度神经网络
第一个就是大家都说的大数据人工智能。因为有了互联网和云联网,让大数据成为可能。利用深度神经网络对大数据的超强处理能力,我们现在所实现的弱人工智能是在各个人类人工智能的表现上更接近于人类的表现本身,但是它离我们真正的人脑的智能还差的很远。
全脑模拟
在当前脑科学与人工智能交叉学科的分类上,这几年包括美国、欧洲和中国都提出了脑计划与人工智能的结合。有人提出来用一个超级的计算机模拟我们人类大脑,这是第二条路径。如果把人类的大脑的生物结构完全搞清楚,放电机制完全搞清楚,我们是不是可以用一个比现在更快一亿倍的计算机整个模拟我们的大脑的生理结构呢?Maybe。
但是这样产生的东西是不是我们想要的?
智能动力学
现在我们也已经提出了第三个路径我们把它叫做智能动力学。什么叫做智能动力学?大家都知道,人类学习鸟飞禽的时候,一开始是不知道原理的,我们采用全脑模拟的这样的方法,我们贴上很多鸟的羽毛,从很高的地方跳下去学习飞行,后来证明这种粗糙的模拟是不可能的。钱学森的导师冯卡门在美国创造了一门新的学科,叫“Aerodynamics”(Air Dynamics)。那么今天我们研究脑科学的时候,是不是在模拟人脑的时候去探求一下人类大脑真正工作的奥秘呢?
如果我们能在这些大脑中间找到我们讲的智能动力学(Intelligence),就能造出超越人脑新的大脑。为什么呢?因为在数字宇宙里边我们不需要再受人脑在自然宇宙里边的束缚。在这种背景下,因为我们有目标,有方法,所以我们也提出了讯飞超脑的目标,现在用大数据人工智能,将来用智能动力学的方法,我们要让机器从能听会说,到能理解会思考。
过去的一两年中间,我们的讯飞超脑也在国际上一系列的比赛当中获得非常多的成绩。
我们在CHiME的国际多通道语音分离和识别大赛获得了第一名。连续十二年我们在"Blizzard Challenge"英文语音合成大赛中也是名列前茅。我们现在的图文识别,英文手写识别率的最高水平已经达到了97%,也就意味着你在文字上,你在任何一张纸上,写出英文,我们可以97%的正确率把你的结果识别出来,混合图文达到92%以上的正确率,这在很多的应用中间有非常高的显示标准。
在美国的SQuAD阅读理解的比赛中我们现在也是第一名,充分证明了我们的机器在会理解、会思考这方面取得结果。同时在肺部结节的数据识别库中也是达到了很好的成绩,让机器的眼睛识别为我们的癌症治疗又实现了一个很高的水平。我们在国际医学影像领域的权威评测LUNA上获得平均召回率92.3%的检测效果,以显著优势获得该项评测的第一名并刷新世界记录。
除此之外,在智能驾驶的Cityscapes(国际上最高水平的场景识别的为自动驾驶做一个评测)中,我们在2017年也刷新了Cityscapes的世界纪录,Cityscapes是由奔驰发起的,是自动驾驶领域最权威的评测。
大家还都知道我在领导中国高考机器人的项目,在过去三年里边我们领导一百多个国家,超过上千人的队伍在研究如何让机器人能够参加高考,今年的最好考试成绩已经出来了。而且我们跟国家卫计委做了一个真正在实用的机器人,就是能够通过国家医学资格考试的机器人。现在要当医生,你必须通过医学资格认证资格考试,总分600分,及格是360,我们的机器人考了456分,高出及格线96分。这就意味着对很多疑难杂症,我们的机器人现在已经可以很好的为你解答了。这在偏远的地区和信息不发达的地区其实是有非常重要的作用。
在过去的过程中,关于人工智能我们不仅做了很多研究性的工作,我们在基础算法和各类技术中都找到了很多的应用。
人工智能怎么改变我们消费者的产品?
因为我现在也是科大讯飞2C类产品的负责人,我们认为人工智能改变产品类最重要的方法就是用增强人和机器之间的交互,就是我们看他们会怎么样?
大家都知道80%人类的信息输入是靠眼睛,但是有多少人知道我们的90%的人的信息输入其实是靠语言。为什么?我们可以靠手势,可以画画,也可以写一段文字,如果把我的话表达出来,输出是靠语言。而机器输出最有效的输出方法是通过图像、显示屏输入视觉吗?不是,机器现在在智能上刚刚能够突破的是,通过机器能够听到我们的语音,这就构成了一个闭环,这也就解释了为什么语音交互,特别是我们讲的强视觉呈现语音交互能够达到将来人机交互最自然的一个方面。
在这个方面我们也推出了AIUI的2.0,主要在四个场景,向移动、场景、车载和翻译,包括家庭推出我们的产品,无论是开发者的速度和数目都得到了很大的提高。最后希望我们所有的东西“Al for You”都能得到一个很好的进展。
人工智能如何构建它在C端的生态?
我今天还想花一点点时间讲一讲人工智能如何构建它C端的生态。因为一个公司如果只是技术上做的好我认为不能解决问题,必须在商业模式上想出新的方案,要考虑到当前商业发展的洞察,它的宗旨到底是什么样的?
我们知道当前的竞争已经不是公司和公司之间的竞争,是生态和生态之间的竞争。这张简单的图片告诉你什么样的公司能够做大,公司能够做大跟你努力的程度有关系,最直接的因素就是你的在产业生态系统中的定位。
大家看,开口大的都是消费者,这边是通讯和计算机的生态系统,最接近消费者的是什么?手机厂商、运营商,离开消费者远的是什么?技术提供方,同样在服装的体系也是这样的,所以说当你在公司里边,你是处于一个大家可以看到你是处于某一个分层中的位置,为什么它是一个衰减的形式?当离你的钱越来越远,你公司的规模、收入就会越来越小,大家看到收入从别的地方流过来就会减少。
还有一个非常重要的因素,在某一个横截面里面会有多少厂商生存下来,现在大的手机厂商数不超过十个,我们看到服装厂商有几十万家之多,为什么?以为我们人类对待最终用户的产品是不一样的。如果你是一个核心技术的厂商,2B的厂商可能就在这儿(图中“技术提供方”处),在这个品类中(图中“运营商”处)决定我们的公司做大你是在什么样的生态系统,你靠近消费者或者是控制者的距离有多远,和你所在这里面最后会保留几家厂商,我们把这个东西叫做大C,而那种小厂商则会留下非常多的选择。
在中国有一个特点,我们中国有两套经济计划体制。中国的商业生态是包括计划经济、市场经济两种的,计划经济控制权在哪儿,在国家战略,在国家的高层领导机构。市场经济的控制是由我们的消费者决定,消费者来决定我们生态系统的控制权是谁。
Marco Iansiti和James F. Monroe写过两本书,《The Keystone Advantage》和《The Death of Competition》。用科技创新的方法,其实我们可以得到一个新的生态。这两本书描述了生态的生存、发展、竞争和消亡,在过去的过程中我们看到过去的公司有一系列的公司成为核心者,包括谷歌、苹果,但是生态上他们除了这些公司以外,他们还需要很多的产品创新、微创新的小的创业者跟他们进行结合。在人工智能时代也是一样,在创新创业这个问题上,其实Christensen写的关于《创新者的窘境》、《创新者的解答》很好解释了在大公司中如何做创新或者是小公司如何进行竞争。
我最推崇的就是Geoffrey A. Moore写的几本书,《跨越鸿沟》《龙卷风暴》和《公司进化论》,现在经常有人问我,在人工智能领域找到人工智能技术的公司,是他们具有领先的优势还是说传统行业里边需要人工智能去改进他们公司具有优势呢?这一点可以得到很好的说明,Geoffrey A. Moore说,在新的技术会进入到早期市场,但是必须跨越鸿沟才能进入我们的大众早期,所有的技术创业公司都希望自己是一个颠覆者,能够通过早期的创业,跨越鸿沟成为新一代生态系统的核心。
但真正的情况是什么样?我们讲的早期市场的创新只是一个小角落(图中“早期市场”处),一个小的角落,而在成熟的市场里边可以通过其他的延续性创新,延续性的创新可以在传统行业里面具有优势的人,继续保持他们的优势。人工智能技术创新的人员可以产生颠覆性的效果,但是传统的行业传统的厂商可以在原有的生态系统里面,利用人工智能来保持他们的领先,对大家来讲他们都有他们全新的机会。
作为一个人工智能公司,不管是人工智能公司还是使用人工智能的公司,一定要意识到自己是技术创新的公司,技术创新在世界上技术是第一,通过技术创新结合合适的商业模式才能赚到大钱,最后这样的大钱反过来不断的持续投入继续创新,最后它必须是一个全球化的公司。所以在这种情况下我认为,将来的人工智能将无处不在,每个公司都需要,但是将来的生态系统会是种什么样的生态系统?它可能是一种混合正交的商业系统,也就是“Mixed Orthogonal Business System”。
每个公司间都有建立紧密的合作,都有自己的人工智能大数据,在新的生态系统下,支持经验、数据和利益的分享非常重要,这就改变了在过去的时间,我们讲互联网模式的一家独大,赢家通吃全面垄断的局面。
今天我的演讲就到这里,谢谢大家。