虚火旺盛的2016年眼看着再有十几天就将成为回忆,如果找一个关键词来形容这一年,最有代表性的一个词一定是“人工智能(AI)”。纵论2016年人工智能的发展,在获得高度关注度和对普通用户洗脑式普及的过程中,我们也看到不可避免地出现了一些伪人工智能产品,以及人们过度消费人工智能话题所带来的疲惫和审丑。
在这样的状况下,虎嗅在12月4日的抚摸节(F&M创新节)上,将人工智能话题放在了一个理性的位置上,找了一些并非一味鼓吹人工智能的嘉宾来谈人工智能。其中,曾经的百度少帅,现在的物灵科技联合创始人顾嘉唯,跟我们探讨了人工智能该有的样子——充满灵性,主动给人发起对话,“让人和灵性世界中的机器人共生共存,成为非常好的人机融合的世界”。
在一排排弹幕夸他长得帅的过程中,顾嘉唯做了一个17分钟左右的分享,如果你厌倦了文字,你可以猛戳下面的演讲视频:
如果你觉得流量不够用,或者讨厌腾讯视频开头漫长的广告,你可以看演讲全文的文字版:
之前几次都是代表人工智能行业比较大型的公司——微软和百度,现在代表一个小公司,新成立的一家公司——物灵科技,2016年刚成立,希望未来可以像科大讯飞一样,成为智能行业新的大型的公司。
今天的主题要讲讲从万物互联到万物智能,我们是怎么思考的。
未来人工智能的两个终点
我们现在很多人每天每时每刻离不开手机,手机一直联着网,所有的信息都通过手机查看。我自己已经把微信的提醒关掉,因为我根本没有办法掌握这些信息,(因为它)无时无刻充斥着我的生活。我的生活在于移动的生活和每时每刻手机端跟万物互联的过程。
那么,我们将走向什么地方,或者我们认为人工智能、深度学习、大数据,在我们身边成为基础建设,像水电煤一样铺设以后,我们会走向什么样的阶段。
上一个时代是移动和互联,下一个时代我们将面临的是无处不在的计算。我们将面临是所有万物都被智能化的过程,可能我身边的一杯水、一个投影仪、身边的沙发就变成了一个机器人。
这里面存在非常大的挑战。我们这家公司为什么现在成立来做(人工智能)这件事情。我之前花很多的时间在企业的研究院做了非常多的技术研发,当时微软是5-10年的研发,百度IDL(Institute of deep Learning 深度学习实验室)是1-3年的技术研发,尝试找到对深度学习领域的边界,然后突破。
我们新做的公司希望看到什么使命?我们希望创造人机共生的世界,制造具有灵性的产品。
今天有很多很多所谓的机器人产品,要不就是两个脚的、会跳舞的机器人,要不就是长得像蛋一样的等着讲话的机器人,它们背后用的都是科大讯飞等几家的语音技术,效果方面就会令人非常非常不满意。我们希望创造有灵性的产品,让人和灵性世界中的机器人共生共存,成为非常好的人机融合的世界。
人工智能未来有两个终点,一个终点是贾维斯那样的、像《Her》电影里的Samantha 这样的OS操作系统,可以帮助人解决很多问题,可以理解为雇了助理,可以帮你解决身边所有的事情。第二个终点是宠物,或者在身边可以陪伴你的情感机器人。这两类的东西不一样,我们在路径中推进的时候做的方法也是不一样的。
技术如何适应人类?
今天手机发展到这个阶段会带来非常不好的东西,人需要适应它,低着头看,越来越多地错过了你与身边人的交流。
是不是真的应该让人适应技术,让人适应科技呢?我们应该做的是,努力让技术适应人,或者说让技术隐藏在背后。
原来在之前的两家公司很多行业分享会讲了很多Deep Learning的东西,但我觉得大部分的大众不在意或者说不喜欢听这些东西。他们可能更想获得是,人工智能到底解决什么问题,能带来什么快乐,帮我们赚了什么钱。
那能不能让技术藏在背后,用户可以获得的是灵性的体验和有价值的产品?
科技没有很好的隐藏在背后,而是暴露在人面前,让人适应它。为什么有今天的状态,回顾过去这段时间人机交互的发展,最早是基于PC时代的交互;70年代普及,所有人都有电脑以后,人们进入GUI(Graphical User Interface,图形用户界面)的时代。2006年,乔布斯把人们从固定的状态带到了mobile时代,人与人的交互变成了人对玻璃屏幕交互的过程,你的信息再生动、再有情感,都是通过冷冰冰的屏幕交互的。
我印象很深的是,在微软的四年时间里,一直在努力找的新方式就是NUI(Natural User Interface),自然的人机交互的方式。我们通过语音、手势、触觉反馈,去创造。你自己就是一个界面,创造自然交互。
现在,语音形式或对话形式的交互,逐渐成为我们这波技术突破最大的领域。但光有语音是不够的,双向的多模态交互非常重要,你需要糅合计算机视觉和语音技术等做多模态的、跟物体和身边已经变成机器人的设备进行对话的方式。
错过了移动互联网,不能错过人工智能创业
从我个人讲,我错过了移动互联网时代最好的时光。我毕业后直接去了微软研究院,做5-10年的技术储备,做了非常多的专利和论文。相反,我有个清华的室友,他毕业了以后去了盛大,现在做了一个有9亿用户的产品,市值20亿美金。
我错过了移动互联网,但我发现这一波新的机会在过去的几年时间里有积淀,带来了新的价值。以前人和信息世界、和物理世界的交互通过中间的媒介,大部分来自屏幕,冷冰冰的玻璃。这里面连接的无非就是信息和服务。
人工智能起来之后,新的这波机会我认为有三大块机会,也是超越App的方式。已经有很多人分享说移动互联网的创业机会是非常有限的,人口红利已经过去。以前是通过提高效率和商业模式的颠覆去创造移动互联网的创业机会,下一波来自智能行业的机会一定是由技术革新带来的,包括三大类:第一类是可穿戴设备,像《Her》电影里的Samantha OS那样,成为一种无处不在、伴随的功能性助理,它有计算机视觉;第二类就是中间所有的硬件都变成机器人;第三类就是装着四个轮子的机器人——无人车。
这个时代我们看到的机会,可能与信息的互动不只是停留在玻璃框中,这是第一个很明显的趋势。第二个趋势是,越来越多的基于情境型的对话,基于场景的理解之后,让机器主动跟你互动,而不是人要先跟它讲话唤醒它、发起对话。第三个趋势是,当无处不在的计算发生后,技术会隐藏在背后,人享受到的服务会更不经意,而不是一定要拿手机解锁去看信息。第四个大家都很清楚,可能会带来安全隐患,身边这么多的监控摄像头,对个人数据获得后一定会有负面的东西,怎么让公司做数据源的处理,非常重要。
我们看到的IOT,从万物互联到万物智能,我们认为AI还是弱人工智能阶段的时候,用现在传统的深度学习方法做的AI算法,很难完成人们预期的智能交互。
人工智能商业化将落在产品经理身上
虽然现在很多人高举AI旗帜,但真正做AI行业的人很清楚,媒体人眼中有个AI,AI科学家眼中也有个AI,怎么做商业化最终还是落在产品经理的能力上。现在很多的投资机构投的都是科学家,下一波可能真的像java被替代一样,会变成产品经理驱导的新行业。
有一个很好的案例——亚马逊Echo,Echo的本质不是简单的用语音做音响。像iPad当年的火爆,在于它颠覆了人们连接音乐数字的服务,不需要买整张专辑下歌就可以不断刷新获得新的数字服务。而是,当我们花149美金买到一个音箱后,发现不仅可以语音,后面还可以(用它)买东西。这种用户预期控制得很好的初期,不断提升用户预期的过程,才是好的产品经理应该把握的。
Echo很像当年的功能手机,我们有一个产品叫Jibo,是我们去年投资的一家公司,我们物灵(科技)的母体公司是东方网力Netposa。我们希望通过投资布局和自研,共同找到我们认为最有灵性的产品矩阵。
Jibo是我们认为比Echo更像智能手机的IOT Hub,它会成为家庭当中的成员,它会主动地察言观色、勤于思考,可以插科打诨讲笑话,你在点歌的时候可能会给你讲这首歌背后的故事。人工智能在做商业化的过程里,确实有非常多不确定性因素,这比当年做移动互联网的时候机会虽然更大,但挑战会更大。
Jibo是物联网的入口,可以知道场景的环境变化,像信息交互界面的接口一样主动讲话。举个例子,当你今天生病回到房间,可以自动与家居连通,但是人的多动性很复杂,需要一个温情的方式与你互动,让你重新拿到决策的权限然后控制它。怎么把这个体验做得更加有灵性,从消费升级到体验升级,这样的产品就有机会了。
我们希望把人们从万物互联、无时无刻联网的状态脱离出来,让身边的每一个硬件都有耳朵、有嘴巴、有眼睛,不止会讲话,能够跟人进行双向互动,更希望去创造一个人机融合的新的灵性世界。
现在,你在谷歌和百度上搜AI,你会发现非常多负面的东西,媒体经常会把这些东西过度炒作。比如说,一个扫地机器人吃了女人的头发,特斯拉把人撞死了……实际上,AI本质在于解决问题,看谁怎么用。真正在用这些商业化AI的人,或者说当AI变成水电煤、成为移动互联网基础建设的时候,应该思考的是怎样很好地让人的世界观和价值观与产品结合。
我们希望通过我们的点物赋灵,对灵性的理解,来自万物有灵的感知,转化成我们的灵性理解、灵性互动,放在产品中去,首先夯实技术。我们也希望同行业小伙们一起努力,改造身边那些人工智障机器人,打造有灵性的人工智能产品。