本文来自微信公众号:混沌学园(ID:hundun-university),作者:陆奇,整理自《未来已来:全球领袖论天下》,演讲时间为2019年11月11日,文内略有删改,中信出版社2021年3月出版原文标题:《陆奇:在未来,究竟哪种职业创造财富的机会最大?》,题图来自:视觉中国
今天,数字化正在发生,随着数字化的进展,整个社会中的一切都会被数字化。每个人都在谈论数字化的产业,数字化对整个社会有着非常深远和广泛的影响,在为此感到兴奋的同时,随之而来的也必然有焦虑,因为数字化会产生一些前所未有的社会现象,其后果如何、会带来怎样的影响,我们都还没有充分理解,其未来将何去何从成为当下的热点问题之一。
依我之见,洞察未来是有方法的,我将其拆解为几个部分。首先,探究其背后的驱动力在哪里;其次,研究其结构是什么;最后,构建其形成的具体图谱。弄清楚未来趋势的这三个组成部分,我们对其的理解就是结构化的、深层的,也才能更仔细、有效地观察未来。
过去20多年,我个人非常幸运,正好在对的时间,有机会在一线参与、观察整个高科技工业历经的几代技术平台,以及其产品所衍生的商业生态。
在进入对数字化未来发展趋势的解读之前,先分享一个在我看来十分有用且我自己也一直在使用的思考方法,它对我产生了巨大的影响。美国物理学家理查德·费曼说:“如果我没能把某件事建立起来,我就没法理解。”
这句话十分重要,它揭示了一种认识世界、观察研究对象的方法:针对任何一个复杂的问题,可以把它进一步拆解为子问题,针对每一个子问题,又继续拆解为子问题的子问题,如此穷尽问题到不能再拆解为止。然后,针对每一个子问题的答案都想好方法测试验证,直至把所有子问题的答案都验证清楚正确了,才能说真正弄明白、搞清楚了最初的问题。这是一种线性思考的方法,可以帮助你把所有问题都探究到本质。这种思考方法已成为我的一种习惯。研究数字化,我也采用这种方法。
1. 数字化的本质
数字化是什么?其本质到底是什么?我认为数字化包括六个核心步骤,缺一不可。
第一,获取(Capture)信息。搜集获取某现象的相关信息是数字化的第一步。
第二,表达(Represent)信息。搜集信息后必须把特定信息表达出来,可以用各种形式表达,比如二进制、符号和向量等。
第三,存储(Store)信息。必须把现有信息存储在某个有效的媒体上,纸就是存储信息的一种媒体。
第四,传送(Transmit)信息。在使用信息时,需要对信息进行传递。
第五,处理(Process)信息。这是数字化过程中最为核心的部分,对信息进行处理,通常是利用数学知识或模型通过计算对信息进行处理。
第六,递送(Deliver)信息。这是把处理好的信息传送给某个特定终端,该终端能够达到我们人类所需的目标。
上述六个步骤构成了数字化,缺一不可。用上述六个步骤来解析当前所讲的数字化,比如,一个用户用键盘把信息输入终端,信息获取通常是用键盘。信息的表达通常是二进制,用0和1来表达。今天的信息存储基本上是用闪存或硬盘,信息传输则往往通过移动互联网、全球的网络、海底电缆这些物理网络。信息的处理,大部分情况下是用硅晶片和软件做大规模的运算。最后是信息的传输,则重新回到具体的应用场景,通常是在屏幕上显示出来。
但我想强调,当前的数字化方式并非一成不变,比如信息表达,可以用非符号的方式。现在的人工智能都是以深度学习为主,而深度学习某种意义上就是一种非符号的表达,它是用重叠向量来表达信息的。而信息也不一定要存储在磁盘或硬盘上。今天在科学界不停探究的是用合成DNA(脱氧核糖核酸)基因来存储信息,信息的密度会大规模地提高。同理,处理信息也不一定要在硅晶片上,可以用其他运算基础,比方说量子计算,就是一个完全不同的、效益高得多的信息处理方式。
所以,数字化并不一定只如我们今天所见,人类在历史上其实也在不断做数字化,只不过采用了不同的方法,比方说用纸张作为媒体,用人进行信息采集或处理,用笔和纸来记录信息。古代人在设计桥梁、造房子的时候,一样要计算,其实整个过程也包含了信息化的这六个核心步骤。中国的算盘就是历史上的一个计算技术,辅助人们处理信息。
那么数字化究竟有什么作用或者说好处呢?数字化是把人们需要的信息获取后存在一个特定的介质上,使得信息本身与这些信息所描述的实体分离开来,进而被大规模、高效地处理后又被传递回人们所使用的终端,被进一步利用的过程。比方说,我们想要描述今天举行讲座的这座大厅,如果描述这座大厅的信息不被抽取出来,那么对这座大厅进行改造就会花很多成本。但如果描述这座大厅的所有信息被抽离出来,就放在一个特定的介质上,通过使用计算机运算,可以还原这座大厅的各种细节,把这些信息用来指导这座大厅的改造,就可以大规模提高效益。
所以,数字化的核心在于信息的获取、表达、存储、传送、处理和递送,它将现实中的现象或物体用信息抽离出来,让信息在某种新的媒体上,以不同的形式表达出来,用一种高效的计算处理信息,形成可获取的知识。这就是数字化的核心。它可以大大提高效益,帮助人们更好地达到目标,这是数字化的核心。
2. 数字化的核心驱动力
毫无疑问,数字化是一条长河,从历史中走来,向未来奔去,不可阻挡,呼啸而过,越来越多的人和领域被卷入其中,对人类社会的影响也越发深广,原因何在?它的核心驱动力是什么?我这些年一直在思考这些问题,也常就此与朋友们交流。我从在不断快速变化中找寻恒量入手,越能抓住亘古不变的东西,越能帮助我们理解未来、预测将来。
我的这一思考角度深受大卫·克里斯蒂安教授的影响,其实盖茨很早就给我推荐大卫的书籍以及40多个小时的视频,他对盖茨也有很大影响,可惜我一直没有看。他提出了一个简单却视角独特的概念——“大历史”,他认为如果不从物理世界的宇宙起源开始是无法研究人类历史的,我对此深表赞同。他认为,历史的起点在物理世界、化学世界、生物世界。在物理世界里,只有两样东西恒久不变:能量和信息。能量比较容易理解,而信息可以转化为知识。一种有效的可以解决多种任务的表达方法,就是知识,而知识是一种潜在的能量。
举例来说知识为什么是潜在的能量。假定有两个人,他们的任务是搬动一块很大的石头,一个人懂杠杆原理,另一个人不懂。懂得杠杆原理的人用一根木棒很快就可以搬动石头,不懂杠杆原理的这个人就永远搬不动,所以说知识是潜在的能量,这是很重要的一个概念。
宇宙起源理论认为,复杂系统是智能的,它能针对环境的变化而做调整。其智能之处就在于,用能量加信息来减熵。人类是一个复杂系统,人类所做的一切都是减熵行为,基于这一宏大的理论背景,不变的不变就是能源加信息。人类社会就是一个超级复杂的系统,而人类社会的长期驱动力,第一是追求权力,第二是追求财富,第三是追求知识。人类的历史证明,人类永远在追求这三样东西,无论是个人、组织还是国家。
那数字化与此有什么关系呢?数字化可以帮助我们更好地追求我们想要追求的,因为人类永远在追求获得更多的能源,用更多的信息来减熵,这是最终核心的核心。数字化的驱动力永无止境,不可阻挡,因为它是基于大历史,基于物理世界、化学世界、生物世界运转的现实,基于人类社会作为一个复杂智能体系的存在的根本。
图10.1的结构不完全精确,但我想借此分享几个重要的概念,讲述一下推动人类社会不断演进的力量和结构。人类社会是由通用技术的发展推进经济的发展,基本上可以划分为三个阶段:农业时代、工业时代,以及我们现在进入的信息和知识经济时代。
农业时代基本上由太阳能驱动,太阳能是人类可以使用的免费能量,基本上只要用劳力就可以,不需要大规模的其他技能。因此,农业时代这条曲线很扁。
工业时代持续发展了300多年,最大的核心驱动其实是化石能源,一开始是煤、汽油,后来变成电,可以输送到任何需要的地方。工业社会主要是化石能源加上人的技能(技能也是一种知识),工业社会有大学,大规模训练培养厨师、裁缝、工程师、律师等具有各种专业技能的人员。因此,工业时代这条曲线开始上扬。
图10.1 人类社会由通用技术的发展推进经济的发展
接着人类进入了这条增长最快、最陡峭的曲线,它是由大规模的信息、数字化来驱动的。计算机的发明,使得获取信息、处理信息的能力以惊人的速度高速发展。第三条曲线仍然是以化石能源为主。人们已经知道,化石能源是有时限的,我认为假以时日新的能源结构必然会出现。
可见,当前的数字化大浪潮之所以来势凶猛,会对人类社会产生重大影响,原因正在于此。从宇宙起源开始的大历史发展演化说明,当前的数字化浪潮是历史的必然,势不可当,不可逆转。
3. 解构驱动数字化的计算平台
过去60多年的历史上,数字化进程一直是由计算平台来驱动的。由于高科技一次又一次突破,平均12年左右会产生出新一代的计算平台。图10.2就充分展现了计算平台演化的发展路径。
图10.2 历代计算平台发展路径
第一代是IBM(国际商业机器公司)单板的个人电脑;第二代是微软、苹果的个人电脑,这时的个人电脑有了显示器,同时有局域网;第三代是PC互联网;第四代是移动和云;而我们刚刚进入第五代AI/5G +边缘计算的早期。
而每一代数字化计算平台的驱动力主要是数字化的广度和深度。数字化广度,可以用用户的数量、地域的覆盖度(覆盖多少个国家,多少平方公里的土地)等来衡量。数字化的深度,可以用交互的频率、交互的信息量、使用的频密度和使用的时长来衡量。
任何一代计算平台,都有前端和后端。
前端永远由交互的模式来驱动,我服务了八年的微软,无论是盖茨,还是鲍尔默,我们最关注的一点就是交互。任何一代技术一旦有交互上的突破,必将引爆大规模的商业价值。道理很简单,新的交互出现,意味着数字化的程度就提高了,无论是数字化的广度还是深度,都提高了。通过把握数字化演进中的“不变要素”而洞悉未来,“交互”理所当然是永远首要关注的,因为交互定义了数字化的行为。
首先,前端包含鼠标、键盘到手指等交互入口。
其次,包含数字化的终端设备,其形态也从个人电脑演变为智能手机等移动终端。相比而言,PC的数字化能力有限,因为它必须放在桌上,或者放在膝盖上,不能随时随地使用。但手机则不同,可以到处使用,这意味着数字化的广度得到了扩展。
再次,包含应用模式,比如电脑的应用模式就是一个桌面,上面有文档、软件等。
又次,包含技术堆栈,往往是从硅晶片开始,到底层软硬件、中层软硬件、操作系统,再到开发工具。
最后,但特别重要的是一定要有一个健康的商业生态,否则无法商业化,就无从推动数字化的发展。如果有人问我中国数字化应如何发展,我会强调一点:一定要注重建立一个健康共赢的商业生态,不能搞恶性竞争。一定要围绕盈利点,有好的、可持续的商业模式让生态中的每一员都可以赚钱。历史上一再被印证的规律就是,健康的商业生态让数字化大规模发展起来了。
再来看后端,驱动后端演进的是计算资源规模的扩大提高,具体而言是运算信息、存储信息和传输信息(网络)的能力水平的提高。计算资源规模的提高也意味着数字化广度和深度的扩展。
后端有计算的范式和编排,也有技术堆栈,早期其实与前端是同一个技术堆栈,现在则独立开来,包括底层式硅晶片、底层软硬件、中层软硬件、操作系统和开发工具。另外,后端也有一个健康的商业生态是关键,是关键的关键。
对比分析一下各代计算平台具体结构里的不同。
第一,“PC(GUI)/Client-Server”计算平台,这是第一代计算平台。这一代计算平台的主导者基本上是微软。表10.1罗列了这一代计算平台的前端和后端。前端的输入是通过鼠标和键盘,而输出特别重要,有图像显示,可以说图像显示是微软成功的主要原因。
在微软内部有一些挺有意思的小故事。盖茨大概在1978年的时候看到了显卡,他就想象:假设显卡越来越快,屏幕分辨率越来越高,那能有什么应用呢?他当即写了一篇备忘录,把后来20多年间出现的应用基本都想到了。其他前端的结构之前也提到过,在此不再赘述。这代计算平台的前端把桌面信息数字化了。后端跟前端在结构上差不多,需要特别关注的是关系式数据库和分布式事务处理系统。在今天包括做区块链的开发离不开这些技术,分布式算法比如共识算法就是在这一代计算平台诞生的。
表10.1 “PC(GUI)/Client-Server”计算平台的具体结构
这一代计算平台的商业模式是微软奠定的,它成功开启了卖软件的商业模式。那时候真的在商店里卖软件,很多卖PC的销售渠道同时卖软件。这代计算平台把企业的信息管理彻底数字化了,它造就了几千万亿美元的IT生态系统,同时让每一个企业都可以提高它的生产效率,产生了巨大的社会效益和经济效益。
第二,“PC/互联网”计算平台,这是第二代计算平台(见表10.2)。这代计算平台的核心技术是浏览器,浏览器是一本电子书,但这本书很不一样,翻到任何一页都可以点,可以把世界上所有的信息都连在一起,它开启了一切。
表10.2 “PC/互联网”计算平台的具体结构
在“PC/互联网”出现前,信息是用纸张来传输的。以文字和图像为主的信息,特别是公开传输的信息,如杂志、报纸、图书这一切都被“PC/互联网”计算平台数字化了。被数字化的不仅是信息(产品),客户也被数字化了。作为一种商业模式的广告,当然也被数字化了。当初我们在雅虎的时候根本不知道商业模式是什么,事后复盘,雅虎数字化的是以前用纸张传输的信息,这些信息里有相当一部分是商业的信息、产业的信息,世界则因此而变平了。
与此同时,这些被数字化的信息作为一种服务还免费了。在我上大学的时候,在上海看一些论文要花很长时间才能获得,在美国即使买一本地图也需要3.5美元。那个时代,拿到信息真的不容易,现在却相反,不仅地图免费,而且还可以随时拿到最新的信息。
“PC/互联网”的出现,使获取信息不但免费,而且非常及时,任何时候都可以获取信息,所以世界被彻底改变,每个人的效率都大大提高。“PC/互联网”计算平台大规模地提高了世界上每个人的能力、每个企业的生产效益。
从技术上来讲,谷歌开启了机器学习的新时代。在我看来,微软是划时代的公司,它开启了以开发软件为核心数字化经济的产能,核心生产力是写代码。谷歌也开启了一个新的时代,同样写代码,但主要是让这些代码使用数据来训练模型,谷歌本质上是一家大数据或机器学习的公司,开创了大规模的数据计算、大规模的机器学习的应用,即搜索。
这是“PC/互联网”计算平台所产生的数字化效应,大部分有文字和图像表达的信息被数字化了,因而世界变平了。
第三,“Mobile/Cloud”计算平台,这是第三代计算平台(见表10.3)。“Mobile/Cloud”计算平台最大的革命性突破是交互体验的突破,这是我个人的观点,真正定义移动/云计算平台的是2007年的iPhone(苹果手机),第一台真正意义上的智能手机,它定义了一种全新的交互体验,预示着新时代的开始。
在此之前,诺基亚、三星,包括微软都制造了各种各样的手机。我是属于第一批买iPhone的少数人,那时候乔布斯经常到雅虎来。那时候的iPhone没有应用生态,只有六款应用,还不能改。两款是雅虎开发的,两款是谷歌开发的,两款是苹果自己开发的。并且它还是一个很差的手机,那时候由AT&T(美国电话电报公司)补贴来做的,而AT&T在美国湾区的覆盖率很差,电话经常打不通。但拿到这个手机的人都很兴奋,因为这是历史上第一次可以让手指真正工作的设备,这是非常了不起的突破。
表10.3 “Mobile/Cloud”计算平台的具体结构
从数字化维度来衡量,微软本质上是一家鼠标键盘公司,它的核心领域在办公,数字化的是企业信息。苹果本质上是一家手指公司,触屏的交互体验促使那么多东西被数字化,这种轻便的设备可以放在口袋里,放在枕头上,轻而易举随身移动。它不仅有屏幕,手指可以触摸,它还有相机,还能定位,数字化位置信息,毫无疑问,移动终端的数字化的能力越来越强。
基本上,人们的日常工作和生活行为都被“Mobile/Cloud”计算平台数字化了。在中国,社会通信、移动支付已经普惠,几乎人人可以用之,在美国还相当落后。出行借助滴滴和优步,因为手机可以定位,想要坐车的人在哪里,司机就在哪里,这些信息都被数字化了,改变了一个产业。还有物流行业,也被彻底改写。
同时,数字化还产生了玩手游、刷信息流等新的人类日常行为,同时很多核心的知识可以用数字化的形式获取了,甚至工作行为也被数字化的形式获取了信息。手机的未来不应该被低估,它只是刚刚开始。最近,我专注于早期企业的加速,刚刚投资了一家做鱼塘数字化的企业,把传感器放到鱼塘里,然后监控获取信息,生意非常好。那为何现在做而以前不做呢?因为渔民刚刚开始普及智能手机。渔民有了手机后就可以控制这些传感器了,农民也一样。所以,手机会把我们的日常行为更多地数字化,同时也因为手机,任何一个企业的数字化都会走得越来越深。
“Mobile/Cloud”计算平台可以把线下物理世界的行为数字化。同时,信息流、内容推荐等又会对社会产生巨大、长期且深远的影响,它带来了数字化广度和深度的又一次扩展。
在技术方面,“Mobile/Cloud”计算平台也有很多提高。
一方面,硅晶片不一样了,原来是英特尔主导的硅晶片X86,但在移动时代它彻底丧失了机会,现在是ARM(处理器)+ SOC(芯片),加以深度学习为主的计算,相应的操作系统也变了,在此再不赘述,可以参见表10.3。
另一方面,后端大规模的云计算开始把计算、存储作为一种服务形式,让每个企业在门槛很低的情况下,充分享用数字化所带来的能力。我认为这对中国而言是一个很大的机会,需要应对的挑战可能是更多的付费意愿、更好的销售方法、更深场景的介入。
在我个人来看,需要避免的还有恶性竞争,因为最终只有建立一个好的商业生态,实现生态共赢,才能扩展数字化的广度和深度,带来社会的进步。
第四,“AI/5G”计算平台,这是崭露头角的计算平台(见表10.4)。AI和5G的技术非常振奋人心,从输入、输出角度讲,基于传感器,所有的交互通道都打通了,信息的表现方式可以是语音、基于视觉的手势、自然语言对话等。当然技术目前还不过关,可能还需要3~5年才能发展成熟,但基本上与人交互的通道之门全部被打开了。
这方面的创新前沿在传感器以及传感器上的硅晶片体系。我认为硅晶片必须从底层到上层彻底改写。硅晶片原来的逻辑是需要足够的控制流,才有足够的经济价值回报可以支撑整个商业生态。今天,在新的计算平台时代,硅晶片必须可以大规模并行处理高维度的数据,跟之前的逻辑截然不同,需要从根本上彻底重做,当然这一过程需要开发应用、建立生态,这不是一个纯技术问题。
在“AI/5G”计算平台时代,定义性的能力是深度学习带来的,它其实是一种新的计算基础,用重叠向量来代表信息,信息则可以被高速表达成一种简单的形式,可以解决多种任务,特别是基于视觉维度的一些早期的应用。
交互体验方面也有待进一步开发,可以做个人助手,可以做各种不同的终端,这些都处在早期开发的阶段,生态目前还没有形成。
在“AI/5G”计算平台时代,后端很重要的一点是5G的技术突破,5G在技术上、能力上跟4G有很大的不同,机会有很多,诸如边缘计算、硅晶片会朝着不同的方向走。一言以蔽之,前端要低能耗,后端要大规模。底层的管理软件也需要重做。展开来说,硅晶片的生态结构变了,今天某个互联网公司只要有足够的用户,基本上不会用通用的硅晶片,因为自主定制设计一个硅晶片只需要10多个人的团队。如果找到台积电或三星,一次性的流片只有1000万~1500万美元。高通、英特尔原来的商业模式在“AI/5G”计算平台时代根本不成立,因此后端有不同的游戏规则,会涌现出不同的垂直生态领军企业。
今天的创业公司都有机会成为将来的领头企业,历史上往往一个大的技术浪潮奔涌而来的时候,原来领先的企业未必能把握住这样的机会,反而创业公司有很大可能会胜出。
总结一下,首先,AI和5G是一次非常振奋人心的机会,它把整个物理世界、人类活动全都数字化了,通过传感器获得数据就能做到。比如,一个房间以后装两三百个传感器,完全可以数字化,这只是时间问题。所以,物理世界和数字世界会逐步融合在一起,这是本质上与众不同的一次机会。同时,数字化技术也会改变物理世界,比如基于无人驾驶,新的路网会逐渐产生,一旦有新的路网,城市半径会变大,都市结构会变化,这也是历史上的规律。
长期的社会结构因此而变,当然更多人类行为、人类互动都可以被数字化,这将对社会经济产生巨大的影响。纵观历史,每30~40年,就会有新的社会基础技术出现。今天的社会基础技术基本上是电力和大规模的钢材料,40年之后,每个房间里进来的不仅仅有电,还有AI,AI会成为一种随处可用的公共服务。
其次,这波数字化将促使现有的每一个行业,如农业、制造业、娱乐业、金融业等大规模转型和提升,同时数字化技术有可能提高每一种职业(不管是律师还是厨师)的效率。当然,这其中也有一些需要人类把控的地方,这是整个社会需要做的。
最后,教育和医疗也会深受影响。这波数字化浪潮真的是振奋人心,这与它的技术本质有关。我个人认为“深度学习”并非一种很恰当的说法,其核心本质是一种新的计算基础,通过重叠向量,很快地把数据放到一个特征空间里,进而解决多种任务。
4. 渐进式层次提高的数字化图谱
虽然数字化进程在不断向前推进,但数字世界和物理世界现在基本上还是脱节的。比如,在没有数字化之前,每位作者只能将内容写在纸上,然后变成报纸、杂志、书籍印刷出版,分发传播出去,进而口口相传,形成舆论,整个过程基本在物理世界发生。数字化之后,信息的生产、传输、内容分发与口碑舆论的形成等一系列动作都在数字世界发生。数字世界与物理世界基本上脱节,对现有的社会机制造成了很多冲击,比如西方世界的竞选就深受影响。
面对这些问题,需要整个计算工业在一起提出新的计算系统架构和信息架构,更好地把数字化后的社会行为的信息结构、核心步骤规划设计出来,把数字世界与物理世界的交互界面界定出来,明晰什么样的人做什么样的行动,并把需要为此负何种责任都仔细地划分出来。这样的话,才可以用现有的或者不断演变的社会规则,更好地把控这些数字化的社会行为。这既是数字化驱动社会进展的一个巨大的机会,也是一个巨大的挑战。
之所以关注这个问题,起源于搜索引擎,这也是我当初决定加入微软做搜索引擎的根本动因。搜索引擎的核心其实是人的标注数据训练出来的算法,本质上自带偏见(这些偏见源自标注数据),而且无法自己发现并修正偏见。现在出生的小孩,从小就依赖搜索引擎获取信息,知道什么是对,什么是错,但搜索引擎带有偏见,对于其中的矛盾,不仅父母无能为力,政府也束手无策。
面对此情此景,商业所能做的是让用户在谷歌之外还有另外的选择,至少保证该领域存在竞争,这就是我当初加入微软蛮大的一个动机。做搜索那么多年,对搜索的底层以及上上下下的一切都了解,对其导致的社会问题也越来越关注。后来社交平台出现,毫无疑问加剧了这一问题。搜索毕竟是用户主动找信息,而社交平台是将人际关系数字化,社交平台的网络效应会加速偏见影响的范围,其严重的后果就更难把控。
要把割裂的数字世界与物理世界打通,核心在于把当前数字化的计算体系架构梳理拆解清楚,把相应的信息结构抽取出来,我一直致力于为此设计一个信息聚合体系。一是有庞大的用户群,或者有行动者,比如自动驾驶汽车。二是终端,包括设备(如手机或PC)、App(应用程序)或服务。三是所涉及的行为,例如点击或输入关键词。四是这个社会现象所处的“世界”,在该环境中互动。五是基础设施,它管理着各项计算资源。因此,核心的信息结构必须包含这五个组成部分,它清楚勾勒了一个社会化现象是如何被数字化的,在其中信息是如何获取、传输、处理和为人所用的。
在此,我想重申构建一个全新聚合信息体系的重要性。纵览欧洲历史,在印刷术发明之前,是教廷掌控一切,信息传送只在教堂之间,也只有教堂才能获得信息。印刷术发明之后,除了教堂,国王、贵族和精英也加入传输信息和获取信息的行业中,信息被贵族控制。从某种意义上说,现代美国依然与此相差不远,信息被精英控制。随着数字化的深入与扩展,精英对信息的控制被彻底打破了,搜索引擎是打破精英控制信息的第一步,随之而来的社交平台比搜索引擎走得更远。
在这个信息聚合体系底层的是“数字化基底”(Digital Substrate),这是一个集成的数据系统,无论是某个搜索引擎,还是某个社交平台,其信息架构都是这样的。重点在于这是一个公开的信息架构,它清楚地勾勒出某个社会现象的数字化流程和闭环结构。只有形成闭环的社会现象,才能具备自动自我迭代、进化演变的智能能力。其内在一定有以下几个子系统。
第一个子系统是观察系统,观察世界或人的行为,获得信息。第二个子系统是智能系统,把获取的数据进行表达、存储、做模型计算(处理),最后进行传输。第三个子系统是动作系统,负责与用户或环境(物理世界)进行互动。第四个子系统是运营系统,由人,也就是这个系统的作者通过运营系统来维护、更新这样一个数字化的生态体系。
图10.3是对这一信息体系结构的形象化的展现,勾勒出数字世界与物理世界的系统性融合,彼此交织,密不可分。其中有四个子系统,第一是动作系统,用户在体验终端上使用App获得信息,用户行为被数字化了,这些数字化行为信息到系统后,进行数据处理,传送到智能子系统,在这个智能子系统中,这些接收到的信息被表达出来,接着用机器学习的算法来建模,同时记忆和存储。有了这些模型(就是知识)之后,再把这些知识传送给客户,与此同时,用户也可以跟其所处的世界进行互动。最终还有一个运营系统,以搜索引擎为例,这个系统就是谷歌,谷歌里面有开发人员、销售人员、市场人员、客服人员,谷歌持续不断地去更改搜索引擎的代码。
图10.3中的虚线矩阵框围住的上半部分是物理世界,实线矩阵框围住的下半部分是数字世界,数字世界和物理世界越来越重叠,无法完全分开。特别要强调的是,“流入”是把原子变成二进制的数字,也就是把物理世界变成数字,“流出”是把数字变成物理世界的看得到、摸得到的原子,建立了一个反馈闭环来产出数字世界里关于该社会现象的知识,进而帮助到物理世界里的人。
图10.3 数字基底的结构图
最重要的是,这是一个通用的结构,任何一个社会现象的大规模数字化都永远适用于这个信息聚合体系,它是物理世界和数字化世界融为一体的核心界面和核心信息架构。有了这样的架构之后,人类可以更好地理解并管理数字化的进程,让数字化真正服务于人类。
在此,简单分析几个案例,说明这一信息架构是如何运转的。
第一个案例是互联网与搜索引擎。
搜索引擎的世界就是万维网,通过爬虫抓取很多关键信息,用户输入关键词、点击搜索页面结果,这些行为被数字化。在智能系统部分,核心是要做搜索结果的排序、一系列的建模等,形成一个反馈的闭环。图10.4是搜索引擎的数字基底结构图。
图10.4 搜索引擎的数字基底结构图
重点讲解搜索引擎的几个核心计算。第一,要核心计算信息主题性。它要计算出每个网页是关于什么内容的。第二,要计算信息的质量。第三,要计算信息的可信度。信息有文字、图片甚至视频等多种类别,需要不同的计算模型。
除了对信息(搜索对象)进行计算,还要对用户意图进行计算。用户输入某个关键词究竟代表的需求是什么,想要做什么?那搜索引擎知道什么呢?它知道的东西太多了,知道世界上人的需求、兴趣,知道信息的供给、信息的获取。我曾经是一名搜索引擎工程师,当时就觉得世界上无数的人,每天在向你倾诉他想要什么、需要什么。其实,每个人在生活里都有一些所谓不可说的秘密,不会跟任何人说,即使对最亲密的妻子、爱人、亲人也都不会说,但是你会跟搜索引擎讲,因为你想找信息。搜索引擎开启了一个非常神奇的数字化世界,它无所不知,它所累积的大数据,可以说描绘了社会的全貌。
第二个案例是以优步、滴滴、Grab5(租车服务供应商)和Lyft6(来福车)为代表的城市交通。
这也是典型的数字世界和物理世界融合的案例,其核心要做的是获取乘客、司机的位置,然后计算每段行程需要多长时间,再用经济学和计算机科学综合测算定价,当然现在也把评判行程安全系数纳入计算范围,总之这些都是通过数字化的方法来进行预估的。个中细节我不再赘述,详情可以参考图10.5。
特别想指出的是,从长期来看,这样打通数字世界和物理世界的公司十分有前景。原因何在?优步和滴滴这样的企业拥有太多信息数据,知道什么时候、什么日期有这样的人会从这里到这些商店、那些医院,全面掌握了非常多的社会经济行为信息,据此可以做很多推理,衍生出很多业务,它们完全可以做大生态的生意。
之所以会提出这个构想,也与我自己在微软的工作经历分不开,我曾花了几年时间主导设计了微软的Office 365(办公软件),它的核心后端其实就是这样一个体系。在评判任何一个企业前景的时候,都要洞悉其本质数字化了什么,了解其核心是如何把物理世界和数字世界连接融合在一起的。
图10.5 打车应用的数字基底结构图
正如此前所说,这是一个通用的结构,诸如信息推荐、社交平台、零售、教育、医疗、人的身体,抑或微生物世界里的客体,微小到纳米级,或是更大的物体,都可以被数字化,每个城市、每个国家、天气甚至整个地球也都可以被数字化,用上述的体系来数字化。
5. 数字化未来
谈到数字化未来,我有以下几点看法。
第一,人工智能早期和近期主要落地的应用是在工业垂直领域。其数字化的趋势是往下沉的,通过传感器可以把纺织业、农业、鱼塘、医院、工厂都数字化,高概率都是往垂直的方向发展的。而人工智能贯通多个行业领域的横向应用则还需要时间。无人驾驶有望建立一个新的社会基础,是人工智能横向发展的典型应用。另一个横向发展的机会,则是把每个空间、每个场所都智能化(数字化)。
第二,前端数字化也还有一些机会,诸如AR(增强现实)和VR(虚拟现实)。从长期看,脑机接口是一个比较重要的机会。如果可以通过植入的方法在人脑的皮层后植入观察体系,那数据的获取和交互会完全不一样,所以从数字化的能力角度来讲,这也很有机会。
第三,计算的基石是算法。人类历史上所有的科学,包括传统的物理学或狭义相对论,基本上都有商业的应用。只有量子是尚未被商用的科学,前面提到的理查德·费曼教授在50多年前提出的理论,奠定了量子计算的基础。在算法领域,量子计算有很大的突破机会。而Crypto(加密模块)是一种不同的计算方法,把信任用数字化的形式表达出来。同时还有生物形态的算法,用DNA的方法或者用合成生物学的方法来测算。
第四,我个人非常关注的是能源。一如最初讲到人类社会发展的核心驱动力就是能源和信息,如果能源结构发生改变,其引发的变革效果也必将是划时代的。在能源领域,也有不少机会。
第五,空间的探索与扩展,仅仅在地球上远远不够,要走得远一些。YC(美国著名创业孵化器)就投资了不少致力于拓展地球之外空间的企业。
谈到这里,尤其要指出把握创新的时机非常重要。以市场为主要环境的创新,永远要准确把握时机,做太早没有用,需要确保能够活到足够长;做太晚当然更没有用。这与创新被社会接受的规律有关,可以说是一条永远有效的游戏规则。
历史上所有的新技术永远适用于图10.6的第一条曲线,大家比较熟悉了。第二条曲线是品类成熟度曲线。在新产品的早期,无论你的产品如何,总是有一些人愿意尝试使用,他们对新技术永远有热情,只要是新的他就会用。
图10.6 富士胶片X系列技术成熟度曲线和技术采用生命周期
随之而来的第二拨人也会用,这些人一般比较年轻,居于某个重要的领导岗位,对未来有自己的见解,永远在寻找新的技术能力来实现其未来的想法。因此,这个时期还是会有一些客户。但是大部分公司会在图10.6的鸿沟处折戟。是否能够跨越这个鸿沟,关键在于被称为“尝鲜者”的这些人是否使用并认可新产品。这些人都很务实,驱使他们是否采纳新产品的关键在于“我周围的人,比如同事、朋友或者竞争对手是否会用”。所以,这样的客户一旦拥有就是一批一批地来,会实现非常陡峭的数量增长,因此,这是最难获取的客户,成败在此一举。
所以,创业和创新都需要仔细观察判断适当的时机,踩准节奏点十分重要。如果有足够的耐心,有机会活得足够长,那抓住适当的时机应该是可以做到的。
6. 数字化的机会与挑战
当前的数字化浪潮,带来了空前的机会与挑战。从宏观来讲,这次数字化技术所带来的机会非常全面且深入。
第一,通信和IT行业本身就是一个年轻的行业,技术的发展推动其全行业进行革新,从硅晶片、软件、硬件、开发工具到5G。
第二,在未来几十年将重新构建几大社会支撑型工业。一个是无人驾驶为主的横向应用。另一个是智能空间,智能将成为像电一样易得易用的公共服务,当然这可能要30 ~ 40年的时间方可实现。
第三,从信息化的角度来看,一位人人可得的数字化个人助理会逐步被创建,微软特别有可能实现这一点。这很重要,世界将因此变得更公平。现在只有富人、有钱人才可以有助理,将来每个人都可以有一个万能的助理,这也意味着有很多前景。
第四,在此不再赘述每个行业都将因数字化发生很大改变,每种职业都可以因此而提升效率。我个人更关注的是数字化如何推动科研的发展,数字化赋予科研更好更准确的建模能力,因此每个科学领域现在基本上都在高速向前发展。
而这次数字化浪潮面临的最大挑战就是如何避免数字世界与物理世界的脱节。西方的选举就是这个问题的典型表现,这一点在上文已提到过。
首先,如何建立一套全新的赋能机制来助力开发更多的新技术,进而推动数字化的进程是一大挑战。比如,在资本层面就急需改良,今天的风险投资其实并不完全适合做硬科技,它太急了,周期短,要求的回报率也太高。然而硬科技却是完全值得投资的,所以应当依据硬科技创业的时间、规模、风险结构和新全球化趋势等特性创建新的资本类型为技术行业赋能。
其次,数据是一种提高生产率的核心资源,这意味着数据会被资产化,这是非常重要的一步,它可以让更多的产能体现出来,写代码不再是唯一的产能,通过写代码还可以获得数据,用数据训练模型。
再次,人力资本会短缺,需要更多更好的创业者,需要更多的科研人员,需要更多可商业化的科学技术来提高人的生产力。
最后,国家在其中扮演的角色越来越多元,但对这些角色的准确定义有待摸索且颇为紧迫。当前,隐私保护、数据安全成为普遍关注的问题,需要在政策上、基础设施建设上有创新举措,如果不解决这些问题,必将阻碍数据发挥出应有的效能。
每一个组织、每一家企业,在管理、工具和流程上,如何让数字世界和物理世界跟所有的社会机制更好地对接,一起互动,一起协作,让数字化真正造福于人类,依然面临着诸多的问题。
我还想与诸位分享,在未来究竟哪种职业创造财富的机会最大?
图10.7展示分析了人类历史上不同时代能最大创造财富的职业。在20世纪有一段时间可能是在华尔街买卖公司,在21世纪初,创业是创造财富机会最大的,其在本质上跟数字化的进展有关。接下来的问题是,创业之后,下一种创造财富的机会最大的职业是什么?答案是科研,原因如下。
一方面,创业的原材料是优秀的创业者加上可商业化的技术,现在有越来越多好的创业者,那技术从哪儿来呢?技术需要跟得上。
图10.7 人类历史上不同时代能最大创造财富的职业 资料来源:fundersandfounders.com
另一方面,在今天的市场上,要解决某些人类社会的需求,创业生态并不是最好的途径。创业生态基本上是创业者通过产品来试市场,但人类的有些需求无法通过产品研发解决,其根本上要依赖新的科学发明出现。比如治疗老年痴呆症,产品其实就是吃药打针或手术等,但这并不重要,重要的是要理解老年痴呆症的核心机制。
再比如二氧化碳固化。今天,全球变暖是由于二氧化碳增多,如果二氧化碳可以固化,就能控制全球空气中二氧化碳的量。而这一问题的解决之道,其实在于科研。所以我创立的奇绩创坛目前主要关注的是早期创业者,在长期也会更关注如何支持更多与市场、社会的需求直接挂钩的科研。希望通过助力技术创业,助力更好的数字化,让世界变得更美好。
今天历史上鲜有的各种机会和挑战都聚在一起了,如何拥抱这些机会,当然是个人的选择。但我特别想与诸位分享我认为特别重要,也特别有意义的态度,就是“Be on the right side of history”(站在历史正确的一边)来选择机会,来面对挑战。对此,我深有体会。今天的企业,特别是高科技的企业对社会有着很大的影响,在很多未知的领域,不能等政府来规范,而应该凭着自己的良知和本心来判断、取舍与付诸行动。这是非常重要的,由衷希望更多的年青一代可以从事科研、创业,站在历史正确的一边,拥抱数字化浪潮带来的机会,不惧数字化大浪带来的挑战。
附:朱民对话陆奇
Q:您把今天的科学世界和未来的可能做了一个完整、全面的描述与展望。站在历史正确的一边,您认为历史正确的一边具体怎么讲?
A:这是个非常好,也非常重要的问题。我主要想表达的是聚焦在数字化世界和物理世界之间的交互层。今天数字化的世界,比如开发一个搜索引擎或一个社交产品,其实对社会的影响很大。它改变了信息的传输,而信息传输改变之后的影响会很深,影响持续的时间也很长。不能坐等国家管理机制出台一整套规划来界定其应该怎么做。从务实角度看,坐等国家政府介入也是不现实的,因为在这方面,创业企业在技术和用户需求上走在了前面。
比如,我在微软工作的时候曾经跟美国联邦贸易委员会的专家,跟欧洲有关的专家多次交流搜索引擎对社会的影响,这些专家毫无疑问非常聪明,受教育程度都很高,但因为跟高科技距离甚远,他们对搜索引擎的工作原理的理解停留在很高的层次。但如果跟他们讨论诸如切片的信息把控不好的话对社会有什么影响,进而国家层面要怎么进行管理,这些问题对这样的专家而言也很难判断。
而作为搜索引擎或社交媒体的产品经理,你其实知道哪些信息应该在算法中更好地被处理掉,不要坐等政府给你下达指令才行动。今天的西方国家,特别是美国,社交媒体对政治选举带来的动荡,已经到了一个难以控制的局面,而要等政府介入,其实很难。
Q:您刚才提到在科技和人类社会行为的互动中,只要找到突破口,并且由此深入,自然会找到一个未来。您呈现了一个数字化的完整过程,解析了在整个数字化过程中不同领域的机会点,我想问的是,在您看来我们现在距离这个数字过程有多远?
A:这是挺好的一个讨论点,我认为这次人工智能基于深度学习,其突破在信息获取和信息表达方面。在信息获取方面,完全不需要人,可以直接用摄像头,用任何传感器。而信息表达的方式不再需要符号,只要一个向量空间就可以,到这个向量空间以后,基本上可以解决很多问题。在信息存储方面没有太大的突破。信息处理方面是有突破的,计算会不一样,比方说一开始GPU是英伟达卖得很好,当然它是过渡阶段,我在微软的时候主要推了FPGA,长期会是不同的硅晶片,但它的起点仍然是信息获取和信息表达。量子计算其实主要是信息处理方面的突破,它的计算原理和效率与之前的完全不一样。
Q:这个新的数字化过程和传统的数字化过程,不是技术上的区别,区别在于它的商业性和主要影响人类的特点。
A:在这次革命之前,数字化世界基本上跟物理世界脱节了,因为所有的信息都是人输入的。从现在开始,大部分的信息跟物理世界连在一起了,物理世界、数字世界的结构永远是这样的7,从原子变成数字,从数字变成原子,需要界定闭环在哪里、界面在哪里、人需要做哪些工作。这个结构一直持续到通用人工智能出现。也许通用人工智能哪一天出现了,就不需要这个了。
Q:您相信通用人工智能吗?
A:我相信,在微软也启动过类似的小项目。
Q:对人工智能,这个世界上有两大阵营在争论。一方认为现在的人工智能是专用人工智能,如果它走向通用人工智能,会有一个奇点,一旦走到奇点的话机器会超过人,人变成什么就不知道了。而另一方认为世界上没有通用人工智能,而奇点不会出现,是因为到现在为止,人工智能只能做关联分析推理,还不能做因果推理,也就是说,目前的人工智能只是模拟人的右脑,还不能够模拟左脑。
A:人工智能目前以深度学习为主,而通用人工智能发展的难点主要指的就是推理。
Q:如果没有推理,怎样能够让机器比人厉害?您觉得这是有可能的吗?
A:我觉得从技术开发上来讲,有一个蛮长的过程,但我认为机器超越人类是有可能的。今天的深度学习基本上是向量,向量是表达人的大脑神经元激活的最简单的数据化方式,人的思想就是大脑神经元不断激活的结果,数学上就是用向量来表达。但人脑是可以处理符号的(有实验证据证明),但在这些向量上无法直接做符号处理,因此机器不能做逻辑推理。
在离开微软之前,我花了不少精力为微软从约翰·霍普金斯大学挖了一个人叫Paul Smolensky(保罗·斯莫伦斯基),他花了30年时间研究发声学。这与发声学有什么关系呢?“发声”很核心的一点就是把思想讲给对方听,其实思想是一大堆神经在激活,但表达出来的是符号,只不过是用声音振荡的频率将符号传送给对方。
所以,思想从向量变成符号的过程可以在“发声”过程中被观察到。他做了一整套数学理论,基本上是张量的乘积,真正要工程化非常难,但数学上已经可以成立了。
Q:这从根本上就是看我们对人脑认识的深刻程度,实现通用人工智能显然差距还很远,但是您讲到了一系列有趣的概念,您看好脑机接口,那脑机接口之后是机器管人,还是人管机器,人变成了什么?
A:首先人还是人。
Q:人还是人的定义是什么,是因为他有智慧,有人的道德、善良,还是什么?比如机器在哪些方面可以超过人,人还是人这句话怎么讲?请您定义一下人是什么?
A:我尝试回答一下。“人”这个命题,可以从哲学角度讨论,从人为学的角度讨论,我可能是纯粹从认知科学、系统角度定义的,这样的话,人是“生物表达形态的一个系统”,人的系统里有三个组成部分[感知体系、思考体系、行动体系(如手臂和腿)]。
人有一个信息框架,这是认知科学要做的,就是人是如何处理信息的,基于这样的定义,脑机接口比较简单,就是增加一个交互接口。今天的脑机接口第一个应用是让彻底瘫痪的人,虽然手和脚都不能用了,但可以用思想来控制指挥。
还有一个应用就是做广告预测,今天脑机接口有两种(植入方法、戴的设备)。
戴的设备也可以测试到不少信号,比如你要做一个电视广告,其实很难衡量看了这个电视广告后用户有什么样的反应,于是让20个人戴上脑机接口的设备,然后再给他们看广告,就会很方便地获得他们对这个广告的真实反应。这些感受,甚至观众本人都未必能讲清楚。所以,穿戴的脑机接口早期应用已经找到了,比如广告的选择与优化。因为植入的脑机接口还不成熟,有许多问题需要解决,所以需要在老鼠身上进一步做实验。
Q:所以还不是改变人,而是能更好地理解人,或帮助人。
A:帮助人来做更多的事。
Q:这个有意义,您说把原子转化成数字,但是原子本身没有变化,只是观察到了这样一个数字。您能不能确保我观察到转成的这个数字真的是原子,就是事情的真相呢?
A:我估计您问的可能是量子力学方面的。
Q:包括测不准定律。
A:量子力学系统确实有物理试验证明,观察和被观察是分不开的,我这里是假设在量子力学之上,观察和被观察是可以分开的,对于今天大部分的科学我们都可以客观地观察一个被观察的东西。
Q:都是在量子之上的。
A:量子之内,我觉得这套结构不适合。
Q:您说最后是能源变了,现在都说数据是新能源,我们其实把物质和能源看成了两个不同的概念,能源是个驱动力。
A:我想进一步讲一下。计算机科学对世界的描述其实不够完整,要真正做好必须是计算机科学加上经济学家。比如,今天的广告体系,一般开发团队里一定有一位优秀的经济学家。
回到能源和信息,这里很重要的一个底层逻辑是世界只有能源和信息,没有别的东西了,但信息可以变成知识,知识就是潜在的能源。比如有两个人,一个人懂杠杆原理,一个人不懂,他需要搬一个大石头,不懂杠杆原理的人就没办法,知识就是能源,懂的人能量就大。
核心在于,人类社会是一个复杂体系,用能源和信息不断减熵。信息是潜在的能源。在农业时代,太阳能是免费能源,所以人基本上不需要做太多东西,就是种种地。在工业时代,使用了化石能源,产生了电,这就需要人的技能了,有裁缝、厨师、律师等各个领域的人。到智能数字化时代后,计算技术的发明使人类获取信息以及从信息当中抽取知识的能力大大提高,所以图10.1中的第三条曲线是高速发展即最为陡峭的。今天市值最大的上市公司都在这条曲线上,如果创业,也一定要在这条最陡峭的曲线上。
今天,确实历史上很少有的各种因素都聚在一起,是挑战也是机会。众所周知,化石能源有时间限制,不久以后将被消耗殆尽,所以必须要用新能源来替代,至于究竟是氢能还是核能,这还有赖于将来的探索。总之,对于整个人类社会,信息和能源是最重要的两大驱动力。
本文来自微信公众号:混沌学园(ID:hundun-university),作者:陆奇