虎嗅注:上周末,谷歌AI机器AlphaGo以5:0横扫欧洲围棋三届冠军樊麾的事情震惊了人类,随之讨论纷沓而来。这种逼格甚高的事情怎么能少了自认为逼格甚高的知乎上的知友们呢?这种事情又怎能少了具有极客范儿的搜狗CEO王小川呢?所以当有人在知乎上提出“如何评价 Nature 重磅封面:谷歌人工智能击败欧洲围棋冠军,3月将与李世石对弈?”时,就一不小心引来了科技骚年王小川。
王小川说,AlphaGo的发布,是一个伟大的里程碑,“又一次让我兴奋地需要说一说”。他给出了两个判断,断言一:AlphaGo在两个月后,将会完胜李世石;断言二:除了围棋,人工智能在其他博弈类的封闭游戏里,也会横扫一切,完胜人类。
注意!不要被“完胜人类”这几个字吓着了。他所谓的人工智能完胜的领域仅限于游戏,且是博弈类封闭游戏。
除此之外,当微软HoloLens问世后,王小川同样非常兴奋,忍不住在2015年1月24日写了一篇技术评论。开篇便是,“很久没有心情澎湃到提笔写一篇技术评论,直到看了微软的全息眼镜HoloLens原型发布……”有兴趣的同学可以在虎嗅上围观《王小川:微软全息眼镜HoloLens将带领人类进入新纪元》。
以下是王小川在搜狗上关于“谷歌人工智能击败欧洲围棋冠军,3月将与李世石对弈”的回答:
AlphaGo的发布,是一个伟大的里程碑,又一次让我兴奋地需要说一说。
先说我的断言一:AlphaGo在两个月后,将会完胜李世石。
留个关子,本文最后再说断言二。
从中学开始,我就着迷用算法来解决游戏的博弈问题,用搜索方法创新性完成过一些题目。这几年深度学习出现后,就感觉有机会能够突破围棋,和清华的联合实验室做过几次探讨,都认为这个方向可行,可惜限于气场和能力不足,没能组织进行这方面的投入。
而此次出手的,是Google旗下的DeepMind团队,在深度学习方面是最顶尖的,资源、能力、气场都没有问题,突破性的技术是基于深度学习进行估值和走棋。
看知乎里好多讨论,是从之前AlphaGo完成的棋局来判断其下棋风格,倒推这个算法的威力,有点刻舟求剑的感觉。我们核心还是要回到对这次AlphaGo用到的技术的深刻理解。为了便于讨论,我们对比以搜索剪枝为核心的深蓝下国际象棋,和以搜索剪枝+深度学习为核心的AlphaGo的三个区别:
1. 围棋相对象棋,最大的区别是棋局的评价函数极难定义。象棋可以找到各种“特征”来计分,比如丢一个马扣多少分,兵往前拱到离底线近了加多少分,而围棋做不到,密密麻麻的黑白子挨着,互相之前又有关联,变化多,规律难以总结。这也是传统算法相对人最弱的几个问题之一。就像是我们人做人脸识别,看一眼就知道是张三李四,而机器算法难以下手。这个问题恰恰是最近几年深度学习最大的突破之处,深度学习不需要人来设计算法“找特征”,通过大量原始数据和标签的对于,机器就能够自动找特征,并且并不比人差。在几年前还有很多人认为机器在图像处理方面举步维艰,怎么定义和抽象鼻子?耳朵?眼睛?可就在这一两年深度学习突飞猛进,一举超过了人类。就在2015年,人脸识别方面,机器的识别能力已经超过了人了,这可是人进化了数千万年的核心能力之一呀。一个围棋棋局,可以理解为一张19*19的图片,其他的走棋规则和非常简单(很容易翻译成计算机规则),正好落入了深度学习擅长的事情。搜索+深度学习,这个算法完全可以覆盖围棋的规则,人下棋的思维过程和模式,只是AlphaGo的一个子集。这就决定了这个算法没有天花板,有机会在围棋领域“打通关”。
2. 深蓝相对AlphaGo,AlphaGo最大的优势是“学习能力”。深蓝的开局更多依靠数据库棋谱的建立,但没有泛化能力(不懂得举一反三),对于没有见过的走棋方法就可能犯傻。而之后的核心能力是计算力,通过暴力的搜索(当然也有最优秀的剪枝,但还是暴力),力图走出10-20步棋来选择最优的路径。这个复杂度是指数级的,变成一个NP问题,受限于计算力。这个系统的算法是写死的,固定的参数下,就会有固定的表现。而调整参数和改变算法,都是工程师的事情。这个系统的天花板是计算机有多强,以及工程师有多聪明。而AlphaGo更多是数据驱动的,喂给他更多的棋局数据,他就能够优化“神经元网络”,同样的运算资源下变得更聪明,并且具有举一反三的能力,这一点非常接近于人(或者说本身就是模拟人的方式来设计的)。而且我们知道,机器处理数据的能力足够地快,以及没有情绪不会出错,这就决定了这个系统如果把今天互联网上能收集到的棋局都学一遍,就成为顶尖高手了。
3. 最最最可怕的还不只是前面这两点,对于下棋博弈问题,AlphaGo还不只是从互联网上去收集数据进行学习,更可以自己和自己下,实现“自学习”。看过电影“超验骇客”没有?人工智能可以做到随着时间的推移就能更加聪明。金庸小说中老顽童让自己左手和右手打架“左右互搏”,成为天下无敌的武功,那个只是故事,在下棋这个领域,而AlphaGo有这样的设计,让这种武功成真了!往下还有两个月的时间,AlphaGo这样一台算法上没有天花板的机器,很有机会在“左右互搏”下登峰造极,成为不可超越的围棋高手。
AlphaGo的技术问题讲完了。怎么来看Google背后的完整动作呢?有人觉得是过度解读了,实际系统挺糙的 -- 选的都是“欧洲冠军” -- 说明系统并不行,这是一种错误的理解。更有可能的原因是Google和Facebook在竞争下围棋,Facebook的员工缺心眼提前放了好多消息出来泄密了,结果Google就赶紧把Nature的文章发了抢了个先,然后卖个期货两个月后和人类对决,那会儿系统就足够好了,这是在竞争环境下合适的做法。
事实上Google和Facebook两家都认识到了AI的重要性,以及就在最近几年会有大的突破。Google 4亿美金收购了DeepMind,当时只有20人,现在已经突破200人了,并且是不计代价的疯狂投入。下围棋只是体现人工智能进步绝佳的宣传点和切入点,从公开的文献可以看到,DeepMind做围棋研发是基于通用的技术进行,领域无关的(Domain independent)。这样的技术未来可以用到合适的其他领域里去。深度学习的魅力在于,只要一个领域里能够建模,能够有充足的数据,就能够在这个领域里做到超越人、取代人,短时间能从0分做到99分。如果我们依然是老观念,用渐进的方式来理解机器智能,比如之前某位大佬宣传他家的XX大脑做到了X岁的智力,这是很误(che)导(dan)的。我们同样也会错误地估计下围棋方面机器的能力,按照人类的理解1D-9D来评价它。一句话,不要用评价人的方法来评价机器的人工智能的能力,完全是不同的模式。
老罗曾经评价过人工智能的一句话:“人工智能就像一列火车,它临近时你听到了轰隆隆的声音,你在不断期待着它的到来。他终于到了,一闪而过,随后便远远地把你抛在身后”。
如果给这句话打上一个补丁,把人工智能的应用局限到一个一个的具体的封闭领域,这是一个很贴切的描述。我们不要过度自大,例如我们容易在自我优越感的驱使下,说动物不如人,比如人会直立行走、会说话、会实用工具,以区别于其他动物。事实证明,动物也会。面对机器也一样,就在几个月前还有人叫嚣机器十年内不能够玩转围棋,理由也都是人一眼就能看明白,机器只会计算。这些自大会让我们误判。也不用过于自卑,觉得围棋上机器上胜利了人类整个智力就被碾压了,到今天机器还是有很多领域完全无能,只能在局部领域。
到结尾,再说断言二:除了围棋,人工智能在其他博弈类的封闭游戏里,也会横扫一切,完胜人类。