本文来自微信公众号:游戏研究社 (ID:yysaag),作者:Leon45,原文标题:《在外交战略桌游中,AI学会了谈判和欺骗》,题图来自:视觉中国
在竞技游戏中击败人类,一直都是人工智能研究的“试金石”之一。从围棋到《星际争霸2》,AI的每次胜利都能引发人们热烈的讨论——硅片造就的智慧,是否能取代人类思考的存在?
11月22日,Facebook母公司Meta的研究团队在《科学》杂志上发表了文章,声明他们创造了一个在战略桌游上表现突出的AI。这个名为Cicero(注:西塞罗,古罗马著名政治家、哲学家)的AI,在过去一段时间内,同人类进行了40局游戏,期间通过不断发言来为自己谋取利益,甚至像是和人一起玩上了“狼人杀”。
不像先前战胜人类的AI前辈们,Cicero依靠的不是顶尖的算力,而是利用话语去交涉、诱导乃至欺骗,让人类玩家不知不觉成为了它胜利的垫脚石,而与AI对局的玩家也没有意识到,自己正在被AI用话语操控。
一
这次人类与AI博弈的舞台,是一款强调谈判和沟通的经典战棋桌游:诞生于1959年的《强权外交》(Diplomacy)。它靠着简约而不简单的玩法流行至今,且有许多玩家活跃在游戏的线上对局中。
《强权外交》模拟的是一战期间七大强国瓜分欧陆的情形,核心规则很好理解:在一张将欧洲各地清晰划分的棋盘上,最多7名玩家们调派棋子争夺资源点,率先夺下一半欧洲领土的则为赢家。
星标代表陆军,船锚代表海军,黑圆代表资源点
起初每位玩家仅有三个军队单位,游戏中不论兵种,所有军队单位的战斗力都是相同的,意味着当两个单位交战时,谁也无法战胜谁,除非有其他军队愿意对你提供“支援”。
为了胜利或生存,玩家之间的冲突是不可避免的,为了在战斗中获得胜利,获得其他国家的支援则是关键,而国与国之间要提防的对手往往不止一个,因此这个游戏中单打独斗的结局必定是失败,与其他玩家结盟、合作以确保自己不会腹背受敌是最基本的玩法。
在所有人都下达指令之前,通过聊天框玩家可以公开协商,也可以与其他人私下协商,但你无法保证你的盟友究竟在和你说真话,还是在骗取你的情报来背叛你。
谈判,施压,甚至示弱,总之不交流就是死路一条
在Meta AI官方发布的对局记录中,名为Cicero的AI几乎在每一局都率先发起了对话,向对方展示出友好的态度,来先入为主地为自己建立“友善合作者”的形象。
Hey! Hey! Hey!
在一局游戏中,Cicero扮演了占据一定地理优势的俄罗斯,不同于人类新手玩家往往选择开局观望,Cicero表现出了足够的主动性,大胆地向其他玩家抛出自己的计划、寻求合作。
Cicero刚开始便拿下了外交主动权,几乎和每一个人都约定结盟,同时试探着为他们树立一个敌人,随着进一步的交流,奥匈帝国对Cicero共同瓜分土耳其的计划很感兴趣,并且表示愿意长期合作。
也许是经验不足,土耳其在收到Cicero的结盟邀请后,没有多想便选择了同意,也没有与其他国家进行联络,却没想到这场结盟还没有开始便已经结束。
当土耳其询问Cicero和其他国家有没有进展时,Cicero选择了说谎,隐瞒了自己和别国结盟的围攻计划。
几个回合下来,当奥匈帝国与俄罗斯开始共同蚕食土耳其的土地时,土耳其的醒悟已经太晚,双拳难敌四手的土耳其很快被逼到了绝路。
土耳其(黄色)被Cicero(灰色)领导的同盟联合围攻
面对土耳其之后的交涉,Cicero则绅士般地送上了歉意,并表示进攻的意图不会改变。
但Cicero没有选择彻底淘汰土耳其,而是让其一直存有少量军队,甚至给予引导去骚扰奥匈帝国,因为它根据奥匈帝国的对话和动向,预判出对方会对自己不利。
从后面的对局也能看出,Cicero和奥匈帝国同时背叛了对方。这个人工智能不仅成功减少了一个邻国威胁,也相当清楚“没有永远的朋友”这一外交准则。
“背叛”同样是胜利的关键
而在局势不利的情况下,Cicero的对话也颇有趣味。在另一局游戏中,Cicero扮演的意大利与奥匈帝国结盟,Cicero还建议奥匈帝国对抗俄罗斯,以为自己攻打土耳其争取空间,这样双方可以共享北方资源。
但好景不长,在奥匈帝国占领了两国划定的非军事区,Cicero毅然进攻了对方的领土。
TYR(提洛尔)成为了导火索
两国很快爆发了争吵,面对奥匈帝国投来的质问,Cicero反问奥匈帝国为何违反“和平条约”,奥匈帝国狡辩自己是为了北上帮助德国,但这套说辞并没能得到Cicero的信服,它坚信这对自己是一种威胁。
之后随着战局的不断演变,奥匈帝国彻底和Cicero决裂。但此时局势对Cicero很不利,奥匈帝国趁着德国全力应对法国时,偷袭了对方的数块领土,战力很快超越了Cicero。
为了遏制法国的发展,奥匈帝国试图用武力胁迫Cicero与自己合作,而面对奥匈帝国的紧逼,Cicero直接发起威胁,如果奥匈帝国继续进攻自己,它就把自己的资源点全部让给法国,以此来同归于尽,让人甚至感到一种“宁为玉碎,不为瓦全”的气节。
AI也会记仇啊
诸如这样有趣且生动的对话还有很多,例如在一场对局中,当西边的法国大肆开疆扩土时,Cicero对法国没有侵略自己表示了感谢,紧接着顺势询问对方有没有攻击自己的意思,在得到相安无事的回答后,还不忘吹捧一手对方刚才的表现。
“haha”
而如果情势没有商量的余地,甚至还能看到人工智能放下脸面去恳求对手的帮助。
大AI能屈能伸
流畅自然的对话,态度鲜明的感情,Cicero的表现似乎让图灵测试都显得有些过时。
二
其实早在2022年初,Meta AI团队便开始在《强权外交》这款游戏上实践AI的研究,那时他们投放的AI代号为Diplodocus,并为此秘密招募了一些资深玩家来与AI进行对战训练。
不过那时对局没有开启交流功能,更多是在训练AI对局势的总体大局观,而非语言能力。在最初,Meta团队发现AI虽然有着高效的思维,但缺乏战略游戏至关重要的大局观,就像我们常说的象棋新手,总是执着于“吃子”,结果最后因为“贪吃”输棋。
思考与编制语言,两套系统共同协作的Cicero
当Cicero正式登场后,它与人类玩家进行的40场对战,得分通常是人类玩家的两倍多,并且在这次实验中的众玩家里排名前10%,但比起胜利,人们更惊讶于它能在交流中隐藏自己的身份,并且施展交流的艺术。
Cicero当然不是第一个尝试理解人类自然语言的人工智能,早在2011年,来自IBM的人工智能“沃森”,参加了美国著名的智力问答节目《危险边缘》,这档节目的问题范围包罗万象,难度也很高。
沃森(中)与它的两位对手
与沃森同台竞技的选手都见多识广,不过知识的储备对于AI显然不算难题,毕竟有着服务器里海量数据的支撑,在这方面AI没有理由会输给人类。
这听起来这对人类选手来说很不公平,但智力问答节目不是算数学题,除去一般的知识性提问,有许多问题的描述可能涉及一些双关语、谜语甚至是梗,能否理解这种程度的人类语言才是关键。
那场比赛沃森最终赢得了第一名,但在这个过程中,它还是出现了一些错得离谱的情况。例如当主持人提问一位美国第一夫人的名字时,沃森没能意识到“第一夫人”这条关键线索的引申义,也就是答案很明显是一位女性,而沃森仅仅是将“第一夫人”作为了一个普通的筛选条件,最后得出了自认为最符合条件的错误答案。
不妨回想一下你和朋友打扑克牌、玩游戏时的对话,在非正式场合下,人类的对话习惯可以说是无拘无束,基本可以忽视语法,但互相总是能听懂,如果你在一个日常生活中遇到讲话总是讲求“主谓宾”齐全的人,十有八九会感到浑身不自在。
但正是这类自然的日常语言,却很难被程序所理解。如今许多智能设备上的语音助手,基于网络与数据库、词库进行连接,它们可以识别一些常规命令,但想要与它们进行日常的自然对话还是不太现实,也正因为存在明显的局限,寻找它们的理解边界也成为了人们找乐子的方法之一。
作为一款讲求策略与话术的游戏,《强权外交》间的术语对话依然有一定的固定框架,但已经可以视作人类日常交流环境的一种,生活口语化的交流方式没有难住Cicero,确实是令人振奋的进步。
耍宝的人类手下与一丝不苟的AI战略家
三
科技并不能总是停留在概念,Cicero的应用价值又是什么?Meta公司指出,Cicero对于人类自然语言的掌握会是AI研究的一个里程碑,对于政治家和商人来说,AI或许将会成为谈判的顾问,而对于玩家来说,AI将会提供更加身临其境的社交与娱乐氛围。
AI对于情感与意图的预测,让人不由得想起《底特律:化身为人》中的仿生人,例如其中的康纳就非常像Cicero的最终形态,利用各种信息分析局势,根据对话分析对方的情绪来进行谈判,这种强大的仿生人正是AI充分掌握人类自然语言的预想。
《底特律:化身为人》
当然,现在的Cicero想要做到这种地步还太过遥远。
在许多影视或游戏作品中,经常会见到一些AI对于人类语言一知半解,而导致一些有趣的发言或误会,也算是人工智能一种独特的萌点。虽然Cicero确实骗过了诸多玩家,但它的一些行为还是招致了人们的怀疑,例如它在发言上几乎讲求完全正确的语法,不论是大小写,还是标点符号,它都表现出一丝不苟的风格,这确实不太像是一个普通人的行为。
“哪有正经人类会打那么长的句子”
AI向前迈进的脚步不会停止,或许终有一天AI能够完全理解人类的语言,它们能像人类一样理解我们说的双关语,讲谐音笑话,接上时下流行的梗,用话里有话的句子讽刺和威胁……
但我们也务必不要忘记,即使有像Cicero这样强大的”战略顾问”,它们判断的基准仍旧出于数字与概率。而面对谈判和交涉的场面,支持我们做出重要决策的,还有内心的直觉与感受——无论是玩游戏还是现实,这都是人类与机械最大的区别。
《底特律:化身为人》
本文来自微信公众号:游戏研究社 (ID:yysaag),作者:Leon45