本文来自微信公众号:信睿周报 (ID:TheThinker_CITIC),作者:江晖(中山大学外国语学院),原文标题:《江晖丨恐惑谷:错觉还是科学?》,题图来自:视觉中国
本文来自微信公众号:信睿周报 (ID:TheThinker_CITIC),作者:江晖(中山大学外国语学院),原文标题:《江晖丨恐惑谷:错觉还是科学?》,题图来自:视觉中国
1970年,日本机器人学家森政弘(Mori Masahiro)在一篇题为《恐惑谷》(不気味の谷)的随笔中提出了以下观点:
一般情况下,人们对机器人的好感度会随着机器人类人程度的提高而增长,例如玩具机器人比工业机器人更容易让人产生亲近感;然而,二者之间的这种正相关关系会在某一个节点被打破,即机器人在外表上非常接近人类却仍存在差异的时候,人们的好感度会陡然下降甚至出现消极反应;但若这些差异进一步减少,人们的好感度还会再次上升,直到机器人与普通健全人类看起来相差无几。
在这条情感变化曲线上出现的低洼段,便被森政弘称为“恐惑谷”,并且他强调,活动的机器人可能会造成更加剧烈的情感反应。
恐惑谷曲线示意图。由本文作者提供
换言之,这是一个关于人们对机器人外表可能产生的情感变化的假设。之所以称之为“假设”,是因为森的观点至今未能得到明确的验证或解释,但有趣之处在于,人们似乎能够对森提出的现象感同身受,信手拈来几个不“讨喜”的机器人。这让恐惑谷成了一桩科学悬案,那种不可名状的恐惧也给机器人增添了一抹神秘色彩。
话虽如此,人形机器人的时代不久将至,相较半个世纪之前,当下对这个问题的探讨更加具有现实意味,甚至带着一股紧迫感。2023年10月,中国工业和信息化部印发《人形机器人创新发展指导意见》(以下简写作《指导意见》),指出人形机器人是未来产业的新赛道,并计划到2025年初步建立人形机器人创新体系。
根据《指导意见》,人形机器人将在特种领域、制造业典型场景以及医疗、家政等民生领域和农业、物流等重点行业得到更加广泛的拓展应用,而前提是在关键技术上取得突破,即打造人形机器人的“大脑”(环境感知、行为控制、人机交互能力)、“小脑”(运动控制能力)以及“肢体”(轻量化、高强度、高精度传感的仿人机械臂的开发)。
毫无疑问,机器人制造技术在不断走向成熟,而在近年呈飞跃式发展的人工智能技术的加持下,人形机器人的性能更将得到大幅提升。但与此同时,我们不能忽略的是当人形机器人从工厂走向家庭日常时普通用户的认知与接受。
从另一个角度说,人形机器人因其特殊的类人属性,也使人们对其“综合素质”提出了更高要求,机器人工程学和计算机科学等理工学科志在攻克其“脑”和“肢体”的技术难题,哲学和文学在三个世纪之前就开始谈论其“心”与“情”的困境,而恐惑谷提出的则是其“脸面”问题。
举一个简单的例子,有朝一日,若护理机器人已经能够熟练地帮助病人端茶送水、穿衣喂药(尽管目前它们尚不能很好地控制开关微波炉的力度),人们是否就可以任性地为其选择一张脸或者一种特殊的造型呢?经验提醒我们不行,但我们更加需要知道为何不行以及应该如何选择。
设计美学和人体工学在机器人工程学中往往处于边缘地位,却绝不是玄学。通过对恐惑谷问题的梳理,至少可以让我们了解在人形机器人的发展历程中,学界、业界围绕机器人的“脸面”所做的努力与探索。答案或许并不唯一,但这是一种不可或缺的视角,更是一种态度。
半个世纪前的假设
现代机器人的概念源于捷克剧作家卡雷尔·恰佩克(KarelČapek)在1920年发表的剧本《罗素姆万能机器人》中首次使用的“robot”一词,但恰佩克的robot是基于生物化学技术的人造人,并非机械的产物。而受技术所限,人类的机器人幻想是依靠金属制造来实现的,同时西欧从中世纪起开始盛行的机械人偶文化的影响也不容忽视。
但如今,我们已经很少去追溯其起源,正如“机器人”这个颇微妙的名词性偏正短语所表达的那样,我们默认了机器人的类人属性,即使它们在智能或行为方面与人还有较大差距,接近人类的外形也是必要条件(因此对于不具备此特征的,需要强调其是工业机器人,至于虚拟社交机器人的出现则是后话)。
卡雷尔·恰佩克的科幻舞台剧《R.U.R.》中的机器人。©wikipedia
20世纪20年代以后,早期的实体机器人陆续问世,文学、影视作品中有关机器人的书写也日渐丰富起来,二者相互促进,一同助力人类的机器人之梦。
因此,在半个世纪后,森政弘写下《恐惑谷》这篇随笔时,多少是带有对未来的预判的。因为彼时相对成熟的机器人是车间的机械手臂,勉强能称为人形机器人的仅是四方的金属零件拼凑体,理想中的人形机器人形象只出现在虚构的文学、动漫作品中,例如1963年首次出现在电视动画中的阿童木。
战后的日本虽然积极发展生产自动化,但将机器人视作一门学问,也是1983年日本机器人学会成立之后的事情了。也正因如此,《恐惑谷》在发表后的30年间并未受到应有的关注,直到2005年,曾在日本大阪大学工作的美国机器人学家卡尔·麦克多曼(Karl MacDorman)将森的随笔译为英文并在国际学会上发表后,学术界才将目光投向了这个似乎过于超前的假设。
所谓30年遇冷一朝花开,此后人们对恐惑谷的关注持续至今,热度有增无减,涉及领域也愈加多元。在此背后,机器人技术的进步诚然是首要原因,计算机图像、虚拟现实技术也拓展了这个假设的用武之地。在后者的影响下,相关研究在2010年后再次出现大幅增长。
2014年,英国未来学家理查德·沃森(Richard Watson)将恐惑谷列入人类关于未来最重要的50个构想之一。但受到关注也意味着将遭到更多的审视。有人质疑,有人追捧,有人尝试推翻,有人希望其能更进一步,诞生于半个世纪前的这个假设被反复推敲,以回答关于恐惑谷的灵魂三问:是什么?为什么?怎么办?
前提之问:恐惑谷存在吗?
与其他理论相比,恐惑谷的一个显著特征是,它在被构建的同时又在不断被推翻,至今仍有大量研究在围绕一个根本性问题展开:恐惑谷究竟存在与否?森政弘的恐惑谷曲线就像没有标注地点的藏宝图,引人遐想却又留下了太多的疑点与盲区。
密歇根大学名誉教授、日本文化研究者詹妮弗·罗伯逊(Jennifer Robertson)曾提出以下几点质疑,尽管琐碎却有一定的代表性:
现实中的人形机器人尚未达到科幻小说中的程度,与人类的实际互动很少。
森的观点仅是基于印象的推测,示意图过于简单。
不应将恐惑谷视为人类的普遍反应,要考虑不同个体的情况以及不同属性特征的影响。
忽略了时间维度,恐惑谷现象可能仅会维持极短的时间。
英译“uncanny valley”存在误导性,“valley of eerie feeling”更为准确。
现代工业机器人也可以具备拟人特征,让人类产生亲和感。
逼真的假肢有助于残障人士回归正常生活,但森将外观置于功能之上,对残障群体缺乏关爱。
以女性对假肢的恐惧为例极为不妥,利用了对女性的刻板印象,也赋予了健全人以特权。
森对残障人士和女性的态度如何姑且不论,在森的随笔里,确实有坐标轴却无坐标值,谈论了假肢却无具体的人形机器人案例,这些也成为众多质疑派关注的焦点。
有人质疑森的恐惑谷假设的原创性,认为他参考了心理学家恩斯特·延齐(Ernst Jentsch,1906年发表《恐惑心理学》)和西格蒙德·弗洛伊德(Sigmund Freud,1919年发表《论恐惑》)的理论。有研究对三人的论著做了详细比较,森政弘本人也对此做过回应,在其他学者的支持下公开予以否认。
当然,这类质疑并不构成恐惑谷假设的致命问题,更多研究希望通过实证方法来验证森式曲线的合理性与科学性。这些讨论主要集中在三个问题上:一是机器人的类人程度达到某个节点时人们的好感度骤降的结论是否成立,二是如何通过维度标准化来确定恐惑谷的顶点和谷底在坐标轴上的精准位置,三是经历情感冲击后人类对机器人的好感度回升能否实现。
目前主流的做法是以实验方式记录并总结实验参与者对类人程度各异的多种机器人的反应规律。尽管实验设计与分析工具在不断进化,例如使用的机器人从实体扩展到虚拟数字人,测量指标逐步丰富,测试方法也从外部观察、问卷调查发展到使用眼动仪、脑波测试仪,但由于实验室实验本身的局限、样本数量的限制和维度的混乱,这些研究难以产生统一的、能够获得广泛认同的结果,大多是在一定条件下进行的有限验证,因此上述三个问题至今仍无定论。
在这种情况下,也衍生出了一些推翻、修正或拓展恐惑谷曲线的观点。例如,有研究者指出曲线应该呈现为“N”形而非“V”形,因为实验结果显示人们更倾向于选择最逼真的假肢。
而来自新西兰坎特伯雷大学人机交互技术实验室的克里斯托夫·巴特内克(Christoph Bartneck)团队建议用“恐惑崖”(Uncanny Cliff)模型代替恐惑谷,因为实验发现人们对某些玩具机器人或人形机器人的喜爱远远超过真人。
此外,美国未来学家吉米斯·卡西奥(Jamais Cascio)提出了存在“第二恐惑谷”(the second Uncanny Valley)的可能,即当高仿真人形机器人的类人程度在达到普通健全人的水平之后走向超人类或后人类时,或许会再次引发好感度的下滑。
鉴于此,学界至今未将恐惑谷假设升级为恐惑谷理论。经过诸多研究的缝缝补补,恐惑谷成了一个更加丰富、宽泛的研究领域,却始终未能建构起一个更加精准、规范的理论体系。这也是森政弘在半个世纪前的假设至今未被取代的原因所在,或许它无法提供完善的理论指导,但人类无法忽视他们在面对机器人时可能出现的情感波动,因为这种概率的存在对于生产实践而言举足轻重。
因此也有研究者提议区别看待恐惑谷假设和恐惑谷现象,前者是工程学问题,后者是心理学问题。换言之,学术探讨仍须继续,而应用问题大可一事一议。
本质之问:恐惑感从何而来?
话说回来,森政弘提出的好感度骤降并非完全出于臆测,起码能够获得一部分人的经验性认同。那么应该如何理解这种不可思议的恐惑感呢?森在随笔的最后提出了一种猜测:这可能是出于人类的防卫本能。但对此他并未做进一步说明,也未在后续研究中对这个问题再做深究。
有研究发现动物(如猿猴)在面对具有恐惑特征的面孔时也会表现出回避行为,并认为这个结果验证了恐惑谷效应的进化起源。这种“本能论”获得了一些学者的支持,但关于其认知原理的解释仍存在不少分歧。
一份关于恐惑谷成因的研究综述将现有的主要观点分为两类:一类认为这是由对人工物和人类的分类困难造成的,另一类认为原因在于对人工物和人类特征的认知不匹配。
相比前者,后者得到了更多的实证支持,例如人工物和人类特征的真实程度不一致(如在人工脸上配置拟真人眼睛)以及一些非典型特征的存在(如过度放大的眼睛)确实能够引发恐惑谷现象。但后者的适用范围并不仅限于机器人,同时在解释一些没有明显外观瑕疵的机器人案例时也显得薄弱,因此前者依然是许多学者尝试继续探究的方向。
例如,日本东北大学机械系教授、科幻作家濑名秀明(Sena Hideaki)提出可以用“家族的相似性悖论”来解释这种现象。他指出,把杯子渐变(morphing)为盘子是不会产生恐惑谷现象的,但从机器人到人的渐变则不同,因为观察者自己也包含在人类之中,当机器人和人类越来越接近时,人类的主观意识或者说主体意识会自然启动,例如在判断生与死、胚胎和胎儿的边界时也会有类似的感觉。
瀬名秀明ロボット学論集,瀬名秀明
勁草書房 2008
谢菲尔德大学计算机科学系的罗杰·摩尔(Roger K.Moore)曾尝试用贝叶斯分类感知模型去解释带有认知冲突的刺激如何在类别边界引发感知紧张。但量化分析的结果并不一致,苏黎世大学的马库斯·奇塔姆(Marcus Cheetham)团队的实验就显示了完全相反的倾向:在人机分界线的暧昧区域,观察者的情绪反应似乎更为积极。
总之,讨论至此便会发现,无论是分类困难或是认知不匹配,其讨论对象早已超越了机器人外观的范畴,或者说森政弘重视的机器人外观问题并不足以解释并解决他提出的恐惑谷假设。森也提到了机器人的运动会加剧恐惑谷效应,其实行为本身,尤其是与外观不匹配的行为就可能引发恐惑谷现象。
在此基础上,不少学者将相关思考拓展到外观和行为等表象因素之外。南丹麦大学的拉斯姆斯·加恩-安德森(Rasmus Gahrn-Andersen)认为,根据现象学理论,应该基于反思性经验将认知对象区分为自主性和非自主性,而不是森基于观察提出的类人与非类人。当人类感知到这两种状态发生转变时,由于违背了认知主体的期望和经验,原有的亲和状态就会被打破。
加恩—安德森指出,恐惑谷可以看作海德格尔提出的现代技术“挑战性揭示”(challenging revealing)性质的一个基础案例,如果其成立,那么非人形机器人也可能产生恐惑谷效应。
与之呼应的还有心理学家库尔特·格雷(Kurt Gray)及其导师丹尼尔·韦格钠(Daniel Wegner)提出的“心灵感知假设”(Mind Perception Hypothesis)。他们认为人形机器人之所以令人不安,是因为它们的外观会让人们把问题归咎于它们的心灵,认为它们已经拥有了人类的思维。因此,即使没有类人的外观,一旦机器人拥有了感受和感觉的能力,而非仅仅掌握反应和行为能力时,就会引发恐惑情绪。
以上关于恐惑谷成因的追问从最初的外观设计到行为举止,又逐步深入思维与心智,讨论对象也跳出了人形机器人的框限。尽管现有研究尚不能从认知结构层面完整地展示其形成机理,但这些探讨给业界在应对相关问题时提供了更丰富、更多元的启发。
对策之问:退一步海阔天空?
如上所述,关于恐惑谷的理论认知还处于发展建构阶段,相比之下,机器人制造以及图像制作领域在采取对策方面更为迅速果断,以规避可能存在的风险。
避免跌入情感变化的谷底可以有两种思路:一种是退回到曲线左侧的顶点附近,即采用一定程度的类人设计却能获得较高好感度的保守性选择;另一种则是跨越谷底,攀登上右侧的顶点,挑战接近普通健全人的高仿真人形机器人。
森政弘的态度在随笔中有明确的交代,他建议设计师不要过度追求高度仿人,避免因跌入恐惑谷而付出巨大代价。2020年在接受笔者采访时,森再次强调了这个观点。尽管他提出的用佛手、佛像替代高仿真设计的方案备受质疑,但在现实中,森的规避思路被广泛接受。
前文提到的罗伯逊曾指出,很多日本学者熟悉这个问题,却极少有国际论文发表。这是事实,即便在日本本土,相关讨论也不多见。值得注意的是,“恐惑谷”被收录进日本的国民字典《大辞泉》,这就说明了问题所在:在日本,恐惑谷被定位为“知识”而非不成熟的理论假设,学界研究和业界生产大多是在此前提下进行的。
换言之,恐惑谷是一条“暗默知”的规则,已经成为行业内的基本常识。人们更关注的是如何才能规避恐惑谷,相比跨越恐惑谷,这是一个相对容易实现的目标,采用非高度类人的外观设计以及在感知能力上做去人性化处理是常见的策略。例如日本本田的ASIMO、富士通的HOAP系列等知名度较高的机器人都采用了类似宇航员的“大白”造型。
日本本田的ASIMO©wikipedia
动画《攻壳机动队》里有一集名为“机器们的时间”,颇为有趣。智能型战斗机器人塔奇克马有着类似蜘蛛的金属外形和完全相同的程序设定,但其中一只因使用了天然油开始展现出个性,其他同伴也随之觉醒。于是塔奇克马们开始为拥有思想而惶惶不安,因为它们认识到自己之所以被允许存在是因为机器的外表,一旦被赋予人形定会招致杀身之祸,于是它们决定一起伪装,让自己表现得更像机器人以求自保。虽是借科幻之名,退避安全线之后的底层逻辑却清晰可见。
但另一方面,人类从未放弃对高仿真人形机器人的追求。被美国有线电视新闻网(CNN)评为“改变世界的八大天才”之一的大阪大学机器人工程师石黑浩(Ishiguro Hiroshi)的研究一直颇受关注,在近20年里他推出的拥有年轻女性外形的Geminoid F系列和以他本人为模型的Geminoid HI系列都引发热议。这些机器人在外观上已经非常接近人类,在人工智能和大语言模型的帮助下,对话能力也得到了显著提升,但在行动能力上离以假乱真还有较大距离。
石黑本人认同恐惑谷的存在,他希望找到跨越恐惑谷的方法,并认为他的机器人在局部功能上已经实现了这个目标。在外界看来,石黑浩多少带有些疯狂科学家气质,但如他所言,研究人形机器人其实是探索人类本身的过程。
石黑浩与他的双胞胎机器人合影。©Osaka University/ATR/Kokoro
石黑的领跑展示了高仿真机器人研发是一项浩大而繁复的工程,每一个细节都可能成为恐惑谷现象的诱因。相关的探究也如抽丝剥茧一般。最初的焦点集中在机器人的外观,主要是脸部的设计上。五官比例、皮肤颜色、表情控制都是影响因素,有研究就发现五官之中眼睛的作用最为关键。
目前机器人的行为尚不能做到灵活自由,许多研究指出相比个别能力突出,整体的协调性更重要。例如仅仅提高机器人的触觉保真度并不能带来更好的体验,而需与视觉、听觉等其他器官的反馈相匹配。正因如此,大多数高仿真人形机器人目前仍在世界各大实验室里等待升级改造。
追问:本质问题抑或选择问题?
在人形机器人从人类的幻想逐渐成为现实,即将走进日常生活的今日,森政弘于半个世纪前提出的假设依然在等待答案。但是,随着技术的不断发展,人们甚至觉得离答案越来越远,因为机器人的范畴更加宽广,人机交互的情境也愈加复杂。
2004年动画电影《极地特快》中饱受争议的数字人形象提醒人们,恐惑谷现象似乎并不仅仅局限于实体机器人,元宇宙浪潮的到来意味着这个问题将进一步扩大。于是,有学者提出“恐惑墙”(uncanny wall)假设,认为恐惑谷是不可跨越的,因为随着时间的推移,人类对技术的识别能力不断增强,跨越恐惑谷的难度也会不断提高,即越过恐惑谷底之后面对的将是一堵没有上限的高墙。
然而,人类永远不会停止对真相的追求,一边试错一边积累,积跬步以行千里。人们对女性机器人索菲亚的样貌深感失望,却又期待下一个升级版本能带来惊喜。毕竟科幻电影中拥有完美外表的机器人带给了我们无限的遐想,尽管编剧们往往会给他们安排一个悲惨的结局以安抚人们对自己可能被机器人取代甚至灭绝的恐惧。
姑且不论现实中的技术何日能让梦想成真,倘若人类尚未做好接受高仿真智能人形机器人的准备,那让技术先行的测试无疑是在制造危机。所以,机器人的问题绝不仅仅是技术问题,技术也不是解决恐惑谷问题的唯一路径。
恐惑谷问题研究走过的50年历程或许在提醒我们,相比一个一劳永逸的答案,我们更加需要的是一种解决问题的智慧。将“以人为本”的理念切实融入技术开发,不再受困于问题本身,并通过思考“怎么做”去有效回避因纠结“是什么”“为什么”所造成的迷茫。因为机器人虽然是产生恐惑谷现象的最直接原因,改造机器人却不是无可回避的选择。目前一部分研究已经开始调整思路,通过改进人机交互的方式来降低风险并取得了一定成效。
而作为用户,人类自身的基本属性虽无法改变,但对技术的认知和接受程度却存在可调节的空间,况且用户还可以根据各自的喜好去选择中意的机器人。如此看来,适当的选择可以帮助我们避免与恐惑谷问题的正面交锋,这样的规避策略并不可耻,还非常有用。当然这并不意味着人类在高仿真人形机器人道路上的退缩,科技的探索仍需前行,而我们也恰好需要一些时间去思考人机共存社会的合理模式。
参考文献
森政弘. 不気味の谷[J]. Energy, 1970, 7(4): 33-35.
森政弘, 江晖. 恐惑谷[J]. 外国文学动态研究, 2020(5): 85-92.
WATSON R. Uncanny Valley—Das Phänomen des „unheimlichen Tals"[J]. 50 Schlüsselideen der Zukunft, 2014: 136-139.
ROBERTSON J. No Place for Robots: Reassessing the Bukimi no Tani ( "Uncanny Valley" )[J]. Asia Pacific Journal, 2020, 18(23).
江晖. 超越 "跨越与否" 的思考与探索: "恐惑谷" 理论五十年传播发展综述[J]. 外国文学动态研究, 2020(5): 98-102.
程林. "人转向" : 为何机器人跌入的是恐惑谷而非恐怖谷[J]. 外国文学动态研究, 2020(5): 93-97.
瀬名秀明. 瀬名秀明ロボット学論集[M]. 東京: 勁草書房, 2008.
TINWELL A, GRIMSHAW M, WILLIAMS A. The Uncanny Wall[J]. International Journal of Arts and Technology, 2011, 4(3): 326-341.
GRAY K, WEGNER D M. Feeling Robots and Human Zombies: Mind perception and the Uncanny Valley[J]. Cognition, 2012, 125(1): 125-130.
CASCIO J. The Second Uncanny Valley[EB/OL]. (2007-10-27)[2024-05-28].
http://www.openthefuture.com/2007/10/the_second_uncanny_valley.html.
GAHRN-ANDERSEN R. Seeming Autonomy, Technology and the Uncanny Valley[J]. AI & Society, 2022, 37(2): 595-603.
BARTNECK C, KANDA T, ISHIGURO H, et al. Is the Uncanny Valley an Uncanny Cliff?[C]//Robot and Human Interactive Communication. IEEE, 2007: 368-373.
MOORE R K. A Bayesian explanation of the "Uncanny Valley" effect and related psychological phenomena[J]. Scientific Reports, 2012, (2): 864.
CHTTTHAM M, SUTER P, JANCKE L. Perceptual Discrimination Difficulty and Familiarity in the Uncanny Valley: More Like a "Happy Valley" [J]. Frontiers in Psychology, 2014, 5.
本文来自微信公众号:信睿周报 (ID:TheThinker_CITIC),原载于《信睿周报》第125期,作者:江晖(中山大学外国语学院)