人类80%的外界感觉信息来自于视觉系统,我们的日常阅读、对周遭物体空间距离的辨认等等,都与视觉系统息息相关。然而,我们又深知“眼见未必实”,因为这套视觉-脑系统太容易受骗上当了。比如常见的视错觉。最有趣的一点在于,即便你随后知晓了视错觉的真相,但大脑仍旧会犯同样的错误……换句话说,我们根本无法推翻脑内构建出的顽固错觉。
本文来自微信公众号:利维坦(ID:liweitan2014),作者:Erica Klarreich,翻译:antusen,校对:Yord,头图来自:《盗梦空间》剧照
一名扮成矿工的男子头顶照明灯,带着镐子,跃上了舞台。来回挥舞几次镐子后,他宣称自己发现了“超级磁铁”——其磁力之强,甚至可以吸引木头。男子头顶上的屏幕似乎印证了他的说法:几个木球正沿着四个斜坡向上滚动,好像摆脱了重力的束缚。
惊奇小球:木球能沿着斜坡向上滚动。这是杉原厚吉(Kokichi Sugihara)设计的视错觉作品,曾斩获大奖。
这名“矿工”其实是日本东京明治大学的数学家杉原厚吉。当时他正在参加佛罗里达州内普尔斯举办的2010年度最佳视错觉大赛决赛。随着视频继续播放,人们发现这些小球并没有真地向上滚动。从正面看,支撑坡道的柱子是垂直的,但绕到背面去看,则不然。除此之外,看似由交点向下倾斜的坡道其实是翘起的。
这个利用了视错觉的设计(赢得了当年的最高奖项)并非只凭杉原一己之力完成,他还有个不同寻常的合作伙伴:电脑程序。
一开始,杉原并没想过要成为视错觉大师。1980年,这位年轻的数学家只对机器人视觉和计算机辅助设计感兴趣,为此,他写了一个可以凭多边形的线条画、生成多个三维图形(当这些三维图形投射在平面时,这一多边形就会出现)的电脑程序——这有点类似于由影子倒推出可以投射出这种影子的物体。
为了测试程序,杉原输入了在三维世界不可能存在的物体的画像,如埃舍尔(M.C. Escher)的无尽楼梯。出乎意料的是,在某些情况下,程序的确据此生成了非常相似的三维物体。他说:“我还以为我的软件出现bug了。”
仔细观察一番后,他意识到,认定“不可能图形”不存在于三维世界的假设是错的。于是,杉原开始利用程序设计纸模型,渐渐地,他发现自己的程序不适合进行机器人视觉与计算机辅助设计研究。他开始致力于探索各种奇怪的结构,这些令人困惑不已的结构很容易用程序制作出来。他造了一台错觉制造机。
之后的34年里,杉原用错觉制造机设计了100多个作品:譬如各种不可能图形(如埃舍尔所绘的楼梯)的实体模型,以及违反直觉的运动模式(如小球向上滚动)。华盛顿美利坚大学的神经科学家亚瑟·夏皮罗(Arthur Shapiro)称:“杉原系统性地创造了视觉系统崩溃后的世界。”夏皮罗既是科学家,也是艺术家,他旨在揭示大脑构建世界的底层数学知识。
针对眼睛所接收的视觉信息,人脑通常会选择性地忽视许多可能的解读。大脑精力有限,且需快速理解视觉信息,因而没办法接受所有怪异的解读,只会依靠过去的经验及内在的视觉处理机制,寻找最可能合理化信息的解释。
布鲁克林纽约州立大学州南部医学中心的神经科学家苏珊娜·马丁内斯-康德(Susana Martinez-Conde)和同事斯蒂芬·麦克尼克(Stephen Macknik)一起举办了这场错觉大赛。她表示,在大多数情况下(尽管不是总是),出于实际需求,大脑的解读与真实世界已足够贴近。“从进化角度而言,如想百分百正确理解信息,人类要付出的代价比现在大得多。”
杉原认为,他的视错觉作品之所以令人摸不着头脑,原因很简单:即使直角并不存在,人们也会自动感知出直角。在许多最引人注目的不可能图形中,某些结构只包含三条朝向不同的线。在这种情况下,人们似乎会忍不住认为这些线是两两垂直的。
杉原通过指示程序选择直角最多的三维图形,验证了这一假设。他表示,计算机通常会选中人们感知出的那个立体图形。当直角数最多的立体图形不止一个时,杉原猜测人类的视觉系统会根据明暗变化决定如何加以感知。他说,视觉系统倾向将较亮的表面解读为朝上,将较暗的表面解读为朝下。他希望能在测试程序中建立一个模块,以验证这一猜想。
© Gfycat
麦克尼克说,一旦我们视其为直角,即便这种认知没有任何意义,我们也往往会坚持己见。我们只能从局部角度观察、处理图像的每一细节,这导致我们能够“看见”不存在的结构。” 他说:“我们之所以认为埃舍尔绘制的阶梯永远向上,是因为从局部看,邻近阶梯间的角度过于合理。我们无法全面观察,因而无法发现诱导我们走入歧途的小偏差,这正是我们能看见不可能图形的原因。”
《上升与下降》(Ascending and Descending)局部,M.C.埃舍尔,1960年3月。© Dreamstime
杉原系统性创造视错觉的能力为探索视觉系统提供了新的思路。他称,还有一些心理学家推崇另一种视觉理论:即视觉系统处理信息时会追求对称性。
杉原已经开始与日本京都立命馆大学研究错觉的心理学家北冈明佳(Akiyoshi Kitaoka)合作,以便弄清楚他的哪类视错觉设计可以有效区分该理论与直角理论。他们的工作成果将帮助研究人员判定我们看东西时各种视觉捷径的优先级。马丁内斯-康德说,处理错觉的视觉层次越低,错觉就越难消除,中层视觉加工过程中出现的深度错觉(在杉原的作品中有诸多体现)“非常顽固”。
© Pinterest
© ScienceAlert
杉原之所以高产不仅是电脑程序出力的结果,不可能图形也是其创作的灵感来源。他经常将物体的某部分从背景移至前景,以此造出现实世界不存在的物体。此外,他还会先切割再重组图形,使各个角度看起来仍然是垂直的,但新图像却不存在于三维世界。利用这些简单的手段,杉原创造了各种各样的不可能图形。其中大多数不可能变成三维物体,但他的程序可以分辨出一些能存在于现实世界的物体。
小屋:最上面的两个图形被切成两半,重新组合在一起,创造出了两个不可能图形。© 杉原厚吉
近年来,杉原开始展现不可能存在的运动模式——三维立体图形是真实存在的,但在上面运动的物体似乎违背了物理定律。杉原的程序可以制造出拥有直线和平面的立体图形。分析立体图形上发生的运动很简单,杉原已经设计出了这样的模块。譬如,为了创造小球滚上斜坡的视错觉,杉原简单画了坡道装置的草图,然后让程序找出了所有在三维世界的映射,从中识别出了可以让小球“向上滚”的立体图形。
当我们看到这些不可能存在的物体或运动时,我们的认知意识并没有强大到足以推翻大脑对三维几何反射式解读的地步。杉原说:“对三维立体图像的解读不能被理性逻辑控制。”
折叠梯:杉原设计的视错觉之一——一根杆子似乎正穿过折叠梯,以看似不可能的方式移动。
不可能的运动在杉原的最新作品中显而易见,他已同意在本文中加以展示。如视频所示,一根笔直的棍子正穿过类似折叠梯的结构,而实际上,如果棍子无法弯曲,根本不可能以这种方式移动。
为了制造这一视错觉,杉原先画了梯子的草图,然后利用程序生成并选择了人们意想不到的三维立体图形。我们对直角的偏好令我们认为梯子的顶端是平的,这样的话,顶端就与支撑横档互相垂直了。但实际上顶端不是平的:有几个横档是倾斜的,因此小棍能以匪夷所思的方式穿过折叠梯。
杉原的程序可能会让人们认为世界上存在着精密的计算机视觉系统能不像人类那样被蒙蔽。然而,北卡罗莱纳达勒姆杜克大学的神经学家戴尔·珀维斯(Dale Purves)表示,没经历过进化,任何计算机程序都不太可能像人类那样观察物体。他说:“我们的视觉系统在数百万或数十亿年的进化过程中获益颇多,你所看到的东西取决于你想怎么看待。我认为,除非通过进化,否则只靠工程师的逻辑,机器没办法像人那样观察物体。”
© Gfycat
如果机器人真能参透进化的真谛,可能也会像人类那样不可避免地产生错觉。伦敦大学学院的神经科学家博·洛托(Beau Lotto)和苏格兰阿伯丁罗伯特戈登大学的大卫·科尼(David Corney)发明了通过反复试错,学习如何判定合成自然场景中灰度值的机器人。
和人类一样,这些机器人也被“白色错觉”欺骗了。明明阴影的灰度完全相同,但靠近黑色条纹的看起来更深,靠近白色条纹的看起来更浅。不过,经过进化磨练的计算机视觉系统也有可能与杉原的程序相结合,以期两全其美。麦克尼克说:“我确信计算机视觉系统最终会比人的视觉系统更加出色。”
© Pinterest
目前,杉原等人的程序还比不上人类的视觉系统。但它们不受人类视觉系统偏好的影响,这正是杉原打算最大限度研究的特性。他说:“我很乐于用视错觉作品惊艳众人”,这些作品不仅仅源于职业兴趣。
原文:medium.com/nautilus-magazine/the-illusion-machine-that-teaches-us-how-we-see-72422de865d5
本文来自微信公众号:利维坦(ID:liweitan2014),作者:Erica Klarreich,翻译:antusen,校对:Yord,本文基于创作共享协议(BY-NC),由antusen在利维坦发布