3月18日,国际计算机学会(ACM)公布,计算机图形学奠基者Patrick M. Hanrahan和 Edwin Catmull 共同获2019年图灵奖。
ACM 提到,图灵奖颁给这两位,以表彰他们对3D计算机图形学的贡献,以及对电影制作和计算机生成图像等应用的革命性影响。
1988年图灵奖颁给计算机图形学之父 Sutherland,2019年 Sutherland 的学生 Catmull 加入图灵奖获得者行列。时隔三十二年,图形学作为一个学科第二次获奖,某种意义上是给予图形学传承的一个肯定。
从Sutherland起源,到今天Pat 和 Ed 获得贡献奖,也无疑给整个图形学社区带来了莫大的精神鼓舞,毕竟作为一个要求码力超强,理论扎实的学科并没有像计算机视觉一样容易入门。
图形学的骄傲:Pat 与 Ed
Edwin Catmull,是著名计算机科学家,皮克斯动画工作室联合创始人、前总裁,曾参与创办了现代视觉特效的起源地 NYIT 计算机图形实验室。因为其技术,Catmull曾先后 9 次获得奥斯卡金奖,影视圈莫不熟知。
Patrick Hanrahan 目前担任斯坦福大学计算机图形学实验室教授,但曾也是皮克斯动画工作室创始员工之一。
25年前《玩具总动员》家喻户晓,其背后的皮克斯动画工作室也正风生水起,那时候Catmull 和 Hanrahan就已经证明了一项专用的计算技术可以对其他领域产生重大影响。
毕竟,两位对《玩具总动员》的技术支持也给世界创造出一种全新的、完全由计算机动画制作的影像存在。
皮克斯原型公司可以追溯到1981成立的卢卡斯电影公司,直到乔布斯从苹果辞职之后花了1000万美元从乔治·卢卡斯手中收购了卢卡斯旗下的电脑动画效果工作室,才有了独立公司皮克斯动画工作室。
乔布斯和这两位的交集也是那时候产生的,之后乔布斯借着这家3D电脑动画公司声名大振, 个人身价达到10亿美元。而这两位“员工”也随着这家公司的发展而声名鹊起。
Edwin Catmull和乔布斯共事过26年。
Hanrahan 与 Catmul 之间联手也创造出不少“神话”,这两人在皮卡斯时候就曾开发出了一套日后称为 “RenderMan” 的生产渲染器雏形,将两人在计算机图形上的诸多创新集成到了其中。
RenderMan确实为电影带来了开创性的电影特效制作,在arnold出来之前,几乎是好莱坞电影的标配渲染器,几乎每一部电影里都能看到RenderMan的身影,例如詹姆斯·卡梅伦的《终结者2:审判日》和史蒂芬·斯皮尔伯格的《侏罗纪公园》,以及促进了电影《阿凡达》,《泰坦尼克号》和《指环王》三部曲的创作。
没错,在那个年代,这两人对渲染数据的划分和处理都是“先进”的,出现在无数paper中,创造了很多超前理念。
尽管技术在不断发展,但即使过了数十年,Hanrahan 和 Catmull 所做的工作仍是该领域的标准。两个人所做的开创性技术贡献,仍是当今计算机图形开发不可或缺的部分。
Hanrahan获得过很多的奖项,仅就在渲染和计算机图形研究方面就获得过三项奥斯卡奖。1993年 Hanrahan和皮克斯的其他创始员工被授予RenderMan科学和工程奖,2004年,他获得了技术成就奖......
Pat 的可佩之处还在于他卓越的眼光,2003年便看到了数据可视化的重要性,与学生共同创建了Tableau公司,旨在将数据运算与美观的图表完美嫁接在一起。2013年Tableau 进行了 IPO,Pat直接实现了财富自由,有人估算其身价十亿多美元。
一时之间,名震四海,不光在学术上,十年的商业经历也极为精彩。曾经担任图形和可视化领域顶级会议,ACM SIGGRAPH Asia(2014)和IEEE Visualization(2005)会议主席的北京大学陈宝权教授表示,单凭Tableau(Hanrahan大佬的第九家公司)这一项成就,Hanrahan足以再获一次图灵奖,毕竟将大量数据拖放到数字“画布”上,转眼间就能创建好各种图表的技术也算是可视化领域的突出贡献。
而Catmull的故事也非常耐人寻味,1974年Catmull获得计算机科学博士学位,同年11月,纽约理工学院创始人便邀请他担任纽约理工大学新成立的计算机图形实验室的主任。
在那里,Catmull组建了一个致力于2D动画的研究小组,不久后便转向3D计算机图形领域,为电影制作开疆扩土。
20世纪70年代,由于几个原因,计算机图形实验室开始陷入困境,尽管技术发展了,但仍然缺乏实际进展。他的坚持和才华吸引了好莱坞的大牌人物卢卡斯和科波拉的注意,卢卡斯聘请他来领导一个小组,研究如何将计算机图形学、视频编辑和数字音频应用到娱乐领域。
随后,卢卡斯便诞生了如抠画、叠画等数字图像合成技术。
后面的故事就是就涉及到了皮克斯和迪士尼,乔布斯收购了卢卡斯动画业务,Catmull便随业务认识了乔布斯。之后,便是和乔布斯共事26年。
时间推进到2006年1月,迪士尼收购皮克斯,Catmull也“转”向负责振兴迪士尼动画工作室。
在那期间,例如奥斯卡金像奖视觉效果类电影的 44 部,包括《阿凡达》、《泰坦尼克号》、《美女与野兽》、《指环王》三部曲以及《星球大战》前传,都有Catmull的身影在。
值得一提的是,2006年他因对计算机图形学领域的建模,动画和渲染方面的开拓性贡献而获得IEEE约翰·冯·诺伊曼奖章。
2018年10月23日,Catmull宣布退出皮克斯和迪斯尼动画公司的计划,只是继续担任顾问,并于2019年7月正式退出。
三十二年的邂逅:图形学一代人的传承
计算机图形学第一次获得图灵奖还是在32年前,当时获奖的Sutherland早已成名。
1962年他的博士论文获得了信息理论之父香侬的指导,并于1963年以论文“Sketchpad:一个人机交互通信的图形系统”参加答辩,在包括香侬等众明星组成的MIT考场上,他获得了满堂喝彩。也就是在那篇论文中,首次有了“计算机图形学”这一术语,也证明了交互计算机图形学是一个可行的、有用的研究领域。从此计算机图形学正式步入科学研究。
所以,信息理论祖师爷的徒弟做了计算机图形学的祖师爷。
跨学科的传递只是一个开始,一个新兴的学科自从诞生之后,便开启了传承。Sutherland 博士毕业之后,在哈佛大学呆了几年,然后转到犹他大学任教,而那时候正是犹他大学刚刚重建的第二年。Sutherland教授2014年受邀在中国计算机大会做特邀报告,陈宝权教授对他进行了一个多小时的面对面采访(https://www.ituring.com.cn/article/127792)。
从1968年到1974年,6年的时间,Sutherland将他所有的图形学知识留给了这所大学,其培养的学生包括 Alan Kay、Gordon W. Romney、Henri Gouraud、Frank Crow、 Jim Clark、 Edwin Catmull等人,这些人先后都成为图形学领域执掌一方的大将。
6年的时间,培养出了一大批计算机图形学的开创者,同时也为一个学科奠定了基础架构。之后这些徒弟便开启了开枝散叶,发扬光大的历程,例如Alan Kay发明了Smalltalk编程语言并获得了2003年图灵奖;Jim Clark创建了一个图形界面浏览器NetScape(网景),之后又创建了第一个图形工作站公司Silicon Graphics Inc(SGI);Romney制作了第一张3D图像;Gouraud发明了Gouraud着色技术......
犹他大学是计算机图形学当之无愧的发源地。
故事并没有结束,学生Catmull接过了Sutherland的接力棒,在犹他大学打下了物理和计算机科学基础之后,应纽约理工学院创始人的邀请主持计算机图形实验室,这个后来被称为图形学黄埔军校的实验室给了图形学这个学科第二次辉煌传承。
纽约理工大学计算机图形实验室重聚
站着的从左往右:John Lewis, Geoff Gardner, Hank Grebe, Andrew Glassner, Kevin Hunter, David Sturman, Tom Duff, Robert McDermott, Darcy Gerbarg, Sterling Stites, Steve DiPaola, Ralph Guggenheim
坐着的: Ned Greene, Paul Heckbert, Patrick Hanrahan, Ed Catmull, Alvy Ray Smith, Lance Williams, Christine Barton
坐地板上的: Susan Van Baerle, Jules Bloomenthal, Tom Brigham, Michael Chou, David Geshwind
实验室创立于1974年,也就是Catmull博士毕业的那一年,因为Catmull本身亦不俗,所以吸引了一大批对计算机图形学的慕名者。
包括后来和他一块获奖的Hanrahan,还有发明 α buffer的 Alvy Ray Smith,事实上若论贡献 Alvy 的成就也足以获得图灵奖。关于Alvy有一个小故事。1978年中美正式建交时,国家主席曾接见过一位叫做“匠白光”的外国科学家,而这位匠白光正是Alvy。
图片来自北京大学陈宝权教授
NYIT计算机图形实验室,不仅在技术上创造了第一个全色图形系统,设计了第一个扫描和上色系统......在人物培养上,对今天获奖的两位也有着非凡意义!微软前高级执行副总裁沈向洋博士当年回国建设微软亚洲研究院,为研究院一炮打响的便是他的图形研究组,他认为:Ed 和 Pat 事业起步的关键便是跟 Alvy Ray Smith , Jim Blinn (当时intern), Jim Clark 等一批优秀人才于70年代末、80年代初在NYIT Graphics Lab一起的工作。上面的图片便是那段历史的画像,是陈宝权教授讲授计算机图形学课程的第一课所用胶片,NYIT Graphics Lab是计算机图形学发展历史的重要里程碑。
果然,跟优秀的人在一起,自己也会变得优秀。
图形学第三次辉煌,便是皮克斯的动画电影时代了,简单的时间脉络是Ed和Alvy 去了卢卡斯,然后乔布斯收购业务成立皮克斯,两位也跟到皮克斯.....
这后面的故事伴随着一些列优秀动画的出品,大家都比较熟悉了。
毕竟《阿凡达》等此类电影让皮克斯名声大振的时候,也在应用层面推动了计算机图形学逐步成熟,从最初的渲染到后来的物理模拟,计算机图形学也经历了理论到应用的高光时刻。
在动画时代的同时,计算机图形学也慢慢向着游戏等新兴领域进发,这个过程直到现在还在继续,期间衍生了很多新兴学科,包括可视化、虚拟现实、人机交互等都创建了自己的学术会议。
计算机图形技术已经渗透到各个领域,从医学影像到桌面系统,再然后就到了目前的互联网APP与社交时代,迸发出更多前端应用,如谷歌、微软、苹果、Facebook都建立了虚拟现实的研发部门,为下一代自然场景社交做准备,而这些基于真实个体与场景的虚拟现实技术也在极大的推进计算机图形学的发展。
粗略来分,图形学的五个时代,Sutherland 到 Catmull,这一脉传承,创立并统领了其中三个。在随后由游戏和互联网推动的时代中,他们精神的传承也在继续。
图灵奖颁给了研究到头的领域?
在2019年公布Hinton、LeCun和Bengio三人获奖时,网上曾有段子说“某个领域获得图灵奖,就证明该领域做到头了”。
伴随着2019年图灵奖颁给图形学领域的两位领军人物,网上也不乏看到类似“Rendering is Over;CG is Over”的话。
然而,正像人工智能远未达到它最初的目标一样,图形学离它最原初的梦想——用计算机重建一切——也还很遥远。
认为图形学“Over”之说,往往最根本的原因是——“图形学太难了!”
微软亚洲研究院网络图形组在2018年的一篇综述文章中提到:“图形学的核心科学问题是在计算机中有效的表达和处理三维世界的各种属性。图形学所处理的三维信息既包括物理真实世界中的三维信息,也包含我们人类大脑通过想象产生的虚拟的三维信息。计算机图形作为一个中介,提供了这两个世界在计算机中的一个共同的表达和信息交流渠道。”
从这种角度来看,若想做好图形学的研究,不光是要会写代码,还要会写大量的代码,因为图形学的任何一项工作都应当是一个完整的系统,这使得计算机视觉领域的工作可能只需要几百或几千行代码就能够做出一项很不错的工作;而在做计算机图形学领域,几万行代码却只能完成一个简单的图形实现。许多实现并没现成的可调用包,如果不是出自研究大组,往往需要从底层(GPU 线程等)一行一行地来写。
而另一方面,图形学的研究,还需要对物理世界有充足的认识,陈宝权教授举例说,做树木的三维重建,往往需要学习大量关于植物生长规律的知识;如果要模拟在屏幕上做水彩画,就需要了解画笔、着色和纸纤维渗透特性等方面的知识。以上这些给图形学的研究带来了极高的门槛,也造成许多学生从刚接触图形学时的好玩到接下来的望而生畏。
图形学研究的难,还不仅表现在能否做出一项完整、炫酷的工作,更让初入行的研究者难以忍受的是,发表顶会论文太难了。
以图形学领域顶级会议SIGGRAPH为例,尽管SIGGRAPH会议每年都有几万人参会,但所收录的论文数量却极低,在早些年每年只录取50篇左右的论文,即使现在随着研究的增多,每年却也只有一百多篇论文录用。作为对比,视觉会议的录用论文近几年则往往是以千计。每年SIGGRAPH参会人数都有逾万人,在体验到的各种炫酷技术背后,则是许多人的心酸。
“一篇SIGGRAPH,堪比N篇CVPR。”
图形学是一门更加偏向解决实际问题的学科,正如我们在前文中提到,图形学在历史中的历次大的变革无不是由工业应用来推动,从动画制作,到游戏开发,到互联网时代的交互等。然而时代在发生变化,技术在不断发生变化,应用需求也在不断发生变化。以上这些场景的技术研发或许已经“Over”,但图形学的发展是随应用而变的。微软亚洲研究院网络图形组曾指出,图形学未来的应用在机器人、3D打印、虚拟现实、增强现实、数字化孪生等场景。
如何进行高效高质量的三维内容创作?如何进行三维世界的实时理解与分析?如何开发大规模可扩展的实时模拟技术?如何将人机交互与图形学进行深度结合?这些问题,对于图形学领域仍然是巨大的挑战。
事实上,目前图形学和计算机视觉的研究也存在着一个趋势,即两者逐渐走向融合。陈宝权教授在采访中指出,目前许多视觉的研究(一半以上)都涉及 3D 视觉,因为从 Learning 的角度来看视觉的理解,3D 世界是最高的学习/认知目标,只有将研究转到 3D 世界,才能真正触及到学习和认知的极限。然而从事这方面的研究,如果不深入图形表达,不继承图形领域所构建的对3D世界的几何与物理过程的表达,视觉智能将难以突破。因此在未来的数十年中,计算机图形学毫无疑问会成为人工智能研究的一个核心领域。
从90年代中影视娱乐给图形学带来的第一次爆发,到20世纪末游戏与社交带来的第二次爆发,现在随着人工智能走向深水区,我们可以期待图形学将迎来它的第三次爆发。
图形学研究经历了50年辉煌的发展历程,Ed Catmull 和 Pat Hanrahan 两人的图灵奖获奖,无疑将给整个图形学社区带来莫大的精神鼓舞,激励再创辉煌。