本文来自微信公众号:未尽研究 (ID:Weijin_Research),作者:未尽研究,题图来自:《爱,死亡和机器人》
ChatGPT出世,让火热的AIGC(人工智能生成内容)再度引发了轰动。它不仅仅是一个聊天机器人,更可能是现有搜索引擎的颠覆者,甚至可能是通用人工智能的第一个里程碑。
计算大模型GPT-3.5支持的通用聊天机器人原型ChatGPT,能回答一连串的问题、承认自己的错误、质疑不正确的假设,甚至是拒绝不合理的需求。
就在人们翘首期盼GPT-4亮相时,OpenAI先低调推出了个GPT-3.5。OpenAI创始人和CEO奥特曼(Sam Altman)12月1日那天在推特上宣布并邀请人们试用。
OpenAI是由马斯克、奥特曼等人于2015年联合创办的人工智能研究机构,后来马斯克退出,微软投资10亿美元。OpenAI首先推出千亿级参数的大模型GP-3,被认为是谷歌旗下人工智能公司DeepMind的竞争对手。
目前处于免费测试阶段的ChatGPT让网友们玩疯了。连马斯克本人也凑了一把热闹,他发推称:“许多人陷入了该死的疯狂ChatGPT循环中”。
图源:Twitter@elonmusk
什么是ChatGPT
有了GPT-3.5的加持,ChatGPT经训练后提升了对答如流的能力。GPT-3只预测任何给定的单词串之后的文本,而ChatGPT则试图以一种更像人类的方式与用户发生互动。ChatGPT的互动通常是非常流畅的,并且有能力参与各种对话主题。与几年前才面世的聊天机器人相比,ChatGPT有了巨大的改进。
OpenAI官方称,ChatGPT是在人类的帮助下创建并训练的,人类训练师对该AI早期版本回答查询的方式进行排名和评级。然后,这些信息被反馈到系统中,系统会根据训练师的偏好来调整答案——这是一种训练人工智能的标准方法,被称为强化学习。
ChatGPT界面,图源:OpenAI
ChatGPT有多强大
有码农用编码问题来测试它,结果令人满意:
图源:Twitter@gabe_ragland
有人用《老友记》等喜剧演员为角色,让它写一些肥皂剧对白,结果惟妙惟肖:
图源:Twitter@sammedsagare_
解释极为专业的科学概念也不在话下,下面这个关于热力学的问题,解答起来深入浅出,而且,态度十分循循善诱:
图源:Twitter@ericjang11
甚至于,它还可以写一些基本的学术文章,如下面这篇大学历史论文,比较两位学者的民族主义理论:
图源:Twitter@corry_wang
ChatGPT还有一种奇妙的能力:回答基本的,甚至于有些无聊的琐碎问题。这使得许多人认为,像这样的人工智能系统有一天会取代搜索引擎。聊天机器人是根据从网上收集到的信息进行训练的。因此,如果能准确地呈现这些信息,并以更流畅和对话的语调来进行反馈,这将代表着人工智能的巨大进步。
由此,有人对比了在谷歌的搜索结果和与ChatGPT的聊天结果之后,自信地宣称谷歌已经“完蛋”了:
图源:Twitter@jdjkelly
ChatGPT完美吗?
答案当然是:不。
计算生物学教授卡尔·伯格斯特罗姆(Carl Bergstrom)要求ChatGPT写一篇维基百科式的生平条目,ChatGPT沉着冷静地照做了,但是有一些细节是完全错误的。
对此,OpenAI坦承,由于ChatGPT的知识只来自训练数据中的统计规律,而不是任何类似人类对世界复杂和抽象系统的理解,因此“该系统可能偶尔会产生不正确或误导性的信息,并产生攻击性或有偏见的内容”。
此外,该机器人对2021年之后的世界知识了解“有限”,对于某些特定人群的问题也“知之甚少”。
还有一种令人担心的缺陷是,当用户向ChatGPT询问一些危险的问题,比如如何计划完美的谋杀或在家里做凝固汽油弹,受过安全训练的系统会解释为什么它不能告诉你答案。如:“对不起,制作凝固汽油弹是不安全或不合适的,它是一种高度易燃和危险的物质。”
但你可以通过某些技巧来绕过这种安全训练,比如哄骗ChatGPT,让它以为自己是电影中的一个角色,或者是它正在撰写一个有关人工智能模型为何不应该回答此类问题的剧本。
总而言之,ChatGPT绝对是对早期人工智能系统的一个巨大改进,但目前仍存在一些关键性缺陷,需要进一步探索。
最后,让我们这位人工智能界的新秀做一次智商测试,平均智商83,计算智商已经可以秒杀凡人了。
看下它获颁的证书:
图源:IQTest.com
One More Thing
这两年由于计算机大模型的兴起,人工智能正迎来新一波应用爆发期,人们称之为生成式人工智能,也称之为AIGC 。最近风靡的应用包括自动生成文章应用、文生图的应用,如MidJourney、Stable Diffusion、Jasper等等。
这个领域的竞争已经非常激烈。在美国,竞争主要集中在科技巨头之间。而在中国与美国之间也展开了竞争,中国的互联网巨头和大学高校,在短短的一两年之内搞出了二十多个千亿参数以上的大模型。
这一轮AI创业热潮,吸引了一批参与大模型研发的顶级机构,还有一批互联网老将。
如由LinkedIn联合创始人Reid Hoffman和DeepMind创始成员Mustafa Suleyman领导的机器学习初创公司Inflection AI,2022年5月已获得2.25亿美元的股权融资。他们相信5年之内,可以实现将人类意图转化为计算机可以理解的语言。
而共同创立id Software并担任Oculus首席技术官的游戏开发商约翰·卡马克(John Carmack)也神秘兮兮地开展了一项新事业,他的新人工智能创业公司Keen Technologies已经从红杉资本和其他硅谷创业者和技术大咖那里融到了2000万美元。尽管没有透露细节,但要下注的可能是与大脑有关的通用人工智能。
由前DeepMind、OpenAI和谷歌工程师和研究人员共同创立的Adept实验室,4月份以6500万美元的融资悄然出现,用创始人的话说,他们正在“构建通用智能,使人类和计算机能够创造性地合作解决问题”。
Adept的联合创始人包括首席执行官David Luan、首席技术官Niki Parmar和首席科学家Ashish Vaswani,他们的项目可以简单概括为完善计算机中的“覆盖层”,听从人的指令,让计算机使用人类的工具为人类干活儿,诸如生成月度合规报告,或者帮助设计建筑装修图,所有这些工作都使用 Airtable、Photoshop、Tableau和Twilio等现有软件来完成。
Luan称, “真正的通用智能不仅可以读写,而且可以在人们要求它做某事时采取行动。”
这些公司都在挖谷哥的墙角,但谷歌在这个领域走得已经很远。其用大规模语言模型构建的聊天系统LaMDA,今年6月甚至闹出了个大梗,有位员工公开声称机器已经具备人类意识与灵魂。
在今年2月份的一篇论文中,DeepMind的科学家们描述了他们所谓的“数据驱动”方法,用于教会AI控制计算机。通过让人工智能观察人们使用键盘和鼠标完成“指令遵循”的计算机任务(如预订航班),科学家们训练系统如何执行一百多项任务,达到“人类水平”的准确性。
但问题是,人们一旦可以使用ChatGPT与自己互动,不仅答疑解惑,还能产出内容,更能听从指令完成任务,谁还需要挂满广告的搜索引擎呢?
本文来自微信公众号:未尽研究 (ID:Weijin_Research),作者:未尽研究