本文来自微信公众号:APPSO,作者:AppSo,原文标题:《黄仁勋对话扎克伯格万字实录:爆粗口抨击闭源,谈智能硬件,互送夹克,下一次还要送金链》,题图来自:视觉中国
本文来自微信公众号:APPSO,作者:AppSo,原文标题:《黄仁勋对话扎克伯格万字实录:爆粗口抨击闭源,谈智能硬件,互送夹克,下一次还要送金链》,题图来自:视觉中国
今天,在美国丹佛举行的第 51 届 SIGGRAPH 图形大会上,英伟达创始人兼 CEO 黄仁勋和 Meta 创始人兼 CEO 马克·扎克伯格举行炉边谈话。
他们讨论了 AI、开源大模型、仿真模拟的未来、下一代计算平台,以及智能眼镜及其与 AI 的集成等众多热议话题。
在现场,扎克伯格与黄仁勋也上演了一场“球衣交换”。扎克伯格特地订购了一件黑色毛领皮大衣,而黄仁勋也将自己标志性的皮外套与扎克伯格交换。
扎克伯格调侃道,“你的这件衣服显然更值钱,因为它是被穿过的。”
部分金句如下:
黄仁勋:
我认为很少有人意识到,推荐系统是世界上设计出的最大计算系统之一。
我认为 Lama 2 可能是去年 AI 领域最重大的事件。
当我们面对一个任务或问题时,我们通常会考虑多个选项,甚至可能构建一个决策树来考虑每种可能的选择所带来的不同结果。这就是我们在进行规划的过程。未来的 AI 也将执行类似的操作。
扎克伯格:
Meta AI 的概念是拥有一个能够帮助处理各种任务的 AI 助手
如果你回顾过去,苹果在封闭系统方面有所作为。但微软,虽然它不是一个完全开放的公司,但与苹果相比,Windows 运行在由不同的 OEM 和不同的软件、硬件上,形成了一个更加开放的生态系统。
我们确实会做一些封闭源代码的项目。我们发布的并不都是开源的。但我认为,对于整个行业正在构建的计算平台,尤其是软件开源,这将为整个行业带来巨大的价值。
至少我不认为会有一个主要的 AI 代理,每个人都在同一水平上与之交流。我不认为会有一个模型被每个人使用。
我认为智能课程和混合现实头戴设备都将存在于我们的世界中。我认为智能课程将类似于移动手机,是下一个计算平台的一种始终在线的版本。
我们离拥有全息眼镜还有一段时间。不过,我认为在一副时尚的、更厚框架的眼镜中实现这一点并不遥远。
以下是黄仁勋和扎克伯格的对话实录(有删减):
黄仁勋:这里是 SIGGRAPH。你知道,这里聚集了众多博士。
SIGGRAPH 最棒的地方在于,它是计算机图形学、图像处理、AI 和机器人技术融合的盛会。多年来,许多公司在这里展示了他们的惊人成就,包括迪士尼、皮克斯、Adobe 和 Epic Games。
当然,英伟达今年在这里也取得了显著成果。我们在 AI 和模拟的交叉领域推出了 20 篇论文。
因此,我们正在使用 AI 进行帮助模拟,规模更大,速度更快。AI,我们正在使用仿真来创建用于合成数据生成的仿真环境。
这两个领域真的融合在一起了,我为我们在 Meta 所做的工作感到非常自豪。你们做了惊人的 AI 工作。
请记住,我们都受益于 Meta 开发的 PyTorch,它在计算机视觉、语言模型以及实时翻译等领域取得了开创性的成果。
我想问你的第一个问题是,你如何看待 Meta 目前在生成式 AI 方面的进展,以及你是如何利用这些技术来优化运营或开发新能力的?
推荐系统是世界上设计出的最大计算系统之一
扎克伯格:是的,这里有很多内容需要探讨。首先,我真的很高兴能来到这里。你知道,Meta 做了很多工作,并且多年来一直参与 SIGGRAPH 会议。与你們这些资深参与者相比,我们还只是初来乍到,但我想那是在 2018 年,你那次著名的演讲,对吧?我只是想说,谢谢你们欢迎我来到你们的地盘。
我认为是在 2018 年,我们展示了我们 VR 和混合现实头戴设备的一些早期手部追踪技术。
我想我们已经详细讨论了我们在高保真化身技术方面取得的进步,这些化身可以从消费者的头戴设备中驱动,我们正逐步实现这一目标,对此我们感到非常兴奋。
此外,我们在显示系统方面也做了大量工作。我们正在进行的一些未来原型和研究旨在使混合现实头戴设备变得更加轻薄。这需要使用先进的光学堆叠技术和集成显示系统。
我们通常首先在这里展示我们的最新成果,所以今年能来参加感到非常兴奋,我们不仅讨论了反向工程的内容,还涉及了所有与 AI 相关的领域。
正如你所说,我们从 FAIR,即 AI 研究中心开始。那时还是 Facebook,现在是 Meta,在我们成立 Reality Labs 之前,我们已经在这个领域耕耘了一段时间。生成式 AI 技术正在引发一场有趣的革命。我认为它将最终以有趣的方式改变我们所做的每一个产品。我的意思是,我亲历了这一切的发展。
你可以看看我们已有的主要产品,比如 Facebook 和 Instagram 的动态和推荐系统。我们一直在不断地发展这些产品,它们已经从最初的与朋友联系功能发展到了更多。
排名功能一直非常重要,因为即使你只是关注朋友,如果有人分享了重要事件,比如你的表弟生了孩子,你当然希望这个消息能出现在动态的最上方。如果我们没有把它突出显示,而是让它埋没在动态中,你可能会对我们感到非常不满。
排名功能一直很重要,但在过去几年中,它已经发展到了一个新的阶段,越来越多的内容变成了各种公共内容。
推荐系统因此变得至关重要,因为现在面对的不再是几百或几千个来自朋友的潜在帖子,而是数百万个内容片段,这构成了一个极具挑战性的推荐问题。
随着生成式 AI 技术的进步,我相信我们很快就会进入一个新的阶段,届时 Instagram 上推荐给你的大部分内容将不仅仅是基于你关注的人,而是来自世界各地与你的兴趣相匹配的内容。未来,大量内容也将通过这些工具被创造出来。其中一部分将是由创作者使用这些工具创作的新内容。
我认为,其中一部分内容最终将根据你的需求即时生成,或者是通过整合全球各地的不同资源来创造的。这正是我们核心业务将如何演变的一个例证。实际上,这种演变已经持续了 20 年。
黄仁勋:然而,我认为很少有人意识到,推荐系统是世界上设计出的最大计算系统之一。
扎克伯格:确实,这是一个全新的方向,不是吗?它并不是人们热议的生成式 AI 领域,但我认为它就像是一种架构,所有的转换都是架构。这就像是在构建越来越通用的模型,将非结构化数据转化为有用的特征。
确实,推动质量提升的一个关键因素是,过去我们为每种内容类型都设计了不同的模型。
例如,我们曾有一个模型专门用于短视频的排名和推荐,另一个模型则用于长视频。通过产品开发,我们使得系统能够在线显示任何类型的内容。
随着你创建出能够覆盖所有内容的通用推荐模型,这些模型会变得越来越精准。我认为,这部分是因为内容的流动性,就像经济学中的概念,你从一个更广泛的内容池中提取,这样就避免了从不同池子中提取内容时可能出现的效率低下问题。
确实,随着模型变得越来越强大和通用,它们的性能也会不断提升。
我梦想着有一天,Facebook 或 Instagram 几乎可以由一个单一的 AI 模型驱动,这个模型能够整合不同的内容类型和系统,这些系统在不同的时间尺度上有着各自的目标。有些内容是向你展示今天你可能感兴趣的有趣内容,而有些则是长期帮助你扩展社交网络,你可能认识的人或你可能想关注的账户。
黄仁勋:多模态模型通常在识别模式和微弱信号方面表现更出色。人们总是对 AI 在你公司中的深度应用感到好奇,毕竟你们一直在构建 GPU 基础设施,并且运行这些大型推荐系统已经有一段时间了。
扎克伯格:实际上,你在采用 GPU 技术方面确实有些滞后。
黄仁勋:是的,我几乎是刻意想要表现得友好一些。
扎克伯格:我知道,可能表现得太过友好了。
黄仁勋:我确实试图表现得友好,你知道吗,我在上台前在后台准备时。
扎克伯格:你之前在谈论关于承认错误的事情,对吧?
黄仁勋:你不必无缘无故地自己提出来。
扎克伯格:我想这个话题已经被充分讨论过了。感觉就像我刚刚被狠狠地批评了一顿。
黄仁勋:现在,生成式 AI 真正酷的地方在于,当我使用 WhatsApp 时,我感觉我正在与它合作。我喜欢想象,当我打字时,它正在实时生成图像。我回头修改我的文字,它就会生成不同的图像,你知道吗?
所以那个中国老人在日落时,一边品着威士忌,一边被三只狗围绕着,一只是金毛猎犬,一只是金毛混血犬,还有一只是伯恩山犬。
它生成了非常吸引人的一张图片。是的,我们已经做到了,那是我每个月的样子。确实,这更好了。现在你实际上可以在那里上传我的照片。这是真的我吗?
扎克伯格:是,这听起来像是上周的事。
黄仁勋:是的,我对此非常兴奋。
扎克伯格:想象一下,我花了很多时间与我的女儿们一起玩耍,想象她们变成美人鱼等角色,过去的一周真是乐趣无穷。是的,这就是生成式 AI 的另一面。一方面,我认为它将为我们的工作流程和产品带来一次重大升级。但另一方面,它还将催生出许多全新的创意。
因此,Meta AI 的概念是拥有一个能够帮助处理各种任务的 AI 助手,这将是极具创造性的,正如你所描述的那样。但重要的是,它们非常通用,因此不必局限于特定用途。随着时间的推移,它将能够回答任何问题。
当我们从 Llama 3 类模型过渡到 Llama 4 类模型及其更高级版本时,这种体验将不再局限于简单的聊天机器人模式。不再是你给出提示,它就回应,然后你再给出提示,它再回应。
相反,它将迅速发展,能够根据你的意图独立工作,跨越多个时间框架。我的意思是,它应该从一开始就确认你已经向它表达了你的意图。
但我的意思是,我认为有些东西最终会加速计算工作,需要几周或几个月的时间,比如,当世界上发生了一些重大事件时。我认为这将具有非常强大的力量。
AI Studio 将帮助每个创作者构建一个 AI 版本的自己
黄仁勋:因此,今天的 AI 主要功能是接收输入并做出回应。但当我们面对一个任务或问题时,我们通常会考虑多个选项,甚至可能构建一个决策树来考虑每种可能的选择所带来的不同结果。这就是我们在进行规划的过程。未来的 AI 也将执行类似的操作。
当我听到你阐述关于创作者 AI 的愿景时,我感到非常兴奋。这个想法确实令人振奋。请向大家介绍一下创作者 AI 以及这个 AI 工作室,它将如何帮助大家实现这一目标。
扎克伯格:确实,我们之前提到过,但今天我们正在将这个项目扩展到更广泛的范围。我们的愿景是,不会只有一个 AI 模型。有些公司似乎在构建一个中央代理,但我们会提供一个 Meta AI 助手供大家使用。更重要的是,我们希望赋予所有使用我们产品的人创建自己代理的能力。
因此,无论是平台上的众多创作者,还是数以亿计的小企业,我们最终希望能够整合所有内容,并迅速创建一个业务代理,以便与你的客户互动,进行销售和客户支持等。我们现在开始推广的项目被称为 AI Studio。
基本上,AI Studio 是一套工具,最终将帮助每个创作者构建一个 AI 版本的自己,作为社区可以与之互动的代理或助手。这里有一个基本问题:一天的时间有限。
如果你是一名创作者,你希望与社区有更多互动,但时间是个限制。同样,你的社区也希望与你互动,但这同样困难,因为时间有限。
因此,允许人们创建这些 AI 代理,实际上是一种替代方案。这些 AI 代理虽然不是创作者本人,但你可以训练它们以你想要的方式代表你,就像创作艺术作品或发布内容一样具有创造性。
显然,这些代理不是直接与创作者本人互动,但我认为这是创作者在社交平台上发布内容后,以另一种有趣的方式与观众互动的一种方式。
同样,我相信人们将根据自己的需求和偏好创建各种用途的 AI 代理。有些可能是为了完成特定任务而设计的定制化实用工具,他们希望对其进行微调。还有些代理可能是为了娱乐目的而创建的。
有些人们创造的内容非常有趣,甚至有些荒谬,以各种不同的方式展现出来,或者对某些事情持有一种幽默的态度。这些内容可能不会被整合进 Meta AI 作为一个助手功能,但我认为人们对于看到和与这些内容互动非常感兴趣。另一个有趣的应用场景是,我们看到人们开始利用这些代理来获取帮助。
让我有些意外的是,Meta AI 目前一个非常受欢迎的应用场景是人们用它来模拟即将面临的复杂社交情境。
例如,在职场中:我想问我的经理,如何才能获得晋升或加薪?或者我与朋友发生了争执,再或者我和女朋友之间出现了棘手的问题。这样的对话该如何展开?
这个平台提供了一个完全无压力的环境,你可以在这里模拟不同的对话场景,观察对话的进展,并获得有益的反馈。
然而,许多人并不满足于只与单一类型的 AI 代理互动,无论是 Meta AI、ChatGPT 还是其他流行的选择。他们渴望创造属于自己的内容。这就是我们 AI Studio 的发展方向。
这一切都是我们更大愿景的一部分,我们认为,人们不应该只与一个大型 AI 进行互动。我们相信,如果世界上存在更多这样多样化的内容,世界将变得更加美好和有趣。
黄仁勋:我认为这非常酷,如果你是一名艺术家并且拥有自己的风格,你可以将这种风格和你所有的作品集,微调成 AI 模型。现在,你可以向这个模型提出请求,让它根据你的艺术风格来创作。
你甚至可以提供一件艺术品,如一幅画或一个草图,作为灵感。我可以为你生成作品。你可以通过我的 AI 来获取这样的服务。
未来,每家餐厅、每个网站可能都会有这样的 AI。
扎克伯格:是的,我认为在不久的将来,就像现在每个企业都有一个电子邮件地址、网站和社交媒体账户一样,未来每个企业都会有一个 AI 代理来与客户互动。
历史上,一些事情一直很难实现。例如,考虑任何一家公司,客户支持通常是与销售分开的部门。这并不是作为 CEO 希望看到的工作方式,因为这两者需要不同的技能。
黄仁勋:你正在构建这些,你的客户支持似乎是关于,是的,显然我是。我的意思是,我记得作为 CEO 的 Mark 需要一些东西。我无法确定是什么,但他似乎并不是一个聊天机器人。
扎克伯格:不,嗯,我想这有点像是,是的。作为 CEO,你必须处理各种事务。但我的意思是,当你在组织中构建起这种抽象概念时,很多时候,像你这样的组织是分开的,因为它们各自优化了不同的事情。但理想的状况是,这些事情应该是一体的。作为客户,你其实并不关心这些。
无论是购买商品还是处理购买后的问题,你都不希望遇到不同的处理方式。你只希望有一个地方可以解答你的疑问,并以不同的方式与企业互动。我认为这也适用于客户服务。
与客户的每一次互动,尤其是他们的投诉,都有助于提升公司的品质。
黄仁勋:是的,你说得对。通过与这个 AI 的互动,我们可以捕捉到组织内的知识。这些互动数据可以用于分析,从而提升我们的服务等方面。
扎克伯格:是的,我认为这个业务版本在集成方面做得更多,我们目前还处于早期的测试阶段。但是 AI Studio 让用户能够创建自己的用户生成内容(UGC)代理和其他相关功能,并启动创作者创造它们的良性循环。我对这个项目感到非常兴奋。
黄仁勋:所以,我能否使用 AI Studio 来优化我的图片,我的图片集?
扎克伯格:是的,我们将会实现这个功能。
黄仁勋:然后我可以把我写过的所有内容都加载进去,基本上把它当作我的个人助理,好吗?每次我回来时,它都会重新加载记忆,记得我们上次对话停在哪里。然后我们可以继续对话,就像之前从未中断过一样。
扎克伯格:是的,你看,我的意思是,就像所有产品一样,它会随着时间的推移而不断改进。训练工具也会变得更好。这不仅仅是你想要它说什么。通常,创作者和企业都有他们想要避免的话题,我们在这方面会不断进步。
你知道,我认为理想的状况不仅仅是文本,对吧?你几乎希望能够做到更多。这有点像是与你正在进行的柯达头像工作的交叉。你基本上希望能够与代理进行几乎像是视频聊天一样的互动。
我相信我们很快就能实现这一目标。这些技术并不遥远,而且发展速度非常快,这让人感到非常兴奋。有很多新的内容等待我们去创造。
即使基础模型的进步现在停止了,但我认为这不会发生,我们仍然有大约五年的时间来进行产品创新,让整个行业学会如何有效地利用已经开发出的所有技术。
但实际上,我认为基础模型和基础研究的进展正在加速,现在是一个非常激动人心的时期。你的愿景,你知道,这一切,你都已经实现了吗?
黄仁勋:所以,感谢你在上一次对话中的支持。是的,你知道,作为 CEO,我们有时候会感到脆弱,我们需要很多鼓励和支持。
扎克伯格:我们现在已经相当坚韧了。我认为我们是这个行业中资历最深的两位创始人,对吧?这是事实。
黄仁勋:的确如此,的确如此。
扎克伯格:我只是注意到,你的头发已经变灰了,而我的只是变长了。
黄仁勋:我的头发变灰了,而你的变卷了,这是怎么回事?
扎克伯格:它一直都是卷的,这就是为什么我一直保持短发。
黄仁勋:是的,我只是想,如果我知道成功需要这么长时间,我可能就不会开始了。不,我会像你一样辍学。
扎克伯格:嗯,说实话,我们的性格差异很大。
黄仁勋:我认为在这些事情上,你有一个 12 年的领先优势,这非常不错。
扎克伯格:这确实很棒。你知道,你做得非常好。
黄仁勋:我会继续前行。就让我这样说吧。是的,我喜欢你关于这个愿景的想法,每个人都应该有一个 AI,每个企业都应该在我们的公司有一个 AI。我想让每个工程师和每个软件开发者都拥有一个或多个 AI。
我喜欢你的愿景的原因是,你也相信每个人和每个公司都应该能够创造自己的 AI。所以,当你开源 Lama 时,我认为这是非常棒的。
顺便说一下,Lama 2,我认为 Lama 2 可能是去年 AI 领域最重大的事件。
扎克伯格:关于那个原因,我的意思是,我原本认为是 H100,但你知道,这很遗憾。
黄仁勋:这是一个典型的“先有鸡还是先有蛋”的问题。是的,哪一个先来?
扎克伯格:H100,实际上,Llama 2 并不是基于 A100 的。
Meta 的开源哲学是什么?
黄仁勋:是的,它确实是 H100。是的,谢谢你。我之所以说它是最大的事件,是因为当它发布时,它激励了每一家公司、每一个企业、每一个行业。突然间,每个医疗保健公司都在建立 AI,每个公司都在建立 AI,无论是大型公司、小型公司还是初创公司都在建立 AI。
它使得每一个研究人员都能重新启动AI,因为他们有了一个起点来做事情。现在 3.1 已经发布。我想让你知道,我们共同部署了 3.1,大家都很兴奋。
我们正在将这项技术推广到全球的企业。这种兴奋程度非常高。我认为这将催生各种应用程序。但请告诉我你的开源哲学。你的观点是怎样的?
你开源了 PyTorch,现在它是进行 AI 的主要框架。现在你已经开源了 LMA 3.1 或 Lama。围绕它建立了一个完整的生态系统。我认为这非常棒,但这一切的起源是什么?
扎克伯格:是的,所以在很多方面都有丰富的历史。我的意思是,随着时间的推移,我们已经做了很多开源工作。我认为其中一部分,你只是坦率地说,我们是在其他一些科技公司之后开始建设的,或者像分布式计算基础设施和数据中心这样的东西。
而且,你知道,正因为如此,当我们建造这些东西的时候,它已经不是一个竞争优势了。所以我们就想,好吧,我们不妨将其开放,然后我们将从围绕它的生态系统中受益。我们有很多这样的项目。
我认为最大的影响可能是我们公布了服务器设计、网络设计,最终是数据中心设计。通过使这些成为行业标准,供应链几乎完全围绕它组织起来,这对所有人都有节省成本的好处。因此,通过开源,我们实际上节省了数十亿美元。
黄仁勋:开放计算使得我们为数据中心设计的 Nvidia hgx ISS 能够在任何数据中心运行。
扎克伯格:太棒了,这是一个非常棒的体验。然后我们用我们的一些基础设施工具做了这件事,比如 React PyTorch。所以我认为当 Llama 出现时,我们倾向于为 AI 模型做这件事。我想有几种方式可以看待这件事。
意思是,过去 20 年在公司里建造东西真的很有趣。其中最困难的事情之一是不得不处理我们通过竞争对手的移动平台发布应用的事实。
所以一方面,移动平台对整个行业来说是一个巨大的推动力,这非常棒。另一方面,通过竞争对手的平台来发布你的产品是有挑战性的。我也成长在一个时代,那时 Facebook 的第一版是在网页上,是开放的。
然后当它转向移动端时,好处是每个人都有一个计算机在他们的口袋里,这很棒。但缺点是,我们在可以做的事情上受到了更多的限制。
扎克伯格:所以当你观察这些计算时代时,有一种很大的近期偏见,每个人都只关注移动端,认为,好吧,因为封闭的生态系统,苹果基本上赢了,并设定了这些条件。
比如,是的,我知道实际上有更多 Android 手机,但苹果基本上占据了更大的市场份额。并且,所有的利润都集中在苹果身上。
在发展上,Android 基本上都在追随苹果。所以我认为苹果在这一代中显然是赢家,但情况并不总是如此。
如果你回顾过去,苹果在封闭系统方面有所作为。但微软,虽然它不是一个完全开放的公司,但与苹果相比,Windows 运行在所有不同的 OEM 和不同的软件、硬件上,形成了一个更加开放的生态系统。
在个人电脑时代,Windows 是领先的生态系统,可以看作是开放生态系统 1。我对下一代的计算抱有希望,那就是我们将会回到开放生态系统占主导地位的那个时代。
再次强调,总是会有封闭的和开放的两种选择。我认为两者都有其合理性,都有其好处。我并不是在这个问题上偏执。
我的意思是,我们确实会做一些封闭源代码的项目。我们发布的并不都是开源的。但我认为,对于整个行业正在构建的计算平台,尤其是软件开源,这将为整个行业带来巨大的价值。
因此,这确实影响了我对 AI 和 Llama,以及我们在 AR 和 VR 领域所做工作的看法。我们基本上是在为混合现实构建 Horizon OS,类似于 Android 或 Windows 的开放操作系统。
基本上,我们想让所有不同种类的设备都能工作。我们基本上只是想让生态系统恢复到那个水平,即成为一个开放的平台。
我对下一代技术持乐观态度,尤其是开放技术方面将取得胜利。我只是想确保我们有使用权。
这可能有点自私,但我的目标是,在接下来的 10 到 15 年里,确保我们能够构建我们用来构建社交体验的基础技术。
我想要构建很多东西,然后却被平台提供商告知“不,你不能真正构建它”,在某种程度上,我就想说“nah, fuck that”。为了下一代,我们想要从头开始建造,并确保它去向何方。
黄仁勋:我想是像,哔——
扎克伯格:你知道,我们做得还可以,至少可以骂 20 分钟。一提到封闭平台,我就会变得愤怒。
黄仁勋:所以,嘿,这真是太好了。我认为这是一个很好的世界,有人致力于构建尽可能好的 AI。他们构建它并将其作为服务提供给世界。
但如果你想构建自己的 AI,你也可以自己构建。所以完全使用 AI 的能力,你知道,有些东西我不喜欢自己制作夹克。我更喜欢有人为我制作这件夹克,你知道我的意思吗?
是的,但对我来说,皮革可以开源并不是一个有用的概念。但我认为你可以提供伟大的服务,令人难以置信的服务,同时保持开放性。这样我们就能拥有整个范围。
但你用 3.1 所做的真正伟大的事情是,你有 4 或 5B 的模型,70B 的模型,8B 的模型,你可以用它们来生成合成数据,用 LLM 模型来教授模型。虽然更大的模型会更通用,但它们也更不脆弱。
你仍然可以构建一个适合你所需的任何操作领域或操作成本的较小模型。你遇到了一个守卫,我认为是 Llama 守卫的护栏,非常棒。
因此,现在你建立模型的方式是透明的。你有世界一流的安全团队和伦理团队。你可以以这样的方式建立它,让每个人都知道它是如何正确建立的。我真的很喜欢这一点。
扎克伯格:是的,我想补充一下我之前被打断的观点。我认为我们的目标是一致的,我们正在建造它,因为我们希望它存在,我们希望它能从一些封闭的模型中脱颖而出。
但这不仅仅是一个你可以构建的软件。你需要围绕它建立一个生态系统。所以,如果我们没有开源,它几乎不会那样工作得很好,对吧?
我们这样做并不是因为我们很无私,即使我认为这对生态系统有帮助,我们也在这样做。我们认为这会使我们正在构建的东西通过一个坚固的生态系统变得更好。
黄仁勋:看看有多少人为 PyTorch 生态系统作出了贡献。是的,这完全正确。大量的工程工作,我的意思是,仅英伟达,我们就有几百人致力于让 PyTorch 变得更好、更可扩展和性能更高等等。
扎克伯格:是的,当某件事成为行业标准时,其他人会围绕它进行工作,对吧?所以所有的硬件和系统最终都会被优化,以便非常高效地运行这个东西,这会造福所有人,并且也会很好地与我们正在构建的系统协同工作。
我认为这只是这种方法如何变得非常有效的例子之一。所以,是的,我认为开源策略作为商业策略将会是一个好策略。我认为人们仍然没有完全理解这一点。
黄仁勋:我们非常喜欢它,围绕它建立了一个生态系统。我们建立了这个基础。
扎克伯格:是的,我的意思是,每次我们推出新产品,你们总是第一个发布并进行优化,使其正常工作。所以,我的意思是,我对此表示感激。
黄仁勋:但我能说什么呢?我们有优秀的工程师,不是吗?所以,嗯,你总是能更快地抓住这些事情。是的,你知道我是个老年人,但我很灵活。这就是 CEO 们必须做的。我认识到一个重要的事情,我也认为 Llama 真的很重要。
我们构建了这个概念,围绕 AI 建立了一个 AI 工厂,以便我们能够帮助每个人建立和获取 AI。对他们来说,拥有 AI 非常重要,因为这使得他们公司的机构知识得以编码和嵌入到 AI 中。
所以他们不能让这个 AI 飞轮、数据飞轮和经验飞轮在其他地方。开源使他们能够做到这一点,但他们真的不知道如何将这一切转化为 AI。
因此,我们创建了一个名为 AI found 的平台。我们提供工具、专业知识和技术支持。我们有能力帮助他们将所有这些内容转化为 AI 服务。
当我们完成时,他们可以带走并拥有它。它的输出被称为 Nim。这个 Nim,即推理微服务,用户只需下载并运行它,包括在预训练和微调环境中。
我们拥有一个完整的生态系统,包括 OEM 合作伙伴,他们可以运行 Nims,以及我们已培训并合作创建 Llama 的 GSI。
现在我们正在帮助全球企业进行这样的操作。我的意思是,这真的是一件非常令人兴奋的事情,是由 Llama 的开源引发的。
扎克伯格:是的,我认为特别帮助人们从大型模型中提炼出自己的模型将是一件非常有价值的新事物,就像我们在产品方面讨论的那样。
至少我不认为会有一个主要的 AI 代理,每个人都在同一水平上与之交流。我不认为会有一个模型被每个人使用。
黄仁勋:我们拥有芯片设计的 AI,软件编码AI,以及理解我们的软件编码 AI,因为我们使用 USD 为 Omniverse 项目编码。
我们还有理解 vlog 的软件 AI,我们的 verlo,以及理解我们 bug 并知道如何帮助我们分类 bug 并将它们发送给正确工程师的软件 AI。
所以每个 AI 都是从 Llama 衍生出来的,我们对其进行微调和设置护栏。如果我们有一个专门为芯片设计的 AI,我们不感兴趣问它关于政治和宗教等问题,所以我们设置了护栏。
因此,我认为每个公司将为它们拥有的每一个功能拥有 AI,他们很可能为这些功能构建 AI。他们需要帮助来实现这一点。
扎克伯格:是的,我认为未来人们将面临的一个问题是,他们将在多大程度上使用更大的、更复杂的模型,而不是只为他们的特定用途训练自己的模型。至少我会打赌,我们将看到大量不同模型的出现。
黄仁勋:我们使用的是最大的模型。原因是我们工程师的时间非常宝贵。所以我们现在使用的是 405B,这是为性能优化的。
正如你所知,405B 的规模太大,无法放入任何 GPU 中,无论其大小如何。这就是为什么英伟达性能如此重要的原因。我们的每个 GPU 都通过这种非阻塞开关连接。
例如,在 HGF 中,有两个这样的例子。我们使所有这些 GPU 能够协同工作,并运行 405B,性能卓越。
我们之所以这样做是因为工程师的时间对我们来说非常宝贵。我们想使用最好的模型,即使它的成本效益只高几美分,那又有什么关系呢?所以我们只是想确保给他们呈现最好的结果质量。
扎克伯格:是的,嗯,我意思是,4 或 5 的成本大约是 GPT-4o 模型推理成本的一半。所以,在那个水平上,它已经相当不错了。但是我的意思是,我认为人们正在设备上做些事情或想要更小的模型。
他们只是会提炼它。所以这就像 AI 运行的完全不同的服务集。
黄仁勋:假设我们雇佣那个 AI,用于芯片设计的 AI 可能每小时需要支付 10 美元,如果你经常使用它,并且与许多工程师共享这个 AI,那么每个工程师可能都有一个与他们坐在一起的 AI,成本并不高。我们付给工程师很多钱。
因此,对我们来说,每小时几美元可以显著提升某个非常有价值的人的能力。
扎克伯格:是的,我不需要被说服。
黄仁勋:如果你还没有雇佣过 AI,那就马上去做。这就是我们所说的全部。那么让我们谈谈下一波,下一波。你知道的,我真的很喜欢你们所做的工作之一,计算机视觉。我们内部经常使用的模型之一是将一切都分段。
而且你知道我们现在正在视频上训练 AI 模型,以便我们能够理解世界模型、我们的用例、我们的机器人和工业数字化的用例,将这些 AI 模型连接到全宇宙中,以便我们能够更好地建模和表示物理世界。
拥有在这些全宇宙世界中运作的机器人。更好的雷朋眼镜类应用程序,你将 AI 带入虚拟世界的愿景真的很有趣。告诉我们这件事。你可能知道,我们现在正致力于通过视频训练 AI 模型,目的是更深入地理解世界模型。
这包括机器人和工业数字化领域的应用案例。我们将这些 AI 模型与 Omniverse 平台相连接,以便更精确地模拟和呈现现实世界。
这样,我们就能让机器人在 Omniverse 的虚拟世界中顺畅地运作。你提到的雷朋的 Meta 类应用程序,以及将 AI 技术融入虚拟世界的创新愿景,都非常引人入胜。能否详细分享一下这方面的信息
扎克伯格:是的,好吧,这里有很多内容需要展开。你提到的第二个“任何模型”,我们实际上在 SIGGRAPH 的这个环节展示了它的下一个版本,名为 Anything two,现在它已经可以运行了。
它的速度更快,而且现在也能处理视频了。我认为这些图像实际上来自我在考艾岛的牧场上的牛。
黄仁勋:下次我们再这样做时,马克来到我家,我们一起做了费城奶酪牛排。
扎克伯格:下次你带来你做的东西,我更多的是扮演副厨师长的角色,但是天哪,那真的非常美味。非常棒。
黄仁勋:这是副主厨的评论。
扎克伯格:好的,听着,那天晚上快结束时,你问我说:“嘿,你吃够了吗?”我回答说:“我不知道,我还能再吃一些。”你很惊讶地问:“真的吗?”
黄仁勋:通常当你这么说的时候,我就会想,是的,我们确实在给自己增加更多的工作。
扎克伯格:还有一个。
黄仁勋:你吃饱了吗?通常你的客人会说,哦,是的,我很好。
扎克伯格:再来一首歌呗,Jensen。给我做一个奶酪牛排。
黄仁勋:所以让你知道他有多么强迫症。我转身准备奶酪牛排,对扎克伯格说:“切番茄。”然后我把刀递给了他。
扎克伯格:我切割东西非常精确。
黄仁勋:所以他开始切番茄,每一片都切得非常精确,每一片都严格到毫米。有趣的是,我本以为所有的番茄片会被切好并叠放在一起,就像一叠牌一样。
然而,当我转身时,他说他需要另一个盘子。原因是他切的所有番茄片,没有一片是相互接触的。一旦他把一片番茄从另一片番茄上分离开,它们就不再接触。
扎克伯格:听着,如果你希望番茄片相互接触,你应该早点告诉我。我只是个副厨师长,好吗?
黄仁勋:这就是为什么他需要一个不会评判的 AI。
扎克伯格:是的,这就像,所以这很酷。
黄仁勋:好的,所以它在识别牛的行踪,同时也在跟踪这些牛。
扎克伯格:是的,这非常有趣。利用这项技术可以创造出各种效果,而且因为它将对外开放,所以在工业领域将会有更多重要的应用。我的意思是,科学家们使用这些工具来研究珊瑚礁、自然栖息地,以及景观的演变等等。
但是,能够在视频中实现这一点,并且有 A/B 镜头,能够与之互动并告诉它你想要跟踪什么,这确实是非常酷的研究。
离全息眼镜还有一段时间
黄仁勋:假设你有一个仓库,里面装满了摄像头。仓库的 AI 正在监控一切活动。如果一堆箱子倒了,或者有人在地上洒了水,或者无论即将发生什么事故,AI 都能识别出来,生成文本描述,然后发送给相关人员。
这样,一旦发生紧急情况,帮助就会及时到来。所以,这是一种使用 AI 的方式,而不是简单地记录一切。
如果发生事故,它不是记录每纳秒的视频,然后返回并检索那个时刻,而是只记录关键信息,因为它专注于重要的事件。拥有一个能够理解视频的模型,一个视频语言模型,对于所有这些创新应用来说都是非常强大的工具。
那么,除了雷朋项目,你们接下来还计划做什么?跟我说说,对,还有那些智能课程,对吧?
扎克伯格:所以,当我们考虑下一个计算平台时,我们倾向于将其视为混合现实的世界。包括头戴设备、智能课程以及智能眼镜。
我认为人们更容易接受这个概念,因为今天几乎每个人都戴眼镜,而这些眼镜最终都会升级为智能眼镜。世界上有超过十亿人,这将会是一个巨大的变革。VRM 是指头戴设备,有些人可能觉得它对游戏或其他用途很有趣,而有些人则不这么认为。
然而,我认为智能课程和混合现实头戴设备都将存在于我们的世界中。我认为智能课程将类似于移动手机,是下一个计算平台的一种始终在线的版本。
而混合现实头戴设备则将像你的工作站或游戏机,当你需要更深入的沉浸式体验和更多的计算能力时使用。眼镜的体积非常小,因此在形态上有许多限制,就像你不能在手机上完成同样水平的计算一样。
黄仁勋:它恰好在所有这些重大突破和生成式 AI 技术出现的时候问世了。
扎克伯格:是的,所以对于智能眼镜,我们基本上是从两个方向着手解决这个问题。一方面,我们一直在研发我们认为是理想全息 AR 眼镜所需的技术。
我们正在进行所有定制硅芯片和显示堆栈的工作,这些都是为了让这种技术能够在眼镜中得以实现,对吧?
这并不是一个头戴设备,也不像 VR 或 MR 头戴设备。它们看起来像普通眼镜,但与你现在戴的眼镜相比,还有一定的差距。
我的意思是,那些眼镜虽然非常薄,但即使是雷朋和我们生产的,目前也还不能将实现全息 AR 所需的所有技术都集成进去。
不过,在未来几年里,我们将越来越接近这个目标。我认为我们会更接近实现它。这个产品仍然会相当昂贵,但我想它将开始成为一个实际的产品。
我们解决这个问题的另一个方法是,从设计精美的眼镜开始,与世界顶尖的眼镜制造商合作。他们拥有众多知名品牌,比如雷朋、Oakley、Oliver Peoples 等。我们与他们合作开发雷朋眼镜,目前我们已经进入第二代产品。
我们的目标是,首先,将智能眼镜的设计限制为美观大方。然后在这样一款眼镜中,我们尽可能多地集成技术,尽管我们知道可能无法完全达到理想的技术集成状态。
但最终,它将是一款看起来非常棒的眼镜。目前,我们已经集成了相机传感器,所以你可以拍照和录视频。我甚至可以直播 Instagram,你可以在 WhatsApp 上进行视频通话,并将画面实时传输给对方。它还配备有麦克风和扬声器。
所以,我的意思是,扬声器实际上非常出色。它是开放耳式的设计,很多人觉得比耳机更舒适。你可以用它来听音乐,这就像是一种私人体验,非常受欢迎。人们也喜欢用它来接听电话。
但后来我们发现,那个传感器套件恰好是我们与 AI 交流所需的关键。这有点像是意外的收获。如果你五年前问我,我们会先实现全息 AR 还是 AI?我可能会说,AI 可能会先实现,对吧?
我的意思是,这一切就像是虚拟和混合现实技术的进步,以及显示技术的进步。我们正在持续朝着这个方向取得进展。
然后,在实现全息 AR 之前,我们取得了 LLDS 技术的突破,这让我们拥有高品质的 AI,并且其发展速度非常快。这有点出乎我的意料。幸运的是,由于我们一直在开发各种不同的产品,我们现在处于一个非常好的位置。
但我想最终你会看到一系列不同价格点和不同技术水平的潜在眼镜产品。所以,基于我们现在对雷朋眼镜的观察,我猜测在 300 美元价格点上,无显示 AI 技术将是一个非常成功的产品,最终可能有数千万甚至数亿人使用。
你将拥有一个非常互动的 AI,可以与之交流。
黄仁勋:是的,正如你刚才展示的,你拥有视觉语言理解能力。你还具备实时翻译功能。因此,你可以使用一种语言与我交流。
扎克伯格:当我听到另一种语言时,显示效果当然也会非常好。但这也会给眼镜增加一些重量,并使其价格更高。
因此,我想对于很多人来说,他们可能更喜欢全息显示的眼镜。但同时,也会有许多其他人,他们希望最终能拥有像非常薄的眼镜一样的产品,无论是工业应用、工作应用,还是消费者产品。你这么认为吗?
是的,我的意思是,我在疫情期间一直在思考这个问题,当时每个人都在远程工作了一段时间。就像你在 Zoom 上花费了所有的时间。
虽然我们现在有了这些技术,但在未来,我们不会离得太远,就能实现虚拟会议,比如,虽然我不在物理位置上,但我的全息图可以出现,让人感觉我们都在同一个地方,就像我们物理上都在场一样。
黄仁勋:我们可以合作开展某项工作,但我认为这对于 AI 用户来说将尤为重要,因为可以与一个不必随时佩戴的设备一起生活。
扎克伯格:是的,但我想我们最终会实现这一点。在眼镜设计中,有更薄的框架和更厚的框架,还有各种风格。
但我想,我们离拥有全息眼镜还有一段时间。不过,我认为在一副时尚的、更厚框架的眼镜中实现这一点并不遥远。
黄仁勋:现在的太阳镜设计确实有些偏大。我注意到了这一点。是的。
扎克伯格:你知道吗,这是一种非常有用的风格。
黄仁勋:这非常有帮助。
扎克伯格:你知道,我正在努力成为一个风格影响者,这样我就能在眼镜上市之前对其产生影响。
黄仁勋:但是,你知道,你现在开始参与影响工作,这还处于初期阶段。
扎克伯格:是的,这还处于初期阶段,但我感觉,如果业务的未来将包括制造人们佩戴的时尚眼镜,那么这可能是我需要开始更加关注的事情。
所以,是的,我们将不得不改变我每天穿同样衣服的形象。我的意思是,这也是关于眼镜的一个特点。我认为这和手表或手机不同,人们真的不想看起来都一样。
而且,我认为这将是一个平台,我认为它将自然地成为一个开放的生态系统。因为我们之前谈论的主题是,人们将要求的眼镜形式和风格的多样性将是巨大的。
这不像每个人都不想戴上其他人设计的一种特定款式的眼镜。我不认为这种单一风格的产品会受到欢迎。
黄仁勋:是的,我认为你说得对。Mark,我们正经历一个令人难以置信的时期,整个计算堆栈正在被重新发明,我们思考软件的方式也在变化。你知道 Andre(Andre Karpathy)将软件分为 1.0 和 2.0,
现在我们基本上已经进入了软件 3.0 时代。从通用计算到生成性神经网络处理,我们计算的方式发生了根本变化,我们现在能够开发的应用程序和能力在过去是不可想象的。
这项技术,生成式 AI,是我所见过的影响消费者、企业行业和科学速度最快的技术之一。它能够跨越从气候技术到生物技术再到物理科学的各个领域。
生成式 AI 正处于这些领域根本转变的核心。此外,正如你所谈论的,生成式 AI 将在社会中产生深远的影响,我们正在制造的产品就是证明。
我特别兴奋的一件事是,有人之前问过我,是不是会有一个名为“Jensen AI”的产品。这正是你提到的创造性 AI,我们只是构建自己的 AI。
我将自己写的东西加载进去,并根据我回答问题的方式进行微调。希望随着时间的推移,这款 AI 能成为许多人提问或交流想法的优秀助手和伴侣。
这将是 Jensen 的一个版本,就像你之前提到的那样,它不会评判。因此,你不必害怕被评判,可以随时与它互动。但我认为这些事情真的很惊人。我们经常写很多东西。
给它三个或四个主题的价值是什么?现在,这些是我想要写的基本主题,用我的声音写,把它作为一个起点。所以现在我们可以做很多事情。
与你一起工作真的很棒,我知道建立一家公司并不容易,你的公司从桌面转向移动,再到 VR,再到 AI,所有这些设备。这真的很,真的很,真的很了不起。
英伟达也多次转型,我知道这样做有多困难。我们都失败了很多次,但这就是想要成为先锋和创新的代价。所以看到你的成就真的很棒。
扎克伯格:同样,我认为这不仅仅是一个转型。如果你继续做你以前做的事情,但同时也在增加新的内容。我认为这一切都有更多的篇章。
观看你们走过的旅程非常有趣。我们经历了一个时期,当时每个人都认为,不,一切都将转移到这些设备上,计算将变得非常便宜。但你们一直坚持着,继续前进。
就像,不,就像实际上一样,你将进入这些可能瘫痪的大系统。是的,不,而且,我的意思是,是的,我们去了。
黄仁勋:实际上,你正在走向这些大型系统,它们可以提供强大的计算能力。是的,我们确实曾经专注于制造越来越大的设备,而不是更小的。这在当时可能看起来有点过时,但现在看来非常酷。
我们开始建造图形处理单元(GPU),现在当你部署 GPU 时,仍然称之为 H100。扎克伯格在他的数据中心使用了大量的 H100,我听说数量接近 60 万。
扎克伯格:我们也是他的好客户,这就是我在 SIGGRAPH 获得 Jensen QA 的原因。
黄仁勋:哇,等一下。我正在得到马克·扎克伯格的 QA,你是我的客人,我想确保有一天打电话给你,你说:“嘿,你知道,几个星期后,我们在 SIGGRAPH 有一个活动。”。
扎克伯格:我说:“是的,那天我想我没有安排任何活动。我飞往丹佛。” 听起来很有趣,确实如此。
黄仁勋:我那天下午没有安排任何活动,只是你突然出现在那里。但这些系统非常令人惊叹,你们建造的这些系统非常庞大,组织起来非常困难,运行起来也非常困难。
你知道,你说你比大多数人晚进入旅程,但你操作的规模比大多数人都要大。这一切都令人惊叹。祝贺你取得的一切成就。你现在是一位真正的时尚偶像。现在看看舞台上的工作,正在努力进行。这是女士们和先生们。
扎克伯格:谢谢。互换夹克,下一次还要送金链
黄仁勋:等等,让我说完。你知道,你知道,上次我们晚餐后聚在一起时,我和 Mark 进行了“球衣交换”,我们拍了一张照片,结果这照片变得非常受欢迎。
现在,我想他穿我的夹克没什么问题。我不知道,这是我的风格吗?我不认为我应该穿成这样,对吗?
扎克伯格:是的,实际上,我为你做了一个。
黄仁勋:你做到了。是的,那个是标志性衣服。
扎克伯格:我的意思是,嘿,让我们看看。我们这里有一个盒子,它是黑色的,用皮革和羊毛皮做的。这不是我做的,我只是在线订购的。
黄仁勋:等一下,这里有点冷。
扎克伯格:我想这是我的善良。我的意思是,这是一个氛围,你只需要这是漂亮的吗?
黄仁勋:我是说,给这个人一个链条。好吧,下次我见到他时,我会给你带来一个金链。公平就是公平,对吧?
所以我想让你知道,我告诉每个人,Laurie 为我买了一件新夹克来庆祝今年的 SIGGRAPH。
SIGGRAPH 是我们公司的一件大事。正如你所想象的,RTX 是在这里发布的,这里发布了很多令人惊叹的事情。
这是一件全新的夹克。哇,我想我们又进行了一次“球衣交换”。
扎克伯格:好吧,你的这件衣服显然更值钱,因为它是被穿过的。
黄仁勋:让我们看看,我不知道。我认为 Mark 很强壮。这个家伙很强壮。
扎克伯格:我的意思是,你也是,伙计。
黄仁勋:好的,好的,谢谢大家,先生们,祝马克·扎克伯格在 SIGGRAPH 上玩得开心。
直播链接:https://www.nvidia.com/en-us/events/siggraph/
本文来自微信公众号:APPSO,作者:AppSo
支持一下 修改