本文来自微信公众号:极客公园 (ID:geekpark),作者:Li Yuan,编辑:郑玄,题图来源:视觉中国
本文来自微信公众号:极客公园 (ID:geekpark),作者:Li Yuan,编辑:郑玄,题图来源:视觉中国
北京时间12月6日凌晨两点,OpenAI正式开启了自己的连发彩蛋项目——12天连续直播,发布12项新功能或者彩蛋功能。
这是一种OpenAI新创造的发布形式,之前没有大科技公司以直播形式连续发布新功能。大家普遍猜测,在这12天的发布中,会出现新的模型,或者年初就已经预告过的Sora视频功能。
今天,彩蛋第一发的谜底正式揭晓,OpenAI在第一天的直播中发布了新的o1模型。
在三个月前的发布会上,OpenAI公布的o1模型,版本名为o1-preview,即o1预览版,而今天,OpenAI正式发布了o1的完整版。
o1比起o1-preview,本身更加智能,同时能够根据不同回答的难度,调节响应的速度。除此之外还o1模型还增加了识别图片的功能。不过浏览网页的功能和上传文件的功能,仍然没有加入。
除此之外,这次的发布会,还肯定了一个几个月之前的“谣言”——OpenAI真的推出了一个200美金的模型付费版本,ChatGPT Pro。
在ChatGPT Plus版本里,模型的使用仍然有限制时长和次数,而进入200美金一个月的Pro版本,所有高阶模型的使用,包括高级语音模式的使用,将不再有任何限制。
Pro版本中,还提供了一个o1模型的Pro版本。使用o1模型的pro版本,将使模型结果的可靠性有小幅提升。对于大多数用户而言,这样的小幅提升可能作用不大,但是对于愿意花200美金一个月使用GPT的用户而言,这样的小幅提升或许也是可贵的。
发布会的具体信息如下:
o1模型完整版:更快,支持图片输入
在今天的发布会后,o1模型将正式取代o1-preview模型,推送给ChatGPT Plus的用户和最新推出的ChatGPT Pro的用户。
o1模型相比于o1-preview主要有几个特征:
1. 基础智能能力有所提升,尤其是编程能力
发布会上,Sam Altman再次以模型解决数学竞赛题、编程竞赛题和博士级别的科学问题的能力,来展现新模型的水平。
可以看到o1的水平比起o1-preview本身还是有不少进步。
OpenAI特意强调,基础智能能力的进步,会让模型的日常表现也更好,而不只是在解决非常困难的数学和编程问题上会有进步。
OpenAI的测试显示,o1模型比o1预览版出现重大错误的概率低了大约34%。
2. 响应速度更智能,简单问题响应速度更快
在o1-preview发布后,很多用户的一个反馈是“慢思考”确实还是太慢了。即使是和模型提一个简单的问题,o1-preview也要思考很久。
以笔者为例,因为没有太多博士级别的问题要咨询ChatGPT,事实上最后还是使用快速响应的4o模型的时间居多。
在新的模型中,OpenAI试图解决这个问题。现在如果你向o1提一个简单的问题,它会更快地回答。只有在提真正困难的问题时,它会花更长的时间来思考。
在演示中,OpenAI的研究人员向模型提了一个问题:列出公元2世纪罗马帝国的统治者,包含其在位时间和成就。
可以看到相较于一般来说会直接回答的4o模型,o1模型的反应速度仍然偏慢,大约使用18秒左右对这个问题进行了回答,但是比起o1-preview模型,其思考速度提升了60%。
OpenAI的人工研究显示,总的来说o1模型的思考速度较之o1-preview提高了约50%。
3. 多模态图像识别
o1-preview的一大特点是,基本上除了文字交流,没有其他的交流方式。
在o1中,这个问题得到了部分解决。目前o1模型可以识别图像。
在演示中,OpenAI研究员上传了一张手绘的热力学草图,o1能够从草图中识别一些具体的数据,并进行了多模态的推理。
不过一些对于高阶用户可能很重要的功能,目前仍然在开发中,包括网页浏览、文件上传、结构化输出、函数调用(function call)等。
4. o1尚未推出API版本
o1模型的API使用也还没有推出。不过可见的是,未来将会推出一个有图形理解功能的API调用接口。
200美金的Pro模式能干什么?
之前,就有媒体爆料过OpenAI将推出200美金一个月的Pro版本。在当时看来,200美金是一个相对天方夜谭的价格。
不过目前看来,OpenAI对于Pro版本的用户的定位还是很清晰的。Pro版本不针对普通用户,而主要针对一些对于模型使用非常看重的高阶用户。
200美金的Pro模式可以无限制使用各种高阶模型,包括o1和高级语音模式。目前笔者的高级语音模式每天只能使用1小时,如果希望24小时使用的话,似乎只能开24个账号,与此相比,似乎还是Pro模式更划算一些。
除此之外,Pro模式也能使用o1模型的pro版本,将使模型结果的可靠性小幅提升。
OpenAI公布的数据结果如上。只能说聊胜于无?不过确实有一种VIP待遇的感觉在里面。
有多少用户最后会为AI工具付费200美金一个月呢?这个数据其实还是很值得期待的。这标志着人们到底愿意为世界上最聪明的大模型付费多少。是不是一个最聪明的大模型,已经值得一个廉价实习生的工资了呢?
接下来,OpenAI还将在12天的发布中发布哪些内容,也值得期待。不过看到第一天的发布后,笔者对发布Sora模型的期待值并不高。
模型的算力成本仍然是一个巨大的问题。以OpenAI的资金雄厚程度,都需要发布200美金一个月的Pro模式来打平高阶模型的算力成本。Sora模型如果能够发布,又需要多贵的会员费才能支撑起模型使用呢?
支持一下 修改