Google深夜发布免费版o1,“暴打”OpenAI
2024-12-20 09:46

Google深夜发布免费版o1,“暴打”OpenAI

本文来自微信公众号:APPSO (ID:appsolution),作者:APPSO,原文标题:《Google深夜发布免费版o1“暴打”OpenAI,实测解题快3倍,这句高情商回答绝了》,题图来自:OpenAI

文章摘要
Google推出Gemini 2.0,挑战OpenAI ChatGPT。

• 🚀 Google发布Gemini 2.0,推理速度快3倍

• 🖥️ OpenAI推出桌面版ChatGPT,提升生产力

• 🎵 ChatGPT新增语音模式,支持多应用协作

OpenAI又是被抢头条的一天。


发布会前夕,Deepmind抢先发布了与o1模型类似的Gemini 2.0 Flash Thinking模型,在大模型竞技场LMSYS上杀疯了。


随后,OpenAI发布会则重点展示了桌面版ChatGPT与Mac应用的深度集成能力。


可以说,桌面版ChatGPT正有望成为你最靠谱的生产力搭子。



抢先实测Google版o1,效果大出所料


没人比Google更懂“狙击”。


今天凌晨,Google重磅推出了Gemini2.0 Flash Thinking模型,从名字上就可以看出,这是一款类似于OpenAI o1的推理模型。



转投Google阵营的Logan Kilpatrick在X平台上发文称:


“就在你以为一切都结束了的时候……我们推出了Gemini 2.0 Flash Thinking。这是一种新的实验模型,可以解锁更强的推理能力并展示其思考过程,能够以闪电般的速度解决复杂问题,以及还有更多功能。”


在大模型竞技场LMSYS上,真·战绩可查。



当然,旁人说得再好,不如亲自上手体验。


我们也第一时间上手实测了这款新模型,先来“9.11和9.8哪个大”的经典问题,结果新模型轻松拿捏,甚至还能用钱举例。



“strawberry中有几个r”也手拿把掐,点开后还能看到其清晰的“思考”步骤。



面对职场分水难题“你有4杯水,来了5个领导你该怎么办?”,Google版o1又会如何应对?满分十分,你给这个答案给几分?




对于“有轨电车难题”的回答,除了前面有条不紊的回答,我更喜欢这位新选手最后一句高情商的回答:


“理解你的思考过程比得到一个‘正确’答案更重要。”





为了考察新模型是否“偏科”,我也上传了一道考研数学热门题,并让它和OpenAI o1模型同时作答。


省去繁琐的运算过程后,两者得出的结果一致,但Google版o1只花了27.5秒,相比之下,OpenAI o1花了足足1分32秒。





当然,最好的评价还是亲自上手。附上体验地址


给Mac装上最强大脑,这才是真正的人机交互


在被抢头条后,OpenAI也不慌不忙地如期举行了发布会。


全新桌面版ChatGPT将超越单纯的问答,能够通过与30多种应用协作来辅助提升你的写作和编程能力。



使用方式也十分简单,用户只需确保目标应用正在运行,然后在ChatGPT聊天栏中点击“与应用协作”(Work With Apps)按钮并选择相应应用即可。


聊天栏上方会显示当前协作的应用程序,用户可以随时查看ChatGPT将要处理的内容范围。这些互动记录会保存在用户账户中,直到被删除或经过30天自动清除。



在实际演示中,OpenAI工作人员通过Mac版ChatGPT展示了多项实用功能。


以Warp控制台为例,ChatGPT能够根据演示人员要求快速生成Git命令来统计代码库的每日提交次数,并将其数据可视化为富有圣诞节气氛的柱状图。



在这个过程中,它充分使用了Advanced Data Analysis(高级数据分析)等内置功能。


为保护用户隐私,OpenAI演示人员表示,只会访问用户明确授权的应用内容。


但在查阅OpenAI官网后发现,这些交互数据可能会被用于模型训练,因此你需要在设置中调整数据使用权限,甚至按需禁用应用协作功能。



在IDE方面,演示人员通过Xcode展示了应用协作功能的技术细节。通过MacOS的可访问性API,ChatGPT能够精确识别并操作界面元素,包括文本字段、行数及内容等。


“它还告诉我们这个文本字段有37行,我们可以向下检查确认是否是37行。”


有趣的是,演示过程再次上演翻车场面。


当要求ChatGPT添加“观察者”功能,选择变化加载文本区域时,o1生成的代码在Xcode运行失败,直到修正过后才成功。



值得一提的是,这项功能不仅支持Xcode,还覆盖了VS Code、Jetbrains全家桶等主流开发工具。


写作场景是日常最实用的场景之一。


Mac版ChatGPT也将支持Notes、Notion和Quip等多款应用,为用户带来全新的写作协作体验。


作为旧金山徒步历史导览员,OpenAI演示人员通过自己正在设计的导览项目生动展示了这些新功能。



比如说,在Notion文档中,他正尝试编写关于旧金山历史人物“诺顿皇帝”的介绍,但如何描述历史人物的生平,如何挖掘有趣细节等等都是一门不小的学问。


借助搜索功能,ChatGPT能够查证历史文献和研究资料,快速补充诺顿皇帝在旧金山的活动轨迹、与当地居民的互动等生平细节,并对其过往行为进行深入解读。


为了减少AI的机器味,我们也能要求其模仿Notion文档中的语言表达方式和叙述节奏,对内容进行调整,使其更加流畅自然。



除了文本交互,ChatGPT高级语音模式还有新玩法。


作为一名职业萨克斯演奏家,OpenAI演示人员还能与前不久刚推出的“圣诞老人”限定语音讨论节日派对曲目的选择。



演示人员还即兴演奏了一段动听的萨克斯乐曲。



目前,上述提到的新功能已在macOS ChatGPT最新版本中上线,而Windows版本很快也会推出。不妨再耐心等待一下。


发布会最后,OpenAI CPO Kevin Weil还预告,明天将会发布“令人兴奋”的新产品。


而Google、Anthropic等公司面对年底最后一轮AI狂欢,是否又会再次放大招“狙击”?


一切都值得拭目以待。APPSO也将在明天凌晨第一时间送上最新报道。


本文来自微信公众号:APPSO (ID:appsolution),作者:APPSO

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定