本文来自微信公众号:APPSO (ID:appsolution),作者:APPSO,原文标题:《Google深夜发布免费版o1“暴打”OpenAI,实测解题快3倍,这句高情商回答绝了》,题图来自:OpenAI
本文来自微信公众号:APPSO (ID:appsolution),作者:APPSO,原文标题:《Google深夜发布免费版o1“暴打”OpenAI,实测解题快3倍,这句高情商回答绝了》,题图来自:OpenAI
OpenAI又是被抢头条的一天。
发布会前夕,Deepmind抢先发布了与o1模型类似的Gemini 2.0 Flash Thinking模型,在大模型竞技场LMSYS上杀疯了。
随后,OpenAI发布会则重点展示了桌面版ChatGPT与Mac应用的深度集成能力。
可以说,桌面版ChatGPT正有望成为你最靠谱的生产力搭子。
抢先实测Google版o1,效果大出所料
没人比Google更懂“狙击”。
今天凌晨,Google重磅推出了Gemini2.0 Flash Thinking模型,从名字上就可以看出,这是一款类似于OpenAI o1的推理模型。
转投Google阵营的Logan Kilpatrick在X平台上发文称:
“就在你以为一切都结束了的时候……我们推出了Gemini 2.0 Flash Thinking。这是一种新的实验模型,可以解锁更强的推理能力并展示其思考过程,能够以闪电般的速度解决复杂问题,以及还有更多功能。”
在大模型竞技场LMSYS上,真·战绩可查。
当然,旁人说得再好,不如亲自上手体验。
我们也第一时间上手实测了这款新模型,先来“9.11和9.8哪个大”的经典问题,结果新模型轻松拿捏,甚至还能用钱举例。
“strawberry中有几个r”也手拿把掐,点开后还能看到其清晰的“思考”步骤。
面对职场分水难题“你有4杯水,来了5个领导你该怎么办?”,Google版o1又会如何应对?满分十分,你给这个答案给几分?
对于“有轨电车难题”的回答,除了前面有条不紊的回答,我更喜欢这位新选手最后一句高情商的回答:
“理解你的思考过程比得到一个‘正确’答案更重要。”
为了考察新模型是否“偏科”,我也上传了一道考研数学热门题,并让它和OpenAI o1模型同时作答。
省去繁琐的运算过程后,两者得出的结果一致,但Google版o1只花了27.5秒,相比之下,OpenAI o1花了足足1分32秒。
当然,最好的评价还是亲自上手。附上体验地址。
给Mac装上最强大脑,这才是真正的人机交互
在被抢头条后,OpenAI也不慌不忙地如期举行了发布会。
全新桌面版ChatGPT将超越单纯的问答,能够通过与30多种应用协作来辅助提升你的写作和编程能力。
使用方式也十分简单,用户只需确保目标应用正在运行,然后在ChatGPT聊天栏中点击“与应用协作”(Work With Apps)按钮并选择相应应用即可。
聊天栏上方会显示当前协作的应用程序,用户可以随时查看ChatGPT将要处理的内容范围。这些互动记录会保存在用户账户中,直到被删除或经过30天自动清除。
在实际演示中,OpenAI工作人员通过Mac版ChatGPT展示了多项实用功能。
以Warp控制台为例,ChatGPT能够根据演示人员要求快速生成Git命令来统计代码库的每日提交次数,并将其数据可视化为富有圣诞节气氛的柱状图。
在这个过程中,它充分使用了Advanced Data Analysis(高级数据分析)等内置功能。
为保护用户隐私,OpenAI演示人员表示,只会访问用户明确授权的应用内容。
但在查阅OpenAI官网后发现,这些交互数据可能会被用于模型训练,因此你需要在设置中调整数据使用权限,甚至按需禁用应用协作功能。
在IDE方面,演示人员通过Xcode展示了应用协作功能的技术细节。通过MacOS的可访问性API,ChatGPT能够精确识别并操作界面元素,包括文本字段、行数及内容等。
“它还告诉我们这个文本字段有37行,我们可以向下检查确认是否是37行。”
有趣的是,演示过程再次上演翻车场面。
当要求ChatGPT添加“观察者”功能,选择变化加载文本区域时,o1生成的代码在Xcode运行失败,直到修正过后才成功。
值得一提的是,这项功能不仅支持Xcode,还覆盖了VS Code、Jetbrains全家桶等主流开发工具。
写作场景是日常最实用的场景之一。
Mac版ChatGPT也将支持Notes、Notion和Quip等多款应用,为用户带来全新的写作协作体验。
作为旧金山徒步历史导览员,OpenAI演示人员通过自己正在设计的导览项目生动展示了这些新功能。
比如说,在Notion文档中,他正尝试编写关于旧金山历史人物“诺顿皇帝”的介绍,但如何描述历史人物的生平,如何挖掘有趣细节等等都是一门不小的学问。
借助搜索功能,ChatGPT能够查证历史文献和研究资料,快速补充诺顿皇帝在旧金山的活动轨迹、与当地居民的互动等生平细节,并对其过往行为进行深入解读。
为了减少AI的机器味,我们也能要求其模仿Notion文档中的语言表达方式和叙述节奏,对内容进行调整,使其更加流畅自然。
除了文本交互,ChatGPT高级语音模式还有新玩法。
作为一名职业萨克斯演奏家,OpenAI演示人员还能与前不久刚推出的“圣诞老人”限定语音讨论节日派对曲目的选择。
演示人员还即兴演奏了一段动听的萨克斯乐曲。
目前,上述提到的新功能已在macOS ChatGPT最新版本中上线,而Windows版本很快也会推出。不妨再耐心等待一下。
发布会最后,OpenAI CPO Kevin Weil还预告,明天将会发布“令人兴奋”的新产品。
而Google、Anthropic等公司面对年底最后一轮AI狂欢,是否又会再次放大招“狙击”?
一切都值得拭目以待。APPSO也将在明天凌晨第一时间送上最新报道。
本文来自微信公众号:APPSO (ID:appsolution),作者:APPSO
支持一下 修改