题图来自:AI生成
题图来自:AI生成
近期,在GPT-4o创造的新范式影响下,月暗、智谱、Perplexity和OpenAI相继上线了AI搜索推理功能。
与此前“大海捞针”不同,最近更新中AI搜索长了“脑子”,在面对问题时,能像人一样先拆解步骤,再精准搜索,最后呈现答案。
根据“知识管理模型”,数据本身无序且缺乏意义,只有向上进化为信息、知识、智慧才能具备价值。信息解决了“What”的问题,知识解决了“How”的问题,金字塔最顶端的智慧应对了“Why”的问题。以此进化逻辑来看,CoT(思考链)加持下的AI搜索已经开启了2.0时代,从信息聚合走向规律总结和辅助决策。
用户对AI搜索的依赖程度超出了预期,Perplexity宣称其每周能处理1亿次查询,每月能处理约4亿次。从巨头手中抢夺用户还远远不够,更重要的是,AI搜索在商业化上释放出了积极信号。国外最新报告显示,随着AI搜索的发展,谷歌搜索广告市场份额十年来首次跌破了50%。
无论新老玩家,都盯上了谷歌们留出来的“蛋糕”。目前有两种路径,一种是效仿谷歌做通用型AI搜索工具,向C端售卖使用权,向B端出售广告席位和创建AI搜索能力;另一种以应用为载体,将AI搜索能力嵌入场景中,欲绕过搜索引擎中间商,自建分发渠道和数据入口。既能通过搜索优化用户使用体验感,提升付费可能性,也能防止中间商赚差价,增强盈利能力。
月暗大搞饥饿营销,疯狂上分,怒刷“国内首个4o搜索”存在感;靠Talkie赚到回头钱的Minimax,将精力放在了AI应用的搜推上;就连一向温吞慢热的微信也在求变,灰测AI问答功能,打通混元与微信间的生态。
“越是共识,门槛越高”,有业内人士认为,正是由于普遍看好AI搜索,才加大了竞争,“如果不突出,还是选谷歌”。
搜索+深度推理=?
深度推理模式下的AI搜索对拆解、分析能力的需求,远远超越了“搜”这个动作本身,搜推的底层逻辑嵌套在了寻找和解决问题答案的过程中。
结合Perplexity和Kimi的使用体验,AI搜索推理模式的基本过程如下:提出一个可能涉及大量搜索和多个意图的问题,针对该问题AI不急于回答,而是先解题,将一个复杂的指令拆解成几个步骤,然后依次完成“搜索+分析”动作,最后才是呈现答案。
以前的AI搜索是“书呆子”,拿着关键词在题库里找,开卷作答。现在的AI是“机灵鬼”,在掌握解题思路后,依照解题步骤分点作答。而且整个解题是实时动态的,边思考边解答。
以Perplexity官方给出的case为例,提问是“阅读贝索斯每年所有股东信,并列出一个每年关键要点的表格”。为了解决问题,AI将其分解为了三步,分别为“搜索并找到贝索斯所有年度的股东信”“获取贝索斯每封股东信的内容”以及“制出贝索斯每年股东信关键要点表格”。如果使用Kimi探索版,会在答案生成完毕后再次搜索,完成“反思后的补充”。
“搜索+深度推理”可视为执行搜索任务的Agent,所以能看到AI给出的是可行性的操作步骤,而不是类似“贝索斯”“股东信”“要点”一类的搜索关键词。AI搜索的底层逻辑发生了变化,从“找到”转向了“解决”,“搜”这一动作变成了解决问题底下的子集。如果把搜索视为辅助解决问题的工具,那这个子集可以无限扩充,比如文档、知识库、PPT、办公软件等等,Agent工具的开放性和延展性为提升搜索质量埋下了伏笔。
当然就目前而言,搜索Agent有其无法克服的自身缺陷。
光子星球在测试中发现,当去过分强调搜索步骤的完整性时,就会发生过程正确,而结果错误的现象。这意味着单个CoT的链条没有问题,但是链与链之间的连接关系出现了错误。在某些问题中出现了“鬼打墙”,搜索和步骤拆解动作反复循环,这将是对算力的巨大浪费。
上述也提到好的解题思路大于搜索,当CoT代替RAG成为标配,更要警惕出现把简单问题复杂化的倾向。比如在一些经典的逻辑问题中,本来可以两步到位的问题,非要强行增加分析过程,反而增加了搜索的难度。CoT不是拿数量说话,而是构建的质量。
AI搜索进阶2.0
跳出单个功能语境,AI搜索离解决问题又进了一步。
搜索筛选出的内容有维度之分,最底层是信息,互联网时代的搜索是通过关键词来匹配到信息池,具体怎么找还要靠用户手动点击进行页面筛选。AI搜索最先填补了上面的断裂,联网的AI可以在自行搜索后,得到确定而非模糊范围的答案。
但这个阶段,用户的感知非常明显,ChatGPT等助手只能回答类似于4W的问题,“谁、什么、何时、何地”。聚合的好处是不用打开N个网页,来了解某个事物的最基本情况,通过prompt以上的构成要素可以随意组合。此时,限制AI搜索是否好用的关键是搜索量,即搜索的范围越大,所能涵盖的4W越全面,也能靠量提升准确性。
知识在信息的基础上进一步被提炼出来,它涉及到对信息的深度理解和处理,是通过大量搜索、对比后发现的规律、趋势。智慧是知识的进一步升维,是运用规律后的指导决策和执行。
2.0阶段的AI搜索处于知识与智慧中间,例如可以追加提问“贝索斯经常提到的关键词”“贝索斯提到的关键点对亚马逊发展产生了怎样影响”等问题。也可以上传《孙子兵法》文档,让AI提出亚马逊发展建议。以上都脱离了4W层面,来到了How、Why问题的探讨。正是因为搜索处理信息维度升高,其价值才水涨船高。
就目前而言,开卷考试和自主思考两种搜索方式的差距并不大,同样的问题用关键词搜索也能获取差不多水平的答案。从信息到智慧,AI 2.0搜索押注的是长期价值,但鉴于目前后训练推理投入不充分,这仍需时间。
除了CoT方式,AI搜索也有其他增强方式。信息搜索是地基,基于此衍生出三条思路,一是扩大搜索量和范围。Kimi探索版的搜索量是普通版的十倍,一次搜索可精读超过500个页面。
Kimi探索版产品负责人曾下过一个结论:“如果 Kimi搜不到的信息,那大概率用户也很难自己通过传统搜索引擎找到”。其潜台词充满了对Kimi搜索量的自信,但也忽略了一个问题,“全”不能与“准确”“优质”划等号。
这就诞生了第二条思路,优质化搜索。核心是提前过滤冗余、低质的信息,确保搜索池质量的基础上再开发搜索能力。相当于建立了一个搜索漏斗池,顶部是未经筛选的信息,第二层按照AI搜索公司或用户定制标准进行过滤,第三层进一步细分,比如关联性强弱、相似程度、优先级等,将重新分配信息的把关权、分发权。
最后一种是直接补充信息来源,因为无论怎么在数量、质量上做取舍,都可能不符合用户预期。如果这样,不如让用户自己上传数据和文本。
瓜分“谷歌”,人人有份
传统搜索退,AI搜索进,趋势日益凸显。当下,AI搜索成为了必争之地。
招聘信息显示,AI六小虎中重押AI搜索推理方向的是月暗,大量涉及推理和工程优化方向的岗位显示在招。Minimax同时也在招聘搜索推荐相关的工程师,但思路有所差异,聚焦在旗下AI应用里的算法、广告投放优化。
(来源:招聘平台)
谁也不知道留给新玩家的窗口期有多久,尽快吞下显现出的“蛋糕”迫在眉睫。此前积累的用户规模和留存沦为了AI搜索的“饵”,到了广告变现时刻。据悉,Perplexity即将在本季度在其应用内投放广告,可投放广告位有“问题回答”的媒体赞助,搜索答案下方的“相关问题”以及”显眼位置“的视频投放。
(来源:Perplexity、Kimi)
参照Perplexity,Kimi探索版一改免费版界面,新增搜索展示页面,预留广告招商位。Kimi本身免费使用,其公司月暗也没有其他业务,投流、算力、人力成本的投入急需输血,To B广告商收入是选择项之一。
“二次售卖”达成的前提是将“用户”售卖出去,用户构成决定了卖给谁。有数据显示,Perplexity中65%用户为“高收入职业白领”(医学、法律、软件工程),30%处于“高级领导职位”。这决定Perplexity瞄准的是高端广告市场,科技、金融、艺术等领域。媒体报道,Perplexity的CPM(每千次展示成本)广告收费为50多美元,是市场平均水平的4.5~20倍。
对Kimi们不算友好,其普遍用户画像为大学生、初入职场白领、宝妈、老师等。对广告主来说,上述用户的消费和转化能力相对有限。Perplexity的用户定价与ChatGPT持平,一年多的时间已完成了用户筛选。国内AI搜索和助手类应用,为了争夺市场,采取免费策略至今。投流打响了知名度,却也让收费更加难以推行,更广泛的用户意味着更模糊的广告投放市场。
值得注意的是,Perplexity借鉴Notion协作空间提供了AI搜索to小B的模式。Perplexity对外开放了AI搜索能力,既能共享知识库,也能提升检索、分析问题的效率,取代了一部分“RAG+知识库”的解决方案。在该版本上,有很大想象空间,比如提供AI搜索融入软件生态的渠道。像Notion一样,开放自身也允许其他产品API接入,既能弥补能力缺陷,也能提高用户使用率。
在这基础上,订阅收费模式进一步分层。除了原先的专业版收费模式,还会按照企业规模数量为标准收费,小规模、中等规模、大规模和定制化解决方案。
种种迹象表明,AI行业正在步入营收和利润导向阶段。搜索被誉为“离钱最近的领域”,AI搜索如果能打响大模型商业化的第一站,无疑是一针强心剂。谷歌们后退,谁能吃掉第一口“蛋糕”?
支持一下 修改