2024-07-30 16:07

浏览器这根电线杆,贴满了各种AI插件

本文来自微信公众号:果壳 (ID:Guokr42),作者:糕级冻雾,编辑:沈知涵


2014年,伊凡·佐克曼向公众发表了一封道歉文章。你可能不认识他,但一定对他的发明无比熟悉——网页弹窗广告。


他的本意是好的,别让格格不入的广告直接插入网页内容里。但好意被滥用了。


软件捆绑加上弹窗广告,在PC时代“横行霸道”。那会儿,你不知道下了什么软件,就会引发电脑右下角弹窗接二连三。想关,却误触了跳转,除了脱口而出的脏话,毫无办法。


不成想刚刚迈进AI时代,这条路又要重走了。


前一阵,我被AI浏览器插件的使用体验刷屏。大多是说为了争夺入口,这些插件悬浮在屏幕右侧,密密麻麻。在选中某个句子时争相跳出,甚至重叠在一起——给人一种穷追猛打的感觉。


我去Chrome应用商店一看,好家伙,发现如今的浏览器插件市场已经快被AI“攻陷”。Chrome甚至新开了AI类板块。


我过去对于插件的印象,大多是一些作为“助力冲浪”的轻巧工具。而如今这些新兴的AI插件“野心”似乎大多了,很多甚至想“包圆”了我的工作。


这么多AI插件,都是从哪儿蹦出来的?


“AI太多,用不过来了。”生怕赶不上这一波生成式AI浪潮的焦虑感不是没来由。


因为供给端的确迎来爆发,2023年,Github上AI项目的数量增长59.3%;AI开源社区Hugging Face上开发者数量涨了四倍。


那么,用户怎么用AI的?a16z统计了用户对网页端AI产品的使用情况,Top50产品中有28%在内容生成类(包括文字,图片,视频,音乐),22%的内容编辑,14%的生产力,10%的通用智能助手(ChatGPT,Claude等);移动端则不同,用户更偏向用通用助理(开屏就是一个AI Chat的聊天界面)。


AI迭代很快丨a16z


网页产品适合做更复杂的,多步骤的工作流。在生产力类别里,七款中有六款产品提供了Chrome浏览器插件,或甚至只有插件版。插件的合理性就在于“同步运行”,不需要用户离开正在用的软件,大大减少了在两个或更多网页端(或应用端)之间跳来跳去的摩擦感。


我记得在上个月“豆包”发布会上,字节当时展示了其桌面版插件的例子。当用户读pdf或写代码时,能划线调出AI,命令其翻译总结和代码注释。坐在我身旁一位许久没有反应的大哥,终于在这时说了声:“这个好!”。


AI应该设计得尽量离用户近,最好嵌入使用环境。这是AI能否被用好的一个前提。


当然,开发者并不满足只将技术做入产品流程里。


AI应用迭代快,却生命周期短。在之前提到的那份a16z榜单,比上一次统计榜单时间过去了半年,Top50里换了40%的新面孔。QuestMobile指出,国内生成式AI应用活跃率均在20%以下、三日留存均在50%以下、部分app的卸载率在50%以上。


一些AI应用,从打开网页才能用,变成到随时陪伴的插件产品,这是为了以一种更为轻巧的方式实现落地。


浏览器在今天依然霸占着重要的流量入口,搜索又是最为通用和高频的互联网需求之一。他们在浏览器界面上抢占地盘,往前做,尽量往“入口”做,则是为了解决对于用户增长的渴望。


插件(曾经)为王


2008年,比起60%全球份额的IE浏览器,Chrome只能算稚嫩后辈。但它增长势头很猛——从2009年的5%,2010年的15%,2012年的31%……谷歌打造的开放生态,与当时微软保持封闭,形成鲜明对比。其中,扩展程序(插件)功不可没。


在既定的开发框架下,第三方开发者用少量开发工作,就能让功能实现。越来越多的开发者被吸引而来,创造丰富的功能打开了浏览器“局限”。用户在上网,但不仅是浏览网页——一个为Netflix,Hulu等流媒体设计的插件,“Netflix Party is now Teleparty”,以浮窗形态让人们边看边讨论。有人在插件评论区说,感谢开发者,挽救了一对异地情侣。


这些像游戏里功能性mod的插件,能提供更好的阅读模式、暗黑模式,自动同意所有的cookies请求、更好的视频播放模式……真的有站在用户角度。


浏览器插件伴随PC互联网走过繁荣。移动互联网分走了用户大部分精力,影响了一些轻巧插件进而“App化”,例如,“简悦”一开始只是一个“生成适合中文阅读的排版页面”的插件,后来它逐渐厚重,功能集成了标注,稍后读,导出等,再后来它推出了独立应用。


移动端应用尽量抢占用户精力的同时,也竖起高墙。这时候人们反应过来,插件才是“互联网精神”的最好注脚,也是最后的余晖。


这绝不是电线杆上贴海报那么简单的事情


2019年,安全公司Extension Monitor对Chrome商店18万个扩展插件进行了统计,发现人们常用的有这几类,广告拦截、通讯、购物、安全、密码管理器等,偏功能性的居多。


关于生成式AI的C端应用开发,一直有一个讨论:大模型迭代如此之快,更强的底层技术出现之后,是否会覆盖现有在上层应用上的“雕花”?对于软件开发是一个挑战,能否抛开“App开发”的包袱,解决用户的实际问题——搞清楚AI应该在哪里、怎么给人“打下手”。


与之前的状况略有不同。这一次AI插件,需要与场景做好结合,才能产生用户价值。


以“搜索”为例。GoogleI/O期间,负责Google搜索的副总裁分享他所观察到的用户行为习惯,“用户不明确要搜什么的时候,通常从一个宽泛问题开始,从搜索结果中得到启发,挖掘,再提问。”


同时,每一次查询背后都有意图,下一步用找来的信息做什么?是总结成大纲,写成PPT?或者改变语言风格,汇成新闻稿?等等(这也看作今天AI搜索对传统搜索引擎的颠覆)。


这些划线后就会争相跳出的插件,核心用户场景就是“伴读”。用户在浏览网页时,能对内容有选择性地让插件做解释、搜索、翻译、总结、扩写,一键转小红书文案等操作——重新组织和交付信息,围绕核心搜索诉求展开。


在产品设计上,一些插件会把常用的几个功能摆出来,放入划线处悬浮工具条里。比如豆包,甚至还能让用户自定义“技能”(相当于创建一个bot,或GPTs)并添加进去。而其他更多功能则列入侧边栏里。


一些遵从了插件的“设计原则”,比如Kimi,更为简洁和“激进”。AI会自动“识别用户意图”和“理解上下文”,有网友测了,一个悬浮按钮一个窗口,不仅能做解释,能翻译,还能解数学题。Kimi另外设置了,呼出右边的悬浮按钮,对页面进行总结和提问对话。


浏览器插件不能是网页端和移动端应用的“简单阉割”,有人称,Kimi为了实现“一个悬浮按钮一个窗口”,实则在窗口背后封装了很多Prompt,根据用户提问来调用,实则有产品思考和技术能力的支撑。


基于基础模型迭代,将会替代掉原有一些内容编辑和生成类的产品价值,比翻译(DeepL等),文本生成(Jasper等),语音转录,字幕翻译等等;能将一些垂类做得足够专业能产生更大用户价值,比如财务工作者需要智能报表生成和分析的工具;金融分析师需要垂直知识库和搜索。


一些做整合的插件(比如MaxAI,Monica),自身不开发基础模型(就是大家常说的“套壳”)。这将考验将不同模型的能力抽离,做到具象的场景里的能力,比如当用户没时间看完一个YouTube的时候,让AI替自己看一遍,总结好。这类插件容易产生的问题是,功能过多,必然显得臃肿。在追求“一站式”的同时,还要兼顾插件本身价值——需求到完成路径最短。


插件之后:真AI浏览器会是什么样子?


过往20年,用户的PC和互联网使用方式发生了巨大变化,比如本地应用越来越走向云端,云的免下载,跨平台,可协同等优势,也拉长了用户在浏览器上花费的时间。但浏览器似乎还是老样子。


如果你忽略插件带来的拥挤感——几个插件在页面右侧争相蹦出AI搜索总结,生成式AI的确为搜索带来了新的价值。但你总有种感觉,这种改变像缝缝补补一样。


AI能在浏览器上产生什么用户价值?而不是只在侧边栏提供一个ChatGPT。


Chrome之所以能打败IE,是因为重新设计了浏览器的底层架构,保证了整体性能的稳定和安全。而且从一开始,Chrome就被当作一个平台(并非只是网页浏览工具)来设计,在开源的Chromium、Linux之上,延伸出了扩展程序、ChromeOS。


去年,微软发布了基于GPT的全新必应和Edge浏览器,相当于直接在搜索引擎内嵌大模型,当时最快最方便用上ChatGPT的方法就是下载Edge用Bing。此举让Edge用户规模快速增长了5000万,日活在3月后首次突破1个亿。同时期,Edge的用户量缓步上升,Chrome则在下降。


但新鲜头过去后,如今Chrome还是占据浏览器市场近2/3的份额(65.68%),Edge上涨到5%之后就陷入增长停滞,目前停留在5.26%,排在Safari(18%)之后。都不要说插件了,Edge直接重做了个内嵌GPT的搜索引擎,这都没能把市场从Chrome那里抢来多少。


总的来说,非常多的用户对浏览器有“依赖性”,迁移成本高。谁能解决“浏览器+搜索引擎+AI功能”的融合问题,谁离“人人都想用的AI”就更近一步。


对于上面的思考,Arc浏览器有一些革新做法,被认为给平静已久的浏览器市场,掀起来一场水花。它按重要程度对信息分层,重构网页浏览体验;


Arc通过设计不同空间(Spaces),满足不同场景下的会话需求;重新设计标签页,呈现出信息的层级结构丨Arc


让浏览器功能更贴近AI原生;重塑搜索的信息组织和交付;保持开放,让用户跨应用端体验更加顺滑等等。


有评论说,Arc有“苗头”让浏览器不再只是浏览网页的工具,而是一个为开放互联网创建的操作系统。的确,谷歌在将近20年之前就说过这话了。


谷歌近来也有一些将AI整合进Chrome中的动作。但对于这样一家科技巨头来说,历史惯性太大。


AI插件“爆发”有一定合理性。不过一旦从应用尽有,到趋于同质化后,大家也略显疲乏。这不,最近有公司的智能助手产品也推出“悬浮球”,争抢又回到了移动端。

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定