本文来自微信公众号:虹线,作者:评论尸,题图来自:AI生成
本文来自微信公众号:虹线,作者:评论尸,题图来自:AI生成
2022 年 9 月,上海的打工族喜大普奔,庆祝上海地铁终于支持了使用支付宝和微信刷码进站。
在此之前,刷手机进上海地铁,要么需要你的手机支持 NFC,要么就要用上海地铁自研的一个非常难用,以至于一直被人吐槽的 App 叫“Metro大都会”。
在“Metro大都会”App 被高频使用的 4 年里,它在 App Store 上收获了无数差评,以至于至今的分数也只有 2.7 分。其他城市也有类似的经历,在支付宝与微信接入扫码乘车的过程中,都遭遇到了当地交通运输集团的抵抗。
原因很简单,如果我们将地铁视为一个“帮助乘客从 A 点到 B 点”的交通方案,那么在这整个方案的实现过程中,“如何让乘客付费”这个业务环节的重要性和实施成本可能只占总方案的 1%。它太不重要,也太没有话语权。
更直接的原因是,各地的公交集团甚至也将在自家 App 里放广告视为正当合理的收入——我掏这么多钱修的地铁,成本都收不回来,让用户每天刷码的时候看两眼广告怎么了?并且他们几乎确定,就算他们真的不接入支付宝和微信刷码进站,城市的居民还能因此不坐地铁吗?不会的。
现在,我们将这个逻辑引入到互联网行业,我之前曾经说过这样一个观点:所有试图颠覆 Office 的产品,如果它长得不像 Office,都证明它做错了。
如果你使用电脑的时间足够长,一定能观察到与这个观点论断差不多的现象。在历史上有无数种宣称要挑战 Microsoft Office 的办公软件,但除了 WPS 在中国做出了成绩之外,鲜有真正对 Microsoft Office 有所冲击的案例。
而 WPS 之所以能够成功,还要归功于 WPS 2005 的大版本重构让它与 Microsoft Office 在界面、功能与文件协议上完全一致。也就是说,WPS 为了颠覆 Microsoft Office,变成了 Microsoft Office。
进入云文档时代,宣布要取代 Office 的产品越来越多,他们尽管在一些细分市场都取得了不错的成绩,但在标准制定和市场份额上都与 Microsoft Office 相去甚远。甚至,这些彼此并不相容的云文档之间,唯一相互通用的文档交换方式是导出为 Microsoft Office 文档在另一端导入,这进一步巩固了 Microsoft Office 在文档市场的重要性。
这究竟是什么原因呢?
这是因为 Microsoft Office 作为一个拥有 34 年历史,超级向前兼容,功能只增不减的应用,承载了最近几十年的社会中对电子文档的几乎全部需求。而其之所以被人认为“难用”,也来自每个 Office 的终端用户只能用到其 10% 的功能,而剩下的 90% 功能都是用不到的。
那,我们能砍掉这 90% 的功能吗?不能,因为实际上每个用户所用到的 10% 功能里,其中的 3% 可能是别的用户用不到的 90%。
也就是说,Microsoft Office 是全人类文档需求的并集,而任何挑战者对 Office 的优化基本都是在其中选择一些需求组成子集。
一方面,你真的做一个和 Office 拥有同样多功能的产品,它的用户体验多半与 Office 不会拉开差距(参考 WPS)。另一方面,这个世界上也很少有工程师团队能完全复现 Office 如此复杂的工程。至少不是硅谷那些宣称自己技术很先进的小型团队。
这个时候,我们就可以 Callback 标题的观点了:AI 在文档这个领域,就像微信、支付宝扫码进地铁,IDE 文档编辑器本身的体验才是地铁轨道和车厢。
AI 只应该做成熟类 Office 产品里的一个按钮,因为在“智能文档”整个的解决方案里,方案的难度重点,以及用户实际的需求,主要是被文档满足的。
如果 AI 不好用,那用户无非就像过去 30 年白领一直在做的那样手动来制作文档,但如果文档环节不好用,那么 AI 功能再智能也无法满足用户的需求。
接下来,我们举一个更具体的例子,n8n 与 Dify。
如果你这两年比较关注 AI 在个人生产力方面的应用,那应该至少在小红书、抖音或 B 站刷到过这两个方案。因为这两个方案是时下非常流行的两套低代码工具。简单解释一下的话,就是可以让你在不编程的情况下,将各种互联网工具与 AI 相连,实现自动化平台的搭建。
而这两个方案中,在国内更为流行的又是 Dify,除了因为这个方案有中文本地化之外,还因为它是在 2023 年 5 月发布的,诞生于这一次 AI 浪潮之后,它的定位更明确,就是与 AI 配合完成自动化工作,也就是更加的 AI Native、AI 原生。
而 n8n 则发布于 2019 年,在它上线三年之后,OpenAI 才上线 ChatGPT。因此无论如何,n8n 都无法被认为是 AI Native。
在“低代码自动化”这个方案里,AI 究竟占据了整个方案比重的多少。根据我自己的经验来说,如果我们以节点来算,一个所谓的“AI工作流”,里面使用到的 AI 节点可能只有 1 次或 2 次。而剩下的所有节点都是与其他工具的链接和数据处理。
DIfy 在上线的一年多时间里发展神速,但截至目前,它整合的非 AI 节点也只有 n8n 的不到一半。这意味着,即便是在完成“将工具接入 AI”这个 AI Native 需求上,它的上限也不如 n8n。因为在某种程度上,Dify 就像支付宝或微信为了给乘客带来更好的支付体验(AI 体验),正在重新建地铁(集成非 AI 工具)。
我当然不否认 Dify 有很多优点,比如它对 AI 本身的支持确实更好,界面也比 n8n 友好很多,而且它未来可能会越来越好,随着社区的活跃,它将拥有超过 n8n 的集成度,但至少在现阶段,它能够做到的事情是不如 n8n 的,这会导致你在使用它的过程中,可能要费很多额外的功夫。
比如,如果你想将 AI 生成的内容写入 notion,在 n8n 里只需要添加一个内置的 notion 节点,但在 Dify 中则需要用“HTTP 请求”节点自己配置向 notion API 发送请求。(这个比如的有效期到 2024 年 12 月 11 日,因为后面 Dify 很有可能会更新)
举这个例子没有任何贬低 Dify 的意思,因为作为同样优秀的低代码工具,Dify 在 Github 上的热度已经超过了 n8n,这意味着,随着社区的贡献与生态的加持,它极有可能在未来的某个时间超过 n8n。
但对于个人使用者来说,我为什么不等它真超过了 n8n 再用它呢?
再次回到我对标题中观点的判断:如果你的需求对应的品类里,有一个成熟产品和一个 AI Native 新秀,你应当毫不犹豫地选择前者,等待前者补充 AI 功能,而不是尝试后者,等待后者完善主功能。
这一逻辑,甚至可以在商业决策层面上成立。
稍微看过财经和科技新闻的都知道,今年国内的 AI 产品是一个泡沫非常大的赛道。这里的泡沫不是指 AI 技术本身被夸大了,而是指各家厂商都在用远超收益的方式进行拉新。比如就有媒体报道,仅在 2024 年 10 月一个月,几家 AI 产品的合计广告投放就到达了 3.5 个亿。
烧钱的结果,带来的是如下成绩:
在这里最为刺眼的是腾讯的元宝,因为作为一个大厂推出的产品,它甚至排在了昆仑万维推出的天工 AI 之下。当然,按照大厂的公关辞令,他们一定是不承认这种第三方数据的。但我们不妨回忆一下,平时在刷微信公众号、视频号、逛 B 站的时候,在铺天盖地的 AI 广告中,确实很少看到腾讯元宝的影子。
因为在腾讯看来,ChatBox 类的 AI 产品似乎是一个并不值得烧钱的 AI Native。用人话来解释就是,即便加入百亿烧钱大战,ChatBox 品类里也烧不出下一个微信级的入口。那么,何不把钱省下来在上游烧一烧模型,等混元更成熟一点,直接把一个元宝的 ChatBox 类产品放进微信发现页里呢?腾讯并不是第一次做这样的事情,微信支付和视频号在某种程度上都是这一策略的成功案例。
但,有人可能对“ChatBox”烧不出下一个用户入口有所质疑。那我们可以看看大洋彼端的情况。我之前曾经提到,OpenAI 当前面临四重问题:
1. 模型没有天堑式护城河(和 Claude/Google/Meta 比);
2. 人才流失迅速;
3. C 端产品不具备显著的网络效应;
4. B 端业务被微软架空了。
与本文对应的问题就在第三点。
ChatGPT 在 2023 年 1 月,也就是上线两个月后达到 1 亿用户量,成为互联网历史上用户增长速度最快的 C 端应用,2024 年 8 月,它的周活跃用户超 2 亿。这些耀眼的数据是那些决定跟进 AI 产品烧钱大战的决策依据——如果我能圈到更多的用户,那么我前期烧的钱在后期一定能赚回来。
但实际上,我们且不说这种前期烧钱后期赚钱的叙事在互联网行业内早已过时。仅就产品类型来说,ChatBox 类产品也不具备这样的条件,因为它不具备网络效应。
聊天工具和社交工具一旦拥有足够的用户量就难以被替代,这是因为当你的朋友都在一个工具上,你就很难启用另一个新的工具,在新的工具上没法联系到你的好友。
但 AI ChatBox 没有这样的“绑架机制”,如果 ChatGPT 的任意竞品提供了更好的模型或更便宜的价格,用户就会在几个月内流失。我们事实上见证了在过去一年里,Claude、Gemini 和 Grox 对 ChatGPT C 端用户增长的瓜分。
否则,ChatGPT 不会在上线两周年,并且大幅放宽免费用门槛之后,活跃用户量才刚到 2 亿。而在这期间,Google Gemini 的活跃用户从 0 增长到了 4200 万,Claude 的活跃用户从 0 增长到了 5440 万。
在思考这个问题的时候,你可以将自己代入一个居住在西方的,常年使用 X 和 Facebook 的用户。你显然不会因为开始使用 ChatGPT 而停止使用 X 和 Facebook,因为在 X 和 Facebook 上有你原本每天都要联系的受众,AI 并不能取代这些真实的社交关系。但当有一天,X 和 Facebook 的私信界面里出现了一个新的 AI,你也许会试试,一旦它的体验和 ChatGPT 差不多,更好或更便宜,你将很有可能从此停止使用 ChatGPT。
这似乎就是腾讯在赌的模式。
在 2022 年 ChatGPT 发布后,许多人乐观地认为,所有产品都可以用 AI 重塑一遍,这也让 AI Native 的概念一夜之间成为风口。
但到了 2024 年,AI 在应用中的实践如果只能确定一件事,那就是绝大部分 AI 不是一个产品,只是一个功能。
如果我们认可这一模式,我们就会发现,目前 AI 应用领域有一些产品存在明显的泡沫,比如被视为颠覆 Google 的 Perplexity。
截至目前,Perplexity 的搜索结果来自 Bing 和一部分自建索引。它在 AI 搜索上的贡献,是基于已有搜索引擎返回的结果的工程化改良。这意味着,传统搜索引擎是 Perplexity 向用户交付产品的关键上游,并且如果你稍有 IT 常识就会知道,搜索引擎这项技术并没有它看起来的那么容易,比如由微软推出的 Bing 在如此多年的追赶之下,它的基础搜索体验依然不如 Google。
即便在我们完全不考虑传统搜索技术难度的情况下,Google 为维持其传统索引(你可以理解为要寻找一个答案,首先要收录一个答案)规模和服务持续运转所投入的云资源(包括算力、存储、网络带宽),可能就高于目前世界上所有 AI 应用加起来的云资源消耗。而 AI 搜索之所以能好用,是利用了这些成果,而不是否定了这些成果。
投资一个基于传统搜索引擎但宣称要颠覆传统搜索引擎的产品,显然不合常理。因为,Perplexity 的最好结局是被 Google 或 Bing 收购,最差结局是被 Bing 视为直接竞争对手后停用其搜索 API 进而导致产品停摆。而不上不下的结局是,Perplexity “自建地铁”,也就是完全自建网页索引系统,与 Google 和 Bing 展开正面竞争。显然,Perplexity 已经选择了这条路线[1]。
但在很长一段时间里,Perplexity 会由于索引能力远低于 Google 和 Bing 而冲抵其 AI 带来的用户体验。比如,Perplexity 的高管 Alexandr Yarats 在接受访谈[2]时,曾承认他们目前的索引范围远低于 Google,这使得他们难以关注到尾部问题。
尽管计算机在最近 40 年才深入民用领域,但它在此期间形成的许多工作范式和产品形态已经是帕累托最优解,并非能够轻易被 AI 颠覆。过去的几十年中,白领工作的方式实际上对人的思维与能力进行了深度塑形。换句话说,今天坐在办公室里的职场人更像是脑力劳动的流水线工人,而非依靠独特技艺的手工业者。
因此,AI 对白领工作的替代并不需要重新定义工作的方式,而是以“无感接入”的形式悄然融入现有的办公流程。在这个过程中,与其说是 AI 颠覆了职场整个“抽象机器”,不如说是我们终于找到了一种在脑力劳动领域也可以 7*24 小时不眠不休的核心齿轮。以往,这个零件是白领本身,这导致了企业或管理学如何试图优化脑力劳动的这个“机器本身”,都必须考虑白领这个“零件”作为人是需要休息的。
这种替代并非依靠革命性的泛式颠覆,因为我们的泛式早已迭代到允许插入一个接近不眠不休的核心组件(996)。
那么,换上一个 24 小时在线的零件又何须重做机器呢?
外链:
[1] https://ethanlazuk.com/blog/how-does-perplexity-work/#query-processing
[2] https://www.unite.ai/alexandr-yarats-head-of-search-at-perplexity-interview-series/
本文来自微信公众号:虹线,作者:评论尸
支持一下 修改