本文来自微信公众号:消费最前线,作者:江心白,题图来自:AI生成
本文来自微信公众号:消费最前线,作者:江心白,题图来自:AI生成
过去一年,大模型作为科技圈顶流,从诞生到落地的发展过程都极其迅速,开始应用后也不出意外地打起了互联网最擅长的价格战。据不完全统计,参与大模型价格战的企业包括字节跳动、阿里、百度、腾讯、科大讯飞……
2024年年末,阿里再度宣布大模型降价,降价幅度甚至超过了80%。
坦白来说,起初的大模型价格战的确在短时间里为企业创造了不少流量,百度在去年8月份就曾透露,百度文心大模型5月API日均调用次数是2亿,8月增长到了6亿次;5月日均Token消耗量是2500亿,8月增长到了1万亿。
字节跳动的豆包在7月份的日均Token用量也超过5000亿,相比5月,平均日均Token使用量增长了22倍。但与所有行业一样,价格战持续太久,必定会回头反噬企业的利润。数据显示,2024年5月份之前,国内大模型推理算力毛利率高于60%,5月各大厂接连降价后,推理算力毛利率跌至负数。
这本是一个可怕的数字,但不知为何,到了2025年,大模型的价格战又打响一炮。
“价格战”的底气又上升了一点
新的一年里,大模型价格战的激烈程度有增无减,除阿里之外,字节跳动、月之暗面也纷纷加入新一轮降价大潮。2025年,一度花钱如流水,亏损到生死不明的大模型企业又打得起价格战了吗?
首先,可以肯定的是,大模型企业在现实落地、融资盈利等方面迎来了一些可观的转折。从2024年下半年开始,国内大模型落地版图基本有了模糊的轮廓,信息处理、客服销售、硬件终端、AI工具、学习教育……共同为大模型拼出一个光明的未来。
2024年1至11月,大模型相关中标项目的盘点结果显示,国内大模型中标项目共728个,中标总金额为17.1亿元,分别是2023年全年数据的3.6倍、2.6倍。受此影响,大模型企业在这方面也开始产生收入。
百度数据显示,去年第三季度,百度智能云营收达49亿元,同比增长11%,AI相关收入占比持续提升至超11%。无独有偶,阿里云季度营收增长至265.49亿元人民币,同比增长6%。其中,AI相关产品收入实现三位数增长。
其次,大模型领域在经历两年的融资下滑期后,终于在2024年有所回温。数据显示,2024年前九个月,AI领域共完成融资金额371.5亿元,相比2023年同期翻了1倍多。总之,在应用落地、实现小规模业绩营收、资本重新眷顾后,有钱是大模型赛道继续价格战的底气。
但当前大模型企业的盈利能力真的可以撑起一场场无序而混乱的价格战吗?
时至今日,大模型的运营成本、后续亏损仍旧居高不下。海外头部大模型企业如OpenAI,2024年的运营成本将超过85亿美元,预计亏损约50亿美元,预计2023年至2028年的总亏损将达到440亿美元。
至于模型训练成本,OpenAI预测到2026年会高达95亿美元。
国内在大模型行业虽小有成就,但与全球大模型平均发展速度相比,停止或者减少训练研发还为时尚早。斯坦福大学基础模型研究中心在去年9月份发布了一则排名,排名前十的模型厂商包括AI创业公司Anthropic旗下的Claude 3.5系列、Meta旗下的Llama3.1系列、OpenAI旗下的GPT-4系列、谷歌旗下的Gemini 1.5系列。
中国大模型目前仅有阿里旗下的通义千问2 Instruct 进入了前十,目前全球AI大模型数量超过1328个。以后国内大模型赛道的投入资本只会越来越多,2024年,尽管整个人工智能行业的整体融资额同比翻了1倍多,但融资交易数只增长了约10%。
换句话说,大模型赛道已经到了残酷的淘汰期。截至2024年11月,我国共有309个生成式人工智能产品完成备案。头部吃肉喝汤,小企业不仅拿不到投资,甚至连继续生存都是问题。为了活下去,要么价格战,要么卷营销。
但一心想要提前占领市场的头部企业不惜一边持续价格战,一边疯狂撒钱营销。
数据显示,在2024年6月上旬,豆包新一轮大规模广告投放的金额飙升到1.24亿元。在10月份的前20天内,Kimi的广告投放费用高达1.1亿元人民币。2025年,逐渐走向成熟的大模型固然多了一丝底气,但前路漫漫,需要花钱的地方数不胜数。
“算力”才是第一生产力
2024年,大模型企业用接连不断的价格战与铺天盖地的广告,让各类大模型产品在现实世界里一再普及,但随着用户越来越多,因算力资源导致服务崩盘的事故再次让整个大模型赛道陷入沉思。
不完全统计显示,去年一年,Kimi、文心一言、ChatGPT等都曾出现过无法正常使用的情况。ChatGPT还一度因为需求量过大暂停新用户注册。在国内,一到论文季,Kimi等主打文本处理类的产品也会“瘫痪”。
算力之于大模型的发展有多重要?算力、算法、数据一度被认为是大模型技术的“三架马车”。这两年,算法的创新使算力需求一直处于高增长状态,对比GPT-3与最新发布的LLaMA3-405B,虽然前后模型规模仅增大了2.3倍,所需算力却增长了116倍。
因此,算力逐渐成为大模型赛道的第一生产力,而全球头部大模型企业在算力上的布局早已拉开序幕。
据悉,OpenAI与微软的巨型数据中心项目,预计成本超过1150 亿美元,配备数百万块 GPU。但OpenAI仿佛并不满足,又与甲骨文达成合作,在德州建立的数据中心未来可容纳数十万个英伟达GPU;Meta计划继续储备35万张英伟达H100GPU,未来芯片储备量将达到60万张。
国内的算力需求也进一步爆发。一方面,用户体验需要算力资源支撑,另外一方面,各大企业之间的产品趋于同质化,在技术上始终没有拉开一定的差异距离,只能一再卷价格。算力或许会是未来破局的关键。
有机构预测过,到2030年,国内100%的推理需求都需要由超大规模数据中心来完成。全球大模型赛道掀起一阵智算中心热,截至2024年上半年,国内已经建设和正在建设的智算中心超过250个,2024年上半年智算中心招投标相关事件791起,同比增长高达407.1%。
但国内当前的算力供应有一个不可忽视的点:芯片。
数据显示,国内AI训练芯片市场英伟达占据了约80%的市场份额,在算力供应链形成之前,这无疑是必须改变的一个僵局。上海的“算力浦江”智算行动实施方案就表示,要在2025年,实现新建智算中心的国产算力芯片使用占比超过50%。
除了芯片,全球大模型赛道推崇的10万卡群实际建设起来要面临的现实问题还有很多。
首先,数据中心耗电巨大。有数据指出,10万卡集群的日耗电量可达300万度,相当于一个城市的日均居民用电量。二来,算力集群越大,故障率也呈上升趋势,10万卡集群每20分钟可能就会出现故障;三来,当前算力短缺且昂贵,但不少企业训练大模型的算力有效利用率往往不足 50%。
当然,整个大模型赛道上至企业、下至相关部门都在想方设法解决算力供应过程中的各种意外。首先,在能源损耗方面,海外很多国际公司已选择分布式部署的策略,谷歌和微软也在推进多数据中心的协同训练。
至于芯片方面,国内不少企业在进行多芯混训,如百度在异构算力的统一管理下,已经实现95%的混合训练效能,并将集群故障恢复时间缩短至分钟级。从国内一部分算力集群的利用率上看,算力浪费的情况正在改善,西安一人工智算中心的算力使用率高达98.5%。
种种迹象表明,全球大模型市场“开弓没有回头箭”,所幸这一次,科技圈应该不会再重现元宇宙的悲剧了。
2025年,是时候“卷应用”了?
开始创造实际价值,成了2025年大模型赛道的主基调。目前,大模型应用已经逐渐渗透到金融、医疗健康、教育培训、搜索、办公等多个场景。李彦宏曾经直言,行业不应该再卷模型了,应该直接创造应用价值。
根据“经济观察报”统计,截至2024年10月9日,网信办共通过188项生成式人工智能备案,但超过三成的大模型在通过备案后未进一步公开其进展情况;仅有约一成的大模型仍在加速训练模型;接近一半的大模型则直接转向了AI应用的开发。
形成这种局面的原因也不难猜。一方面,行业的价格战无论还继不继续,其背后所能发挥的效应也大不如前,在各大巨头的相互压迫下,整个市场不得不趋于良性竞争。另外一方面,算力资源等技术发展现状让基础模型的建设动辄需要数亿美元的投入。
马斯克曾估算,GPT-5的训练可能需要3万~5万张英伟达H100芯片,仅芯片成本就超过7亿美元。转向应用,自然就成了一大部分企业拼不过技术、资本后,曲线救国的一种主要方式。
而头部企业虽然在技术资源、资金方面勉强还算充裕,但市场抢夺早在大模型爆发之际就启动了“加速键”,如果不以应用提前占据先机,很有可能会被淹没在历史的尘埃里。仅在国内,通用大模型、行业大模型在这两年层出不穷。
《生成式人工智能服务管理暂行办法》显示,通过备案的通用大模型包括百度文心一言、商汤大模型“商量SenseChat”、百川智能的百川大模型、智谱华章的“智谱清言”;行业大模型包括昆仑万维“天工”大模型、知乎“知海图AI”模型、金山办公“WPS AI”、好未来“MathGPT”大模型、网易有道“子曰”教育大模型。
一些企业的“模海战术”已开启,典型的例子是阿里,在2024年的云栖大会上,阿里不仅宣布再度降价,还一口气上架了100多个模型,包括大语言模型、多模态模型、数学模型和代码模型。大模型一涌而出,于整个赛道而言,或许是百家争鸣的好事。
但于某一家企业而言,同类产品一个接一个面世,自身产品的独特性就会大打折扣,尤其当前大模型赛道本就陷入同质化泥沼无法自拔。以百度为例,去年百度的大模型收入虽然有所上升,但增速却大幅度下降。
数据显示,2024年第三季度,百度云的环比增速从14%降至11%,生成式AI云收入环比增速从95%骤降至17%。究其原因,与市场竞争加剧脱不开关系,为了守住市场份额,“应用”价值必须提升。
然而,企业一味奔向应用,放弃技术进步可以吗?有一点不得不提,目前大模型市场的拿单效率与模型本身息息相关。去年一年里,大模型招标项目陡增,其中,阿里云、百度云、腾讯云、字节的火山云皆是中标常客。
但细究下来,腾讯云共计中标28个,金额总计2.1亿元;阿里云中标20,共计中标5.7亿元;百度云中标37个,共计拿下5亿元的单子;火山云中标24个,但总金额只有6186万元。
四家为什么会差异至此?原因是火山云虽拿遍智能体细分领域的订单,但智能体的复杂性和客制化难度并不算高,所以客单价会受研发量规模上下浮动。换句话说,大模型的“钱景”始终与技术正相关,2025年,大模型只能接着卷下去。
本文来自微信公众号:消费最前线,作者:江心白
支持一下 修改