进入2024年,Stability AI风波不断。3月21日,开发Stable Diffusion的几名核心研究人员离职。过了没有两天,Stability AI的CEO Emad Mostaque宣布离任,并退出董事会。又过了没到一个月,4月19日,Stability AI又宣布裁员20人,约占全体员工的10%。
Stability AI到底挖了多大的坑?根据The Information的说法,Stability AI私下表示2023年的营收只有800万美金左右,这个数字比之前网传的1100万美金还低了不少。而根据彭博社在2023年10月的报道,Stability AI一个月就要在员工工资和云计算等领域支出800万美金,其他不算,公司利润率怒达-1100%。
而2024年第一季度,Stability AI收入不到500万美元,貌似赚得多了点,但亏损超过3000万美元,利润率稍微好看了些,也就是-600%。
公司经营结果一塌糊涂,还欠了不少外债,据传Stability AI欠云计算供应商和其他公司1亿美元。相比之下,隔壁Midjourney只有十几名员工,就能拿下3亿美金左右的年营收。
如此糟糕的财务状况,几乎所有生图类产品都会用其底层模型的Stability AI,到底问题出在哪?
开源+API的商业模式陷阱
经过一番资料的搜索,对于这个问题,笔者主要总结出了两个方面的原因,一是公司的管理出现了问题,二是Stability AI的商业模式一直没有跑通。
Stable Diffusion其实并不是Stability AI开发的产品,这款模型最初是由项目负责人Robin Rombach攻读博士学位的慕尼黑大学和另一个AI视频创企runway共同开发的开源模型项目Latent Diffusion。
而Stability AI最初只是为项目提供了计算资源,才取得了冠名权。而2022年,Stability AI说服了负责人Robin Rombach和其他核心成员加入公司,这才“名正言顺”地获得了Stable Diffusion的所有权。
虽然获得了所有权,但是Stability AI的管理却一地鸡毛。有离职员工透露,CEO Mostaque几乎不懂研究,也不会为研发团队制定计划、分配资源,加上他个人的学历、经历造假、欺骗投资人、欠薪等丑闻,造成Stability AI管理混乱,负面新闻缠身。如果说管理层混乱是一个例外,Stability AI选择的商业化路径在为很多做开源模型、API收费的企业敲响警钟。
Stability AI商业模式图解,图片来源:FourWeekMBA
众所周知,Stable Diffusion是一款开源模型,所有人都可以免费下载和修改模型。
而Stability AI本身则是靠API、企业服务、AI相关的咨询来赚钱。这个开源商业化模式,模仿的是Linux的提供商RedHat,即靠开源打出知名度,再靠API和企业定制产品在B端赚钱。Stable Diffusion在推出伊始就上线了API。
目前来看,市面上绝大多数的生图产品,使用的都是SD和它的衍生模型,受众远比Midjourney和DALL-E等闭源模型要大很多,而为什么Stable Diffusion被那么多创企采用,官方做API却不赚钱呢?
第一个原因其实是模型本身的设计,由于SD从一开始就是开源模型,所以在设计时就比闭源模型参数更少,更轻量,以满足离线部署的需求,因此,SD原模型的生图效果其实是不如闭源模型的。
但是SD作为开源模型,本身设计上,留下了很大的“可调整空间”,例如对SD模型进行微调可以得到Checkpoint,可以优化某种特定风格的生图质量,进一步还能在Checkpoint的基础上对cross-attention layer进行调整形成LoRa模型,来添加特定对象或实现人物、风格一致的效果。这些都给了用户和开发者按需求/场景,实现更佳效果的可能。而在实际落地中,绝大多数开发者都会对SD模型进行重新训练,来适应电商、广告、或者漫画脸等场景。
而直接调用API,单纯做套壳产品,其实竞争力不大,无法满足多数厂商的业务落地需求。
第二个原因是成本问题。
信息来源:各公司官方网站
其实单看API费用的话,除了最新推出的SD3比较昂贵之外,SDXL和SD1.6等已开源的模型的API可以说比OpenAI便宜不少了,与腾讯混元的文生图API价格相当。
用户云上部署SD的成本核算分享|图片来源:AI魔法学院
但是如上所述,很多厂商为了落地,会选择自行部署。而SDXL和SD1.6都是完全开源模型,任何用户都可以自行下载和部署这两款模型。甚至,一些云厂商也会将SD这种完全开源的模型做成即插即用的插件放在自己的解决方案里。
根据网络上的分享,使用腾讯云部署SD 1.5的话,平均单张图片花费0.1~0.01元人民币,合1美金能生成70~710张图片;而上面提到的AWS的云服务,1美金大约可生成240张图片。而如果选用更便宜的云服务提供商的话,这个价格能做到更低。
那我们把云部署的费用更新到表格中,就会变成下面这样:
这么一比,虽然SD在API价格对比层面,费用确实不高,但和其他一些方式比没有成本优势。
谷歌搜索“SD API”结果(上),第三方API的价格(下)
最后,依然是因为完全开源,在Stable Diffusion出来不久,就已经各路有三方API出现了,目前在谷歌搜索“Stable Diffusion API”第一条是官网,第二条就是一个第三方API的网站,甚至这个网站提供无限次使用API的服务,价格为147美金/月。
SD使用的Creative ML OpenRAIL-M license协议关于“分发模型”的条款,注:SD使用的协议是专为AI开源产品设计,而类似DeepSeek等国内出海产品会使用针对一般开源软件的MIT协议,两者商业化条款的规定基本相同,前者在道德等层面上会做了更多的规定,促使人们安全地使用AI。
对于其他企业使用开源模型做三方API的法律问题,我咨询了法律专业人士。他表示能否提供第三方API服务需要参考产品协议中列示的商用条款,如果违反条款,原开发者就有权进行索赔。而Stable Diffusion所使用的协议,完全允许向第三方分发模型,包括销售付费API,这让SD官方的API无形中又多了无数竞争对手。
目前,很多国内大模型都在走开源+API的路径,但是在开源的基础上,都会拥有能力更强的闭源模型,或干脆将开源闭源分成两个系列,为自己的API保留一些差异,在开源和商业化方面找到平衡。
看下来,Stablity AI陷入“疯狂烧钱,但营收不利”的局面,其实就是没有在开源的同时推出能够区别于开源模型的差异化产品,在价格上也无法与自行部署模型来竞争。在价格更低、部署也并不麻烦的情况下,B端用户们自然会更倾向自行部署大模型、甚至直接使用部署了开源模型的云服务,而不是调用API,Stablity AI自己的模型开源把自己的商业化路径堵死了。
从开源转向闭源,Stablity AI的自救能成功吗?
这样的商业化困境,造成Stablity AI一直要靠融资维持,早在去年11月份,就有消息爆出,投资者对公司业绩不满而要求CEO辞职的新闻。
为此,Stability AI开始密集进行商业化尝试,涵盖API、限制自行部署模型商用、ToC订阅付费等多种模式。
评论Stablity AI会员订阅的X帖文|图片来源:X
去年12月底Stablity AI针对自行部署模型用户,变更了政策,简单说就是不商用还可以免费用,但如果商用,就要买会员了。
这个政策变更覆盖的模型有SDXL Turbo、视频生成模型SVD等。与之前坚持的不限制商用的开源协议不同,Stablity AI想通过限制“自部署”模型的商用权限获得收入。
Stablity AI宣布在API中推出SD3的X帖文|图片来源:X
而且SD3宣布了很久,一直没上线模型,只提供了API调用,Stablity AI似乎有转向闭源的趋势。
4月17日,Stablity AI宣布SD3和SD3 Turbo可以通过调用API中访问模型,而且在X帖文中还提到,为了实践开源的承诺,未来将在Stablity AI会员的权益中添加这两款模型,但绝口不提完全开源的事情。
Stable Artisan订阅价格
除了收模型的会员费,在5月9日,Stablity AI又宣布开始做C端生意了,推出基于Discord的AI图像工具Stable Artisan。
用户可以在Discord中输入提示词,用SD3、Stable Video和Stable Image Core等最新模型进行生图、修图、生成视频等操作。商业化方面,Stable Artisan采取订阅制,用户可以根据生图数量的需求按月或年付费。“Discord平台+4档订阅付费”,这几乎已经是照抄Midjourney的模式了,只不过订阅价格略便宜一些。
但问题是,面对各路生图模型的竞争,Stablity AI还能收到C端用户的钱吗?
测试方式:用各生图模型生成多组图片,由人类进行打分|图片来源:数字生命卡兹克
要想探究这个问题,我们首先要看,Stablity AI的模型能力是否有优势,这个答案是“似乎没有”。我们以最新推出的SD3为例,虽然Stablity AI在论文中表示经过测试,SD3比市面上所有模型都要强。
但是根据国内媒体进行的测评,在细节质量、语义理解和审美三个点的评分上,SD3基本都低于MidjourneyV6,虽然这个测评带有不小的主观性,但是综合笔者看到的其他测评结果,至少可以得出结论,SD3并没有碾压Midjourney、DALL-E的实力,不同模型在不同的维度上各有优劣。
而且,与API有同样的问题,Stable Artisan也不能像市面上的其他生图产品那样调节更多的参数或使用Lora,可控性上可能还不如那些使用了开源SD模型的产品。
此外,目前Stable Artisan只支持在Discord聊天框里输入Prompt,但是笔者看下来,几乎没有对用户的指引,用户虽然可以二次创作其他人生成的图片,但只能像“原始版Midjourney”那样,在Discord中一页一页的翻找。更不要说,像很多生图产品那样有让用户点标签生成提示词,或者像SeaArt一键做同款等方便用户操作的设计了。
此外,笔者浏览了一下Discord中其他用户的生图记录,绝大多数用户都是在使用文生图工具,使用线稿生图或去背景/对象等其他功能的用户并不太多,而且这个去背景的效果,似乎也不怎么好。
Discord邀请页面显示的在线人数
从人气来看,Stable Diffusion Discord的在线人数只有Midjourney一个零头。而目前,Midjourney网站端的生图功能已经向生图超过100张的用户开放了,其他生图产品基本都在网站端使用了。而Stable Diffusion才刚刚走上Midjourney等产品一年半前走的路。
写在最后
作为一个AI时代的明星,Stable Diffusion和Stablity AI已经写下浓墨重彩的一笔,但是不到2年的时间,就沦落到出售公司的程度,也令人唏嘘不已。未来开源AI这条路能否走出“疯狂烧钱,却不挣钱”的死路,找到可行的商业模型,可能还要未来的AI创企们给出答案了。