看得见的硝烟

AI少闲月，五月人倍忙。

5月的AI行业格外热闹。国外，OpenAI、谷歌、微软相继发布了AI在多模态和端侧应用的新产品GPT-4o、Astra和AI PC ，赚足看客眼球的同时，竞争的硝烟也在弥漫。

而国内，大模型厂商的竞争则更直接和露骨，他们没有征兆地开启了价格战。没有铺垫和试探，降价幅度堪比蹦极，仿佛置身“618大促”直播间，卖货主播声嘶力竭地喊：“帮家人们把大模型价格打下来！”。

很多人认为价格战的导火索是字节的豆包大模型降价，其实并不准确。真正打响第一枪的是幻方旗下的大模型公司DeepSeek，它于5月6日开源了DeepSeek-V2，并将输入价格定为1元/百万tokens，仅为GPT-4-Turbo价格的近百分之一。

随后智谱AI入局，宣布个人版GLM-3Turbo模型产品的调用价格下调80%，输入价格也定为1元/百万tokens。

接下来，云厂商的加入把战斗推向高潮，这下整个“晋西北”正式乱成一锅粥了。

5月15日，字节宣布豆包主力模型Doubao-pro-32k输入价格定价0.8元/百万tokens；5月21日，阿里云宣布旗下九款通义大模型全降价，其中对标GPT-4的主力模型Qwen-Long价格直降97%，来到了0.5元/百万tokens。

阿里云这边刚起锅烧水，百度过来就把炉子拆了。通义宣布降价仅几小时后，百度可能懒得算那几块几毛的账了，直接把两款文心轻量级模型ERNIE Speed和ERNIE Lite免费了。

百度把调子起高了，后边上台的选手也只能硬着头皮唱。5月22日，科大讯飞宣布讯飞星火Lite API调用免费；“跟跑大师”腾讯云随即也宣布旗下混元模型混元-lite免费、混元-standard-256k输入价格下调87.5%，降至15元/百万tokens。

透过现象看本质，国内外的动作虽不相同，但都隐隐指明了当下大模型厂商的发力方向——大模型应用的落地。

降价空间从何而来？

阿里云智能集团资深副总裁刘伟光明确指出，大幅降低大模型推理价格的目的，在于加速AI应用的爆发。

从行业角度看的确如此，但降价幅度如此之大、且降价的均是API调用费而不是订阅费等特点来看，本次价格战厂商们争夺的目标就是B端客户和开发者，一方面。通过降价甚至免费的方式增加自家大模型调用量，是一种推销、引流手段。

另外，更多客户使用大模型各自场景里做数据、做微调来优化模型，也能促进更多AI应用的诞生，进而与大模型更深层次绑定。

另一方面，大模型能如此大幅度的降价，其推理成本肯定通过某种方式实现了降低，推理成本的下降得益于模型优化技术的快速迭代。

阿里云表示，通过构建弹性的AI算力调度系统并结合百炼分布式推理加速引擎，阿里云优化了大规模推理集群，大幅压缩了模型推理成本并加快推理速度。

火山引擎总裁谭待在豆包大模型发布后表示，字节通过优化模型结构、将单机推理改为分布式推理、混合调度云计算算力等方式优化了成本。

DeepSeek 相关负责人此前表示，DeepSeek-V2通过MoE模型架构实现了模型结构创新，成本降低的同时，功能也更加强大。

本次价格战，真正把战火扩大的是云厂商。云厂商具备算力集中和规模效应优势，大模型落地是工程化实践，工程化做得越好，大模型成本也就降得越低。

最后还有一点原因不得不提，宣布超低价、免费的很多都是轻量级模型。比如百度宣布免费的ERNIE Speed和ERNIE Lite，是两款轻量级模型，支持8k和128k上下文长度。

虽有诚意不大的嫌疑，但大部分用户的场景可能也不需要太大的参数。就像只玩扫雷，就没必要给电脑配个4090显卡。轻量级模型也许刚好能满足使用场景，价格还更低，“效价比”拉满。

不过从这里也能看出很多厂商既要流量，又要赚钱的心思。先用低价产品“请君入瓮”，培养用户粘性。后续就可以用各种方式刺激用户使用高性能模型了，这些模型可并不便宜。就像网盘和下载工具，免费体验付费才有的高速下载，久而久之有的用户自然就忍不了免费但很慢的下载速度了。

尝鲜大模型，或许有“坑”

这次的大模型的降价真正的诚意有多少呢？会不会像一些游戏广告，宣传“注册送手机”，结果想要领取需要达成海量前置条件呢？

拿豆包大模型来看，其通用模型pro-32k版推理输入价格为0.8元/百万tokens,宣称比行业低99.3%。乍一看很便宜，但这是输入价格，其输出价格为2元/百万tokens，加权平均输入输出后，综合收费为1元/百万tokens。很多大模型和豆包一样，降价公告着重宣传输入价格的低廉，而对输出价格和综合费用等闭口不谈。

豆包的价格规则最离谱的地方是其限制RPM为60，意思是只有每分钟60个请求的话，才是这个价格。可在真实的业务场景中，如果用户想高频次调用模型，那抱歉，没有这个优惠了。

另外，如前所述，很多参与降价的轻量级模型，等于是给了用户一个“阉割版”大模型，无论从参数、生成速度，还是功能上肯定都是大打折扣的。当期无法满足用户需求时，用户可能会选择价格更昂贵的同厂商的高性能大模型。

虽说这些都是正常的商业宣传行为，但势必会对很多没加入价格战的创业公司带来巨大打击。不同于云厂商大模型的背靠大树好乘凉，很多创业公司承受不住如此大的降价。

所以本次价格战并没有卷入太多创业公司，也有人对价格战的行为表示不理解。“我觉得大模型公司不会这么不理智，因为技术是最重要的，如果技术不行，纯粹靠贴钱方式去做生意，我们绝对不会跟这样的定价做对标。如果以后中国就这么卷，大家宁可赔光通输都不让你赢，那么我们就走海外市场。”零一万物创始人李开复如是说。

这次的价格战本质上还是在技术遇到瓶颈、产品同质化严重的大环境下，大模型厂商宁愿烧钱也要打淘汰赛，今年注定会再次上演大模型行业新一轮淘汰赛。

正如云计算市场的竞争，大模型的价格战一经开打就很难回头，这种非良性的竞争状态或许会长期持续。

硝烟散去，满地狼藉，可能剩者为王，也可能全盘皆输。