打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
大模型“618大促”,硝烟下的真相
userphoto

2024.05.24 河北

关注

作者 | 万泉河

编辑 | 阿文

看得见的硝烟

AI少闲月,五月人倍忙。

5月的AI行业格外热闹。国外,OpenAI、谷歌、微软相继发布了AI在多模态和端侧应用的新产品GPT-4o、Astra和AI PC ,赚足看客眼球的同时,竞争的硝烟也在弥漫。

而国内,大模型厂商的竞争则更直接和露骨,他们没有征兆地开启了价格战。没有铺垫和试探,降价幅度堪比蹦极,仿佛置身“618大促”直播间,卖货主播声嘶力竭地喊:“帮家人们把大模型价格打下来!”。

很多人认为价格战的导火索是字节的豆包大模型降价,其实并不准确。真正打响第一枪的是幻方旗下的大模型公司DeepSeek,它于5月6日开源了DeepSeek-V2,并将输入价格定为1元/百万tokens,仅为GPT-4-Turbo价格的近百分之一。

随后智谱AI入局,宣布个人版GLM-3Turbo模型产品的调用价格下调80%,输入价格也定为1元/百万tokens。

接下来,云厂商的加入把战斗推向高潮,这下整个“晋西北”正式乱成一锅粥了。

5月15日,字节宣布豆包主力模型Doubao-pro-32k输入价格定价0.8元/百万tokens;5月21日,阿里云宣布旗下九款通义大模型全降价,其中对标GPT-4的主力模型Qwen-Long价格直降97%,来到了0.5元/百万tokens。

阿里云这边刚起锅烧水,百度过来就把炉子拆了。通义宣布降价仅几小时后,百度可能懒得算那几块几毛的账了,直接把两款文心轻量级模型ERNIE Speed和ERNIE Lite免费了。

百度把调子起高了,后边上台的选手也只能硬着头皮唱。5月22日,科大讯飞宣布讯飞星火Lite API调用免费;“跟跑大师”腾讯云随即也宣布旗下混元模型混元-lite免费、混元-standard-256k输入价格下调87.5%,降至15元/百万tokens。

透过现象看本质,国内外的动作虽不相同,但都隐隐指明了当下大模型厂商的发力方向——大模型应用的落地。

降价空间从何而来?

阿里云智能集团资深副总裁刘伟光明确指出,大幅降低大模型推理价格的目的,在于加速AI应用的爆发。

从行业角度看的确如此,但降价幅度如此之大、且降价的均是API调用费而不是订阅费等特点来看,本次价格战厂商们争夺的目标就是B端客户和开发者,一方面。通过降价甚至免费的方式增加自家大模型调用量,是一种推销、引流手段。

另外,更多客户使用大模型各自场景里做数据、做微调来优化模型,也能促进更多AI应用的诞生,进而与大模型更深层次绑定。

另一方面,大模型能如此大幅度的降价,其推理成本肯定通过某种方式实现了降低,推理成本的下降得益于模型优化技术的快速迭代。

阿里云表示,通过构建弹性的AI算力调度系统并结合百炼分布式推理加速引擎,阿里云优化了大规模推理集群,大幅压缩了模型推理成本并加快推理速度。

火山引擎总裁谭待在豆包大模型发布后表示,字节通过优化模型结构、将单机推理改为分布式推理、混合调度云计算算力等方式优化了成本。

DeepSeek 相关负责人此前表示,DeepSeek-V2通过MoE模型架构实现了模型结构创新,成本降低的同时,功能也更加强大。

本次价格战,真正把战火扩大的是云厂商。云厂商具备算力集中和规模效应优势,大模型落地是工程化实践,工程化做得越好,大模型成本也就降得越低。

最后还有一点原因不得不提,宣布超低价、免费的很多都是轻量级模型。比如百度宣布免费的ERNIE Speed和ERNIE Lite,是两款轻量级模型,支持8k和128k上下文长度。

虽有诚意不大的嫌疑,但大部分用户的场景可能也不需要太大的参数。就像只玩扫雷,就没必要给电脑配个4090显卡。轻量级模型也许刚好能满足使用场景,价格还更低,“效价比”拉满。

不过从这里也能看出很多厂商既要流量,又要赚钱的心思。先用低价产品“请君入瓮”,培养用户粘性。后续就可以用各种方式刺激用户使用高性能模型了,这些模型可并不便宜。就像网盘和下载工具,免费体验付费才有的高速下载,久而久之有的用户自然就忍不了免费但很慢的下载速度了。

尝鲜大模型,或许有“坑”

这次的大模型的降价真正的诚意有多少呢?会不会像一些游戏广告,宣传“注册送手机”,结果想要领取需要达成海量前置条件呢?

拿豆包大模型来看,其通用模型pro-32k版推理输入价格为0.8元/百万tokens,宣称比行业低99.3%。乍一看很便宜,但这是输入价格,其输出价格为2元/百万tokens,加权平均输入输出后,综合收费为1元/百万tokens。很多大模型和豆包一样,降价公告着重宣传输入价格的低廉,而对输出价格和综合费用等闭口不谈。

豆包的价格规则最离谱的地方是其限制RPM为60,意思是只有每分钟60个请求的话,才是这个价格。可在真实的业务场景中,如果用户想高频次调用模型,那抱歉,没有这个优惠了。

另外,如前所述,很多参与降价的轻量级模型,等于是给了用户一个“阉割版”大模型,无论从参数、生成速度,还是功能上肯定都是大打折扣的。当期无法满足用户需求时,用户可能会选择价格更昂贵的同厂商的高性能大模型。

虽说这些都是正常的商业宣传行为,但势必会对很多没加入价格战的创业公司带来巨大打击。不同于云厂商大模型的背靠大树好乘凉,很多创业公司承受不住如此大的降价。

所以本次价格战并没有卷入太多创业公司,也有人对价格战的行为表示不理解。“我觉得大模型公司不会这么不理智,因为技术是最重要的,如果技术不行,纯粹靠贴钱方式去做生意,我们绝对不会跟这样的定价做对标。如果以后中国就这么卷,大家宁可赔光通输都不让你赢,那么我们就走海外市场。”零一万物创始人李开复如是说。

这次的价格战本质上还是在技术遇到瓶颈、产品同质化严重的大环境下,大模型厂商宁愿烧钱也要打淘汰赛,今年注定会再次上演大模型行业新一轮淘汰赛。

正如云计算市场的竞争,大模型的价格战一经开打就很难回头,这种非良性的竞争状态或许会长期持续。

硝烟散去,满地狼藉,可能剩者为王,也可能全盘皆输。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
百模大战进入新阶段,先把价格给大家打下来
大模型“价格战”爆发,谁能抢占商业化制高点?|价格战
大模型“以厘计价”,谁能扛住价格战?
刚刚,字节跳动放大招!
抖音豆包成年轻人AI顶流!字节跳动大模型家族登场,tokens价格比行业低99%
AI逼近,张一鸣比马云更危险
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服