字节掀桌，和BAT赌明天

更新时间：2024-05-28 02:42:53作者：橙橘网

字节掀桌，和BAT赌明天

价格战在中国，从来都是最熟悉、最痛苦，也终究是无可回避的情节。短短10天时间，一度选择“等等看”的字节，猝不及防地打出“低价”王炸，将大模型战火拉进了下一序列。

5月15日，在字节跳动“FORCE原动力大会”上，跳过介绍和过渡，火山引擎总裁谭待一步到位亮出了“豆包”的最新价格：0.0008元/千Tokens，宣布这是低于行业99.3%的“地板价”。

他同时高调向阿里和百度喊话：此次是主力模型降价，不是用小模型降价来混淆视听。“很遗憾阿里和百度还没有128k可精调的模型，但我期待他们的更新。”

▲（谭待于2024“FOECE大会”。图源/火山引擎）

「市界」从多方了解，阿里、百度、腾讯等头部玩家对字节的这次出击缺少准备；各方虽感无奈，也只能被动追随。

5月21日，阿里云宣布：旗下多款大模型的推理输入token降价，降价幅度为67%-97%。同日，百度文心大模型旗下两款模型ENIRE Speed、ENIRE Lite宣布免费。5月22日，腾讯云宣布，旗下多款大模型推理输入token降价，降价幅度为50%-87.5%。

站在行业层面看，某种程度上大模型的价格战终不可避免。一方面，推理算力价格的不断降低构成了价格战基础；而生成式大模型发展仍处于早期阶段，各家差距尚不明显。同时，卷应用、卷生态的蓝海正在展开，云厂商的降价，将吸引更多开发者、商户共同做大蛋糕。

不过相比于大厂的高调作战，「市界」接触的大模型开发者、创业者们多数表现平淡。虽然他们相信：价格战会打消一部分AI成本顾虑，但更多人认为，大厂降价开源的多是小模型，使用起来也有许多限制，降价远没有那么货真价实。

01、“鲶鱼”字节

许多人没猜到，价格战的发起者，会是云厂商巨头里对大模型布局最为滞后与暧昧的字节。

2023年4月，字节跳动火山引擎总裁谭待在与包括「市界」在内的媒体沟通中，曾言之凿凿地表示：“火山引擎自己是不做大模型的，我们做的是服务好大模型创业的公司。字节跳动未来如果推出基础大模型，将会是火山引擎客户之一。”

在去年“百模大战”角逐中，字节一度选择“佛系”跟随。2023年3月、4月，百度文心一言、阿里通义千问先后公布。而字节到了2023年8月，才上线了AI聊天机器人“豆包”。

动作偏“慢”的背后，字节入局云市场较晚、技术与客户储备较弱是原因之一。

一方面，2021年才正式做云的火山引擎在巨头云厂商里，是“最年轻”的一朵。做云三年多来，火山云一直被视为挑战者角色，尚未进入中国云市场份额前五强。

据媒体报道：在2024年1月召开的字节跳动年度全员会上，字节跳动 CEO梁汝波曾提到：公司直到 2023年才开始讨论GPT，而业内做得比较好的大模型创业公司都是在2018年至2021年创立。

但最终字节从低调观望，到主动出击，“转变”或来自于两方面原因：其一，市场经过一年酝酿，竞争逐渐从底层算力训练，进入到了模型优化层的推理算力比拼。对于算力“卡脖子”问题，国内市场也逐渐找到了通过调整模型结构，以降低推理成本的办法——如采用MoE（Mixture of Experts）混合模型架构等策略。

目前，虽然用于算力训练的高端芯片仍然紧缺，但用于优化模型的、相对低端的推理算力芯片，供应已比较充足——这让降价也变得有条件发生。

同时，阿里等玩家的积极出击，或也不断给字节带去了扰动和求变的决心。

近日据“腾讯科技”报道，2023年年中，字节曾在市场上寻觅大模型投资标的。但在几乎与创企MiniMax达成协议的关口，字节突然临场反悔，决定“要么自己做，要么收购一家公司”。

站在集团层面，押注大模型还有更加现实的意义。2024年，TikTok海外市场深陷风暴眼中，字节对站上新风口的渴求尤为迫切；外界也将字节在大模型上的密集动作描述为“寻找下一个TikTok”。

进入2023年底，字节的AI布局陡然提速。据“凤凰科技”报道，字节正式组建了Flow部门，专注于AI大模型的应用研发。2024年3月，飞书产品副总裁齐俊元调至Flow部门，主要负责豆包的PC端业务。2024年4月，历任今日头条CEO以及TikTok产品技术负责人的朱文佳开始整体负责字节AI业务，向梁汝波汇报。

一位知情人士向「市界」透露：一旦下定决心，字节就确立了“全面横向对标”的大模型战略，在应用层、连接层、技术层，都不愿放过。换句话说，市场中已有的整条大模型产业链，几乎全被字节视为“敌人”。

虽然身位落后，字节也有大模型必需的两大利器：算力与流量。据“晚点Latepost”报道，2023年春节后，字节曾“抢购”了超10亿美元的英伟达GPU。

而一旦抖音助力，字节亦有能力快速抬高任何产品的用户大盘。2023年底，据媒体多方统计，豆包的月活用户还远逊于文心一言和通义千问。而到今年3月前后，据QuestMobile最新报告显示：2024年3月，“豆包”App月活用户为2328.2万，在AIGC类应用中排名第一——这自然离不开字节的庞大流量池扶持。

02、阿里、百度、腾讯各怀心事

字节突然下场，改写了游戏规则；对阿里、百度等领跑者来说，“低价”的标签不容这样轻易地被夺走。

5月15日字节发动价格战后，市场一度沉寂数日——某种程度上，大家在等待头号玩家阿里的表态。从2023年以来，阿里在云计算市场上，一直表现为寸土必争。其大模型应用层也堪称国内最丰富，既有自研通义大模型，也囊括了最全的模型和开放生态。

5月21日，阿里云终于宣布，高调跟进价格战：旗下九大模型降价。其中，对标GPT-4的Qwen-Long输入价格直降97%，仅需0.0005元/千tokens。阿里的正面硬刚，不仅意味着击穿了“豆包”定价；且降价的旗舰大模型覆盖的任务场景、目标客群也与字节高度统一。

毕竟对于内忧外患的阿里来说，大模型已被视为不容有失的、决定未来十年的船票。过去两年，阿里云虽然在市场份额、营收上仍位列行业第一，但在争夺政企云等节节受挫后，增速比起逐年仍以两位数抬升的华为云、天翼云等，已只余个位数。

阿里云迫切需要大模型为自己注入增长动力。近日，据“数智前线”消息，阿里云内部提出了一个非常激进的目标：三年之内，要拿下国内大模型云计算市场的90%。

另据阿里内部人士向「市界」透露，2023年阿里新任CEO吴泳铭上位后，在其投资背景和马云的支持下，阿里用“现金+算力”的模式，积极投资了月之暗面、Minimax、智谱AI、百川智能和零一万物，集齐“大模型五虎”。这些明星创企，一方面会作为客户在阿里云上训练大模型，一方面也透过阿里云，向外提供着服务。

相比起主打开放生态的阿里，更希望效仿“微软+OpenAI”，做高质量“垂直整合”的百度，在价格战面前的态度更为复杂。

在豆包宣布低价的当天，一位百度内部人士告诉「市界」，公司反应并不积极，更相信“客户真正关注的是效果，而非单纯低价”。5月16日的百度财报电话会上，百度智能云事业群总裁沈抖也指出：面对其他厂商的价格战，同样重要的是，评估不同模型在不同工作负载下的性能比，而不是仅仅关注表面价格。

但看到阿里下场后，百度还是用最快的速度跟上了。5月21日下午，百度宣布文心系列大模型中的ERNIE Speed（8K、128K）、ERNIE Lite（8K、128K）两款大模型的API将免费提供。

但不同于字节与阿里直接对旗舰级产品开放降价，百度免费的两款大模型，是于今年3月份发布的轻量级大模型，被动防御意味更浓。

阿里、百度表态后，隔日，腾讯云也作出了应对：官宣六款大模型API降费，其中混元-lite直接免费提供服务；混元-standard-256K的最新输入价格定为0.12元/千tokens，相当于降价87.5%；最高配置的万亿参数模型混元-pro的输入价格则从0.1元/千tokens降至0.03元/千tokens，降幅达70%。

相比之下，更擅长做产品和SaaS应用的腾讯，在AI技术层、客户层不及阿里、百度，跟随意味也更加明显。

在过去一年的“百模大战”中，腾讯更多侧重在混元大模型中，将自家的腾讯会议、企业微信、腾讯文档等产品装入，努力拓展集成了AI能力的几大产品客群。不过，也有市场声音认为，当生成式AI技术步入稳定期，开始应用层比拼后，握有产品线、流量、现金的腾讯，有能力以逸待劳，快速追上。

在腾讯云宣布降价同日，科大讯飞也挤上了降价的“末班车”，宣布Spark Lite-8K提供免费服务，Spark 3.5 Max-8K则降价至0.21-0.3元/万tokens区间。但不同于几家大厂，科大讯飞不涉及公有云服务，模型参数规模也较低。一位科大讯飞员工委婉地向「市界」表示了讯飞在降价潮中的焦虑：“跟友商们比，还有进步的空间。”

03、B端客户冷眼旁观

经过一个多星期的酝酿，这场如“618大促”般热闹的价格战，以大厂的悉数入场收官。但在高调的大厂和应用者之间，又快速拉开了火热与冷静的鲜明对比。

首先，不少开发者们发现，大厂所谓的“免费”有不少限制条件。例如，百度、讯飞等拿出的降价产品，均是偏轻量化的版本，只适用于推理量级小、场景简单的企业“尝鲜”使用。

此外，本轮降价更多聚焦于“API调用”场景——这也侧面说明，大模型行业仍处于早期阶段。

2023年，谭待便曾表示：云厂商按token消耗数量计费，无法真实反映不同业务、场景的客户价值，并非很理想的商业模式。

多位行业人士也对「市界」表示，在API层面的降价，更像“试用装”鱼饵——大厂希望借此达成的是“公有云+API”的闭环：B端用户被API吸引而来，结合使用深度，向公有云租用推理算力；未来在数据存储、高级功能、API调用次数、高峰期使用溢价等层面形成再付费。

因此，价格战也可被看作是大厂的一场“获客”游戏；而长期的角力关键，发展较成熟的云市场早已给出过答案。

近日，Lepton AI创始人、阿里巴巴原副总裁贾扬清的一则朋友圈留言在业界广为流传。他表示：“企业在使用AI的时候，并不是成本驱动的。不是因为API贵才没人用，而是因为企业首先得搞清楚怎么用起来产生业务价值，否则的话，再便宜也是浪费。”

因此，不少中小大模型创企也站在了大厂的另一极，选择理性观望，而不是跟随。

5月22日，在腾讯、科大讯飞同步宣布降价时，百川智能发布了最新一代基座大模型Baichuan 4，并推出了首款AI搜索助手“百小应”，没有跟随价格战。

创始人王小川在会后接受媒体采访时表示，价格战仅是大厂的游戏。“核心要看你的商业模式是什么。如果你是做to B服务的时候，降价最后卖的不是模型本身，卖的是整套云服务。”

零一万物创始人李开复对价格战的态度更为消极。他直言大模型价格战是双输打法，可以类比曾经的共享单车烧钱大战。“以后可能中国就是这么卷，大家宁可赔光通输也不让你赢，那我们就走外国市场。”

据零一万物API平台负责人蓝雨川透露：目前零一万物Yi-Large的API定价是20元对应百万tokens，大概是GPT-4 Turbo成本和定价的1/3。对此，李开复自信地表示：“我们的定价非常合理。”

04、能引爆商业化元年吗

不论创企是否选择、或有能力跟随价格战，当行业被价格燃起热火后，接下来比拼算力储备、补贴力度、技术实力的淘汰竞赛势必会加速展开。留给各家建立护城河的时间，也将急剧压缩。

对于迫切希望打开to B市场入口的大厂而言，彼此之间图穷匕见，争夺API用户的“贴身肉搏”已经率先展开。

一家小B端客户告诉「市界」，在5月15日发布会举办之前，火山方面已多番与其进行接触，希望其能够从原有的API服务商上转用豆包。另一位开发者则表示，近日当他在豆包大模型官网页面注册了登录账号后，短短一小时内就接到了火山引擎方面的沟通电话，“挂断后第二天他们还接着打”。

每一个分散的需求，开始被巨头case by case般地注意和争夺——虽然大厂力推的价格杀器，未必是客户选择的首要因素。

一位企业用户告诉「市界」，自己一直在被火山“密集轰炸”，“但最后是否会接入豆包，要试用一下看看效果再做决定”。

留学文书GPT创业者小鱼则透露，在创业之初探索MVP（最小化的可行性产品）阶段，小鱼试用了国内的大部分大模型产品后，最终选择接入的API并不最具经济性。

他谈道：“当时我注意到百度文心的API定价最为便宜，但它的效果尤其是英语效果实在是无法满足我们的需要，所以也被排除了。”

价格之外，各家云大厂能够提供的服务附加值，也是用户更为看重的方向。例如，使用豆包是否会获得抖音的流量扶持；使用通义千问，阿里的生态能否提供整体支持，将是达成更深层绑定的关键因素。

同时，经过一年的大模型基础设施铺陈，AI的爆款级应用还有多远，也再度被广泛期待。

毕竟在移动互联网早期，也曾有移动App付费还是免费的商业化困局。但这些疑问，很快被微信、支付宝、美团、滴滴的一场场免费商战进行了颠覆式解答。而随着现象级的AI应用产生，能否卷起新的商业世界，才是巨头们不惜成本投入的核心原因。

近日，猎户星空创始人傅盛在回应价格战问题谈到：大降价宣告了大模型创业公司，必须寻找新的商业模式。而寻找超级应用的重要性，也再升了一级。

作者 | 董温淑

编辑 | 李原

运营 | 刘珊

本文标签：字节百度百川掀桌大模型应用层

上一篇：字节掀桌，和BAT赌明天

下一篇：存量酒店资产如何改造？仲量联行支招：可在这几方面重新定位

字节掀桌，和BAT赌明天

相关文章

为您推荐

字节掀桌，和BAT赌明天

存量酒店资产如何改造？仲量联行支招：可在这几方面重新定位

大利好全数捞不到，广州楼市趋势难改

预计12月底完工！花都：集群街2号居民楼已完成拆除开始重建

国家大基金三期成立，六大行持股约33%

新加坡教育奖学金靠谱吗？那些拿奖学金到新加坡上学的孩子，现在怎么样了

热门文章

热门推荐

最新文章