自助文字广告位，限时特惠！

卷王豆包上桌了：谁压力倍增？

2,880 00

卷王豆包上桌了：谁压力倍增？

厂商停不下来，反映的恰恰是对未来的焦虑。在这场大模型的军备竞赛中，豆包想要上演大力出li>一是包含模型推理的基础服务，指的是根据输入的信息内容，给出回答的过程。简单来说就是实际使用模型的过程。这部分各家都有不同的模型标准。

二是模型精调，厂商可以根据客户需求按token使用量（训练文本训练迭代次数）计费，训练完成后出账，按量后付费。

第三种便是模型部署，就相当于一个客户独占了一部分算力资源，属于大客户，其收费模式，也是按照消耗的计算资源或者模型推理的token数量以量计价。

这3种收费模式，代表的也是大模型开发由浅入深的过程。而各大科技公司疯狂砍价的，其实是种基础服务，即标准版模型的推理费用。而这部分定价又分成了输入和输出两部分。简单来说，输入就是用户提问的内容，而输出则是大模型的回答。在调用大模型时往往会根据输入和输出的token数量，进行双向计费。这种细微差异，很容易成为大模型公司的套路。

例如，豆包的通用模型DoubaoPro-32k，输入价格为0.8元/百万tokens，按照官方说法是比行业便宜了99.3%，一些主流模型也都开始了降价，比如阿里云三款通义千问主力模型Qwen-Turbo价格较之前直降85%，低至百万tokens0.3元，Qwen-Plus和Qwen-Max的输入价格分别再降价80%和50%，分别为0.8元/百万tokens和20元/百万tokens。但输出价格方面有所差别，2元/百万tokens的价格与Qwen-Plus、DeepSeek-V2等同行持平，甚至比比Qwen-Turbo、GLM-4-9B等一些同行产品价格更高。

再看的豆包视觉理解模型Doubao-vision-pro-32k，输入化为每百万tokens的售价为3元，大概是0.4美元，输出直接来到了9元，大概为1.23美元。按照豆包说法，这个售价比行业平均价格便宜85%。但对比几个直接竞争者:阿里的多模态模型Qwen-VL系列在最近降价后与其价格一致;多模态的Gemini1.5Flash模型每百万输入tokens报价为0.075美元、每百万输出tokens成本为0.3美元，对于较小的上下文（小于128k）还另有折扣价;GPT-4omini则是输入0.15美元，输出0.6美元。

卷王豆包上桌了：谁压力倍增？

不过不止豆包，国内其他厂商基本也都有类似的降价套路。例如百度宣布免费的ERNIE-Speed-8K，如果实际部署，收费就变成了5元/百万tokens。还有阿里的Qwen-Max，实际与字节跳动的豆包通用模型Pro-32k一样，只是降低了输入的价格。

值得一提的是，标准模型的推理费用必然不会是企业在未来大模型商业化中唯一的收入来源。随着大模型被更多开发者使用，规模化商用加速，大模型的商业化路径还会逐渐走向多元化，包括更深入的模型定制化、服务化和聚焦行业应用等。但对于当下的厂商来说，将大模型的标准版推理费用降低到几乎可以忽略不计，无疑是抢占用户、获取企业市场的重要手段。