DeepSeek 已正式发布 v4 版本,并同步调整定价策略:在高峰时段(每日 9-12 点和 14-18 点),价格将翻倍。此前 V4 预览版曾将折扣价设为永久价,此次改为峰谷定价,主要受算力供应紧张和正式版性能提升预期影响。

DeepSeek 在调价方面保持了透明度——提前邮件通知,计费规则清晰。相比之下,国产大模型行业普遍面临的真正问题是算力短缺导致的服务不稳定。
算力短缺已成常态
随着各家调用量上升,智谱、Kimi 等平台均下调了订阅 Token 量和并发限制,但即便限流仍无法避免工作时间服务掉线。
智谱虽然在国内模型中表现相对突出,但用户频繁遇到需要重新连接的情况,只能错峰使用。
Kimi 的 Token 额度持续缩减,并发限制降至个位数,429 错误频发。用户体验方面,k2.7 的实际表现也受到质疑,有用户认为其水平接近 M3。


根源在于推理算力不足
大模型厂商训练新模型需要算力卡,提供推理服务同样需要。没有充足的算力,普通用户就无法获得稳定且高性价比的服务。
与 GPT 隔三差五重置额度不同,国内平台普遍「抠搜」,这更多是推理服务容量弹性有限的体现,而非单纯的成本考量。
展望
短期内,涨价、限流、429 错误将成为国产大模型的使用常态。长期来看,只有等国产算力供应真正跟上规模,推理成本才有实质下降空间,用户才能获得更稳定的服务体验。
声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。