小米MiMo-V2.5系列API永久降价:不再区分上下文长度,同步优化Token计费体系
发布于:05-27
作者:太平洋快讯

【太平洋科技快讯】小米宣布旗下MiMo-V2.5 系列大模型API于北京时间5月27日0:00正式生效,全球同步调整。相比原始API定价,新定价最高降幅达99%,并取消上下文窗口长度区分。

本次调价覆盖MiMo-V2.5与MiMo-V2.5 Pro两个版本:

输入缓存命中价:

MiMo-V2.5 Pro降至0.025元/百万tokens

MiMo-V2.5降至0.02元/百万tokens

输出价格:

MiMo-V2.5 Pro降至6元/百万tokens

MiMo-V2.5降至2元/百万tokens

同时,小米优化Token Plan计费体系,实现加量不加价,用量提升至原标准的5–8倍,并引入Credits机制简化计费规则。

小米表示,降价依托推理系统深度优化:通过SGLang HiCache与SWA机制,将KV Cache数据搬运量降至原水平的1/7,可缓存token数量提升近5倍;结合专家并行与输入长度分桶策略,提升集群吞吐能力,降低单位token服务成本。

网友评论