文档

MiMo-V2.5 系列调价公告丨 百万亿 Token 创造者激励计划收官

过往几个月,我们通过 MiMo Orbit、百万亿 Token 创造者激励计划等活动,让更多人有机会体验 MiMo ,并解决真实的问题——这是 MiMo 在规模化应用道路上的第一步。

而现在,随着底层技术的不断精进,我们终于可以做一件更彻底的事——对整个模型价格体系进行一次永久性翻新

本次公告核心速览:

  • MiMo-V2.5 系列 API 永久降价

  • Token Plan 计费体系优化,用量提升至原来的 5-8 倍

  • 百万亿 Token 创造者激励计划圆满收官

  • 当前有效 Token Plan 用户额度全量重置

生效时间:北京时间 2026年5月27日0点

MiMo-V2.5系列API永久降价

相比原始 API 定价,新定价最高降幅可达 99%,且不再区分输入长度。

图片

本次调价于北京时间 5 月 27 日 0:00 正式生效,全球同步调整,诚邀各位开发者接入体验。

TokenPlan 计费体系优化

  • 加量不加价,用量提升至原5-8倍,为您解锁更充沛的生产力

    • 示例:在Agent或Code场景下,可用 Token数量为:

图片

  • 计费规则调整,更加清晰易懂,所见即所得。

图片

百万亿 Token创造者激励计划圆满收官

「百万亿 Token 创造者激励计划」自 4 月 28 日上线以来,受到全球用户的热情追捧和广泛关注,截止北京时间 5 月 26 日 16:08,100T Tokens 已全部提前发放完毕,活动提前收官、圆满结束,感谢广大开发者的踊跃参与!

注:Apache 软件基金会成员专属福利活动长期有效、可继续申请,不受本次收官影响。

图片

惊喜:现有 TokenPlan 用户额度全量重置

无论当前套餐用量如何,所有已订阅 Token Plan 且当前仍在有效期的用户(包括参与百万亿 Token 创造者激励计划并获得 Token Plan 的用户,涵盖 Apache 软件基金会专属福利用户)的 Credits 额度将于北京时间 5 月 27 日 0:00 全量重置,并按新计费规则执行。

One More Thing:针对 Token Plan 已过期的历史付费用户,我们也同样准备了惊喜好礼,将在未来一周宣布,请保持关注。

推理技术优化说明

本次价格调整背后,离不开小米技术团队在推理系统上的持续优化。

我们基于 SGLang HiCache 完整支持 SWA(Sliding Window Attention),将 KV Cache 在 GPU 显存、CPU 内存、SSD 等多级存储之间的数据搬运量降低至优化前的近 1/7,并将可缓存 token 数量提升至优化前的近 5 倍,显著提升了缓存命中率和推理效率。

同时,我们通过优化专家并行方案、输入长度分桶策略等,进一步提升了集群输入吞吐能力,从而在保障服务质量的前提下持续降低单位 token 服务成本。

结语

技术的价值,最终要体现在被使用的广度上。

依靠技术的持续创新,我们希望通过提供兼具低成本与顶尖能力的模型服务,撬动真实、持续、规模化的推理需求,推动完整 AI基础设施链条的建设。

让更多的人能用到更好的模型——这是 MiMo 不变的使命。

更新时间 2026 年 05 月 27 日

Copyright©2026 Xiaomi. All Rights Reserved | Cookie Policy | Cookie Preferences

We use cookies and similar technologies of our own to ensure the proper functioning of the website, customize content according to user preferences and analyze users' interactions on the website, as well as their browsing habits. You can find more information in our Cookie Policy. Select an option or go to Cookie Settings to manage your preferences. Learn More.