文档

速率限制

本页列出 Xiaomi MiMo API 开放平台当前支持的全部模型及其限流配额,帮助您在接入前规划请求频率。

限流说明

平台对每个账号设有模型并发上限,服务器负载较高时可能出现响应延迟或 429 报错。建议您合理规划请求频率,在高并发场景下实现请求重试与退避策略,以避免触发限流。

  • RPM(Requests Per Minute):每分钟最多发起的请求数。计算范围为调用同一模型时,单个账号下所有 API Key 的请求总数之和。
  • TPM(Tokens Per Minute):每分钟最多交互的 Token 数。计算范围为调用同一模型时,单个账号下所有 API Key 的请求 Token 总数之和。

文本生成模型

模型系列 模型 ID RPM TPM
Pro 系列 mimo-v2.5-pro 100 10M
mimo-v2-pro 100 10M
Omni 系列 mimo-v2.5 100 10M
mimo-v2-omni 100 10M
Flash 系列 mimo-v2-flash 100 10M

语音识别模型(ASR)

模型 ID RPM TPM
mimo-v2.5-asr 100 10K

语音合成模型(TTS)

模型 ID RPM TPM
mimo-v2.5-tts 100 10M
mimo-v2.5-tts-voiceclone 100 10M
mimo-v2.5-tts-voicedesign 100 10M
mimo-v2-tts 100 10M
更新时间 2026 年 06 月 11 日

Copyright©2026 Xiaomi. All Rights Reserved | Cookie Policy | Cookie Preferences

We use cookies and similar technologies of our own to ensure the proper functioning of the website, customize content according to user preferences and analyze users' interactions on the website, as well as their browsing habits. You can find more information in our Cookie Policy. Select an option or go to Cookie Settings to manage your preferences. Learn More.