模型规格
模态
输入模态文本
输出模态文本
模型能力
深度思考
工具调用
流式输出
联网搜索
结构化输出
Cache 缓存
性能
上下文长度1M tokens
最大输出长度128K tokens
RPM100
TPM10M
模型价格
人民币
输入(缓存命中)
¥ 0.025元/百万 tokens
输入(缓存未命中)
¥ 3元/百万 tokens
输出
¥ 6元/百万 tokens
美元
输入(缓存命中)
$0.0036美元/百万 tokens
输入(缓存未命中)
$0.435美元/百万 tokens
输出
$0.87美元/百万 tokens
模型优势
极致 Agent 能力
SWE-bench、TAU-bench 等主流 Agent 评测全面领先,复杂多步任务一次性完成率大幅提升,真实工程场景验证可用。
长程代码开发
4.3 小时内满分完成北大研究生数周才能完成的编译器,专为大型代码库端到端开发而设计。
1M 超长上下文
支持 1M tokens 上下文,完整处理超长合同、代码库与研究报告,超长执行周期内保持逻辑一致。
模糊指令遵循
精准捕捉上下文隐含的微妙要求,高强度智能体场景下稳定遵循,是真实生产环境效果出色的关键。

真实任务中的表现

编译器工程:北大 SysY 编译器全流程自主开发
耗时 4.3 小时、672 次工具调用,独立完成词法 → 语法 → 语义 → 代码生成全链路,通过全部 233 个测试用例。
全栈应用:全功能视频编辑器独立实现
11.5 小时无人工干预,产出 8192 行代码,涵盖时间轴剪辑、特效叠加与字幕生成。

芯片 EDA:TSMC 180nm 电路完整 EDA 设计
约 1 小时完成 RTL → 综合 → 布局布线 → DRC/LVS 全流程,面积、功耗、时序、良率四项指标均提升一个数量级。
选择适合你的接入方式
按量计费 API 接入
2
3
示例代码
接口兼容 OpenAI 和 Anthropic 协议,现有项目仅需修改 base_url 和 model 即可无缝迁移。
import os
from openai import OpenAI
client = OpenAI(
api_key=os.environ.get("MIMO_API_KEY"),
base_url="https://api.xiaomimimo.com/v1"
)
completion = client.chat.completions.create(
model="mimo-v2.5-pro",
messages=[
{
"role": "system",
"content": "You are MiMo, an AI assistant developed by Xiaomi. Today is date: Tuesday, December 16, 2025. Your knowledge cutoff date is December 2024."
},
{
"role": "user",
"content": "please introduce yourself"
}
],
max_completion_tokens=1024,
stream=False,
extra_body={
"thinking": {"type": "disabled"}
}
)
print(completion.model_dump_json())Token Plan 订阅
在 MiMo Claw 中使用
MiMo Claw 搭载 mimo-v2.5-pro 最新旗舰模型、mimo-v2.5 多模态理解与 mimo-v2.5-tts 语音大模型,可限时免费体验。