模型规格
模态
输入文本、图像、视频、音频
输出文本
模型能力
全模态理解
深度思考
工具调用
流式输出
联网搜索
结构化输出
Cache 缓存
性能
上下文长度1M tokens
最大输出128K tokens
RPM100
TPM10M
模型价格
人民币
输入(缓存命中)
¥ 0.02元/百万 tokens
输入(缓存未命中)
¥ 1元/百万 tokens
输出
¥ 2元/百万 tokens
美元
输入(缓存命中)
$0.0028美元/百万 tokens
输入(缓存未命中)
$0.14美元/百万 tokens
输出
$0.28美元/百万 tokens
模型优势
原生全模态感知
支持图像、视频、音频、文本的原生理解,实现跨模态精准感知与长程推理,综合感知能力跻身行业前沿。
1M 上下文
支持长视频追踪、长文本分析、长时间画面时序推理等长程任务,大幅拓展模型在复杂长流程场景中的适用范围。
强大的全模态 Agent 能力
具备原生 Agent 执行能力,可高效完成浏览、理解、推理与操作等复杂任务,日常任务表现比肩 mimo-v2.5-pro。
性能与效率兼备
在保持领先能力的同时,实现更优的 token 效率,位于性能与效率的 Pareto 前沿。

选择适合你的接入方式
按量计费 API 接入
2
3
示例代码
接口格式兼容 OpenAI 和 Anthropic 协议,现有项目仅需修改 base_url 和 model 即可无缝迁移。
import os
from openai import OpenAI
client = OpenAI(
api_key=os.environ.get("MIMO_API_KEY"),
base_url="https://api.xiaomimimo.com/v1"
)
completion = client.chat.completions.create(
model="mimo-v2.5",
messages=[
{
"role": "system",
"content": "You are MiMo, an AI assistant developed by Xiaomi. Today is date: Tuesday, December 16, 2025. Your knowledge cutoff date is December 2024."
},
{
"role": "user",
"content": "Please describe the content of the provided images, audio and videos respectively"
},
{
"role": "user",
"content": [
{
"type": "image_url",
"image_url": {
"url": "https://example-files.cnbj1.mi-fds.com/example-files/image/image_example.png"
}
},
{
"type": "input_audio",
"input_audio": {
"data": "https://example-files.cnbj1.mi-fds.com/example-files/audio/audio_example.wav"
}
},
{
"type": "video_url",
"video_url": {
"url": "https://example-files.cnbj1.mi-fds.com/example-files/video/video_example.mp4"
},
"fps": 2,
"media_resolution": "default"
}
]
}
],
max_completion_tokens=1024,
stream=False,
extra_body={
"thinking": {"type": "disabled"}
}
)
print(completion.model_dump_json())Token Plan 订阅
在 MiMo Claw 中使用
MiMo Claw 搭载 mimo-v2.5-pro 最新旗舰模型、mimo-v2.5 多模态理解与 mimo-v2.5-tts 语音大模型,可限时免费体验。