小米MiMo-V2.5系列大模型开启公测:从"能用"到"好用"的全面跨越

前沿资讯 1776933725更新

0

小米人工智能实验室今日凌晨正式推出MiMo-V2.5系列大模型。

此次发布的系列包含四款产品:MiMo-V2.5-Pro、MiMo-V2.5、MiMo-V2.5-TTS Series以及MiMo-V2.5-ASR,实现了从底层推理能力到上层应用的全方位升级。

MiMo-V2.5-Pro被小米定位为"迄今最强大的模型",在通用智能体能力、复杂软件工程以及长程任务处理等维度上,已能与Claude Opus 4.6、GPT-5.4等全球顶尖Agent模型正面较量。

内部测试中,MiMo-V2.5-Pro展现出令人印象深刻的长程任务能力:搭配合适的运行框架,它可以稳定完成单次涉及近千轮工具调用的复杂任务;在智能体场景下的指令遵循能力也明显提升,既能精准捕捉上下文中的隐性要求,又能在超长周期内保持逻辑一致。

评测数据显示,在业界公认最难的推理测试之一Humanity's Last Exam,MiMo-V2.5-Pro总分48.0分(含无工具与有工具两部分),超越V2-Pro(40.0),接近Gemini 3.1 Pro(51.4)。

针对顶级开源项目的前沿软件工程挑战FrontierSWE,MiMo-V2.5-Pro位列#3.4,领先V2-Pro(#5.0)、Gemini 3.1 Pro(#3.9),仅次于GPT-5.4(#1.9)和Claude Opus 4.6(#2.0)。

在业界公认的软件工程能力测试标杆SWE-Bench Pro中,MiMo-V2.5-Pro得分57.2分,与Claude Opus 4.6(57.3)和GPT-5.4(57.7)基本持平,超越Gemini 3.1 Pro的54.2分。

MiMo-V2.5是此次发布的另一款核心产品,定位于"为Agent场景而生的原生全模态大模型"。它能够同时处理图像、音频、视频等多种模态输入,并将理解转化为行动。

关键升级包括:Agent能力全面超越MiMo-V2-Pro,胜任日常简单任务的同时API成本降低约50%;多模态感知全面超越MiMo-V2-Omni,在VideoMME、CharXiv、MMMU-Pro等权威评测中逼近甚至超越业界顶级闭源模型。

Token效率:节省42%至50% 。MiMo-V2.5全系列针对Token效率进行了深度优化。在达到相同ClawEval基准分数情况下:MiMo-V2.5-Pro相比Kimi K2.6节省42% Token;MiMo-V2.5相比Muse Spark节省50% Token。这意味着开发者在使用该模型构建应用时,有望以更低成本获得接近前沿水平的智能支持。

配合新模型发布,小米同步优化了Token Plan定价方案:

Credits速率更新:MiMo-V2.5消耗1 Token = 1 Credit;MiMo-V2.5-Pro消耗1 Token = 2 Credits。取消原有1 Token = 4 Credits计费方式,不再区分256k和1M上下文窗口的Credit倍率。

夜间专属优惠:北京时间每天00:00至08:00,所有模型Credits消耗速率在原有基础上再打8折。

订阅折扣:新增"连续包月"模式,老用户开通自动续费享次月7折,新用户享次月77折;新增"包年"周期,一次订阅享全年88折。

上线福利:所有已购买Token Plan的用户(截至北京时间4月22日22:00前)的Credits额度将全部重置清零。

小米同时宣布,MiMo-V2.5-Pro和MiMo-V2.5模型即将全球开源,敬请期待。

目前用户可通过Xiaomi MiMo开放平台(platform.xiaomimimo.com)接入API,或在Xiaomi MiMo Studio(aistudio.xiaomimimo.com)体验产品。

从此次发布可以看出小米在AI领域的战略清晰:MiMo-V2.5-Pro主攻高复杂度长程任务,MiMo-V2.5覆盖绝大多数通用Agent场景并具备原生全模态能力,V2.5-TTS和V2.5-ASR则补全了语音交互的关键环节。

随着Token Plan的价格优化和开源计划的推进,小米正试图在全球AI大模型竞争中构建差异化优势。