小米发布并开源MiMo Code:一款面向长周期任务的终端AI编程助手

前沿资讯 1781147754更新

0

今天,小米正式发布并开源了 MiMo Code V0.1.0。

这是小米 AI 团队最新开源的一款编程助手,基于 OpenCode 打造,定位是Scaling Coding Agents to Long-Horizon Tasks——让 AI 在长周期、多步骤的软件工程任务中保持稳定表现,采用 MIT 协议开源。

那它解决的是什么问题呢?

先说一个大多数人在用 AI 编程工具时会遇到的场景:你让 AI 帮你写一个功能,它哗哗哗写了一大段代码。但如果你今天做了一点,明天打开想继续,它已经不记得你们昨天聊到哪了、你之前提过什么要求、有哪些地方是已经确认过的。结果你只能从头再交代一遍,非常折磨。

这背后有一个根本的原因:AI 模型本身是无状态的——每次对话都是独立的,它不会主动记住任何东西。所有关于你是谁项目是什么之前聊到哪了的信息,都需要人工塞进上下文里。普通的 AI 聊天工具无所谓,反正每次对话就几分钟。但当你做一个需要几十步、上百步操作的大项目时,这个问题就会被无限放大——上下文越来越臃肿,直到装不下了,AI 就会开始遗忘之前做过什么,做着做着就不知道自己卡在哪了。

现有的 AI 编程工具是怎么处理这个问题的呢?大多数做法是让 AI 自己记笔记——让模型自己判断什么时候该保存进度、该记下什么。但问题是,模型并不会主动做这件事,它只有在用户明确要求的时候才会去记,而且记什么、怎么记,也全凭它自己判断。

MiMo Code 换了个思路:让 AI 专心干活,记录这件事完全不依赖 AI 本身,而是用一套工程系统来完成。

具体来说,它内置了一套持久记忆系统,用三层机制来解决AI 健忘的问题。

第一层叫 MEMORY.md,用来存储项目知识——比如项目的目录结构是怎样的、用的是什么技术栈、有哪些开发规范需要遵守。这些信息跨会话持久存在,第二次打开项目时 AI 直接继承,不用重新介绍。

第二层叫 checkpoint.md,用来保存当前会话的状态快照——你做到哪一步了、遇到了什么问题、下一步打算做什么,这层由一个独立的子 agent 自动维护,不需要主 agent 分心。

第三层叫 notes.md,供 AI 随手记录临时想法用的,有点像草稿纸。

这三层文件在会话恢复时自动加载。当上下文快要装不下时,系统会从这些文件里提取关键信息,重建出一个干净的上下文让 AI 继续工作,而不是让它从零开始或者直接崩溃。

用官方的话说:不赌模型自觉,用工程把它兜住。

有了记忆系统,上下文管理的问题还没有完全解决。当上下文快要满的时候,系统需要决定保留什么、丢掉什么。MiMo Code 的做法是预算化注入——给记忆内容分配一个 token 预算,按重要性排序后塞进去。当真的快要溢出时,它会智能地从 checkpoint、项目记忆、任务进展和近期消息中重建上下文,让 AI 能够继续当前的工作。

配合这套机制的是树状任务系统。每一步的进展都被结构化地记录下来,用 T1、T1.1、T1.2 这样的层级来组织。恢复会话时,任务进度不会丢失,你知道自己卡在哪、接下来该做什么。

还有一个有意思的设计是 Goal 停止条件。用过 AI 编程工具的人大概都有感受:AI 很容易出现乐观停止——它觉得自己干完了,实际上条件并没有真正满足。MiMo Code 的解决方案是引入一个独立裁判模型:当 AI 想停下来时,由这个裁判来判断条件是否真正满足,而不是让 AI 自己评价自己。这个判断基于完整的对话记录,所以不会被 AI 的自我感觉蒙蔽。

长周期任务中还有一个痛点——重复工作。今天你花了十分钟手动完成的一件事,明天又要再做一遍。MiMo Code 内置了 /dream 命令,每 7 天自动触发一次,由独立 Agent 读取历史会话和现有记忆文件,执行合并、去重、验证路径有效性,将分散的记忆收敛为一份紧凑的当前状态并更新全局记忆。到了下次使用,它会在合适的时机自动调用这些记忆。同时 /distill 会发现你工作中反复手动执行的操作流程,将高置信度的候选打包成可复用的 skill 或子 agent。简单说就是,它在观察你,然后学着帮你自动化那些你重复干的事。

除了这些让 AI 记得更清楚的能力,MiMo Code 还有一个特色功能叫 Compose 模式。大多数 AI 编程工具的工作方式是拿到需求就埋头写代码,像一个不看导航就上路的司机——看似高效,实则容易跑偏。但不同模型其实各有自己的性格,与不同框架之间的配合效果也不一样。MiMo Code 为 MiMo 系列模型量身打造了一套专属的 Harness 系统,让模型能力与框架深度配合,再用 Compose 模式来实现 1+1>2 的效果。

使用时,只需按 Tab 键切换到 Compose 模式,给它一个简单的想法,它就能自动完成设计、规划、编码、测试、审查的全流程,最终交付一套工业级的成品。

官方展示了一个对比测试:给 Claude Code 和 MiMo Code 下同样的指令——「帮我用 golang 实现一个 redis,需要支持用 redis-cli 连接」。Claude Code 出手很快,代码很快跑通了,但几乎没有配套测试,功能能用却不扎实;MiMo Code 前期花了更多时间做规划,看起来慢了一截,但落到结果上,实现了更丰富的功能,配有完整详尽的测试。官方评价说,算总账反而 MiMo Code 更快——慢写、快验,整体更省心。

在 SWE-Bench 和 Terminal Bench 两个权威测试集上,官方也做了一组对照实验——让 MiMo Code 与 Claude Code 使用同一个 MiMo 模型,只比拼各自的 Agent 系统本身。结果显示:

  • SWE-Bench Pro:MiMo Code 62% vs Claude Code 57%
  • Terminal Bench 2:MiMo Code 73% vs Claude Code 68%在模型完全相同的前提下,MiMo Code 凭借专属 Harness 与 Compose 模式的协同拿到了更优的分数。

除了键盘输入,MiMo Code 也支持语音。动动嘴,活就干了。技术层面由 TenVAD 负责语音活动检测——就是判断你什么时候开始说话、什么时候说完;MiMo ASR 负责把说的话转成文字。两套技术配合,实现按停顿分片转写、文本逐段追加。不过该功能目前仅对 MiMo 登录用户开放

如何使用?

安装非常简便:

  • Mac 和 Linux 用户:终端运行 curl -fsSL https://mimo.xiaomi.com/install | bash
  • Windows 用户:终端运行 npm install -g @mimo-ai/cli装好后,终端输入 mimo 即可启动。官方推荐 Mac 用户在 iTerm 或 VSCode 终端中使用,以获得最佳体验。模型配置方面:
  • 内置 MiMo-V2.5 限时免费通道,无需注册即可使用
  • 也支持接入 DeepSeek / Kimi / GLM 等主流模型 API,以及第三方 Token Plan日常使用:
  • 输入 / 可查看各项配置
  • 所有设置项已全面中文汉化
  • TUI 页面右侧有常驻状态看板,随时观察工作进度GitHub 地址:https://github.com/XiaomiMiMo/MiMo-Code