Kimi推出全新K2 Thinking:推理与自主搜索能力全面进化

前沿资讯 1762500719更新

0

导读: Kimi 推出新一代开源模型 Kimi K2 Thinking,主打“边思考、边使用工具”的原生能力,在多项测试中刷新纪录。它能连续自主推理 300 轮,完成复杂搜索、编程与写作任务,标志着「模型即 Agent」理念的进一步落地。


月之暗面带来了最强开源作品:Kimi K2 Thinking

这款新模型的核心理念是「模型即 Agent」,也就是让系统在思考过程中主动使用搜索、编程、浏览等工具,从而完成真正复杂的推理任务。

在多项关键测试中,Kimi K2 Thinking 都取得了行业领先(SOTA)成绩。 在人类最后的考试(Humanity’s Last Exam)中,其综合推理成绩达 44.9% ;在 OpenAI 发布的网络浏览测试(BrowseComp)中,更以 60.2% 的得分刷新纪录,几乎是人类平均水平的两倍。

Kimi K2 Thinking 的一大突破,是其能在无人干预的情况下,持续完成高达 300 轮 的思考与工具调用。这意味着,用户在 kimi.com 或 Kimi App 上与它对话时,它能像真正的研究员那样“边思考边行动”,不断检索、验证、再推理,直到找到答案。

在复杂信息检索测试 BrowseComp 中,Kimi K2 Thinking 展现出出色的耐心与钻研精神。它会在多轮搜索中主动验证假设、核对数据,并像人类研究员一样通过权威网站查找原始资料。

新模型在编码任务中也有明显提升,特别是在 HTML、React 等前端开发任务上,能更流畅地将想法变成真实可运行的产品。

除了推理与编程,Kimi K2 Thinking 在写作、学术研究和情感交流等方面也全面升级。 它能把零散的灵感整理成完整的故事,也能在技术论文中保持逻辑严谨。面对个人话题时,它的语气更自然、有温度,能帮助用户理清思路、给出具体建议。

为了在大规模推理任务中保持速度与稳定性,Kimi 团队采用了 量化感知训练(QAT) 技术,将模型优化为 原生 INT4 量化结构。这让 Kimi K2 Thinking 在保持性能的同时,推理速度提升约 2 倍,对国产加速芯片的支持也更友好。

目前,Kimi K2 Thinking 已在 kimi.com 与最新版 Kimi App 上线,用户可在「工具箱」中开启“长思考”模式,体验它的多轮推理能力。 API 已开放至 Kimi 开放平台(platform.moonshot.cn),并提供 256K 上下文支持,适合开发者和研究者集成使用。

随着 Kimi K2 Thinking 的发布,“能主动思考的 AI 助手”正从概念变为现实。它不仅能理解指令,更能像人一样探索答案,为复杂任务提供更具创造性的解决方案。


参考资料:https://mp.weixin.qq.com/s/oQp1kFpoYFhYQ8GzbwZLyA