
前沿资讯
1747910882更新
0
法国AI初创公司Mistral AI宣布联合开源企业All Hands AI发布全新开源模型Devstral。这款模型专为软件工程代理(SWE Agent)设计,240亿参数,所需算力极低,可在笔记本电脑上运行。Mistral AI研究科学家巴蒂斯特·罗齐埃(Baptiste Rozière) 强调:“我们希望开发者能真正‘拥有’自己的AI工具,在本地私密运行、自由修改,这正是开源精神的核心。”
Devstral延续了Mistral早期Codestral系列的成功。Codestral于2024年5月推出,是一个220亿参数模型,可处理80多种编程语言,在代码生成和补全任务中表现出色,其受欢迎程度和技术优势推动了快速迭代,如基于Mamba架构的增强版Codestral-Mamba和Codestral 25.01等,这些为Devstral从快速补全扩展到完整代理任务执行奠定了基础。
该模型具有128K token的上下文窗口,使用拥有131K词汇量的Tekken分词器,支持通过Hugging Face 、Ollama等主要开源平台部署,也可通过Mistral的Le Platforme API访问,有API调用和本地部署两种模式。目前Devstral作为研究预览版发布,采用Apache 2.0开源协议,Devstral不仅是代码生成工具,更是构建自主软件工程系统的基础模型。
性能方面,Devstral在SWE-Bench Verified基准测试中获46.8%的分数,领先所有先前开源模型及包括GPT-4.1-mini在内的多个闭源模型超20个百分点。它从Mistral Small 3.1经强化学习和安全对齐技术微调而来,还针对集成到OpenHands、SWE-Agent和OpenDevin等代理框架优化,能借助这些框架与测试用例交互、导航源文件并执行多步骤任务。为确保稳健性,模型在不同代码库和内部工作流程中进行了测试,避免过度拟合。
虽然Devstral目前作为研究预览版发布,但Mistral和All Hands AI已经在开发具有扩展功能的更大后续模型。Mistral AI研究科学家罗齐埃指出:“小模型和大模型之间总会有差距,但我们在缩小这一差距方面已经走了很长一段路。即使与一些更大的竞争对手相比,这些模型的表现已经非常出色。”Mistral开发者关系负责人杨索菲(Sophia Yang)博士指出:这不仅是代码补全工具,而是能自主导航项目、解决实际问题的‘虚拟工程师’。