百川智能开源发布Baichuan-M2:32B参数登顶全球开源榜首,成本仅为同类方案1/57

前沿资讯 1754905259更新

1

8月11日消息,百川智能今日宣布,正式发布新一代开源医疗增强大模型:Baichuan-M2。该模型在OpenAI权威医疗健康评测集HealthBench上获得60.1分,不仅以32B的小尺寸反超OpenAI最新开源模型gpt-oss-120b(57.6分),更在全球所有开源模型中排名第一,并力压Qwen3-235B、Deepseek R1、Kimi K2等多款旗舰模型。

今年1月,百川智能率先推出“AI患者模拟器”,基于真实数据构建上万个不同年龄、性别、症状的虚拟患者,模拟数百万次诊疗过程,并由此开源了行业首个医疗增强模型Baichuan-M1。时隔7个月,Baichuan-M2在升级患者模拟器的基础上,引入端到端强化学习与大型验证系统,实现医疗能力的跨越式提升。

Baichuan-M2在隐私保护与私有化部署方面进行了极致轻量化优化,量化后精度接近无损,可在单卡RTX4090上部署,成本较DeepSeek-R1 H20方案降低57倍,并已完成国产主流芯片的适配,方便医疗机构利用现有硬件快速部署。面向急诊、门诊等高交互速度需求场景的Baichuan-M2-Spec版本,单用户Token生成速度提升74.9%。

多数头部模型主要用数学与代码数据强化学习,而百川智能首创以高质量医疗数据推动通用能力增长的模式,使M2在数学、写作、指令遵循等核心能力上不降反升,可广泛应用于医疗以外领域。

在更严苛的HealthBench Hard复杂医疗问题子集上,Baichuan-M2得分34.7,成为全球第二款突破32分的模型,仅次于GPT-5,并超越所有其他闭源顶尖模型。专家指出,其在知识更新速度、推理深度与全面性上,已可为医生提供强力支持。

Baichuan-M2深度对齐中国权威医学指南与政策,能够根据本地患者特点和医疗资源优势,给出最契合的诊疗方案。在肝细胞肝癌等案例中,其建议与国家卫健委最新版《原发性肝癌诊疗指南(2024)》高度一致,相较于国际通用方案更贴近中国临床实际。

在与北京市海淀区卫健委、北京大学第三医院、国家儿童医学中心等合作测试中,M2在多学科会诊中展现出与资深主任医师相当的推理与决策能力,不仅能精准锁定病因,还能给出条理清晰、可执行性强的治疗方案与应急预案。

百川智能表示,Baichuan-M2的技术创新不仅提升了医疗AI的专业水平,也为通用大模型的强化学习提供了新思路。该模型已免费开源,为医疗行业提供了低成本、快速落地的世界级解决方案。

参考资料:反超OpenAI,百川开源大模型医疗能力登顶世界第一