
前沿资讯
1751364987更新
0
当地时间6月30日,微软AI团队公布了一项突破性研究成果,其开发的“MAI诊断协调系统”(MAI-DxO)在《新英格兰医学杂志》(NEJM)发布的经典病例中展现出高达85.5%的诊断准确率,远超具备5至20年经验的医生团队的表现。
AI系统早已能在美国医学执照考试(USMLE)等标准化测验中获得高分,但这些考试多以选择题为主,难以全面评估AI在真实临床中的推理能力。微软此次采用了NEJM的304个复杂病例,将其转化为“连续诊断基准”(SD Bench)测试,以模拟医生在接诊过程中逐步提问、检验和判断的完整过程。
MAI-DxO系统是一个由多种AI语言模型组成的“虚拟医生团队”,包含 "假设医生"、"检验选择医生"、"质疑医生"、"管理医生" 和 "检查医生" 等多个角色。该系统通过交互式问诊、动态检查选择和自主推理决策,逐步完成最终诊断结果。微软此次测试了包括GPT、Claude、Gemini、Llama等多个主流大模型,并在MAI-DxO框架下进行协同融合测试。
研究数据显示,最优组合为OpenAI的o3模型配合MAI-DxO。在追求最高准确率的配置下,其准确率达到85.5%,是普通医生平均水平的四倍。MAI-DxO系统在诊断过程中引入了“虚拟成本”机制,模拟真实医疗系统中的资源消耗,在不依赖“无限制检查”的前提下,该组合实现了高性价比诊疗路径,诊断成本比医生低20%,比单纯使用o3模型低70%。
研究人员指出,真实世界的医生往往面临“专科化”限制,一名内科医生无法轻松处理风湿免疫、神经或妇科等领域的难题。而AI不受此限制,能够同时具备广泛知识覆盖与深入推理能力,形成独特的“复合型医疗智能”。
“AI并不是为了取代医生,而是为了扩展他们的能力。”微软AI医疗项目负责人Dominic King(多米尼克·金)表示,“在常规病症自我管理、复杂病情辅助判断和节省医疗资源方面,AI都能发挥关键作用。”
微软团队强调,MAI-DxO系统仍需在常见病、初级医疗等场景中进一步验证。未来,微软将携手全球医疗机构、监管部门和科研组织,共同推进AI系统在医疗场景中的安全落地与规范应用。“只有将人类医生的专业经验与AI的计算能力深度融合,才能真正开创更加普惠、高效且可信的医疗未来。”
参考资料:https://microsoft.ai/new/the-path-to-medical-superintelligence/