微软发布AI诊断系统MAI-DxO：在复杂医疗挑战中超越人类医生-AI前沿快讯-AI工具导航

微软发布AI诊断系统MAI-DxO：在复杂医疗挑战中超越人类医生

当地时间6月30日，微软AI团队公布了一项突破性研究成果，其开发的“MAI诊断协调系统”（MAI-DxO）在《新英格兰医学杂志》（NEJM）发布的经典病例中展现出高达85.5%的诊断准确率，远超具备5至20年经验的医生团队的表现。

AI系统早已能在美国医学执照考试（USMLE）等标准化测验中获得高分，但这些考试多以选择题为主，难以全面评估AI在真实临床中的推理能力。微软此次采用了NEJM的304个复杂病例，将其转化为“连续诊断基准”（SD Bench）测试，以模拟医生在接诊过程中逐步提问、检验和判断的完整过程。

MAI-DxO系统是一个由多种AI语言模型组成的“虚拟医生团队”，包含 "假设医生"、"检验选择医生"、"质疑医生"、"管理医生" 和 "检查医生" 等多个角色。该系统通过交互式问诊、动态检查选择和自主推理决策，逐步完成最终诊断结果。微软此次测试了包括GPT、Claude、Gemini、Llama等多个主流大模型，并在MAI-DxO框架下进行协同融合测试。

研究数据显示，最优组合为OpenAI的o3模型配合MAI-DxO。在追求最高准确率的配置下，其准确率达到85.5%，是普通医生平均水平的四倍。MAI-DxO系统在诊断过程中引入了“虚拟成本”机制，模拟真实医疗系统中的资源消耗，在不依赖“无限制检查”的前提下，该组合实现了高性价比诊疗路径，诊断成本比医生低20%，比单纯使用o3模型低70%。

研究人员指出，真实世界的医生往往面临“专科化”限制，一名内科医生无法轻松处理风湿免疫、神经或妇科等领域的难题。而AI不受此限制，能够同时具备广泛知识覆盖与深入推理能力，形成独特的“复合型医疗智能”。

“AI并不是为了取代医生，而是为了扩展他们的能力。”微软AI医疗项目负责人Dominic King（多米尼克·金）表示，“在常规病症自我管理、复杂病情辅助判断和节省医疗资源方面，AI都能发挥关键作用。”

微软团队强调，MAI-DxO系统仍需在常见病、初级医疗等场景中进一步验证。未来，微软将携手全球医疗机构、监管部门和科研组织，共同推进AI系统在医疗场景中的安全落地与规范应用。“只有将人类医生的专业经验与AI的计算能力深度融合，才能真正开创更加普惠、高效且可信的医疗未来。”

参考资料：https://microsoft.ai/new/the-path-to-medical-superintelligence/