OpenAI推出最新推理模型o3-pro

前沿资讯 1749625291更新

0

6月11日,OpenAI正式发布最强推理模型o3-pro,该模型聚焦深度思考与可靠回答,即日起面向ChatGPT专业版用户及API开放。

OpenAI表示,o3-pro延续了o1-pro在数学、科学和编程等领域的表现。在学术评估中,o3-pro持续超越o1-pro和o3。

专家评审则在全类别测试中更青睐o3-pro,尤其在科学、教育、编程等关键领域,认为该模型在回答清晰度、全面性、指令遵循度和准确性方面均表现更佳。

OpenAI采用严格的“4/4可靠性”评估标准,只有模型在四次尝试中均正确回答问题才视为通过,o3-pro在该评估下彰显了其稳定且精准的优势。

早期用户测试显示,在需多工具协同的复杂场景中,o3-pro解决效率比原o3提升400%,且方案完整度更高。有观点认为,o3-pro本质是一套集成化AI系统,而非单一模型,其核心能力依托于实时搜索、文件解析、视觉推理、Python执行、记忆系统等工具链。不过,也由于工具调用需求,其响应速度相比o1-pro有所放缓,官方建议用户在处理对可靠性要求极高的复杂问题时选用该模型。

实测方面,在苹果公司一篇名为《思维的错觉》论文中,有一个10盘汉诺塔问题被视为AI推理的"天花板挑战",此前所有模型在该问题上准确率近乎为零。o3-pro通过19分钟的运算,不仅得出1023步的最优解,还按0索引规则完整输出移动序列,经验证首尾步骤均符合标准解法,性能之强,可见一斑。

定价方面,o3-pro输入20美元/百万token,输出80美元/百万token,较o1-pro成本降低87%。同时,基础版o3模型价格同步下降80%,输入2美元/百万token,输出8美元/百万token,中小企业和个人开发者也将能享受高级推理能力。

使用权限方面,从发布当日起,专业版和团队版用户可在模型选择器中直接使用o3-pro,替代原有的o1-pro,企业版和教育版用户预计将在下周获得访问权限。不过,OpenAI表示,o3-pro的落地仍面临"高智商低适应"的困境。如同12岁天才进入大学,其强大的推理能力需与实际应用场景深度结合。OpenAI首席科学家指出,下一阶段的重点将是"构建AI与人类协作的操作系统",让模型不仅能解决问题,更能理解社会规则与协作流程。

参考资料:https://help.openai.com/en/articles/9624314-model-release-notes;https://www.youtube.com/watch?v=vmrm90u0dHs