GPT-5上线“翻车”,OpenAI紧急回滚,Sam Altman承认“比预想的坎坷”

前沿资讯 1754733752更新

1

8月9日消息,原计划成为“史上最强”大模型的GPT-5,在昨日上线后不到24小时即遭遇口碑与性能双重滑铁卢。OpenAI联合创始人兼首席执行官Sam Altman今日在Reddit AMA与X平台公开致歉,承认发布过程“比预想的更坎坷”,并宣布立即恢复用户对上一代模型GPT-4o的访问权限。

“模型切换故障、性能表现不佳、用户困惑……我们确实搞砸了。”Altman在Reddit回答网友提问时坦言。为缓解用户不满,OpenAI已紧急撤回部分更新,ChatGPT Plus用户可手动切回GPT-4o,但具体保留时间尚未确定。

据Altman介绍,问题主要源自GPT-5全新的“模型自动路由”系统。该系统本应依据任务复杂度,把用户请求分配给GPT-5的四个版本(regular、mini、nano、pro),并可选“思考模式”。但是,关键组件“autoswitcher”一度宕机,导致大量用户被分配到性能缩水的子模型,“看起来比预期蠢得多”。

此外,在昨日发布会直播中展示的基准成绩图表也出现低级错误。Altman解释称:“团队加班到凌晨,人为失误在所难免。”与官方宣传的“全面领先”相反,用户贴出的实测截图显示,GPT-5在基础数学、逻辑推理及编程任务上屡现低级错误:

● 数据科学家Colin Fraser发现,GPT-5坚称“8.888循环等于9”;

● 多位用户晒出截图,模型在“5.9 = x + 5.11”中解错x值;

● 开发者社区反馈,其“一次性”编程成功率低于Anthropic最新Claude Opus 4.1;

● 安全公司SPLX指出,除非加固安全层,GPT-5仍易被提示注入与混淆逻辑攻破。

Altman透露,GPT-5发布后24小时内,OpenAI API调用量翻倍,进一步放大平台不稳定。为此,OpenAI决定:立即将ChatGPT Plus用户速率限制提高一倍;上线UI补丁,允许用户手动开启“思考模式”;调整模型决策边界,并在对话界面明确标注当前所用模型。

拥有7亿周活的ChatGPT仍是全球用户最多的生成式AI产品,但此次“翻车”给竞争对手留下窗口期。业内评论指出,若OpenAI无法在后续迭代中迅速修复体验,GPT-5恐被贴上“增量更新”的标签,而非其宣称的“划时代突破”。Altman在X平台总结道:“我们正收集更多反馈,确保下一步走得更稳。”

参考资料:https://venturebeat.com/ai/openai-returns-old-models-to-chatgpt-as-sam-altman-admits-bumpy-gpt-5-rollout/