Julian Schrittwieser：AI能力飞速增长，多行业应用或在2026迎来拐点-AI前沿快讯-AI工具导航

Julian Schrittwieser：AI能力飞速增长，多行业应用或在2026迎来拐点

导读：“最近，关于AI发展是否达到“顶峰”的讨论频繁出现，但真实数据表明，AI能力仍在以指数级速度提升。从软件开发到经济各行业的任务表现，AI正快速逼近甚至接近人类水平，2026年或将成为AI广泛落地的关键一年。”

Julian Schrittwieser（朱利安·施里特维泽），人工智能领域著名的强化学习专家和研究者，曾在谷歌DeepMind工作十年，是AlphaGo系列项目的核心贡献者之一。2024年宣布从DeepMind跳槽加入Anthropic，继续在强化学习领域探索和推动AI的发展。

以下是其最新博客文章《Failing to Understand the Exponential, Again》（译：我们又没看懂指数增长）中的主旨内容：

在AI领域，近期出现了一种奇怪的现象：尽管AI现在能写程序、设计网页，但一旦出现错误或偏离方向，很多人就断定AI永远无法达到人类水平，甚至影响有限。这种想法其实类似于疫情初期，人们明明可以从指数增长趋势看出全球大流行不可避免，却仍当作遥远可能或局部事件来看待。

研究机构 METR 最近发布的《衡量AI完成长任务能力》报告提供了更直观的数据。报告显示，AI在完成软件工程任务上的能力呈现明显指数增长：以 Sonnet 3.7 为例，它可以独立完成最长约一小时的任务，成功率达到50%。而最新模型如 Grok 4、Opus 4.1 和 GPT-5 已经能够处理超过两小时的任务，且表现略高于趋势线。

不仅如此，OpenAI的 GDPval 研究进一步扩展了评估范围，覆盖44个职业、9个行业，总共1320个任务，并通过专业人士盲测评分。而且结果显示，最新的 GPT-5 已经非常接近人类表现，而 Claude Opus 4.1 更是几乎匹配行业专家的水平，表明AI在不同领域的能力提升具有一致性。

结合这些趋势，Julian Schrittwieser预测，未来几年AI在经济和工作场景中的应用可能出现以下变化：

到2026年中期，AI将能连续工作完整8小时，胜任全天任务。
至2026年底，至少有一个模型在多个行业达到人类专家水平。
到2027年底，AI在多项任务上可能经常超过人类专家表现。

显然，单纯看表面现象或几次模型更新的对话能力，很容易低估AI的发展速度。研究数据表明，指数增长趋势仍在继续，未来两三年将是AI从实验室走向广泛应用的关键期。

参考资料:https://www.julian.ac/blog/2025/09/27/failing-to-understand-the-exponential-again/