Julian Schrittwieser:AI能力飞速增长,多行业应用或在2026迎来拐点

前沿资讯 1759055943更新

0

导读:“最近,关于AI发展是否达到“顶峰”的讨论频繁出现,但真实数据表明,AI能力仍在以指数级速度提升。从软件开发到经济各行业的任务表现,AI正快速逼近甚至接近人类水平,2026年或将成为AI广泛落地的关键一年。”


Julian Schrittwieser(朱利安·施里特维泽),人工智能领域著名的强化学习专家和研究者,曾在谷歌DeepMind工作十年,是AlphaGo系列项目的核心贡献者之一。2024年宣布从DeepMind跳槽加入Anthropic,继续在强化学习领域探索和推动AI的发展。

以下是其最新博客文章《Failing to Understand the Exponential, Again》(译:我们又没看懂指数增长)中的主旨内容:

在AI领域,近期出现了一种奇怪的现象:尽管AI现在能写程序、设计网页,但一旦出现错误或偏离方向,很多人就断定AI永远无法达到人类水平,甚至影响有限。这种想法其实类似于疫情初期,人们明明可以从指数增长趋势看出全球大流行不可避免,却仍当作遥远可能或局部事件来看待。

研究机构 METR 最近发布的《衡量AI完成长任务能力》报告提供了更直观的数据。报告显示,AI在完成软件工程任务上的能力呈现明显指数增长:以 Sonnet 3.7 为例,它可以独立完成最长约一小时的任务,成功率达到50%。而最新模型如 Grok 4Opus 4.1GPT-5 已经能够处理超过两小时的任务,且表现略高于趋势线。

不仅如此,OpenAI的 GDPval 研究进一步扩展了评估范围,覆盖44个职业、9个行业,总共1320个任务,并通过专业人士盲测评分。而且结果显示,最新的 GPT-5 已经非常接近人类表现,而 Claude Opus 4.1 更是几乎匹配行业专家的水平,表明AI在不同领域的能力提升具有一致性。

结合这些趋势,Julian Schrittwieser预测,未来几年AI在经济和工作场景中的应用可能出现以下变化:

  • 到2026年中期,AI将能连续工作完整8小时,胜任全天任务。
  • 至2026年底,至少有一个模型在多个行业达到人类专家水平。
  • 到2027年底,AI在多项任务上可能经常超过人类专家表现。

显然,单纯看表面现象或几次模型更新的对话能力,很容易低估AI的发展速度。研究数据表明,指数增长趋势仍在继续,未来两三年将是AI从实验室走向广泛应用的关键期。


参考资料:https://www.julian.ac/blog/2025/09/27/failing-to-understand-the-exponential-again/