Anthropic宣布Claude Sonnet 4上下文窗口扩大5倍

前沿资讯 1755079459更新

0

8月13日消息,Anthropic宣布旗下最新大语言模型Claude Sonnet 4的上下文窗口由原先的20万tokens大幅扩展至100万tokens,增幅达5倍。该功能现已以公有测试(public beta)形式上线Anthropic API及Amazon Bedrock,Google Cloud Vertex AI亦将于近期支持。

Anthropic产品团队介绍,更长上下文将直接解锁以下高价值场景:

● 大规模代码分析:开发者可一次性读入包含源码、测试用例与技术文档的完整代码库(超过7.5万行),模型可据此理解项目架构、跨文件依赖并提出系统性改进建议。

● 海量文档综合:法律合同、科研论文或技术规范等数百份文档可被整体加载,模型在保持全文记忆的同时完成跨文档关联分析。

● 长链智能体:构建跨越数百次工具调用、多步骤工作流的智能体,完整保留API文档、工具定义及历史交互记录,确保输出始终连贯。

为覆盖新增算力成本,Anthropic同步调整超20万tokens请求的计费标准:

• ≤20万tokens:输入3美元/百万tokens,输出15美元/百万tokens;

• >20万tokens:输入6美元/百万tokens,输出22.5美元/百万tokens;

Anthropic同时提示,结合提示缓存(prompt caching)可将延迟与费用进一步降低,若采用批处理模式,还可再节省50%成本。

“过去用户必须把问题拆成小块才能喂给模型,现在可以直接丢进整份代码或数千页文档。”Anthropic产品负责人Brad Abrams(布拉德·艾布拉姆斯)在接受媒体采访时说,“一次请求即可跑完完整业务场景,这是企业客户最迫切的需求。”

根据Anthropic官方解释,100万tokens相当于2500页文本,或7.5万至11万行代码,数倍于其上一代20万tokens、仅能处理约2万行代码的规模。作为参照,该容量可一次性容纳整部《战争与和平》,亦可并行处理数十篇学术论文或上百份金融报告。

Anthropic表示,过去2个半月内,已先后推出Opus 4、Sonnet 4及Opus 4.1,今日再度加码,彰显了“快速迭代、紧贴需求”的节奏。“我们不是简单对标竞品,而是被客户的真实场景推着跑。”Abrams强调。

目前,新功能仅向API等级达到Tier 4或拥有定制速率限制的深度用户开放,覆盖领域包括软件开发、制药、零售、专业服务及法律科技等。Anthropic称,将在收集早期反馈后,于近期面向更广泛开发者开放。

参考资料:https://www.anthropic.com/news/1m-context;https://www.theverge.com/ai-artificial-intelligence/757998/anthropic-just-made-its-latest-move-in-the-ai-coding-wars