Anthropic宣布Claude Sonnet 4上下文窗口扩大5倍-AI前沿快讯-AI工具导航

Anthropic宣布Claude Sonnet 4上下文窗口扩大5倍

8月13日消息，Anthropic宣布旗下最新大语言模型Claude Sonnet 4的上下文窗口由原先的20万tokens大幅扩展至100万tokens，增幅达5倍。该功能现已以公有测试（public beta）形式上线Anthropic API及Amazon Bedrock，Google Cloud Vertex AI亦将于近期支持。

Anthropic产品团队介绍，更长上下文将直接解锁以下高价值场景：

● 大规模代码分析：开发者可一次性读入包含源码、测试用例与技术文档的完整代码库（超过7.5万行），模型可据此理解项目架构、跨文件依赖并提出系统性改进建议。

● 海量文档综合：法律合同、科研论文或技术规范等数百份文档可被整体加载，模型在保持全文记忆的同时完成跨文档关联分析。

● 长链智能体：构建跨越数百次工具调用、多步骤工作流的智能体，完整保留API文档、工具定义及历史交互记录，确保输出始终连贯。

为覆盖新增算力成本，Anthropic同步调整超20万tokens请求的计费标准：

• ≤20万tokens：输入3美元/百万tokens，输出15美元/百万tokens；

• ＞20万tokens：输入6美元/百万tokens，输出22.5美元/百万tokens；

Anthropic同时提示，结合提示缓存（prompt caching）可将延迟与费用进一步降低，若采用批处理模式，还可再节省50%成本。

“过去用户必须把问题拆成小块才能喂给模型，现在可以直接丢进整份代码或数千页文档。”Anthropic产品负责人Brad Abrams（布拉德·艾布拉姆斯）在接受媒体采访时说，“一次请求即可跑完完整业务场景，这是企业客户最迫切的需求。”

根据Anthropic官方解释，100万tokens相当于2500页文本，或7.5万至11万行代码，数倍于其上一代20万tokens、仅能处理约2万行代码的规模。作为参照，该容量可一次性容纳整部《战争与和平》，亦可并行处理数十篇学术论文或上百份金融报告。

Anthropic表示，过去2个半月内，已先后推出Opus 4、Sonnet 4及Opus 4.1，今日再度加码，彰显了“快速迭代、紧贴需求”的节奏。“我们不是简单对标竞品，而是被客户的真实场景推着跑。”Abrams强调。

目前，新功能仅向API等级达到Tier 4或拥有定制速率限制的深度用户开放，覆盖领域包括软件开发、制药、零售、专业服务及法律科技等。Anthropic称，将在收集早期反馈后，于近期面向更广泛开发者开放。

参考资料：https://www.anthropic.com/news/1m-context；https://www.theverge.com/ai-artificial-intelligence/757998/anthropic-just-made-its-latest-move-in-the-ai-coding-wars