
前沿资讯
1755079459更新
0
8月13日消息,Anthropic宣布旗下最新大语言模型Claude Sonnet 4的上下文窗口由原先的20万tokens大幅扩展至100万tokens,增幅达5倍。该功能现已以公有测试(public beta)形式上线Anthropic API及Amazon Bedrock,Google Cloud Vertex AI亦将于近期支持。
Anthropic产品团队介绍,更长上下文将直接解锁以下高价值场景:
● 大规模代码分析:开发者可一次性读入包含源码、测试用例与技术文档的完整代码库(超过7.5万行),模型可据此理解项目架构、跨文件依赖并提出系统性改进建议。
● 海量文档综合:法律合同、科研论文或技术规范等数百份文档可被整体加载,模型在保持全文记忆的同时完成跨文档关联分析。
● 长链智能体:构建跨越数百次工具调用、多步骤工作流的智能体,完整保留API文档、工具定义及历史交互记录,确保输出始终连贯。
为覆盖新增算力成本,Anthropic同步调整超20万tokens请求的计费标准:
• ≤20万tokens:输入3美元/百万tokens,输出15美元/百万tokens;
• >20万tokens:输入6美元/百万tokens,输出22.5美元/百万tokens;
Anthropic同时提示,结合提示缓存(prompt caching)可将延迟与费用进一步降低,若采用批处理模式,还可再节省50%成本。
“过去用户必须把问题拆成小块才能喂给模型,现在可以直接丢进整份代码或数千页文档。”Anthropic产品负责人Brad Abrams(布拉德·艾布拉姆斯)在接受媒体采访时说,“一次请求即可跑完完整业务场景,这是企业客户最迫切的需求。”
根据Anthropic官方解释,100万tokens相当于2500页文本,或7.5万至11万行代码,数倍于其上一代20万tokens、仅能处理约2万行代码的规模。作为参照,该容量可一次性容纳整部《战争与和平》,亦可并行处理数十篇学术论文或上百份金融报告。
Anthropic表示,过去2个半月内,已先后推出Opus 4、Sonnet 4及Opus 4.1,今日再度加码,彰显了“快速迭代、紧贴需求”的节奏。“我们不是简单对标竞品,而是被客户的真实场景推着跑。”Abrams强调。
目前,新功能仅向API等级达到Tier 4或拥有定制速率限制的深度用户开放,覆盖领域包括软件开发、制药、零售、专业服务及法律科技等。Anthropic称,将在收集早期反馈后,于近期面向更广泛开发者开放。
参考资料:https://www.anthropic.com/news/1m-context;https://www.theverge.com/ai-artificial-intelligence/757998/anthropic-just-made-its-latest-move-in-the-ai-coding-wars