前沿资讯
1770371418更新
0
导读:Anthropic发布了Claude Opus 4.6,如果你每天和Excel、财务模型、SEC文件打交道,Claude Opus 4.6将能直接嵌入到你的工作流中。
Anthropic正式发布Claude Opus 4.6,这是其2026年首次重大模型更新。与前代相比,新模型在财务分析能力上的提升超过23个百分点,首次实现了"第一次产出就接近投产标准"的品质。消息发布后,金融服务公司股价应声下跌,全球领先的金融数据和软件公司FactSet(中文名:慧甚)跌幅一度高达10%。
Anthropic在官方博客中表示,新模型在智能编码、工具调用、信息检索和财务分析等领域表现尤为突出。

财务推理能力:外部基准验证的SOTA表现
Claude Opus 4.6的财务能力经过了多项外部基准测试的验证。
在Finance Agent基准测试(由Vals AI开发,评估模型对美国上市公司SEC备案文件的研究能力)中,Claude Opus 4.6达到60.7%的准确率,相比Opus 4.5提升5.47个百分点,目前位列行业第一。在TaxEval税务推理基准测试中,该模型达到 76.0% 的准确率,同样为当前最高水平。
Anthropic的内部Real-World Finance评估体系包含约50个投资和财务分析用例,测试模型在电子表格、幻灯片和文档生成方面的综合能力。Opus 4.6在这个评估中相比Sonnet 4.5提升了超过23个百分点,进步幅度显著。
产品矩阵:Excel、PowerPoint、Cowork三端齐发
Anthropic此次还同步推出了一系列产品更新,将Claude的能力直接嵌入到了金融从业者的日常工作场景中。
Claude in Excel现在支持更长时间运行的任务,随着财务模型变得复杂,Claude Opus 4.6能够保持专注和准确。
新功能包括数据透视表编辑、图表修改、条件格式、排序筛选、数据验证和金融级格式化。此外还新增了长对话自动压缩和多文件拖放支持,大幅减少了用户在标签页间复制粘贴的工作量。
Claude in PowerPoint作为研究预览版首次亮相,用户可以在PowerPoint侧边栏中直接调用Claude。它能够读取现有的布局、字体和母版,然后内联创建新内容。用户可以让Claude从客户端模板生成演示文稿、对现有幻灯片进行针对性修改,或者从零开始生成高质量的首版演示文稿。目前该功能已向Max、Team和Enterprise计划用户开放。
Cowork是Anthropic桌面应用中的新功能,用户可以指定一个桌面文件夹,Claude能够直接读取、编辑和创建该文件夹中的文件。Cowork还支持插件定制,企业可以使用预置的企业财务插件(包含日记账分录、差异分析和核对等常见工作流程),也可以构建自己的插件来匹配个性化工作方式。
技术底层:规划能力与自我纠错
从技术角度看,Claude Opus 4.6相比前代在三个关键维度上实现突破。规划能力更谨慎:模型在执行多步骤任务前会进行更充分的思考和规划。任务持久性更强:能够更长时间地持续执行代理任务,适合需要数小时甚至数天的大型项目。自我纠错能力:能够在大规模代码库中可靠运行,并在发现错误时主动纠正。
这些改进使得Claude Opus 4.6特别适合复杂的企业级工作流程。Anthropic同时宣布推出"智能体团队"功能(Agent Teams),允许将单个项目的工作分配给多个智能体,每个智能体负责项目的特定部分并相互协调配合,模拟真实工程师团队的协作方式。
Claude Opus 4.6、Claude in Excel和Cowork已在所有付费Claude计划中开放使用。Claude in PowerPoint目前以研究预览形式向Max、Team和Enterprise用户开放。Anthropic同时提醒,AI在金融领域的应用仍处于活跃发展期,对于高风险工作,人工判断仍然不可或缺。
参考资料:https://claude.com/blog/opus-4-6-finance
豫公网安备41010702003375号