挑战GPT-4o,Anthropic 发布新模型:Claude 3.5 Sonnet

工具推荐 1718949913更新

0

      大模型的竞赛还在火热进行中。昨日,Anthropic 发布了新模型: Claude 3.5 Sonnet ,它在多个任务上的表现甚至优于 OpenAI 的 GPT-4o 或谷歌的 Gemini 。新模型已经在网页和 iOS 平台上向 Claude 用户开放,很快将向开发者开放。

      Claude 3.5 Sonnet 被定位为中端产品,位于最小的 Haiku 和最高端的 Opus 之间,它们代表了 Anthropic 对不同性能级别的 AI 模型的独特命名方式。值得注意的是,Anthropic 表示 3.5 Sonnet 的性能甚至超过了 3 Opus,新模型的处理速度是旧机型的两倍,性能提升效果明显。

      在 AI 模型的基准测试中,Claude 3.5 Sonnet 在九项测试中的七项,五项视觉基准测试中的四项上超过了 GPT-4o、Gemini 1.5 Pro 和 Meta 的 Llama 3 400B。尽管基准测试结果仅供参考,因为它们可能受到多种因素的影响,但这些结果仍然显示了 Anthropic 的不凡实力。

      Claude 3.5 Sonnet 的提升不仅限于性能,在编写和翻译代码、处理多步骤工作流、解释图表和图形以及从图像中转录文本等方面都有显著进步。此外,新模型还改进了对幽默的理解,并能够以更人性化的方式进行生成,这使得它在与人类的交互中更加自然和流畅。

      Anthropic 还推出了一项名为 Artifacts 的新功能,它扩展了大模型和用户的交互方式。通过 Artifacts,用户可以直接在 Claude 应用内查看和编辑 AI 请求的结果,例如设计草图或邮件。这种交互方式提高了效率,使用户能够直接在 AI 应用中进行编辑,而无需将内容复制到其他文本编辑器中。

      Anthropic 的目标是将 Claude 打造成一个企业级工具,帮助企业在一个共享空间中安全地集中管理他们的知识、文档和正在进行的工作。这听起来更像是 Notion 或 Slack 这样的协作工具,而不是传统的聊天机器人。Anthropic 的模型将成为整个系统的核心,提供强大的 AI 支持。

      自三月份推出 Claude 3 Opus 以来,Anthropic 一直在不断进步,其竞争对手 OpenAI 和谷歌也在不断发布新的模型版本。现在,Anthropic 已经迈出了新的一步,而它的竞争对手无疑也会迅速跟进。Claude 可能不像 Gemini 或 ChatGPT 那样广为人知,但它在 AI 竞争中的地位已经确立。

      Anthropic 还计划在今年晚些时候发布 Claude 3.5 Haiku 和 Claude 3.5 Opus,进一步丰富其产品线。Anthropic 致力于每隔几个月就显著提升性能、速度和成本之间的平衡,以满足不同用户的需求。除了开发新一代大模型,Anthropic 还在探索新的模式和功能,以支持更多企业用例,包括与企业应用程序的集成。团队还在研究 Memory 功能,使模型能够记住用户的偏好和交互历史,提供更加个性化和高效的体验。