快醒醒吧,OpenAI,Claude 3.5 Sonnet好评如潮

前沿资讯 1719476494更新

2

      Anthropic 的最新机型 Claude 3.5 Sonnet 击败了 OpenAl 的 GPT-4o,在Coding Arena 和 Hard Prompts Arena 的榜单上稳居榜首。新的 Sonnet 成本只有Claude Opus的五分之一,但性能却超越了 Claude Opus,并能与 GPT-4o 和 Gemin 1.5 Pro 等前沿机型全面竞争。

      Claude 3.5 Sonnet的亮点之一是其"Artifacts tool",该功能以独立窗口的形式呈现在用户界面的角落,帮助用户将任务可视化。当用户请求生成代码片段、文本文档或网站设计时,Artifacts功能会在专用窗口中展示这些创作。这种创新的设置为用户带来了动态的工作空间,允许他们实时查看、编辑和增强Claude的输出,将AI生成的内容无缝集成到他们的项目和工作流程中。OpenAI的ChatGPT目前尚未具备类似的功能,也没有发布相关的消息。然而,Claude 3.5 Sonnet的用户已经开始利用这一模型创建游戏、网站、功能性声音效果和模拟。一位用户在社交平台上分享了他的体验:"我要求Claude创建一个模拟弹射运动的动画,结果让我大吃一惊!想象一下,在几分钟内为任何主题生成自定义动画和插图。"

      Anthropic还在Claude中引入了"项目"功能,允许用户将与Claude的对话整理成可共享的项目。每个项目都包含一个20万字的上下文窗口,相当于一本500页的书,使用户能够将所有相关文档、代码和观点整合在一起,提高Claude的效率。此外,用户还可以在每个项目中设置自定义指令,以进一步调整Claude的响应。前StabilityAI首席执行官Emad Mostaque评价说:"Claude 3.5 Sonnet在编写代码方面比普通计科专业毕业生更出色。"如果配备必要的工具,Claude 3.5 Sonnet可以自主编写、编辑和执行代码,展现出高级推理和故障排除能力。它在代码翻译方面特别擅长,因此在更新传统应用程序和迁移代码库时非常有用。

      OpenAI面临竞争对手的压力越来越大。尽管该公司在谷歌之前发布了GPT-4o机型,但其语音功能仍未发布。一位用户在社交平台上表达了他的失望:"已经过去一个半月了,还没有新的语音或视觉功能。"OpenAI已宣布将在今年秋季向所有Plus用户提供语音功能,但需要一个月的时间才能达到推出的标准。该公司正在改进该模型检测和拒绝某些内容的能力,并努力改善用户体验,准备将基础设施扩展到数百万用户,同时保持实时响应。

      与此同时,亚马逊正在开发一款名为Metis的ChatGPT杀手级应用。同样的事情也发生在OpenAI的视频生成模型Sora上。就在几个月前,Sora还让所有人大跌眼镜,似乎遥不可及。如今,市场上已经出现了多个质量达到70-80%的Sora克隆,如Kling、Luma和Runway。我们只能寄希望于OpenAI能够兑现他们的承诺,推出新的模型,以应对日益激烈的市场竞争。