
前沿资讯
1749205155更新
0
谷歌推出“最智能”模型Gemini 2.5 Pro的更新预览版“Gemini 2.5 Pro Preview 06-05 Thinking”,并宣称其在编码性能上超越OpenAl o3和Claude Opus 4等竞争对手。
谷歌表示,企业用户能够利用这一更新版本测试构建全新应用程序,或替代早期版本。根据谷歌官方博客,“I/O版本”的Gemini 2.5 Pro在回应内容上更具创造性,在编码与推理能力方面也优于其他模型。谷歌DeepMind首席执行官戴密斯·哈萨比斯曾强调,I/O版本是公司迄今为止最出色的编码模型,而此次的新预览版性能更进一步,即将发布的稳定版本也已具备企业级应用能力。
性能数据是此次新预览版的一大亮点。谷歌公布的测试结果显示,在LMArena测试中,Gemini 2.5 Pro新版本得分提升24分,来到1470分,在WebDev Arena测试中,提高35分,达到1443分,目前在两个测试排行榜均位居首位。在编码能力方面,该模型在Aider Polyglot等高难度编码基准测试中一骑绝尘,同时,在评估模型数学、科学、知识储备及推理能力的高挑战基准测试,如GPQA和Humanity’s Last Exam(HLE)中,Gemini 2.5 Pro也展现出顶尖水准。
谷歌表示,其认真听取并回应了此前2.5 Pro版本发布后的用户反馈,着重对模型的风格和结构进行了优化。升级后的模型在输出响应时更具创造性,格式也更为规范,能够为用户提供质量更高的回答。目前,开发者可通过Google AI Studio和Vertex AI在Gemini API中使用升级后的2.5 Pro预览版。值得一提的是,谷歌新增了“思考预算”功能,开发者可借此对成本和延迟进行更精准的控制。
在定价方面,新版本的收费标准为无输入缓存时每百万token 1.25美元,输出价格为10美元。发布数小时内,开发者们便纷纷开始试用Gemini 2.5 Pro新预览版。虽然众多开发者认可其速度符合谷歌承诺,但关于该版本实际性能是否真的更优,仍有待进一步验证。
参考资料:https://venturebeat.com/ai/google-claims-gemini-2-5-pro-preview-beats-deepseek-r1-and-grok-3-beta-in-coding-performance/