谷歌“最智能”模型Gemini 2.5 Pro迎更新，来到Preview 06-05 Thinking版本-AI前沿快讯-AI工具导航

谷歌“最智能”模型Gemini 2.5 Pro迎更新，来到Preview 06-05 Thinking版本

前沿资讯 1749205155更新

谷歌推出“最智能”模型Gemini 2.5 Pro的更新预览版“Gemini 2.5 Pro Preview 06-05 Thinking”，并宣称其在编码性能上超越OpenAl o3和Claude Opus 4等竞争对手。

谷歌表示，企业用户能够利用这一更新版本测试构建全新应用程序，或替代早期版本。根据谷歌官方博客，“I/O版本”的Gemini 2.5 Pro在回应内容上更具创造性，在编码与推理能力方面也优于其他模型。谷歌DeepMind首席执行官戴密斯·哈萨比斯曾强调，I/O版本是公司迄今为止最出色的编码模型，而此次的新预览版性能更进一步，即将发布的稳定版本也已具备企业级应用能力。

性能数据是此次新预览版的一大亮点。谷歌公布的测试结果显示，在LMArena测试中，Gemini 2.5 Pro新版本得分提升24分，来到1470分，在WebDev Arena测试中，提高35分，达到1443分，目前在两个测试排行榜均位居首位。在编码能力方面，该模型在Aider Polyglot等高难度编码基准测试中一骑绝尘，同时，在评估模型数学、科学、知识储备及推理能力的高挑战基准测试，如GPQA和Humanity’s Last Exam（HLE）中，Gemini 2.5 Pro也展现出顶尖水准。

谷歌表示，其认真听取并回应了此前2.5 Pro版本发布后的用户反馈，着重对模型的风格和结构进行了优化。升级后的模型在输出响应时更具创造性，格式也更为规范，能够为用户提供质量更高的回答。目前，开发者可通过Google AI Studio和Vertex AI在Gemini API中使用升级后的2.5 Pro预览版。值得一提的是，谷歌新增了“思考预算”功能，开发者可借此对成本和延迟进行更精准的控制。

在定价方面，新版本的收费标准为无输入缓存时每百万token 1.25美元，输出价格为10美元。发布数小时内，开发者们便纷纷开始试用Gemini 2.5 Pro新预览版。虽然众多开发者认可其速度符合谷歌承诺，但关于该版本实际性能是否真的更优，仍有待进一步验证。

参考资料：https://venturebeat.com/ai/google-claims-gemini-2-5-pro-preview-beats-deepseek-r1-and-grok-3-beta-in-coding-performance/