谷歌翻译接入Gemini:戴上耳机就能“同声翻译”

前沿资讯 1765615559更新

0

导读:谷歌翻译,正在从“能看懂字面意思”走向“真正理解人在说什么”。随着 Gemini 模型的接入,翻译不再死板直译,同时,还上线了任意耳机实时同声翻译,把跨语言交流的门槛进一步压低。


谷歌翻译(Google Translate) 获得了一系列基于 Gemini 的新能力,主要变化可以用一句话概括:翻译开始真正理解语境,而且还能直接“播放”给用户。

首先是翻译质量的升级。 Google 翻译现在调用了 Gemini 的高级语言理解能力,重点解决了过去最容易“翻车”的成语、俚语、本地化表达等场景。像英文里的 “stealing my thunder(偷走我的雷声)”,以前往往被逐词直译,现在 Gemini 会先分析上下文,再给出符合真实含义的自然表达(抢了我的风头)

这项改进将从今天起陆续上线,覆盖 Android、iOS、网页版 Google 翻译以及 Google 搜索。首批在美国和印度开放,支持英语与近 20 种语言互译,包括中文、日语、西班牙语、阿拉伯语、德语等。

另一项升级,是实时语音翻译的变化。

在此前移动端功能的基础上,Google 翻译现在支持使用任意耳机进行实时翻译。操作方式很简单:把手机对准正在说话的人,就能在耳机里直接听到“已经翻译好的声音”

该能力基于 Gemini 2.5 Flash 原生音频模型,Google 强调,它会尽量保留说话者的语气、重音和节奏,让用户更容易分辨是谁在说话,也更容易跟上对话节奏。

面对面交流、出国听课、听演讲,甚至看外语影视内容,都成了这项功能的典型使用场景。

在使用上,用户只需要在 Google 翻译 App 中连接好耳机,点击底部的 “实时翻译(Live translate)”,选择语言或开启自动识别即可。全屏界面还会同步显示文字转写,方便对照理解。

目前,这一功能仍处于 Beta 测试阶段,已在美国、墨西哥和印度的 Android 版本上线,支持 70 多种语言,且不挑耳机型号。谷歌表示,模型和体验仍在持续优化中,计划在 2026 年 推出 iOS 版本,并扩展到更多国家和地区


参考资料:https://9to5google.com/2025/12/12/google-translate-gemini-headphones/