谷歌翻译接入Gemini：戴上耳机就能“同声翻译”-AI前沿快讯-AI工具导航

谷歌翻译接入Gemini：戴上耳机就能“同声翻译”

导读：谷歌翻译，正在从“能看懂字面意思”走向“真正理解人在说什么”。随着 Gemini 模型的接入，翻译不再死板直译，同时，还上线了任意耳机实时同声翻译，把跨语言交流的门槛进一步压低。

谷歌翻译（Google Translate） 获得了一系列基于 Gemini 的新能力，主要变化可以用一句话概括：翻译开始真正理解语境，而且还能直接“播放”给用户。

首先是翻译质量的升级。 Google 翻译现在调用了 Gemini 的高级语言理解能力，重点解决了过去最容易“翻车”的成语、俚语、本地化表达等场景。像英文里的 “stealing my thunder（偷走我的雷声）”，以前往往被逐词直译，现在 Gemini 会先分析上下文，再给出符合真实含义的自然表达（抢了我的风头）。

这项改进将从今天起陆续上线，覆盖 Android、iOS、网页版 Google 翻译以及 Google 搜索。首批在美国和印度开放，支持英语与近 20 种语言互译，包括中文、日语、西班牙语、阿拉伯语、德语等。

另一项升级，是实时语音翻译的变化。

在此前移动端功能的基础上，Google 翻译现在支持使用任意耳机进行实时翻译。操作方式很简单：把手机对准正在说话的人，就能在耳机里直接听到“已经翻译好的声音”。

该能力基于 Gemini 2.5 Flash 原生音频模型，Google 强调，它会尽量保留说话者的语气、重音和节奏，让用户更容易分辨是谁在说话，也更容易跟上对话节奏。

面对面交流、出国听课、听演讲，甚至看外语影视内容，都成了这项功能的典型使用场景。

在使用上，用户只需要在 Google 翻译 App 中连接好耳机，点击底部的 “实时翻译（Live translate）”，选择语言或开启自动识别即可。全屏界面还会同步显示文字转写，方便对照理解。

目前，这一功能仍处于 Beta 测试阶段，已在美国、墨西哥和印度的 Android 版本上线，支持 70 多种语言，且不挑耳机型号。谷歌表示，模型和体验仍在持续优化中，计划在 2026 年推出 iOS 版本，并扩展到更多国家和地区。

参考资料：https://9to5google.com/2025/12/12/google-translate-gemini-headphones/