“豆包手机助手”亮相:懂用户、能“代劳”的“真智能”助手

前沿资讯 1764584507更新

0

导读: 今天,豆包手机助手公开亮相,开发团队展示了它与手机系统级合作带来的全新交互方式:可直接操作手机完成复杂任务的能力、与相册深度结合的图片处理体验,以及基于本地记录的记忆功能和更强推理的Pro模式。


据豆包手机助手开发团队介绍,2022年ChatGPT的出现,让很多团队看见了重新设计手机助手的机会,于是在去年,他们启动了豆包手机助手项目,如今,首次对外亮相。

相比传统语音助手,豆包这次的升级更像是一次“嵌入式重做”。开发团队与手机厂商合作,实现了系统级的语音唤醒、侧边AI键操作和针对屏幕内容的智能理解,让用户不必再主动进入某个应用就能和助手交互。

现场演示中,豆包能直接回答用户关于景点、照片拍摄角度等问题;也能在手机侧键上实现语音通话、视频通话与屏幕共享的一键启动。在相册场景下,用户一句话就能完成复杂的图片编辑,比如“把照片里的人和杂物去掉,只保留风景”,系统即能生成一张令人满意的风景图。

但真正让人“眼前一亮”的,是豆包的操作手机能力。

开发团队展示了多个日常场景,例如社交媒体看到商品后,助手可以跨平台比价、整理结果,并在涉及支付时主动提醒用户接管。在其他演示里,豆包还能自动处理播客播放、解锁汽车前备箱、帮用户在工作应用上请假、提交出差申请甚至订票。只要一句话,它就能帮你把手机上繁琐的事处理干净。

为了让助手更贴近用户的实际需求,豆包加入了本地保存的记忆功能。例如用户忘记座位号、取件码、停车位置,或模糊记得朋友推荐的店铺位置,豆包都能立即答出。所有记录均需用户授权,并能随时关闭。

在更高阶的探索中,豆包推出了操作手机的“Pro模式”。这个版本除了能操作界面,还能直接调用工具,提高执行效率。由于结合了记忆数据,它能在很多场景里“少问一句”,自动推断用户的真实需求。例如用户说“帮我给女儿挑礼物放进购物车”,系统会根据过往信息自动理解年龄与偏好,无需再次说明。

现场还展示了一个复杂的旅行任务:助手能自动整理用户在社交平台收藏的餐厅、在地图上标记、查找符合兴趣的展览、订票,并统一写入备忘录,整个流程无需反复确认,几乎是一次性完成。

开发团队表示,目前没有推出自有手机的计划,而是正与多家手机厂商合作,并提供了搭载豆包手机助手技术预览版的手机供开发者和用户体验。

他们希望,通过更深入的系统合作和持续优化,让手机助手从“能听懂”变成真正“能办事”。


参考资料:https://mp.weixin.qq.com/s/RWAJbnWQ6pjAOgo__9kV7w