Image from The Verge谷歌正在为其 Gemini Live AI 助手推出重大增强功能,该助手将随下周8月28日发布的新款 Pixel 10 设备一同亮相。这些更新有望彻底改变用户与AI的互动方式,使其更加直观,并更深入地融入日常任务。
一项突出的新功能是 Gemini Live 提供实时视觉引导的能力。用户可以将智能手机摄像头对准物体,Gemini Live 将直接在屏幕上高亮显示特定项目,从而简化了识别项目所需正确工具等任务。这项视觉辅助功能在发布之初将独家提供给 Pixel 10,同时也会更广泛地推广到其他安卓设备,并在未来几周内支持 iOS。
为了进一步扩展其实用性,Gemini Live 即将与消息、电话和时钟等核心应用集成。这将实现无缝多任务处理;例如,用户可以打断关于方向的对话,立即起草一条短信通知某人他们会迟到。该AI还将能够根据需求发起电话和起草消息。
作为这些改进的收尾,谷歌正在为 Gemini Live 引入一个先进的音频模型。此次升级将显著增强聊天机器人对人类语音元素(如语调、节奏和音高)的运用,使其能够根据对话上下文调整其语调。用户还将能够控制 Gemini 的语速,甚至可以体验特定角色的口音,以实现更引人入胜的叙事复述。