4月17日消息。近日,谷歌宣布了一项重大更新:其人工智能工具Gemini Live将免费向所有安卓用户开放。这一功能此前仅限Pixel 9和三星Galaxy S25用户通过付费订阅Gemini Advanced使用,但因用户反馈积极,谷歌决定将其推广至更广泛的安卓生态。
Gemini Live的核心能力在于通过手机摄像头或屏幕实时捕捉内容,并基于AI技术提供即时响应。例如,用户在水族馆拍摄鱼类时,Gemini可自动识别物种并展示相关科普信息;面对屏幕上的文字或图像,用户也可通过语音或文字交互获取进一步解释或操作建议。
此外,该功能支持自然语言对话,用户可随时打断AI补充细节或切换话题,无需重启对话流程,提升了交互的流畅性。
Gemini Live最初作为付费功能推出后,用户对其便捷性和实用性的高度评价促使谷歌调整策略。谷歌在社交平台X上表示:“用户的热烈反响让我们决定将这一功能免费开放,让更多人体验AI带来的变革。”
这一决策也反映了科技公司在AI普及领域的竞争加剧。同一天,微软宣布其类似工具Copilot Vision已在Edge浏览器中免费上线,进一步凸显了行业对AI工具平民化的重视。
从4月17日起,Gemini Live将逐步向所有安装Gemini应用的安卓设备推送,预计未来几周内完成全球覆盖。用户需通过Google Play商店更新至最新版应用,点击右下角的波形图标即可启动功能。
目前,该功能仅支持英语交互,且暂未登陆iOS平台。不过,谷歌透露未来将扩展至更多语言和操作系统。
Gemini Live的应用场景极为多样:
1. 教育辅助:实时翻译或解析屏幕上的学术内容。
2. 旅游导览:通过摄像头识别地标、动植物并提供背景知识。
3. 日常办公:快速提取屏幕文本生成摘要或执行指令。
这一功能的免费化不仅降低了AI技术的使用门槛,也为开发者提供了新的集成方向,例如与教育、旅游类应用的深度合作。
谷歌与微软同日发布免费AI工具,标志着行业竞争进入新阶段。OpenAI虽在语音交互领域先行一步,但其高级语音模式仍局限于付费订阅用户,而谷歌通过免费策略可能抢占更多市场份额。
未来,多模态交互(如结合摄像头、语音和屏幕内容)或成为AI助手升级的重点。谷歌已透露计划将Gemini Live整合至更多服务中,进一步拓展其应用边界。