谷歌测试Gemini桌面版新功能:推系统级听写与光标追踪

谷歌(Google)正面向部分用户测试 macOS 客户端的重大语音升级。本次测试涵盖三大核心功能:系统级语音听写,允许用户通过快捷键在任何第三方应用中实现全局语音转文字输入;“魔法指针”(Magic Pointer),支持 Gemini 实时追踪并跟随用户的光标悬停内容,确保人机交互的视觉与逻辑同步;以及多设备连接菜单,暗示了未来跨桌面协同的可能。

此次升级重新设计了Gemini Live的界面,使其更趋近移动端的全屏画布形态。此举契合谷歌计划在2026年夏季推出 Gemini Spark 及增强语音功能的战略,旨在弥合桌面端与网页版的体验鸿沟。面对 OpenAI 的 Codex Remote Control 和 Anthropic 的 Claude's Dispatch 等竞品的底层渗透,谷歌正通过强化屏幕感知与跨设备协同,加速推动桌面端生产力工具向全模态智能化转变。

via AI新闻资讯 (author: AI Base)
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
admin@oaibest.com