【灵思导读】 GoogleMaps迎来重大升级:Gemini全面介入步行与骑行导航!询问洗手间、咖啡馆、充电桩剩余数量、街区氛围,Gemini都能理解自然语言并掌握物理世界信息。路痴群体的福音来了,再也不用举着手机尴尬地原地打转了!
导航中最让人无奈的一句话,莫过于那句平静的:“请向东走500米。”
即便将手机举到空中来回调整方向,那个指示箭头依然固执地原地打转。
在辨别方向这件事上,人们的耐心已经被GPS消耗了二十年。
而如今,这种令人困惑的体验画上了句号。
GoogleMaps刚刚发布了一项重磅更新:Gemini正式接管步行与骑行导航。
从此,手机不再只是机械地播报经纬度,而是会在耳边轻声提醒:“在前方星巴克路口右转,就是那个贴有海报的红色建筑。”
路痴朋友们,可以起身欢呼了!
请用日常语言交流,而非坐标指令!
传统导航依赖于GPS坐标,这是一种机器理解的形式,它并不清楚500米在人的感知中意味着什么。
Gemini介入后,将这些机器指令转化为语义层面的理解。
为了实现“在加油站后方右转”这类自然表达,Gemini在后台交叉引用了全球2.5亿个地点的数据与海量Street View图像。
它需要准确判断哪个建筑具有“醒目”特征、哪个地标具备“知名度”,并确保这些信息在视觉上具有辨识度。
直至目前,Google一直在尝试借助Gemini让地图具备“场景感知能力”。
在2025年11月的早期版本中,这一能力还仅限于驾车场景;而如今,它已经扩展至步行与骑行场景。
你可以随时提出需求:“告诉我这个街区有什么值得逛的地方?”或“这附近有带卫生间的咖啡馆吗?”
无需再反复确认那个模糊的方向箭头,只需依据路口那个标志性的“蓝色雕塑”即可。
Google正将Maps从静态的方向指引工具,转型为实时互动的对话式导航体验。
“解放双手”的智能代理
出行是为了行走,而非频繁操作屏幕
在解决了信息理解的问题后,如何实现“感官协同”呢?
1月29日,Gemini正式从汽车仪表盘“走入”步行与骑行这类对交互要求较低的场景。
如果你在骑行,或者手里提着东西,Gemini的“代理功能”便显得尤为实用。
无需停下脚步、不必摘下手套、也不需要在街头对着屏幕反复操作。直接提问即可:
路边那个造型奇特的建筑是什么?顺便查一下附近有带卫生间的咖啡馆吗?
这种深度的应用联动,使地图成为一个流动的任务处理中心。
如果你在陌生的街道上漫步,Gemini也能充当实时的百科助手。
你可以随时询问:“我现在处于哪个区域?”或“附近有哪些值得一看的景点?”
也可以针对具体生活需求提出复杂问题,例如:“这条路线上有没有带卫生间且价格适中的咖啡馆?”
这种涉及设施细节(卫生间、停车位、价格区间) 的多维度筛选,是普通AI搜索难以提供的深度物理数据。
此外,Gemini支持在导航界面内进行连续对话。
你可以先问:“前方两英里内有没有素食餐厅?”得到回答后再追问:“那里的停车情况如何?”
需要注意的是,这并非简单的语音识别,而是将Maps、Gemini、微信和日程表深度整合在一起。
这种针对“实际生活需求”的多维度筛选,才是AI真正发挥作用的体现。
“全知视角”
Google Lens带来的空间感知升级
如果说地标导航解决了“如何前往”的问题,那么Gemini加上Google Lens,则解决了“去哪里”以及“到达后做什么”的信息不对称问题。
地图从一个二维的坐标平面,进化为一个三维的物理世界解读工具。
在Maps的搜索栏中,点击相机图标对准眼前的建筑时,Gemini便开始实时解析物理实体的相关信息。
你可以这样提问:“这是什么地方?有什么特别之处?”或“这里的氛围怎么样?”
AI会迅速调取2.5亿个地点的资料,结合大量用户评价,给出有温度的回答,而不仅仅是冷冰冰的评分。
Google甚至能够挖掘出“隐藏信息”。
通过全新的Gemini Tips 模块,你甚至可以在出发前了解某些餐厅的“隐藏菜单”、最合适的预订方式,甚至是大型商场里那个最难找的特定入口。
这些细节信息,是传统搜索通过关键词筛选几乎无法实现的。
电动车车主也无需费心寻找充电桩了,它不仅会告知充电桩的位置,还能通过历史数据和实时网络信息,预测你到达时具体还剩几个空闲车位。
这种信息层面的优势,让传统搜索显得像是上个时代的产物。
维度之争
为何SearchGPT短期内难以超越?
硅谷常有观点认为SearchGPT或Perplexity将颠覆Google。
但在“物理世界”领域,它们难以匹敌。
SearchGPT是一个全知的“数字存在”,它理解网页和逻辑,但在现实道路中缺乏感知能力。
它没有覆盖全球二十年的街景数据,也没有对2.5亿商户信息的实时掌握。
当你想了解“那家餐厅的外观如何”或“那个路口是否有台阶”时,AI无法通过逻辑推导得出答案,它必须“亲眼见过”。
Google通过Gemini将这些积累的视觉资源激活,让AI具备了对物理世界的理解能力,这是目前任何纯文本训练的大模型都无法逾越的差距。
根据SOCi发布的本地可见性指数报告,在处理具体的本地商户信息(地址、营业时间、实时动态)时,ChatGPT的信息准确率为68% ,而Gemini则实现了100% 的覆盖与精准匹配¹。
在导航这种容错率极低的场景下,32%的误差率足以让用户选择Google。
Google的目标远不止于地图。有观点认为,Google正在构建一个全场景的Agent闭环:Chrome负责处理数字世界的复杂任务(订票、比价),而Maps负责处理物理世界的复杂任务(导航、探店、代理沟通)。
这场竞争的本质,是“认知”与“存在”的较量。
OpenAI拥有更敏捷的思维,但Google拥有更扎实的基础。
在AI代理时代,只有那个能够真正看见并行走于物理世界中的AI,才能称得上真正的代理者。
未来,你可能不再只是“使用地图”,而是与城市“对话”。
Google正借助Gemini弥合数字世界与物理世界之间的最后一道缝隙。
从Chrome的自动化代理,到Maps的全场景“免触控”操作,AI正逐渐接管我们的感知方式。
下次站在陌生的路口,别再像那个盯着旋转箭头不知所措的样子了。戴上耳机,直接问那位智能助手:
“带我去那家只有本地人才知道的隐秘餐厅,顺便帮我查查,那里现在有没有可以看风景的露天座位?”
如果你还未感受到这种变化,不妨去路口走500米体验一下。
———— END ————
灵思极智旗下“极智系列”三款AI智能应用
关注后,两步置顶服务号,可第一时间收到灵思极智推文!

