大数跨境

【灵思分享】路口徘徊之际,谷歌Gemini在耳边提醒“往红房子方向走”

【灵思分享】路口徘徊之际,谷歌Gemini在耳边提醒“往红房子方向走” 灵思极智
2026-04-09
2

【灵思导读】 GoogleMaps迎来重大升级:Gemini全面介入步行与骑行导航!询问洗手间、咖啡馆、充电桩剩余数量、街区氛围,Gemini都能理解自然语言并掌握物理世界信息。路痴群体的福音来了,再也不用举着手机尴尬地原地打转了!

导航中最让人无奈的一句话,莫过于那句平静的:“请向东走500米。”

即便将手机举到空中来回调整方向,那个指示箭头依然固执地原地打转。

在辨别方向这件事上,人们的耐心已经被GPS消耗了二十年。

而如今,这种令人困惑的体验画上了句号。

GoogleMaps刚刚发布了一项重磅更新:Gemini正式接管步行与骑行导航。

从此,手机不再只是机械地播报经纬度,而是会在耳边轻声提醒:“在前方星巴克路口右转,就是那个贴有海报的红色建筑。”

路痴朋友们,可以起身欢呼了!

请用日常语言交流,而非坐标指令!

传统导航依赖于GPS坐标,这是一种机器理解的形式,它并不清楚500米在人的感知中意味着什么。

Gemini介入后,将这些机器指令转化为语义层面的理解。

为了实现“在加油站后方右转”这类自然表达,Gemini在后台交叉引用了全球2.5亿个地点的数据与海量Street View图像。

它需要准确判断哪个建筑具有“醒目”特征、哪个地标具备“知名度”,并确保这些信息在视觉上具有辨识度。

直至目前,Google一直在尝试借助Gemini让地图具备“场景感知能力”。

在2025年11月的早期版本中,这一能力还仅限于驾车场景;而如今,它已经扩展至步行与骑行场景。

你可以随时提出需求:“告诉我这个街区有什么值得逛的地方?”或“这附近有带卫生间的咖啡馆吗?”

无需再反复确认那个模糊的方向箭头,只需依据路口那个标志性的“蓝色雕塑”即可。

Google正将Maps从静态的方向指引工具,转型为实时互动的对话式导航体验。

“解放双手”的智能代理

出行是为了行走,而非频繁操作屏幕

在解决了信息理解的问题后,如何实现“感官协同”呢?

1月29日,Gemini正式从汽车仪表盘“走入”步行与骑行这类对交互要求较低的场景。

如果你在骑行,或者手里提着东西,Gemini的“代理功能”便显得尤为实用。

无需停下脚步、不必摘下手套、也不需要在街头对着屏幕反复操作。直接提问即可:

路边那个造型奇特的建筑是什么?顺便查一下附近有带卫生间的咖啡馆吗?

这种深度的应用联动,使地图成为一个流动的任务处理中心。

如果你在陌生的街道上漫步,Gemini也能充当实时的百科助手。

你可以随时询问:“我现在处于哪个区域?”或“附近有哪些值得一看的景点?”

也可以针对具体生活需求提出复杂问题,例如:“这条路线上有没有带卫生间且价格适中的咖啡馆?”

这种涉及设施细节(卫生间、停车位、价格区间) 的多维度筛选,是普通AI搜索难以提供的深度物理数据。

此外,Gemini支持在导航界面内进行连续对话。

你可以先问:“前方两英里内有没有素食餐厅?”得到回答后再追问:“那里的停车情况如何?”

需要注意的是,这并非简单的语音识别,而是将Maps、Gemini、微信和日程表深度整合在一起。

这种针对“实际生活需求”的多维度筛选,才是AI真正发挥作用的体现。

“全知视角”

Google Lens带来的空间感知升级

如果说地标导航解决了“如何前往”的问题,那么Gemini加上Google Lens,则解决了“去哪里”以及“到达后做什么”的信息不对称问题。

地图从一个二维的坐标平面,进化为一个三维的物理世界解读工具。

在Maps的搜索栏中,点击相机图标对准眼前的建筑时,Gemini便开始实时解析物理实体的相关信息。

你可以这样提问:“这是什么地方?有什么特别之处?”或“这里的氛围怎么样?”

AI会迅速调取2.5亿个地点的资料,结合大量用户评价,给出有温度的回答,而不仅仅是冷冰冰的评分。

Google甚至能够挖掘出“隐藏信息”。

通过全新的Gemini Tips 模块,你甚至可以在出发前了解某些餐厅的“隐藏菜单”、最合适的预订方式,甚至是大型商场里那个最难找的特定入口。

这些细节信息,是传统搜索通过关键词筛选几乎无法实现的。

电动车车主也无需费心寻找充电桩了,它不仅会告知充电桩的位置,还能通过历史数据和实时网络信息,预测你到达时具体还剩几个空闲车位。

这种信息层面的优势,让传统搜索显得像是上个时代的产物。

维度之争

为何SearchGPT短期内难以超越?

硅谷常有观点认为SearchGPT或Perplexity将颠覆Google。

但在“物理世界”领域,它们难以匹敌。

SearchGPT是一个全知的“数字存在”,它理解网页和逻辑,但在现实道路中缺乏感知能力。

它没有覆盖全球二十年的街景数据,也没有对2.5亿商户信息的实时掌握。

当你想了解“那家餐厅的外观如何”或“那个路口是否有台阶”时,AI无法通过逻辑推导得出答案,它必须“亲眼见过”。

Google通过Gemini将这些积累的视觉资源激活,让AI具备了对物理世界的理解能力,这是目前任何纯文本训练的大模型都无法逾越的差距。

根据SOCi发布的本地可见性指数报告,在处理具体的本地商户信息(地址、营业时间、实时动态)时,ChatGPT的信息准确率为68% ,而Gemini则实现了100% 的覆盖与精准匹配¹。

在导航这种容错率极低的场景下,32%的误差率足以让用户选择Google。

Google的目标远不止于地图。有观点认为,Google正在构建一个全场景的Agent闭环:Chrome负责处理数字世界的复杂任务(订票、比价),而Maps负责处理物理世界的复杂任务(导航、探店、代理沟通)。

这场竞争的本质,是“认知”与“存在”的较量。

OpenAI拥有更敏捷的思维,但Google拥有更扎实的基础。

在AI代理时代,只有那个能够真正看见并行走于物理世界中的AI,才能称得上真正的代理者。

未来,你可能不再只是“使用地图”,而是与城市“对话”。

Google正借助Gemini弥合数字世界与物理世界之间的最后一道缝隙。

从Chrome的自动化代理,到Maps的全场景“免触控”操作,AI正逐渐接管我们的感知方式。

下次站在陌生的路口,别再像那个盯着旋转箭头不知所措的样子了。戴上耳机,直接问那位智能助手:

“带我去那家只有本地人才知道的隐秘餐厅,顺便帮我查查,那里现在有没有可以看风景的露天座位?”

如果你还未感受到这种变化,不妨去路口走500米体验一下。


————  END  ————


灵思极智旗下“极智系列”三款AI智能应用




灵思极智让AI为各行业赋能
打造[超级企业]+[超级个体]
“让人回归人的价值”!
用灵思,创极智!点击关注“灵思极智”


关注后,两步置顶服务号,可第一时间收到灵思极智推文!



【声明】内容源于网络
0
0
灵思极智
AI领域超级创造工厂,用灵思,创极智!
内容 176
粉丝 0
灵思极智 AI领域超级创造工厂,用灵思,创极智!
总阅读135
粉丝0
内容176