3月6日消息,高德地图宣布推出全球首个由大模型驱动的视觉认知步导系统地标AI领航,深度融合千问大模型、亿级POI数据库与千万级高精街景图像,让导航系统首次具备视觉认知与人类语言理解能力。
该系统针对传统步行导航起点迷方向、距离无概念、终点认不出的痛点,基于超亿级POI数据库、高精度步行路网拓扑及千万级高精街景图像三大核心能力,建立对空间关系的深度理解。
结合千问大模型的多模态能力,可识别交通设施、商铺、地标建筑等实体并评估视觉显著性,生成符合人类习惯的自然语言指引。
导航过程中,系统会在起点、转弯、临近终点等关键节点,优先选择醒目易识别的参照物进行语音播报,同时在地图上高亮对应位置。
指引文案突出颜色、形态与相对位置,例如“过了蓝色便利店右转,银色玻璃门就是入口”“保持施耐德电气大门在左手边”等,实现所见即所导。
实测显示,用户听到视觉地标提示后,平均比传统导航快2秒确认正确路径,有效减少看手机频次,降低老人、亲子家庭、游客等群体的步行出行门槛。升级后的步行导航无需额外设置,在导航界面即可直接使用。
目前该功能已支持北京、上海、广州、深圳、重庆、杭州六座城市,其他城市正在逐步上线。

