智驾赛道进入“思考”时代:VLA与WA的终极对决
从“说话”到“想象”,智能驾驶技术正迎来决定性分水岭
当理想i8在暴雨山区自动识别塌方路肩并规划绕行,小鹏P7 Ultra仅凭视觉系统精准避让突发障碍时,智能驾驶已迈过技术革命的临界点。新能源汽车的竞争不再局限于续航与座舱,智驾能力正从“加分项”升级为“生存项”。
原创ⓒ 新熵 新能源车组作者丨茯神 编辑丨思原
后端到端时代
早期智能驾驶竞争聚焦硬件:激光雷达、摄像头、毫米波雷达构成感知系统,高性能芯片如英伟达Thor则承担决策中枢。车企一度信奉“传感器越多越强”,但高成本制约普及——单颗激光雷达曾超1万美元,导致搭载车型售价突破50万元。
▲ 图/英伟达旗舰智驾芯片Thor
小鹏P7早期因双激光雷达增加8万元成本,销量长期低迷,直至简化配置才实现突破。行业逐渐意识到,单纯堆砌硬件难以为继。
2019年,特斯拉开启端到端路线,通过海量真实路测数据训练模型,实现从感知到控制的直接映射。国内车企纷纷跟进,但该模式在长尾场景(如突发行人、极端天气)中表现乏力,因罕见场景数据不足,难以充分学习。
VLA闪电逆袭
2023年底,理想提出VLA(Vision-Language-Action)技术,整合视觉、语言与行动三模态,使系统具备“观察-推理-决策”能力。不同于端到端的数据映射,VLA将图像转化为语言描述,再经大模型逻辑推导输出指令,显著提升复杂场景应对能力。
理想依托庞大用户车队积累多元驾驶数据,持续优化模型;小鹏则构建云端训练集群,加速模型迭代。即便是年交付仅3.4万辆的元戎启行,也选择“All in VLA”。其CEO周光表示,通过共享平台数据与算力,可在低成本下实现量产落地——采用Orin-X+征程5双芯片方案,BOM成本压至5500元,较华为MDC 810低32%。
这一方案为中小车企提供了突围机会。“VLA让企业用低成本复制头部体验,窗口期仅18个月,错过即出局。”周光强调。
WA才是终极?
与VLA的广泛布局不同,华为、蔚来押注更前沿的WA(World Model,世界模型)路线。其核心是构建“数字孪生世界”,让系统先理解物理规律,再做出决策,被业内视为智驾的“终极形态”。
华为ADS负责人王军比喻:“VLA是刷题应试,WA是掌握知识点。”蔚来李斌称:“WA赋予车辆‘想象力’,而非仅靠‘记忆力’。”理论上,WA可摆脱对真实数据的依赖,在长尾场景中更具泛化能力。
但商业化门槛极高:华为在WA领域投入超200亿元,仅服务器集群耗资50亿,年运维达8亿;蔚来成立“世界模型实验室”,累计投入150亿,占研发总支出40%。此类投入远超多数车企承受范围。
▲ 图/华为
VLA让车学会“说话”,WA则让车学会“想象”。前者是当前破局关键,后者或是三年后的决胜所在。理想、小鹏借VLA实现逆袭,华为、蔚来以WA构筑护城河,而更多品牌只能在有限窗口期内争夺入场资格。
智驾终局尚未揭晓,真正的赢家将是那些能将“说话”与“想象”融合为“思考”的玩家。在这场淘汰赛中,唯有兼具现实执行力与未来洞察力的企业,方能笑到最后。

