2025年8月26日,耀途天使轮项目元戎启行发布全新一代辅助驾驶平台——DeepRoute IO 2.0,该平台搭载自研的VLA(Vision-Language-Action)模型。
对比传统端到端模型,VLA模型融合视觉感知、语义理解与动作决策三大核心能力,更擅长应对复杂路况,在安全性、舒适性方面呈现断代式突破。
元戎启行由CEO周光博士带领团队于2019年创立,总部位于深圳,在全球多地有业务落地。目前已完成6轮融资,累计融资金额超 5 亿美元。元戎启行始终坚持自主创新,推出最新一代搭载VLA模型的辅助驾驶系统DeepRoute IO 2.0,该模型集成思维链能力,打造具备“防御性驾驶”意识的AI司机。
01
DeepRoute IO 2.0&VLA模型
DeepRoute IO 2.0平台以“多模态+多芯片+多车型”适配为核心设计理念,支持激光雷达与纯视觉版本,可面向多种主流乘用车平台开展定制化部署。
截至目前,基于DeepRoute IO 2.0平台,元戎启行已达成5个定点合作项目,首批量产车即将进入市场。
周光介绍,“VLA模型融合了语言模型,具备强大的思维链能力,能摆脱传统端到端模型的黑盒难题,并将信息串联、分析,从而推理出因果关系。此外,它天然集成海量知识库,泛化能力更强,能够更好地适应复杂多变的真实道路环境。”
在此次发布会上,元戎启行也展示VLA模型的4大功能:空间语义理解、异形障碍物识别、文字类引导牌理解、记忆语音控车,这些功能将根据实际部署节奏逐步释放。

空间语义理解是本次发布最大亮点。该功能可在视野受限的动态或静态盲区环境中(如公交车遮挡、复杂路口、桥洞等)感知潜在风险,主动对盲区进行 “预防性预判”,在风险出现前提前减速、稳妥通行。
例如,在通过无红绿灯的路口时,VLA模型能提前识别到“注意横穿,减速慢行”的指示牌,即使公交车通行造成动态盲区,VLA也会结合公交车的动作去做出准确的决策。当公交车进行减速时,它会通过推理前方可能有行人穿行,并做出“立即减速、注意风险、谨慎通行”的决策。
公交车动态盲区遮挡
其余三项能力也各具特色:异形障碍物识别使系统能够识别并灵活应对如施工锥桶、超载小货车等非结构化障碍;文字类引导牌识别让系统“看懂路标”,准确解析潮汐车道、公交专用道等文字信息;记忆语音控车功能支持自然语言指令交互,并逐步学习用户偏好,带来更具个性化与拟人化的驾驶体验。
值得关注的是,在 DeepRoute IO 2.0 平台中,元戎启行提出了让 AI 学会 “害怕” 的理念。
“我一直强调,必须让AI学会害怕,这才是对安全真正的重视。”周光称,害怕是生物进化出的保护机制,AI也应当具备对风险的敬畏之心,防御性驾驶是元戎启行训练中的核心目标。
谈及研发 VLA 模型的初衷,周光分享了两个关键契机。“早在2023年底GPT-4发布时,元戎启行就意识到GPT是真正的跨时代突破。它打破了人们对AI发展进程的认知:原来从弱AI到强AI可能只需要几年,而非过去认为的50年。GPT-4不仅能理解图像,还能做出逻辑判断,例如告诉我们‘这里可以左转’。”周光认为,如果不转型为大模型驱动的公司,未来很可能面临降维打击。
2024 年 6 月的一个实际场景,让元戎启行坚定了VLA模型研发方向。周光回忆称,当时在深圳福田保税区入口处,突然新增了一块 “车辆左转不受灯控” 的临时标识牌,元戎启行的测试车因传统端到端模型无法理解文字信息,遇到红灯仍按常规停车,后方车辆因看到标识而鸣笛催促。这类场景无法通过传统端到端学习解决,即便通过地图打标签也需要至少一周,必须依靠对文字的理解,而大模型则可以实时处理。
截至目前,元戎启行集团总人数超1000人,研发人员占比达84%。
02
量产加速,已交付近10万辆
在技术加速演进的同时,元戎启行已在量产商业化方面建立起坚实基础,获得超过10款车型的定点合作,并实现近10万辆具备城市领航辅助系统的量产车型交付,涵盖SUV、MPV、越野车等多个车型。
预计2025年底,将有超20万辆搭载元戎启行辅助驾驶方案的车辆进入消费者市场。

未来,元戎启行将围绕VLA模型持续拓展应用边界,在乘用车市场加速量产部署的同时,推进基于量产车平台的Robotaxi业务。
在更广阔的Road AGI体系中,VLA模型也将向更多可移动智能体延展复用,逐步实现从单点功能到通用智能体的系统演进。
“我们会全力推进我们的量产,而且把VLA技术放在对应领域,如Robotaxi、C端(乘用车)领域等。未来,我们还将把VLA模型运用到所有可移动物体上,实现物理AGI。”周光表示。
参考:
钛媒体《对话元戎启行CEO周光:VLA模型主要成本是AI芯片,已实现近10万辆辅助驾驶方案交付》
腾讯汽车《元戎启行周光谈最新VLA大模型:让AI学会害怕,才是对安全真正的重视》

