在智能汽车展厅中,客户接待正在从传统人工讲解,走向“人机协同”的新阶段。客户走进展厅后,不仅希望快速了解产品亮点、价格配置和竞品差异,也期待更有科技感、更自然的互动体验。
近日,耀行科技面向展厅接待与产品讲解场景,为硅基公园团队完成了一套部署在人形机器人上的本地语音对话 Agent 系统。该系统以智元机器人为载体,围绕 ID ERA 9X 的产品介绍、竞品对比、客户异议处理和动作互动,打造了一个“会听、会说、会查、会讲、会动”的智能展厅助手。

从固定播报到智能对话
本项目的核心目标,不是让机器人简单播放固定话术,而是让它真正具备面向展厅场景的对话能力。系统启动后,机器人可以监听现场用户语音,完成语音采集、语音识别、意图判断、知识库检索、大模型回答生成和语音播报。
客户可以直接向机器人提问,例如“介绍一下你们的车”“这车多少钱”“和问界 M8 比有什么优势”等。机器人会根据问题内容生成适合现场播报的简短回答,既能回应客户关注点,也能结合产品事实和场景价值进行讲解。
本地知识库,让机器人更懂产品
为了让机器人真正“懂产品”,项目构建了面向耀行科技业务场景的本地知识库。知识库按照展厅讲解、竞品应对、异议话术、价格配置等主题进行拆分。
用户提问后,Agent 会根据问题关键词和知识库路由规则,自动选择相关知识片段,再由大模型生成口语化回答。这样,机器人不仅能介绍产品卖点,也能围绕客户关心的价格、配置、权益、竞品差异和使用场景进行回应,更贴近真实销售场景。
联网检索兜底,减少信息过期
汽车销售场景中,价格、权益、OTA、上市发布等信息具有较强时效性。如果只依赖固定知识库,容易出现信息过期的问题。
因此,系统加入了联网检索兜底能力。当本地知识库命中不足,或用户询问最新信息时,Agent 会调用联网搜索,并结合搜索结果和本地知识库进行回答。这一机制可以有效降低信息过期和模型编造的风险。尤其在涉及价格、权益和版本配置等敏感内容时,系统会坚持“不确定不编造”的原则,让现场沟通更加审慎、专业。
语音加动作,提升展厅互动体验
除了语音问答,本项目还为机器人接入了动作指令能力。当用户说出“挥手”“握手”“敬礼”“比心”“鼓掌”“拜拜”“击掌”“鞠躬”等指令时,机器人可以识别对应意图,并调用预置动作服务完成动作执行。
部分动作还支持左手、右手、双手等语义识别。例如用户说“右手敬礼”,机器人能够识别动作方向并执行对应动作。这种“语音 + 动作”的互动方式,让展厅接待更具参与感,也更容易形成客户记忆点。
面向真实展厅的语音链路优化
真实展厅环境往往会受到背景噪声、人声干扰和机器人自身播报回声的影响。为提升现场可用性,项目对语音链路进行了专门优化。
系统通过机器人麦克风采集音频,并利用语音活动检测判断用户是否正在说话;回答播报期间,系统会屏蔽麦克风输入,避免机器人把自己的声音再次识别成用户问题;播报结束后,再恢复用户语音输入。通过这些细节优化,机器人能够更稳定地完成现场对话。
同时,系统还具备上下文记忆和问答记录能力。最近多轮对话会被记录下来,用于回答“刚才说了什么”等上下文问题;当天完整问答也会保存,方便后续排查问题、复盘客户关注点,并持续优化知识库和销售话术。
让机器人真正进入业务现场
本次项目的价值,不只是给机器人增加一个语音问答功能,而是围绕真实展厅接待场景,构建了一套完整的产品型 Agent。它能够听懂客户问题,调用产品知识,补充最新信息,生成简短专业的回答,并通过语音和动作完成现场互动。
未来,随着知识库持续完善、模型能力不断提升、机器人硬件持续进化,展厅中的机器人将不再只是展示对象,而会逐渐成为能够参与接待、讲解和转化的智能助手。耀行科技也将继续探索智能汽车、机器人与 AI Agent 的融合应用,让技术真正进入业务现场,为客户带来更自然、更高效、更有温度的智能交互体验。

