耀行科技语音对话Agent 落地：让人形机器人成为展厅里的“产品经理”- 大数跨境

耀行科技机器人

2026-05-25

导读：在智能汽车展厅中，客户接待正在从传统人工讲解，走向“人机协同”的新阶段。

在智能汽车展厅中，客户接待正在从传统人工讲解，走向“人机协同”的新阶段。客户走进展厅后，不仅希望快速了解产品亮点、价格配置和竞品差异，也期待更有科技感、更自然的互动体验。

近日，耀行科技面向展厅接待与产品讲解场景，为硅基公园团队完成了一套部署在人形机器人上的本地语音对话 Agent 系统。该系统以智元机器人为载体，围绕 ID ERA 9X 的产品介绍、竞品对比、客户异议处理和动作互动，打造了一个“会听、会说、会查、会讲、会动”的智能展厅助手。

从固定播报到智能对话

本项目的核心目标，不是让机器人简单播放固定话术，而是让它真正具备面向展厅场景的对话能力。系统启动后，机器人可以监听现场用户语音，完成语音采集、语音识别、意图判断、知识库检索、大模型回答生成和语音播报。

客户可以直接向机器人提问，例如“介绍一下你们的车”“这车多少钱”“和问界 M8 比有什么优势”等。机器人会根据问题内容生成适合现场播报的简短回答，既能回应客户关注点，也能结合产品事实和场景价值进行讲解。

为了让机器人真正“懂产品”，项目构建了面向耀行科技业务场景的本地知识库。知识库按照展厅讲解、竞品应对、异议话术、价格配置等主题进行拆分。

用户提问后，Agent 会根据问题关键词和知识库路由规则，自动选择相关知识片段，再由大模型生成口语化回答。这样，机器人不仅能介绍产品卖点，也能围绕客户关心的价格、配置、权益、竞品差异和使用场景进行回应，更贴近真实销售场景。

汽车销售场景中，价格、权益、OTA、上市发布等信息具有较强时效性。如果只依赖固定知识库，容易出现信息过期的问题。

因此，系统加入了联网检索兜底能力。当本地知识库命中不足，或用户询问最新信息时，Agent 会调用联网搜索，并结合搜索结果和本地知识库进行回答。这一机制可以有效降低信息过期和模型编造的风险。尤其在涉及价格、权益和版本配置等敏感内容时，系统会坚持“不确定不编造”的原则，让现场沟通更加审慎、专业。

除了语音问答，本项目还为机器人接入了动作指令能力。当用户说出“挥手”“握手”“敬礼”“比心”“鼓掌”“拜拜”“击掌”“鞠躬”等指令时，机器人可以识别对应意图，并调用预置动作服务完成动作执行。

部分动作还支持左手、右手、双手等语义识别。例如用户说“右手敬礼”，机器人能够识别动作方向并执行对应动作。这种“语音 + 动作”的互动方式，让展厅接待更具参与感，也更容易形成客户记忆点。

真实展厅环境往往会受到背景噪声、人声干扰和机器人自身播报回声的影响。为提升现场可用性，项目对语音链路进行了专门优化。

系统通过机器人麦克风采集音频，并利用语音活动检测判断用户是否正在说话；回答播报期间，系统会屏蔽麦克风输入，避免机器人把自己的声音再次识别成用户问题；播报结束后，再恢复用户语音输入。通过这些细节优化，机器人能够更稳定地完成现场对话。

同时，系统还具备上下文记忆和问答记录能力。最近多轮对话会被记录下来，用于回答“刚才说了什么”等上下文问题；当天完整问答也会保存，方便后续排查问题、复盘客户关注点，并持续优化知识库和销售话术。

本次项目的价值，不只是给机器人增加一个语音问答功能，而是围绕真实展厅接待场景，构建了一套完整的产品型 Agent。它能够听懂客户问题，调用产品知识，补充最新信息，生成简短专业的回答，并通过语音和动作完成现场互动。

未来，随着知识库持续完善、模型能力不断提升、机器人硬件持续进化，展厅中的机器人将不再只是展示对象，而会逐渐成为能够参与接待、讲解和转化的智能助手。耀行科技也将继续探索智能汽车、机器人与 AI Agent 的融合应用，让技术真正进入业务现场，为客户带来更自然、更高效、更有温度的智能交互体验。

【声明】内容源于网络

耀行科技机器人

面向高危场景的通用具身机器人

内容 5

粉丝 0

耀行科技机器人面向高危场景的通用具身机器人

总阅读5

粉丝0

内容5