-
引言 -
应用场景一 意图理解 -
1.1 核心目标 -
1.2 双模块协同 -
1.3 核心价值 -
应用场景二 RAG问答 -
2.1 核心目标 -
2.2 三层精炼 pipeline(检索->重排->生成) -
2.3 核心价值 -
应用场景三 知识库维护 -
3.1 核心目标 -
3.2 人机协同知识工厂 -
3.3 核心价值 -
总结 -
参考文献
引言
作为深耕循环经济领域的企业,转转始终致力于在全行业与广大用户群体中积极倡导绿色消费理念。为进一步打通二手交易服务的关键环节、筑牢用户信任的 “最后一公里”,转转选择以更贴近用户的方式升级服务体验:一方面,组建专业上门工程师团队,为用户提供涵盖手机 3C 等闲置物品的上门回收服务,省去用户奔波之劳;另一方面,布局集回收、零售、寄卖功能于一体的转转品牌门店,让用户处置闲置物品的过程更便捷、更高效,真正实现 “身边事身边办”。
在转转的上门回收业务中,质检环节是决定交易成败与用户信任的核心。工程师需要在现场短时间内,对种类繁多、情况各异的产品进行快速、精准的评估。这一过程高度依赖工程师的经验与知识,但同时也面临着标准化难、效率瓶颈、知识更新快等固有挑战。一位工程师的误判或信息缺失,都可能直接影响回收定价的公平性与用户体验。这些固有挑战使得传统规则库或简单机器人难以应对。我们研发并部署了基于大语言模型(LLM)的质检知识智能问答系统,旨在为上门工程师提供一位实时在线的“AI专家助手”。
本文将围绕意图理解、RAG 问答与知识库维护三大核心应用场景,深入剖析在应对前述场景挑战的过程中,所采用的核心技术创新思路与实践方案。
应用场景一 意图理解
意图理解是问答系统的一个关键组成部分,旨在识别用户查询背后的基本需求[1];是连接用户问题与系统知识之间的“智能桥梁”,直接决定了问答系统的成败。
1.1 核心目标
在转转上门回收场景中,不少上门工程师面临问题表述难题:要么需求模糊,仅能提出 “手机摄像头出现晃动应该怎么办” 这类笼统疑问;要么表达口语化、不规范,如将专业需求简化为 “手机主板有问题怎么质检”。而深度意图理解的核心目标,正是通过主动引导工程师完善提问,降低其认知与表达门槛,进而精准捕捉真实需求。
为实现这一目标,我们搭建了 “意图识别 - 意图改写” 的闭环机制。该机制能够将工程师初始提出的模糊查询(query),转化为具备结构化特征、可被机器精准解析与处理的明确意图。这一转化过程,不仅完成了对用户需求的深度解读,更搭建起工程师与系统之间高效沟通、协同运作的桥梁,为后续问题解决提供精准方向。
1.2 双模块协同
该方案由意图识别与意图改写两个核心模块顺序构成。形成一个“识别-引导-确认”的完美闭环。其中,意图识别模块负责对用户的初始查询(query)进行粗粒度分类与语义解析,从而快速判定查询所属的大致领域及核心意图方向;而意图改写模块则是实现 “引导提问” 功能的关键环节,它会依据意图识别模块输出的结果制定针对性交互策略:若用户查询具备基础明确性,便直接对其进行标准化改写以提升后续检索精度;若查询信息存在缺失,则主动向用户询问更多关键细节,以完善需求信息。
-
意图识别子模块
意图识别子模块的核心难点主要体现在两方面:其一,如何从用户简短的提问中精准捕捉意图方向,例如需确认设备具体型号的 SKU 类意图、需拆机才能发现或确认问题的拆修类意图,以及咨询设备功能使用方法的功能支持类意图;其二,如何从用户提问中精准提取与意图相关的关键实体信息,如设备部件、故障现象等。
我们的意图识别模型迭代分为两个阶段:第一阶段采用“通用大语言模型(LLM)+ 提示工程”方案,通过精心设计的高质量提示词(Prompt)引导通用LLM准确执行意图识别任务,能够快速实现可用性目标;第二阶段则基于第一阶段积累的数据,进一步进行领域适应性预训练与指令微调,最终构建出专用于转转回收场景的意图识别模型。与第一阶段相比,第二阶段专属模型在识别精度和响应速度方面均有显著提升。
-
意图改写子模块
意图改写子模块的核心难点在于引导策略的智能决策机制。该机制需综合意图识别的结果与业务逻辑约束(例如拆修类意图需强制包含“部件”和“现象”实体),动态判断应答策略——选择“直接回答”或“反问引导”,并在引导时精准定位待补全的关键信息。
在线下阶段,我们基于质检知识库提取实体,构建“部件-现象”知识图谱,并将历史用户问识别的对应实体作为同义词补充至图谱;线上推理过程中,系统依据实时意图识别结果及业务规则判断是否发起引导;如需引导,则动态查询部件+现象知识图谱,以实现精准、结构化的用户反问。
1.3 核心价值
转转回收问答场景的意图理解方案巧妙地结合了LLM强大的语义理解能力和领域知识图谱的结构化推理能力。该方案具备三重核心价值:其一,能将开放性问题转化为更易操作的选择题,为用户带来流畅且友好的交互体验;其二,可有效确保信息的结构化呈现,为后续环节-RAG问答-筑牢数据基础;其三,深度凝聚了转转在回收领域的专业知识与标准化业务流程,是平台核心竞争力的直接体现。
应用场景二 RAG问答
RAG问答是整个问答系统中直接面向用户的“门面”和“价值兑现点”;用户不会关心后台的知识库有多大、模型有多强、意图理解有多复杂。他们所有的体验和感受,都来自于与RAG问答接口交互的那一瞬间。
2.1 核心目标
针对用户经意图理解后提出的明确问题(如 “苹果手机主板出现第三方标识怎么办”),我们需提供准确、即时且权威的解答。
检索增强生成(RAG)引入了信息检索过程,通过从可用数据存储中检索相关对象来增强生成过程,有更高的准确性和更好的鲁棒性[2]。因此在我们的问答场景中,同样采用 RAG 技术以保障答案质量。
2.2 三层精炼 pipeline(检索->重排->生成)
我们推出的第一版转转回收RAG问答,采用通用 RAG 架构,核心包含 “检索” 与 “生成” 两大基础模块。系统上线后,通过多维度数据分析发现,核心 badcase 集中于两点:一是检索阶段返回的相关信息中冗余内容过多,干扰有效信息识别;二是生成模块难以从海量信息中精准筛选适配的知识,最终导致输出答案存在合理性偏差。
针对这一问题,我们对架构进行了优化迭代,特采用 “检索→重排→生成” 三级流水线架构:通过 “检索” 筛选相关知识,不遗漏与问题相关的任何关键信息,为后续回答提供完整信息基础;借助 “重排” 精准过滤无关噪音数据,保障核心信息的有效性;最终在“生成”阶段,以经过筛选的纯净上下文为支撑,搭配严格规范的 Prompt ,双重约束LLM的生成逻辑,不仅能产出准确、可靠的回答,更能有效抑制模型 “幻觉” 现象。
2.3 核心价值
该方案深度融合了 LLM 的理解与表达能力,以及转转回收领域的专业知识库:一方面充分释放 LLM 在自然语言交互上的优势,让回答更贴合用户理解习惯;另一方面通过检索、重排等技术把控信息质量,确保答案的专业性与准确性,成为转转回收业务在技术层面的核心竞争壁垒。
应用场景三 知识库维护
高质量、大规模的知识库是 RAG(检索增强生成)系统稳定运行的核心基石。若缺失这一关键支撑,即便配备再先进的算法模型,系统也会陷入 “巧妇难为无米之炊” 的困境,难以输出精准可靠的结果。
因此,构建覆盖全面、内容精准的高质量知识库,并搭配可快速定位关键信息的高效检索系统,是决定 RAG 项目能否成功落地、能否稳定输出可靠结果的关键环节。
3.1 核心目标
随着平台业务复杂度持续提升,新质检标准不断更新,各类长尾场景逐渐增多,传统依赖人工维护知识库(KB)的模式,已难以满足高效迭代、精准覆盖的需求[3]。因此,我们需对知识库进行智能化的维护,提升维护效果,降低人工成本。
3.2 人机协同知识工厂
人机协同知识工厂的运作流程包含四大核心步骤,各环节环环相扣,实现从信息挖掘到知识入库的全链路闭环,具体流程如下:
-
QA 对挖掘:以人工和机器人的真实会话数据为基础,借助LLM的语义理解与提取能力,自动从对话中筛选、提炼有效的问答对(QA 对),为后续知识加工提供原始素材。 -
标准问挖掘:针对上一步提取的用户问(即 QA 对中的 “问”),通过聚类算法对语义相似的用户问进行分组,形成若干问题簇。对高频出现的问题簇,筛选或定义一个具备代表性的 “标准问”;簇内其余用户问则作为该标准问的 “相似问”,实现用户问题的规范化与归类。 -
答案生成:将每个高频问题簇下的多个 QA 对整合为结构化Prompt,输入 LLM 进行处理。由模型基于多组 QA 对的核心信息,生成唯一、统一且逻辑连贯的答案,作为对应标准问的最终官方答案,确保答案的一致性与专业性。 -
质检入库:引入人工审核环节,对 “标准问 - 相似问” 的对应关系、“标准问 - 答案” 的准确性与合规性进行双重核验。审核通过后,按照预设的知识库存储规则,将合格的 “标准问 - 相似问”、“标准问 - 答案” 数据正式录入知识库,完成知识的落地沉淀。
3.3 核心价值
基于 LLM 的人机协同知识工厂方案兼具科学性与可操作性,有实用、高效和可落地的优势:以真实用户问题挖掘需求,让知识库内容贴合实际诉求、保障知识覆盖全面与应用价值,实现 “实用”;借助 LLM 自动化完成知识库构建中耗时的 “信息提取” 与 “内容生成”,人工仅负责质量核验,大幅降本提效,实现 “高效”;通过 “聚类分析” 聚焦高频问题优先覆盖核心需求,搭配 “人工审核” 严控内容质量,双重保障确保知识库上线后应用效果,实现 “可落地”。
总结
在转转回收的智能问答场景,LLM的三大应用场景紧密衔接、环环相扣:意图理解如系统大脑,精准识别用户需求;RAG问答如系统心脏,基于可靠知识生成回答;知识库维护如造血系统,持续更新并优化知识供给。
面对技术难点,我们不再依赖单一模型,而是通过系统工程的整体思路,融合领域微调、RAG架构、知识图谱与人机协同,构建出一个持续进化、越用越智能的新一代问答系统。
参考文献
[1]Improving Generalization in Intent Detection: GRPO with Reward-Based Curriculum Sampling(https://arxiv.org/pdf/2504.13592)
[2]Retrieval-Augmented Generation for AI-Generated Content: A Survey(https://arxiv.org/pdf/2402.19473)
[3]DoorDash用大模型、知识图谱与聚类算法重塑客服知识库(https://mp.weixin.qq.com/s/VDtoyQvPTBCZj_ErSOZj3g)
关于作者
李莹莹、杨慧姗、张为丽,转转算法工程师,主要负责LLM在客服、上门和门店等场景的相关工作。
想了解更多转转公司的业务实践,欢迎点击关注下方公众号:

