引言
支付宝行业技术部、蚂蚁集团基础智能技术团队,联合华东师范大学钱鸿老师和李丙栋老师团队在第 34 届人工智能国际联席会议[1](IJCAI-2025)自主旅行行程规划挑战赛[2]中,基于自研的“大模型+优化求解”技术完成用户旅行行程规划需求,夺得 Original OS Track(原始自然语言组)赛道冠军、DSL Track(带约束条件组)赛道亚军。
左右滑动查看证书
背景
IJCAI'25 自主旅行行程规划挑战赛旨在推动大模型驱动的智能体的创新发展,使其能够根据用户的具体请求,例如:“我从上海出发前往北京游玩 3 天,想去故宫博物院,预算 5000 元,请帮忙设计行程”,生成可行且个性化的旅行方案。
大模型在生成旅行方案时,常因时空逻辑冲突(如时间安排不合理、位置错位)、信息不实时或不准确及浅层个性化(忽略用户真实需求)等导致方案不可行;其根本问题在于将旅行规划简化为文本生成任务,而非处理多约束条件下的动态资源调度。
解决方案
针对具备可验证的领域特定语言的 DSL 赛道,我们开发了一种用于旅行规划的约束感知多智能体框架,该框架集成了检索增强的微调 LLM,能够帮助模型更准确地提取用户约束与意图。而在基于自然语言的 OS 赛道中,我们提出了该框架的一个更强变体,具备强大的 DSL 生成能力,可自动生成可验证的领域语言以支持后续验证。该约束感知多智能体框架由环境模块、思考模块和行动模块三个核心模块组成。
一、环境模块
环境模块是用户请求与大语言模型之间的通信接口。通过对模型进行大规模监督微调(SFT)并结合检索增强等技术,有效解析用户请求中的模糊表达与方言差异,精准对齐任务需求,从而实现可验证的约束条件提取与领域语言构建(基于 Python,用于最终验证约束满足程度)。
二、思考模块
思考模块使用微调后的大型语言模型分析用户输入,并系统地推断特定于任务的约束,确保隐式需求与个性化的偏好被明确捕获并与问题上下文保持一致。
三、行动模块
行动模块采用多智能体框架进行任务协调,包括城际交通智能体、景点推荐智能体、路线规划智能体、餐饮和酒店推荐智能体、行程整合智能体,以及负责修正与反思的主控智能体。该模块通过集成推断得到的约束,组织各智能体协同工作,执行所需操作并高效生成最终解决方案。
城际交通智能体用于规划用户往返所在地和目的地城市之间的交通方式,在时空关系、用户预算和交通工具偏好三个方面做出权衡决策。
景点推荐智能体将用户个性化偏好与地理空间逻辑相协调,确保最终的推荐既符合需求,又在空间逻辑分配上合理,以便于后续的路线规划。
路线规划智能体基于已有的 POI 和城市内交通信息,在微观层面规划用户每一天的行程。形式上,我们通过自主设计的启发式方法,求解以下运筹优化问题:
其中 是推荐的 POI 集合, 是一个 0/1 指示变量,表明在第 天是否要规划从 到 的行程, 为从 到 的时间开销, 作为另一个 0/1 指示变量,代表是否将规划去往地点 的行程, 为惩罚系数。该目标旨在通过尽可能多地规划推荐地点,并减少全局消耗的时间,以获得更加高效的行程规划。
餐饮和酒店推荐智能体负责在已有的景点行程路线中,基于用户的偏好和预算推荐合适的餐厅与酒店,并插入到行程规划中。
行程整合智能体用于串联行程中所有的 POI,规划其中两个相邻 POI 的局部路径,并输出最终结果。
修正与反思的主控智能体负责在每次修改行程后,通过一种基于 Python 实现的领域语言验证预算、偏好等约束是否满足,确保旅行规划的质量。
这些关键模块的开发,不仅显著提升了多智能体框架在模糊约束下的旅行规划效果,也为 DSL 领域内语言的旅行规划系统在更广泛领域的应用提供了深入的理论见解和有力的技术支撑。
未来展望
未来我们将进一步扩展多智能体框架的应用范围,探索更多复杂约束场景下的解决方案。同时持续优化各模块的性能,提升系统的整体响应速度和旅行规划方案质量。为支付宝端出行和旅行场景的智能化提供坚实技术保障。
目前,支付宝 AI 出行助手已经上线。作为国家新一轮交通强国试点任务的智能出行大模型试点项目,后续团队将积极参与文旅行业高质量数据集建设,专家模型训练,行业标准建设等,推动出行和旅行相关 AI 应用成熟度提升,提升旅客用户体验。
会议及比赛官网
IJCAI-2025 官网: https://2025.ijcai.org/
[2]自主旅行行程规划挑战赛: https://chinatravel-competition.github.io/IJCAI2025/

