大数跨境
0
0

智能体“自主决策”时代来了:看小米、阿里、快手、小红书的落地实战

智能体“自主决策”时代来了:看小米、阿里、快手、小红书的落地实战 DataFunSummit
2025-12-19
0

大模型应用正迈入“智能体”新阶段,从单纯对话走向自主感知、决策与行动。行业领先公司已展开深入实践:小米让智能体“看懂”手机和汽车屏幕,实现跨端精准操控,其GUI Agent在权威测评中夺得第一;阿里云构建“内外兼修”的客服Agent,攻克复杂工单处理与规模化难题;快手打造多模态安全智能体系统,用于应对海量、多变的内容治理挑战;小红书则致力于提升Agent的可靠性、可扩展性与深度个性化,以支持旅行规划等创新应用。这些实践共同勾勒出自主决策Agent从技术架构到场景落地的关键路径,揭示了下一个人机交互时代的演进方向。

即将在2026年1月16-17日北京举办的Agentic AI Summit超级智能体系统架构大会上,小米、阿里、快手、小红书等技术专家将分享详细的技术落地话题。

01

小米大模型智能体负责人刘伟将分享小米 GUI Agent 的思考和实践话题在人工智能与移动终端深度融合的浪潮中,如何让智能体真正“看懂”界面、“自主”操作,已成为人机交互领域的关键挑战。小米 GUI Agent,作为基于视觉语言模型的图形界面智能体,通过端到端的感知与决策能力,实现了对手机、汽车等多场景的跨平台精准交互,无需依赖传统结构化数据,极大拓展了智能助理的应用边界。

在2025年10月的 SuperCLUE 测评中,小米 GUI Agent 以90.01分的优异成绩斩获金牌,在13款国内外竞品中位列第一,标志着手机交互正从语音助手时代迈入 GUI 智能体驱动的新阶段。

本次演讲将系统介绍小米在 GUI Agent 方面的技术思考、核心模型架构、强化学习优化策略,以及在手机与汽车座舱等场景中的规模化落地实践,并展望其未来的演进方向与应用前景。

演讲提纲:

  • GUI Agent 概述:从自动化工具到感知决策智能体

  • 核心技术架构:视觉语言模型与强化学习的深度融合

  • 传统能力评测与实际场景表现

  • 落地实践:从手机到跨设备场景的规模化部署

  • 未来展望:GUI Agent 的技术演进与生态构建

02

阿里云 算法专家刘星言 博士分享的话题客服领域Agent模型的内外兼修之道在阿里云客服业务中面临着大量中频、长尾的复杂工单,传统定制化 Workflow 的方案难以规模化覆盖。为应对这一挑战,阿里摒弃了单点定制的思路,转而构建一个可长期规模化的通用型 Agent 系统。核心理念是「内外兼修」:对模型外,通过自研的在线阅读器和上下文管理器,将冗长、嘈杂的工单信息提炼为高质量的输入,解决“垃圾进,垃圾出”的源头问题;对模型内,团队设计了一套高质量训练数据构建的 Pipeline,并结合强化学习,高效地将模型的行为与人类专家的行为对齐。

演讲提纲:

  • 业务背景与挑战:为何需要通用自助型Agent

  • 模型之「外」:构建高质量的信息环境

  • 模型之「内」:SFT与RL的双重修炼

  • 总结与Takeaway

03

快手 安全算法中心负责人刘梦怡 博士将分享安全大模型智能体系统在内容治理体系下的应用实践话题在数字内容爆炸式增长的今天,内容安全正面临前所未有的挑战:海量信息实时涌现、违规形式不断变异、跨场景跨模态治理难度陡增;传统规则引擎已难以应对 “速度与精度” 的双重考验,安全治理的效率瓶颈与风险盲区日益凸显。而大模型时代的到来,大幅提升了机器的多模态理解、主动学习以及复杂语义推理能力,成为破解困局的核心选择。

本次分享将从短视频平台内容安全业务出发,介绍快手安全算法团队自研多模态大模型与智能体系统的核心技术方案,以及在真实场景赋能安全治理智能化全链路的应用实践,包括自研多模态大模型优化、安全推理大模型审核智能体、与多智能体协同的内容风控引擎等,希望给大家带来一些大模型智能体在垂直场景定制化中的技术与应用新思路。

演讲提纲:

  • 内容安全业务背景与挑战

  • 快手安全大模型核心技术

  • 安全推理大模型审核智能体

  • 多智能体协同的内容风控引擎

  • 未来技术与业务应用趋势展望

04

小红书 中台算法组大模型应用算法专家焦文祥 博士分享的话题可扩展、可个性化:面向 AI 创新应用的 Agent 核心能力探索为满足小红书在旅行规划等 AI 创新应用中对可靠性、可扩展性和深度个性化的需求,我们聚焦于 Agent 的多个核心能力的探索和升级:

(1)工具调用的可靠性: 针对工具调用在复杂场景中的鲁棒性不足,我们引入 LoopTool 框架,通过数据-模型闭环实现 Agent 对自身工具能力的自主进化和持续修复,保障行动指令的准确性。

(2)Agent 的自主与通用能力:提出DeepAgent 架构以自主记忆折叠高效管理长程任务上下文,实现对大规模工具集的可扩展学习,确保架构的通用性。同时,提出Agent2World 框架通过自主生成符号世界模型,赋予 Agent 环境认知能力,实现认知的持续升级。

(3)复杂个性化规划能力:针对高约束任务(如旅行规划),提出 TravelPlan-o1,采用竞争共识推理(CCoT)机制,通过多路径的内部自我验证,保证 Agent 能够生成兼具可行性与深度个性化的高质量决策方案。

演讲提纲:

  • AI 创新应用对 Agent 的能力需求

  • Agent 工具调用的可靠性

  • Agent 的自主与通用能力

  • Agent 复杂个性化规划能力

活动推荐

本次Agentic AI Summit 超级智能体系统架构峰会汇聚了顶尖互联网公司的 Agentic AI 建设先锋,内容直击企业AI落地的核心挑战与解决方案。无论您是关注Agent平台建设、还是Agent工具开发,都将在这里获得极具价值的启发与实践参考。

如果您想要来参会听演讲,和专家面对面交流,请点击「阅读原文」即可报名参会!

【声明】内容源于网络
0
0
DataFunSummit
DataFun社区旗下账号,专注于分享大数据、人工智能领域行业峰会信息和嘉宾演讲内容,定期提供资料合集下载。
内容 490
粉丝 0
认证用户
DataFunSummit 北京鸿润嘉诚企业管理咨询有限公司 DataFun社区旗下账号,专注于分享大数据、人工智能领域行业峰会信息和嘉宾演讲内容,定期提供资料合集下载。
总阅读10.8k
粉丝0
内容490