7月28日,在上海举办的2025世界人工智能大会(WAIC)闭幕。通过这次盛会,所有参会者都感受到了中国AI喷薄而出的创新力。
今年,蚂蚁除了通过展览展示了一系列AI普惠应用产品,也参与主办了多场论坛,带来了一些技术新进展,我们整理出来和大家一起分享。
01
首个连接硬件的院士智能体入驻健康应用AQ
AQ联合中国科学院院士、浙江大学附属第二医院党委书记王建安及其医生团队,共同打造推出“Jack安心智能体”。这是首个连接智能硬件提供专科疾病管理的专业智能体。
打开AQ,在对话框说一句“帮我找王建安的智能体”即可调用,除常见心内科疾病症状科普问答功能之外,用户可接入华为手表、鱼跃血压计等设备,智能体将结合血压、脉搏、ECG等数据,为心脏瓣膜病患者提供专业的诊后管理服务,如健康分析、异常预警、复查提醒、加号申请等。
AQ正进一步探索推动AI医疗技术的开放。
在大会“AI智变·未来健康”产业论坛上,AQ首次公布了一系列医生共建合作进展:已接入269个医生智能体服务,打造首个连接智能硬件的院士智能体,与信通院启动国内首个《医疗健康行业智能体AI医生》标准体系,推出医生易用的智能体开放平台。
02
发布金融推理大模型,助力金融机构加速落地智能体应用
大模型在金融领域应用持续深化,但通用大模型因“知识鸿沟”难以满足产业需求,构建专业金融大模型成为行业趋势。蚂蚁数科发布了金融推理大模型Agentar-Fin-R1,旨在为金融AI应用打造可靠、可控、可优化的智能中枢。
它有三大优势:
基于6大类66小类金融全场景任务体系,融合千亿级金融语料和专家标注的长思维链机制,提升复杂金融任务处理能力,让大模型“天生懂金融,出厂即专家”。
创新加权训练算法,可显著提高复杂任务处理效率,减少二次微调成本,有效降低大模型在企业落地的门槛与成本。
支持动态更新迭代,实时吸收最新的金融政策、市场动态等关键信息,配合专项评测工具,实现模型能力在真实业务场景的持续优化。

评测显示,Agentar-Fin-R1在FinEval1.0、FinanceIQ等权威金融大模型评测基准上超越同尺寸通用及金融大模型,展现突出的金融专业性、推理能力以及合规能力,并保持优秀通用性能。
此外,蚂蚁数科还联合十余家科技伙伴共同发起「金融智能体应用联创联盟」,联盟将积极推进金融AI的行业标准、产业应用、生态合作,构建开放共赢的协作平台,推动行业繁荣。
03
开源高阶程序HOP框架,探索大模型可靠应用新范式
大模型在专业领域的应用,首当其冲的是可靠性问题。蚂蚁密算宣布开源高阶程序(High-Order Program)大模型可信应用技术框架,探索智能与工程融合的AI应用新范式。
该框架借鉴了人类在工程管理体系中的成功经验,如通过标准作业程序(SOP)和检查清单等机制,构建一个能够有效复用、验证、扩展和派生的机制,使大模型在应用过程中即使出现幻觉问题,也能保证大模型达到专业领域所需的精确性和可靠性,推动大模型在专业领域中规模化应用。
目前,高阶程序技术框架已经在金融风控全链路、网络入侵检测、医疗重复计费等多行业场景中初步应用,在可靠性和时效性上有显著提升。
04
“蚁天鉴”升级,新增智能体安全评测工具
AI领域正从大模型时代迈向智能体时代,然而智能体的越权、过度代理等问题也带来了安全挑战。
为应对AI时代智能体产业规模化落地所面临的安全风险,蚂蚁集团联合清华大学对大模型安全解决方案“蚁天鉴”升级,新增智能体安全评测工具,具备Agent对齐、MCP安全扫描、智能体安全扫描及零信任防御等四大核心功能,为智能体提供了风险扫描与实时防御能力。
目前,“蚁天鉴”的风险研判Agent准确率可以达到96%以上,并可支持11个行业的智能体测试。蚂蚁集团期待与行业共建,并将逐步开源开放安全工具,推动智能体创新应用,确保AI技术的安全、可靠、可控,共建可信AI生态。
此外,蚂蚁还与上海人工智能实验室、信通院、IIFAA联盟联合发布了《终端智能体安全2025》,为终端智能体安全提供风险评估指南。
人工智能的发展还面临着多重挑战。蚂蚁将持续布局AI,探索智能的上限,携手行业共同迎接AI新未来。

