大数跨境
0
0

2025WAIC闭幕,我们跟大家分享一些新进展

2025WAIC闭幕,我们跟大家分享一些新进展 蚂蚁技术AntTech
2025-07-29
1



7月28日,在上海举办的2025世界人工智能大会(WAIC)闭幕。通过这次盛会,所有参会者都感受到了中国AI喷薄而出的创新力。


今年,蚂蚁除了通过展览展示了一系列AI普惠应用产品,也参与主办了多场论坛,带来了一些技术新进展,我们整理出来和大家一起分享。




01

首个连接硬件的院士智能体入驻健康应用AQ


AQ联合中国科学院院士、浙江大学附属第二医院党委书记王建安及其医生团队,共同打造推出“Jack安心智能体”。这是首个连接智能硬件提供专科疾病管理的专业智能体。



打开AQ,在对话框说一句“帮我找王建安的智能体”即可调用,除常见心内科疾病症状科普问答功能之外,用户可接入华为手表、鱼跃血压计等设备,智能体将结合血压、脉搏、ECG等数据,为心脏瓣膜病患者提供专业的诊后管理服务,如健康分析、异常预警、复查提醒、加号申请等。


AQ正进一步探索推动AI医疗技术的开放。


在大会“AI智变·未来健康”产业论坛上,AQ首次公布了一系列医生共建合作进展:已接入269个医生智能体服务,打造首个连接智能硬件的院士智能体,与信通院启动国内首个《医疗健康行业智能体AI医生》标准体系,推出医生易用的智能体开放平台


02

发布金融推理大模型,助力金融机构加速落地智能体应用


大模型在金融领域应用持续深化,但通用大模型因“知识鸿沟”难以满足产业需求,构建专业金融大模型成为行业趋势。蚂蚁数科发布了金融推理大模型Agentar-Fin-R1,旨在为金融AI应用打造可靠、可控、可优化的智能中枢。



它有三大优势:

  • 基于6大类66小类金融全场景任务体系,融合千亿级金融语料和专家标注的长思维链机制,提升复杂金融任务处理能力,让大模型“天生懂金融,出厂即专家”。

  • 创新加权训练算法,可显著提高复杂任务处理效率,减少二次微调成本,有效降低大模型在企业落地的门槛与成本。

  • 支持动态更新迭代,实时吸收最新的金融政策、市场动态等关键信息,配合专项评测工具,实现模型能力在真实业务场景的持续优化。







评测显示,Agentar-Fin-R1在FinEval1.0、FinanceIQ等权威金融大模型评测基准上超越同尺寸通用及金融大模型,展现突出的金融专业性、推理能力以及合规能力,并保持优秀通用性能。


此外,蚂蚁数科还联合十余家科技伙伴共同发起「金融智能体应用联创联盟」,联盟将积极推进金融AI的行业标准、产业应用、生态合作,构建开放共赢的协作平台,推动行业繁荣。


03

开源高阶程序HOP框架,探索大模型可靠应用新范式


大模型在专业领域的应用,首当其冲的是可靠性问题。蚂蚁密算宣布开源高阶程序(High-Order Program)大模型可信应用技术框架,探索智能与工程融合的AI应用新范式。



该框架借鉴了人类在工程管理体系中的成功经验,如通过标准作业程序(SOP)和检查清单等机制,构建一个能够有效复用、验证、扩展和派生的机制,使大模型在应用过程中即使出现幻觉问题,也能保证大模型达到专业领域所需的精确性和可靠性,推动大模型在专业领域中规模化应用。


目前,高阶程序技术框架已经在金融风控全链路、网络入侵检测、医疗重复计费等多行业场景中初步应用,在可靠性和时效性上有显著提升。


04

“蚁天鉴”升级,新增智能体安全评测工具


AI领域正从大模型时代迈向智能体时代,然而智能体的越权、过度代理等问题也带来了安全挑战。


为应对AI时代智能体产业规模化落地所面临的安全风险,蚂蚁集团联合清华大学对大模型安全解决方案“蚁天鉴”升级,新增智能体安全评测工具,具备Agent对齐、MCP安全扫描、智能体安全扫描及零信任防御等四大核心功能,为智能体提供了风险扫描与实时防御能力。



目前,“蚁天鉴”的风险研判Agent准确率可以达到96%以上,并可支持11个行业的智能体测试。蚂蚁集团期待与行业共建,并将逐步开源开放安全工具,推动智能体创新应用,确保AI技术的安全、可靠、可控,共建可信AI生态。


此外,蚂蚁还与上海人工智能实验室‌、信通院、IIFAA联盟联合发布了《终端智能体安全2025》,为终端智能体安全提供风险评估指南。


人工智能的发展还面临着多重挑战。蚂蚁将持续布局AI,探索智能的上限,携手行业共同迎接AI新未来。

【声明】内容源于网络
0
0
蚂蚁技术AntTech
科技是蚂蚁创造未来的核心动力
内容 1081
粉丝 0
蚂蚁技术AntTech 科技是蚂蚁创造未来的核心动力
总阅读197
粉丝0
内容1.1k