大家可能对ModelArts这个词比较陌生一些,希望今天讲完后大家能有所了解。在AI飞速发展的当下,我们为什么要为行业打造ModelArts这个AI平台工具呢?这就涉及到一个关键问题,也是大家非常关心的:从年初DeepSeek爆火以来,我们跟很多行业CEO交流发现,他们普遍关心一个问题,为什么在引入DeepSeek之后,还是很难在企业的生产场景中真正应用起来呢?这是企业AI落地的非常共性的问题。华为怎么应对这个问题呢?华为本身作为传统的制造企业在AI进程中我们怎么一步一步打造一个让20万员工都能随时可用的AI智能助手呢?今天分享的主题涉及到其中一个关键环节,如何基于ModelArts打造一个让企业真正能用起来的AI智能应用生产线。
首先我们看这个行业趋势,人工智能发展分级框架,现在处于L3级,即Agent开发应用期,未来走向L4、L5过程中,只有语言大模型是远不够的,一定要像人一样有理解、有执行能力,AI将具备全模态感知能力,自动驾驶、具身智能,都体现了这个趋势。
第二趋势,可以看到图中显现出业界有两条发展AI的路径,一条是国内外的行业头部玩家,持续在开发更先进的大模型,参数量更大,能力更强。另一条,是DeepSeek带来的技术普惠,让大模型走进了千行百业,支撑各种各样场景的应用,也是在蓬勃发展。
AI的应用在金融行业来讲,华为已经在面客,风险管控等场景有比较好的落地实践,在这个过程中我们把行业对AI应用开发的技术需求不断沉淀在平台能力层,比如100多种意图识别的能力,就是满足普通用户在和金融服务平台交互过程中,会随时切换业务办理问题,Agent要能够准确识别这些意图,才能精准回答问题。
AI的发展已经为金融行业信息技术带来了巨变:第一,以DeepSeek为代表的开源大模型带来了应用范式的变化,智算相比通算的技术栈复杂了很多,大模型应用,一方面要求企业有一个能力更强的技术团队去运营大模型系统,另一方面要有一个平台来承载不同模态和规格的大模型。
对于AI底座来讲,在DeepSeek出来之前主要是大模型训练和大模型推理两个资源池分开运行。目前的趋势是大模型后训练工作重要性在持续增加,我们需要有统一的资源池,根据任务在逻辑上灵活应对不同用途,但是统一的资源池该怎么管理,就需要有一个平台软件,相当于我们的算力调度的平台,这也是ModelArts的核心能力之一。
总结来看,企业需要用技术平台的确定性来去应对大模型技术发展的不确定性,这也是华为在多年的数字化转型过程中,包括服务各行各业的过程中沉淀出来的方法论,我们希望搭建一个基本稳定的AI平台应对技术的变化。
这个技术平台需要做什么事情?让我们把AI简单用起来,和高效的管起来,一方面讲的是面向我们的用户,我们要做各种各样的业务,传统保险业务,渠道管理医养结合等等,各种各样的业务怎么更好的把AI能力用起来。第二方面就是技术团队能够高效管起来,智算技术栈比之前基于CPU的时代复杂很多,所以我们技术团队能力怎么提升,工具怎么做得更好用,这是对平台的诉求。
华为的ModelArts就是面向AI开发的一站式的平台。它的定位我可以给大家举个简单的例子来说明:玩车的朋友都知道,房车通常来说都是基于一款合适的基础车辆改装而来,比如福特系列、奔驰系列的量产车型,当然这些车辆也可以被改装成工程车、警车等等,现在市面流行的大模型就像是某款标准化量产车,而我们企业用的时候是要用到具体的业务场景里面,行业大模型就是我们要改装的警车、防弹车、露营车,这个时候我们需要什么?我们需要一个改装场和一套专业的改装工具。ModelArts就是AI流水线的车间,它里面已经具备了让我们能够把标准大模型进行改装的数据工程,模型工程和应用开发能力。
有了这套流水线,就能够快速支撑我们在各种各样业务场景下开发不同的智能体的应用。
最后是一个案例,这是华为服务某个头部大行实际案例。基于ModelArts,我们把客户几千张NPU卡资源管理起来,做统一的算力的资源池的构建和纳管,各个业务部门有需要的时候就分资源来用,就像云平台的其他云服务一样。
在这个过程中确实也有现有技术团队的能力培养问题,华为公司在做行业的大模型应用时,推荐客户要重点考虑采购AI专业服务,在刚才讲到的模型开发、应用开发过程中华为的专业团队会深度介入,会帮助我们一起研究这个场景,做需求分析,做方案设计,做Agent应用开发打样。这个过程中,我们客户的技术团队的AI开发和运营能力就逐步培养起来,能够支撑未来更多业务场景的开发。
在这个项目里面客户的技术团队,现在已经用ModelArts这个平台在做全行创新业务自主的开发。
最后要补充一点,基于ModelArts平台还有一个重要作用,就是AI资产管理,除了数据资产之外,还有模型资产,Agent应用资产等等,这将是未来行业数字化竞争的关键点。
所以我们打造ModelArts这个平台的目的,除了提高AI开发应用的效率,算力资源管理的效率,还希望用户把未来企业AI资产长在企业内部,真正培养出企业内生AI能力。同时,AI应用上线后,各类反馈和采集的数据会源源不断反馈到平台中,不间断的为模型工程提供新的养料,形成数据飞轮效应。
以上就是我为大家带来ModelArts AI平台的定位、作用和相应案例,希望大家有所收获,谢谢!
首先欢迎各位来宾,非常荣幸再一次站在美丽的古北水镇这个舞台上分享合合信息过去一年围绕智能文档处理包括商业大数据,我们在产业端的实践落地的细节应用以及思考。
因为合合信息这个公司的名称大家不是很熟悉,每次我们希望花一点时间把合合信息的公司介绍一下。合合信息是一家在2006年在上海成立的科技公司,我们希望用科技创新让世界更高效,有一个关键里程碑,去年年底在上海科创板上市。我们公司两条主营的业务线:C端产品、B端服务。C端产品包括扫描全能王、名片全能王、启信宝。整个B端服务跟C端产品构建逻辑类似,基于整个底层的AI技术和商业大数据技术给我们B端客户提供企业级的解决方案。
今天我也是围绕在B端领域的探索实践给各位保险行业的伙伴们做一次分享。
实际上我们回顾过往基于大模型的技术升级产品大概也有两年半的时间,大概从2023年年初开始。我们回顾看一下在整个产业端围绕大模型的应用,五大场景类型,包括像文档治理、内容生成、知识管理、客户服务、辅助决策,无论是什么样的AI技术,基于什么样的AI技术构建出来的场景应用,我们认为走向三个价值:一、提升组织内部流程运营的效率,包括去把组织内部的一些经验资产通过模型能力去沉淀,再比如说激活我们企业内部的数据价值,这三个价值的前提是需要非常高质量的标准化的数据输入,我们需要一款能够对多元异构数据处理的底座能力,这是合合信息在过往希望研发的方向。我们提供各类文档处理的能力,在第一个环节文档治理,比如对合同文本的精准解析、合同文本关键要素提取,这个效果直接影响到后续环节的有效性。
回到保险行业,其实保险行业作为全球范围内规模最大,最稳定的行业之一,相比巨大的保费规模在内部运营效率提升方面还有很大提升空间,有大量的业务流程和场景还是通过大量人力去处理的。包括有大量人力做文书处理、表单填写、理赔的人工处理,包括核保的人工处理。过去两年半大模型的出现,极大的提升了对非标准化复杂文本的理解能力,包括对邮件、PDF、长文本的合同,相比传统的自动化工具,像简单的OCR等,更具备更强的泛化能力和上下文理解能力。随着大模型的到来,优化了我们保险行业的流程,甚至去重塑和接管起到了非常大的可能性。
针对这些场景的理解,合合信息提供的通用文档的识别解析就成为了一个非常关键的能力底座,这是核心的研发方向。
我以具体的案例去讲一下我们文档解析的核心能力,包括如何去助力构建一些AI应用。
面向客户或者业务人员的AI工具,知识问答是金融行业、保险行业比较多的落地应用方向。它大概逻辑就是会去多元异构数据给各个业务单元或者客户提供知识问答的应用。合合信息基于自己的架构,包括文档解析能力,构建了一款面向财经金融分析师的知识库,内置了大量的上市企业的文档数据,包括年报、财报,并允许用户上传一些自有数据。这个应用构建我们更多希望能够协助更多的开发者快速构建出自有的应用,我们把整个代码其实都做了开源,大家可以基于这个地址进行访问。
当我们去构建RAG实践时发现,我们融合很多内部的数据、知识,融合内部的保险条款,在整个过程中产生的业务数据、制度数据,我们认为大量的知识都是沉淀在以文档形式沉淀的,我们在实践RAG的时候发现有一个通用瓶颈,就是解析的质量直接决定后续环节的有效性,比如说对保险条款的提取,包括对表格的提取,如果条款的缺失包括表格的断裂会直接影响文档切分领域完整的语义性,构建索引库的时候,会脱离实际业务场景,对于后续的整个问答准确度会产生非常大的影响。所以我们认为需要有非常专业的文档解析工具去处理这些问题。
以一份文档为例,我们可以对文档进行分割,即刻义把内部元素进行提取,比如说有很多手写体,不同的表格、公式、图片,目录结构都可以解析出来。我们还可以把文档中的阅读顺序进行还原,比如说文档有阅读顺序的,从左到右,我们可以通过文档解析工具可以把阅读顺序进行还原。包括文档中有很多复杂元素都可以通过文档解析来进行提取。比如真实文档中有存在水印,有手写,包括对图象进行切边、校正,把这些元素都集成到通用解析工具上。知识库问答,当我们有一个需求,需要知道来源是哪里,通过文档解析可以结合大模型实现这个效果。
为了进一步做验证,我们做了很多的测试,我们自己基于第三方的Agent开发平台,构建了很多知识库,也用到了合合信息自研的文档解析工具,包括开源的解析工具,这个细节非常多,我们把相关测试内容放到公众号上。对于目录结构分段使RAG系统更加稳定,段落和表格完整性对效果有正向影响,我们也对比了第三方开源的工具效果,也是有一定提升。
举两个实际情况,比如说这个原文件是跨页表格,如果通过第三方开源工具会缺失第一行。像行列密集表,用一般工具会存在断裂和缺失,会直接影响下游的问答效果。
回到保险行业,我们会有大量的真实单据需要去处理,包括票据、表单等等,通过合合信息的文档解析和大模型能力,可以解决三个挑战:一、解决这些文档质量参差不齐的情况,可以使整个版面元素进行统一数据化处理,可以通过泛化能力适应不同的版式。
实现路径:一、通过文档解析能力为文档进行解构,当页数小于3时,直接调用自己训练过的抽取大模型进行结构化,如果页数大于3走RAG的架构,大模型接受Token长度有限,通过检索召回的方式把相关片断进行系统输入,最终得到抽取的结果。基于这个逻辑,我们可以解决长短文本的各类抽取问题,可以覆盖全域的文档处理的需求。
以一个实践案例来说,这是从网上找的单据,所以不存在客户信息泄漏的问题,比如说像我们看到某一个设备的保险条款,其实从文档处理角度来看是非常复杂的,有中间的表格,中间还有条款类,还有非表格的清单类,其实像这种保险条款是一对多的关系,每个保险险种都有保险金额、费率、保费,我们通过文档解析可以理解这个复杂版面。
因为大模型的泛化能力加上解析能力,适配不固定版式的单据,非常典型场景就是保险资管做基金运营时,上游的基金管理人会提供各种各样的交易确认单,没有办法穷举这个版式,我们作为下游其实没法要求上游提供的版式按照我的要求走的,所以通过这种抽取能力可以突破不固定版式的限制。
基于长文档,像合同动辄几百页,通过解析+大模型+RAG的架构,可以突破长文档的限制。我们也做了很多实践落地。基金合同为例,私募基金合同大概120多个字段,全字段测下来识别率可以达到85%以上。
其实我们在前端去进行OCR架构的调整,我们也会对具体场景模型进行微调,合合信息在B端积累了很多年,我们有一个非常精标的数据集,通过精标的数据集对开源的基础模型进行了训练。我们跟客户合作时,也会积累很多场景知识、行业知识,比如说抽合同时购买方其实有不同的别名,怎么样归到一个字段上,这是需要做大量处理的,虽然大模型具备了一定的识别同义词的能力,但是如果不做训练的话会有大量幻觉。回到B端场景,我们做大量训练就是降低幻觉,提升输出稳定性。所以我们基于解析大模型、RAG+模型微调可以提供非常精准的解决垂直场景的抽取能力。
热度非常高的一个话题,就是多模态,它的技术成熟度在C端逐渐落地,包括像文生图、文生视频,但是回到B端场景,合合信息也在保持积极探索。先说结论:我们认为金融机构、保险行业基于多模态的技术在处理文档这个领域还有点早。原因很多:首先多模态的稳定性还是比较差的,他会输出完全和文档内容不相关的内容,包括在去训练优化的时候会出现比较大的挑战,比如说通过OCR+大模型我们去训练时可以优化通过文本数据标注提升OCR识别率,通过语义的标注提升大模型的理解能力,但是如果多模态的话其实需要做大量文本图象对的标注,无论对标注难度也好,或者对样本的要求也好,都是指数级上升的。所以我们认为在短期可能对于多模态的应用还为时尚早。
这是我们跟多模态大模型针对复杂场景做了一些测试,合合信息产品效果还是比较显著的。
基于文档解析能力包括大模型的抽取能力,我们构建了一站式智能文档处理平台,可以把某些场景下的分类、抽取、审核进行一个集成。因为时间关系不展开说了,包括在实际的保险业务场景中,有很多的单据流的场景需要通过一个非常好用的文档解析工具、文档处理工具去对各类单据进行分类、识别、抽取,包括进一步的审核。
合合信息一直在服务金融机构以来,都是本着提效工具的定位,比如说对于文档处理来说,我们提供图象处理、图象解析、图象分类、信息的抽取,基于大模型技术对不同环节进行了升级,随着DeepSeek的开源其实可以用到越来越多的更好用的参数规模更大的、能力更强的大模型,其实也让我们的产品从提效供给走向智能伙伴,我们可以通过大模型的能力对结构化的文本进行智能审核及
简单来说就是用TextIn DocFlow进行结构化协同,基于大模型的能力做智能化审核,用一个视频的方式演示一下。
刚才是一个财务报销场景,我要识别这个发票是否是在我们公司要求的差旅时间内发生的,所以可以基于抽取结果进行大模型的理解进行这样的审核。
展望一下未来,其实我们现在的Agent技术也在不断成熟,未来DocFlow也会从工具的方式走向Agentic DocFlow,机制逻辑是:传统ADP以线性方式进行文档处理,是相对流水线化的,包括流程也是相对固定的,未来我们希望针对不同的场景可以动态调度不同的图象处理模型,比如说调度去水印、相片增强,能够实现自动的编排,应对更多复杂场景。包括DocFlow,对于用户反馈的样本可以快速迭代模型,提升模型的识别率。
第二部分是关于商业大数据,合合信息旗下有一款启信宝的C端产品,在过往也基于数据能力服务了很多保险机构,围绕合规、展业、主数据管理、风险监控提供了解决方案。
我们的目标希望构建一个高质量的外部数据源,在数据流通、数据要素价值释放大背景下,能够给到金融机构优质的外部数据资产,包括我们去构建了全量的基础数据库以及基于基础数据库构建了各种知识数据,比如说各种机构画像的标签画像,包括启信分等。
我们现在也基于大模型升级了整个数据产品,核心的逻辑是希望让大模型结合业务经验,使得用户在用数据时用得更好。我们用大模型解读各类的裁判文书,让大模型用非常通俗易懂的方式输出相关的风险,这样的话能够非常快速的降低我们的尽调的时间。
区别于C端查的场景,我们数据交付方式非常多,可以通过数据库的同步机制,把数据库以库的形式落到金融机构内部,搭建同步服务,让你每天拥有实时全量的外部数据。同时提供相关的建模和平台搭建的服务。
这里面其实有一个具体的例子,不展开说了。
总结:
今天把合合信息B端产品实践做了系统性的分享,现在外部很多应用发展路径是从Tool模式走向Copilot,走向Agent。回到合合信息,我们是从Tool走向Copilot阶段之间,这也是因为我们面对的是非常严肃的B端场景,我们希望提供可靠、经过业务验证的以后,这样一个比较务实的技术和产品迭代思路以及服务理念也是践行了合合信息的价值观,我们希望把真正经过技术验证的产品交到客户手里面,提供真有用、真好用的产品。
大家扫下面这个二维码可以获取到前面提到的名片全能王、扫描全能王、启信宝免费一年VIP。我们这个扫描全能王是非常好的工具,可以把考试的试卷的错题擦除掉,这是一个大人的福利,小孩的恶梦,大家可以用一下。
企业微信金融行业总监 张金光
今天非常高兴能在这里和大家一起分享一下企业微信最新的产品情况以及跟大家一起探讨如何用好企业微信,助力寿险行业一体化智能升级。
关于企业微信,目前作为我们行业的基础设施,在两方面为行业发挥重要作用。一方面是做为企业专属连接器,一端连接消费互联网,一端协同保司内部,打通上下游,连接了产业互联网;另一方面是作为企业数字化的底座,为保险公司一体化智能升级发挥重要作用。
结合企微的功能框架图,来简单介绍下企微内外一体的综合能力。那首先蓝色部分,在对内办公管理场景,企业微信有丰富的应用组件来实现内部高效协同与办公管理;绿色部分,通过企微打通微信,在代理人、电网销等多个业务场景赋能对外客户经营;最后一部分,是通过企微的打通上下游,实现产业链的综合协同,这是企微帮助保险公司实现内外一体经营的直接展现。对外内部办公,两个版本:一个是常用的SAAS版本,一个是私有化版本。企业之间的互联应用于客户服务以及保险、金融贷场景当中,我们可以看到内外一体的产品布局。
随着大模型在当今保险行业的深入使用,对于人员、应用以及数据打通需求越来越强烈,企业微信通过C端客户的连接,我们渠道代理人连接,以及内部办公的连接,实现了人员打通、应用打通、数据打通。实现账号统一,平台统一以及门户的统一。
接下来对于寿险行业一体化智能解决方案,做一个系统介绍。
首先关于办公平台,企业微信目前支持私有化的版本部署,私有化部署可以更好的保障公司的合规安全,企业微信的私有化部署具有高可用、高可靠、高稳定的特点。尤其在资源部署能力上,包括内部通信、微盘等产品能力都可以使用三台服务器支持1万人以内的员工使用。这一点也是业内领先的能力。从2018年开始企业微信支持国产化,我们目前形成了完善的适配系统,有众多政府单位、国央企以及金融机构的使用案例。
同时企业微信也支持企业打造一站式的办公门户,包括一键登录所有系统,打开企业微信可以连接所有应用,包括千人千面专属工作台,可以定制根据不同业务部门,无论是总部管理人员、事业部人员、一线员工打造千人千面的专属页面。支持多样化的信息展示。让企业真正实现自定义办公门户。
对于打破数据孤岛,使用企业微信实现数据内外一体。企业微信不仅可以连接我们内部办公平台的各种应用数据,还可以打通外部营销的数据,实现数据的有效整合,帮助业务人员之公司管理层形成全面的数据视图,提升决策效率和准确性。
企业微信作为我们数据化的底座拥有大量开放的接口能力,可以赋能各种内外应用,尤其是企业如果已经有现有的小程序可以直接关联企业微信,无须开发,在企业微信和微信多端运行。企业微信开放了大量的消息通知能力,支持多样的文件通知、文档展示、图文结合,多种类型的消息保障了消息触达的效率。
作为目前大家关心的 ai 相关场景,企微开放了很多场景应用。企业微信目前可以支持智能搜索的功能,比如说我是业务人员,通过企微智能搜索和总结,可以将我跟某家客户的跟进情况进行系统总结和分析。沟通数据一般分散在文档或者会议纪要中,通过智能搜索和总结能力可以一键式呈现所有沟通记录和最新进展。同时,更直观的智能总结,可以在打开群聊时体验到,支持快速获知跟我相关的群聊信息,而且仅我可见,节省大量时间。
会议场景,实现了各种总结、个性化提醒、会中分析、会后回顾以及要点提炼,帮助会议更加高效。
文档场景,我们开放了一些新的AI能力,除了之前发布的可以智能总结客户的跟进记录,让我们业务人员和团队长都可以非常明确快速的了解整体客户跟进的情况。企业微信目前开放了更多诸如总结、分类、内容生成、图片理解、摘要等多种AI能力。企微智能文档大家欢迎使用。
企业微信的智能机器人不仅支持我们腾讯的混元大模型、DeepSeek大模型的使用,还支持企业自由配置大模型和知识集,来保障机器人回复准确性和有效性。如果出现机器人无法回答的问题可以直接转人工进行针对性处理。现在企业微信的智能机器人没有数量限制,各家企业可以基于自己业务场景创建机器人来进行使用。
除了以上情况之外企业微信在安全和协同方面实现了全域守护,包括事前通过企业微信安全配置可以实现身份、权限、设备的管控,在事中可以实现风险的及时监控和拦截,同时事后我们可以实现风险的追溯和数据丢失恢复。比如说企业内部的关键信息如果员工用自己手机拍照上传到社交媒体之后,可以依据照片在我们企业微信后台追溯的能力,查询到数据泄露的时间、人员等信息,实现数据追踪。
寿险场景,大家都在探讨一个问题,如何使用企业微信更好对代理人赋能,打造超级代理人。企业微信对于代理人的价值可以用六个一来进行概括:一、1张名片,当代理人使用企业微信就有了保险公司的品牌背书,无论是团队建联和团队招募都会显得业务人员更专业,客户可信度更高。二、1群客户,原有代理人展业依托与线下的熟人社交,使用企业微信可以共享客户池,可以进行线上客户的分配。三、1个助理,可以实现在跟客户沟通过程中有一个智能助理角色帮助我们进行任务的提醒、客户的检视,每个代理人都有自己的一个智能助理。四、1个营销弹药库,由总部设置好产品、话术、资讯、营销资料库等,我们代理人在沟通过程中可以一键取用,边聊边发。五、1个服务团队,我们面临客户需求时需要联通理赔服务团队一起服务客户,这个时候可以基于企业微信的通讯录可以一键拉群,各个团队可以帮助客户解决问题。六、1个管理助手,不仅是代理人对自己业务流程进行管理,还包括团队长、公司对于整体活动量管理、营销热点管理以及整体内外活动的统一管理。
企业微信帮助寿险公司打造超级代理人有两个优势:一个平台化优势,依靠企业微信产品丰富程度,可以帮助我们不同的公司,不同层次的客户逐步深入使用企业微信,无论从即时通信到综合办公,以及不同业务部门之间的协同,结合企业微信丰富的数据开放AI底座可以实现一体化平台。二是企业微信内外一体的产品应用可以帮助不同部门实现数字化办公需求,无论是办公部门、科技部门、销售部门和服务部门,都可以使用企业微信提升自己的办公效能,一体化协同。
所以基于我们企业微信在整体的寿险行业的产品解决方案,企业微信是我们一体化智能升级的最优解,无论使用私有化版本实现对内办公,对代理人核心业务系统的对接,还是使用企业微信的SAAS版实现内外联通,对营销人员的管理和客户的私域运营,还是连接到C端,使用现有的小程序、公众号、视频号的能力,实现内外一体的整体的展业营销,从总部员工到我们的渠道伙伴,到代理人团队,到企业微信用户的私域运营以及拓展潜在客户。企业微信都是可以信赖的智能伙伴。
以上是我今天交流的内容,感谢各位领导与嘉宾!
江南科友战略市场部总监 李根
各位领导、各位同仁,大家上午好!
我是来自江南科友公司的李根,今天非常荣幸站在这里跟大家分享有关密码技术、数据安全、合规这一重要议题,即如何“以密码之力,助保险业务从安全合规迈向创新增长”。
我们在座的保险科技部同仁,相信大家都有一个共同感受,近年来我们的合规政策不断出台,合规要求也越来越细,而业务创新需求越来越急。我们常常会遇到这样的困扰:
业务系统刚刚上线,又出现合规新要求,为了应对和满足新要求,则业务系统又面临着改动。
其次就是业务系统的安全建设是烟囱式,如核心系统、保单系统等各类系统,在遇到密评要求、数据安全要求时,各自为战独立建设,合规检查时才发现密码设备、密钥管理散落在各个环节,很难梳理密码运行现状和密钥证书状态,既增加管理成本,又埋下隐患,以及当新系统面临安全需求时,原有的密码资源又难以复用,这不仅加大了科技团队的投入,对业务发展也有一定的影响。
更关键的是,我们围绕着数据要素的创新业务,如我们保险客户分析用数,以及基于AI智能应用的用数,在非常多的用数场景,我们既想用好这些数据,但又担心踩红线出现安全风险,这都是咱们科技同仁们共同面临的困惑。
近两年当中监管机构发布了有关数据的管理办法,以及两个密码应用的技术标准。第一就是银行保险机构数据管理办法,目的从制度设计到技术规范,全面构建了覆盖数据全生命周期的安全管理框架,落实数据安全保护管理要求,建立数据安全保护基线。当然这也是一脉相承的来自密码法、个人信息保护法的导向,无论是保险还是银行基于自身发展所需,或政策要求,都应建立相应的安全体系。第二就是在今年5月13日发布的两个标准,一个是《保险交易服务商用密码密码技术要求》,另一个是《保单登记平台商用密码应用规范》,这两个标准的内容基本来自密评的39786的密评标准,39786是密评的GB标准,从2017、2018年起在政府行业、很多行业开始落实,基本上等保三级系统需要通过密码评测。
其实银行业是在2022年底发布的0255的密评行标,与咱们5月13发布的标准有很多相通之处,都是围绕金融机构的等保三级系统,在物理与环境、网络与通信、设备与计算、应用与数据,以及管理制度等八个方面提出了54项指标要求,最终是在每个环节的数据应该如何保护,如应用与数据环节涉及的是身份鉴别数据、访问控制、业务重要数据,总体来说密评本质是使用密码技术,对数据资产进行安全保护。
问题来了,随着保险行业数据安全、密评等安全合规要求日趋严格,如何才能做到高效合规呢?比如保险核心系统、保单系统、理赔系统对于密评要求,若各自独立建设安全模块,各自满足?这种烟囱式的建设方法,对于科技团队来说,工作量及成本投入太大,如何能形成一种体系化的合规方法,统筹规划安全体系,系统化满足合规要求,这是大家比较关注的问题。
其次,如何既能满足合规的同时,又能促进业务的增长?按照原来的建设方法、传统视角来看,合规则是被动处理、应对模式,因为系统各自为战,每次的合规改动制约业务灵活性,加大了数据要素在业务创新场景下的复杂度。
但从新视角来看,其实合规这种可以通盘考虑,可以改变原来孤岛式、烟囱式的建设方式,合规建设可以是主动服务,统筹安排,合规是一种业务,我们可以把满足数据安全、密评合规的密码安全体系做成业务,即安全业务,与咱们的核心业务、渠道业务是一样的,由安全系统为业务系统提供一揽子场景化的密码服务能力、数据安全保护机制,这样不单单是满足本次合规,而可以去灵活应对合规要求的变化,为不同业务系统围绕数据要素的流通环节提供场景化的保护能力,可以让数据要素在安全状态下释放价值,从而达到促进业务增长的目的。
说到这里,其实保险与银行有着极其相似的背景和发展路径。
都是面临合规政策不断出台,银行的合规要求可以追溯到2014[6]号,要求业务系统使用国密算法,以及2017年[170]的风险管控要求弱密码识别、双因素认证,2020[140]金融信息系统国密改造基线,2024[245]号文要求的两高一弱,每个时期都会提出不同的要求,大家面临的是一样的问题,合规要求多,密码技术有专业性,大家对密码相对陌生,业务也是各自适配密码模块,对合规实现都认为有难度。
随着数据成为核心生产要素后,银行、保险机构基于数据的业务日益增加,如理赔用数、核保AI的用数,这些用数的场景非常多,按照监管要求对数据进行保护,大家现状是敏感数据太多了,其次这些数据分散到不同系统当中,我们也看到一些金融机构由于数据管理粗糙,而被处罚的事件,数据不敢用、担心出问题。
所以说,银行和保险曾面临同样的现状,痛点是一样的:
都是由于业务系统孤岛式、烟囱式的密码体系建设,造成了内部缺乏统一的密码接口规范,从而难以管理、难以复用的困境,如电子保单平台建设时采用的密码标准,核心系统不能直接用。
业务系统为满足合规要求,需要进行多次的改动,而业务改动非常困难。
面对密码评测、数据安全的规范标准,对既有业务场景有一定影响、业务性能是否下降也需要考量。
不过,银行的密码安全、数据安全相对来说走在前面,银行也走过孤岛式、烟囱式的模式,但银行是十年前国密改造时,就开始改变思路,将合规和数据安全改为主动服务、统筹安排,我们江南科友为80%以上银行建设了新的密码安全体系,深度应用各类业务系统中。整体的解决思路是:
一、从孤岛式、烟囱式密码应用转变为业务系统提供全密码应用支撑。
二、全面转向以业务场景和安全管理为驱动,覆盖核心系统、渠道系统等近100多业务系统。
三、形成了面向业务系统的一揽子密码能力。
通过全密码应用的场景化能力,对数据在业务系统的各个环节进行安全保护,让业务系统可以放心地去用数,用于创新场景,为业务增长提供安全的环境。
保险行业构建全密码的应用,实现两个目标:一、高效合规,二、数据保护。
保险机构业务系统在交易环节主要是数据形成的过程,形成之后会围绕数据做数据使用,合规原来主要针对数据形成的环节,但是增值主要是在数据使用环节。全密码应用是站在数据共享和应用的视角,以合规为前提,以满足业务用数为驱动,从技术和功能导向转变为业务和管理导向的数据安全管理体系。
我们不但要满足数据形成环节的核心系统、ESB系统、理赔等系统安全支撑,还要实现覆盖数据使用环节的数据分析、用数、保单报送等安全支撑。全密码应用可实现四个“统一”。
第一,形成了统一安全服务,包含密码服务、认证服务、数据安全服务、大模型AI安全服务,以标准化、体系化给业务系统去供给的模式。
第二,形成统一密码计算,就是高效利用密码设备,将所有密码设备统一设备管理起来,实现统一密码计算。
第三,形成统一密钥和证书管理,将分散的证书和密钥有效管理起来,解决保险机构业务系统有数字证书数量不清晰,存放在什么位置不清楚,是否快到有效期等问题。之前金融机构就遇到过由于密钥、证书管理分散造成数字证书过期,导致生产事件。这些数字证书在业务系统上线时大家比较记录,但是两三年之后由于分散存放,缺乏台账和交接记录,就出现管理混乱的情况了,统一管理可以帮助保险机构建立规范和方法,形成密钥和证书使用流程。
第四,形成统一密码监控,让整个密码应用体系是可监测的,其运行状态、资源情况、每个业务系统使用情况,一目了然。
通过全密码应用为保险业务系统提供所要求的数据机密性、完整性、抗抵赖,满足每个业务系统所有安全需求,全密码应用架构是场景化、插件式模式,可为每个业务提供场景化的密码安全服务,如核心系统、电子保单的安全服务就有一定的差异。其次插件式,每个安全服务其实都是插件,最后是云架构,适用于保险机构数据中心现有的技术标准,云下、云上均可支持。
当前,全密码应用已在银行业和部分保险机构深度使用。第一,提升合规的效率,提供一揽子服务,可以共用我们所有的场景化密码能力。第二,助力降本增效,原来分散在每个业务环节的加密设备将近上百台,但是全密码应用平台建设之后,可以节省50%乃至更多的密码设备资源,因为通过这种平台就整合了加密能力,然后通过场景化的服务接口或者免改的接口去适配业务,让业务做更少的改动去满足合规的要求。第三,可视掌控安全,安全也是一种业务,从默默无闻的后台让大家可看到、可监测。第四保护了数据安全,促进数据要素业务的创新。
我们来看一个保险交易服务系统保护的全流程,通过全密码应用覆盖八个场景:
用户访问场景,实现对用户身份的认证和确权。
交易传输场景,对用户交易的数据保护。
数据存储场景和用数场景,这也是密评、数据安全要求最重要的场景,更多聚焦数据存储和数据使用安全,数据如何加密存储,以及加密存储后,围绕用数怎么办?首先就是数据如何抽取?其次是密文数据DBA如何维护?如何基于数据做数据分析?生产环境数据如何向测试环境脱敏提供?向外机构数据报送怎么办?全密码应用围绕数据从形成到使用的这个场景,能够提供完整的场景化方案和能力,满足数据流通中的各种保护要求,让业务系统可以安全地去使用数据。
面向未来,我们其实也是在积极的布局抗量子密码算法和大模型AI安全,金融机构走过了从国密算法替换国际算法过程。当前面向量子的威胁,如何能够抵抗量子攻击,这也是保险机构需要考量的问题,因为量子计算机发展速度超预期,强大的密码破译能力威胁传统密码学,去年美国NIST已发布了抗量子密码算法标准,国内今年2月份开始征集,我们江南科友也发布抗量子密码方案和密码产品系列,并在去年9月份与我们母公司三未信安一同发布了《抗量子密码技术与应用白皮书》。针对大模型AI安全这一块我们也是针对大模型的模型应用安全、模型安全以及基础安全,形成了围绕软件、硬件服务,提供身份认证、数据安全和人工智能多维一体的解决方案,同时也发布了《大模型安全密码应用白皮书》,这两份材料在我们公众号都有发布,欢迎大家下载。
最后,介绍一下我们江南科友,江南科友成立于1991年,是三未信安科技股份有限公司(股票代码:688489)的全资控股子公司。科友总公司位于广州,在北京、上海、深圳、杭州、成都、武汉六个公司,我们的业务范围和服务网络覆盖全国。我们一直专注于密码技术、数据安全在金融行业的深度应用。在银行的覆盖率达到85%以上,服务的金融客户数超过1000家,专注信息安全行业27年,我们在金融科技安全领域是头部领军企业。
今天所分享的全密码应用服务已成为银行业务密码应用的标配,已广泛用于股份制银行、城市商业银行、省级农信社和保险机构。
我们江南科友具有全国产化的密码产品,涵盖密码芯片、密码板卡、密码设备、密码系统等系列化产品,深耕金融场景多年,形成了围绕政策合规类、业务场景类、新技术应用类等诸多安全解决方案。
当大家在面临合规、数据安全要求时,我们江南科友可为保险机构提供密码现状评估,以及共同进行场景突破、形成场景化的能力,在帮助保险机构达成高效合规同时,实现保险数据的全流程保护,助力业务创新增长。
各位同仁,我今天的演讲到此结束,感谢大家!
腾讯云副总裁&智能解决方案负责人 王麒
非常开心和各位一起探讨在大模型下面我们的机遇和挑战,我们发现在大模型兴起的这一两年里面,尤其在今年我们会发现大模型朝着三个趋势上面去发展,第一个趋势,底层的模型越来越成熟的时候,今年大家更多讨论的是上升到应用,而且应用是离企业最近的能看得见、摸得着,能实际解决痛点的地方,所以今年大模型的应用将会重塑整个AI的市场。第二个趋势,在训练和推理上面我们还是需要再进一步加速它,我们知道训练和推理加速必然带来底层的卡的节省,对企业来讲就是成本节省,所以在训练和训推上面需要有进一步加速的提升空间,当大模型推理成本加速越高的时候,才能真正实现技术平权,也就是你把成本降下来,有更多的老百姓就可以用更加低的价格能够直接享受AI带来的生活便捷。第三个趋势,智能体的落地,我们发现刚才讲的应用市场格局重塑,具体表现在大模型里面就是构建一个智能体,构建智能体,那智能体的构建平台非常重要,就是如何让智能体的开发门槛进一步下降,甚至到不懂技术的运营同学和产品同学都能够自己开发出一个能够解决企业痛点的智能体就变成了今年非常流行的趋势,所以选择一个非常好的智能体开发平台,也是在应用市场重塑的格局里面非常重要的工具。
腾讯在今年初,DeepSeek出来以后,一个国民级的应用出来以后,腾讯积极拥抱DeepSeek,实现了双模驱动,有自有的模型混元继续投入大量研究,同时我们也拥抱开源的DeepSeek,在双底层模型的帮助下,在上层ToC端的应用,比如说元宝快速接入DeepSeek,现在也是成为一款国民应用。在C端应用过程中出现有趣的应用融合的创新,比如说在腾讯新闻或者在公众号里面看到的内容资源,我们可以一键分享到元宝上面去做内容精华的提取,同时在元宝上面去写一个PPT的大纲时,这个时候我们同样可以把内容一键导数到腾讯文档再做丰富,所以应用融合创新也是未来趋势。
B端产品我们发现在双模型的加持之下,腾讯B端产品也会产生一批AI原生应用创建的一些工具。
现在来看一下腾讯云给企业以及合作伙伴提供的整套全栈的技术栈,大模型的基础设施,大模型出来之后对计算、存储、网络都有全新要求。再往上到的大模型的工具平台,工具平台主要就是两个方向。一个就是训推一体方向,尤其保险业我们发现最后其实你底层动不动有上千亿的模型,其实并不一定可以很好的解决企业问题,而且成本又高,耗资源。如果用一个精调过的小模型,它就能够解决保险业里面单点的痛点,这个时候可以拿一个大模型做训练,蒸馏出一个小模型,小模型具备大模型的能力,最后部署起来非常简单,所以说这是一个平台,他在做训练和推理的过程。
智能体开发平台,今年整个趋势发展都是朝应用和智能化方向发展,所以提供一个给B端用户能够快速低门槛搭建平台的开发工具显得尤其重要。
我们在保险业上面我们也持续在践行腾讯云,我们发现在保险业里面,在AI如何对保险业进行赋能主要从三个方面,一个是前台的营销,还有中台的业务支撑,还有后台的支持。前台营销更多的是帮助代理人能够帮他扩大拓客的带宽,AI在中间可以扮演很强的助手、陪练、智能会话分析的能力。在中台是有两条路可以走,一条是针对大模型去蒸馏训练出一个小模型,易于部署,小模型具备的保险行业里面的专有知识,它能够更好、更准确回答用户问题,可以帮助代理人。另外一条路,因为大模型的训练或者精调他的成本比较高,还有一条比较低成本,就是使用智能体开发平台,我直接做一个应用,通过RAG或者工作流技术把企业的数据直接放到这个RAG里面,可以提升端到端的准确率。后端支撑,把数据库统一做管理,支持私有化部署,还有代码助手,还有运营分析系统,这些都是可以帮保险的后台很好的起到的支撑作用。
还有训推一体的平台可以做什么?训练和推理一起的工具平台,我们看训练,我们主要要把所有的GPU卡资源都管理起来,如何管理GPU卡资源直接决定你的成本高与低。比如说我们提出一个潮汐调度,所有GPU卡白天解决推理,到了晚上推理调用的人少了,这个时候就可以把GPU卡拿过来做训练,去做离线任务的训练,这样可以把GPU卡24小时跑满,这是潮汐调度。还有一个是推理,我们知道今年DeepSeek今年出来以后,DeepSeek是开源的,但是各家提出的DeepSeek满血版提供的推理服务差异在哪?主要就是在推理速度上面,推动速度决定着你需要投入多少资源,比如说单台机器你能支持10并发,跟你单台机器支持20并发,你的成本就是÷2,所以说在这个平台通过加速的能力,能够帮助企业大大节省推理成本。
只能体开发平台,刚才讲的是今年风口就是Agent智能体,我们提供了三个模式来帮助客户去实现低门槛的开发一个智能体,标准模式就是用RAG的方式,企业把自己独有的数据不需要放到大模型下面去增训,可以用一个更轻的方式,就是用RAG方式把企业数据放到向量数据库里面,可以用标准模式来。还有一种模式叫工作流模式,就解决了我们传统的人工智能大模型是我说你来查,你来告诉我答案,但是进化到你说我来做,这个就是工作流,它能够完成企业的一些任务。企业里面经常会有一些定向的任务,它其实是有固定几步流程的,比如说输入一个保险人资料,就能够针对这个资料去库里面去找到匹配推的保险,其实这是固化的过程,可以大大减少人力的投入。除了工作流模式之外,还有一个Agent模式,这个才是真正到了智能模式,在Agent的智能模式下,我们可以实现任务的自动规划,可以实现任务上下文有上文记忆,可以记住这个用户的偏好,可以调用第三方协议,可以调用第三方的插件,比如说计算的保费的插件,能够去让智能体解决复杂问题,这个智能体可以有三个模式来解决这个问题。
先讲第一个模式:RAG的模式,企业现在基底模型如果大家都一样的时候,我这个企业跟你的企业我怎么体现出我做出来的AI赋能比你更强呢?这里很重要一点就是企业自己独有的数据,当你用好企业数据,可以使你AI赋能效率大大提升,很重要一点就是RAG的能力,RAG的能力刚才讲到就是针对企业里面有大量的复杂的表格,PDF、PPT等等,其实企业里面有非常复杂的Excel表格,表格嵌套表格,大模型要把这个能力把图文混排的表格去做解析,用多模态的技术把这些表格里面的数据全部解析出来,这个时候就能够方便我们的代理人去问这些复杂表格的时候,就能非常精准的图文并茂的方式回答你。
在工作流里面,在一些固定的任务时,我们可以用大模型的工作流替代人工的重复操作,在工作流里面我们的智能体开发平台有一个亮点,就是支持全流程节点回退,有一个全局视角的Agent进行意图判断。举个例子,我们在保险输入时我问你性别、年龄、你希望采用年缴、月缴,你希望这个保险时间多长,客户回答的全面所有参数时,你往下计算保费时,客户说我想把10年改成8年,这个时候在正常的工作流里面走不下去了,因为这个时候节点在算保费时,这个时候你告诉他回退到上个节点,整个系统就卡死了,必须Agent关闭再重新打开,意味着前面用户输入又得再来一遍。这个时候我们支持节点回退方式。
还有一个就是多Agent模式下的转交协同,尤其复杂企业里面有多个Agent之间互相协同,有一个Agent做代理人拓客用的,营销用的,有一个Agent解决客服用的,有一个Agent解决内部数据统计的,这个时候多个Agent之间需要进行协同转交,可以实现零代码进行协同转交,当遇到问题我把主动权转交给另外一个Agent,还可以再归还回来。可以解决企业复杂问题。
最后一个优势,支持MCP的插件,Agent进入到智能时代之后很重要一点就是调第三方工具,大家都要支持MCP标准协议就可以支持第三方所有丰富的插件。
两个保险业的最佳实践:一、通过调用DeepSeek的方式,上层建造一个智能体开发平台,帮助保险代理人助手,这个代理人当客户问他非常多的保险知识时,这个代理人可以在内部的RAG查询系统里面快速查到答案。比如说这个保险跟去年的保险有哪些差异,在我们大模型的智能体开发平台上面,两个文档一输出,马上用高亮给你标出,原来从3年改到5年,保费上升了1%,快速能够回答了。
二、某保险科技公司,它利用大模型来做智能外呼,就是给客户打电话进行保险的营销,这对小额保险直接在电话里面能够成交,针对大额保险能够先收集到线索再引到人工来,这个过程中非常重要的一点是:我们需要精准判断用户讲的每句话的意图识别,对应拿出那个分支的话术回答他。大模型在保险行业的应用中不仅仅只有大模型技术,还把传统AI的技术用上了,他要用户讲的话要能够转成文字,要有TTS的能力,你把大模型讲出来的话要能够用语音方式、拟人方式传递出去,这个案例很好的把传统AI和大模型AI做了结合,并且这个地方还要解决端到端的时延,要做到人与人讲话之间接近五百毫秒的回复,要不会感觉对方很傻,你两秒才回答我,这个感受不一样。
伙伴共建场景实践,在离客户最近的一公里其实是伙伴最清楚行业里面的Knowhow和规则,腾讯非常愿意和伙伴进行场景的共建,比如说中科软跟腾讯有密切合作,中科软提供底层的工具基础上包装了两个行业应用,一个保险计划书生成,还有一个就是智能陪练,这两个应用在门口的展厅体验非常好。保险计划书当用户输入了一些保险的信息通过工作流方式每一步先去判断用户的风险,再计算用户保费,再结合整个保费情况输出给用户,整个过程中你会发现生成了一份保险计划书,这是一个非常好的共建场景。
大模型今年的趋势,不像去年,去年所有企业更多是关注底层的基模的性能,但是今年所有的企业更多的关注应用,因为应用能够解决企业的最后落地痛点问题,腾讯希望在今年的趋势下,我们能够提供智能体开发平台和训推一体化的平台,跟伙伴一起,最后帮助保险行业能够研发出更多的智能的应用,来为保险业解决真正行业中的痛点,实现降本增效。谢谢大家!

