华为云数据库军团总裁 李世豪
尊敬的各位领导、嘉宾,大家好,非常高兴来参加中科软的财险科技创新论坛,并作为首位演讲嘉宾进行分享,我代表华为公司分享一下华为公司在数据库领域的最新进展。
今年6月份,行业监管机构对自主创新改造有了最新要求,要全面替换、应替尽替、能替尽替,围绕这个要求,企业到底如何用好数据库,更好地满足行业监管要求?
大家可能会关心第一个事,云数据库军团是做什么的?一句话说,就是围绕产业,我们会成立由科学家、工程师、行业专家组成的团队,从行业角度把它做深做透,这里涉及到和客户、伙伴共同去打造围绕行业的差异化方案,也会涉及到华为内部各个团队,如生态、交付、测试等等,包括分布在各个团队的行业专家,以军团方式把他们连接到一起,更快响应企业客户的要求。
第二、华为云数据库的定位和愿景是什么?从华为自身而言,GaussDB承载了华为自身最核心的系统,包括ERP、财经、 消费者云、车等业务所依赖的数据库都跑在GaussDB上;此外,我们面向全球的金融、政府、央国企、运营商等关键基础设施领域提供全场景的数据库服务,服务好客户。
从业务变化来看,这也推动了我们人才的布局,在国内,我们已经覆盖了15个研究所,在海外,俄罗斯、土耳其、加拿大等国家都有我们的内核专家。这样的人才布局,为我们产品的打造和投入提供了非常坚实的基础。除了GaussDB,我们还在开源生态、迁移、运维工具等维度提供全栈全场景的数据库服务,只有真正走向全球,才是具备全球竞争力的数据库,才能更好地支撑业务的持续发展和技术的持续领先。
我重点介绍一下GaussDB的进展。在金融行业,我们从2021年起,最开始在大行,包括工行、农行,一直在围绕客户做联合创新工作,近年来有很多关键突破,包括在工行做到了同城双集群的RPO等于0;与招行联创的基于Ustore的原地更新存储引擎,还有全密态、应用无损透明等等;2024年我们推出了向量数据库;2025年推出了透明多写。沿着金融行业,GaussDB还在持续不断地孵化新的能力,也给全行业带来了技术的领先性。
2025年后的核心,是怎么从“能用”做到“好用”。对此,我们主要考虑几个方面:一、韧性,如何来确保业务的稳定运行;二、安全,昨天看到一条新闻,一个700多人的企业被黑客勒索4000多万,因为交不起赎金解散了,所以如何防勒索也是考虑的重点;三、高效运维,现在随着国内数据库越来越多,该如何做好数据库的运维工作;四、智能,数据库如何和AI更好地结合,还有第五点,就是数据库的生态。
第一点,在主流商业数据库替代过程中,最大的挑战就是应用能否不改造。GaussDB的透明多写方案就是用于平替主流商业数据库的。传统模式下,主流商业数据库跑在一体机上的方案,因为硬件的能力可能跟不上,只能去做分布式改造。对于保险系统来讲,很多业务有很多存储过程,且年头比较长,代码人员可能找不到、改不动。针对这种情况,能不能在业务上不改,同时又达到一体机性能的要求?围绕这个需求,GaussDB推出了透明多写的方案,其实就是对应主流商业数据库的多读多写。实际项目中的数据显示,六节点的GaussDB,TPMC可以达到688万tpmC,相比较主流商业数据库跑在X86上还是有非常大的提升。第二、GaussDB在存储节点上可以做到24个节点,达到200TB,就是单集群能做到200TB的数据处理能力,应该说基本上能满足大部分主流商业数据库替代的场景,因此应用也不需要做分布式改造。
第二点,现在数据勒索已经是一个黑产了,有专门的人从事数据勒索工作。我们从去年和建行、工行也在做相关方面的联创。大家知道,黑客在锁库时通常会锁住主库,要恢复的话,需要通过备份恢复存量数据。但是在锁的瞬间增量数据可能就会丢失了,RPO做不到等于0。而GaussDB的黑匣子方案可以把增量数据写到机密存储里面去,并且只能写不能改,所以黑客是进不去的,一旦主库被锁住,就会把增量数据恢复出来,该方案目前已经在工行落地了。有了这项技术,我们跟建行找到了新的场景、新的能力,就是异地不丢数,原来一般是同城不丢数。有了黑匣子的技术加持,哪怕发生机房级的故障或者两个数据中心都出问题,增量数据也是在这个黑匣子里,一旦网络环境恢复,这些数据也能恢复,因为是实时写的增量数据。
第三点,智能运维。数据库产品是在各种严苛场景下打磨出来的,需要各行各业场景深度的填坑经验。只有打磨清楚,数据库产品才能更稳定可靠地服务大家。GaussDB基于大模型技术推出数据库智能助手GaussDB Doer,可以做到百亿级运维Token,基于运维知识库快速支撑各位DBA老师做故障定位,该功能现在也是可以体验的。
第四点,向量数据库。我们知道,大模型技术在保险行业也在广泛推广,那如何落到本地保险行业的知识,是需要知识库的结合,因为光靠L0的基础大模型不足以支撑保险行业的应用。需要知识库的话就需要向量数据库,GaussDB天然地具备向量数据库的能力,所以只要买一套GaussDB,就可以同时兼具两种能力。GaussDB向量数据库可以做到千维的查询、百亿的向量数据,时延做到25毫秒,召回率达到99%。因为向量数据库是向量计算,向量计算在很大程度上依赖于先验知识,其计算过程往往需要借助大规模的算力来实现,对算力开销比较大,但是和GaussDB结合以后可以做到标量和向量的结合,最大的好处是能节省算力,有一些数据可以直接用数据库的标量计算来做第一次查询,这样就能力大大节省算力。
第五点,关于我们和伙伴共同推进自主创新数据库的落地成果,主要包括几个方面:一、在商业层面,我们联合软件伙伴,如中科软以及我们在银行领域的伙伴等等,一起进行联合方案的打造,通过伙伴的业务场景共同打造满足所在行业的差异化方案和能力。二、通过市场发展基金、专职人员激励、伙伴能力提升计划等大力发展更多的服务伙伴来支撑数据库的运维工作,共建数据库繁荣新生态。人才培养方面,我们已经在全国130多所高校开设了GaussDB课程,还定期面向高校教师举办导教班培训活动,给高校老师做课程培训。
接下来分享一下在工商银行的实践案例案例, 1)工行在做主流商业数据库替代时,一个最具挑战性的业务就是全球信贷系统,这对GaussDB是一大考验,全球信贷系统能完成替代的话,说明用GaussDB替代是可行的,我们围绕全球信贷系统做了很多的技术开发,一方面是存储过程超过了两亿行,开始的时候也搞不定,然后我们基于工行的场景,全部做到内核里,最终对存储过程的替代做到了95%以上。 2)因为工行有各种类型的数据库,GaussDB的兼容性能够尽量地不做业务改造,目前工行关基和核心业务有1500多套,在6月30日已全部上线到GaussDB。3)我们和工行联创的同城两个机房,两个集群的数据做到了RPO等于0,RTO秒级的水平。
今天的分享就到这里,感谢大家!
合合信息智能解决方案事业部副总经理&解决方案负责人 邓亚光
首先欢迎各位来宾,非常荣幸再一次站在美丽的古北水镇这个舞台上分享合合信息过去一年围绕智能文档处理包括商业大数据,我们在产业端的实践落地的细节应用以及思考。
因为合合信息这个公司的名称大家不是很熟悉,每次我们希望花一点时间把合合信息的公司介绍一下。合合信息是一家在2006年在上海成立的科技公司,我们希望用科技创新让世界更高效,有一个关键里程碑,去年年底在上海科创板上市。我们公司两条主营的业务线:C端产品、B端服务。C端产品包括扫描全能王、名片全能王、启信宝。整个B端服务跟C端产品构建逻辑类似,基于整个底层的AI技术和商业大数据技术给我们B端客户提供企业级的解决方案。
今天我也是围绕在B端领域的探索实践给各位保险行业的伙伴们做一次分享。
实际上我们回顾过往基于大模型的技术升级产品大概也有两年半的时间,大概从2023年年初开始。我们回顾看一下在整个产业端围绕大模型的应用,五大场景类型,包括像文档治理、内容生成、知识管理、客户服务、辅助决策,无论是什么样的AI技术,基于什么样的AI技术构建出来的场景应用,我们认为走向三个价值:一、提升组织内部流程运营的效率,包括去把组织内部的一些经验资产通过模型能力去沉淀,再比如说激活我们企业内部的数据价值,这三个价值的前提是需要非常高质量的标准化的数据输入,我们需要一款能够对多元异构数据处理的底座能力,这是合合信息在过往希望研发的方向。我们提供各类文档处理的能力,在第一个环节文档治理,比如对合同文本的精准解析、合同文本关键要素提取,这个效果直接影响到后续环节的有效性。
回到保险行业,其实保险行业作为全球范围内规模最大,最稳定的行业之一,相比巨大的保费规模在内部运营效率提升方面还有很大提升空间,有大量的业务流程和场景还是通过大量人力去处理的。包括有大量人力做文书处理、表单填写、理赔的人工处理,包括核保的人工处理。过去两年半大模型的出现,极大的提升了对非标准化复杂文本的理解能力,包括对邮件、PDF、长文本的合同,相比传统的自动化工具,像简单的OCR等,更具备更强的泛化能力和上下文理解能力。随着大模型的到来,优化了我们保险行业的流程,甚至去重塑和接管起到了非常大的可能性。
针对这些场景的理解,合合信息提供的通用文档的识别解析就成为了一个非常关键的能力底座,这是核心的研发方向。
我以具体的案例去讲一下我们文档解析的核心能力,包括如何去助力构建一些AI应用。
面向客户或者业务人员的AI工具,知识问答是金融行业、保险行业比较多的落地应用方向。它大概逻辑就是会去多元异构数据给各个业务单元或者客户提供知识问答的应用。合合信息基于自己的架构,包括文档解析能力,构建了一款面向财经金融分析师的知识库,内置了大量的上市企业的文档数据,包括年报、财报,并允许用户上传一些自有数据。这个应用构建我们更多希望能够协助更多的开发者快速构建出自有的应用,我们把整个代码其实都做了开源,大家可以基于这个地址进行访问。
当我们去构建RAG实践时发现,我们融合很多内部的数据、知识,融合内部的保险条款,在整个过程中产生的业务数据、制度数据,我们认为大量的知识都是沉淀在以文档形式沉淀的,我们在实践RAG的时候发现有一个通用瓶颈,就是解析的质量直接决定后续环节的有效性,比如说对保险条款的提取,包括对表格的提取,如果条款的缺失包括表格的断裂会直接影响文档切分领域完整的语义性,构建索引库的时候,会脱离实际业务场景,对于后续的整个问答准确度会产生非常大的影响。所以我们认为需要有非常专业的文档解析工具去处理这些问题。
以一份文档为例,我们可以对文档进行分割,即刻义把内部元素进行提取,比如说有很多手写体,不同的表格、公式、图片,目录结构都可以解析出来。我们还可以把文档中的阅读顺序进行还原,比如说文档有阅读顺序的,从左到右,我们可以通过文档解析工具可以把阅读顺序进行还原。包括文档中有很多复杂元素都可以通过文档解析来进行提取。比如真实文档中有存在水印,有手写,包括对图象进行切边、校正,把这些元素都集成到通用解析工具上。知识库问答,当我们有一个需求,需要知道来源是哪里,通过文档解析可以结合大模型实现这个效果。
为了进一步做验证,我们做了很多的测试,我们自己基于第三方的Agent开发平台,构建了很多知识库,也用到了合合信息自研的文档解析工具,包括开源的解析工具,这个细节非常多,我们把相关测试内容放到公众号上。对于目录结构分段使RAG系统更加稳定,段落和表格完整性对效果有正向影响,我们也对比了第三方开源的工具效果,也是有一定提升。
举两个实际情况,比如说这个原文件是跨页表格,如果通过第三方开源工具会缺失第一行。像行列密集表,用一般工具会存在断裂和缺失,会直接影响下游的问答效果。
回到保险行业,我们会有大量的真实单据需要去处理,包括票据、表单等等,通过合合信息的文档解析和大模型能力,可以解决三个挑战:一、解决这些文档质量参差不齐的情况,可以使整个版面元素进行统一数据化处理,可以通过泛化能力适应不同的版式。
实现路径:一、通过文档解析能力为文档进行解构,当页数小于3时,直接调用自己训练过的抽取大模型进行结构化,如果页数大于3走RAG的架构,大模型接受Token长度有限,通过检索召回的方式把相关片断进行系统输入,最终得到抽取的结果。基于这个逻辑,我们可以解决长短文本的各类抽取问题,可以覆盖全域的文档处理的需求。
以一个实践案例来说,这是从网上找的单据,所以不存在客户信息泄漏的问题,比如说像我们看到某一个设备的保险条款,其实从文档处理角度来看是非常复杂的,有中间的表格,中间还有条款类,还有非表格的清单类,其实像这种保险条款是一对多的关系,每个保险险种都有保险金额、费率、保费,我们通过文档解析可以理解这个复杂版面。
因为大模型的泛化能力加上解析能力,适配不固定版式的单据,非常典型场景就是保险资管做基金运营时,上游的基金管理人会提供各种各样的交易确认单,没有办法穷举这个版式,我们作为下游其实没法要求上游提供的版式按照我的要求走的,所以通过这种抽取能力可以突破不固定版式的限制。
基于长文档,像合同动辄几百页,通过解析+大模型+RAG的架构,可以突破长文档的限制。我们也做了很多实践落地。基金合同为例,私募基金合同大概120多个字段,全字段测下来识别率可以达到85%以上。
其实我们在前端去进行OCR架构的调整,我们也会对具体场景模型进行微调,合合信息在B端积累了很多年,我们有一个非常精标的数据集,通过精标的数据集对开源的基础模型进行了训练。我们跟客户合作时,也会积累很多场景知识、行业知识,比如说抽合同时购买方其实有不同的别名,怎么样归到一个字段上,这是需要做大量处理的,虽然大模型具备了一定的识别同义词的能力,但是如果不做训练的话会有大量幻觉。回到B端场景,我们做大量训练就是降低幻觉,提升输出稳定性。所以我们基于解析大模型、RAG+模型微调可以提供非常精准的解决垂直场景的抽取能力。
热度非常高的一个话题,就是多模态,它的技术成熟度在C端逐渐落地,包括像文生图、文生视频,但是回到B端场景,合合信息也在保持积极探索。先说结论:我们认为金融机构、保险行业基于多模态的技术在处理文档这个领域还有点早。原因很多:首先多模态的稳定性还是比较差的,他会输出完全和文档内容不相关的内容,包括在去训练优化的时候会出现比较大的挑战,比如说通过OCR+大模型我们去训练时可以优化通过文本数据标注提升OCR识别率,通过语义的标注提升大模型的理解能力,但是如果多模态的话其实需要做大量文本图象对的标注,无论对标注难度也好,或者对样本的要求也好,都是指数级上升的。所以我们认为在短期可能对于多模态的应用还为时尚早。
这是我们跟多模态大模型针对复杂场景做了一些测试,合合信息产品效果还是比较显著的。
基于文档解析能力包括大模型的抽取能力,我们构建了一站式智能文档处理平台,可以把某些场景下的分类、抽取、审核进行一个集成。因为时间关系不展开说了,包括在实际的保险业务场景中,有很多的单据流的场景需要通过一个非常好用的文档解析工具、文档处理工具去对各类单据进行分类、识别、抽取,包括进一步的审核。
合合信息一直在服务金融机构以来,都是本着提效工具的定位,比如说对于文档处理来说,我们提供图象处理、图象解析、图象分类、信息的抽取,基于大模型技术对不同环节进行了升级,随着DeepSeek的开源其实可以用到越来越多的更好用的参数规模更大的、能力更强的大模型,其实也让我们的产品从提效供给走向智能伙伴,我们可以通过大模型的能力对结构化的文本进行智能审核及
简单来说就是用TextIn DocFlow进行结构化协同,基于大模型的能力做智能化审核,用一个视频的方式演示一下。
刚才是一个财务报销场景,我要识别这个发票是否是在我们公司要求的差旅时间内发生的,所以可以基于抽取结果进行大模型的理解进行这样的审核。
展望一下未来,其实我们现在的Agent技术也在不断成熟,未来DocFlow也会从工具的方式走向Agentic DocFlow,机制逻辑是:传统ADP以线性方式进行文档处理,是相对流水线化的,包括流程也是相对固定的,未来我们希望针对不同的场景可以动态调度不同的图象处理模型,比如说调度去水印、相片增强,能够实现自动的编排,应对更多复杂场景。包括DocFlow,对于用户反馈的样本可以快速迭代模型,提升模型的识别率。
第二部分是关于商业大数据,合合信息旗下有一款启信宝的C端产品,在过往也基于数据能力服务了很多保险机构,围绕合规、展业、主数据管理、风险监控提供了解决方案。
我们的目标希望构建一个高质量的外部数据源,在数据流通、数据要素价值释放大背景下,能够给到金融机构优质的外部数据资产,包括我们去构建了全量的基础数据库以及基于基础数据库构建了各种知识数据,比如说各种机构画像的标签画像,包括启信分等。
我们现在也基于大模型升级了整个数据产品,核心的逻辑是希望让大模型结合业务经验,使得用户在用数据时用得更好。我们用大模型解读各类的裁判文书,让大模型用非常通俗易懂的方式输出相关的风险,这样的话能够非常快速的降低我们的尽调的时间。
区别于C端查的场景,我们数据交付方式非常多,可以通过数据库的同步机制,把数据库以库的形式落到金融机构内部,搭建同步服务,让你每天拥有实时全量的外部数据。同时提供相关的建模和平台搭建的服务。
这里面其实有一个具体的例子,不展开说了。
总结:
今天把合合信息B端产品实践做了系统性的分享,现在外部很多应用发展路径是从Tool模式走向Copilot,走向Agent。回到合合信息,我们是从Tool走向Copilot阶段之间,这也是因为我们面对的是非常严肃的B端场景,我们希望提供可靠、经过业务验证的以后,这样一个比较务实的技术和产品迭代思路以及服务理念也是践行了合合信息的价值观,我们希望把真正经过技术验证的产品交到客户手里面,提供真有用、真好用的产品。
大家扫下面这个二维码可以获取到前面提到的名片全能王、扫描全能王、启信宝免费一年VIP。我们这个扫描全能王是非常好的工具,可以把考试的试卷的错题擦除掉,这是一个大人的福利,小孩的恶梦,大家可以用一下。
各位尊敬的来宾上午好,我是海光信息的纪钟。
海光信息技术支持与优化中心总经理助理兼金融行业技术总监 纪钟
大家都知道2023年十月底,中央金融行业工作会议提出了要做好五篇大文章,这也是现在各个金融单位关注的要点,同时2024年政府工作报告也提出发展新质生产力,这些都是国家层面对金融数智化转型的具体要求。做金融数智化转型过程中一定不是技术部门一家的事,一定是技术和业务双轮驱动才能很好地做好数智化转型,各个金融单位一定要将其当成一把手工程,通过最高层领导的协调工作才能将数智化转型做好。
而数智化转型过程中,金融企业需要关注四个方面:
一、业务创新,现在已经进入了第四次产业变革,也就是人工智能革命已经来了,而人工智能革命带来的是商业模式的剧变,这就要求我们的业务创新速度要加快。原来可能半年上线一个新业务,现在可能几周就要上线,这就需要我们IT系统能很好支持这个业务创新速度。现在保险行业要实施IFRS17,引入新的会计准则,IT和业务部门就要关注能否从原来业务系统快速切换过来。还有,像新兴的互联网保险、智能理赔、智能投顾等这些新业务能不能快速上线都是业务创新需要考量的范畴。
二、风险管控,保险是经营风险的金融企业,怎么有效降低风险、化解风险是保险企业非常关注的,比如明天有大暴雨和冰雹,能不能有效通知车主尽量少外出,尽量避免被冰雹砸中被水淹,提前有效防范风险。同时保险公司有很多资金在运作,能不能有效的防止被欺诈也是风险管控的迫切需求。
三、市场营销,可以说所有销售里面最强的是保险公司的销售,因为他要卖很多复杂的金融产品,要针对性说服用户购买产品。怎么更好的说服用户,怎么更好的做好营销,发现优质客户,这就是智能营销需要做到的。对保险经纪人、代理人的驱动与激励也是智能营销要做的工作。
四、降本增效,保险公司对IT的投资还是非常有限的,怎么做到降本增效,在有限的投资下实现业务高速拓展,是管理层非常头疼的问题。保险公司可以利用很多技术做到降本增效,比如经常提到的人工智能技术、区块链技术、物联网技术、绿色数据中心液冷技术等等。
我们在做数智化转型中也要关注三个特别大的要素:
一、算力,来自信通院、IDC的数据,全球算力需求是指数级上涨。2025年中国数智化算力要多少?要1000EFLOPS,这是什么概念?大家知道现在全球最快的超算中心最大的性能就是E级机,这1000亿至少有1000套E级机才能撑得住中国数字化转型的要求。
二、算法,现在随着人工智能革命的出现,AI算法的迭代非常快,以ChatGPT和DeepSeek为代表的大模型的算法,每三个月迭代一次。这个迭代过程中要求我们的业务能快速跟进,这样才能够加速数智化转型的创新速度。
三、数据,数字中国提出来最重要的一点是要把数据变成生产要素,就是数据要素,这就要求考虑几点:1、我们企业能否很好的做好数据治理,就是要做好整个企业数据的质量、安全、架构和生命周期的管理,实现数据有效利用。2、金融机构是使用数据非常多的企业,数据仅靠金融机构自己的数据是不够的,就要打破这个数据壁垒,实现共享,同时保证数据安全和隐私保护。3、我们现在拿数据训练大模型发现,会出现一些幻觉,幻觉的根本原因,一个是算法不行,一个就是数据不真实,不标准,所以数据的真实性和标准化是有效解决这个幻觉的很好的手段。所以我们要把数据作为新一代的数智化转型非常关键的点去考量。
在其中海光扮演什么角色呢?海光作为金融行业IT基础设施的主要技术力量,一直致力于推动金融行业数智化变革。从海光信息2024年财报大家可以看到,海光信息每年的销售额都呈50%以上的增长,去年达到90多亿的销售额,同时我们很关注研发,在研发的投入是销售额的30%以上,目前已经是整个金融信创市场的TOP2供应商,同时我们在一些非信创市场也开始涉足。
海光不仅仅是一个做CPU设计的公司,还同时兼顾了CPU和DCU两个产品的研发,两个产品目前都处于国内行业领先的水平。
先看一下CPU,海光第二代产品开始全部通过了国家安全可靠的评测,到了现在的C86-4G已经实现了国家最高安全可靠等级,其性能实现了跟国际主流厂商并跑的水平,同时海光目前已经做到了4路互联。我们跟合作伙伴,类似于像达梦集中式数据库这样的产品,他可以把原来的纵向扩展能力提升2.4倍,取得了非常好的效果。整个C86-4G除了性能以外,还在两个方面做了很多工作:
一、安全,CPU内有一个安全模块,通过了商密的二级认证,很多时候客户要做密评,用它能够直接过密评三级。C86-4G CPU内集成了SM3/SM4指令集,可以直接用指令集级支持国密算法3和国密算法4,使密码运算得到了数倍的提升。有些安全产品企业把加密卡拿掉,直接用我们的CPU实现,在降低成本的同时还提升了业务处理速度。
二、RAS特性,我们对标小型机做了100多项RAS增强,保证单节点可靠性,避免爆炸半径过大对系统的影响。
海光C86-4G在交易型场景里面已经有2倍以上性能提升,如果采用4路是4倍提升。在大数据场景有2倍提升,在JAVA场景是3倍提升,在云桌面场景里面达到3倍提升,在基于分布式存储的Ceph场景2倍提升,在WEB场景是2.5倍的提升。
目前保险行业用到了3类海光CPU,一类是3000系列,主要用于终端产品,原来客户用信创终端产品时感觉性能下降,但是换上海光终端的用户都觉得这个终端是完全能够替代原来Intel 的。另外两类是均衡型的5000系列和高性能的7000系列,性能满足要求,生态跟X86生态完全一致,原应用可做到无缝迁移,用海光性能优化包优化后性能会显著提升。
再就是安全,CPU内有安全模块,这个安全模块通过国家密码局的二级认证,如果客户需要做密评,拿这个模块就能够通过三级密评。同时海光支持可信计算,金融客户在实施等保2.0的等保4级时要求实现全链路可信,采用海光的产品就完全可以做到。还有机密计算,在云里面部署多租户时,需要依托机密计算有效保证防止攻击,在机密计算范畴海光可以提供安全容器、安全虚机等技术保证计算过程的安全性。在密态数据库领域,很多用户怕自己的数据泄密,需要保证在计算、传输和存储过程中的数据全链路安全。我们与合作伙伴推出的密态数据库技术在这几个方面都进行了加密,完全保证各个处理节点的安全。应对黑客攻击,我们有可信计算可以保障整个系统的全链路安全可靠。
海光DCU的生态类似于CPU在X86生态一样,可以有效和英伟达的Cuda生态兼容,是我们非常强大的优势,通常一个模型或者算法在3人天内即迁移,这是NPU架构不可想象的。DCU产品已经在很多金融企业用于票据识别(OCR)、数字人、小模型或者大模型的推理等,在保险行业已经有多家公司选取海光DCU卡甚至做到了千卡集群。
同时,我们认为做DCU不是光靠硬件,软件更重要,我们投入了数百位非常高水平的专家去研究DCU的软件产品,在DTK这一层对标英伟达的Cuda、AMD的ROCm等等,实现了代码的快速兼容。在第二层DAS,对标英伟达的CudaFor AI ,同时把包括像DeepSeek的推理模型全部融合。最高一层对标英伟达AIE,我们叫DAP,为用户提供了完整的人工智能开发平台。总体来看,海光DCU的优势包括:算力较为领先,同时在卡间互联方面嵌入了专用的超高速互联芯片,实现了大模型下的多卡互联需求。在全栈优化、全景支撑方面也都做了很多工作。
海光DCU目前支持的AI主流开源框架达20多个,95%的AI算子也都完成适配,对接了常用接口库,迁移了大量的AI应用软件,由于生态兼容性好,基于CUDA架构写的算法可实现低工作量的迁移,我们甚至有自动工具可以直接转换过来了,给客户带来的好处就是创新速度快,上线快,性价比高。
介绍第一个案例,用户是中国四大财险公司之一,他的核心业务系统原来是IBM小型机+Oracle数据库,迁移到海光平台加上国产分布式数据库,实现了全面替换,替换后性能提升了5倍,同时整个总拥有成本是下降的,这是信创带来的最大的好处,也满足业务要求,实现了系统的平滑迁移。
第二个案例是国内四大保险公司之一做的千卡集群,该保险机构要做全国的智能AI平台,买了千张DCU卡,并与其现有的英伟达GPU卡合在一起做了一个AI资源池,提供包括推理、训练等能力,涵盖了大模型和小模型,这里面也承载了中科软的相关应用,来满足该机构快速发展的要求。
最后总结一下海光芯的优势,主要体现在两个方面:
一、CPU,做通用计算场景,
二、DCU,做智能计算场景。
未来的产业预计30%是通用计算,70%是智算。
在通用计算里,海光能够提供良好的生态,同时能够为数据提供安全保障,算力能够达到现在国际主流CPU的算力水平。在存储应用方面,海光也跟很多存储厂商在合作,实现存、算、传的全面支撑。包括安全产品的厂商,如加密机厂商、安全网关厂商、防火墙厂商等也在用海光CPU的安全模块,保证整个计算过程中的安全。很多安全厂商原来用的加密卡,现在都不需要了,拿掉了,就能够满足安全厂商对国家密码认证的需求,很多金融机构要做密评,用这个技术就可以满足要求。
第二,在智能计算场景,海光更多考虑帮助客户快速的适应业务高速迭代,要能够把原来的业务很容易的迁移过来,很多创新型的业务,基于开源社区的一些技术代码快速拿进来,快速实心业务迭代和创新,目前海光做了几件事:一、我们在底层就跟Cuda兼容,中间层对标英伟达的Cuda For AI,再往上我们有DAP,满足跟英伟达的AIE完全匹配。我们同合合信息等AI合作伙伴一起提供了很多金融行业智算的能力,不论是票据识别、单据识别、智能客服、风险监控等等方面都做了大量的研究。帮助用户从原来传统应用快速转变成了基于智能化的智算的服务,把很多新兴的业务都快速融入了进来。为金融行业的数智化变革尽了自己的微薄之力!
今天想跟大家分享的内容就这些,谢谢!
OceanBase资深架构师 李丹丹
各位来宾,各位专家,大家上午好,我是OceanBase架构师李丹丹,今天很高兴能有机会与各位共同探讨,在保险行业数字化转型过程中,OceanBase一体化数据库如何助力保险行业攻坚关键业务系统。
AI时代下,企业数字化转型迎来了一个关键的阶段,无论是政策引导还是国产升级要求,都在加速这一进程。不同于前几年只有头部的金融机构,比如在保险行业如国寿、太保等在做数字化转型,现在更多的中小保险公司也都加入了。从技术驱动层面来看,传统核心系统现在都要做升级,甚至做一些拆分,像平安就是在做这件事;从市场需求来看,互联网保险推动着保险业务变革,业务连续性要求从时段性保障升级为7×24不间断运行,这就对基础设施高可用能力提出刚性需求。
聚焦保险关键业务系统建设,我们面临着四个趋势和挑战,首先就是数字化转型正在用新技术提升效率和用户体验,在财险领域,智能农险,短险,出行险、运费险、外卖延误险等,这些都对传统系统带来很多冲击,要求越来越高,对于互联网、平台、保险公司来说,如果响应时间过长,可能导致平台切流,给保险公司带来较大损失;从产品创新角度,尤其对于车险,有新能源汽车、自动驾驶等等,也会带来挑战和冲击;从数据驱动角度,现在监管要求越来越严格,我们面临的这些风控类的系统,反洗钱、反欺诈等风控类系统的要求越来越高;第四点,全链路技术栈需要满足实时分析、多模数据融合处理等能力。
最上所述,攻坚保险关键业务系统,OceanBase助力金融数字化转型包含五个层面:
一、金融级的稳定性和安全性,作为从金融行业实战中成长起来的数据库,OceanBase深刻理解业务连续性的重要性。要保证所有的金融业务能够实现7×24小时的不间断运行。无论是业务变更还是数据库升级等等,始终保持服务的持续可用。
二、高性能,这是分布式的特点,能够更好的应对大数据量和高并发量的需求。
三、实时风控系统,基于OLTP-Based HTAP,可以保证风控系统做到更好的实时性,过去咱们很多时候是做T+1业务,现在可以实现准实时的效果。
四、对于腰部和中小保险机构来说,需要用更低的成本完成升级,快速完成国产升级的要求,我们提供MySQL、Oracle、DB2等数据库的平滑升级方案,从产品到解决方案到工具产品的全配套覆盖。
五、最后就是高性价比,保险机构和银行不一样,数据量非常庞大。分布式的海量数据处理能力和数据库编码压缩能力可以降低算力需求和存储成本,提升投入产出比,实现降本增效。OceanBase是根自研,也是产品为金融和保险客户兜底的最大底气。
这是产品的发展历程,OceanBase与多数国产数据库存在本质差异,我们是从蚂蚁集团内部孵化出来的,有巨大的内部场景,支付宝作为国家关键基础设施之一,底层所有数据库都是用的OceanBase产品,不仅仅是交易支付链路,到财富类,到保险类,到余额宝都是用的OceanBase数据库,有着连续性的保障,产品本身也是内部在完成孵化之后外部进行推广。2014年开始支持双十一,稳定支持了12年。现在升级到V4的版本,两年前开始扬帆出海,海外很多金融科技公司也都在用OceanBase产品作为核心数据库。
赛迪顾问的报告显示,OceanBase在金融核心系统数据库选型中排名第一,去年完成了国家信息分布式安全信息评测。OceanBase的兼容性和稳定性以绝对优势成为市场占有率第一的国产数据库。
面向保险行业也是由产品一体化的产品家族来支持,OceanBase只有一款产品,支持单机分布式一体化的架构,同一个产品既可以集中式部署,也可以分布式部署,最新版本开始支持列存,现在很多数据中台、数据加工或者实时数仓场景都可以用OceanBase数据库来支持。同时OceanBase也有数据库一体机,包括运营商的一些经营分析系统,都有用我们一体机产品。
对于保险关键业务系统,我们总结出来几个关键升级路径,比如现在大部分用的还是Oracle的系统,对于这类系统,OceanBase备齐了全链路工具,有兼容性工具,也有相关解决方案,可以做到业务平滑迁移。对于互联网保险的业务场景,很多是基于MySQL来开发的,OceanBase可以做到在一套集群内,既可以支持Oracle,也可以支持MySQL。
老系统像DB2场景这种,我们也是有专属工具可以做到数据级别的迁移,可以迁移到Oracle和MySQL的租户上。我们看到比较多的还是用的OceanBase的Oracle租户完成业务平迁,从能力上来说我们支持一户多芯,包括多副本的校验机制,可以保证金融级别的高可用性。从部署形态上来讲,OceanBase也是原生、多活的架构,可以实现一套数据库资源池支持内部上百个业务系统,像头部保险公司,比如说人保、国寿、太保、平安等等都是这么实施的。
对于保险行业来说,我会多聚焦于一些财险的案例,我们看到的是几乎所有头部的保险公司底层都是有用OceanBase数据库,像人寿、太平洋保险、中国平安都是全栈使用OceanBase数据库,一些中大型保险企业如阳光保险等也在全栈使用OceanBase。
以太保财险为例,太保在两年时间就完成了升级,比较复杂的系统如P17客户服务系统,覆盖了车险、非车险以及农险,全业务线的客服都会接入P17,压力非常大,这个系统需要承接日均1500个并发请求,响应时间严格控制在1秒内,且需要保证零业务中断,因为一旦宕机全业务线都会瘫痪。面对复杂架构与高压挑战,P17系统已稳定运行超过两年,持续满足高可用性要求。
在太保的案例中,原Oracle数据库总量达到6个PB,依托OceanBase存储引擎的编码压缩技术,在性能无损情况下,6个PB的数据量在OceanBase里缩减至只占1PB,每年节省上亿的存储成本。针对监管报送类场景,基于OceanBase 4.0的HTAP混合负载能力,系统处理效率提升300%以上,核心交易链路响应时间严格控制在1秒以内,有力支撑了关键业务系统的平稳运行。
中华联合财险基于专有云底座加OceanBase数据库完成部署,截至去年年底实现全业务系统流量100%切换至OceanBase。该部署包含核心系统单元化改造,可以进行流量调拨。去年就完成了车险、非车、农险全业务线国产升级,部署规模超百台服务器,前台业务系统开发周期缩短50%以上,依托于OceanBase的易用性,实现分钟级系统升级,这与传统架构停机几个小时进行升级很不一样。也是基于混合云架构完成全栈的交付部署。
众安财险核心系统全量部署于互联网保险业务平台,特点就是并发量非常高,而且有业务峰值,依托于OceanBase的分布式快速扩缩容和并行处理能力,有效支撑高频交易场景及业务峰值需求。大家叫外卖,到淘宝买东西的运费险都会接入保险公司,对于腰部保险公司很难做很大的基础设施建设,需要数据库可以快速且按需完成流量的分配。当承接了大型保险机构流量分发时,更需要分布式数据库产品具有快速的扩缩容能力。同时,众安保险利用OceanBase的多可用区的能力,可以把流量分配到不同的可用区,确保业务稳定运行,具备高可用的能力。
OceanBase的4.3版本支持列存引擎,在多家金融机构完成生产部署,如报表类系统或者加工类系统,以及监管报送类的系统,都基于OceanBase的列存完成上线。OceanBase列存引擎不仅兼容传统很多MPP数据库的列式存储特性及分析查询能力,同时可以利用分布式处理的性能,使得关键业务系统获得显著的性能提升,而且满足实时报表生成及查询等混合负载需求。
当今是AI时代,我们称为AI for OceanBase,面向开发端,OceanBase支持了自然语言转SQL语言的能力,支持智能开发的知识库;运维端除了基础监控告警,还具备智能诊断的能力,可自动生成修复方案并执行标准化处置流程。系统支持可配置的自主运维服务,还可根据DBA运维的习惯提供人机协同模式,降低运维成本,同时提升运维的效率,降低运维的压力。
OceanBase作为AI一体化数据库底座,无论是知识库还是智能助手可以加速落地。通过向量化引擎构建统一数据平台,原生支持结构化事务处理、半结构化数据存储,也可以把非结构化多模态数据如文本、图片存储进去,包括向量化引擎,都可以在一套OceanBase数据库集群中实现。既可以支持常见的交易类、分析类系统,也可以支持智能、AI的应用系统,可以在一套库中完成支持。比如说业务系统前端采用OceanBase的结构化数据来存,后端知识库的数据可以将PDF、WORD等导入到OceanBase向量数据库来存储。OceanBase的向量数据库能力优于市面上主流的开源数据库,同时OceanBase V4版本通过国家安全测评,满足金融级合规要求,大家可以放心的使用。
九层之台,起于累土,感谢选择与自研同行的客户,谢谢!
腾讯云保险行业架构专家 杜芳
非常开心和各位一起探讨在大模型下面我们的机遇和挑战,我们发现在大模型兴起的这一两年里面,尤其在今年我们会发现大模型朝着三个趋势上面去发展,第一个趋势,底层的模型越来越成熟的时候,今年大家更多讨论的是上升到应用,而且应用是离企业最近的能看得见、摸得着,能实际解决痛点的地方,所以今年大模型的应用将会重塑整个AI的市场。第二个趋势,在训练和推理上面我们还是需要再进一步加速它,我们知道训练和推理加速必然带来底层的卡的节省,对企业来讲就是成本节省,所以在训练和训推上面需要有进一步加速的提升空间,当大模型推理成本加速越高的时候,才能真正实现技术平权,也就是你把成本降下来,有更多的老百姓就可以用更加低的价格能够直接享受AI带来的生活便捷。第三个趋势,智能体的落地,我们发现刚才讲的应用市场格局重塑,具体表现在大模型里面就是构建一个智能体,构建智能体,那智能体的构建平台非常重要,就是如何让智能体的开发门槛进一步下降,甚至到不懂技术的运营同学和产品同学都能够自己开发出一个能够解决企业痛点的智能体就变成了今年非常流行的趋势,所以选择一个非常好的智能体开发平台,也是在应用市场重塑的格局里面非常重要的工具。
腾讯在今年初,DeepSeek出来以后,一个国民级的应用出来以后,腾讯积极拥抱DeepSeek,实现了双模驱动,有自有的模型混元继续投入大量研究,同时我们也拥抱开源的DeepSeek,在双底层模型的帮助下,在上层ToC端的应用,比如说元宝快速接入DeepSeek,现在也是成为一款国民应用。在C端应用过程中出现有趣的应用融合的创新,比如说在腾讯新闻或者在公众号里面看到的内容资源,我们可以一键分享到元宝上面去做内容精华的提取,同时在元宝上面去写一个PPT的大纲时,这个时候我们同样可以把内容一键导数到腾讯文档再做丰富,所以应用融合创新也是未来趋势。
B端产品我们发现在双模型的加持之下,腾讯B端产品也会产生一批AI原生应用创建的一些工具。
现在来看一下腾讯云给企业以及合作伙伴提供的整套全栈的技术栈,大模型的基础设施,大模型出来之后对计算、存储、网络都有全新要求。再往上到的大模型的工具平台,工具平台主要就是两个方向。一个就是训推一体方向,尤其保险业我们发现最后其实你底层动不动有上千亿的模型,其实并不一定可以很好的解决企业问题,而且成本又高,耗资源。如果用一个精调过的小模型,它就能够解决保险业里面单点的痛点,这个时候可以拿一个大模型做训练,蒸馏出一个小模型,小模型具备大模型的能力,最后部署起来非常简单,所以说这是一个平台,他在做训练和推理的过程。
智能体开发平台,今年整个趋势发展都是朝应用和智能化方向发展,所以提供一个给B端用户能够快速低门槛搭建平台的开发工具显得尤其重要。
我们在保险业上面我们也持续在践行腾讯云,我们发现在保险业里面,在AI如何对保险业进行赋能主要从三个方面,一个是前台的营销,还有中台的业务支撑,还有后台的支持。前台营销更多的是帮助代理人能够帮他扩大拓客的带宽,AI在中间可以扮演很强的助手、陪练、智能会话分析的能力。在中台是有两条路可以走,一条是针对大模型去蒸馏训练出一个小模型,易于部署,小模型具备的保险行业里面的专有知识,它能够更好、更准确回答用户问题,可以帮助代理人。另外一条路,因为大模型的训练或者精调他的成本比较高,还有一条比较低成本,就是使用智能体开发平台,我直接做一个应用,通过RAG或者工作流技术把企业的数据直接放到这个RAG里面,可以提升端到端的准确率。后端支撑,把数据库统一做管理,支持私有化部署,还有代码助手,还有运营分析系统,这些都是可以帮保险的后台很好的起到的支撑作用。
还有训推一体的平台可以做什么?训练和推理一起的工具平台,我们看训练,我们主要要把所有的GPU卡资源都管理起来,如何管理GPU卡资源直接决定你的成本高与低。比如说我们提出一个潮汐调度,所有GPU卡白天解决推理,到了晚上推理调用的人少了,这个时候就可以把GPU卡拿过来做训练,去做离线任务的训练,这样可以把GPU卡24小时跑满,这是潮汐调度。还有一个是推理,我们知道今年DeepSeek今年出来以后,DeepSeek是开源的,但是各家提出的DeepSeek满血版提供的推理服务差异在哪?主要就是在推理速度上面,推动速度决定着你需要投入多少资源,比如说单台机器你能支持10并发,跟你单台机器支持20并发,你的成本就是÷2,所以说在这个平台通过加速的能力,能够帮助企业大大节省推理成本。
只能体开发平台,刚才讲的是今年风口就是Agent智能体,我们提供了三个模式来帮助客户去实现低门槛的开发一个智能体,标准模式就是用RAG的方式,企业把自己独有的数据不需要放到大模型下面去增训,可以用一个更轻的方式,就是用RAG方式把企业数据放到向量数据库里面,可以用标准模式来。还有一种模式叫工作流模式,就解决了我们传统的人工智能大模型是我说你来查,你来告诉我答案,但是进化到你说我来做,这个就是工作流,它能够完成企业的一些任务。企业里面经常会有一些定向的任务,它其实是有固定几步流程的,比如说输入一个保险人资料,就能够针对这个资料去库里面去找到匹配推的保险,其实这是固化的过程,可以大大减少人力的投入。除了工作流模式之外,还有一个Agent模式,这个才是真正到了智能模式,在Agent的智能模式下,我们可以实现任务的自动规划,可以实现任务上下文有上文记忆,可以记住这个用户的偏好,可以调用第三方协议,可以调用第三方的插件,比如说计算的保费的插件,能够去让智能体解决复杂问题,这个智能体可以有三个模式来解决这个问题。
先讲第一个模式:RAG的模式,企业现在基底模型如果大家都一样的时候,我这个企业跟你的企业我怎么体现出我做出来的AI赋能比你更强呢?这里很重要一点就是企业自己独有的数据,当你用好企业数据,可以使你AI赋能效率大大提升,很重要一点就是RAG的能力,RAG的能力刚才讲到就是针对企业里面有大量的复杂的表格,PDF、PPT等等,其实企业里面有非常复杂的Excel表格,表格嵌套表格,大模型要把这个能力把图文混排的表格去做解析,用多模态的技术把这些表格里面的数据全部解析出来,这个时候就能够方便我们的代理人去问这些复杂表格的时候,就能非常精准的图文并茂的方式回答你。
在工作流里面,在一些固定的任务时,我们可以用大模型的工作流替代人工的重复操作,在工作流里面我们的智能体开发平台有一个亮点,就是支持全流程节点回退,有一个全局视角的Agent进行意图判断。举个例子,我们在保险输入时我问你性别、年龄、你希望采用年缴、月缴,你希望这个保险时间多长,客户回答的全面所有参数时,你往下计算保费时,客户说我想把10年改成8年,这个时候在正常的工作流里面走不下去了,因为这个时候节点在算保费时,这个时候你告诉他回退到上个节点,整个系统就卡死了,必须Agent关闭再重新打开,意味着前面用户输入又得再来一遍。这个时候我们支持节点回退方式。
还有一个就是多Agent模式下的转交协同,尤其复杂企业里面有多个Agent之间互相协同,有一个Agent做代理人拓客用的,营销用的,有一个Agent解决客服用的,有一个Agent解决内部数据统计的,这个时候多个Agent之间需要进行协同转交,可以实现零代码进行协同转交,当遇到问题我把主动权转交给另外一个Agent,还可以再归还回来。可以解决企业复杂问题。
最后一个优势,支持MCP的插件,Agent进入到智能时代之后很重要一点就是调第三方工具,大家都要支持MCP标准协议就可以支持第三方所有丰富的插件。
两个保险业的最佳实践:一、通过调用DeepSeek的方式,上层建造一个智能体开发平台,帮助保险代理人助手,这个代理人当客户问他非常多的保险知识时,这个代理人可以在内部的RAG查询系统里面快速查到答案。比如说这个保险跟去年的保险有哪些差异,在我们大模型的智能体开发平台上面,两个文档一输出,马上用高亮给你标出,原来从3年改到5年,保费上升了1%,快速能够回答了。
二、某保险科技公司,它利用大模型来做智能外呼,就是给客户打电话进行保险的营销,这对小额保险直接在电话里面能够成交,针对大额保险能够先收集到线索再引到人工来,这个过程中非常重要的一点是:我们需要精准判断用户讲的每句话的意图识别,对应拿出那个分支的话术回答他。大模型在保险行业的应用中不仅仅只有大模型技术,还把传统AI的技术用上了,他要用户讲的话要能够转成文字,要有TTS的能力,你把大模型讲出来的话要能够用语音方式、拟人方式传递出去,这个案例很好的把传统AI和大模型AI做了结合,并且这个地方还要解决端到端的时延,要做到人与人讲话之间接近五百毫秒的回复,要不会感觉对方很傻,你两秒才回答我,这个感受不一样。
伙伴共建场景实践,在离客户最近的一公里其实是伙伴最清楚行业里面的Knowhow和规则,腾讯非常愿意和伙伴进行场景的共建,比如说中科软跟腾讯有密切合作,中科软提供底层的工具基础上包装了两个行业应用,一个保险计划书生成,还有一个就是智能陪练,这两个应用在门口的展厅体验非常好。保险计划书当用户输入了一些保险的信息通过工作流方式每一步先去判断用户的风险,再计算用户保费,再结合整个保费情况输出给用户,整个过程中你会发现生成了一份保险计划书,这是一个非常好的共建场景。
大模型今年的趋势,不像去年,去年所有企业更多是关注底层的基模的性能,但是今年所有的企业更多的关注应用,因为应用能够解决企业的最后落地痛点问题,腾讯希望在今年的趋势下,我们能够提供智能体开发平台和训推一体化的平台,跟伙伴一起,最后帮助保险行业能够研发出更多的智能的应用,来为保险业解决真正行业中的痛点,实现降本增效。谢谢大家!
中科软科技董事长 左春
在本次论坛中,中科软董事长左春发表了题为《小模型是未来保险行业 AI 应用的主要支撑技术》的主旨演讲。在演讲中,左春系统性地阐述,在人工智能浪潮下,保险行业无需追逐算力庞大、成本高昂的大模型,而应将重点放在研发与应用 “低成本、高精度、强安全” 的垂直领域小模型上。他强调,小模型将与保险公司现有的核心业务系统深度融合、持续迭代,借助 “搜索、摘要、对比、生成” 等核心能力赋能业务流程,最终实现穿透式管理与差异化服务,甚至能进一步形成对关联产业 “降维打击” 的赋能优势。这不仅是一场技术变革,更是一次深刻的管理升级,关乎整个行业生态的协作与共同成长。
一、时代命题:保险行业亟需小模型辅助实现持续迭代升级的管理变革
人工智能的发展正从通用大模型转向更具针对性的垂直领域小模型。而在众多行业中,保险业因其独特的属性,亟需采用小模型技术来实现深层的管理变革。
保险业是一个知识密集型,或者更直接地说是“条款密集型”的行业。其经营管理以内容分类复杂、非结构化数据形式多样、精算计算工作量大、监管条文错综复杂的文案型合同为核心,并需与结构化数据管理深度结合。无论是产品设计、风险管控,还是营销渠道与客户服务,无一不涉及对海量专业条款、监管文件和多模态数据的处理。这些内容的处理,传统上耗费巨大的人力,且因版本更迭频繁,在内外部审计和监管环节需要进行大量的对比与审查工作。因此,行业内部一直存在利用技术手段来处理和简化这些复杂文本的强烈需求。而小模型正是为处理知识密集型行业的难题而生的专业工具,这正是保险行业对人工智能技术,特别是小模型抱有高度关注的根本原因。
人工智能应用是一场深刻的管理变革,其过程是持续迭代、螺旋升级的。任何“一步到位”的想法,在实践中都被证明是欠缺的。在保险行业,AI系统并非要取代现有的核心业务系统,而是作为新的“文案系统”或能力模块,融入并扩展现有的核心业务系统群,构成“广义行业应用软件系统群”,并将随着管理重点持续演进、螺旋升级。
具体而言,在原有保险核心业务系统对结构化数据处理能力的基础上,小模型带来的持续演化创新可集中体现在表单管理系统的深度优化层面。未来的系统需要对合同文档、监督条款、除外责任等复合型文档进行高效管理。这催生了两个层面的技术创新:上层,是对传统文案管理系统增加新功能;底层,则是基础平台的巨大变化。
二、范式分野:大模型之困与小模型之道
虽然大模型展示了通用人工智能的强大能力,但在企业级应用,特别是高度规范的保险行业,其固有的行业特性催生了向小模型的技术范式转移。
(一)大模型在B端AI应用的局限
大模型的出现虽然为新一代AI的核心能力奠定了基础,但同时也伴随着两大核心挑战:
-
高昂的成本:大模型依赖集中的庞大算力,其硬件投入(如英伟达GPU)动辄上亿,对于绝大多数企业而言易构成沉重的成本负担。 -
严重的安全隐患:大模型通常在远端运行,其安全边界难以清晰界定。企业员工在使用过程中,可能会无意间将内部的敏感业务数据和核心知识资产泄露出去。因此,企业对直接访问远端大模型服务必须施加严格的访问约束和管理制度。
上述成本和安全困境使得大模型在企业级的直接应用受到极大限制。正如SaaS(软件即服务)模式在国内面临的挑战一样,其在数据安全、深度集成、系统升级等方面的不足,同样会出现在大模型应用中,亟需通过本地化部署来改善。
(二)小模型的“低成本、高精度、强安全”核心优势
小模型的出现,正是为了解决大模型的上述痛点。它并非简单地将大模型微缩,而是一种不同的应用范式,其核心优势可归纳为低成本、高精度、强安全:
低成本:小模型追求轻量化的基座和运行环境。它不追求成为一部无所不包的“百科全书”,而是致力于成为一本本高效实用的“管理手册”。这意味着在训练模型时,可以将百科全书式的通用知识进行提炼,保留精髓,再与具体业务场景的管理手册相结合,从而大幅降低算力和训练成本。这种成本优势不仅反映在模型基座的构建上,更体现在后续的运行和维护中。这是一种小规模、持续性的投入模式,而非一步到位的巨额投资,更符合企业管理的实际情况。
-
高精度:高精度是小模型在垂直领域应用的核心价值所在。相较于大模型容易产生“幻觉”的泛化回答,小模型更强调对领域标准知识的精准掌握。在保险业务管理中有很多强监管、高合规的标准,即“标准答案”,不容许模型出现“幻觉”或错误。小模型通过构建针对性的知识体系,引入特定领域的词根表、知识库和带有高权重指标集的数据进行训练,确保对专业内容的精准理解和表达。这种对“正确答案”的聚焦,是小模型能够成为可靠智能辅助工具的基础。 -
强安全:强安全的优势切中了保险客户的核心关切点。由于小模型可以进行本地化或在安全的私有云环境中“类本地”部署,企业的所有数据和知识资产都保留在内部,受到类似核心业务系统级别的强大保护,根本上解决了远端大模型潜在的数据泄露风险。保险公司的知识是其核心资产,开发商如中科软也遵循着绝不碰客户数据的监管红线。在“再怎么强调安全也不为过”的金融行业,小模型提供的可控、可信赖的安全环境是其得以应用的基础。
(三)功能再现:在小模型基座上再现和丰富大模型的核心功能
客户的核心需求是在小模型的基座上,再现并丰富大模型已经拥有的核心能力,并与管理流程自动化相结合,以大幅提升人工处理的效率和质量。新一代人工智能技术相较于传统搜索引擎的优势,可提炼为四个关键功能,这四个功能同样需要在小模型中被复现,它们将构成未来保险AI应用领域端的重要功能。
-
搜索:这是所有信息检索技术的基础。但AI时代的搜索,不再是简单的关键词匹配,而是基于语义理解的深度搜索,能够更准确地帮助用户在海量资料中快速定位所需内容,其相似性计算的量级远超传统搜索。 -
摘要:这是AI带来的巨大变革之一。传统搜索只能帮用户找到原文,而新一代的AI技术则能进一步读懂原文并生成内容摘要,自动提炼文本核心内容,极大地提升了信息获取的效率。 -
对比:在获取了摘要信息后,更深层次的需求是在不同信息源之间进行比较,分析多个文本摘要间的共性与差异,对于实现“定性量处”等管理目标至关重要。在保险业务领域,此项功能在理赔案例分析、监管合规性审查等场景中有高频应用,例如总公司在评估分公司的理赔工作质量时,需将所有理赔案例和管理规定都输入系统,通过AI自动进行摘要和对比,则可以快速筛选出优秀案例或不合规操作。 -
生成:这是AI能力的进一步延伸,可辅助生成结论性报告等新的文本内容。“对比”和“生成”功能相结合,能有效解决大量文案工作。
三、落地路径:工程化与生态协同的实践方法论
小模型的成功落地并非一蹴而就,它是一项长期的、复杂的软件工程,需要务实的态度、清晰的路径和生态各方的通力合作。
(一)生态重构:ISV与众多生态伙伴的“长链条”协作
人工智能时代的到来,也深刻地改变了软件产业的分工与合作模式。
过去,软件分层分类清晰,基础软件和基础模型是支撑行业应用软件的独立主体,尽量回避领域知识,不同层级之间的融合协作相对较少。如今到了小模型阶段,工程化的分工与协作变得至关重要。新的分工趋势是:大厂集中于通用模型基座的供给,而以中科软为代表的头部ISV,则侧重于面向垂直领域的小模型的预训练(与通用模型厂商合作蒸馏模型基座)、后训练和应用集成,在各个环节补充领域知识和现场技术迁移的短板。
小模型的应用是“长链条”合作的场景,考验着生态伙伴间的合作精神,涉及多项关键要点:
-
拥抱开源:开源软件的工具和平台是小模型研发的重要支撑环境。开源软件数量繁多,即便保险公司拥有上百人的技术团队,也难以全面研究,对于任何单一企业都构成了巨大的技术挑战。因此,ISV的价值在于能够快速学习并与保险公司的技术团队密切合作,能够熟练运用不断迭代的、从流程框架到实用工具库的流行开源软件系列,熟悉硬件和软件的配置环境,以及流行开源软件的外部调用方式和函数库特性。中科软作为头部ISV,不仅通过自身快速学习,深入了解封装之下的各种工具与平台,还会组织比赛并邀请客户参与评审交流,进一步提升技术能力。 -
广泛合作:小模型的应用是一个“长链条”的合作场景,考验着所有参与者彼此合作的精神和态度。实现小模型的落地需要硬件厂商、云平台、模型基座提供方、ISV以及下游的客户的紧密合作,共同服务好最终用户。其中ISV的角色是细分领域的应用软件集成者,负责将底层技术与上层应用无缝衔接。 -
POC(概念验证)先行:在长链条的合作模式下,大量的尝试性工作和原型验证(POC)变得必不可少。ISV需要有能力先为客户搭建好原型系统,待验证成功后再由客户下单,从而避免客户在前期进行不必要的设备投资。中科软未来也将与客户建立联合实验室,共同探索前瞻性工作。
(二)工程化要点:要求全面完整的软件系统工程
将小模型从概念应用到生产环境,在具体实施过程中需要系统化的工程方法。从核心能力来看,涉及多个方面的要求:
-
数据准备与标注:无论是大模型还是小模型,高质量的数据“喂养”都是基础。小模型的优势在于可以就地组织数据,将企业长期积累的知识与行业成果相结合。这项工作需要大量领域知识作为支撑,且要求持续投入,因为客户最终需要的是有价值的内容成果物,而非仅仅是工具和平台。 -
工程化规范:为了保证模型的可操作性和完整性,需要建立一系列工程化规范,包括垂直领域知识加持下的数据约束与格式、微调描述框架、提示词规范等。 -
封装与二次开发:对技术用户而言,AI技术应该是被良好“封装”、便于使用的,而新一代基座软件接口多、参数杂,看似灵活,实则在实施交付过程中只是半成品。ISV必须凭借对工具和平台的熟稔,把高自由度接口重新“封装”。同时,ISV还需要特别强调平台产品的客户端技术迁移、组件组装和针对性的二次开发能力。
从完整的AI垂直应用涉及到的自下而上多个层级出发,具体的工程化实施要点可分划为以下内容:
-
数据层:规范数据约束与格式,处理多结构语料(如保险条款切分、多模态信息提取),强化基于领域知识的数据清洗与标注,加强半结构化数据集建设; -
模型层:建立微调描述框架与提示词规范,实现垂直模型的精准微调与推理部署; -
应用层:支持客户端技术迁移、组件组装及二次开发,在“多自由度”工具选择中形成收敛性落地框架,保证高质量的应用效果。
四、应用价值:穿透式管理与降维打击
小模型技术正通过实现“穿透式管理”为保险业核心业务痛点提供解决方案,同时还将为行业带来赋能关联产业的“降维打击”,进一步挖掘更深层的价值潜力。
“穿透式管理”的精髓在于实现“闭环”,即打通从结构化数据到非结构化数据的全链条,确保管理意图能够无损地传导至执行末端并得到有效验证。
“报行合一”是穿透式管理的典型案例。这不仅是监管机构对保险公司的要求,即备案的产品费率、费用规则等必须与市场实际执行完全统一,同时也是保险公司总公司对庞大分支机构进行有效管理的核心诉求。费用的透明化管理是其中的关键。通过小模型技术,系统能够将核心系统中的费用计划(结构化数据)与原始单据、发票签字等(非结构化数据)进行自动化的关联、检索和查验,从而清晰地展现费用计划的完成率,并追溯每一个环节的负责人和确认凭证。
类似的应用还包括:
五、未来之路:持续迭代与共同成长
人工智能正以前所未有的深度和广度融入各行各业,保险业的变革已经拉开序幕。AI应用伴随着持续演化的管理升级,以实现整体管理一致性与效率的提升,其推进过程是持续的、螺旋式的,在局部层面甚至是频繁迭代的。小模型的应用,正是真正实现保险行业数智化管理范式的关键。当基础的凭证管理、闭环追溯都通过技术手段得以实现后,保险公司才能真正地走向数智化管理。
技术永远是服务于业务价值的工具,必须深刻理解客户的业务痛点和真实需求,才能真正用AI创造价值。引用YC(YCombinator)对AI的理解:“首先要理解业务环节和市场竞争,再谈AI辅助”。在激烈的市场竞争中,单纯依靠压缩销售费用进行价格战是不可持续的。未来保险公司的核心竞争力在于提供差异化的产品与服务。借助小模型等AI工具,保险公司可以根据自身业务特点和客群需求,深度定制差异化的管理模式、服务流程和产品形态,最终为客户创造更大的价值,摆脱低层次竞争。
小模型以其低成本、高精度、强安全的特性,为这场变革提供了切实可行的技术路径。它需要企业、ISV、平台厂商等生态各方,秉持开放合作的精神,共同探索与实践。它更需要行业内的每一位从业者,从工程师到管理者,都主动升级认知,快速学习,拥抱变化。这不仅是对技术的深刻洞察,更是对行业未来发展方向的战略引领。

