
12月13日,2018数据资产管理大会在北京国家会议中心举行。本次大会由中国信息通信研究院、中国通信标准化协会(CCSA)主办,CCSA TC601大数据技术标准推进委员会承办,中国IDC圈协办。

中国建设银行股份有限公司副总经理尚波
会上中国建设银行股份有限公司副总经理尚波发表了“中国建设银行的数据能力建设”演讲,以下为不改变原意的删减版:
中国建设银行数据能力建设的历程。我们分成了五个阶段,第一阶段是84年,叫做不关注,在这个阶段中国建设银行重点是相当于把业务电算化,原来单点,后来城市点到点,从城市通兑网到省级大联网,2005年最终实现全国大联通,这时候大家做一些业务的数字化,但真正对数据的管理和应用还是没有太多的概念。
第二阶段叫做起步,2003年中国建设银行成立了信息中心,就是我们数据管理部的前身,有一支队伍专门去关注数据的管理,在这个阶段提出了数据管控的一些概念,制定了一些数据的标准,开始规划和建设建设银行的数据仓库。
第三阶段是打基础,是2007-2010年,2007年建设银行股改上市会以后,与美国银行开展战略合作,美银在数据治理和数据管理方面给予了很大的帮助,在这个阶段他们和我们一起带领我们去研究数据能力框架。同时也是我们数据管理部在牵头实施新资本协议。
第四阶段体系化,2011年开始中国建设银行对整个全行的核心业务系统进行了重构,打破原来所有的系统,按照组建化、模型驱动的方法去来构建新一代的核心系统,为期六年。通过这个建设,借助新一代核心系统的建设,使得中国建设银行建立了数据管理体系和数据应用体系。
第五阶段就是持续优化。在这样一个数据化的时代,要把数据视作资产、视作战略资源去加以管理和应用。

第二部分,2007年美银专家带领我们开始建设数据能力的框架,这个框架2007年开始做,不断地在修订、在补充、在完善。我们形成了中国建设银行的能力框架,不断地在迭代,从数据的应用、数据管控机制的建设和管理类数据的需求的统筹管理。
业务数据化。中国建设银行的核心系统的建设是模型来驱动的,通过模型来驱动,两大核心模型,一个是数据模型,一个是流程模型。从数据的角度来看,我们参考了IBM金融服务数据模型构建中国建设银行,我们从ABCC’到D,最核心的一块我们是C,C模型是企业界的逻辑数据模型,涵盖了建设银行所有的产品和服务,在构建C’是叫应用级或者叫组件级的模型,根据建设银行的C模型来组建指导它建设它的数据库设计,最终落地到数据库。通过企业界的C模型把建设银行所有数据的规范和标准进行统一的定义,包括所谓的代码。通过两套模型把技术标准规范定义了,确保企业数据的标准唯一。
数据资产化,业务要数据化,数据要资产化,资产化借助底层。根据数据能力框架定义好数据管控的机制,通过这些建设来支撑,保证中国建设银行的数据能够达到全、省、快、信、易、好,整个数据是良性的,使得需要数据的时候,可以很快拿到而且是可信的,而且是容易的。
数据治理组织架构,中国建设银行今年刚刚改革,建设银行今年成立了金融科技创新委员会,我们最大的特点是在创新委员会下面设立了数据治理专业委员会,它最重要的职责是对中国建设银行所有关于数据管理和数据应用重大的一些事项要去审批的,重大的一些财务支出是要审批的,大数据的重大的一些项目也需要它去审批。

建设银行数据管理部承担了一个重大的职责就是把数据需求进行集中,统一进行管理,我们把数据需求分为三类,我们叫做简单、复杂和专业需求。对于纯数据的需求,第一类简单的直接通过一些管理分析类的系统,通过界面去解决。再一类是专业复杂的需求,复杂的需求往往是临时性、紧迫性的东西,有专业的数据团队通过服务去交付。还有一块需求是专业的需求,专业的需求往往通过数据模型的建设,通过模型跑出结果去交付的,叫做专业。最重要的一点是驱动,有两类驱动,一类是业务需求的驱动,业务部门或者分行干不了的事情有困难会提出来,这是驱动力。还有一块是数据需求的驱动,数据分析人员、数据专业人员对于业务有一定的洞察能力的时候,他会来主动提出一些需求,叫做数据驱动。
关于数据的需求,除了传统的管理分析类专业的系统,还有一些需求,我们给它分为三类:一类我们叫固定报表,自助查询加上机器查询,这类应用由企业级的数据平台来去支撑,企业平台最重要的作用是来支撑我们业务人员自主用数,把用数的权利还给业务,这是数据管理部牵头建设的一个平台。再一块叫做数据模型实验室和数据挖掘,这块对应着大数据智能平台,大数据智能平台承担着中国建设银行数据模型实验室和传统的商业智能或者大数据分析应用。再一块就是仪表盘,仪表盘有手机移动端作出各阶层500、600个指标,我们T+1,大部分核心业务指标做了T+1来去展现的。

建设银行2016年开始建设大数据智能平台,数据来源就是数据仓库,数据仓库所有的数据包括内部数据、外部数据、结构化数据、非结构化数据,对整个大数据智能平台是开放的。在功能上有三大核心能力:第一,数据的获取,从仓库拿数据不需要走线上流程,有一套机制可以直接去取。再一个就是分析能力,借助各种工具,传统的商业智能工具也好、新型的大数据包括人工智能的一些能力都部署上去了。再一块就是交付,把模型交付出去,也可以把结果批量地交付出去,也可以分装服务直接跟我们的流程系统去对接,这是交付。
另外我们还有三个库,一个产品库,好的模型分装成产品去共享,变成一个数据产品,再一个是知识库,工具箱;另外一点是图,图数据库加上可视化分析工具相关的算法。
绿色工程,最大的职责是管理好数据共享数据。
通过我们共享来实现国家的价值,让数据的价值最大化,重要的理念是四化概念:业务数据化、数据资产化、资产价值化、价值最大化。
通过中国建设银行新一代核心系统的建设同步建立了两大体系,数据管理体系和数据应用体系,通过这两个体系的互动,使得数据更好,也支撑数据的应用能够更好地发展。
·END·
关注更多精彩


