
作者:沙丘社区分析师团队
随着数字经济发展,全球数据库产业持续火热,从21世纪开始,全球共有277家数据库企业成立。我国数据库产业从2013年开始呈现高速发展态势,平均每年新增10家左右数据库企业。
从市场角度看,全球数据库市场保持较高规模增长。根据中国信通院统计,2021年全球数据库市场规模为697美元,较2020年增速为3.9%。中国数据库市场规模在2021年为47亿美元,较2020年相比增速高达34.3%。当前中国数据库市场和全球相比体量较小,仅占比5.2%。
2021年,中国公有云和本地部署模式的数据库市场规模相近,分别占总市场的47.3%和52.7%,但公有云数据库市场的增速更快。预计2022年,全球及中国云数据库营收均占数据库整体市场50%以上。
从2017年开始,数据库领域利好政策不断推出,涉及技术环节、标准环节以及工信、金融等各个领域。具体来看:
预热阶段(2017.6-2021.3):2017年6月,工信部十三五规划中提到“面向事务的新型关系数据库、列式数据库、NoSQL数据库、大规模图数据库”,代表着数据库首次纳入工信规划;2019年8月,中国人民银行发布金融科技规划(2019-2021年),首次将数据库纳入到金融科技发展规划中,尤其强调了对分布式数据库的研发。
起步阶段(2021.4-2021.12):2021年10月,国家战略明确要求“自主可控、安全高效”,国务院印发《国家标准化发展纲要》提出要“开展数据库等方面标准攻关”,全国人大也提出了在基础软件方面的布局规划,数据库明确纳入国家战略。
深化阶段(2022.1至今):随着十四五规划密集出台,各部门陆续发布规划,并着重对数据库的发展提出要求。其中工信部印发的《“十四五”软件和信息技术服务业发展规划》和《“十四五”大数据产业发展规划》都强调了“加速分布式数据库、混合事务分析处理数据库、共享内存数据库集群等产品研发和应用推广”以及“推动高性能数据库在金融、电信、能源等重点行业关键业务系统应用”;中国人民银行印发《金融科技发展规划(2022-2025年)》提到“实现敏态与稳态双模共存、分布式与集中式互相融合”;中国人民银行、市场监管总局、银保监会、证监会四部门印发《金融标准化“十四五”发展规划》提到“加快基础软硬件相关标准研制与实施”、“支持构建分布式和集中式并存的双核架构格局”。
从行业应用方面看,数据库将规模化向金融、电信、能源、政务四大行业深入创新应用。
• 金融行业:核心系统分布式改造需求旺盛,过去3-5年以中信银行、邮储银行、国家开发银行、张家港农商行、微众银行、常熟农商行等为代表的新核心系统相继上线并平稳运行。
• 电信行业:数据库应用创新将从周边非核心系统过渡到核心应用系统,例如对CRM、计费库等核心系统的改造,且数据库云化趋势明显,通过解耦化、模块化、标准化以PaaS方式为应用提供弹性、自治的服务。
• 能源行业:主要分为发电侧和电网侧,发电侧企业信息系统改革加强,风和光伏为代表的发电侧对趋势预测等数据分析需求提出新要求,对时序数据库、分析型数据库等需求旺盛;电网侧由于物联网应用场景和传感器数量不断增加,监控系统产生的数据规模与日俱增,对数据库性能和稳定性提出更高要求。
• 政务行业:国产化应用正在从省、部级单位为主的应用示范阶段,深入到以地市、县级为主的应用推广阶段,主要应用系统由电子公文系统扩展至其他核心政务应用系统,但仍以集中式数据库为主导,对分布式数据库的需求相对较少。
大数据时代,数据量不断爆炸式增长,数据存储结构也越来越灵活多样,日益变革的新兴业务需求催生数据库及应用系统的存在形式愈发丰富,这些变化均对数据库的各类能力不断提出挑战,推动数据库技术不断演进。未来数据库的发展方向有四个:降低成本、安全可信、增强性能和新兴业务。
(1)降低成本
降本增效是企业数字化转型的恒命题,数据库未来将通过三个方向的技术迭代帮助企业实现成本降低。
第一,多模数据管理。传统业务系统以关系型数据库为主,但有些业务系统使用的是非关系型数据库,例如图数据、时序性数据等,这些系统通过专项数据库来管理。使用不同的数据库管理存在较多问题,例如数据之间无法进行高效联动和计算。
多模数据管理能力是指一个数据管理系统支持多种数据模型和语义访问,多模数据库拉近了多样化应用与数据库之间的距离,能够优化对于各种数据结构的管理。目前国内外都有典型的多模数据库产品,例如国外的Oracle、MongoDB、微软等,国内的阿里、巨杉、星环等。
第二,HTAP数据库。HTAP数据库即事务分析混合型数据库,从应用角度出发,适用于数据分析量不是特别大但对事务实时性有要求的场景。
第三,数据库+AI。数据库与AI的结合分为AI for DB和DB for AI两种结合方式。
AI for DB是利用人工智能技术为数据库的开发、运维、管理提升效率,可以通过机器学习将人工经验方法内置到数据库中,自动实现参数调优、数据库性能优化等。
DB for AI是利用数据库支撑人工智能的计算,在数据库内完成机器学习计算。
(2)安全可信
区块链、隐私计算等技术与数据库结合,在数据防篡改、加密等方面实现突破,防篡改数据库和全密态数据库对于未来组织和组织之间进行数据流通而言必不可少。
其中,全密态数据库能够提供对应用透明的加解密能力,在数据库系统中数据的全生命周期以密文形式进行处理,同时密钥掌握在授权用户手中。全密态数据库的实现方式有硬件方案与密码学方案两大类。全密态数据库能够在数据密文的状态下对数据进行处理与使用,极大程度上保护了数据隐私,是防止数据隐私泄露保障数据安全的重要数据库产品之一。
但当前,这类数据库尚处于初始发展阶段,还有很多问题需要解决,例如基于存储和计算开销的效率挑战、基于数据操作过程的安全性挑战等。
(3)增强性能
数据库性能的增强有两个技术发展方向:
第一,软硬件协同发展。数据库管理系统作为软件,离不开硬件的支撑,芯片、网络组件等技术的突破,硬件能力提升往往对数据库性能的提升效果显著,近几年上海天玑、沃趣科技、云和恩墨等IT服务商以及达梦、人大金仓、华为等数据库厂商已经推出了基于国产数据库的一体机,性能和稳定性方面也有了充分的应用和实践。
第二,云原生数据库。云原生数据库形态不断演化,最开始仅仅是将数据库简单地部署到云上,没有自动的弹性扩缩容等能力,只是通过云资源对数据库进行集中纳管。随着云原生数据库的不断发展,企业云化从“以资源为中心”演进到“以应用为中心”,以Serverless技术为代表的云原生数据库在架构和技术能力上能感知应用特征,将计算、内存、存储分层解耦,实现三者的池化,从而可以实现每种资源独立伸缩,保证计费的精准性,可以充分发挥数据库的性能,减少资源浪费,进一步提升性价比。
(4)新兴业务
未来,数据库领域将产生两个新兴业务:
第一,大规模图数据处理。《“十四五”软件和信息技术服务业发展规划》明确提出“突破大规模并行图数据处理关键技术”,伴随全球数字化转型日趋火热,海量图数据的挖掘利用将直接影响企业数字化、智能化进程。
图数据库是基于图模型,使用图结构进行语义操作的数据库,将现实世界的实体和实体关系抽象表达为顶点和边,擅长图数据的高效存储、查询、计算、分析,并支持数据的增删查改操作。在分类上,图数据库可归类为NoSQL数据库。图模型分为两种,一种是属性图模型,另一种是RDF模型。
传统的关系型数据库在处理关联数据时,大量的连接操作造成性能成指数级下降;而NoSQL数据库(图数据库以外)采用的数据结构和分布式架构,更适合离散、关联关系弱的数据存储管理。图数据库中丰富的关系表示,完整的事务支持,提供了高效的关联查询和完备的实体信息,能有效解决关系型数据库难以解决的大数据关联难题。
图数据库在我国最早由各大高校实验室、研究所开始研究,主要聚焦于支持RDF图模型的图数据库。后来由于电商和社交对图数据库的需求,迫使互联网企业不断研发和迭代图数据库产品,包括阿里云、蚂蚁集团、京东、百度、腾讯等。当前,初创企业和传统IT企业也参与到图数据库市场中,初创企业最大的特点是完全自主研发,强调高性能与数据库的事务性;传统IT企业则在图数据库的发展浪潮下,加入产品的研发步伐,并且通常与企业已有的其他产品(如知识图谱工具)一同对外输出。
第二,实时湖仓。传统的数据仓库以结构化数据为主,数据湖则是各种类型数据都可以存储,实时湖仓架构结合数据湖和数据仓库的优点,既可以储存海量各种类型的数据,也可以做到高效计算。
关于我们
沙丘社区是一家数字化研究与知识服务机构,为客户提供客观、可执行的数字化研究与市场洞察,致力于帮企业做更好的技术决策。

