大数跨境
0
0

商业银行的数字化转型(二):从集中式到分布式存储的演进

商业银行的数字化转型(二):从集中式到分布式存储的演进 鹏云网络
2023-02-01
2
导读:银行分布式存储选型因素探讨。

20世纪60年代,大型机凭借其超强的计算和IO处理能力,以及在稳定性和安全性方面的卓越表现,引领了计算机行业的发展,集中式的计算机系统架构也成为了主流。

随着计算需求的增长和计算场景的多样化集中式的处理模式越来越显得捉襟见肘。同时随着PC技术的成熟和普及,计算机网络化和微型化的发展趋势在今年不断演进发展,整个分布式计算的理论和实践也走向成熟,计算机系统也开始从集中式向分布式架构演进。



银行业务存储需求

业务数据成倍增长,传统存储面临新挑战

此前,传统的企业级存储设备多为集中式存储(Centralized storage),尤其是银行业。传统的集中式存储系统由于其稳定和可靠的优势一度是银行业重要业务数据库数据存储的首选。

集中式存储并不是一个单独的设备,是集中在一套系统当中的多个设备,整个存储系统可能需要几个机柜来存放。在集中式存储中,存储服务器成为系统性能的瓶颈,也是可靠性和安全性的焦点,不能满足大规模存储应用的需要。

近年来,随着银行业务的不断增长以及互联网业务的兴起,业务数据呈几何倍数快速增长,使银行数据中心的传统存储系统架构面临新的挑战

  • 新建存储系统周期长与新兴业务快速上线间的矛盾;
  • 系统庞大,管理复杂,运维人员压力巨大;
  • 存储性能无法满足越来越多的数据并行处理应用需求;
  • 客户需求分析、业务数据分析与决策推荐等需求,导致对AI、区块链、云计算、大数据等新技术应用的迫切需求。

    ……

面对上述多种挑战,且在银行主机上云的IT架构转型战略下,逐渐形成了基于稳态+敏态双模的,可应对业务数据高并发、高访问需求的趋势。因此,银行需要引入分布式存储技术,来解决存储的可靠性、扩展性、异构、成本投入以及数据迁移等问题,为银行上云业务应用系统提供基础设施的技术保障。

分布式存储其实是相对于集中式存储而言的。其特点是将数据分散存储在多个存储节点,比如x86通用服务器和Power服务器等。其中,以x86通用服务器最为普遍。

而分布式网络存储系统采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,它不但提高了系统的可靠性、可用性和存取效率,还易于扩展。因此,分布式的处理方式越来越受到业界的青睐。

银行对于存储的需求细分(见下图)


存储优势差异

集中式存储与分布式存储的要点差异

集中式存储系统包含控制器、磁盘阵列(JBOD)、交换机和管理设备等组件。集中式系统中,每个终端或客户端及其仅仅负责数据的录入和输出,而数据的存储与控制处理完全交由主机来完成。通俗来讲,集中式数据存储的主要特点是能把所有数据保存在一个地方。

而集中式系统的另一个明显特点就是部署结构简单,由于集中式系统往往基于底层性能卓越的大型主机,因此无需考虑如何对服务进行多个节点的部署,也就不用考虑多个节点之间的分布式协作问题。

分布式存储包含的种类繁多,除了传统意义上的分布式文件系统、分布式块存储和分布式对象存储外,还包括分布式数据库和分布式缓存等。

如下图是鹏云的分布式块存储系统(DBS)的架构,ZettaStor DBS 软件基于分布式计算技术,把分散在大量廉价 x86 服务器上的内置硬盘整合成一个统一的存储资源池,再从资源池中划分存储资源提供给客户端访问。用户数据均匀分布存储在这些硬盘上,数据访问负载也被这些服务器和硬盘均担。只需通过添加服务器节点的方式,即可灵活方便地从容量和性能两个维度横向扩展至海量规模。 

分布式存储采用可扩展的系统结构,利用多台存储服务器分担存储负荷。其具备以下几个明显的优点:

  • IO吞吐量大

  • 扩容方便

  • 可以组成大规模的存储池

  • 采购成本可分批次、分阶段投入,设备可以分批次折旧

    ……

集中式存储与分布式存储的具体差异(见下图)

和集中式系统相比,分布式系统的性价比更高、处理能力更强、可靠性更高,同时具有很好的扩展性。分布式架构在其经济性、自主性、灵活性和扩展性层面较集中式架构有较为突出的优势,是近年来各企业进行IT系统建设的首选。


银行分布式存储选型

什么样的存储更符合金融银行的业务需求

当前,金融业信息技术创新工作已进入深水区,IT基础机构转型成为重点,分布式成为各金融机构IT基础架构转型的着力点。

一方面,分布式技术助力金融机构实现对上下层软硬件的逐步替代。另一方面,分布式技术的应用有助于提升金融业IT基础架构的可用性和安全性。传统架构中的高可用性是通过高可靠硬件设备来实现的,而分布式架构面向单节点故障有一定的自愈能力,有效提升基础架构的可用性。

金融业务系统运行环境日趋复杂、业务稳定性需求日益提升。在金融行业数字化转型的大背景下,传统集中式存储模式,已经不适应当下金融业务的所有需求。满足各类场景下存储的“软能力”变得尤为重要。随着金融机构对非结构化数据、海量文件的处理,分布式存储也随之出现了块存储、文件存储、对象存储等类型。

集中式存储架构为金融业务提供了良好的性能及稳定性,但在业务复杂性、数据安全性、扩容性价比的多重压力下,金融机构逐渐采用更加高效的分布式架构解决方案。

而金融行业针对不同的应用场景,则需要选择适合系统运行真实需求的存储类型。比如见下表,根据金融业常见的4种场景与对应的指标要求,适合不同的存储系统:

其中,集中式存储在金融业中使用较多的案例有高端的全闪存存储,其具有百万级的IOPS、低延时的特性,并支持NVMe磁盘。在金融业交易类系统中,集中式存储常用于核心账务系统与交易银行系统等。集中式存储在时延、稳定性方面有明显优势,适合应用于有数据强一致性要求、高IOPS、低时延的OLTP类交易业务场景。

而分布式存储更适用于海量数据、大数据OLAP类场景、以及对时延不敏感的场景。如表中的BI分析平台和办公系统,通常对数据容量的需求较大,且存在横向扩容需求,因此使用分布式块存储更合适。

银行分布式存储的技术选型,一般会全面考察6类30余个评估项,详见下表:

如今分布式存储、容器、大数据等混合架构带来了异构存储运维和数据备份的挑战。在数据备份方面,随着网络安全等级保护2.0制度、数据安全保护法等政策深入,在不同场景下的数据备份,将会是未来金融机构开展数据保护建设的重点方向。

如何基于多种异构型的存储构建一体化的运维平台,需要综合考虑多方面的因素。包括系统的业务连续性要求、系统的关键性程度、存储是否同构、联机业务量大小、平台建设成本等等。要成功实施完备的异构存储资源池,不仅要选择合适、成熟和高效的存储技术,更要通过严密的组织、规划和设计。


END


*本文部分内容源于公开资料整理,仅供学习交流参考。

其中部分参考资料为:

  • 中国信通院《分布式系统稳定性建设指南》

  • DOIT《分布式存储市场调研报告》

  • twt社区:rechen2020《银行分布式存储基础设施创新实践分享


【声明】内容源于网络
0
0
鹏云网络
南京鹏云网络科技有限公司(简称“鹏云网络”)是一家专注于软件定义存储产品与解决方案业务的高新技术企业和双软企业,总部位于南京。鹏云网络自2012年成立以来,始终坚持技术创新,以主流、先进的“软件定义存储”技术和产品,为客户构建自主可控的数据中心基础设施,帮助客户快速实现IT基础架构变革。
内容 75
粉丝 0
认证用户
鹏云网络 南京鹏云网络科技有限公司 南京鹏云网络科技有限公司(简称“鹏云网络”)是一家专注于软件定义存储产品与解决方案业务的高新技术企业和双软企业,总部位于南京。鹏云网络自2012年成立以来,始终坚持技术创新,以主流、先进的“软件定义存储”技术和产品,为客户构建自主可控的数据中心基础设施,帮助客户快速实现IT基础架构变革。
总阅读3
粉丝0
内容75