大数跨境
0
0

MFS分布式文件系统

MFS分布式文件系统 云容灾备份安全治理
2018-07-28
2

什么是MFS?

MooseFS是一个容错,高可用,高性能,扩展,网络分布式文件系统。它将数据分布在多个物理商品服务器上,这些服务器对用户可视为一个虚拟磁盘。它符合POSIX并且像任何其他类Unix文件系统一样支持:

  • 分层结构:文件和文件夹,

  • 文件属性,

  • 特殊文件:管道,插座,块和字符设备,

  • 符号和硬链接,

  • 安全属性和ACL。
    它适用于需要标准文件系统的所有应用程序。

分布式原理

分布式文件系统是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连。简单来说,就是把一些分散的(分布在局域网内各个计算机上)共享文件夹,集合到一个文件夹内(虚拟共享文件夹)。对于用户来说,要访问这些共享文件时,只要打开这个虚拟共享文件夹,就可以看到所有链接到虚拟共享文件夹内的共享文件夹,用户感觉不到这些共享文件是分布于各个计算机上的。分布式文件系统的好处是集中访问、简化操作、数据容灾,以及提高文件的存取性能

MFS原理

MFS是一个具有容错性的网络分布式文件系统,它把数据分散存放在多个物理服务器上,而呈现给用户的则是统一的资源。

MFS文件系统的组成

  • 元数据服务器(Master):在整个体系中负责管理文件系统,维护元数据。

  • 元数据日志服务器(Metalogger):备份Master服务器的变化日志文件,文件类型为changelog_ml.*.mfs。当Master服务器数据丢失或损坏时,可以从日志服务器中取得文件,进行恢复。

  • 数据存储服务器(Chunk Server):真正存储数据的服务器。存储文件时,会把文件分块保存,并在数据服务器间进行复制。数据服务器越多,能使用的“容量”也越大,可靠性越高,性能也就越好。

  • 客户端(Client):可以直接挂载MFS文件系统。

MFS读取数据的处理过程

  • 客户端向元数据服务器发出读请求

  • 元数据服务器把所需数据存放的位置(Chunk Server的IP地址和Chunk编号)告知客户端

  • 客户端向已知的Chunk Server请求发送数据

  • Chunk Server向客户端发送数据

MFS写入数据的处理过程

  • 客户端向元数据服务器发送写入请求

  • 元数据服务器与Chunk Server进行交互(只有当所需的分块Chunk存在的时候才进行交互),但元数据服务器只在某些服务器创建新的分块chunks,创建成功后由Chunk Servers告知元数据服务器操作成功

  • 元数据服务器告知客户端,可以在哪个Chunk Server的那些chunks写入数据

  • 客户端向指定的Chunk Server写入数据

  • 该Chunk Server与其他Chunk Server进行数据同步,同步成功后Chunk Server告知客户端数据写入成功

  • 客户端告知元数据服务器本次写入完毕

MFS优势

  • 高可用性:没有单点故障也称为无SPOF配置。文件系统的元数据在物理冗余服务器上保存为两个或多个副本。用户数据冗余地分布在系统中的存储服务器上。

  • 低成本的数据安全:MooseFS使用户能够节省大量硬盘空间,保持相同的数据冗余级别。在大多数常见情况下,将节省至少55%的硬盘空间.

  • 可扩展性:存储可以扩展到16字节(~16000千兆字节),这使我们可以存储超过20亿个文件

  • 高性能:旨在支持高性能I/O操作。用户数据可以在许多存储节点上同时读取/写入,从而避免单个中央服务器或单个网络连接瓶颈


【声明】内容源于网络
0
0
云容灾备份安全治理
分享云灾备规划、实施、运营、备份与恢复、数据安全、数据治理;窥视国内外备份软件与监控软件知识前沿水平线; 越努力,越幸运!
内容 2171
粉丝 0
云容灾备份安全治理 分享云灾备规划、实施、运营、备份与恢复、数据安全、数据治理;窥视国内外备份软件与监控软件知识前沿水平线; 越努力,越幸运!
总阅读3.8k
粉丝0
内容2.2k