点
击
蓝
字
关
注
我
们
之前笔者写过一篇文章《寻找不同的“罗塞塔”,终于找到一个志同道合的项目!》,介绍了恒今基金会的罗塞塔计划—一个研究语言档案长期保存的项目。近日,笔者又惊喜地发现一个同处信息化领域且同样是研究数字资源长期保存的“罗塞塔”项目——艾利贝斯罗塞塔系统(Ex Libris Rosetta)。
目录
CONTENTS
0
1
系统概述
● 艾利贝斯罗塞塔系统(Ex Libris Rosetta)
随着数字技术的飞速发展,图书馆、档案馆和博物馆等机构面临着海量数字资源永久保存的难题。这些机构不仅需要储存成千上万的实体物品和实物资源,还需确保大量日益新增的数字资源得到妥善保存,以实现数字资源长期保存及传承后世的目标。然而,许多机构的存储系统并未充分考虑数字内容的持续可用性和可访问性。
以色列艾利贝斯(Ex Libris)公司研发了罗塞塔系统(The Rosetta System),支持图书馆、档案馆和博物馆等机构持续收集和保存数字内容,以便于将来继续使用。目前,全球已有数十家机构采用该系统,它配备了一套独特的数字资源保存模块,协助机构识别格式风险、评估缓解替代方案以及实施保存策略,确保数字内容的长期保存和可访问性。
0
2
系统功能介绍
● 艾利贝斯罗塞塔系统(Ex Libris Rosetta)
2.1 功能架构
罗塞塔系统建立在开放档案信息系统(Open Archival Information System, OAIS)模型(参见本公众号文章《OAIS模型及其数字资源长期保存要求》)的基础上,并遵循可信赖仓储的审计与认证(Trustworthy Repositories Audit and Certification, TRAC)(参见本公众号文章《可信数字仓储(TDR)及其实践应用案例》)。系统包括收集(Ingest),保存(Preservation),工作区域(Working Area), 操作存储库(Operational Repository), 管理(Management),永久存储库(Permanent Repository),交付(Delivery)和发布(Publishing)八个功能模块,系统功能架构如下图所示。
模块功能分别介绍如下:
2.2 系统信息流
罗塞塔系统的信息流示意图如下所示:
系统信息流包括以下几个阶段:
生产者登录到罗塞塔系统。
生产者通过收集服务器上传文件。
罗塞塔系统将生产者上传的内容移动到操作服务器,该服务器通过 SIP 处理模块处理内容。经过系统验证的SIP可供管理者使用,管理者使用基于 Web 的界面查看内容,并决定是否需要批准、返回给生产者修改或拒绝。
管理者批准 SIP 后,系统将生成的AIP移动到永久存储库。在永久存储库中,一般不再保留SIP中的数字对象内容,但可以保留一份元数据作为今后比对之用。
如前所述,永久存储库中的AIP无法更新、删除或重新排列。当必须更改AIP 时(例如,其元数据或格式需要更新),罗塞塔系统会将其移回操作服务器。更新过程完成后,系统再将 AIP返回到永久存储库,并记录更新过程。
最后,由“交付模块”和“发布模块”通过接口将内容从罗塞塔系统传送到内容使用者。内容使用者可以在只读模式下搜索和查看内容。他们通过公共接口(例如图书馆的在线公共访问目录OPAC)访问存储库内容,他们可访问的内容由管理者和生产者定义(访问权限选项)。
0
3
系统特点介绍
● 艾利贝斯罗塞塔系统(Ex Libris Rosetta)
罗塞塔系统是一个网络应用程序,可通过Microsoft Internet Explorer、Mozilla Firefox和Google Chrome等主流浏览器访问。系统提供了完善的安全、审计和完整性检查功能,以确保已采集馆藏资源的长期安全保存。
3.1 对元数据标准的遵守
在罗塞塔系统的开发过程中,一个关键的指导原则是确保该解决方案符合数字保存的国际标准。系统数据模型能够足够灵活地管理不同类型的数字内容,包括:文本文档、图像、音视频文件等。其目标是创建一个数据模型:
罗塞塔系统的数据模型基于长期保存元数据实现策略PREMIS(有关PREMIS的详细介绍参见本号文章《PREMIS(保存元数据:实施战略)项目介绍》)以及元数据编码和传输标准(METS)。
PREMIS是一个描述长期保存所需实体和元数据的概念模型。PREMIS元数据元素以三种不同的类别(管理元数据、描述元数据和结构元数据)存储在罗塞塔系统 METS容器中。元数据和文件按照一定的结构组织,如下图所示:
3.2 可扩展的基础设施
罗塞塔系统为保存机构提供了一套灵活且可扩展的基础设施,以应对不断增加的数字资源保存和管理需求。这一解决方案基于健壮的分布式架构,允许将存储模块、工作区域、永久存储库以及数据库分别部署在独立的服务器上。此外,各模块均可通过添加额外计算资源和存储资源实现扩容。罗塞塔系统还支持引入专用服务器,执行特定任务,如病毒检测和固化特性检查。这种灵活性使得保存机构能够从较小的硬件配置起步,并根据不断增长的馆藏需求调整系统配置。
3.3 灵活的开放平台
罗塞塔系统支持不同类型数字资源的采集、确认、接收、存储、管理、保存和发布,当相关政策发生变化时,还支持这些数字资源从一个机构转移到另一个机构。数字资源将会被保存为长期可用的格式,之后还需不断对保存格式进行评估,必要时进行转换迁移,以确保其持续的可用性。
罗塞塔系统的体系结构与基于规则的工作流引擎相结合,除了能为保存机构提供开箱即用的工具之外,还支持使用插件工具和应用程序来优化系统功能。这些工具支持以下任务和活动:
3.4 强大的社区知识库
罗塞塔系统的核心特性之一是社区驱动的知识库。该知识库由罗塞塔系统用户社区负责管理与更新,旨在共享并存储关于文件格式、应用程序、技术元数据及风险控制等方面的知识点。在社区知识库,每个客户都可以基于罗塞塔系统共享与其他客户的信息,创建保护计划,执行保存行动,并能及时获得社区反馈。
0
4
应用案例
● 艾利贝斯罗塞塔系统(Ex Libris Rosetta)
罗塞塔系统在图书馆、档案馆、博物馆等领域具有较为广泛的应用,这些机构可以使用该系统来保存和管理工作中产生的各种具有保存价值的数字资源,如历史文档、照片、音频和视频等。同时,文化遗产机构通过使用罗塞塔系统可以确保珍贵的历史资料得到长期保存和妥善管理,使人类文明得以传承。另外,罗塞塔系统还是帮助学术机构提供长期数据访问的理想合作伙伴。
罗塞塔系统的全球客户分布图如下所示:
目前,全球已有数十家机构采用该系统,包括:
罗塞塔系统作为一个完整的数字资源管理和保存系统,已经在多个领域取得了较为广泛的应用。随着数字化浪潮席卷而来,罗塞塔系统在未来的应用前景将更加广阔,助力数字资源的长期保存和高效利用。
他山之石可以攻玉,数字资源长期保存是数字罗塞塔计划项目的核心研究内容。经过三年的持续研发,数字罗塞塔计划项目已推出包括蓝光存储、数字胶片、电子档案库房等在内的全套数字资源长期保存软硬件产品及解决方案,旨在解决电子档案乃至数字资源长期保存领域的国产化替代问题,以实现“保存社会记忆,传承人类文明”的最终目标。
END
热文推荐
档案信息化
就看罗塞塔
高端交流群已开
加小罗,秒进群
点点“赞”和“分享”,给罗塞塔充点儿电吧~

