点
击
蓝
字
关
注
我
们
如果世界上有一个模型对国内的数字图书馆和数字档案馆建设做到了“言必称之”的程度,那一定是OAIS(Open Archival Information System,开放档案信息系统)参考模型;如果问哪一个标准对世界范围的数字档案馆应用系统和电子档案长期保存系统的建设最具指导意义和参考价值,那也一定是ISO 14721《空间数据和信息传输系统 - 开放档案信息系统(OAIS) - 参考模型》。本文中我们将对档案界如雷贯耳的OAIS参考模型进行介绍,当然,限于文章篇幅,我们将重点对与数字罗塞塔计划紧密相关的数字资源长期保存要求进行介绍。
在国际标准化组织(ISO)的请求下,美国空间数字系统咨询委员会(Consultative Committee for Space Data Systems,CCSDS)开始开发一个存档标准以支持数字资源的长期保存。CCSDS于1999年5月发布了OAIS参考模型,这一参考模型针对数字信息的长期保存和维护的档案系统提供一个概念性的框架,描述了一个档案系统存在的环境、档案系统的功能组织以及支持档案处理的信息基础结构。在CCSDS和ISO的推动下,OAIS参考模型成为了数字档案系统普遍遵从的标准规范(即ISO14721),来自图书馆、档案馆、科学数据、文化传承等领域的相关项目和系统都纷纷以其为准,进行系统的规划和设计。CCSDS认为需要长期保存的数字信息将被留存,这一“长期”指的是时间足够长,能与技术变革产生的影响相关联,这些影响包括新载体和新数据格式的支持以及用户群的改变等(关于“长期”的定义可以参考《档案数字资源长期保存的“长期”是多少年?》一文)。到目前为止,ISO14721标准出过两个版本,分别是ISO14721:2003和ISO14721:2012,主体内容差别不大。
OAIS的目标如下:
1、为长期保管数字信息所需理解的存档概念提供框架,以提高对此的关注度;
2、为非存档组织有效参与保存过程提供所需概念;
3、提供包括术语和概念在内的框架,以实现对现有和将来的存档机制和操作进行描述和比较;
4、提供描述和比较不同的长期保存策略和技术的框架;
5、为比较数字信息的数据模型,探讨数据模型与基础信息如何随时间变化提供基础;
6、为实现对长期保存的非数字形式信息(如实体介质和实体样本)的扩展提供基础;
7、阐述关于长期数字信息的保存与访问的一致观点,促进数字保存各方支持者的更多赞助;
8、指导OAIS相关标准的确定与创建。
OAIS参考模型帮助理解长期保存和访问数字信息所需的存档概念,并提供一种考虑数字资源长期保存的思维方式。利用此模型可以达到让不同应用平台下产生的数字档案能够互联互通、资源整合,实现信息共享、长期保存以及持续可读的目的。
OAIS认为,一个OAIS是一个置身于生产者、消费者和管理者之间的一个存档体系。如下图所示。
围绕OAIS进行档案收集、管理、存储和利用的角色分别有生产者、管理者和消费者:
1、生产者(Producer)
2、管理者(Management)
3、消费者(Consumer)
管理者、生产者、消费者在OAIS中更多的代表了功能性,而不是单纯的组织角色。所有这些角色可以被包含在单一的组织架构内,也可以分布在多个不同的组织中。
数字信息是OAIS中的基本格式,这些数字信息或者是作为档案的主体,或者是作为对数字化信息以及物理存档信息的支持信息存在。在OAIS参考模型中,提供了一个完整的档案信息保存功能,它包括摄取/收集、数据管理、档案存储、利用/分发。它同时论述了数字信息从一种载体或格式到另一载体或格式的迁移/转换、信息表示的数据模型、信息保存中软件的作用、档案系统之间数字信息的交换等。它还确立了各个档案功能内部和外部的接口,以及一系列在这些接口之上的高层服务。
在OAIS参考模型中定义了六大功能实体和三大信息包。下图描述了OAIS参考模型的框架结构(以档案数字资源管理为例):
OAIS中六大功能实体分别为:
OAIS提出了信息包(Information Package)的概念来说明档案生产者向OAIS的提交过程和OAIS向档案消费者的分发过程。一个信息包是一个包含名为内容信息(Content Information)和保存描述信息(Preservation Description Information,PDI)两种信息对象的容器。
OAIS对提交给它的信息包、它所存储的信息包、以及它分发给其它消费者的信息包进行了区分,分别将这些信息包叫做提交信息包(Submission Information Package,SIP)、保存信息包(Archival Information Package,AIP)和分发信息包(Dissemination Information Package,DIP)。
信息包是信息对象的容器,而信息对象是由知识背景、数据对象和表征信息组成的。数据对象要么是物理对象,要么是数字对象。表征信息是用来解释数据的,使数据成为有意义的信息。因此,信息包是包含了“内容信息”和“保存描述信息”这两种信息对象的“容器”。信息包还与其它两种信息对象——“封装信息”和“信息包描述信息”联系在一起。如下图所示:
作为国际标准的OAIS参考模型之所以能够在数字资源长期保存领域获得广泛的认可,不仅在于它为数字信息保存提供了一个可供遵循的模式和框架,还在于它所蕴含的管理思想精髓能够被各种数字信息保存机构所广泛借鉴和吸收,发挥其在数字资源保存领域的独特优势。
3.1
信息模型
OAIS的首要目标就是为指定用户群(消费者Consumer)保存信息,而保存时间则难以确定。OAIS认为:完善的数字保存系统必须确保被保存的信息对于目标用户而言是独立可理解的,也就是说,应当确保目标用户在没有信息生产者(Producer)帮助的情况下,仍能够独立地理解被保存的信息。为了实现这一目标,在保存系统中既要保存存档对象,也要保存存档对象的描述和说明信息。为此,OAIS提出了信息模型的概念,用以描述数字保存系统中存在的各类信息,规范数字保存系统中的信息类型和信息包组成。信息模型揭示了数字保存系统中复杂的信息关系,直接影响着在数字保存系统中选择什么作为存储对象,哪些信息是数字对象本身,哪些信息是对数字对象进行描述的信息,这些信息都如何对数字对象进行描述和说明。另外,数字保存系统中的信息模型不仅要有助于数字对象的存储,也要有助于在数字保存链条的每一个阶段发生问题时,能够及时采取措施进行修正,并能够在新的环境和条件下确保可以还原保存的数字对象,保证数字对象的系统可读性和用户可读性。总之,信息模型在数字资源长期保存活动中占据着非常重要的地位。OAIS信息模型如下图所示:
为了对信息对象进行全面而准确的描述,OAIS引入了信息包的方式,实现了信息对象的自包含、自描述、自证明:
引用IBM以色列海法实验室的观点,数字资源长期保存包含两个层面含义,即比特保存与信息保存。也就是说,要实现数字资源的长期保存,必须同时做到比特保存和信息保存。比特保存,也叫物理保存,主要指在存储载体老化或逐步过时的过程中,或是在经历自然灾害后,人们恢复载体中所存信息的能力,重在解决硬件过时的问题。信息保存也叫逻辑保存,主要指在未来技术和用户群体变化的情况下,长期确保数据可理解性和可用性,重在解决编码、语法甚至部分语义过时的问题。由此可见,OAIS信息模型实际上就是为了解决数字保存中的“信息保存”问题。
接下去我们再来看看OAIS参考模型六大功能实体中和长期保存密切相关的两大功能实体(档案存储和保存计划)以及保存策略。
3.2
档案存储
档案存储功能实体详细分解如下图所示:
各组成部分简要描述如下:
1、 数据接收
2、存储等级管理
3、载体转换
4、 错误检验
5、灾难恢复
6、数据提供
3.3
保存计划
保存计划功能实体详细分解如下图所示:
1、 目标用户监控
2、技术监控
3、长期保存策略与标准制定
4、 打包设计和迁移计划制定
3.4
保存策略
计算机工业迅速变化的特性以及数字资源存储载体寿命的短暂性与OAIS的主要目标——长期保存数字信息相背离。无论OAIS将当前的资源维护的多么好,最终还是得将大部分的资源迁移到不同的载体和(或)不同的软硬件环境中去,以维持它们的可读性。在数据丢失的可能性高得不得不加以重视之前,目前的数据存储载体至多只能维持几十年。而且,仅在几年之后,技术的迅速发展将使得许多系统面临挑战。
OAIS通过数字迁移来应对上述挑战,在迁移过程中,OAIS需要:保存所有的信息内容;对信息进行重新归档并替换原有信息;对迁移的各个方面进行全面的控制和负责。驱动OAIS中的AIP数字迁移的三个主要因素是:
1、 改良后的成本
2、客户服务的新需求
3、载体损坏
OAIS中的数字迁移涵盖的范围很广,包括复制、更新、(重新)封装、格式转换等,事实上,数字保存的技术措施和技术策略还不止这些,历史上曾经提出过的保存策略包括计算机博物馆(系统保存)、风干、更新、再生性保护、仿真、标准化(格式转换)、封装、迁移八种,如下图所示:
有关这些保存策略(技术措施)的相关介绍参见《数字资源长期保存技术概览(上》和《数字资源长期保存技术概览(上》。
对国外数字资源长期保存先进理论、标准、项目进行跟踪研究是数字罗塞塔计划研究任务的重要组成部分。数字罗塞塔计划是由杨安荣博士联合国内知名投资机构发起的一项利用蓝光存储、数字胶片、玻璃存储等技术,旨在解决电子档案乃至数字信息长期保存的国产化替代科技攻关工程项目,以实现“保存社会记忆,传承人类文明”的最终目标。
【完】
※※※※※※※※ 重要消息 ※※※※※※※※
数字罗塞塔公众号已创建档案信息化业务和技术高端交流群,供高质量粉丝交流探讨档案信息化问题、分享相关经验和研究成果,添加“小罗”微信号:DRP-Rosetta,拉你入群哦~
热文推荐
档案信息化,就看罗塞塔!
微信公众号|数字罗塞塔计划
保存社会记忆,传承人类文明

