大数跨境
0
0

【大比武02】业务系统新型电子文件通用归档接口实现方案

【大比武02】业务系统新型电子文件通用归档接口实现方案 数字罗塞塔计划
2023-08-29
0
导读:传统的归档接口已无法适应当前数字档案(馆)室建设和各类业务系统电子文件归档的需要,将各类业务系统的归档接口设计成既符合新标准要求又具通用性就显得意义重大。


编者按

本篇是参加“罗塞塔”杯档案信息化公司业务与技术实力大比武(简称“大比武”)的投稿文章,来自北京美络克思科技有限公司,作者:季雪岗。


随着数字档案馆(室)建设的深入,增量电子化已成为发展趋势,实现不同类型业务系统的电子文件归档成为必然选择。笔者在给客户档案信息化建设过程中也经常碰到一种现象,很多单位在建设业务系统时往往没有考虑到电子文件的归档需求。这将导致以后再来实现电子文件归档时会面临成本高、改造困难、实现难度大等问题;同时,因为归档接口不通用而需要在归档接口方面进行多次投资。因此,传统的归档接口已无法适应当前数字档案(馆)室建设和各类业务系统电子文件归档的需要,将各类业务系统的归档接口设计成既符合新标准要求又具通用性就显得意义重大。



1

传统归档接口存在的问题


在新形势下传统归档接口已无法满足数字档案馆(室)建设的要求,主要体现在以下几个方面:

01 传统归档接口的元数据不全面且严重缺失

传统归档接口一般只是捕获了文件实体块的内容描述元数据,而对验证真实性方面很重要的背景元数据、机构人员实体元数据、业务实体元数据等内容往往缺少捕获;同时也缺乏签名相关信息,这就导致后续无法支持数字签名和验签等功能。


02 每增加一个业务系统归档接口就需要厂商研发人员来定制开发

由于在接口开发时未进行通用化设计,往往在每次增加业务系统归档接口时需要由厂商研发人员再进行定制化开发,所以软件厂商一般在给客户报价时都会再增加接口报价。这无疑增加了客户的投入。


03 功能上不符合新的归档要求

传统归档接口只是简单的完成了数据“搬迁”,不具备数据按照国家新标准规范要求对元数据合规性进行验证功能,如《产品数据管理(PDM)系统电子文件归档与电子档案管理规范》( DA/T 88-2021)中提到PDM系统归档接口功能要求“将归档信息包传输至指定位置,传输过程中归档信息包中信息不丢失、不被非法更改”,而传统接口功能是无法进行验签的,电子文件真实性无法得到保证。



2

新型通用归档接口的实现思路及工作原理


通过对国家档案局多个电子文件归档相关的标准规范进行归纳总结,常见的在线归档和接收接口方式主要有两种形式,即WebService归档接口方式和中间库归档接口方式,新型通用归档接口也具有这两种方式:

(1)Web Service模式

工作原理如图1所示,即由通用归档接口连接业务系统及数字档案馆(室),由各类业务系统调用同一个归档接口,新型通用归档接口功能为图中各编号功能的总和。其通用性主要是通过动态从数字档案馆(室)系统中获取到元数据方案并由接口传递给业务系统,如图中虚线所示,各业务系统根据传递的XML Schema文档(体现为XSD文件格式)可对归档数据进行打包。该文档与动态获取的四性检测方案共同构成了对不同业务系统归档时进行四性检测时的重要依据。

图1 通用WebService归档接口方式

(2)中间库模式

工作原理如图2所示,即在业务系统和数字档案馆(室)系统间建立中间库并提供归档接口的模式,归档接口功能为图中中间库右侧的功能部分。这种模式往往是业务系统和档案系统未同步建设,或在建设业务系统时遗漏了归档接口而采用的一种模式。在该模式中,中间库的结构是按照数字档案馆(室)系统中定义的元数据方案进行创建的。该中间库不仅仅包含了传统中间库包括的内容元数据,还包括新标准中要求的所有元数据类型。

图2 中间库归档接口方式


通过以上两种归档接口方式的实现原理可以看出,新型通用归档接口实现思路主要体现在以下两个方面:

►►►

一是“新型”

即将与归档相关的新标准规范要求的功能封装到归档接口中,包括了与元数据、数据封装以及四性检测有关的新标准规范,这也是实现合规的数字档案馆(室)系统基础之一。同时,XML 文件中的数字签名块存有对签名对象执行的数字签名,该签名具备防冒充、防篡改、防重放、防抵赖、防泄密等特点,在接收信息包时接口检测功能会对其进行验证,验证工作原理如图3所示。

图3 归档接口验签过程

►►►

二是“通用”

即将动态内容作为外部配置项,外部配置项可通过可视化的配置方式来实现,而不是通过研发人员将动态性写在归档接口的程序代码里。这个外部配置项主要包括元数据方案配置(如图4所示)和四性检测方案配置(如图5所示)。通过归档接口可将元数据方案配置生成归档接口需要用到的XML Schema文档。

图4 元数据配置方案

图5 四性检测方案可视化配置



3

归档信息包(ASIP)封装结构的优化


封装有逻辑封装和物理封装之分,后者可以形成独立的计算机文件或文件夹存储结构,非常适合异构系统归档接口所使用。本通用接口方案中的归档信息包封装结构主要采用和参考了《党政机关电子公文归档规范》(GB/T 39362-2020)描述的信息包结构,笔者认为,该规范相比较《基于 XML 的电子文件封装规范》(DA/T 48-2009,以下简称《规范》)更为合理和实用,主要基于以下两点考虑:


01 《规范》中计算机文件是以Base64编码的形式嵌入在XML文件之中

这种方式的优点是元数据能与计算机文件结合更紧密,档案的完整性更有保障。但在实践中证明,该方式往往导致封装形成的XML文件容量过大,后续访问和处理性能明显下降。


02 《规范》中XML文件结构中缺乏对元数据项合规性验证机制

归档时对元数据项进行解析和校验往往很重要,这是后续四性检测以及将数据写入档案系统的基础。为避免出现在检测及归档环节因为信息包封装结构相关资料的缺失导致电子档案信息包解析和校验发生困难,可将归档信息包的封装结构以标准的形式规范化并公开发布,可通过本文介绍的通用归档接口根据元数据方案动态生成XML Schema来实现,并将该文档与归档信息包一同保存。在归档接口接收到归档信息包后,采用XSD文件对XML文件结构进行校验,校验通过方可归档。


因此,在归档环节需对电子文件封装结构采用一种新方法,经过改进后的单份电子文件归档信息包主要包括电子文件元数据XML、电子文件元数据XSD、计算机文件等多个文档,归档信息包封装结构如图6所示。

图6 优化后的归档信息包结构



4

新型通用归档接口的价值


新型通用归档接口有利于推动单位数字档案馆(室)建设以及业务系统电子文件归档的推广实施,其价值体现在以下几个方面:


01 可以大大降低数字档案馆(室)建设的成本

对于一个集团型企业,其业务系统往往几十个,如果再考虑到其下属单位,该企业的业务系统归档接口数量众多。如果采用传统模式实施,光归档接口这块投资至少需要好几百万,而采用了新型通用归档接口,就可以将建设成本降到百万以内。因此,一个单位采用了新型通用归档接口后产生的经济效益非常明显。


02 有利于推动单位业务系统与数字档案馆(室)系统集成

新型通用归档接口使得数字档案馆(室)系统与业务系统的集成变得更加简单,只要发布了XML Schema文件,业务系统开发商或客户服务人员就可以比较轻松的地调用归档接口以实现业务系统电子文件归档。


03 符合国家相关标准规范

因为新型通用归档接口已将国家电子文件归档相关标准规范要求置入到功能实现中。如《文书类电子档案检测一般要求》(DA/T 70-2018)中要求,“对归档电子文件中包含的数字摘要、电子签名、电子印章、时间戳等技术措施的固化信息的有效性进行验证”,新型通用归档接口包含了验证功能,从而确保了归档数据能符合国家标准规范相关要求。


04 对国家标准规范的落实和优化提供了实践经验

近些年,国家档案局在电子文件归档方面的出了很多标准规范,如《党政机关电子公文归档规范》(GB/T 39362-2020)、《产品数据管理(PDM)系统电子文件归档与电子档案管理规范》( DA/T88-2021)等,这些标准规范实践性很强,新型通用归档接口一方面实践和验证了这些标准规范的可行性,同时可以根据实际环境要求进行适当的优化处理。


END


数字罗塞塔计划公众号致力于作为中立的第三方客观公正地表达自己对于档案信息化领域的看法和观点。真理越辩越明,我们也衷心欢迎越来越多的人投身到档案数字资源管理和保存这一领域的研究中来并发表真知灼见,共同为人类文明的传承而努力奋斗!


热文推荐

智慧档案库房“1+3+N”建设思路

【表情包可下载】罗塞塔英雄大会,各大门派摩拳擦掌,字母表都不够用

走进静安,带您了解全国示范数字档案馆创建过程

电子文件生命周期中究竟有多少个库?

【大比武01】AI影像档案修复系统应用研究


档案信息化

就看罗塞塔

高端交流群已开

加小罗,秒进群

 欢我们就点“”和“在看”分享给小伙伴哦~

档案信息化,就看罗塞塔!

【声明】内容源于网络
0
0
数字罗塞塔计划
保存社会记忆,传承人类文明! 我们始终秉持中立的立场客观公正地分享和交流档案信息化与档案文化领域的知识和观点,致力于成为全国领先的档案”两化”新媒体平台。
内容 524
粉丝 0
数字罗塞塔计划 保存社会记忆,传承人类文明! 我们始终秉持中立的立场客观公正地分享和交流档案信息化与档案文化领域的知识和观点,致力于成为全国领先的档案”两化”新媒体平台。
总阅读10
粉丝0
内容524