大数跨境
0
0

罗塞塔档案信息化问题汇编(第八期·下篇)

罗塞塔档案信息化问题汇编(第八期·下篇) 数字罗塞塔计划
2024-09-02
0
导读:档案信息化问题汇编是小编针对罗塞塔四大群内部分精选问题进行整理汇总,每月一期以问题汇编的形式发布,将群友们的精彩发言分享给大家。

档案信息化问题汇编是小编针对罗塞塔四大群内部分精选问题进行整理汇总,每月一期以问题汇编的形式发布,将群友们的精彩发言分享给大家。本期为罗塞塔档案信息化问题汇编第八期(下篇),继续分享已有回复或答案的问题。


第八期


目录

热点关注问题

(一~五)

罗塞塔档案信息化问题汇编(第八期·上篇)

热点关注问题

(六)

涉及档案部门和数据部门职责划分问题的讨论

热点关注问题

(七)

关于国产现象级3A游戏《黑神话:悟空》,档案新媒体能做点啥?

第八部分

其他问题拾萃(共19题)



6

热点关注问题六

8月20日,有群友提问:“想咨询一下各位大佬数字档案馆能否建在政务云上,如果上云,档案数据存储是否需要配置独立存储?有没有相关依据?”这个问题由于涉及到档案部门和数据部门的职责划分,再次引发群友们的热议。

楼主

我们单位是国家综合档案馆。我们是准备上云,但是觉得存储应该是独立存储,但是政务云管理单位要求我们提供必须独立存储的依据。

楼主补充

目前我们的政务云提供了基础的云环境,包括计算资源和基础的安全防护以及签章服务、统一登录等,政务云整体过了等保三级和密评。我们觉得上云问题不大,就是存储这块,我们觉得应该独立存储,在存储之前增加防火墙进行防护。政务云管理部门要求统一分配,不希望我们搞特殊化。

群友1

政务网上的非密档案数据没必要独立存储,一般电子政务云的云存储就好了

群友2

档案部门应该重点关注资源总库(长期保存库),放在局域网中;但是档案接收、管理和利用,不应该是独立于政务一体化的大框架之外的

DRP

国家档案局发过一个文件《关于档案部门使用政务云平台过程中加强档案信息安全管理的意见》(档办函〔2020〕55号),其中明确指出“SM数据和资源总库不得使用政务云平台”。

补充

有关四库分离的问题可参见本号文章《档案信息化建设到底需不需要“四库分离”?》。关于楼主所说的情况不在“档办函〔2020〕55号”文件所列的条款之内,直接使用政务云资源没有问题。

群友3

我也认为不需要,确实也没有支撑文件。而且更重要的是,这不仅不是“主动融入”的态度,还与国家政务一体化要求背道而驰。

楼主

和我理解的差不多,确实基础设施应该统一建设,像天然气、自来水一样。业务部门就应该专注业务流。

群友3补充

现在要做的是,都往云上赶:不上云,就不能实现数字资源一体化,不上云,不能真正打掉部门间的“墙”,也就无法实现多跨协同;不上云,也不能真正实现在两端“高效办成一件事”,从而累计更多的数据;不上云,最终无法充分发挥数据的威力,数据要素的整体方针也就无法实现了。

群友4

有专家说:只要是网络就没有安全的。我的想法是:只要解决了安全问题,你想放哪儿就放哪儿。因为没有人向档案部门保证能解决安全问题,并且没有人愿意与档案部门签订安全协议,所以在“档办函〔2020〕55号”文件中只说了开放档案可以上云,并特别强调资源总库和SM档案不能上云。如果要求档案馆的档案数据上云,相关部门应该与档案部门签订一个免责协议。

群友5

政务云涉及到众多党政机关的业务和数据,从制度、技术等方面,是有系列安全体系保障及监督的,安全能力和服务及时性都要高于档案馆的专网。我个人提议,SM的建在政务内网,政务外网的档案资源建在政务外网,资源总库保存在局域网,利用库也可以分政务外网和互联网。总结起来几个网就建几个库,好记,逻辑也简单。

楼主

我们基本就是这么设计的,唯一不同的就是资源总库直接建在内网了。我们不打算建机房,内网托管给密码局,外网上云。机房、网络、安全是相关部门统一建的,其他我们自己建,作为应用接入。

群友6

服务器、存储等设备你们自己投入,组网接入内网吗?数据备份政务内网提供吗?

楼主

我们不打算建局域网,服务器、存储等设备买好之后托管,备份也是我们自己的。

群友7

@群友4,至于说签协议,客观上,我们翻完了全网,无论是档案法还是发文,都找不出来一个把馆藏和这个还没定义清楚的管理库放在本地的支撑依据文件;主观上,作为基层档案馆,一个处于业务末端的、传统的、依靠财政投入的部门,力量有限。所以从主客观上,都很难要求签订这个协议。

群友8

任何事物都扛不住“自然淘汰”,一旦其他机构(比如数据局)出现“数据可信赖的第三方存储库”的规范或法规,档案行业将面临更大的挑战

群友9

@群友8,你这个说法偷换概念了。面临挑战的是档案管理机构,不是档案行业本身,档案作为高价值的可信数据只会越来越重要

群友10

我个人感觉到,档案的力量很大,将是社会信用的基石,我们大有可为。但需要我们不放弃成长,总能奋发图强,再难我们都坚守理想,无论在哪里,有档案就有信用。

群友11

总结:档案会永远存在的,因此围绕其的管理活动必然永远存在,这是档案行业的“不变”;

随着社会发展,其管理机构、表现形式、管理方法等等都会发生变化,这是档案行业的“变”。

因此,把档案作为一门事业,而不是生意或者工作,从更长期、更广阔的视角来无限接近档案的本质,这是把握住了“不变”;而结合客观环境、趋势变化、因时、因势、因地制宜,这是把握住了“变”。

同时把握住“变”与“不变”,这就是真正的实事求“是”!


7

热点关注问题七

8月20日,国产现象级3A单机游戏《黑神话:悟空》震撼发布,一时间各大媒体新闻报道铺天盖地,好评如潮,各地文旅部门也纷纷@黑猴,准备接住这泼天的流量,那档案新媒体是不是也应该做点什么呢?群友们就这一热点话题展开讨论。

群友1

游戏平台上的信息组织和展示值得我们学习,档案信息化对我们档案室的人来说,就是如何提高工作效率,让我们的工作更加轻松。

群友2

爆款游戏确实有它的独到之处。分析了一下前期人气一直居高不下的《王者荣耀》这款游戏,发现其在建立个人全周期档案存储及查询方面的思路居然和最近各地正在推进的“一人一档”惊人地相似!

DRP

游戏素材、游戏3D场景和游戏数据如何归档是一个世界性难题,和各类新媒体平台归档差不多情况,不知道怎么搞。本号前面也刚刚发过一篇文章《新媒体数据归档与保存:应对互联网崩塌的挑战》

群友3

可以了解一下巴黎圣母院的重建,据说就是《刺客信条》这个游戏商提供了当时全套的3D建模数据。至少说明他们是有存档和利用的机制的,而且确确实实发挥了作用。

DRP

@群友3,这个事情我们还专门研究过,和你的说法不一致,说是来自Google地图的倾斜摄影模型,具体可参见本号文章《倾斜摄影技术在数字孪生档案馆建设中的应用》

群友3

我觉得有可能他的恢复数据是综合的,肯定要多方考虑,最后设计出一个完整的恢复方案

群友4

也幸好是巴黎圣母院这么有名的建筑,才会有这么多厂商愿意给他做建模做存档,在游戏里也有商业价值。如果是藏在一个大山里的古建筑,可能烧了也就烧了

DRP

问题来了:《黑神话:悟空》拍了这么多山西古建筑所形成的数字模型,这应该都可以算是数据资产,产权属于谁?

群友5

我觉得这个可能就要看当时游戏厂商去做建模的时候,和当地文物管理部门之间签的协议了

群友6

知识产权应该还是属于文物管理部门的吧,协议可以签买断或者分成模式

群友7

这似乎是一个存在争议的问题,网上有一篇文章“对故宫等文物建筑的数字化使用,是否受《著作权法》的保护?”,最后也是没有结论,等待法院判决…

群友8

不晓得《黑神话:悟空》是不是之前签过合作协议,哪怕没签,是公司未经授权自己采集的,现在大的形势上是对文物的宣传,是个双赢的局面,也没有损害文物所有方的形象,除非爆什么反转的大瓜,否则不会有问题

群友9

山西文旅部门和杭州灵隐寺都支持了



8

其他问题拾萃


1、各位专家,请教一个问题:下图是GB/T 18894规范中的电子文件归档登记表,表中我标注的红圈内的“件”,是不是应该填写电子文件数量?不是填写一文一件的条目数量?如果以案卷方式移交,前面的“卷”,是填写案卷数量吗

就是件和卷的数量,不是电子文件个数,否则单位不应该叫“件”,应该叫“个”。《<电子文件归档和电子档案管理规范>解读》一书的相关章节中也有明确描述:

2、请教下老师们,国家综合档案馆的科技项目和实施的信息化项目,按照GB/T 11822-2008《科学技术档案案卷构成的一般要求》,可以纳入到科学技术档案门类下管理吗?

信息化项目归入科技门类下面的建设项目分类更加合适;而每年申报的国家档案局科技项目整理形成的档案应该归入科研课题分类。

3、请教各位大佬,如何理解档案数据利用的场景分析,可否列举几个场景启发下思路?

这种开放式的问题最适合AI大模型,可以尝试一下文心一言、通义千问、Kimi之类。

4、市场有不少号称能够基于AI实现自动分类、自动确定保管期限的软件准确度如何?实际使用中会不会类似的内容分到不同的类?

软件中内置本单位的三合一表实际上根本不需要用到AI技术,基于规则就可以判断,而且准确率很高。如果是基于通用三合一表,通过AI来判断,那肯定会有这种情况。

5、企业档案的分类是不是应该与企业数据治理的主题域统一或归并?

这个想法值得努力去推进落地,有点数档一体化的意思了!事实上主题域的划分方式很多,应该可以和档案分类保持一致,比如按照机构或者问题划分。当然由于数据治理在前,档案分类在后,档案部门如何与数据部门加强沟通协调以实现前端控制,始终是一个难题。

6、我觉得在归档时采用xml存数据(归档信息包)这个事没有意义,其他格式还可以用json等等,以一种中间格式存储数据的做法本身的意义在哪?

采用信息包的方式来组织归档信息主要是为了满足归档时前后端系统之间的对接,但并不是只有归档信息包数据交换这一种方式。GB/T 18894-2016《电子文件归档与电子档案管理规范》中给出了三种归档接口方式:

这其中,“c)归档电子文件及其元数据的规范存储结构。”指的就是归档信息包,但也可以采用“a)webservice方式”和“b)中间数据库”方式,后面两种方式在过程中就不需要采用XML来存数据,如果是直接调用接口,当然也可以采用JSON进行数据组织。

7、有关xml/json这种离线封装的做法我一直在管理与技术上进行反思。只是觉得封装这种传输方式,与数据治理中的ETL具体的差别在哪。或者说为什么说长期保存要封装?

从本质上来说,封装不只是为了数据传输,更是为了长期保存。封装的作用是实现自描述,自包含,自证明,做到技术无关性,利于档案数据的长期保存。有关封装格式的介绍可参考本号文章《EEP封装?METS封装?还是ZIP封装?》

8、咨询各位老师,档案室允许建在一楼吗?

没有明确规定档案室不允许建在一楼,但根据实践经验来看,强烈建议档案室不要建在一楼,否则隐患不少。

9、分公司可以单独设置全宗号吗?还是使用母公司的全宗号呢?

全宗号是档案行政管理部门赋予的,如果没有赋予的话,本单位可以根据实际情况进行编排:如果公司机构改革频繁的,建议用大全宗;如果企业机构稳定,可以考虑单独全宗。

10、各位老师,请教个问题,一般数字化扫描的JPG和PDF,哪个叫数字化副本,哪个叫数字化成果?

根据《档案法》第三十五条的说法,应该都是“传统载体档案数字化成果”,“数字化副本”应该不是规范的称谓。

11、我想问下专家,数据电文具体是指什么,包括电子文件和元数据吗?

《中华人民共和国电子签名法》第二条有明确定义:本法所称数据电文,是指以电子、光学、磁或者类似手段生成、发送、接收或者储存的信息。

电子文件及其元数据属于这个范围。

12、以下来自一位群友的独白(关于档案智能开放鉴定是个伪命题):


理由如下:

1) 不同的机构和专家对开放的定义范围并不相同,这个专家认为可以开放,那位专家认为不能开放;

2) 不同时期对开放定义范围也不相同;

3) 每一次变化都要重新训练模型;

4) 通过关键词来筛掉一部分,准确性覆盖不足,人工效率提升有限;

5) 开放鉴定的档案类型单一,基本上停留在文书上;

6) 开放档案数据目录更新频率不及时,属于运动式的工作;

7) 缺乏对开放鉴定后档案利用情况分析,缺乏效果评价;

8) 档案开放鉴定缺乏监督保障机制。

群友补充

应该说完全依靠大语言模型来实现档案智能开放鉴定是伪命题。


13、群主发言:1月份的时候我们曾经讨论过“数据要素X,为啥没有国家档案局参与?”这个问题(详见本号文章《罗塞塔档案信息化问题汇编(第一期)》),最新的解释是这样的:

数据要素X,数据要赋能国民经济某个领域的发展,也就是数据要结合其他应用领域;而档案本身就是数据要素,不存在需要数据赋能的问题。换句话说:档案部门应该是“X”之前的“数据要素”,是赋能部门,而不是“X”之后的被赋能部门!


所以档案部门应该积极行动起来,推动数据档案化治理工作,进而全面推进数字化转型和数字经济发展,为数字中国建设贡献档案力量!

14、请问各位专家在档案馆查询到的资料可以用在论文中发表吗?

如果是公开资料应该没问题,部分档案馆网站上都可以查询。但引用时建议注明来源。

15、请问各位专家,一般对系统要求的日志审计功能,需要对普通用户的日志也进行审计吗?还是三员日志审计就可以?

日志是所有用户的操作都要记录的,包括系统登录退出、增删改查等各项操作。但日志审计模块应该区分不同的日志,便于审计人员查看。

16、请教下各位同仁,有做过廉租房保障房档案整理的么?主要是住建部门三合一制度没有包含进去,不知道如何归档。

可以参见《国家基本专业档案目录》,其中第二批中有城镇廉租住房档案:

17、各位大佬,请教个问题。我单位成立了核算共享中心,中心负责总部及集团8家二级单位财务工作,会产生相应的会计档案。请问,这些会计档案是否应该归集到财务共享中心的全宗下统一管理?还是分别列入总部及8家二级单位各自的全宗管理呢?总部及8家二级单位在我单位是独立全宗的管理模式。

建议归入财务共享中心全宗统一管理。

18、请教一个问题:档案部门有没有权力根据自己系统特点或者检索需要,对接收的著录文件进行优化或者修改?比如某单位移交的业务档案档号中以编码代替地名,在检索中不够直观,可否在导入利用库中自行进行批量修改?比如将字段值“43”修改成“湖南省”?

元数据是档案的组成部分,不能修改,对元数据做描述加强是可以的。可以考虑增加字段,来注释这个值,例如:编码、编码名称,保留原始的数据。

19、请教一个问题:文件日期是著录生效通过日期(最后一个领导签批时间)还是文件落款日期(主办负责部门上报日期)?

应该是文件落款日期。


数字罗塞塔计划公众号致力于作为中立的第三方客观公正地表达自己对于档案信息化领域的看法和观点。真理越辩越明,我们也衷心欢迎越来越多的人投身到档案数字资源管理和保存这一领域的研究中来并发表真知灼见,共同为人类文明的传承而努力奋斗!


热文推荐

罗塞塔档案信息化问题汇编(第八期·上篇)

电子文件归档接口方式分析及应用实例

古印度的未解之谜——哈拉帕印章文字

使用AI大模型搭建档案知识助理

东巴古籍——纳西族古老文字的见证



档案信息化

就看罗塞塔

高端交流群已开

加小罗,秒进群

点点“”和分享,给罗塞塔充点儿电吧~

【声明】内容源于网络
0
0
数字罗塞塔计划
保存社会记忆,传承人类文明! 我们始终秉持中立的立场客观公正地分享和交流档案信息化与档案文化领域的知识和观点,致力于成为全国领先的档案”两化”新媒体平台。
内容 524
粉丝 0
数字罗塞塔计划 保存社会记忆,传承人类文明! 我们始终秉持中立的立场客观公正地分享和交流档案信息化与档案文化领域的知识和观点,致力于成为全国领先的档案”两化”新媒体平台。
总阅读10
粉丝0
内容524