
科情智库
邢玉艳、刘耀
(中国科学技术信息研究所,北京 100038)
精准医疗作为全新的医学模式,可能会带来疾病诊断、诊疗和健康保健方面的革命而造福人民。精准医疗的发展给人类带来福利的同时,也不可避免的给我们带来突出的医学伦理问题,其中任何伦理问题出现问题,都会对个人、对社会带来巨大损失,同时也会阻碍精准医学的发展,我们必须清醒的认识并积极应对,为其制定相应的规范和标准体系。若要进行标准体系构建,标准工作者就需要依据规范的方法进行大量的资料整理与搜集,从海量资源中提炼出大量的概念、关系、结构,需要耗费大量的人力、物力,有时也并不能将标准体系中的包含的方面找全,广度和深度可能并没有达到理想状态,为解决这一问题,本研究提出了一种基于数据驱动的标准体系构建方法,利用概念自动获取、关系自动抽取、结构表示等技术,实现标准体系的辅助构建。
本研究对标准体系自动构建的方法进行了详细介绍,其中包括标准体系模型的构建,该模型是整个模型构建中的指导,包括精准医疗领域概念获取、医学伦理领域概念获取、信息安全领域概念获取、三个领域概念关系获取、领域知识获取,将这五个阶段又分成了三个维度,分别是概念维、关系维和知识维。
最后选取个人隐私领域进行标准体系的生成,从单个标准和单类标准两个角度进行分别生成,最终得到了正确率达到86.99%,召回率达到65.53%,其中单个标准的实验采用回溯方法,与已发布的标准进行比对,验证了本文方法的有效性,单类标准的实验通过生成某一类的标准,验证了本文方法的有用性。从新生成的结构中可以看出,生成的这几个一级标题,健康医疗大数据、个人信息的使用、个人信息安全事件处置、去标识化概述、法律责任,基本都是与健康医疗信息安全相关的内容,可以为相关研究者提供一定的支持。有些二级标题的名称与原结构中标题并不完全匹配,但是所要展现的内容则是更加细节的,比如,安全框架中的实施方法中就包含了新结构中的去标识化,数据使用环境中就包含新结构中的个人信息查询、更正、删除等操作,这就需要研究者根据实际需求进行筛选。
利用本文方法生成的标准体系可以为相关研究人员在制定标准体系之前提供一个可以参考的框架与结构,缩短了研究人员大量收集相关材料的时间,大大地提高了工作效率。在未来工作中,标准体系制定者若想制定新领域的标准体系或者标准,或者对已知标准体系进行更新,可以运用本文方法进行资源限定后,进行生成或者筛查,这样大大提高了标准工作者的效率,,进一步地推动了标准化工作的智能化。当然,本文还有不足之处,下一步将会进一步扩大语料范围进行机器学习,并利用已有的知识库辅助概念与关系的标引,同时将生成的标准体系进行可视化展示。
推荐阅读 >
识别下方二维码,关注「科情智库」
持续关注产业动态及科技领域报告

