大数跨境
0
0

面向科技大数据的颠覆性技术多维度识别算法

面向科技大数据的颠覆性技术多维度识别算法 科情智库
2024-03-06
0

科情智库


背景

颠覆性技术在科研和产业领域引发广泛关注,对市场和科技影响巨大,各国将其视为战略重点,支持其发展和应用。颠覆性技术的不确定性和突变性使其难以识别和管理,对科研人员和管理者构成了巨大挑战。现有的专家研判法和模型大数据分析法存在局限性。专家研判法以专家知识为基础进行预测,难以消除专家主观所带来的系统性偏见。科技大数据分析通过深度学习算法挖掘信息并采用多种方法进行识别,以弥补专家评估的不足,但识别角度有限。


方法

本文提出颠覆性技术识别框架MAR-DT,构建大规模引文网络,设计四个计量指标并通过实际数据验证其有效性。颠覆性技术具有以下显著特征。

技术突破性:某一技术在某一领域取得了显著的进展。

技术创新性:技术的创新性则体现在其与现有技术相比的新颖性和独创性。

领域影响力:表示技术对特定领域的影响程度,包括其应用范围和重要性。

科技文献影响力:反映了技术在学术研究中的知名度和引用情况。

本文提出的颠覆性技术多维度识别算法(MAR-DT)可以划分为4个关键步骤:

1.科技大数据获取与预处理:设计文献检索策略,在科技论文数据库中收集候选论文集,进行人工筛选和预处理,构建数据集。

2.领域引文网络构建:根据引文字段提取节点集合与边集合,构建领域引文网络。

3.多维指标构建与评估:基于数据和引文网络进行突破性、创新性、领域影响力和科技文献影响力的评估指标计算,使用熵权法对指标矩阵进行融合,排序得出颠覆技术候选清单。

4.颠覆性技术识别和结果量化分析:从候选技术清单中分析、筛选得出颠覆性技术清单。


突破性指标

颠覆性技术出现后,对于科技文献的老化速度具有催化作用,这种现象经常在科技文献的引用关系中表现出来,当具有颠覆性的科技文献出现后,科研人员对该领域之前传统方法的关注度急剧下降,转而开始频繁引用具有颠覆性意义的科技文献。颠覆性技术可以划分为(1)对现有技术的巩固和(2)对现有技术产生冲击两种不同的类型。本研究引入CD指数进行颠覆性技术突破性(breakthrough)的分析,指标值越接近-1表明该技术越具有巩固性,反之,若突破性指标值越接近1,则表明该技术更具突破性。


创新性指标

颠覆性技术具有较高的创新性,发布后短时间内大概率将受到相关学者共同关注,呈现出快速扩张的趋势,本文通过对引文数量的短时间内的变化趋势进行创新性指标设计。创新性(Innovation)的计算方法,技术创新性指标计算结果越高,在单位时间内的学术影响力越大,越具创新性。


领域影响力指标

颠覆性技术存在发展与完善的过程,伴随着知识跨领域扩散现象,技术本身的影响逐渐扩散到其他领域。本研究设计技术领域影响力指标,定量地评估颠覆性技术的跨领域影响力,该指标通过利用被引用的科技文献所属的技术领域信息进行度量。


科技文献影响力指标

科技文献被认可的程度能够在被引用量的变化上体现,为避免经典科技文献的引用对颠覆性技术识别造成干扰。本文引入时间维度的考量,提出科技文献影响力,是指一篇科技文献在其公开发表后当年、发表第二年以及发表第三年的被引用量之和与目标科技文献总被引量之间的比值,突出科技文献的时效性。


指标融合

本文使用熵权法对四项评价指标进行加权计算,对指标矩阵进行规格化处理,归一化后得到的颠覆性技术指标矩阵,随后进行指标比重计算,计算指标熵值以及差异系数,指标的差异系数越大,对颠覆性技术评估的影响就越显著,根据各指标的权重,得到最终指标值Comprehensive。对最终指标值Comprehensive进行逆序排序,选取排序结果的前100篇作为颠覆性技术识别结果。


结论与建议

美国作为世界上最具科技创新实力的国家之一,发布了数量最多的颠覆性技术成果,在无线电通信与计算机科学领域所拥有的颠覆性技术领域处于领先地位。中国在颠覆性技术突破方面仍具备较大的提升空间,加强颠覆性技术的研发是实现技术领跑和维护领域技术安全的重要途径。

本研究根据颠覆性技术发展特征,关联科技大数据自身时序信息以及引文结构变化等,提出一种定量化的颠覆性技术的多维度识别框架(MRA-DT),综合考虑突破性、创新性、领域影响力和科技文献影响力,设计四种不同的颠覆性技术识别指标,利用熵权法对颠覆性技术各特征指标进行量化测度,基本实现了对论文数据的颠覆性技术细粒度挖掘,解决了传统方法在科学性、可解释性等方面存在的不足。实验结果表明,本文提出的颠覆性技术多维度框架能够甄别出不同时期研究领域的代表性成果,达到预期的研究目标。

我国在计算机技术和无线电通信方面颠覆性技术突破仍具较大的提升空间,需要加强关键领域科技研发,在稳步发展过程中确保国家科技安全。该方法能够对科学文献领域的颠覆性技术进行识别,为科研人员和相关情报从业人员及国家管理者提供参考与决策依据。

未来工作可以进一步考虑科技成果的时滞性,结合科技动态资讯、专利数据、产业信息等进行辅助分析与验证。


作者:赵姝1,2,3,郭双瑞2,褚晓泉4,仇瑜5,刘姝伶2

1.智能计算与信号处理重点实验室,合肥 230601;

2.安徽大学计算机科学与技术学院,合肥 230601;

3. 安徽省信息材料与智能传感实验室,合肥 230601;

4. 清华大学计算机系 北京 100084;

5.北京智谱华章科技有限公司 北京 100084


来源:此文为缩减版,《中国科技资源导刊》2023 Vol.(6):49-61


文章观点不代表主办机构立场。


推荐阅读 >

代表委员谈科技自立自强① | 将创新发展主动权牢牢掌握在手中

2024级信息资源管理专业高级人才课程研修班招生简章

美国能源部成立关键和新兴技术办公室

【声明】内容源于网络
0
0
科情智库
宣传科技信息资源及科技情报研究成果,关注产业最新动态、发展热点和重大变革,为科技创新提供新媒体渠道。
内容 1586
粉丝 0
科情智库 宣传科技信息资源及科技情报研究成果,关注产业最新动态、发展热点和重大变革,为科技创新提供新媒体渠道。
总阅读6
粉丝0
内容1.6k