大数跨境
0
0

引证行为与引文分析

引证行为与引文分析 科学出版社
2015-11-10
2
导读:引证行为是学者最基本的学术行为。引文分析是知识图谱研究的重要内容,可视化是引文分析研究的重要手段与结果展示方式…


引证行为是学科学者最基本的学术行为之一,客观地表征了科学知识交流与共享、继承与转移情况,反映了学者的知识利用和吸收行为。



引证行为


19世纪以来,西方科学界开始形成严格的科学传统,要求学者在撰写论著时,须参照前人所写过的有关文献,这就使得一篇完整科学文献包括两部分:正文和参考文献部分。另外,在社会科学论著中,除在文后列出参考文献,也以文中注释、脚注、间注和夹注的形式存在。


引证行为既是一种科学规范与制度,也是一种人类科学研究和知识交流的基本需要。


从20世纪中期开始,就有许多学者从不同角度归纳出了引证的动机,从几种到几十种不等,如Brooks根据前人的研究,将引文动机分为七类。学者施引过程中,无论是出于答谢被引者“引文是学者付给同行的硬币工资”,还是为了论证自身观点把被引对象作为论据,或者是施引者本身复杂的心理过程的体现,引文都是学术论著的重要组成。


引证行为是学者重要的学术行为,引文分析成为文献计量和知识计量重要的方面。在引证行为中,涉及两个基本单元主体,即施引文献和被引文献,许多文献的引证与被引证组成了引证网络。


引证相关概念的关系


早在1965年,普赖斯创造性地展示了文献引证之间的复杂关系。如上图所示,箭头指向施引文献,箭尾指向被引文献,图中的各概念都是相对文献A来说的。此外,引证模式也具有不同层面,以文献之间的引证关系为基础,可以扩展到作者、机构或单位、期刊、国家或地区等不同层面的引证关系,各种基本单元之间组合可组成更复杂的关系,如作者关键词同被引、作者期刊共引、高被引作者与高产作者互引等。


引文分析乃是当今世界上最富声望的科学计量技术。

——著名科学计量学家布劳温(Braun T)



引文分析


引文分析法,就是利用各种数学及统计学的方法进行引文数据的比较、归纳、抽象、概括等,对科学期刊、论文、著者等分析对象和知识单元的引用和被引用现象进行分析,以揭示其数量特征和内在规律的一种文献计量研究方法。


引文分析领域大致可以分为三个时期:


20世纪50年代至60年代,为引文分析学的初始形成期,加菲尔德研制SCI和普赖斯进行引文网络分析,开创了引文分析的先河,他们也因此成为引文分析领域的奠基人;


20世纪70年代至80年代,是引文分析的发展繁荣期,其重要人物有斯莫尔和麦克罗伯特,斯莫尔提出了共被引理论并详细论证了共被引方法,麦克罗伯特则对引文分析存在的问题进行了深入批判;


从20世纪90年代起,引文分析学进入了深化扩张期,各种引文分析理论有了进一步发展,通过引文分析可视化学科或领域结构有了较大的进展,重要的人物有怀特、麦肯恩和陈超美等,随着计算机互联网的发展普及,网络引文分析也成为引文分析的热点,同时是网络计量学的主要内容,其代表人物有英格沃森、塞沃尔与鲁索等。


文献引证关系具有一定的分布结构和规律性。对文献引文的分布理论和规律进行研究,可研究引文的集中与离散分布规律,以及增长与老化变化规律。


要对这些规律进行分析,主要涉及三种基本类型:


①从引文数量上进行研究,主要用于评价期刊和论文等;


②从引文间的网状关系或链状关系进行研究;


③从引文反映出的主题相关性方面进行研究。


常用的测度指标主要有引文率、影响因子、自引证率、自被引率、当年指标、引文半衰期、引文普赖斯指数、h指数、特征因子等;在对专业或学科结构和知识交流情况进行研究时,除用引用率外,还可用引文耦合、同被引和互引、直引等测度指标进行分析。引文分析的角度包括引文年代、引文语种、引文类型、引文国别、引文作者、引证经典著作等的分析等。


目前,引文分析主要集中在三个方面:


①对引证关系的分析。进而探究知识网络中知识交流和知识转移的情况和规律;同时也有基于引文分析角度,对学科的结构进行展示。这两方面对引文分析都在进一步深入,如研究施引和被引位置的分析、实际引用频次的分析,以及基于语义的引文上下文情境分析和全文分析等。


②基于引文分析的科学评价。引文分析在评价科学期刊、人才、机构等方面发挥重要作用,从简单的被引频次到相对引用量、从影响因子到特征因子(eigenfactor)、从单一考虑被引量到综合衡量犺指数等,目前方兴未艾。


③网络引文分析。随着互联网的普遍应用,网络引文分析成为新的热点,也是网络计量学的主要内容。网络引证关系相应地从传统文献与网络文献两个角度可分为四大类,即Print.-to-Print (P-P)、Print-to-Web (P-W)、Web-to-Print(W-P)、Web-to-Web (W-W),实际上网络引证复杂的关系远非这四种类型的简单区分关系,在一定程度上它们有交叉、重合和扩展。


Ding等提出下一代引文分析———基于内容的引文分析,从句法和语义水平分析引文,通过被引和施引两个角度,从全文层面,一方面研究引证的具体位置,另一方面关注引证的具体语义和背景信息,并且认为基于内容的引文分析将在以下方面得到广泛应用:引用动机分类、文献摘要、文献检索、文献推荐与预测、知识挖掘与可视化。


此外,引文分析的发展是横向扩展和纵向深入并存,引文分析不断改进已有分析方法、提出新的分析模型,同时也结合共词分析、社会网络分析和内容分析等方法。


但是无论哪方面,可视化都是引文分析研究的重要手段与结果展示方式,引文分析也是知识图谱研究的重要内容。



引文分析可视化


可视化具有的直观、形象等优势正好可以为以大量抽象的引文数据为基础的引文分析提供良好的展示途径。


大部分知识图谱绘制是建立在引文分析的基础上,特别是在知识图谱研究的早期,20世纪中期随着SCI等引文索引数据库的研制成功,为引文分析提供了极大的便利,基于引文数据的知识可视化研究开始兴起。


目前,引文分析可视化的研究主要是从时间序列和地理信息两个方面展开的。


①基于时间序列的引文可视化研究。例如,20世纪60年代早期,加菲尔德等利用SCI数据,开始了系列引文分析的开拓性研究,如在《应用引文数据撰写科学历史》中绘制了DNA 研究领域的历史发展图谱,随后他开发了引文编年可视化软件HistCite,目前该软件仍是进行信息检索和学科结构展示的重要工具。此外,普赖斯用相同的数据在他一系列经典著作——《巴比伦以来的科学》《小科学,大科学》《科学文献的网络》中,进行了知识图谱绘制的开创性工作,如使用曲线图展示文献的指数增长现象。


②而基于地理信息的可视化分析。主要通过文献中作者和所属国家、机构的信息关联起来,可视化地展示不同地理位置的施引和被引情况,从而从不同层面直观地展示知识交流和转移的空间分布情况,往往与地理信息系统相关软件结合进行应用。


可视化引文分析严格说来就是可视化引文关系,即利用信息可视化技术,通过计算机系统设计软件与工具,对引文分析的结果以各种图形进行显示,使得引文及其相互关系直观地展示的过程。


随着计算机技术的发展,引文分析博采统计分析、矩阵分析等数学方法,吸收采纳可视化技术,发展成可视化引文分析,以图形的方式显现引文分析的结果,使得这一方法实际应用更加易于被人接受和理解。


随着计算机的深入应用和各种作图软件的涌现,引文可视化展示所应用的图形也经历了一个从简单到复杂,从平面到立体,从估测到准确计算的过程。


按照对不同的引文分析类型进行可视化显示所采用的图形进行归纳有:对直接引用关系进行可视化显示的图形(引文编年图、矩阵表示法“蝴蝶”表示法);对同被引分析可视化进行显示的图形(聚类树图、二维平面图、三维立体彩色图)等。


其实,从另一角度,引文可视化展示可分为两种:一种是对直接引用关系的展示;另一种是引证关系网络的展示。


除同被引外,还有文献耦合和文献的互引关系网,这些既可以通过一般的二维、三维图形和树形图进行展示,也可以通过模拟自然和社会界形成隐喻图像。



本文由刘四旦摘编自杨思洛等著《中外图书情报学科知识图谱比较研究》一书。


ISBN 978-7-03-045714-1


《中外图书情报学科知识图谱比较研究》从中外对比视角,在对知识图谱理论、方法.应用系统把握的基础上,绘制了图书情报学科合作模式、引证模式、学科结构、研究趋势四个方面内容的系列知识图谱,深入探讨新时期中外图书情报学科知识图谱的异同及促进策略,为科学知识图谱研究的完善及图书情报学科的发展提供科学依据和实例。



用您的手指点亮科学!

欢迎转发分享朋友圈,

您的鼓励是我们前进的动力!

点击“阅读原文”可购买本书。

【声明】内容源于网络
0
0
科学出版社
传播科学,创造未来。
内容 3026
粉丝 0
科学出版社 传播科学,创造未来。
总阅读1.6k
粉丝0
内容3.0k