高被引论文的影响力变化研究开题报告

 2022-01-16 19:33:15

全文总字数:5079字

1. 研究目的与意义、国内外研究现状(文献综述)

本课题的意义、国内外研究概况、应用前景等(列出主要参考文献)

1 课题意义

在文献计量学领域中,引文分析是一种十分重要的研究方法。传统的引文分析一般只针对被引文献的被引频次来评价文章、作者及机构的影响力[1]。在传统的引文分析中,无论来源文献在施引文献中被提到过多少次,被引文献的被引频次只被记为一次,被引频次相同的文献具有相同的影响力。然而,这种分析方法很难全面的揭示文章的被引用情况,因为它忽略了文章的不平等贡献,尤其是高被引论文的情况。事实上,如果有两篇被引频次相同的文献,它们在施引文献中的引用位置、引用强度、共被引及引用主题等方面的被引用情况不同,那么它们的影响也可能不同。因此,基于引文内容的分析方法就显得尤为重要,它可以解决单纯利用被引用次数带来的只重数量不重内容的问题[2]

一、 高被引论文指的是被引频次相对较高的学术论文,学术影响力十分大 [3]。对高被引论文的引用内容分析可以探究其如何影响一个学科领域以及它的影响力如何随着时间发生变化。了解一篇论文的影响是如何增长、扩散和减弱十分重要,它可以促进学术交流和理解研究废弃趋势、检测不同领域和影响因素的影响变化以及区分论文的影响[4]

二、 2 国内外研究概况

国内外研究者们往往会引用具有较高影响力的高被引论文,但是对于高被引论文的影响力研究以及高被引论文的影响力动态变化研究还不是很多。

在对高被引论文的研究中,主要分为对高被引论文的传统计量研究和内容分析研究。韦忠明[5] 统计了2011年版14种高等教育核心期刊2006-2010年历年高被引论文,分析了其机构、作者、地区、发表期刊、主题等情况。陈松青[6]研究了2008-2014年出版的19种图书情报学核心期刊的高被引论文,对其期刊、作者、机构、发表年份、研究主题等信息进行了统计,揭示了近期我国图书情报学高被引论文的主题特征及学科前沿热点。Ho[7]分析了Web of science数据库中1856-2011年间社会科学领域被引次数≥50次的论文的传统计量指标以及研究了高被引论文的引文生命周期。Kolle[8]统计了1961-2014年发表的园艺学领域高被引论文的作者、国家、机构等特征,通过分析文章的生命周期,得出大多数园艺学领域高被引论文在出版十年内被引用次数较少,之后被引次数有所增加的结论。

在国内,张磊[9]通过抽取引文关键字对档案学高被引论文进行主题识别,得到我国档案学高被引论文的研究主题。随鑫和王念祖[10]以2009-2013五年间中文社会科学引文索引(CSSCI)收录的图书馆情报学高影响力论文作为研究对象,采用内容分析法对其主题、关键字共词频次进行分析,得到这五年间我国图书馆学情报学的研究热点。刘盛博[11]等人以2014年诺贝尔生理学或医学奖获得者J.O Keefe的高被引论文为实例,从引用内容的主题和功能两方面对论文的影响力进行分析。彭年冬和谢珍暖[12]采用内容分析法和依据论文关键字为基础确定对19种图书情报核心期刊的高被引论文的论文主题,探究其主题分布。在国外,Lu[4]等人认为研究者们只引用高被引论文,并未研究高被引论文对引文的影响,他们采用基于内容的引文分析方法研究了一篇发表于2005年被高度引用的论文,赫希的“h指数”文章,从引用次数、引用位置、引文主题、引文共被引等方面跟踪了其2006年-2014年以来文章影响力的动态变化。此外,研究者们探究了高被引论文的引用行为,发现相比于一般论文,高被引论文的参考文献数量更多,并且更倾向于引用影响因子高的期刊及期刊论文[13-17]

3应用前景

传统的引文分析手段不能衡量引文随着时间推移的影响,而用基于内容的引文分析方法,可以从多个角度分析探究高被引论文的影响力动态变化。该方法不仅可以揭示了某领域高被引论文的影响力随着时间推移所产生的动态变化,还可以为其他领域高被引论文的研究提供一定的参考。同时,未来可以进行更大规模的研究。这些研究可以提供一种新的方法帮助我们评估被高度引用的文章,并促进更好的学术沟通和理解随着时间的推移的过时研究。随着未来科学知识和技术的不断进步,这种研究的重要性将进一步增加。

参考文献

[1] 赵蓉英,曾宪琴.全文本引文分析—引文分析的新发展[J].图书情报工作,2014,58(9):129-135.

[2] 胡志刚.全文引文分析方法与应用[D].大连:大连理工大学,2014:2-3.

[3] Moed HF. The impact-factorsdebate: The ISI’s uses and limits[J].Nature,2002,415(6873):731-732.

[4] Lu C, Ding Y, Zhang CZ .Understanding theimpact change of a highly cited article: a content-based citationanalysis[J].SCIENTOMETRICS, 2017,112(2):927–945.

[5] 韦忠明.我国高等教育核心期刊高被引论文统计与分析[J].高教探索,2013(1):144-147.

[6]陈松青.国内图书情报学核心期刊高被引论文统计分析[J].情报探索,2016(3):42-46.

[7]Ho YS. Classicarticles on social word field in Social Science Citation Index: abibliometric analysis[J]. SCIENTOMETRICS,2014,98(1):137-135.

[8]Kolle SR. HighlyCited Articles in Science Citation Index Expanded – Subject Category ofHorticulture: A Bibliometric Analysis[J]. ERWERBS-OBSTBAU,2017,59(2):133-145.

[9]张磊.档案学高被引论文引用情感类型分析[J].档案管理,2014(4):22-23.

[10]隋鑫,王念祖.2009-2013年国内图书馆学情报学研究热点分析[J].情报科学,2015,33(10):61-65.

[11]刘盛博,王博,唐德龙,马翔,丁堃.基于引用内容的论文影响力研究——以诺贝尔奖获得者论文为例[J].图书情报工作,2015,59(24):109-114.

[12]彭年冬,谢珍暖.图书情报核心期刊高被引论文统计分析与研究[J].大学图书情报学刊,2014,32(4):88-93.

[13]梁春慧,孙艳,万跃华.高被引论文的参考文献特征研究——以化学领域为例的分析[J].科技与出版,2014(7):119-122.

[14]张立伟,姜春林,刘 学等.图书情报学高被引论文引用现象的实证研究[J]图书情报作,2014,56(16):116-121.

[15]张磊.档案学高被引论文引用情感类型分析[J].档案管理,2014(4):22-23.

[16]姜春林,刘学,张立伟.中文高被引期刊论文的参考文献也倾向于高被引吗?——以图书情报学为例[J].情报杂志,2015,34(1):105-109.

[17]孙海生,黄燕.引用内容分析法在领域发展轨迹研究中的应用[J].情报探索,2015(9):56-60.

2. 研究的基本内容和问题

研究的目标、内容和拟解决的关键问题

1 研究的目标

该研究旨通过引用内容分析法跟踪高被引论文的被引情况,总结出该领域高被引论文的影响力变化特点并为其他领域的相关研究做一个参考。

2 研究的内容

跟踪一篇某领域的高被引论文十年内的被引情况,采用基于内容的引文分析方法,从引用强度、引用位置、引用主题等方面探究其影响力的动态变化。

3 拟解决的关键问题

(1) 如何科学的选择研究样本

(2) 如何快速下载目标引文的施引文献全文

(3) 如何准确的手工标注引用内容

(4) 如何使用TFIDF算法抽取引用内容关键词

(5) 如何计算引用主题的相似度

(6) 如何分析高被引论文的被引情况及探究影响力变化

3. 研究的方法与方案

研究方法、技术路线、实验方案及可行性分析

1 研究方法

研究拟采用内容分析法对所选的高被引论文研究对象进行内容分析,分别从引用次数、引用强度、引用位置、引用主题相似度等方面进行统计分析,了解高被引论文的被引情况的变化,从而探究研究对象在某领域的影响及影响力的变化。

2 技术路线

(1) 选择一个领域的高被引论文

(2) 下载所选高被引论文的所有施引文献全文,剔除未获得全文的文献。

(3) 经过处理,提取引用信息,输入EXCEL表格中。统计引用数量、引用位置分布情况。利用TF-IDF算法进行引用主题的关键词识别,提取出各年前30主题词。

(4) 利用内容分析方法统计分析等方面,总结出数据收集阶段描述,探究高被引引文的影响如何随着时间变化。

3 实验方案

3.1 数据来源

Webof Science数据库

3.2 样本选择

i. 在年份选择方面,为了减少时间因素对研究结果的影响,可以选择同年的论文作为研究对象,又因为ESI目前的统计周期为2008-2018年,而2008-2018年可以保证一定的时间跨度,因此可以选择2008年的高被引论文作为研究对象。

ii. 在被引次数选择方面,样本的被引次数要求在1000次到2000次之间,这样既可以深入的探究高被引论文的影响力的变化又使不会研究工作量过大而影响研究进展。此外,还应注意目前样本论文的2018年被引次数还不代表最终结果。

iii. 在领域选择方面,因我校为南京农业大学,具有农业学科背景,所以选取一篇有关农业科学领域的文章进行研究会更加有说服力。

3.3 引用信息提取

i. 被引用数量

ii. 基于内容的引文分析

3.4 引用数据处理

被引次数、引用强度分布; 引用位置分布; 引文共被引;引用主题分布

4 可行性分析

l 技术可行性: 南京农业大学图书馆可以提供WOS的文献资源;python语言可以提取关键词及计算关键词相似度。

l 人员可行性:由于前序SRT项目就是采用基于引用内容分析的方法,对于数据收集、标注、分析都有一定的经验。

l 研究可行性:Lu等人曾做过类似的研究,可为本研究提供参考与启迪。

4. 研究创新点

特色或创新之处

传统的引文分析方法仅是依据被引次数来分析,会忽略引用的不同动机,而采用基于内容的引文分析方法,可以从多个角度探究引用行为的动机。高被引论文经常被引用,但是对高被引论文的影响力变化研究还没有很多,该研究基于内容的引文分析方法,并增加时序条件,通过跟踪高被引论文在一段时期内的被引情况,来揭示随着时间推移的高被引论文影响力动态变化。此外,农学领域还没有相关研究,该研究可以总结农学领域高被引论文的动态变化特点,为该领域的引用提供一定的参考。

5. 研究计划与进展

研究计划及预期进展

l 3.10-3.20课题申报、开题报告完成

阅读论文,和导师谈论,确定课题;

明确课题的意义、总结国内外研究概况、发现应用前景;

确定研究的目标、内容并列出拟解决的关键问题;

选择研究方法、设计技术路线、实验方案及进行可行性分析;

制定研究计划

l 3.21-4.20样本选择、数据收集结束

选择研究领域、筛选来源文献;

下载施引文献全文;

提取施引内容信息,确定研究数据集

l 4.21-5.20完成数据分析、论文攥写

利用EXCEL计算平均引用次数、平均引用强度、平均引用位置分布数;

编写TFIDF算法的代码,提取各年引用内容前30关键词,代表引用主题;

编写关键词相似度的代码,计算各年引用主题的相似度;

分析引用次数、引用位置、引用主题等引用情况;

根据研究情况攥写论文。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版