科研评价中的机构名称规范化研究开题报告

 2022-01-29 19:03:16

1. 研究目的与意义、国内外研究现状(文献综述)

随着改革开放的深化和高等教育的进一步发展,处在经济时代的我国高等学校将迎接着更大的挑战"科学研究已提到了极其重要的地位,单纯以培养人才为目标的大学已不能适应社会的需要,教学与科研相结合,二者要并重,为社会输送合格人才和提供科技等方面的服务"提高科研创新实力是促进高校改革与发展的关键,而建立科学的高校科研评价体系是加强高等学校科研管理和提高学术水平的重要举措[1]。而在科研评价中需要区分每一个高校的科研产品,需要对大量的高校科研产出进行准确的分类,本文通过对文献作者机构进行识别与规范来区分科研产品的归属,主要是将同一机构的多个不同机构名称相互关联起来,实现英文机构名称的统一化与规范化,提高科研评价者的工作效率。

目前,国内不少研究者从机构名称规范化研究方面对科研评价进行研究,建立机构名规范标准成为机构名规范化的前提,机构名称规范化首先需要制定机构名的规范标准,如《团体名称界定范围与标目结构》、《中国规范记录格式》、calis联合目录规范格式,通过规范标准让机构名称数据在著录和检索过程中得到规范控制[2];其次就是构建机构名称数据库,如万方只是服务平台的中国科研机构数据库、全国组织机构代码信息数据库等。这些数据库收集了海量的机构信息,其中包括机构名的简称、别名、简介、机构类型与网站链接等,为科研评价者以及其他各领域的用户提供了一个相互交流合作的平台[3];最后则需要建立一个机构名称规范化文档,通过建立统一的机构名称规范文档,将同一个机构的别名、更名以及简称等添加到规范文档中,用其中的一个使用频次最高的机构名对同一机构的其他不同表达形式进行关联,从而达到对机构名称的唯一性标识的目的[4]

在机构名识别方法方面,更多学者使用模板匹配,主要是对机构名称的组成识别,并基于机构名称的模板来对机构名进行模板识别,目前,机构名称的形式越来越多,使用模板识别的时候需要大量的匹配模板,将会导致模板匹配的准确率下降;由于同一个机构名多种不同标识的出现,便出现了编辑距离、层次条件随机场等来识别机构名称是否属于同一个机构的标识。国内主要是通过对中文机构名称的识别以及规范化来辅助科研工作者对机构的评价。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容和问题

本文主要是英文机构名称的研究和识别为基础,探索英文文献中机构名称规范化的方法与流程,研制出一套基于向量空间模型和邮政编码的机构名称自动识别算法,通过算法对上述机构名称数据数进行识别,并将同一机构的不同机构名标识进行统一规范,建立同一机构不同名称之间的相互映射关系,形成初步的英文文献机构名规范化数据库,实现不同的英文机构名称之间的统一化与规范化,方便一次性检索同一机构下所有的科研产出,提高对科研人员以及科研机构评价的准确率,优化科研评价系统的功能,满足用户评价的多层需求

随着我国的科研事业的迅速发展,文献数据也急剧增长。通过人工的方式检测和识别机构名简称和别名之间的关系,建立机构名规范化数据库已经成为了不可能的事情,一是以人工的速度难以满足快速发展的科研评价的需求,二是人的工作精力有限,难以精确的从大量的机构数据中找出某机构名称的所有形式。在这样的情况下,本文研制了使用空间向量模型配合邮编号对机构名称自动识别的算法,构建机构名称数据规范文档,来辅助人工完成对机构名称规范化的工作。

3. 研究的方法与方案

本文使用到的工具有:

1)机构名称信息数据库(access数据库)

2)eclipse开发工具

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究创新点

与前人比较,本文在向量空间模型和邮政编码自动识别机构名称方法的基础上,提出了抽取和识别机构名称的方法,并编写了英文机构名称自动识别算法,通过算法来实现同一机构名的多种不同表示形式之间的关联关系映射,这样提高了科研评价工作者对机构以及该机构中的科研人员的评价效率。通过实验证明该算法对英文机构名称的识别能力有了明显的改善,因此识别的准确率方面也得到了相应的提高。为了探讨自动识别结果的正确率和召回率,得出适合用于科研评价中的规范化应用中,本文获取了1500篇的英文文献中的3051条机构名称数据,通过自动识别算法处理后得到101组相同机构名,其中识别正确的机构名称有91组。在通过人工对3051条机构名称数据进行审核的到113组相同机构名,然后算出了正确率和召回率分别为90.1%和88.3%,由此可以看出,采用本算法对WOS数据库中的英文机构名称识别,能够减少机构名称识别的误差,降低英文机构名称识别的出错率,还可以尽可能的避免人工查找机构名称时造成的遗漏,提高英文机构名称识别的召回率和检准率,有利于降低人工成本,提高科研评价者的工作效率。

5. 研究计划与进展

2014年

2月10日至2月20日:大量阅读科研评价和机构名称规范化相关的期刊与博硕士论文;

2月20日至3月1日:拟定论文综述;

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版