基于Bi-LSTM的数字人文研究方法抽取研究开题报告

 2022-01-31 09:01

1. 研究目的与意义、国内外研究现状(文献综述)

数字人文是计算机学科和人文学科交叉研究的一个新领域,由计算人文和人文计算领域发展而来。近年来,随着数字化环境的发展,数字人文及大数据的出现使人文学科的研究发生了深刻的变化,大数据正在掀起一场思维模式和数据技术的革命,给数字人文研究带来新的思维模式、研究视角与实现方式。本文以web of science核心数据集为来源,运用文献计量方法,结合可视化分析工具,对数字人文研究文献中涉及的研究方法进行抽取和统计分析,分析数字人文研究的前沿和热点领域,明确演化路径和发展趋势。

国外数字人文的研究早已形成非常清晰的学术共同体。各种数字人文研究学会和专门的研究机构在国外已经非常普遍。多项数字人文研究项目和成果获得了国家层面的资助与学界的广泛关注,并取得了较大的反响。现在该研究领域形成了一个国际数字人文组织联盟(the alliance of digital humanitiesorganizations),由人文计算领域影响力最大的三个组织组成:文学与语言学计算协会(association for literary and linguistic computing)、人文领域计算机应用联合会(the association for computers in the humanities)和数字人文学会(the society for digital humanities)。该联盟每年召开一次数字人文年度大会,由北美和欧洲的高校和研究机构轮流举办。从数字人文的实践来看,全球范围内的数字人文研究中心已经不下50家,主要集中在欧美日等发达国家,其中较为知名的研究机构有:伦敦国王学院的人文计算研究中心、美国斯坦福大学的人文实验室、马里兰大学的人文技术研究机构、伊利诺伊大学的科学与学术情报研究中心以及日本立命馆大学的京都数字文艺研究中心等。很多项目和研究机构都得到了国家级和专业机构的基金资助。

“数字人文”这个概念在国内尚是一个新鲜的术语概念。据中国教育部社科司统计,大陆教育系统内有729家人文研究机构。但是到目前,专门的数字人文研究中心只有武汉大学2011年刚成立的一家。中国国家自然科学基金和国家社会科学基金及教育部人文社科基金尚未资助过以“数字人文”为主题的研究项目,目前也没有以“数字人文”为主题的连续性研讨会。尽管没有使用“数字人文”的名称,许多高校和研究机构早已开展了“数字人文”研究,如中国社会科学院的地理信息服务平台系统;南京师范大学虚拟地理环境实验室的华夏家谱gis平台;中国艺术研究院的西北人文资源环境基础数据库;北京大学的中国基本古籍库;首都师范大学国学传播中心的古籍电子定本工程等。这些数字人文项目为人文学科提供了基础数据保障和简单分析工具,大大方便了人文学科的研究过程。可见在数字图书馆建设浪潮的推动下,大陆的数字人文项目尤其是人文资料专题数据库建设取得了非常突出的成绩,且大部分人文学科已经采用计算机技术和网络技术进行人文资料的数字化整理、分析和展示。但是就现状来看,对相关信息技术的使用还处于比较初级的水平。大部分的项目还停留在传统文本的数字化、数字作品的保存和简单分析与展示层面,尚未有项目针对已有的海量人文资源,挖掘其中更深入的知识和模式。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容和问题

本研究通过量化数字人文的方法,从web of science上下载题录,抽取数字人文期刊中提及的研究方法,对这些研究方法进行挖掘和可视化分析,得出实验结果呈现的规律。

拟解决的关键问题:分析与挖掘与实时分析统计紧密关联,实时统计是分析与挖掘的基础。

以词条及词频时间分布为视角的数字人文利用分宏观层次与微观层次,宏观层次用于宏观趋势、规律的呈现,微观层次则用于具体信息考证及例证。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与方案

实体抽取方法:是基于角色标注算法自动识别命名实体,通过对语言规律的理解和科学预测,智能识别文本中出现的人名、地名、时间、事件及文章的主题关键词。

数字人文方法:是一种将现代信息技术方法与传统人文社会科学研究相融合的新兴研究方法,研究离不开计算机处理等技术手段,计算机技术的参与才能更好地推动语言学的发展。

文献计量法:是一种对学科领域研究文献各个方面和整体进行定量化研究的方法,有助于揭示其发展规律。知识图谱能够通过共引分析和共现分析,以可视化的形式呈现某一领域在一定时期内的研究热点、演进历程和发展趋势。利用sati32、citespaceiii 工具对国外数字人文研究论文的时间分布、学科与主题变迁、研究热点等进行定量统计与定性分析,尝试以动态清晰、直观形象的方式全面解读数字人文领域的发展趋势、研究进展、热点前沿、学科知识结构及其动态演化关系。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究创新点

本研究的特色就是旨在从数据的新角度帮助大家理解关于数字人文的一系列问题。尽管量化研究存在误差而且只能通过数据对这些问题进行统计表述,但它们可以成为定性研究有力的数据线索,同时从宏观和个案角度为我们了解学科领域和学者群体奠定客观基础。站在“数字”和“人文”两个领域的十字路口,研究着这一双向关系中的联系和差异,探索着其学科目标和本质在当前数字时代的定位。

需要承认的是,量化研究也有许多局限性。高度跨学科的数字人文领域有很多无法用数据分析来解决的矛盾。虽然量化可以展示数字人文的主题分布、揭示“数字”和“人文”的占比,但不能仅仅依靠统计来解决真实环境下更加复杂的数字人文争论和批评,例如,仍有待加强的多样化学者群体和研究内容、对实事政治的较少关注、研究和教学的不平衡、仍需拓宽的开放存取的版权意识,以及对高科技高资金项目的趋之若鹜。

为适应数字人文的发展潮流,人文学、社会学、计算机科学等相关学科需要建立对数字人文更全面的理解。这样不仅可以避免人文学与大众化的数字应用社区隔离开来,也可以使计算机学者获得必备的人文学应用知识,并依此迎接新技术新思路的来临。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 研究计划与进展

2019.12.10—2020.01.09 完成开题报告

2020.01.10—2020.03.15 完成论文初稿、中期检查

2020.03.16—2020.04.09 修改完成二稿

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。