基于知识图谱的西汉贵族氏族传承与演变研究——以“七王之乱”为例开题报告

 2022-01-31 09:01

1. 研究目的与意义、国内外研究现状(文献综述)

中国历史的传承以家族为核心,蕴含丰富的社会历史文化内涵,从多方面影响着社会的发展进程。从某种程度说,家族的兴衰折射着社会的兴衰。随着计算机技术和互联网的发展,利用数字媒介对历史学进行深入的分析、演示和研究活动成为一种全新历史研究的方法。本次研究借助计算机建立西汉贵族氏族知识图谱模型,采用知识图谱的理念展现西汉氏族人物之间丰富的亲属及社会关系,以记载家族血缘世系为核心内容,深入剖析,建立西汉人物关系网络,形成西汉特有的社会关系网,并使用数字可视化的方式展示西汉家族、历史兴衰动态变化的过程,方便人们追溯其传承与演变,发掘氏族文化的历史价值。对于深入了解中国社会与中国文化,透视中国社会的历史变迁,具有非常重要的意义。与传统计量史学不同的是,数字扩大了计量的内涵,展示了发掘新知识的方法,并创造了历史叙事和演绎的新形式,促成了史学研究从方法论到认识论的发展。

2012年,google率先提出知识图谱(knowledge graph)的概念。知识图谱由知识以及知识之间的关系组成。知识或者说实体的内特性使用属性—值对(attribute-valuepair,avp)来表示。知识之间的关系通过两个实体之间相连接的边来表示。这里的知识图谱,即knowledge graph,与最开始的用于可视化科学文献引用网络的知识图谱,即mapping knowledge domain,在概念上已经有了较大的变迁。随着不断的探索研究,知识图谱作为一种知识管理的新思路,已经不再仅仅局限在搜索引擎应用,在各种智能系统(如ibm watson),以及数据存储(如graph database,neo4j)领域。

目前,微软和谷歌拥有全世界最大的通用知识图谱,facebook拥有全世界最大的社交知识图谱,阿里巴巴和亚马逊则分别构建了庞大的商品知识图谱,百度致力于构建最大最全的中文知识图谱,美团nlp中心正在构建全世界最大的餐饮娱乐知识图谱“美团大脑”。对于历史人物关系及社会网络的研究,在国内,有着家谱知识库、古籍循证平台、名人手稿知识库等一系列数字人文项目。相关文献研究方面,北京大学严承希通过符号分析法对cbdb数据集中宋代人物政治关系进行可视化分析,中国社会科学院文学研究所刘京臣以cbdb、中华寻根网为例对明清进士家族进行研究,探寻其分属派系,细化姻亲、交游、师友等关系,借此挖掘构建了更为全面的家族世系图谱。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容和问题

目标通过对西汉贵族氏族信息进行有效的收集、分析,在现有的技术基础上,以血缘为纽带建立知识图谱,建立西汉人物关系网络,展现西汉氏族人物之间丰富的亲属及社会关系,并使用数字可视化的方式方便人们了解其家族的繁衍过程,了解西汉许多著名人物的姓名源流及历史典故、历史影响,了解西汉家族、历史兴衰动态变化的过程,方便人们追溯其传承与演变,发掘氏族文化的历史价值。

知识图谱中的内容以班固所著《汉书》为主要数据来源,《汉书》是我国第一部纪传体的断代史,主要记述了上起刘邦、下至王莽的二百三十年的历史。

本次研究将对书中内容进行人物名称实体抽取,将其中较为著名的历史事件(如“七王之乱”)中所涉及的相关人物作为实体,通过君臣,亲属(父子,母子,同族,翁婿),叛乱与平叛,杀与被杀等属性将各实体相连接。再从百度百科、知乎等搜索引擎中寻找相应该历史事件中开端,影响,结局,覆盖整个西汉时期,根据分析内容对事件的涉及人物进行延伸。选择了“全历史”网站作为辅助的资料来源,该里有较为完整的关系图谱,以及人物间关系查询。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与方案

知识图谱是人工智能领域一项重要的技术分支,通过事前抓取的知识库,将知识有序的组织起来,结合自然语言处理、机器学习、数据统计分析和大数据处理等技术来构建一个高效可靠的知识仓库,并以图的形式展示各个知识模块节点的关联性,从而让用户能更加快速、准确地访问自己需要的信息,实现语义检索。

对于以血缘为纽带建立的人物关系网络,需要展现西汉氏族人物之间丰富的亲属及社会关系,因而在其数据存储时,如果使用常规的关系型数据库,需要处理的数据之间关联关系较多,数据库会变得越来越庞大和复杂,因此本次研究通过neo4j图数据库,清晰展现对象之间存在的多种复杂关系,来实现知识图谱的可视化。

neo4j是一个高性能的nosql图形数据库,也是一个基于磁盘的、嵌入式的、支持海量数据的、具备完整acid特性和迅速图查询特点的java持久化引擎。neo4j的存储方式是:nodes(节点)和relationships(关系)。节点表示人物或实体对象,边用于表示实体间的关系,关系可以为双向关系或单向关系,同时可以在节点或边上添加响应的属性来补充说明实体与联系的相关信息。这其中,节点的类别、属性、边的类别属性等,都是分开存储的,这将大大有助于提高数据库的性能。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究创新点

采用知识图谱来对历史学的研究和实践加以计量,其所采用的研究视角、研究对象、研究方法都是在传统历史学的基础上进行拓展和延伸。体现了数字化社会浪潮中所建立的新的开放、高效、现代化的史学研究方法。

5. 研究计划与进展

已完成计划为:对《汉书》内容梳理完成,对《汉书》进行人名实体抽取,建立了关于“七王之乱”的事件相关人物关系表。

预期计划为:查阅爬取网站数据相关文献,尝试对“全历史”网站内容进行爬取,对数据库内容进行补充完善;参考相关“历史数字化”、“计量历史”有关的文献,尝试用不同的角度解读知识图谱。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。