1. 研究目的与意义、国内外研究现状(文献综述)
1.1 课题意义
知识图谱,以关联数据集知识库为基础,对数据资源进行整理分析,确定关系网络,再通过可视化技术,将知识之间的关系描述出来。知识图谱本质上是语义网的成果之一。目前随着语义web资源的增长、rdf数据的快速传播、linking open data (lod)等工程项目的实施,internet从仅包含网页间超链接的文本向万维网中包含大量描述实体与实体之间的关系的形式转变。最近,知识图谱也被使用在语义知识网络(web of data)中[1]。语义知识网络的核心要义是以图形的方式向用户返回经过加工和推理的知识,而知识图技术则是实现智能化语义检索的基础和桥梁,尽管传统搜索技术能够根据用户查询快速排序网页,提高信息检索的效率,然而这种网页检索效率并不意味着用户能够快速准确的获取信息和知识。对于搜索引擎返回的大量结果,还需要人工排查和筛选,随着互联网信息总量的爆炸性增长,这种检索方式已经很难满足人们全面掌控信息资源的需求[1]。
到目前为止,语义知识网络的思想只是被部分实现。特别是关联数据的思想已经获得突破性进展,这促进了w3c标准资源描述框架下(rdf resource description framework)的数据互联与推广。本次课题研究的意义在于分析知识图谱存储与搜索的关键技术,了解知识图谱的使用原理,并通过现有技术对知识的性能进行提高,以优化查询。
2. 研究的基本内容和问题
2.1 研究目标
rdf三元组(rdf triple)。给定一个uri集合 、空结点集合 、文字描述集合 ,一个rdf三元组 是形如 的三元组。
rdf数据图(rdf data graph)。rdf数据图 是一个三元组 。
3. 研究的方法与方案
3.1 研究方法
1) 研究方法主要从理论入手将知识图谱相关理论知识内容研究透彻,为下一步研究奠定基础。
2) 再进行软件环境的搭建,在搭建的过程中,研究并总结不足与发现,并充分利用现有资源进行学习。
4. 研究创新点
1) 完成rdf关系数据库的存储。
2) 使用sparql完成关系数据库的查询。
3) 完成图数据库与rdf数据库的对比。
5. 研究计划与进展
1) 2017 1.1-2.1 进行理论知识的学习,将本次实验的框架搭建起来。
2) 2017 2.1-2.15选择合适的数据集完成初步的数据分析。
3) 2017 2.16-3.10完成初步的数据分析。
