古籍中异体字现象研究–以《方志物产》广西分卷为例开题报告

 2022-01-21 21:27:16

1. 研究目的与意义、国内外研究现状(文献综述)

1、本课题的意义:本文以《方志物产》广西分卷为例,采用轮排算法梳理归纳了《方志物产》中所记载的异体字现象,根据轮排结果分析异体字在《方志物产》中的类型及成因,并通过构建对照词典进行异体字自动替换以实现物产名称的规范化,顺应当今数字化发展的时代潮流。

2、国内外研究概况:我国古籍文献种类繁多、规模宏大,是我国独一无二的文化瑰宝,但在其传播和传承的过程之中,由于岁月的变迁和侵蚀,最初的载体形式正慢慢地走向老化,许多古籍面临着毁于一旦的危险境地。

值得欣慰的是,近年来,随着计算机技术的迅猛发展以及数字人文研究领域的兴起,古籍的呈现模式打破了以往纸质文献的束缚,正朝着数字化的方向发展,越来越多的古籍文献被开发建设成了数字化资源库,研究人员可以直接通过计算机调用这些数字化资源,就能对古籍进行分析和研究,大大提高了以往的工作效率。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容和问题

1、研究目标、内容:本文将以《方志物产》广西分卷为例,着重研究异体字现象,从异体字的概念、类型、成因等角度归纳异体字,并尝试解决异体字问题。

通过轮排算法对语料进行分析,发现并分析异体字出现的现象及规律,构建正异对照词典,并以此为参考依据,利用程序将异体字自动替换为正体字,同时测试该编程系统转化的查准率,以达到批量化规范异体字的目的,方便古籍的阅读和进一步研究,顺应当今数字化发展的时代潮流。

2、拟解决的关键问题:轮排算法的设计;正异对照词典的构建;自动替换程序的设计。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与方案

1、研究方法:主要采用轮排算法对方志语料进行格式化处理,从而方便后续工作的分析。

2、技术路线:利用轮排结果对语料进行定性分析,从中归纳出方志中异体字的概念、类型以及成因等特性,为搭建正异体字对照词典做好理论准备;根据理论知识搭建好正异对照词典之后,编写异体字自动替换程序,以规范语料中各条物产信息存在异体字的现象,并统计出程序正确替换异体字的效率。

3、实验方案:随机选取20条物产条目进行测试,每一条物产条目都至少包含两种物产名称,并在括号内标明出现的次数,之后可重复上述步骤,再进行多轮测试,以得出最终系统测试的平均正确率。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究创新点

本文主要根据古籍中异体字的现象、类型、成因提出了异体字规范化的解决方案,通过轮排技术和构建正异对照词表进行异体字查找和自动替换,从而达到规范物产名称的目的,方便古籍的阅读和后续研究,进一步提高古籍数字化资源的统一性。

5. 研究计划与进展

2月下旬:阅读相关文献,为论文撰写工作做好理论准备;3.1-3.20:编写轮排算法,并完成语料的分析工作;3.21-3.31:理清异体字的概念以及异体字在方志古籍中的成因、类型等等特性;4.1-4.15:构建正异体字对照词典;4.16-5月中旬:异体字自动替换程序的编写以及论文的整体完善工作。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版