全文总字数:5957字
1. 研究目的与意义(文献综述)
1.1研究背景及意义
自 然 语 言 处 理 ( n a t u r a l language processing,nlp)是研究人与计算机交互语言问题的一门学科。从应用的角度来看,自然语言处理可以分为自然语言理解技术和自然语言生成技术两个部分。自然语言生成技术广泛应用于自动问答、机器翻译和语音识别中,在近两年随着深度学习的发展也取得了很大的进展。而自然语言理解技术是让机器理解语言所要表达的含义,这也是学者们一直以来研究的重点和难点。
随着国家法制化建设工作的稳步推进,司法公开化的体制在逐步形成,越来越多的案件审判结果实现了透明化、公开化。现如今在中国裁判文书网、北大法宝等网站上都有着庞大的裁判文书数据库,这些裁判文书的公开为我们提供了丰富的数据来源。对于法律从业者来说,法律检索是必备的从业技能,能够迅速、准确、完整地检索出所需要的法律信息对案件审理来说至关重要。当前关于法律文书的检索服务大致可分为三类:(1)基于具体的裁判文书案号、案件名称的检索;(2)基于案件关键词的检索;(3)基于案例涉及到的法律依据的检索,例如《中华人民共和国民事诉讼法》第一百二十条;这三种检索服务的熟练掌握需要用户具备一定的法学专业素养。
2. 研究的基本内容与方案
2.1研究的基本内容及目标
(1)文本预处理
对文本进行分词、词性标注和命名实体的识别。然后去掉重复词、停用词,初步得到文本预处理的结果。
3. 研究计划与安排
(1)2020/1/13—2020/2/28:确定选题,查阅文献,外文翻译和撰写开题报告;
(2)2020/3/1—2020/3/15:文本预处理,实现分词,设计停用词表,去重、去停用词,构建法律词典优化分词结果;
2020/3/16--2020/3/29:研究并实现关键词抽取算法;
4. 参考文献(12篇以上)
[1]徐浩广. 基于自然语言处理的法务服务系统的设计与实现[d].中国科学院大学(中国科学院沈阳计算技术研究所),2018.
[2]向李兴. 基于自然语义处理的裁判文书推荐系统设计与实现[d].南京大学,2015.
[3]杨丽萍. 面向自然语言的法律检索系统的研究与实现[d].南昌大学,2016.
