基于lucene的论文检索系统开题报告

 2021-08-08 20:29:48

1. 研究目的与意义

毕业论文是高校本科教学计划中最后一个综合性实践教学环节,也是学士学位评定的重要依据。

然而随着互联网的普及,信息化技术水平的飞速发展及网络拥有的强大搜索功能,也为大学生抄袭论文提供了一大捷径,使得毕业论文质量呈现严重下滑趋势。

本文研究和分析了开源的搜索引擎工具lucene的原理,将lucene技术应用于毕业论文检索系统中,对上传论文的相似性进行检测,及时发现抄袭论文,防止学生抄袭,进而提高论文质量。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 国内外研究现状分析

全文信息检索是网络检索的发展方向之一,它以全文数据库的存储为基础。

全文检索技术可以对各类数据(文字、声音、图像等)按照其内容而不是外在特征来实现信息的检索,本文只研究针对文本数据的索引和检索。

全文检索技术最早于1959年出现在美国匹兹堡大学(university of pittsburgh)的法律情报检索系统中。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的基本内容与计划

研究内容:本毕业论文的内容为使用lucene工具设计并实现一个论文检索系统,系统的主要功能包括论文信息导入、论文索引建立,论文全文检索等。

研究计划:1.准备工作阶段:阅读基于lucene工具开发使用的相关资料,了解开发的基本知识; 2.设计开发阶段:相应数据处理计数的选择,规划表单,完成应用的功能和交互设计,并完成应用开发工作; 3.撰写论文阶段:根据前期的设计以及最终实现的功能,完成论文的撰写工作,详细描述应用实现的功能,并对论文中的图表按照论文格式进行调整和编号; 4.论文交审阶段:完成论文的提交,审核和答辩。

具体时间安排:学习关于lucene工具的使用处理(1~2周),表单、应用功能和交互的设计(3~4周),代码编写(5~7周),应用的测试与改进(8~9周),论文大纲和草稿的撰写(10~11周),论文初稿的撰写完成(12~13周),论文初稿的修改与完善(14周),完成论文的提交、审核和答辩(15周)。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究创新点

1、在Lucene中扩展多种格式文档处理模块,使其可以对多种常用文档格式进行处理,如Word格式、PDF格式等。

2、对Lucene进行扩展,增加中文分词模块,提高了Lucene对中文识别能力。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版