1. 研究目的与意义、国内外研究现状(文献综述)
课题的意义:
由于自然语言处理的复杂性,现有的基于关键字的搜索引擎无法较好的理解、处理自然语言问题。
1、无法全面准确理解用户搜索意图。现如今查询的关键不仅仅是简短的关键词组合,而是复杂、冗长、口语化的自然语言句子,传统的搜索引擎无法实现对用户语义信息理解,仅仅是信息的初加工。因此无法精准把握自然语言问句的准确含义,正确识别用户意图。
2. 研究的基本内容和问题
研究目标:
为科学高效地解决我国农户们在马铃薯种植管理方面遇到的问题,拟开展基于自然语言处理技术的马铃薯种植管理问答系统的核心技术研究。虽然不同的问答系统有差异,但是问题抽取和答案生成这两个方面具有重要意义。本研究主要解决的是在问答系统中问题抽取以及答案自动生成这两方面的问题。
3. 研究的方法与方案
研究方法:
(1)问题检索:在描述问题时,通过字符串匹配、单词顺序、语义来考虑,找到与问题p语义最相近的问题q。
(2)答案抽取:问答系统的返回给用户的答案需要满足准确性,简洁性的要求。由于答案抽取返回给用户最终结果,体现了问答系统的最终结果。答案抽取部分并不独立作用,需要根据问题分析与问题检索模块给出的信息共同进行分析。问题分析的好坏直接严重影响答案抽取部分的答案质量。
4. 研究创新点
特色或创新之处
1)基于网络爬虫技术,构建马铃薯种植管理的数据源;
2)利用自然语言处理技术,对问题进行分词,标注,关键词提取,构建更有效的查询请求;
5. 研究计划与进展
研究计划及预期进展
2019年 12 月 31日-2020年 1 月 5 日:查阅资料,确定毕业设计研究方向;有针对性的对该方向进行资料的查阅与收集,了解现如今课题研究现状及发展方向,与导师讨论确定毕业设计具体选题;学习相关技术,为开题做好前期的准备工作和相关计划,并且撰写开题报告完成开题工作。
2020年 1 月 6日-2020年 2 月中旬:对系统需要使用的关键技术进行深入学习,学习语言培养技能,进行项目已有模型的搭建,了解系统具体功能。
