基于主述位理论的自动问答系统——问答系统设计及实现开题报告

 2022-09-09 02:09

1. 研究目的与意义

随着现在互联网的迅速发展,互联网上的信息越来越丰富,人们每天都通过互联网获取各种各样的信息来满足自己的需求。通常,人们依靠比如百度、谷歌之类的搜索引擎来获取自己所需要的信息,这些搜索引擎一般也能快速帮助人们找到相关的网页,我们只需要输入一些关键的字词,搜索引擎马上会找到大量的相关网页供我们阅读。

然而,这些传统的搜索引擎也存在很多的弊端。首先是传统的搜索引擎返回的是大量的相关信息,无法准确定位用户需要的信息。举个例子:在百度中搜索一个关键词,百度常常会给我们返回数千个甚至是数万个网页,我们想要找到自己所需要的信息还得自己去逐一浏览这些网页,这就会浪费我们大量的时间。其次,传统的搜索引擎仅仅以关键词匹配的形式去搜索用户需要的信息,不能理解用户真正的需求。有的时候,人们查找信息的需求并不一定能通过简单的关键词组合来表达自己的意图,因此,搜索引擎就更不能接收并理解到用户的意图,进而找出令用户满意的答案了。还有,传统的搜索引擎仅仅使用简单的关键词匹配的形式去查找相关信息,并不一定能理解用户的深层语义,而且一般同样的中文字词一般还含有多种意义,因而传统的搜索引擎有时检索的效果很难令用户满意。由此可见,传统搜索引擎已经不适应当前用户的需求,自动问答系统应运而生。

自动问答系统的历史起源于20世纪60年代,这时人工智能刚刚兴起,英国的数学家turing发表了一篇有关人工智能的论文“computingmachineryandintelligence”,在这片论文中,turing提出判断一台计算机是否有智能在于计算机是否能够像人一样与人对话,并且提出了一个实验来测试计算机是否有智能——图灵测试:在五分钟的时间内,如果被测试的计算机能够回答出由身为人类的测试者所提出的大量问题,并且其中有百分之30的测试者认为被测试者是人类,那么这台计算机具备了人的智能。此后,大量的研究者开始研究自然语言理解的技术,并以此来开发自然语言问答系统。然而在当时的技术条件之下,自动问答系统一般用于个别的应用系统中作为专家系统来使用,并不能全面应用在互联网中供用户使用。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究内容和预期目标

主要研究内容:构建完整的话题结构有助于实现自动问答系统所需要的5w要素,即what,who,where,when。本课题利用主述位理论构建的完整微观话题结构,基于自动抽取的新闻语料知识库,实现一个自动问答系统。旨在让用户直接用自然语言提问,对用户的问题进行处理,获取关键信息,依此去搜索语料库获取答案并且返回给用户。一般的问答系统包含三个主要模块,分别是:问题理解、信息检索和答案抽取。

用户向系统提出一个问题,首先由系统对用户提问的问句进行预处理,尤其是中文问句,需要对用户的问题进行中文分词和词性分析,然后再正式对用户的问句进行分析,理解用户提问的意图。比如处理一个问句“谁发明了电灯?”,需要知道用户的意图是在问人名who,进而对用户的问句进一步处理。在整个问题理解模块中,一般包括问题的预处理、问题分类、关键词提取及扩展。

进行过问题处理之后可以得到一堆的关键词及其拓展词,这些词语用于信息检索中,使用关键词及其拓展词来查找到相关的答案语料,并计算搜索到的答案语料的相关度,我们称之为答案语料的权重,根据权重对答案语料进行排序,将权重较大的答案语料提取出来转交给答案抽取模块。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与步骤

研究方法:调查法、跨学科研究法、文献研究法

步骤:

(1)1月15日至2月15日分析课题,查找资料。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1]鲁松,白硕,黄雄.基于向量空间模型中义项词语的无导词义消歧[j].软件学报,2002,06:1082-1089.

[2]俞士汶,朱学锋.关于汉语信息处理的认识及其研究方略[j].语言文字应用,2002,02:51-58.

[3]徐振宁,黄凯歌,张维明,陈文伟.ontology建模方法研究[j].计算机科学,2002,01:68-71.

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 计划与进度安排

(1)1月15日至2月15日分析课题,查找资料。

(2)2月16日至2月28日完成需求分析。

(3)3月1日至3月16日完成开题报告。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。