1. 研究目的与意义
1.1研究背景
人工智能的历史源远流长,在古代神话中,技艺高超的人可以制造机器鸟并为其赋予低能或意识。现代意义上的ai处于朴素阶段便是用机械符号处理的观点解释人类思考的过程。在20世纪40年代基于抽象数学推理的可编程数字计算机的发明使一批科学家开始讨论电子计算机的可能性。
1956年开始,在在达特茅斯学院举行的一次会议上正式确立了人工智能的研究领域。当时的很多参与者都认为,经过一代人的努力,与人类具有同等水平的机器会出现,同时上千万美元被投入到ai研究中。但是这条路并不好走,初期人工智能的方向由于计算机运算能力的限制、计算复杂性的指数爆炸、常识推理和莫拉维克悖论。初期人工智能一度陷入谷底。
2. 研究内容和预期目标
2.1研究内容
本课题的研究主题是深度学习算法、自然语言处理和信息检索的知识,在此基础上让自身对整体的机器阅读理解环境有所了解。之后将致力基于match-lstm基线模型和中文机器阅读理解数据集dureader进行研究和处理。dureader数据集提供了来源于百度搜索引擎和百度知道问答社区的实际数据,其数据都是由人类回答的。数据集中包含大量之前很少研究的是非和观点类的样本,而且每个问题都对应多个答案是目前最大的mrc数据集。通过构建网页的形式将系统分为数据处理后端和用户交互前端,前后端分离构建。前端使用vue.js框架,提供良好的用户交互环境和优秀的画面展示,使得用户能够在优秀的画面展示下加深对人工智能算法的印象。后端使用python的flask框架完成基于restful风格的api接口提供使用,将数据置于flask框架中基于python的tensorflow机器学习框架中处理。
3. 研究的方法与步骤
3.1研究方法
本课题主要是针对于现有的数据集dureader和match-lstm基线模型开展研究,故研究方法将围绕其内容和深度学习算法而展开,以其内容研究为主,人工智能的发展史和现有的多种著名算法为辅做到知其然,知其所以然。在了解算法核心的基础上,再研究现有的机器阅读理解模型。
3.2研究步骤
4. 参考文献
[1] hochreiter,s. and schmidhuber,j.long short-term memory[j].neural computation,1997
[2]weihe,kailiu,jingliu,yajuanlyu,shiqizhao,xinyanxiao,
yuanliu,yizhongwang,huawu,qiaoqiaoshe,xuanliu,tianwumhaifengwang.
5. 计划与进度安排
(1)1月11日至2月15日分析课题,查找资料。
(2)2月16日至2月28日完成需求分析。
(3)3月01日至3月16日完成开题报告。
(4)3月17日至3月26日完成数据分析。
(5)3月27日至4月05日完成软件设计。
(6)4月06日至4月13日完成软件主框架的设计与搭建。
(7)4月14日至4月28日完成软件的编码工作。
(8)5月01日至5月08日完成软件后期的修改、测试、运行。
(9)5月09日至5月30日完成毕业论文的撰写。