1. 研究目的与意义
1.1时代背景
随着人工智能的飞速发展,其各项技术已经从各个方面深度融入人们的日常生活。人脸识别、语音识别、机器翻译、智能交互等等,在这一部分领域里相关技术已经走向成熟。但还有一部分领域仍在探索攻坚阶段,譬如近期火热的机器阅读理解。该任务要求研究人员构建机器学习模型对文章和相应问题进行语义理解,并最终拟人化地给出相应问题的答案。机器阅读理解研究的深入,不仅是开启ai时代的理解力的加速器,更能将人机交互的范围不断扩大,机器智能可以开始捕捉人类的逻辑并挖掘深度的语义。
1.2现状
2. 研究内容和预期目标
本课题主要研究基于注意力机制的机器阅读的实现。
机器阅读是自然语言处理的一个火热的子项目,它的实现方式多种多样,各基于不同的模型,本课题主要研究的是基于注意力机制。注意力机制是从人的注意力机制而得名,人可以用有限的注意力更多的集中在焦点上,从而获取更有效的信息。因此该机制的核心就是从众多的信息中筛选出最有效的信息,而剔除无用的信息。
本课题的预期目标是基于bidaf基线模型对中文机器阅读理解数据集dureader进行研究和处理。就是像英语的阅读理解一样,对给定的文章,机器能够通过阅读后筛选出问题的正确答案。
3. 研究的方法与步骤
本课题拟采用文献研究法,实验研究法来完成。
1)文献研究法:首先,机器阅读是自然语言处理的子项目,所以要先研究自然语言处理的发展,了解自然语言处理的方法;然后进一步探究机器阅读所采用的不同的研究方法、各种不同的模型框架;最后明确本课题所要采用的方法和所要完成的目标。
2)实验研究法;在明确了所要完成的目标和要使用的方法后,搭建所需要的平台,主要使用python语言来进行操作。而bi-directionalattention flow模型则是本课题重点关注的内容,然后完成文本的向量化,提取出问题的答案。
4. 参考文献
[1]奚雪峰,周国栋.面向自然语言处理的深度学习研究[j].自动化学报,2016,42(10):1445-1465.
[2]王亚珅,黄河燕,冯冲,周强.基于注意力机制的概念化句嵌入研究[j/ol].自动化学报:1-11[2019-03-15].
[3]陈肇雄,高庆狮.自然语言处理[j].计算机研究与发展,1989(11):1-16.
5. 计划与进度安排
(1)1月11日至2月15日分析课题,查找资料。
(2)2月16日至2月28日完成需求分析。
(3)3月01日至3月16日完成开题报告。
