1. 研究目的与意义(文献综述包含参考文献)
文 献 综 述文 献 综 述一、引言2016年,随着alphago以四胜一负的成绩击败围棋世界冠军李世石,强化学习,特别是深度强化学习方法,在世界范围内引起了巨大的轰动,引起了全世界的关注[1]。
深度强化学习(deep reinforcement learning: drl)通过端对端(end-to-end)的学习方式,实现从原始输入到输出的直接控制,广泛应用于处理高维度原始输入数据,并进行控制决策的任务中。
在博弈类游戏[2]中使用机器学习算法训练的程序最早的是 td-grammon[3]。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
2. 研究的基本内容、问题解决措施及方案
一、 本课题要研究或解决的问题1、 学习和掌握python语言及开源机器学习库pytorch的基本使用方法;2、 学习和掌握强化学习中的q-leaning算法,特别是dqn算法;3、 利用pytorch框架,编写相关算法的实现程序;4、 针对特定的游戏,编写相关程序,将算法应用于程序控制,实现游戏博弈的智能控制;5、 进行成果展示,完成学位论文的撰写。
二、 拟采用的研究手段(途径)1、 查阅相关文献掌握机器学习中的q-learning和dqn算法, 熟悉其基本原理以及相关算法实现。
2、针对贪吃蛇游戏规则和特点,搭建游戏环境,选择算法模块,设计可以进行自我学习的贪吃蛇系统,无须人为干预,可以通过强化学习,获得更高的分数。
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
