基于深度强化学习的掼蛋平台的设计与实现开题报告

 2022-04-15 20:05:24

1. 研究目的与意义

深度强化学习(drl,deep reinforcement learning)是深度学习与强化学习相结合的产物,它集成了深度学习在视觉等感知问题上强大的理解能力,以及强化学习的决策能力,实现了端到端学习。

深度强化学习的出现使得强化学习技术真正走向实用,得以解决现实场景中的复杂问题。

掼蛋是一种在华东为主,淮安以及周边地区广为流传的扑克游戏,起源于江苏省淮安市,故又称“淮安掼蛋“,是由地方的扑克牌局 “跑得快”和“八十分”发展演化而来。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究内容和预期目标

本设计主要研究内容是基于掼蛋平台,研究深度强化学习算法。

预期目标为通过深度强化学习训练出能比具有的平均水平掼蛋牌手具有更高水平的掼蛋人工智能。

3. 研究的方法与步骤

本课题通过对照实验的方法,来比较不同算法之间所训练出的深度强化学习人工智能所具有的掼蛋水平。

不同掼蛋ai之间通过对战,找出胜率最高的掼蛋ai,进而找出最优的掼蛋深度强化学习算法。

本课题首先需要完成掼蛋平台的设计,完成掼蛋平台的设计后需要完成对掼蛋深度强化学习算法的设计以训练掼蛋ai,最后通过比较找出较优的强化学习算法。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1]chaturvedi pratik,dutt varun. understanding human decision making in an interactive landslide simulator tool via reinforcement learning [j]. frontiers in psychology,2021,10(1):40-51.

[2]palmieri john, spiegler kevin m., pang kevin c.h. et al.dataset of active avoidance in wistar-kyoto and sprague dawley rats: experimental data and reinforcement learning model code and output[j]data in brief, 2020, 6(3):32-40.

[3]yang meiyi,liu nianbo,zuo lin,gong haigang,liu minghui,liu ming. mobile parking incentives for vehicular networks: a deep reinforcement learning approach[j]. ccf transactions on pervasive computing and interaction,2020,2(4):163-175.

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 计划与进度安排

(1) 2022年12月1日 —2022年1月1日

接受毕业设计任务,查阅资料并完成开题报告;

(2) 2022年1月2日 —2022年1月8日

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版