1. 研究目的与意义
1.1背景(加上当前论文的研究成果)
随着人类科学的飞速发展,人工智能越来越引起人们的关注,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
随着深蓝、倚天、alphago等一系列棋类博弈软件的诞生,人们对于人工智能,特别是基于深度学习和强化学习的人工智能更为重视。2016年google旗下deepmind公司开发的alphago成为第一个人类职业围棋选手、第一个战胜围棋世界冠军的人工智能程序。alphago又一次掀起了深度学习和强化学习的热潮。如图1,就是alphago zero强化学习下的自我博弈原理图。
2. 研究内容和预期目标
2.1 研究内容
棋类博弈机器人在不与人下棋时,自己不断跟自己下棋,提高自身棋力等。待需要与人下棋时时,根据设定好难度等级,与人进行下棋。本设计主要是设计一种棋类博弈机器人。主要内容和预期目标:
(1)利用强化学习框架建立自学习模型,棋类可以为五子棋或者中国象棋或者其他棋类游戏;
3. 研究的方法与步骤
(1)首先熟悉java、c、c 、python等语言;
(2)阅读mastering the game of go with deep neural networks and tree search、mastering the game of go without human knowledge,了解alphago、alphago zero的原理;
(3)了解theano或者tensorflow框架原理,熟悉theano或tensorflow开发文档;
4. 参考文献
[1]silver d, schrittwieser j, simonyan k, et al. mastering the game of go without human knowledge[j]. nature, 2017, 550(7676):354-359.
[2]silver d, huang a, maddison c j, et al. mastering the game of go with deep neural networks and tree search[j].nature, 2016, 529(7587):484-489.
[3]chen j x.the evolution of computing:alphago[j]. computing in science engineering, 2016, 18(4):4-7.
5. 计划与进度安排
(1) 2018年1月10日 — 2018年1月30日
接受毕业设计任务,查阅资料并完成开题报告;
(2) 2018年2月1日 — 2018年2月8日
