作为一名快乐的肥宅,玩游戏是居家必备,无论是王者荣耀、吃鸡、原神这些大热游戏,还是跳一跳、合成大西瓜、2048、这些风靡一时得小游戏,咱都有涉及。但是为了成为一个“头号玩家”,我总是疯狂的去个各大社区、网站寻找各种攻略,跟着攻略成长,我时常在想,什么时候俺才能成为一代攻略大神啊,让大家学习我的技术,岂不是很刺激!灵光一闪,毕竟我是个有点小技术的肥宅,曾经也痴迷过deepmind,跑过AlphaGo,这不得训练一个AI玩一玩。

强化学习训练2048游戏,观察AI如何找到出口。

image.png

既然要练手,那就先从2048这种简单,不考验操作,纯策略的游戏入手吧。在网上搜罗了一番,果然让我找到了开源的2048游戏环境。

GitHub地址: https://github.com/rgal/gym-2048

下一步就是把这个算法和强化学习结合了。算法部分很简单,目前我才用的是最传统的DQN,10分钟就可以达到一个还可以的模型效果。如果小伙伴们有想法,可以试试RainBow,PPO,A2C,SAC这类算法,相信会获得更佳的效果。我开发这个模型,用的是来自华为云的ModelArts(它是一个在线、开箱即用的AI平台,还有免费的GPU算力,每天不限次数使用,不要太爽!),所以代码是在ipynb中跑的。

整体步骤大概可以分为3步:

1.创建游戏环境

2.创建DQN算法
image.png
image.png
image.png
image.png
image.png

3.创建网络模型

此处我用的就是一个非常简单的三层卷积网络
image.png

完成以上三步,就可以愉快的开始训练啦:
image.png

我只训练了10分钟,在这个不能错步的严格环境下,推理时可以达到256分,如果采用更先进算法,更长的训练时间,2048不是梦。

详细代码获取方式:点此链接可直接在线运行,或者下载https://marketplace.huaweiclo...

这个技术来源是我在去年华为云AI全栈成长计划中接触到的,据说今年华为云又开始了新一轮【AI实战营】,6大分类实战营Python、ModelArts、MindSpore AI框架、深度、强化、机器学习,助我们成为“AI王者”!短平快地学习全面AI知识的同时,还能拿到Mate 30Pro、智能手表、无线耳机等惊喜豪礼!我已经扫描下面二维码报名啦~你还要等吗?
image.png

点击关注,第一时间了解华为云新鲜技术~


华为云开发者联盟
1.4k 声望1.8k 粉丝

生于云,长于云,让开发者成为决定性力量