HTML5技术

[深度学习]实现一个博弈型的AI,从五子棋开始(1) - xerwin

字号+ 作者:H5之家 来源:H5之家 2017-11-15 12:01 我要评论( )

好久没有写过博客了,多久,大概8年???最近重新把写作这事儿捡起来最近在折腾AI,写个AI相关的给团队的小伙伴们看吧。 搞了这么多年的机器学习,从分类到聚类,从朴素贝叶斯到SVM,从神经网络到深度学习,各种神秘的项目里用了无数次,但是感觉干的各种事

好久没有写过博客了,多久,大概8年???最近重新把写作这事儿捡起来……最近在折腾AI,写个AI相关的给团队的小伙伴们看吧。

 

搞了这么多年的机器学习,从分类到聚类,从朴素贝叶斯到SVM,从神经网络到深度学习,各种神秘的项目里用了无数次,但是感觉干的各种事情离我们生活还是太远了。最近AlphaGo Zero的发布,深度学习又火了一把,小伙伴们按捺不住内心的躁动,要搞一个游戏AI,好吧,那就从规则简单、老少皆宜的五子棋开始讲起。

 

好了,废话就说这么多,下面进入第一讲,实现一个五子棋。

 

小伙伴:此处省去吐槽一万字,说好的讲深度学习,怎么开始扯实现一个五子棋程序了,大哥你不按套路出牌啊……

我:工欲善其事必先利其器,要实现五子棋的AI,连棋都没有,AI个锤子!

老罗:什么事?

……

 

五子棋分为有禁手和无禁手,我们先实现一个普通版本的无禁手版本作为例子,因为这个不影响我们实现一个AI。补充说明一下,无禁手黑棋必胜,经过比赛和各种研究,人们逐渐知道了这个事实就开始想办法来限制黑棋先手优势。于是出现了有禁手规则,规定黑棋不能下三三,四四和长连。但随着比赛的结果的研究的继续进行,发现其实即使是对黑棋有禁手限制,还是不能阻止黑棋开局必胜的事实,像直指开局中花月,山月,云月,溪月,寒星等,斜指开局中的名月,浦月,恒星,峡月,岚月都是黑棋必胜。于是日本人继续提出了交换和换打的思想,到了后来发展成了国际比赛中三手交换和五手二打规则,防止执黑者下出必胜开局或者在第五手下出必胜打。所以结论是,在不正规的比赛规则或者无禁手情况下,黑棋必胜是存在的。

 

(1)五子棋下棋逻辑实现

这里用Python来实现,因为之后的机器学习库也是Python的,方便一点。

界面和逻辑要分开,解耦合,这个是毋庸置疑的,并且之后还要训练AI,分离这是必须的。所以我们先来实现一个五子棋的逻辑。

我们先来考虑五子棋是一个15*15的棋盘,棋盘上的每一个交叉点(或格子)上一共会有3种状态:空白、黑棋、白棋,所以先建个文件 consts.py

做如下定义:

from enum import Enum N = 15 class ChessboardState(Enum): EMPTY = 0 BLACK = 1 WHITE = 2

 

 

棋盘的状态,我们先用一个15*15的二维数组chessMap来表示,建一个类 gobang.py

currentI、currentJ、currentState 分别表示当前这步着棋的坐标和颜色,再定义一个get和set函数,最基本的框架就出来了,代码如下:

from enum import Enum from consts import * class GoBang(object): def __init__(self): self.__chessMap = [[ChessboardState.EMPTY for j in range(N)] for i in range(N)] self.__currentI = -1 self.__currentJ = -1 self.__currentState = ChessboardState.EMPTY def get_chessMap(self): return self.__chessMap def get_chessboard_state(self, i, j): return self.__chessMap[i][j] def set_chessboard_state(self, i, j, state): self.__chessMap[i][j] = state self.__currentI = i self.__currentJ = j self.__currentState = state

 

 

这样界面端可以调用get函数来获取各个格子的状态来决定是否绘制棋子,以及绘制什么样的棋子;每次下棋的时候呢,在对应的格子上,通过坐标来设置棋盘Map的状态。

所以最基本的展示和下棋,上面的逻辑就够了,接下来干什么呢,得考虑每次下棋之后,set了对应格子的状态,是不是需要判断当前有没有获胜。所以还需要再加两个函数来干这个事情,思路就是从当前位置从东、南、西、北、东南、西南、西北、东北8个方向,4根轴,看是否有连续的大于5颗相同颜色的棋子出现。假设我们目前落子在棋盘正中,需要判断的位置如下图所示的米字形。

 

 

那代码怎么写呢,最最笨的办法,按照字面意思来翻译咯,比如横轴,先看当前位置左边有多少颗连续同色的,再看右边有多少颗连续同色的,左边加右边,就是当前横轴上的连续数,如果大于5,则胜利。

def have_five(self, current_i, current_j): #四个方向计数 竖 横 左斜 右斜 hcount = 1 temp = ChessboardState.EMPTY j in range(current_j - 1, -1, -1): #横向往左 from (current_j - 1) to 0 temp = self.__chessMap[current_i][j] if temp == ChessboardState.EMPTY or temp != self.__currentState: break hcount = hcount + 1
j in range(current_j + 1, N): #横向往右 from (current_j + 1) to N temp = self.__chessMap[current_i][j] if temp == ChessboardState.EMPTY or temp != self.__currentState: break hcount = hcount + 1
hcount >= 5: return True

 

 

以此类推,再看竖轴、再看左斜、再看右斜。于是,have_five函数变成这样了:

 

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章
  • vuejs实现本地数据的筛选分页 - 金振宗

    vuejs实现本地数据的筛选分页 - 金振宗

    2017-11-15 09:02

  • 使用原生JavaScript的Canvas实现拖拽式图形绘制,支持画笔、线条、箭头、三角形、矩形、平行四边形、梯形以及多

    使用原生JavaScript的Canvas实现拖拽式图形绘制,支持画笔、线条、箭

    2017-11-09 16:05

  • 实现输入框【输入填写+动态提示信息+下拉选择】 - 酒不醉心

    实现输入框【输入填写+动态提示信息+下拉选择】 - 酒不醉心

    2017-10-30 18:01

  • 开始Java8之旅(六) -- 使用lambda实现Java的尾递归 - 祈求者-

    开始Java8之旅(六) -- 使用lambda实现Java的尾递归 - 祈求者-

    2017-10-26 10:02

网友点评
m