AJax技术

AlphaGo棋风已变,强化学习功不可没

字号+ 作者:H5之家 来源:H5之家 2017-05-31 18:01 我要评论( )

不出所料,AlphaGo 又赢了。 人不再是当年那个人,“狗”也不再是当年那只“狗”。 对于昨天的棋局,柯洁表现如何 AlphaGo 的表现又如何,它何以能变得更强? 昨

不出所料,AlphaGo 又赢了。


人不再是当年那个人,“狗”也不再是当年那只“狗”。


对于昨天的棋局,柯洁表现如何 AlphaGo 的表现又如何,它何以能变得更强?


昨天的棋局,柯洁的表现还是值得称赞的。但最后,当然还是毫无悬念就输掉了,这说明人类在准备上,针对 AlphaGo 还是有不足。

 

柯洁不是一个人在战斗,应该是中国的围棋界,加上中国的计算机界、AI 界来一起迎战人类最强大的对手。如果我们能够打败他,这将是一个非常重磅的新闻。

 

可是我们现在感觉,柯洁在开局上的套路准备有所不足。50多手下来,其实局面对黑棋(柯洁)来说已经不乐观了。所以,这是反映我们准备不足的一个因素,特别是点三三局面的变化其实并不复杂,但从判断来讲是黑棋(柯洁)不利。


这里是我们对棋局的看法。

 

AlphaGo棋风已变

聂卫平老师有说,AlphaGo 是特意只输半颗子。这一说法我们尚不能证实,但 AlphaGo 的白棋在后续变化上,相对于人类棋手对局,肯定是下得比较保守的。而另一个角度,柯洁的发挥又相对强势。


因而,最后能出现这么细微的局面,说明棋局还是在 AlphaGo 的掌控之中的,毕竟它要确保的是结果的胜利。至于胜子 1 目还是 10 目,对于电脑来说,这里的判断其实是一样的,都是 100% 胜利这个结果。


所以,我认为这是两个方面的因素,一是电脑从计算上可能做了适当的退让,这从取胜的角度讲是完全没有问题的;二是柯洁在官子上也下得相对紧凑和精彩。


相对于去年的版本,今年 AlphaGo 的成长是非常明显的。它有了很多创新的下法,和自己独有的下法,这些下法我们可以从它今天的对局以及年初的 Master 大战群雄上看出来。

 

DeepMind 创始人哈萨比斯也简单讲过它的细节,AlphaGo 今年是单机版,在计算量上是去年的十分之一,但能力上看来比去年提升了不止一点。

 

用柯洁自己的话说,他有信心战胜去年的 AlphaGo,但距离 Master 与新版 AlphaGo 的差距是非常显著的。



强化学习功不可没

从新版 AlphaGo 的表现来看,它更多是在自我学习的成长上,也就是通过强化学习(Reinforcement Learning)和自我对局演化成不同的版本。这样,每一个 AlphaGo 程序都会有它自己的风格,你可以有意识地诱导它往不同风格去发展。

 

如果没有不同的风格,强化学习的效果就不会太好。这就相当于你左右互搏,尽管自己和自己下得很多,但风格相近的成长对你未必是好事。而不同风格的成长,就能带来更好的结果。

 

总的来说,这次的 AlphaGo,跟去年相比是很不相同的,棋风也大不一样,下法的创新程度也要高很多。这要归功于它在自我对局中的成长,同时也证明 DeepMind 在强化学习上的研究和成果是非常有价值的。



李世石的学生也来凑热闹

第一局比赛开始后,李世石的学生化身 conanbatt,专门出现在 Hacker News 上,来回答硅谷网友的围棋问题:


问题1:AlphaGo 面世以来,人类棋手的下法有何变化?

AlphaGo 无疑已经改变了围棋领域。专业棋手在围棋领域的竞争是相当激烈的,当棋手研究出一种全新的下法时,必定有另一位棋手会尝试来推翻他。这样的竞争一直在推动着专业围棋的进步。


柯洁在本局所用的点三三开局,是人类棋手在 AlphaGo 之前从未用过的。我 15 年前刚学围棋的第一件事,就是不要下出这样的落子。


问题2:AlphaGo 之后最重要的问题,就是围棋的未来将会如何?

当然,当前的专业棋手将依旧以围棋为生。不过,在电脑始终能比你下得更好的情况下,再花毕生精力学成专业棋手还有何意义?


在 AlphaGo 去年打败李世石的时候,我就说过,围棋的未来是在于找对人类仍能进步但 AlphaGo 却没戏的细微领域。这就是为什么古力、连笑同 AlphaGo 的配对赛会对我特别有吸引力。


专业棋手与 AlphaGo 一起合作会有希望打败 AlphaGo 吗?果真如此的话,人类或许能有一席之地。

 

问题3:柯洁说再也不想打AlphaGo了,为什么李世石也这么想?

我不认为李世石还想再打。围棋非常依赖于棋手下棋时的信心:专业棋手从不会随意跟业余棋手下围棋,因为一旦输了,会非常他们的心态,使他们在面对其他专业选手时表现得更差。

 

在 2001 年的一场专业大赛中,一个阿根廷的业余围棋选手连续击败了两位有实力的专业棋手,这是一个强烈的信号。自那时起,那两位专业棋手基本就告别了专业赛事。


这对专业棋手的打击是巨大的,他们很难赢下自己认定会输的比赛。


说到这里,对于周五的双人 AlphaGo 配对赛,我们竟有点小小的期待了;至于五人围殴 AlphaGo 与柯洁获胜的希望,你们觉得还重要吗?


本文系 AI100 授权计蒜客发布,如需转载请与作者联系。

 

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章
  • 代理服务器

    代理服务器

    2015-10-30 17:03

  • [IT教程网]Ajax和jQuery基础入门视频[已经完结]

    [IT教程网]Ajax和jQuery基础入门视频[已经完结]

    2015-10-14 17:08

  • [IT教程网][王兴魁]AJAX核心技术视频教程[已经完结]

    [IT教程网][王兴魁]AJAX核心技术视频教程[已经完结]

    2015-10-14 12:25

  • CJ老师JavaScript+Ajax+Jquery视频教程(150课时)[已完结]

    CJ老师JavaScript+Ajax+Jquery视频教程(150课时)[已完结]

    2015-10-04 14:13

网友点评
c