柯洁和AlphaGo讲解人机大战三番棋

2017-09-16 20:50 来源: 弈客围棋

本文来自微信号：庆丰棋圣木可三吉

大家期待已久的人机大战第二季三番棋的讲解，由两位对局者亲自出马的靠谱讲解，终于来了。

由现“前五十手天下第一（人）”的樊麾二段携与人机大战期间完全相同配置的AlphaGo，与体重已达76.5 KG的“世界围棋第一人”柯洁九段联袂奉献专业解说。

第一局链接

第二局链接

第三局链接

这个节目大概是早些时候录制的，当时围棋TV的演播室还是这个茶几+沙发的布置。现在已经改成电视台的那种三角形的桌子了。

因为要做英文字幕，面向世界各地的棋友，所以花了不少时间进行后期制作。感兴趣的棋友们也可以学习一些英文词句。

比如，下得比较“淡”（形容AlphaGo的棋风），这个词对应的翻译是“bland”。

出现在镜头中的阿柯略显月半，脸也有点圆，气色不错。Corgi said he is thinner（棋薄） in the programme, but now he is fatter（人厚）.

看过之后的一个强烈的感觉就是——阿柯还是非常强的，对棋的理解又快又准，而且不固执，的确是最接近于狗哥的棋手，所以双方的“交流”和理解是比较顺畅的。如果是个棋力不够高或者悟性不够强的棋手，大概不能形成有效的交流和理解。

同时，也更加深刻地展示了狗哥的棋高，而且是理智型的高。尤其是狗哥站在阿柯的视角拆解变化，当一个局部亏损之后，不会再继续不理智地越陷越深，而是即使悬崖勒马，宁肯选择一个亏得最少的变化，赶紧止损，然后在其他更宽阔地地方寻求追赶的战机。而人类棋手往往因为思维惯性一条道跑到黑。

另外，狗哥并没有在任何一个局部都背后准备相当犀利的必杀技。在绝大多数场合，只是依靠对大方向的把握，简简单单占据更好的方向和更大的价值处，一点一点积累足以获得胜利的资本。至少在对阿柯时，不是非得怎么一下子搞死对手，没那么紧。

有棋友形容得蛮形象的：“这步亏了两个点，这步亏了一个点，这步亏的有点多，五个点了。。。阿狗胜率80了，gg”。

这盘棋下边的战斗是白棋（柯洁九段执白）亏了，这个判断也与我们当时的判断一致。并不是不分高下。更不是前一百手都势均力敌。

另外就是当时布局阶段白棋在下方的棋形，po主是觉得偏薄，在左上交换之后，这里更薄，不是个很好的构思，将来战斗要吃亏。在这次阿柯（以下简称76.5KG）自己的讲解里，他当时也觉得这里有所担心，不是很满意。但是，AlphaGo的判断是认为76.5KG的白棋这么下是可以的。

不过，大家公认，狗哥也“亲自鉴定”，三番棋中的第二局是阿柯下得最好的一局，甚至也是AlphaGo升级为Master版本之后，人类棋手与AlphaGo最为接近的一局，发挥很棒，既是以实力为基础，又有灵感和一点点小运气的成分。这是值得称道的一局棋。

AlphaGo这一版本的棋是很严谨的，这次完全可以做到复盘胜，也就是说狗哥的棋是禁得起推敲的，不给对手“这里是唯一败招，我下得时候没看见，如果我重新下，我走对了，我就能赢了”的幻想，因为你这里走对了，其他地方也还是不行。这是实力上的压制，不存在“我能赢”的偶然性，——棋的进程可能有一定偶然，结果是必然的。

在很多小细节上，狗哥能够精细地积攒优势。哪怕只是一点点细微的出入，积少成多。1%的优势看似不多，但如果有5步、10步这种小优势，累积起来就可怕了。为什么几乎与AlphaGo的对局，人类棋手差不多没有撑过100手的，大多前50手之后就不太行了？因为即便没有大的战斗，没有明显的失误，仅仅是被积累了几个1%的小优势，那也是很难捞回来了，而且这种差距后面还可能继续积累。

这次三盘棋的讲解比预想中的要简短，可能是因为76.5KG时间比较紧张，很难在繁忙的赛程中抽出太多的时间。看视频，这三盘棋的讲解是一气录下来的，不是一天录一盘，讲得很细的那种。在开局和主要的胜负决定处（往往比人们意识到的更早）用了比较多的时间，后面就比较简略了。如果换成与人下，76.5KG在后半盘还是有大把机会逆转的。

具体这三局棋进程中的胜率变化如下（百分比为胜率，前面的数字n表示第n手）：

这里可以有一个补充，樊麾二段这次透露，AlphaGo在胜率没有超过70%时，是不会保守退缩的，还是会绷得很紧。

这确实是个新说法，以前大家可能都有种错觉。不过po主或多或少还是觉得，如果优势比较明显，狗哥大概还是会采取偏保守和稳健的下法。很臭的保守是不会的。但一般性的保守，或者差不多的情况下选择一种稳健的下法，这应该是存在的。当然，从某种角度来看，这种优势之下稳健的下法也的确是当前局面下理所当然的最佳招法（或之一），无可厚非。

同时，当胜率掉到比较低（如30%以下）之后，AlphaGo是会下一些拼命招法的。但这种拼命不是早期版本中的乱下死一片的胡搞，而是有一定合理性地拼搏。

这就意味着，AlphaGo是会下让子棋的。那些觉得AlphaGo落后了就不会下棋的猜想并不成立。当AlphaGo判定胜率低到一定程度，比如20%以下，逆转无望，便会认输。不会等到完全尘埃落定，无子可落再认。这一点与人类棋手比较像了。

根据我们现在看到的AlphaGo表现出来的水准，TA与“围棋之神”的差距恐怕已经不太大了。换句话说，照现有思路进化的AlphaGo提升到顶点后，仿照吴清源时代的十番棋规则，围棋之神应无法让AlphaGo先，双方执黑不贴目地情况下进行十番棋对决，大致五五开。（当然，如果执黑大贴目进行十番棋大战，“围棋之神”应该能赢）

但无论如何，早前人们认为只有穷举才能找到围棋极高境界的判断是不准确的。深度学习的理论已经基本解决了围棋问题。

弈客围棋原创整理！更多精彩赛事直播，棋文弈事，尽在弈客围棋，下载弈客APP，和热爱围棋的棋友对弈手谈！返回搜狐，查看更多

责任编辑：

平台声明：该文观点仅代表作者本人，搜狐号系信息发布平台，搜狐仅提供信息存储空间服务。

阅读 ()