柯洁和AlphaGo讲解人机大战三番棋
本文来自微信号:庆丰棋圣木可三吉
大家期待已久的人机大战第二季三番棋的讲解,由两位对局者亲自出马的靠谱讲解,终于来了。
由现“前五十手天下第一(人)”的樊麾二段携与人机大战期间完全相同配置的AlphaGo,与体重已达76.5 KG的“世界围棋第一人”柯洁九段联袂奉献专业解说。
第一局链接
第二局链接
第三局链接
这个节目大概是早些时候录制的,当时围棋TV的演播室还是这个茶几+沙发的布置。现在已经改成电视台的那种三角形的桌子了。
因为要做英文字幕,面向世界各地的棋友,所以花了不少时间进行后期制作。感兴趣的棋友们也可以学习一些英文词句。
比如,下得比较“淡”(形容AlphaGo的棋风),这个词对应的翻译是“bland”。
出现在镜头中的阿柯略显月半,脸也有点圆,气色不错。Corgi said he is thinner(棋薄) in the programme, but now he is fatter(人厚).
看过之后的一个强烈的感觉就是——阿柯还是非常强的,对棋的理解又快又准,而且不固执,的确是最接近于狗哥的棋手,所以双方的“交流”和理解是比较顺畅的。如果是个棋力不够高或者悟性不够强的棋手,大概不能形成有效的交流和理解。
同时,也更加深刻地展示了狗哥的棋高,而且是理智型的高。尤其是狗哥站在阿柯的视角拆解变化,当一个局部亏损之后,不会再继续不理智地越陷越深,而是即使悬崖勒马,宁肯选择一个亏得最少的变化,赶紧止损,然后在其他更宽阔地地方寻求追赶的战机。而人类棋手往往因为思维惯性一条道跑到黑。
另外,狗哥并没有在任何一个局部都背后准备相当犀利的必杀技。在绝大多数场合,只是依靠对大方向的把握,简简单单占据更好的方向和更大的价值处,一点一点积累足以获得胜利的资本。至少在对阿柯时,不是非得怎么一下子搞死对手,没那么紧。
有棋友形容得蛮形象的:“这步亏了两个点,这步亏了一个点,这步亏的有点多,五个点了。。。阿狗胜率80了,gg”。
这盘棋下边的战斗是白棋(柯洁九段执白)亏了,这个判断也与我们当时的判断一致。并不是不分高下。更不是前一百手都势均力敌。
另外就是当时布局阶段白棋在下方的棋形,po主是觉得偏薄,在左上交换之后,这里更薄,不是个很好的构思,将来战斗要吃亏。在这次阿柯(以下简称76.5KG)自己的讲解里,他当时也觉得这里有所担心,不是很满意。但是,AlphaGo的判断是认为76.5KG的白棋这么下是可以的。
不过,大家公认,狗哥也“亲自鉴定”,三番棋中的第二局是阿柯下得最好的一局,甚至也是AlphaGo升级为Master版本之后,人类棋手与AlphaGo最为接近的一局,发挥很棒,既是以实力为基础,又有灵感和一点点小运气的成分。这是值得称道的一局棋。
AlphaGo这一版本的棋是很严谨的,这次完全可以做到复盘胜,也就是说狗哥的棋是禁得起推敲的,不给对手“这里是唯一败招,我下得时候没看见,如果我重新下,我走对了,我就能赢了”的幻想,因为你这里走对了,其他地方也还是不行。这是实力上的压制,不存在“我能赢”的偶然性,——棋的进程可能有一定偶然,结果是必然的。
在很多小细节上,狗哥能够精细地积攒优势。哪怕只是一点点细微的出入,积少成多。1%的优势看似不多,但如果有5步、10步这种小优势,累积起来就可怕了。为什么几乎与AlphaGo的对局,人类棋手差不多没有撑过100手的,大多前50手之后就不太行了?因为即便没有大的战斗,没有明显的失误,仅仅是被积累了几个1%的小优势,那也是很难捞回来了,而且这种差距后面还可能继续积累。
这次三盘棋的讲解比预想中的要简短,可能是因为76.5KG时间比较紧张,很难在繁忙的赛程中抽出太多的时间。看视频,这三盘棋的讲解是一气录下来的,不是一天录一盘,讲得很细的那种。在开局和主要的胜负决定处(往往比人们意识到的更早)用了比较多的时间,后面就比较简略了。如果换成与人下,76.5KG在后半盘还是有大把机会逆转的。
具体这三局棋进程中的胜率变化如下(百分比为胜率,前面的数字n表示第n手):
这里可以有一个补充,樊麾二段这次透露,AlphaGo在胜率没有超过70%时,是不会保守退缩的,还是会绷得很紧。
这确实是个新说法,以前大家可能都有种错觉。不过po主或多或少还是觉得,如果优势比较明显,狗哥大概还是会采取偏保守和稳健的下法。很臭的保守是不会的。但一般性的保守,或者差不多的情况下选择一种稳健的下法,这应该是存在的。当然,从某种角度来看,这种优势之下稳健的下法也的确是当前局面下理所当然的最佳招法(或之一),无可厚非。
同时,当胜率掉到比较低(如30%以下)之后,AlphaGo是会下一些拼命招法的。但这种拼命不是早期版本中的乱下死一片的胡搞,而是有一定合理性地拼搏。
这就意味着,AlphaGo是会下让子棋的。那些觉得AlphaGo落后了就不会下棋的猜想并不成立。当AlphaGo判定胜率低到一定程度,比如20%以下,逆转无望,便会认输。不会等到完全尘埃落定,无子可落再认。这一点与人类棋手比较像了。
根据我们现在看到的AlphaGo表现出来的水准,TA与“围棋之神”的差距恐怕已经不太大了。换句话说,照现有思路进化的AlphaGo提升到顶点后,仿照吴清源时代的十番棋规则,围棋之神应无法让AlphaGo先,双方执黑不贴目地情况下进行十番棋对决,大致五五开。(当然,如果执黑大贴目进行十番棋大战,“围棋之神”应该能赢)
但无论如何,早前人们认为只有穷举才能找到围棋极高境界的判断是不准确的。深度学习的理论已经基本解决了围棋问题。
弈客围棋原创整理!更多精彩赛事直播,棋文弈事,尽在弈客围棋,下载弈客APP,和热爱围棋的棋友对弈手谈!返回搜狐,查看更多
责任编辑: