无障碍 关怀版
评论

柯洁和AlphaGo讲解人机大战三番棋

原标题:柯洁和AlphaGo讲解人机大战三番棋

本文来自微信号:庆丰棋圣木可三吉

大家期待已久的人机大战第二季三番棋的讲解,由两位对局者亲自出马的靠谱讲解,终于来了。

由现“前五十手天下第一(人)”的樊麾二段携与人机大战期间完全相同配置的AlphaGo,与体重已达76.5 KG的“世界围棋第一人”柯洁九段联袂奉献专业解说。

第一局链接

第二局链接

第三局链接

这个节目大概是早些时候录制的,当时围棋TV的演播室还是这个茶几+沙发的布置。现在已经改成电视台的那种三角形的桌子了。

因为要做英文字幕,面向世界各地的棋友,所以花了不少时间进行后期制作。感兴趣的棋友们也可以学习一些英文词句。

比如,下得比较“淡”(形容AlphaGo的棋风),这个词对应的翻译是“bland”。

出现在镜头中的阿柯略显月半,脸也有点圆,气色不错。Corgi said he is thinner(棋薄) in the programme, but now he is fatter(人厚).

看过之后的一个强烈的感觉就是——阿柯还是非常强的,对棋的理解又快又准,而且不固执,的确是最接近于狗哥的棋手,所以双方的“交流”和理解是比较顺畅的。如果是个棋力不够高或者悟性不够强的棋手,大概不能形成有效的交流和理解。

同时,也更加深刻地展示了狗哥的棋高,而且是理智型的高。尤其是狗哥站在阿柯的视角拆解变化,当一个局部亏损之后,不会再继续不理智地越陷越深,而是即使悬崖勒马,宁肯选择一个亏得最少的变化,赶紧止损,然后在其他更宽阔地地方寻求追赶的战机。而人类棋手往往因为思维惯性一条道跑到黑。

另外,狗哥并没有在任何一个局部都背后准备相当犀利的必杀技。在绝大多数场合,只是依靠对大方向的把握,简简单单占据更好的方向和更大的价值处,一点一点积累足以获得胜利的资本。至少在对阿柯时,不是非得怎么一下子搞死对手,没那么紧。

有棋友形容得蛮形象的:“这步亏了两个点,这步亏了一个点,这步亏的有点多,五个点了。。。阿狗胜率80了,gg”。

这盘棋下边的战斗是白棋(柯洁九段执白)亏了,这个判断也与我们当时的判断一致。并不是不分高下。更不是前一百手都势均力敌。

另外就是当时布局阶段白棋在下方的棋形,po主是觉得偏薄,在左上交换之后,这里更薄,不是个很好的构思,将来战斗要吃亏。在这次阿柯(以下简称76.5KG)自己的讲解里,他当时也觉得这里有所担心,不是很满意。但是,AlphaGo的判断是认为76.5KG的白棋这么下是可以的。

不过,大家公认,狗哥也“亲自鉴定”,三番棋中的第二局是阿柯下得最好的一局,甚至也是AlphaGo升级为Master版本之后,人类棋手与AlphaGo最为接近的一局,发挥很棒,既是以实力为基础,又有灵感和一点点小运气的成分。这是值得称道的一局棋。

AlphaGo这一版本的棋是很严谨的,这次完全可以做到复盘胜,也就是说狗哥的棋是禁得起推敲的,不给对手“这里是唯一败招,我下得时候没看见,如果我重新下,我走对了,我就能赢了”的幻想,因为你这里走对了,其他地方也还是不行。这是实力上的压制,不存在“我能赢”的偶然性,——棋的进程可能有一定偶然,结果是必然的。

在很多小细节上,狗哥能够精细地积攒优势。哪怕只是一点点细微的出入,积少成多。1%的优势看似不多,但如果有5步、10步这种小优势,累积起来就可怕了。为什么几乎与AlphaGo的对局,人类棋手差不多没有撑过100手的,大多前50手之后就不太行了?因为即便没有大的战斗,没有明显的失误,仅仅是被积累了几个1%的小优势,那也是很难捞回来了,而且这种差距后面还可能继续积累。

这次三盘棋的讲解比预想中的要简短,可能是因为76.5KG时间比较紧张,很难在繁忙的赛程中抽出太多的时间。看视频,这三盘棋的讲解是一气录下来的,不是一天录一盘,讲得很细的那种。在开局和主要的胜负决定处(往往比人们意识到的更早)用了比较多的时间,后面就比较简略了。如果换成与人下,76.5KG在后半盘还是有大把机会逆转的。

具体这三局棋进程中的胜率变化如下(百分比为胜率,前面的数字n表示第n手):

这里可以有一个补充,樊麾二段这次透露,AlphaGo在胜率没有超过70%时,是不会保守退缩的,还是会绷得很紧。

这确实是个新说法,以前大家可能都有种错觉。不过po主或多或少还是觉得,如果优势比较明显,狗哥大概还是会采取偏保守和稳健的下法。很臭的保守是不会的。但一般性的保守,或者差不多的情况下选择一种稳健的下法,这应该是存在的。当然,从某种角度来看,这种优势之下稳健的下法也的确是当前局面下理所当然的最佳招法(或之一),无可厚非。

同时,当胜率掉到比较低(如30%以下)之后,AlphaGo是会下一些拼命招法的。但这种拼命不是早期版本中的乱下死一片的胡搞,而是有一定合理性地拼搏。

这就意味着,AlphaGo是会下让子棋的。那些觉得AlphaGo落后了就不会下棋的猜想并不成立。当AlphaGo判定胜率低到一定程度,比如20%以下,逆转无望,便会认输。不会等到完全尘埃落定,无子可落再认。这一点与人类棋手比较像了。

根据我们现在看到的AlphaGo表现出来的水准,TA与“围棋之神”的差距恐怕已经不太大了。换句话说,照现有思路进化的AlphaGo提升到顶点后,仿照吴清源时代的十番棋规则,围棋之神应无法让AlphaGo先,双方执黑不贴目地情况下进行十番棋对决,大致五五开。(当然,如果执黑大贴目进行十番棋大战,“围棋之神”应该能赢)

但无论如何,早前人们认为只有穷举才能找到围棋极高境界的判断是不准确的。深度学习的理论已经基本解决了围棋问题。

弈客围棋原创整理!更多精彩赛事直播,棋文弈事,尽在弈客围棋,下载弈客APP,和热爱围棋的棋友对弈手谈!返回搜狐,查看更多

责任编辑:

平台声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()
大家都在看
推荐阅读

聚圣源店铺起名称测试打分如何免费起名字大全姓何女孩起啥名字周易起名免费取名软件属鼠人起什么名字好听10月26日是什么星座老电视剧大全易经起名大师姓姜的女孩起什么名字好夏小宇秦子墨小说免费阅读大气好听建筑公司起名字word字体下载渴了可以喝水吗威海区号考试后的感想狗起什么名段家宝石材加工厂起名魔兽争霸升级补丁起名字测试在线starpointgemini2科技公司起名参考浙江移动网上营业厅皇道仙尊起名网英文名怎么样给小孩子起名铃铛噩梦用剑的起个什么名字好史姓女宝宝起名字大全腾讯微博登陆淀粉肠小王子日销售额涨超10倍罗斯否认插足凯特王妃婚姻让美丽中国“从细节出发”清明节放假3天调休1天男孩疑遭霸凌 家长讨说法被踢出群国产伟哥去年销售近13亿网友建议重庆地铁不准乘客携带菜筐雅江山火三名扑火人员牺牲系谣言代拍被何赛飞拿着魔杖追着打月嫂回应掌掴婴儿是在赶虫子山西高速一大巴发生事故 已致13死高中生被打伤下体休学 邯郸通报李梦为奥运任务婉拒WNBA邀请19岁小伙救下5人后溺亡 多方发声王树国3次鞠躬告别西交大师生单亲妈妈陷入热恋 14岁儿子报警315晚会后胖东来又人满为患了倪萍分享减重40斤方法王楚钦登顶三项第一今日春分两大学生合买彩票中奖一人不认账张家界的山上“长”满了韩国人?周杰伦一审败诉网易房客欠租失踪 房东直发愁男子持台球杆殴打2名女店员被抓男子被猫抓伤后确诊“猫抓病”“重生之我在北大当嫡校长”槽头肉企业被曝光前生意红火男孩8年未见母亲被告知被遗忘恒大被罚41.75亿到底怎么缴网友洛杉矶偶遇贾玲杨倩无缘巴黎奥运张立群任西安交通大学校长黑马情侣提车了西双版纳热带植物园回应蜉蝣大爆发妈妈回应孩子在校撞护栏坠楼考生莫言也上北大硕士复试名单了韩国首次吊销离岗医生执照奥巴马现身唐宁街 黑色着装引猜测沈阳一轿车冲入人行道致3死2伤阿根廷将发行1万与2万面值的纸币外国人感慨凌晨的中国很安全男子被流浪猫绊倒 投喂者赔24万手机成瘾是影响睡眠质量重要因素春分“立蛋”成功率更高?胖东来员工每周单休无小长假“开封王婆”爆火:促成四五十对专家建议不必谈骨泥色变浙江一高校内汽车冲撞行人 多人受伤许家印被限制高消费

聚圣源 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化