AlphaGo赢得李·塞多尔的第三场决定性比赛

人工智能在第五届历史性系列比赛中的第三次胜利


Go是一款具有悠久历史和丰富文化底蕴的东亚逻辑游戏。规则和变型有几个,但主要目标是相同的:两个参与者中的每一个都需要用自己的颜色的石头来挡住最大尺寸的区域。人工智能研究人员被复杂性所吸引。征服国际象棋为时已晚-几年来计算机的性能一直比人类更好。但是在进行中,可能的位置数量比象棋中的位置高得多(10 100)。现代程序效果很好,但很受爱好者欢迎。在创建可以击败最优秀的人的系统之前,最好是十年。

因此专家表示,在AlphaGo出现之前。 DeepMind(2014年Google收购了该公司)的开发使用的是Monte Carlo方法。最好的现代计算机系统都使用此技术。但是在AlphaGo,举动也有助于选择政治和价值观的神经网络。他们可以称为识别图像和语音的神经网络的近亲。该系统首先被教导可以在KGS服务器上玩16万场游戏。然后,AlphaGo接受了针对自己的游戏训练。

该AI样本在1月份首次引起关注。然后Google 在AlphaGo上发表了一篇科学论文,其中提到了2015年10月的比赛。三届欧洲冠军范晖在五场比赛中有五场输给了新的发展。

人们认为,欧洲的围棋水平低于比赛本国的亚洲水平。回族的个人举动和错误提出了疑问。因此,围棋运动员和AI爱好者都期待着AlphaGo首尔对抗人队的最佳代表之一-第九届职业运动员丹·李·塞多尔( dan Lee Sedol)的拥有者

直到三月,问题如下:AlphaGo是否有机会与Lee Sedola对抗?但是塞多尔输了第一第二聚会。如果给他之后第二个表现乐观的第一场比赛主九届后在混乱。 Sedoll说他看不到玩游戏的时刻。

今天是第三批。谷歌前首席执行官埃里克·施密特(Eric Sc​​hmidt 参加了游戏,该公司的重要工程师之一杰夫·迪恩(Jeff Dean)和谢尔盖·布林(Sergey Brin)于第二天抵达汉城。显然,征服go象征着机器学习技术的重要性,而这正是Google的核心。从左至右:DeepMind创始人Demis Hassabis,第九位职业丹老板Lee Sedol和Google联合创始人Sergey Brin。




与第一局一样,塞多尔也变成了黑色,即第一局。而且,熟悉该系统也可以包括在内-DeepMind工程师几乎没有资源在比赛期间进行任何更改。至少有传言,Sedoll和一个围棋专家团队整夜都在寻找AlphaGo的弱点。布莱克的第一步是积极进取的。看起来Sedol试图将游戏推向另一个方向,试图对系统的弱点施加压力。


比赛AlphaGo第三部分的视频播放-Lee Sedol。

在比赛中,人工智能以ko位置的形式展示了在困难时刻工作的能力。人们认为计算机转账系统不能很好地应付ko。到第三局结束时,布莱克已经没时间了,所以这个人不得不考虑一下动作。

经过176次移动后,游戏 AlphaGo系统的胜利而告终。 AI还剩8分31秒。



这是该系列赛连续第三次获得AlphaGo胜利。确定了五场比赛的历史系列的总体结果。金钱报酬的命运已经确定-很明显,现在他将去慈善事业并发展围棋,这是人们失败时的原意。周日和周二的最后两场比赛将决定AlphaGo优势展示的深度-尽管该系列赛已明确结束,但仍将继续进行。


去年三月,该系统击败了第二个职业丹选手,而今天它绕过了第九个丹。在过去的五个月中,AlphaGo系统已经在针对自己的比赛中进行了训练,这也许有助于解决这一问题。作为断言头部DeepMind德米斯·哈萨维斯,大约相同数量的硬件资源的当前配置使用,并击败范辉的选项。哈萨比斯算法比硬件更重要。

最后的第五场比赛将在星期二举行。然后,将总结在数千个图形加速器的商用服务器处理器集群上启动的数千年人类游戏之战和为期两年的开发战的结果。

关于该主题的有用材料:

Source: https://habr.com/ru/post/zh-CN391513/


All Articles