Lee Sedoll赢得AlphaGo第四场比赛

AI赢得了历史性比赛的前三场比赛



一个人获得胜利的巨大优势:我们在AlphaGo界面中看到了失败的认识。

今天是比赛李·塞多尔-AlphaGo的第四部分。著名的第九职业丹的现年33岁的老板和Google DeepMind部门的计算机go系统正在玩。今天塞多尔赢了。

AlphaGo是DeepMind的产品,将蒙特卡洛方法与政治和价值的神经网络相结合。在汉城运行的系统是两年工作的结果,包括在来自KGS服务器的16万场比赛以及针对自己的比赛中对神经网络进行机器学习。去年10月,AlphaGo 已经领先于强者。是三届欧洲冠军范晖,他在五场比赛中有五场失去了人工智能。

人们认为,在欧洲,围棋的所有权水平低于亚洲游戏国家。显示明显的优势对阵李·塞多尔。这位职业选手已经输了五场比赛中的三场。现在该系列的结果已经清楚了,获奖的一百万美元的命运也将得到明确体现,它将捐赠给慈善机构和发展组织。在最后两场比赛中,将确定人队的失败深度。

昨天,在第三次人类失败之后,新闻发布会的主题之一就是 AlphaGo是否存在任何弱点的问题。那个白发男子提到了他的感觉。他为此向朝鲜民族和围棋选手道歉。

很容易理解他的紧张情绪。 Go在韩国是一种流行的游戏;据估计,大约有800万人在玩它。在韩国,比赛的新闻流传到报纸的头版。 Google所发生事情的严重性表明了观察者的身影。搜索巨头Sergey Brin的联合创始人,公司Jeff Dean的重要工程师之一Google前负责人Eric Sc​​hmidt参观了游戏。后者帮助Google在进行比赛的“四季”酒店铺设了光通道。与该公司的数据中心进行通讯时需要该通道,AlphaGo在数百个处理器内核和视频加速器上启动。



这个男人与白人一起玩,也就是说,AI拥有先发制人的优势。和以前的比赛一样,塞多尔(Sedol)没时间在对手之前。也就是说,在某个时候,该人被迫在出行上花费一分钟。反过来,AlphaGo系统可以很好地管理时间-这是添加了有助于管理时间的神经网络的结果。

78怀特的举动非常出色。也许Sedol确实在计算机系统中发现了薄弱环节。AlphaGo的回答很弱。根据DeepMind的负责人Demis Hassabis的说法,在第79步时系统犯了一个错误,但仅在第87步时才意识到。之后,AI感到困惑。


坦率地说,AlphaGo采取了虚弱而可怕的举动。当获胜几率降至20%以下时,系统会识别失败。关于这一点,谷歌工程师戴维·西尔弗(David Silver)在一次休息中回忆了一下,当时休息了一下李·塞多尔。白银拒绝就一系列言辞不一的系统举动发表评论。比赛继续进行,而塞多尔仍然被迫在缺乏时间的情况下工作。 AI犯了另一个错误,后来被击败。这场对抗历时4.5小时,共进行了180步,人类胜利。塞多尔说,他从来没有为一个胜利而如此祝贺。



将举行五场比赛,比分3-1已经结束了获胜者的问题。但是,要评估系统的强度,比赛的整体结果很重要。最后,第五期将在星期二举行。像过去的四个一样,它将在YouTube的DeepMind频道上播放。有趣的是,十月份范晖还击败了AlphaGo。这位欧洲冠军两次获胜,但都是在非正式比赛中。

Go是一种古老的东亚逻辑游戏。两个玩家中的每一个都需要用自己的颜色的石头围起来尽可能大的区域。进行中的人工智能研究人员被复杂性所吸引:有太多的职位需要分类。计算机系统长期以来一直屈服于棋子和象棋。例如,自2005年以来,最优秀的人一直在失去下象棋的最佳计算机系统。有计算机系统,但它们是业余爱好者玩的。在AlphaGo出现之前,专家们认为围棋游戏将再保持十年不变。

第四局

Source: https://habr.com/ru/post/zh-CN391659/


All Articles