Cho Chikun和Deep Zen Go:超越人类的另一种尝试



2016年1月27日,Google DeepMind首次公开宣布其新开发成功。 Google于2014年收购了这家英国人工智能公司,试图征服古老的亚洲围棋游戏。今年年初,围棋作为与计算机无关的游戏的地位仍然不可动摇。存在计算机围棋系统,但在业余水平上使用。专业人士只差点就输给了他们。

DeepMind在Monte Carlo人工神经网络的结合上构建AlphaGo。创建系统,调整参数并训练神经网络后,将其与其他计算机程序和人类冠军进行了测试。 AlphaGo在2013、2014和2015年击败了欧洲冠军范晖。

传统上,围棋在欧洲要比亚洲的国内要低。 AlphaGo的强度引起了充分的怀疑。但是Google立即宣布,下一场AlphaGo对抗赛将与第9名职业球员李·李·塞多尔(Lee Sedoll)的所有者举行,后者是过去十年中最好的球员之一。 3月,进行了一系列的五场比赛……该名男子再次以4:1的比分输了。人工智能社区和围棋选手震惊之后,人们对未来的比赛完全保持沉默。没有预定对阵AlphaGo的新比赛

日本项目“ Deep Zen Go”的团队将尝试击败AlphaGo,到目前为止,该团队正在教导其对抗人类的系统。在11月19日,20日和23日,计划与来自日本的第9名单打大师Cho Tikun进行三场比赛。 DeepMind员工Aya Huang做出了一个有趣的预测,他在3月的一次历史性比赛中坐在Lee Sedol的对面,并在AlphaGo的板上放了一块石头。欢相信新版本的Zen将会以3:0或2:1的分数获胜。

DeepMind解决了一个真正困难的任务。根据游戏规则,两个对手将黑白石头放置在一定大小的棋盘上(在专业游戏中为19×19)。可以捕获石头,禁止某些动作,还有一些规则因游戏版本而异。但是目标始终是一个目标:一个挡在更大领土上的人获胜。

对于计算机系统来说,向外简单的桌面娱乐非常困难:19×19板上的棋子可能比8×8板上的棋子多一百个数量级。石头不会减少,更多的石头-您无法为聚会的结局建立基础。从最初的举动中,您可以快速推断出无法预见的新情况。所有这些使功能强大的计算机系统的创建变得复杂。

go的第一个程序创建于70年代。自80年代初以来,世界锦标赛就一直在计算机程序中举行。长期以来,汽车让残障人士失去了9块或更多的石头。直到今年初,四残障成就被认为是一项成就

最新的技术是木材搜索或蒙特卡洛方法,这是一个具有良好举动数据库的专家系统。在DeepMind,将政治和价值的神经网络添加到了蒙特卡洛方法中。从第六名到第九名,他们在来自KGS玩家服务器的16万场比赛的帮助下接受了培训。然后系统对该系统进行了大量研究。结果是击败了第2个职业丹的第一个欧洲冠军,然后击败了第9个职业丹的韩国冠军。

对于Google而言,发展的意义不仅是解决理论问题的方法。这是一个值得骄傲的好理由。搜索共同创始人谢尔盖·布林(Sergey Brin)和其他著名员工参加了比赛。他们都想看到公司胜利的时刻。

最近,人工智能系统在相同的神经网络上获得了发展势头。如今,几乎每个口袋里的人都有一个智能语音助手,可以用人类语言回答问题:Siri,Google Assistant或Cortana的Google Now。公司喜欢提醒您,这只是其AI成就的冰山一角。例如,谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)在上个月展示谷歌Pixel智能手机时的开幕致辞中提到,AlphaGo击败了最优秀的人。她提醒一下驱虫在新机器翻译系统指示英语←→中文和高级图像识别与语音识别算法之间的某个位置。

Google的胜利距离很远。这场比赛在韩国首都举行,成为了为发展人工智能系统创建一个万亿韩元(8.6亿美元)的基金的原因其他计算机执行系统的开发人员熟悉DeepMind和AlphaGo研究的报告,并改进了他们的系统。很少有人愿意忍受如此成熟的围棋程序新手。

深禅


3月1日,甚至在AlphaGo比赛开始之前,Zen Yoji Ojima的创建者Lee Sedol和日本公司Dwango 宣布了合作创建Deep Zen Go的分布式版本。对于Ojima来说,Zen是一个业余项目,他无法认真地花钱。该公司准备提供设备和机器学习专家。开发团队还得到了东京大学的深度学习团队和Ponanza程序开发人员的协助,该程序是世界上最成功的计算机将军系统,其性能胜过专业人士。



最终目标是击败AlphaGo,其成就期限为六个月至一年。该程序的作者说,由于更好的模式识别,AlphaGo具有500个Elo评级点的优势。 Zen的创造者认为,他们可以通过改进模式识别来获得400分,而从其他修改中获得200分。但是,仅根据与范慧的比赛得出这些估计值。

工作已经开始。该项目从该计划的第十一个版本的分支开始,从今年3月1日开始计算。在第十二版中,出现了机器学习的第一个发展。在版本12.2中,集成了价值神经网络。 9月,机器学习出现在12.4版中。如何的开发商,他们的目的不是做一个副本AlphaGo,但在自然的文章的工作时间考虑在内。

Zen的真正性能不仅仅是开发团队的报告。可以在KGS服务器上“触摸”该系统,以进行在线游戏,几年来,不同版本的Zen一直在进行闪电战15秒。自3月以来,Zen机器人的等级逐渐提高。首先数百最好出现中Zen19,Zen19X的下一个版本进入了他们的神经网络的费用在排名前50位,Zen19A击中二十名。

Zen19K并在KGS服务器上收到第8旦-此版本具有价值神经网络。从物理上讲,该播放器看起来像是带有两个四核Intel Xeon处理器E5-2623 v3Kurisu服务器和四个视频加速器Nvidia GTX Titan X(Maxwell)。此版本已与专业人士竞争。例如,在8月30日,俄罗斯专业选手和多个欧洲冠军Ilya Shikshin 输给了机器人,并获得 31

Zen19K2僵尸程序的最新版本首次在服务器上达到了第9 dan,并达到了评级的第一行。值得注意的是,该服务器在欧美更受欢迎,亚洲专业人士很少使用它。


从2016年9月8日到11月15日,Zen19K2机器人程序评分增长图表。

与男人决斗


禅宗在与人的正式比赛中显示出进步。在2016年3月,Zen成为由日本电子通信大学举办的第九届go电脑杯的获胜者。这项比赛被认为是围棋比赛的计算机程序中的世界冠军。他们演奏了除AlphaGo之外所有功能最强大的程序-可能是Google决定在这里没有任何证据。作为比赛的获胜者,Zen程序与日本Kobayashi Koichi(第9个职业丹)一起在3个障碍盘上进行比赛并获胜。

7月27日,作为欧洲锦标赛的一部分今年在圣彼得堡举行的禅宗体系中,有2个障碍球与最强的女职业选手之一的Cho Heyang(9个职业丹)对决。禅宗再次变得更坚强。该程序在与人平等的基础上逐渐进入游戏。

为了向世界介绍AlphaGo,DeepMind与地理上最丰富,经验最丰富的专业人士进行了比赛。这是一个类似的时刻:根据开发人员的说法,该系统已达到与Fan Hui匹敌的AlphaGo水平。几天前,Deep Zen Go 被选为新的竞争对手


从左到右:Zen的开发人员之一是Kato Hideki和Cho Chikun。

曹提坤 -第九个专业的60岁的硕士是从日本获得的,日本是80年代和90年代世界上最强大的大师之一。在他的职业生涯中,他赢得了一百多次大型比赛。对阵他的三场比赛将于11月19日,20日和23日举行。这将是三场比赛,日本将为白色比赛获得6.5 Komi的日本补偿点,而大型聚会的标准则是持续两个小时并击败3×60秒。

一台强大的服务器,散热能力高达几马力,将对一个人产生影响:两个22核Intel Xeon E5-2699v4处理器,四个Nvidia Titan X  (这次是最新的Pascal),128 GB RAM,128 GB固态驱动器(系统)和两个480 GB。

有趣的是,李·塞多拉(Lee Sedola)击败了AlphaGo,后者在1920个处理器内核和280个视频加速器的Google Cloud Platform中运行。根据《自然》杂志上的一篇文章,在77%的情况下,未分配的版本会丢失分布式版本。但是根据DeepMind报告,常规的,未分配的AlphaGo版本也不是那么弱。右图比较了AlphaGo在单台计算机上的性能,并以分布在多个服务器群集中的形式比较了性能。



这些游戏将在线流式传输,并带有日语注释。目前尚不清楚官方评论是否将使用英文。

11月19日,星期六。广播开始时间:莫斯科时间06:30(日本时区12:30)。游戏开始:莫斯科时间07:00(JST 13:00)。第一局
11月20日,星期日,同一时间。第二局
11月23日,星期三,同一时间。第三局

如您所见,这三场比赛都在官方周末举行。 11月23日在日本,节假日丰富,但在日本感恩节这一天和节假日则较差



几天后,将确定与Tikun的比赛结果。人的力量可以被预测和预测。但是对AlphaGo知之甚少:自3月以来我们还没有见过一场公开赛。在此期间,DeepMind的发展开始发挥了多深的作用还不得而知。 Deep Zen Go持续改进:开发人员希望他们的程序能尽快达到2016年3月的AlphaGo水平。

对于一家综合性的技术巨头来说,即使在一个象征性的方向上也不能将AI置于首位的桂冠。但是,Google有更多资源。但是,如果各方安排决斗,新的亚洲发展项目将能够在官方比赛中击败AlphaGo,但不要失去希望。但是,首先,该程序需要学习如何打败人。

作者感谢go_secrets组为撰写本文提供的帮助

Source: https://habr.com/ru/post/zh-CN399127/


All Articles