俄罗斯是否有机会在“人工智能马拉松”中发挥领导作用



如今,计算机程序开始取代会计,销售人员,翻译甚至记者。 根据联合国的一份报告,机器人将很快占据发展中国家可用工作的2/3。 科幻电影的真实性如何?现在有可能谈论人工智能的全面发展吗?

为了回答这个问题,我们将跟踪俄罗斯和国外AI在分析,交流和创造方面的主要功能的发展。 人工智能科学的一个细分,称为机器学习,其任务是“训练”计算机进行“思考”(并因此分析数据,识别隐藏的模式并在它们的基础上解决复杂的问题)。 毫不夸张地说,这些研究处于科学的“前沿”;世界上最大,技术最先进的公司(包括Google,Microsoft和IBM)都在朝着这个方向努力。 他们开发的服务(例如Google Predictions API,Microsoft Azure和IBM Watson)使您可以基于大型结构化数据创建知识模型。

图2. Internet上的信息演变。

重要的是要注意,此类服务中的数据处理算法不是硬编码的,它们可以独立识别模式并得出某些结论。 麻省理工学院的《技术评论》将基于所得结果的机器学习(强化学习,即程序进行实验并从错误中“学习”)列入2017年最先进的10项突破性技术中。

IBM Watson已经能够以比经验丰富的诊断医生高出几倍的准确度诊断癌症。 计算机技术的指数增长(如图所示)证明了此类系统功能的加速发展。 还应该注意的是,尽管这些程序技术复杂,但它们具有简单友好的界面,允许任何用户使用它们。


图3.计算能力的指数增长(Raymond Kurzweil撰写)。

俄罗斯正在开发类似的系统。 因此,斯科尔科沃机器人技术中心负责人阿尔伯特·埃菲莫夫(Albert Efimov)宣布开发了Sotsmedika系统,据创建者称,该系统应该成为上述Watson项目的“真正竞争对手”。

俄罗斯的另一项发展是Cognitive Systems公司的Brain2平台,该平台专注于AI系统知识的神经模型中大数据的快速处理。 例如,在1461个房地产对象的79个参数上训练的用于评估房地产价值的神经模型(房屋价格)能够以很小的误差(RMSE = 0.42)来预测该对象的价值,这相当于对经验丰富的房地产专家的评估。 同时,模型训练只花了20分钟。 为了进行比较,使用最好的免费机器学习库Keras(TensorFlow),经验丰富的数学家程序员将花费至少30个小时来解决类似的问题,并且结果会略好一些(RMSE≈0.32)。



相片








由于项目融资的显着差异,国内的发展并不逊色,甚至超过了国外。 因此,在Google Prediction服务中创建的用于解决已经提到的Kaggle House Price任务(用于在机器学习专家之间进行竞争的服务)的模型显示,RMSE = 7000,比Brain2差了数万倍。

地图上还显示了其他俄罗斯AI项目:


图4.俄罗斯AI地图。

然而,机器分析功能的发展不是新闻,而是现代AI在多大程度上可以与人类进行交流? 此类通信的最著名示例是分别安装在Apple和Android设备上的Siri和Google Assistant助手。 这两个程序在识别自然语音和完成小任务(写消息,做笔记)方面都取得了重大进展,但是他们还没有学会如何综合自己的问题答案,因为Siri和Google Assistant都可以通过“阅读”发现的句子来回答问题。 Alexa由亚马逊于2014年推出,工作起来有点辛苦-它根据现成的模板综合答案。 最后,目前最先进的技术是中国机器人小楠,该机器人以1秒钟内写300个字符而著称。 该程序合成的文本示例如下:“苹果公司在华尔街的第一季度收益预测”; “八月份消费者价格指数上升了2%,达到了12个月的历史新高。” “安州绵阳发生了4.3级地震”,“奥运会,女子乒乓球单打决赛中丁宁(中国)4-0轻松晋级。”

当然,小楠将无法替代这个人-一名记者:文字的连贯性存在问题,此外,小楠无法进行采访和提出其他问题。 但是,该项目是机器人在没有显式模板的情况下查找并合成任意文本的少数项目之一。

那我们呢? 根据成千上万的Google Play用户的评分进行的琐碎比较显示,由国内开发人员创建的Dusya语音助手并不逊色于同一Google Assistant。 Dushi的限制与其他语音助手的限制相同-该程序仅提供对问题的现成答案(尽管Dushi系统允许您通过编写脚本来创建自己的功能,这从根本上不会改变程序的功能,但会稍微扩大范围)。 前面提到的Brain2可以综合自己的问题答案。



例如,基于Sberbank策略文本开发的神经模型(更准确地说是7个具有FuzzyArt结构的多层神经贝叶斯模型)能够搜索与查询相关的标记,并以句子的形式从中合成答案。 这样的模型可以用作“智能”聊天机器人助手,并且系统答案的单词选择精度为0.86,从所选单词合成答案的正确性达到0.91。


图5. Brain2Text模型

近年来,不仅机器思维的分析和交流,而且其创造功能也在积极发展。 其中最困难的是有意义的诗歌。 在这些成就中,可以着重强调Google与斯坦福大学和麻萨诸塞州大学之间的一项联合项目,该项目旨在教AI编写诗歌。 获得的结果之一如下:

世界上没有其他人。
看不到其他人。
他们是唯一重要的人。
他们是唯一剩下的人。
他必须和我在一起。 她必须和他在一起。
我必须这样做。 我想杀了他。
我开始哭了。 我转向他。

国内开发商也不甘落后。 因此,Yandex的员工Alexei Tikhonov和Ivan Yamshchikov发行了专辑Neural Defence,其中包含由机器人编写的歌曲和诗歌。 他们创建的算法以民防组织的创始人Yegor Letov的风格编写文本,Tikhonov和Yamshchikov进行了编写。 专辑开头是“等待奇迹,不可能的奇迹”。

“认知系统”公司的另一个俄罗斯项目“普希金”的目的是教AI用俄罗斯诗歌的阳光(4英尺歧义的四行诗)的风格创作诗歌。 为此目的,已经开发了用于定义和选择押韵,单词重音的模型,针对一组单词和文本组合的语义关联模型正在进行中。


图6. Pushkin项目

也许明天我们将生活在一个新世界中。 在程序可以解决复杂问题的世界中,例如驾驶汽车,建造房屋,进行诊断和外科手术,所有这些都在我们的控制之下,同时又能保持人机对话。 俄罗斯能否在这个新世界中占据应有的地位? 时间会证明一切。 可以肯定的是:在我国“人工智能马拉松”中,起跑位置还不错。

参考文献:

1) 机器人威胁着发展中国家多达三分之二的工作,但也可能是一个机会 //贸发会议。
2) 2017年10项突破性技术//麻省理工学院技术评论。
3) E. Konchalovskaya:到2030年,计算机和机器人可以从事哪些工作? // TheQuestion Portal。
4) Skolkovo居民将帮助医生不要犯错误 // // Polit.ru
5) 机器人记者Xiao Nan在第二个门户网站“新闻”中写了第一篇文章
6) 小南方 //南方都市报。
7) Google AI项目撰写的诗歌可以使Vogon感到自豪 // The Guardian。
8) 神经防御 // Yandex音乐。

Source: https://habr.com/ru/post/zh-CN402627/


All Articles