人工智能,强大而又不是很



4月4日至7日,由NVIDIA组织的专门针对并行计算和人工智能的会议在圣何塞举行。接下来,我想分享一下我受此事件启发而对AI领域的现状和发展前景的看法。

关于人工智能的推理可以分为两种类型。第一类是谈论当计算机出现时将发生什么以及人类的命运。探索人与思维机之间关系的可能选择。讨论了与人类意识可能转移到计算机外壳有关的永生主题。也许主要的问题正在提出-如果一个人创造的思想远胜于自己的思想,那么他将与谁在一起?进化的主人,奴隶,死胡同或共生的参与者?
第二类是对方法的讨论,从理论上讲,这应该导致创建成熟的人工智能和方法,这些方法现在已经可以帮助解决复杂的智力问题。

主要的分水岭贯穿着机器的“合理性准则”。这称为将人工智能分为强项和弱项。弱AI意味着计算机具有解决信息问题的能力,例如,确定图片中显示的内容或将语音声音转换为相应的文本。强大的AI意味着计算机不仅可以操作信息,而且可以某种程度上理解其含义。例如,如果一台计算机从一种语言翻译成另一种语言时,只是根据预定的不变规则简单地用一个词替换了另一个词,那么这就是一个弱AI,但是如果它是从理解短语的含义而来的,那么它已经接近于强词了。

强AI的标准是著名的图灵测试。如果在通过匿名通信渠道与计算机通信时,您不知道谁是另一端的人,人或机器,那么我们可以假定这种对话者计算机确实在想。该测试的本质是,有多少人不记得人们对某些问题给出的答案,有多少人没有积累在特定时刻相关的短语,总会出现“机械”答案的情况。

Microsoft Tay的聊天机器人是“未能通过测试”的最新示例。您可以通过Twitter或Messenger Kik和GroupMe与他聊天。在与用户交流一天之后,聊天机器人变得激进起来,开始称赞希特勒并责骂犹太人。



这种行为的原因根本不是与他交谈的人“睁开了他的眼睛”。原因-到目前为止,机器的无能力将更接近于理解短语的含义。当聊天机器人记住与当前对话类似的内容时,他可以使用人们在这种情况下所说的短语,以期获得合理的信息。或者,机器人可以尝试确定对话的主题,例如,通过对话者使用的单词和措辞建议一个或另一个主题的程度。确定了对话的主题之后,他可以尝试从具有相似主题的对话中选择短语,或者使用嵌入其中或从Internet收集的该领域的知识。通过此策略,您可以创建合理对话的外观,但只能创建可见性。虽然,也许这还不错。有时在公司第五或第六次来临时,当完全不需要交流来仔细聆听与您交谈的人时,如果此时此刻有人被聊天机器人所取代,那么也许这不会立即引起注意。

比起谈论免费主题,计算机明显更好,它可以理解命令和形式化查询。如果机器期望得到非常明确的处理,则任务将大大简化。根据这一原则,无论Siri和Ok,Google都能成功运行。

会议上有很多关于IBM Watson超级计算机的活动。沃森(Watson)的主要思想是用自然语言理解对话,将其翻译成计算机友好的描述,使用各个领域的知识库来找到适当的答案。



2011年2月,沃森(Watson)赢得了危险电视节目! (俄语对应为“我的游戏”)。此外,他不仅击败了竞争对手,还击败了两个冠军,即该计划最大赢家的所有者布拉德·鲁特(Brad Rutter)和双赢系列赛期间的纪录保持者肯·詹宁斯(Ken Jennings)。这台计算机赢得了100万美元的奖金。 NVIDIA开玩笑说赢了,他们不知道一百万台计算机会做什么,但是从强化训练方法的角度来看,必须说这是一种很好的强化。尤其要注意的是,沃森与玩家之间处于平等地位,因为他没有连接到互联网。为了纪念沃森,“整个互联网”已预先上传,至少是4 TB大小的重要部分。对于结构化数据而言,这是很多,足以考虑到整个Wikipedia占用17 GB的数据。



游戏中最重要的事情是,对问题的回答没有任何简化和额外的说明。这意味着在某些情况下,计算机确实能够正确确定所需的内容并在其知识库中找到它。但是沃森真的了解所提出问题的实质吗?不,我不了解,至少不是人们了解的方式。战斗的实质是什么?人们能够理解所提出的每个问题,但无法始终在他们的记忆中找到答案。计算机不理解问题的含义,但是使用算法将它们翻译成某种搜索形式,从而在其结构化内存中找到了相当准确的匹配项。沃森(Watson)的胜利表明,与理解和较差的记忆力相比,算法加上良好的记忆力可以提供更大比例的正确答案。如果人们可以访问Internet并且没有设置严格的时间框架,那么游戏的结果将有所不同。

IBM Watson尚不能归因于强大的AI,但这并不影响其优点。与理解自然语言相关的主要问题是,取决于词组的上下文,同一单词中可能会出现多种解释。但是,如果对话进入一个更特殊的领域,那么事实证明,许多领域几乎决定了唯一可能的解释。在这一点上,计算机的成功显着增加。意识到这一点,沃森的开发人员专注于各个主题。例如,IBM超级计算机的最大突破也许与医学诊断有关。 Watson可以轻松地以自然语言进行医学话题的交谈,因为所说的所有内容仅在医学意义上进行了解释。拥有庞大的病历数据库,在诊断和治疗课程方面,计算机能够以优秀医生的水平展现自己,并且在某些领域(例如,肿瘤学)以出色的水平展现自己。这并不意味着现在应该忽略在世的医生,而应该理解它,以便使医生有宝贵的机会通过与Watson协商来检查其发现或获得其他想法。我将把自行车带到这个话题。

莫斯科八十年代中期。
关于在医学中使用计算机的医学会议。所有参与者都同意,不久的将来,计算机将取代医生……他们将做出诊断,而人们将只有程序上的措施。
在会议结束时,一位年迈的医生表达了要成为院士和医生的愿望。在热烈的掌声中,他几乎没有登上领奖台……参加活动的党派人士认为,受人尊敬的医生对这种创新的支持将是一个好兆头。党的人民委员。这是一个非常困难的案例,以前的八位医生无法诊断出患者。我的老师对这名妇女一目了然;他立即下令分析Wasserman的反应。那么,亲爱的同事们,告诉我,什么样的计算机可以仅在一种类型的患者中立即诊断出梅毒*?

返回沃森。 IBM走了创新之路一个开放的API,任何人都可以使用Watson的知识和自然语言界面将其集成到他们的业务中。 IBM正在尝试创建许多认知服务,例如语音和图像识别,自然语言的查询分类服务,翻译成另一种语言,确定语音和文本的情感色彩等。将来,他们看到许多公司将能够将其大部分语音客户支持转移到Watson的技术上,这将节省大量资金。简而言之,呼叫中心的许多印度人可能没有工作。

当可以转移到缩小解释空间的特殊任务时,AI会开始变得更好用的想法不仅适用于自然语言分析,而且还适用于例如图像分析。原则上,这是构建没有驾驶员的汽车控制系统的基础。当将人工视觉系统显示为图片并确定该图片中的内容时,该确定很有可能发生。对于一只有老虎斗篷的狗,系统可以说它是老虎。旅途中一切都变得更容易,可以满足的对象数量也不大,这意味着选择和解释非常有限:行人,汽车,公共汽车,路标,标记,但没有老虎,不是鲸鱼和婚礼蛋糕。

无人机控制使用许多技术,其中一些是:
  • 模式识别,负责识别道路上的各种物体;
  • 处理一系列具有偏移的图像,它使您可以在其他背景下选择单个对象;
  • 立体图像处理使您可以建立深度和距离的地图;
  • 使用激光雷达可以补充距离图的构建,或者允许您从头开始构建它,例如在完全黑暗的环境中。有一天福特表现出色 ;
  • 强化培训,提供有关驾驶和驾驶规则的培训。


会议厅里有三辆来自奥迪,沃尔沃和宝马的无人驾驶汽车。所有这些控件,不仅是它们,都具有基于NVIDIA DRIVE解决方案构建的控件该解决方案本身包含三个组件:
  • NVIDIA DRIVE PX-自动驾驶平台;
  • NVIDIA DRIVE CX-带有导航系统的车载计算机,如果PX知道如何去,那么CX知道去哪里以及如何招待乘客;
  • NVIDIA DIGITS DEV BOX是一个深度学习系统,可让您训练PX的神经网络。






自动驾驶给人留下了深刻的印象。AI的所有荣耀。我特别喜欢丰田展示的关于如何学习如何驾驶无人驾驶汽车的视频。起初,他像一只瞎猫一样,四处张望,不断刹车,然后更加自信地移动,最后,经过3000英里的奔跑,他开始自信地在任何道路上奔跑。



丰田汽车公司通过丰田研究所派代表参加了会议。研究所首席执行官吉尔·普拉特(Gill Pratt)宣布,该汽车制造商打算在未来五年内投资10亿美元用于AI相关研究。丰田的做法很有趣。他们说,他们不认为全自动驾驶是重中之重。现在,例如在特斯拉中实施的自动驾驶仪需要“方向盘上的手”模式。也就是说,他可以驾驶,但需要驾驶员不断监控。与增加旅行乐趣相比,此模式很烦人。丰田公司专注于驾驶员辅助系统,也就是说,在一切正常的情况下,自动驾驶仪不会干扰控制,但是如果情况失控,自动驾驶仪将一切都掌握在自己手中并保存了情况。很少有驾驶员在极端情况下有驾驶经验,正常驾驶与在紧急情况下的行为无关。在这种情况下,可以对自动驾驶仪进行严格的培训。每年有1,200,000例道路死亡-这是地球上的统计数据。根据丰田公司的说法,他们的系统会将这一数字降低到几乎为零。正如吉尔·普拉特(Gill Pratt)(回忆)回忆:“我们的系统需求不应该考虑到汽车,急需它的消费者每年有120万人。”“我们的系统需求不应该考虑到汽车,急需它的消费者每年有120万人。”“我们的系统需求不应该考虑到汽车,急需它的消费者每年有120万人。”

但是,无论有没有驾驶员驾驶的汽车看起来多么令人惊讶,自动驾驶仪都不是强大的AI。到目前为止-这是一组好的方法和算法。此任务可能不需要更多。
无需使用强大的AI即可成功解决许多任务,例如无人驾驶。带有深度学习的神经网络(或深度学习,如果您喜欢深度学习的这种翻译)非常适合于“额头编程”停滞不前的情况,事实证明,将神经网络与大量训练示例和主题一起“馈电”要容易得多从而教给她正确的分类,而不是尝试描述所有模式以及对它们的反应。

但是奇迹不会发生,获得结果的简单性会因训练的复杂性而得到补偿。在大量示例上训练包含大量元素的神经网络需要大量计算。传统的CPU对于此类计算而言太慢了。唯一的救助是计算的大规模并行化,因为神经网络非常擅长于此。最初创建用于形成图形图像的GPU几乎是完美的解决方案。神经网络市场的需求迫使GPU制造商考虑到铁结构中此类应用程序的功能,并促使他们创建合适的软件,使开发人员的工作更加轻松。在会议上,NVIDIA作为GPU的主要制造商,试图说服所有人他们创建了完整的必要软件堆栈,为神经网络开发的所有阶段提供支持。

正如我已经写的,在会议上,NVIDIA在DGX-1超级计算机的深度神经网络训练领域取得了突破。一个突破是学习任务的生产率比以前提高了12倍。

图片

因此,该生态系统不仅包括铁,还包括针对深度学习进行优化的全套程序(https://developer.nvidia.com/deep-learning#source=pr)。
DGX-1软件套件包括NVIDIA深度学习GPU培训系统(DIGITS),用于创建深度神经网络(DNN)的完整交互式系统,以及用于创建DNN的GPU加速原语库-NVIDIA CUDA深度神经网络(cuDNN)版本5
此外,该系统包含几种广泛使用的深度学习框架(Caffe,Theano和Torch)的优化版本。 DGX-1还提供对基于云的管理工具,软件更新和容器应用程序库的访问。”

总的来说,在会议上,NVIDIA显然试图向所有人传达这样的想法,即他们长期以来不仅是专用芯片的制造商,而且是一家具有总体技术远景并提供集成解决方案的公司,在该解决方案中,铁只不过是一个事实,而事实并非如此。主要组成部分。

简而言之,AI跨越式发展。但就目前而言,所有这一切都是薄弱的人工智能。 “弱”一词不应被视为负面评估。这只是对所用技术的改进。通过计算机翻译系统可以轻松判断我们与强大的AI有多远。在翻译技术或其他易于理解的文本时,机器翻译器可达到标准水平。但是值得举一个例子,要求理解该短语的含义,正确的翻译如何成为一个偶然的问题,没有任何统计方法可以挽救这种情况。

IBM的Deep Blue在1997年与国际冠军Garry Kasparov的国际象棋比赛中赢得了6场比赛。 Google的AlphaGo最近击败了世界上最强大的Go播放器。这预示着强大的AI时代即将来临?一个机器人迈出了一大步,但人类却没有什么进步。我们看到了一种很好的教学方法,并且得到了加强,但有一个重要的“但是”。事实是,象棋和围棋都可以对位置进行相当简单和准确的描述。行为策略是建立在这样的理解之上的:我们对职位的熟悉程度在某种程度上是熟悉的,并且我们可以利用所获得的经验来做决定。为了不计算所有选项,最后对情况质量进行了评估,这使您可以评估位置而无需计算选项以进行可能的继续。在两种情况下,事实证明最重要的是能够从职位的正式描述中获得影响其评估的所有语义元素。对于国际象棋和郭来说,这虽然不容易,但是却可以解决。在生活中,一切都变得更加复杂。对正在发生的事情的外部“原始”描述对确定行为策略和评估情况的质量没有多大帮助。您无法通过某些符号的重合来判断情况的相似性。它需要了解正在发生的含义。任何次要细节对于确定正在发生的事情可能至关重要。因此,如果没有障碍物,不违反交通规则并遵循路线,则Google移动将继续沿道路行驶。而且,他不会被地平线上的核蘑菇,或僵尸们紧张地站在场上而感到困惑。但事实证明。在生活中,一切都变得更加复杂。对正在发生的事情的外部“原始”描述对确定行为策略和评估情况的质量没有多大帮助。您无法通过某些符号的重合来判断情况的相似性。它需要了解正在发生的事情。任何次要细节对于确定正在发生的事情可能至关重要。因此,如果没有障碍物,不违反交通规则并遵循路线,则Google移动将继续沿道路行驶。而且,他不会被地平线上的核蘑菇,或僵尸们紧张地站在场上而感到困惑。但事实证明。在生活中,一切都变得更加复杂。对正在发生的事情的外部“原始”描述对确定行为策略和评估情况的质量没有多大帮助。您无法通过某些符号的重合来判断情况的相似性。它需要了解正在发生的含义。任何次要细节对于确定正在发生的事情可能至关重要。因此,如果没有障碍物,不违反交通规则并遵循路线,则Google移动将继续沿道路行驶。而且,他不会被地平线上的核蘑菇,或僵尸们紧张地站在场上而感到困惑。任何次要细节对于确定正在发生的事情可能至关重要。因此,如果没有障碍物,不违反交通规则并遵循路线,则Google移动将继续沿道路行驶。而且,他不会被地平线上的核蘑菇,或僵尸们紧张地站在场上而感到困惑。任何次要细节对于确定正在发生的事情可能至关重要。因此,如果没有障碍物,不违反交通规则并遵循路线,则Google移动将继续沿道路行驶。而且,他不会被地平线上的核蘑菇,或僵尸们紧张地站在场上而感到困惑。

创建强大的AI不仅与算法(使用传统方法)对信息进行操作的能力直接相关,而且与理解其含义的能力直接相关。这项任务似乎很困难,特别是因为它与理解大脑的工作直接相关,因为这种机制恰好能够发挥意义。强大的AI会很快到来吗?也许很快。在下一篇文章中,我将描述我们团队在意义概念的数学形式化以及基于此的模型构建方面的发展,该模型声称对大脑具有很好的描述,因此令人信服地显示了一个很好的工作样本。因此,也许不久之后在商店中您就会听到这样的对话:

卖方:这是一种新颖的大脑植入物,可以减轻一半的精神负担。
买家:太好了!卖给我几个。

Source: https://habr.com/ru/post/zh-CN393071/


All Articles