人工智能是一个移动的目标。 这里是如何最好地针对它。

人工智能(AI)似乎从四面八方包围着我们。 我们在家里和电话上遇到他。 根据企业家和商业创新者的说法,我们甚至没有时间发挥自己的见识,如何在我们购买和使用的几乎所有产品和服务中都使用AI。 此外,
其在解决业务问题中的应用范围也在飞跃增长。 同时,人们对AI出现的后果的怀疑越来越多。 我们担心自动化将如何影响工作场所,工作机会和社会。
有时,在关于Alexa,Siri和AlphaGo的头条新闻的恐惧与胜利之间,现实就迷失了,因为AI技术-机器学习及其子集,深度学习-有许多局限性,克服这些局限性需要大量的努力。 本文介绍了这些局限性,并应有助于董事更好地理解究竟是什么阻碍了他们实施AI的尝试。 我们还将介绍一些有希望的突破,旨在消除一些限制并创造新的机遇。
我们的前景取决于最前沿的工作-研究,分析,评估数百个实际使用案例-以及与AI相关领域的一些高级思想家,科学家和工程师的协作。 我们试图从他们的经验中汲取精华,并为企业主管提供帮助,正如我们的经验所表明的那样,它们通常仅由他们自己的主动行动来指导,并且并不总是很好地了解前沿技术或人工智能已经具备的功能。
简而言之,人工智能的问题和局限性为领导者带来了“移动目标”问题:由于领导者不断变化,他们很难走到最前沿。 当尝试使用AI遇到现实障碍时,这通常也会令人沮丧–这可能会降低进行进一步投资的动力或导致“观望”的观点,而其他观点将继续突飞猛进。 麦肯锡世界研究所最近的
一项研究表明,领导者与使用AI的人之间的差距越来越大-这可以在比较不同行业以及每个行业中看到(图1)。
图表1:在不久的将来,人工智能领导者将在其中进行更多的投资。 纵向:估计未来三年AI支出的增长百分比; 横向:已经使用AI的公司所占百分比试图弥合鸿沟的董事应能够以知情的方式与AI合作。 换句话说,他们不仅需要了解AI可以在哪些领域促进创新,想法和决策,从而提高利润和效率,还需要了解AI尚无法提供帮助的地方。 此外,他们必须接受技术和组织约束之间的关系和差异-文化障碍,缺乏可以为企业创建交钥匙AI解决方案的员工以及将AI嵌入产品和流程的“最后一英里”问题。 如果您想成为一位了解某些会阻碍AI发展的关键技术问题的领导者,并准备利用可以克服这些局限性并可能改变AI发展道路的有前途的发展,请继续阅读。
挑战,局限和机遇
一个有用的参考点将是了解深度学习(GO)技术的最新进展。 这些可能是AI领域中最令人兴奋的发展,并且在没有传统监督的情况下,它们在分类和预测效率方面实现了爆炸性的增长。 GO使用了大型神经网络,该网络能够包含数百万个分层分布的模拟“神经元”。 最常见的网络选项称为
卷积神经网络 (SNA)和
递归神经网络 (RNS)。 这些神经网络使用训练数据和
反向传播算法进行训练。
尽管在这一领域已取得了令人瞩目的进展,但仍有许多工作要做。 关键时刻是将AI调整为特定任务和可用数据。 由于这些系统不是经过编程的,而是经过培训的,因此要准确执行复杂任务,其工作的各种过程通常需要大量的标记数据。 获取大型数据集可能很棘手。 在某些地区,它们可能根本不存在,但是即使存在,标签也可能占用大量的人力资源。
此外,在这些模型中,可能很难破译在GO的帮助下训练的数学模型如何得出某种预测,推荐或解决方案。 即使黑匣子实现了其目的,其用途也可能受到限制,尤其是在其预测或决定影响社区并产生与人类健康有关的后果的情况下。 在这种情况下,用户经常需要知道“为什么”(例如,算法对这些建议的精确程度),如果其行为可能产生法律或监管后果。 在这种情况下,为什么某些因素而不是其他一些因素至关重要?
让我们研究五个相互关联的因素,在这些因素中,这些局限性以及为克服这些局限而出现的新选择开始发挥作用。
限制1:数据标记
大多数现代AI模型都是使用“监督学习”进行训练的。 这意味着人们必须对源数据进行标记和分类-这样的工作可能很困难并且容易出错。 例如,机器人公司正在雇用数百人来手动标记许多小时的视频,以帮助培训这些系统。 同时,出现了新的有前途的技术-例如,流控制(由Microsoft Research的Eric Horvitz及其同事演示),其中可以在自然使用期间标记数据。 不受控制或部分受控制的方法减少了对大型,带标签数据集的需求。 两种有前途的技术是
强化训练和
生成竞争性网络 。
加强培训。 这种无监督的学习技术允许算法通过反复试验简单地学习。 该方法使用胡萝卜和棍子方法:对于每次完成任务的尝试,如果算法的行为成功,则该算法将获得奖励(例如,高分),否则将获得惩罚。 随着重复次数的增加,效率也会提高,并且在许多情况下,只要学习环境与现实世界相对应,效率就会超出人类的能力。
强化学习因在教学计算机中使用计算机游戏而闻名-最近,GP也已内置到该方案中。 例如,在2017年5月,它帮助
AlphaGo AI系统在围棋比赛中击败了世界冠军
Ke Ze 。 再例如,Microsoft已开始提供受益于强化学习并适应用户偏好的服务。 强化学习的潜在应用适合各种类型的企业。 其中的可能性包括:使用AI进行证券交易,它会因获得或失去金融而获得或失去积分; 产品推荐引擎,根据推荐做出的每笔销售都可获得积分; 构建货物运输路线,按时交货或减少油耗获得奖励的软件。
强化学习还可以通过开发前所未有的解决方案,甚至有经验的玩家也从未想到过使用的策略,来帮助AI超越人类标记的自然和社会局限性。 例如,最近,使用新型强化训练的AlphaGo Zero系统通过学习从头开始进行打败,击败了其前身AlphaGo。 这意味着从与您自己完全随机的游戏开始,而不是在人们和人们玩的游戏中进行练习。
生成对抗网络(GSS)。 在这种带有部分控制的训练模型中,两个网络相互竞争,以提高和完善他们对某个概念的理解。 例如,为了识别鸟类的外观,一个网络试图找出真实和伪造鸟类图像之间的差异,而其竞争对手试图通过发行与鸟类图像非常相似的图像来欺骗它,而不是那些。 当开始绘制两个蚊帐时,每个模型中鸟类的表示都会变得更加准确。
GSS提供越来越合理的数据示例的能力可以大大减少人们标记数据集的需求。 例如,为了训练在医学图像中识别肿瘤的算法,通常将需要数以百万计的人标记图像来指示肿瘤发展的类型和阶段。 使用受过训练以产生越来越逼真的各种类型肿瘤图像的GSS,研究人员可以训练肿瘤识别算法,将一个较小的人为标记数据数据库与GSS的输出相结合。
尽管使用GSS进行疾病的准确诊断仍远未实现,但研究人员已经开始在日益复杂的环境中使用GSS。 其中包括:以特定艺术家的风格理解和创作艺术品; 利用卫星图像和地理特征识别来创建快速发展的领土的相关地图。
限制2:获取大量培训数据集
已经表明,在某些情况下,使用线性模型的简单AI技术可以接近其他领域的医学专家的能力。 然而,当前的机器学习浪潮需要训练数据集-不仅是标记数据,而且数量庞大且全面。 GO方法需要成千上万条记录来编译能够进行分类的相对较好的模型,在某些情况下,甚至需要数百万条记录才能更接近一个人的水平。
困难在于,在许多商业案例中,此类海量数据集可能难以获得或创建。 任务中的每个小变化都可能需要另一个大数据集和新的培训。 例如,训练自动驾驶汽车在天气经常变化的采矿场附近移动可能需要一个数据集,其中包括机器可能遇到的各种环境条件。
一键式学习技术可以减少对大数据集的需求,并允许AI模型通过
少量的实际演示或示例(在某些情况下甚至是一个示例)来学习对象的特征。 只有熟悉一个示例(例如一辆皮卡车)后,AI的能力才能更接近一个可以准确识别同一类别的各种代表的人。 在仍在开发中的这种方法中,科学家首先在模拟的虚拟现实中初步训练模型,在模型中可以选择任务,或者在模式识别的情况下可以选择对象的图像。 然后,在模型为现实世界中的对象演示了几种选项(AI在虚拟现实中没有看到这些选项)后,他们将使用现有知识制定正确的解决方案。
这样一来,这种培训可以帮助创建一个系统,该系统仅在了解视频示例后即可扫描侵犯版权的文本或识别视频中的公司徽标。 如今,此类应用程序还处于早期阶段。 但是它们的有用性和有效性可以迅速扩展在各个行业中使用AI的可能性。
局限3:可解释性问题
可解释性对于AI系统而言并不是新问题。 但是它随着民防的成功和采用而增长,因此,不仅应用程序的种类在增加,而且应用程序的不透明性也在增加。 该模型越大,越复杂,就越难以人为解释来解释为什么做出该决定(如果一切都是实时发生的,则做起来就更加困难)。 这就是为什么某些AI工具的使用在可解释性有用甚至是不可解释的领域中没有得到如此广泛扩展的原因之一。 此外,随着AI范围的扩大,监管机构的要求也可能增加对具有高度可解释性的AI模型的需求。
增加模型透明度的两种新兴方法是局部可解释模型不可知性解释(LIME)和注意力技巧(图2)。 LIME试图确定训练后的模型主要基于输入数据的哪些部分来进行计算,以便开发出可解释的中间模型。 该技术一次查看多个数据段,并观察预测如何变化,以便微调中间模型并开发出更准确的解释(例如,排除眼睛而不是鼻子以检查哪个对脸部识别更重要)。 注意技术可以可视化模型做出特定决策时所依赖的输入数据部分(例如,专注于嘴巴以确定人物是否在图片中)。
图2一段时间以来使用的另一种技术是
通用加性模型 (OAM)。 使用具有一个功能的模型,OAM会限制功能的交互,因此,每个功能对于用户而言都变得更易于解释。 期望采用这些技术和其他试图消除AI神秘感的技术将大大有助于增加AI的使用。
极限4:学习的普遍性
与人类不同,人工智能模型很难将他们的经验从一套情况转移到另一种情况。 实际上,模型在特定应用程序中实现的所有内容仅适用于这种情况。 结果,尽管应用程序的任务非常相似,但是公司必须不断地花费资源来培训下一个模型。
应对这一挑战的一个有希望的答案是便携式学习。 通过这种方法,对AI模型进行了训练以解决特定问题,然后将其快速应用于相似但不同的工作。 DeepMind的研究人员在实验中展示了学习转移带来的可喜结果,在实验中,使用虚拟现实的训练已转移到控制真实的机器人肢体中。
便携式学习和其他通用方法正在不断发展,它们可以帮助组织快速创建新方法来为现有方法和工作方法应用新功能并为其添加新功能。 例如,当创建虚拟助手时,便携式培训可以将用户的偏好从一个区域(例如音乐)扩展到另一个区域(例如书籍)。 用例不仅限于数字产品。 便携式培训可以帮助,例如,石油和天然气公司将对预测井维护进行了培训的AI算法的使用范围扩展到其他设备,例如管道和钻井平台。 便携式培训,即使从原理上讲,也可以彻底改变业务分析:想象一个可以分析数据并了解如何优化航空公司利润,能够使其模型适应天气或当地经济变化的AI工具。
另一种方法是使用一些大致描述适用于各种问题的广义结构的方法。例如,DeepMind的AlphaZero在三种不同的游戏中使用了相同的结构:有可能使用这种通用结构在一天之内训练一个国际象棋的模型,以便后来在世界冠军计划中胜出。最后,想象一下新生的元学习技术试图自动化机器学习模型开发的可能性。例如,Google Brain团队使用AutoML自动化神经网络的开发,以对大型数据集上的图像进行分类。如今,这些技术与人类开发的技术一样有效。这种发展看起来很有希望,特别是由于许多组织缺乏人才的事实。元学习也有可能超越人类的能力并改善结果。重要的是要了解这些技术仍处于开发的早期阶段。限制5:偏差数据和算法
到目前为止,我们已经集中在已经开发的技术方法可以克服的局限性上,我们已经描述了其中的一些。偏差是另一种问题。当人类成瘾(有意识的或无意识的)决定使用哪些数据以及忽略哪些数据时,潜在的破坏性社会后果将等待我们。此外,当数据收集的过程和频率根据不同的组和行为而变化时,人们可以预料到算法将如何分析此数据,从中学习并做出预测的问题。不利后果包括:根据错误信息做出的雇用员工决定,科学或医学预测失真,财务模型不正确以及针对刑事案件的决定,错误的法律决定。在许多情况下,这种偏差在“先进数据科学”,“专有数据和算法”或“客观分析”的幌子下仍然未被发现或忽略。通过在新领域中部署机器学习和AI算法,我们可能会遇到这些在数据集和算法中出现的偏差问题的新表现。它们通常留在那儿,因为要识别它们并采取措施消除它们,您需要深刻理解使用数据的技术和现有的社交互动,包括收集数据的过程。一般而言,偏见是最困难的障碍之一,当然也是最沉重的社会负担。现在,有很多研究,包括关于使用AI的最佳方法的理论研究和数据收集,试图解决学术,非商业和私人领域中描述的问题。现在是时候了-这个问题可能会变得越来越关键,并引发越来越多的问题。例如,考虑以下事实:许多基于学习和统计的预测方法都默认地认为未来就像过去一样。当我们采取的行动将改变它时,我们将在社会文化环境中做什么?基于过去行为的决策会在哪里减慢进展(或者更糟的是发展对变革的抵抗力)?许多领导者,包括商业领袖,可能很快就会面临寻找此类问题答案的需求。如何击中移动目标
针对所描述的局限性提出解决方案并推广此处指出的高级开发的商业实施可能需要数年时间。但是令人兴奋的一系列与AI相关的功能表明,想象力可能是AI的最大限制。对于领导者来说,这里有一些提示,他们试图站在最前沿,或者至少跟上前沿趋势。学习新信息,适应并跟上。
尽管企业的大多数主管不需要了解卷积神经网络和递归神经网络之间的区别,但您通常需要熟悉现代工具的功能,对短期内何时可以取得突破有一般的认识,并展望未来的前景。采访您的数据和机器学习专家,与AI先驱进行交流以适应当前知识,参加几次AI会议以获取有关真实事实的信息;新闻文章可能会有所帮助,但也可能是炒作的一部分。跟上新发展的另一个好方法是由知识渊博的专家进行的研究,例如AI Index(百年AI研究小组的一个项目 (来自斯坦福)。开始使用复杂的数据策略。
人工智能算法需要帮助揭示隐藏在系统生成的数据中的新想法。通过制定处理数据的综合策略,可以帮助他们,不仅着重于从单个系统收集数据所需的技术,而且着重于数据的可用性,接收,标记和管理系统。而且,尽管新技术有望减少训练AI算法所需的数据量,但需要大量数据的受控训练仍然是主要技术。甚至旨在最小化所需数据量的技术仍然需要某种数据。因此,所有这些的重点将是对您自己的数据及其最佳使用方式的准确了解。跳出框框思考。
转移转移技术仍处于起步阶段,但始终有机会在多个领域(而不仅仅是一个领域)使用AI实现解决方案。如果您已经解决了大型仓库中设备的预测性维护这样的问题,该解决方案可以应用于消费产品吗?我可以在多个产品分销渠道中使用有效的“还可以购买什么”技巧吗?鼓励公司各部门彼此共享知识,以揭示在公司的多个领域中使用最佳AI解决方案和想法的方法。成为创新者。
仅仅跟上现代AI技术和用例不足以长期保持竞争力。说服您的数据处理专家或与外部专家合作,借助新兴技术(例如本文中提到的那些技术)来解决有用的问题。总是找出可以做的事情和已经可用的事情。现在,普通用户可以使用许多针对标准应用程序(包括语音,视觉和情感识别)训练的机器学习工具,数据集和模型。有时,它们可以以带有源代码的项目形式获得,在其他情况下,则可以通过领先的研究人员和公司创建的软件接口(API)获得。注意这些功能,他们可以帮助您注意到先驱者的好处。人工智能的前景十分广阔,将这些承诺转化为行动所需的技术,工具和流程尚未准备充分。如果您认为可以等待,请让该技术成形,然后成功使用其中一项技术-再三考虑。从站立位置跳跃非常困难,尤其是当目标快速移动并且您不了解现代AI技术可以做什么和不能做什么时。尽管AI领域的研究人员和先驱已经准备解决当今最严峻的问题,但是时候开始了解AI最前沿的情况了,以便您可以正确地设置组织,并帮助组织学习新的机会,利用它们,甚至可以促进它们下一个