量子计算机的主要任务是增强人工智能

融合量子计算和机器学习的想法是最主要的。 她能辜负高期望吗?




威奇托大学Wichita University)物理学教授伊丽莎白·贝尔曼(Elizabeth Behrman)在1990年代初开始致力于将量子物理学与人工智能融合在一起,特别是在当时不受欢迎的神经网络技术中。 大多数人认为她正在尝试将水与油混合。 她回忆说:“我很难发表。” -神经网络杂志说:“这是一种什么样的量子力学?”而物理学杂志上说:“这是什么类型的神经网络?”

今天,这两个概念的混合似乎是世界上最自然的事情。 神经网络和其他机器学习系统已经成为21世纪最突然的技术。 它们在人类职业上比人类做得更好,并且不仅在我们大多数人无论如何都不发光的任务上(例如在国际象棋或深入的数据分析中)而且在大脑已经进化的那些任务中都超越了我们。例如,人脸识别,语言翻译和四向交叉路口的通行权确定。 由于强大的计算机功能,这样的系统成为可能,因此,技术公司开始搜索不仅是更大的计算机,而且属于全新的计算机也就不足为奇了。

经过数十年的研究,量子计算机几乎已经准备就绪,可以比地球上的其他任何计算机执行计算。 它们的主要优点通常是将大数分解,这是现代加密系统的关键。 是的,到现在至少还有十年。 但是如今,最基本的量子处理器也神奇地完美地满足了机器学习的需求。 他们一次处理大量数据,寻找经典计算机看不见的难以捉摸的模式,并且不会在不完整或不确定的数据之前发布。 “量子计算的本质统计性质与机器学习之间有着自然的共生关系,”加州伯克利的量子计算公司Rigetti Computing的物理学家约翰·奥特巴赫(Johann Otterbach)说。

就此而言,摆锤已经摆动到另一个最大值。 谷歌,微软,IBM和其他科技巨头正在将钱投入到量子机器学习(KMO)以及致力于该主题的初创孵化器中,该孵化器位于多伦多大学。 斯科尔科沃科技学院量子物理学专家雅各布·比亚蒙特Jacob Biamont)说,“机器学习”正成为流行语。 “通过将其与“量子”的概念混合,您将学到一个兆模字。

但是,“量子”这个概念永远不会意味着对它的期望。 尽管您可能认为KMO系统需要强大,但它会遭受“锁定”综合症的困扰。 它适用于量子态,而不适用于人类可读的数据,这两个世界之间的转换可以发挥其所有明显的优势。 就像iPhone X一样,它具有所有令人印象深刻的功能,但它的速度并不比旧手机快,因为本地网络令人作呕。 在某些特殊情况下,物理学家可以克服这一I / O瓶颈,但是在解决MO的实际问题时是否会出现这种情况仍不清楚。 “我们还没有明确的答案,”德克萨斯大学奥斯汀分校的IT专家Scott Aaronson说,他一直试图真正地研究量子计算领域的事物。 “人们对于这些算法是否会带来某种速度优势的问题非常谨慎。”

量子神经元


无论是经典的还是量子的,神经网络的主要任务是识别模式。 它是根据人脑的图像创建的,是基本计算单元(“神经元”)的网格。 他们每个人都可以不再困难地打开/关闭。 神经元监视许多其他神经元的输出,就像在某些问题上投票一样,如果有足够的神经元投票赞成,则切换到打开位置。 通常,神经元分层排列。 第一层接受输入(例如,图像像素),中间层创建各种输入组合(表示诸如面孔和几何形状的结构),最后一层产生输出(图片中的高级描述)。


通过以最佳方式调整连接的权重来训练深度神经网络,以将信号通过几层传输到与必要的广义概念相关的神经元

重要的是,这整个方案不是事先制定的,而是通过反复试验在学习过程中进行调整的。 例如,我们可以提供标记为“小猫”或“小狗”的图像网络。 它为每张图片分配一个标签,检查是否成功,如果不成功,则更正神经连接。 起初,它几乎是偶然地工作,但随后又改善了结果。 例如,经过10,000个示例,她开始了解宠物。 严肃的神经网络中可能有十亿个内部连接,所有这些都需要进行调整。

在经典计算机上,这些连接由神话般的数字矩阵表示,网络操作意味着执行矩阵计算。 通常,这些对矩阵的运算用于处理特殊的芯片-例如GPU 。 但是没有人能比量子计算机做得更好。 麻省理工学院的物理学家,量子计算的先驱塞斯·劳埃德(Seth Lloyd)说:“在量子计算机上处​​理大型矩阵和矢量的速度指数级地提高。”

为了解决这个问题,量子计算机能够利用量子系统的指数性质。 量子系统的大多数信息容量不包含在其单独的数据单元中-量子位,经典计算机的位的量子模拟-而是包含在这些量子位的联合属性中。 两个量子位一起具有四个状态:都打开,都关闭,打开/关闭和关闭/打开。 每个人都有一定的体重或“振幅”,可以起到神经元的作用。 如果添加第三个量子位,则可以想象八个神经元。 第四-16.机器的容量呈指数增长。 实际上,神经元遍布整个系统。 当您更改四个qubit的状态时,一次处理16个神经元,而一台经典计算机必须一次处理一个数字。

劳埃德(Lloyd)估计,60量子位足以编码人类一年产生的数据量,而300可能包含整个宇宙的经典内容。 由IBM,英特尔和谷歌制造的当今最大的量子计算机大约有50量子比特。 仅在我们假设每个幅度代表一个经典位的情况下。 实际上,振幅是连续值(代表复数),并且具有适合解决实际问题的精度,每个振幅最多可以存储15位,Aaronson说。

但是量子计算机以压缩形式存储信息的能力并不能使其更快。 一个人必须能够使用这些量子位。 2008年,麻省理工学院的物理学家劳埃德( Aloy Harrow )和以色列巴伊兰大学的计算机科学家Avinatan Hassidim 展示了如何进行矩阵的重要代数求逆。 他们将其分解为可以在量子计算机上执行的一系列逻辑运算。 他们的算法适用于大量的MO技术。 而且,他不需要像分解许多步骤一样多的步骤。 在噪声(现代技术的主要限制因素)可以破坏一切之前,计算机可以快速执行分类任务。 “在拥有功能全面的,抗错误的量子计算机之前,您可能只是拥有量子优势,”研究中心的Kristan Temm说。 IBM的Thomas Watson。

让大自然解决问题


到目前为止,仅在具有四个量子位的计算机上证明了基于量子矩阵计算的机器学习。 量子机器学习的大多数实验成功都使用了一种不同的方法,其中量子系统不仅模拟网络,而且模拟网络。 每个量子位负责一个神经元。 而且,尽管无需讨论指数增长,但这种设备可以利用量子物理学的其他特性。

这些设备中最大的设备包含大约2,000量子位,由位于温哥华附近的D-Wave Systems制造。 这并不是人们在考虑计算机时所想象的。 它通过查找内部一致性来工作,而不是获取一些输入,而是执行一系列计算并显示输出,而无需进行任何输入。 每个量子位都是一个超导电回路,就像一个微小的电磁体一样,朝上,朝下或朝上和朝下(即处于叠加状态)定向。 量子位由于磁性相互作用而结合在一起。



要启动该系统,您首先需要施加一个水平方向的磁场,该磁场以上下相同的叠加量(等同于一张空白纸)来初始化量子位。 有两种输入数据的方法。 在某些情况下,您可以将qubit层固定为所需的初始值。 通常,由于交互作用而包含输入。 然后,您允许量子位彼此交互。 有些人尝试以相同的方式排列,有些人则指向相反的方向,并在水平磁场的影响下切换到首选方向。 在此过程中,它们可以强制其他量子位切换。 最初,这种情况经常发生,因为错误地定位了许多量子位。 随着时间的流逝,它们会平静下来,之后您可以关闭水平场并将其固定在此位置。 此时,量子比特以上下位置的顺序排列,这是基于输入的结论。

量子位的最终排列并不总是很明显,但这就是重点。 该系统简单地表现自然,解决了传统计算机将长期困扰的问题。 东京工业大学的物理学家西森秀敏解释说:“我们不需要一种算法。”他开发了D-Wave机器的工作原理。 -这是与常规编程完全不同的方法。 这个问题天生就解决了。”

量子位的转换归因于量子隧道效应,这是量子系统向最佳配置,尽可能最佳的自然趋势。 可以建立一个基于模拟原理的经典网络,使用随机抖动而不是通过隧道切换位,在某些情况下,它实际上会更好。 但是,有趣的是,对于机器学习领域中出现的问题,量子网络似乎更快地达到了其最佳状态。

D-Wave的机器有其缺点。 它极易受到噪声的影响,在当前版本中,它不能执行很多操作。 但是机器学习算法本质上是耐噪声的。 它们之所以有用,恰恰是因为它们可以识别不整齐的现实中的意义,尽管分散了注意力,但仍将小猫和小狗分开。 “神经网络以其抗噪声性而闻名,”伯曼说。

2009年,由Google的IT专家Hartmouth Niven领导的团队,他是增强现实的先驱者(他是Google Glass项目的联合创始人),他进入了量子信息处理领域,展示了D-Wave机器的早期原型如何能够执行非常真实的任务机器学习。 他们将机器用作单层神经网络,在街道上拍摄的20,000张照片中,将图像分为两类:“汽车”和“非汽车”。 该机器只有52个工作量子位,不足以完全输入图像。 因此,Niven小组将汽车与经典计算机结合在一起,该计算机分析了图像的各种统计参数,并计算了这些值对汽车照片中存在的敏感程度-它们通常不是特别敏感,但至少与随机值有所不同。 这些值的某种组合可以可靠地确定汽车的存在,但不清楚哪种组合。 然后神经网络参与确定所需的组合。

一个团队有一个与每个值相关联的量子比特。 如果qubit设置为1,则将相应的值标记为有用;否则,将其标记为1。 0表示不需要她。 量子位的磁性相互作用编码了此问题的要求-例如,仅需考虑非常不同的数量,以便最终选择是最紧凑的。 最终的系统能够识别汽车。

去年,由加州理工学院粒子物理专家Maria Spiropoulou和南加州大学物理学家Daniel Lidara领导的团队将一种算法应用于解决实际物理问题:将质子碰撞分为希格斯玻色子和非玻色子类别希格斯。 通过将估计仅限于产生光子的碰撞,他们使用了粒子的基本理论来预测光子的哪些特性应指示希格斯粒子的短期出现-例如,超过动量的某个阈值。 他们检查了八种这样的特性及其28种组合,总共产生了36个候选信号,并允许D-Wave芯片找到最佳样本。 他确定了16个变量是有用的,而3个是最好的。 激光雷达说:“鉴于训练集的规模小,量子方法在准确性上优于高能物理学专家社区中使用的传统方法。”


加州理工学院的物理学家Maria Spiropoulou使用机器学习来搜索希格斯玻色子

12月,Rigetti演示了一种使用19量子位通用量子计算机自动对对象进行分组的方法。 研究人员向汽车提供了城市列表以及它们之间的距离,并要求她将城市分为两个地理区域。 这项任务的难点在于,一个城市的分布取决于所有其他城市的分布,因此您需要立即为整个系统寻找解决方案。

实际上,该公司的团队为每个城市分配了一个量子比特,并注明了该城市分配给哪个城市。 通过量子位的相互作用(在Rigetti系统中,它不是磁性的,而是电的),每对量子位都试图取相反的值,因为在这种情况下,它们的能量被最小化了。 显然,在任何包含两个以上量子位的系统中,有些对必须属于同一组。 位置较近的城市更可能同意这一点,因为对他们而言,属于同一组的能源成本要比偏远的城市低。

为了使系统的能耗降至最低,Rigetti团队选择了某种类似于D-Wave方法的方法。 他们用所有可能的组分布的叠加来初始化量子位。 他们允许量子位彼此简短地交互,这导致它们接受某些值。 然后,他们使用了水平磁场的类似物,如果它们具有将系统以最小的能量稍微推向能量状态的趋势,则可以使量子位反转。 然后,他们重复了互动和革命这两个阶段的过程,直到系统通过将城市分配到两个不同的区域来最大程度地减少能源消耗。

相似的分类任务虽然有用,但相当简单。 在生成模型中有望实现真正的MO突破,该模型不仅可以识别幼犬和小猫,而且还能够创建新的原型-从未存在过的动物,但与真实的动物一样可爱。 他们甚至能够独立地得出类别,例如“小猫”或“小狗”,或重建没有爪子或尾巴的图像。 D-Wave首席科学家Mohammed Amin表示:“这些技术在莫斯科地区具有很多能力,而且非常有用,但很难实施。” 量子计算机的帮助将在这里派上用场。

D-Wave和其他研究团队已经接受了这一挑战。训练这样的模型意味着调整量子位的磁或电相互作用,以便网络可以重现一些测试数据。为此,您需要将网络与常规计算机结合在一起。网络涉及复杂的任务-它确定一组给定的交互对最终网络配置的意义-伙伴计算机使用此信息来微调交互。在去年的一次演示中,NASA量子人工智能实验室的研究员Alejandro Perdomo-Ortiz和一个团队为D-Wave提供了一个由手写数字组成的成像系统。她确定总共有十个类别,从0到9匹配数字,并创建了自己的数字形式的涂鸦。

隧道瓶颈


这都是好消息。坏消息是,无论您的处理器有多酷,如果您无法为它提供可以使用的数据。在矩阵代数算法中,单个运算可以处理16个数字的矩阵,但是仍然需要16个运算才能加载矩阵。量子计算机初创公司Xanadu的研究人员,第一批获得CMO学位的科学家之一玛丽亚·舒尔德(Maria Schuld)表示:“避免了状态准备问题,即将经典数据置于量子状态中,这是最重要的部分。”物理上分散的MO系统面临着并行的困难-如何将任务引入量子位网络并根据需要进行交互。

输入数据后,您需要以某种方式存储数据,以便量子系统可以与之交互,而不会破坏当前的计算。劳埃德(Lloyd)及其同事提出了一种使用光子的量子RAM,但没有人拥有一种用于超导量子位或捕获离子的模拟设备-领先的量子计算机中使用的技术。 “除了构建量子计算机本身的问题之外,这是另一个巨大的技术问题,”亚伦森说。 -与实验人员交流时,我觉得他们很害怕。他们不知道如何处理该系统的创建。”

最后,如何显示数据?这意味着要测量机器的量子状态,但是测量不仅一次返回一个随机选择的数字,而且还破坏了计算机的整个状态,在您有机会回收它之前擦除了其余数据。您必须一次又一次地运行算法以取出所有信息。

但是,并非一切都丢失了。对于某些类型的任务,可以使用量子干扰。可以控制操作的过程,以使错误的答案相互抵消,而正确的答案可以增强自己的能力。因此,当您测量量子态时,不仅会返回随机值,还会返回所需的答案。但是只有少数算法(例如穷举搜索)可以利用干扰,并且加速度通常很小。

在某些情况下,研究人员发现了数据输入和输出的解决方法。 2015年,劳埃德(Lloyd),加拿大滑铁卢大学(University of Waterloo)的西尔瓦诺·加内罗内(Silvano Garnerone)和南加州大学的Paolo Zanardi表示,在某些类型的统计分析中,没有必要输入或存储整个数据集。同样,当几个键值已足够时,也不必读取所有数据。例如,科技公司使用莫斯科地区根据巨大的人类习惯发布有关观看电视节目或购买商品的建议。 “如果您要为Netflix或Amazon创建这样的系统,则不需要在任何地方记录矩阵,而是为用户提供建议,” Aaronson说。

所有这些都提出了一个问题:如果量子机器在特殊情况下展示其能力,也许经典机器在这些情况下也能很好地展示自己?这是该领域尚未解决的主要问题。毕竟,普通计算机也可以做很多事情。实际上,处理大型数据集的常用选择方法-随机抽样-实际上在本质上与量子计算机非常相似,无论其内部发生什么,最终都会产生随机结果。舒尔德指出:“我实施了许多算法,并对它们做出了类似的反应:“太酷了,它是如此加速”,然后,出于娱乐目的,我为一台经典计算机编写了采样技术,并且我意识到用帮助取样。”

迄今为止,KMO所取得的成功都不是没有成功的。乘坐D-Wave车。在对汽车和希格斯粒子的图像进行分类时,它的运行速度不比经典计算机快。“我们的工作中未讨论的主题之一是量子加速,” Google DeepMind项目的IT专家Alex Mott说,他曾在研究希格斯粒子的团队中工作。矩阵代数方法(例如Harrow-Hassidimi-Lloyd算法)仅在稀疏矩阵(几乎完全填充为零)的情况下显示出加速度“但是没有人问这个问题-稀疏数据通常对于机器学习很有趣吗?” -舒尔德说。

量子智能


另一方面,即使是对现有技术的罕见改进也可能会使技术公司满意。微软研究院的量子计算机研究员内森·瓦耶布Nathan Vayeb)说:“由此带来的改进是适度的,不是指数级的,但至少是二次方的。” “如果您使用足够大且快速的量子计算机,我们将彻底改变莫斯科地区的许多地区。”在使用这些系统的过程中,计算机科学家也许可以解决理论上的难题-它们实际上是按照定义的速度,确切地说是更快。

舒尔德还认为,软件方面还有创新的空间。 MO不仅仅是一堆计算。这是一组具有自己特定的定义结构的任务。她说:“人创造的算法与使MO有趣且美观的事物是分开的。” -因此,我从另一端开始工作,并认为:如果我已经拥有一台小型量子计算机,那么可以在其上实现哪种MO模式?也许这种模型还没有被发明出来。”如果物理学家想打动MO专家,他们将要做的不只是创建现有模型的量子版本。

就像许多神经科学家得出的结论一样,人类思想的结构反映了对身体的需求,MO系统也得以实现。图像,语言和流经它们的大多数数据来自真实世界,并反映了其属性。 CMO也得以实现-但在比我们更丰富的世界中。毫无疑问,它将发光的一个领域是量子数据的处理。如果这些数据不是图像而是物理或化学实验的结果,则量子机器将成为其元素之一。输入问题消失了,传统计算机远远落后了。

仿佛处于恶性循环的情况下,第一个KMO可以帮助发展其继任者。韦伯说:“我们真正想要使用这些系统的方法之一就是自己创建量子计算机。” “对于某些纠错程序,这是我们唯一的方法。”也许他们甚至可以纠正我们的错误。如果不解决人脑是否是量子计算机这一问题(这是一个很有争议的问题),它有时仍会以这种方式运行。人类的行为与环境息息相关。我们的偏好是通过提供给我们的选择而形成的,并不符合逻辑。在这方面,我们类似于量子粒子。 Perdomo-Ortiz说:“您如何提问和以什么顺序重要,这是量子数据集的典型特征。”因此,KMO系统可能成为研究人类思维的认知扭曲的自然方法。

: , . , , . , - , . – , , . , , .

Source: https://habr.com/ru/post/zh-CN410777/


All Articles