人工智能如何刺激对新粒子的搜索

在寻找新的基本粒子时,物理学家总是不得不推测粒子的行为。 新的机器学习算法不需要这个。




在今年四月大型强子对撞机发生的一次碰撞中,发现了单个带电粒子(橙色线)和大型粒子射流(黄色圆锥体)

大型强子对撞机(LHC)每秒碰撞数十亿对质子。 有时,这台机器设法使现实有些摇摆,并在这些碰撞中创造了前所未有的东西。 但是,从定义上讲,由于此类事件是意外的,物理学家并不知道他们到底需要寻找什么。 他们担心,通过筛查数十亿次此类碰撞的数据并采样一些更可行的量,他们可能会无意间删除某些新物理学的证据。 纽约大学粒子物理专家凯尔·克莱默Kyle Kranmer)说:“我们总是担心我们会溅水,这是ATLAS LHC实验的一部分。”

面对智能减少数据量的任务,一些物理学家正在尝试使用“深度神经网络”之类的机器学习技术来拖拉熟悉的事件,以寻找新的物理现象。

在使用该技术的典型情况下,深度神经网络通过研究一堆标记为“猫”的照片和另一堆标记为“狗”的照片来学习将猫与狗区分开。 但是,这种方法在寻找新粒子时将行不通,因为物理学家无法将他们从未见过的某些事物提供给机器图像。 因此,当机器从已知粒子开始学习,然后寻找信息不那么详尽的罕见事件时,他们必须“在很少的监督下进行学习”,例如,此类事件通常发生的频率。

五月份在arxiv.org预印本上发表的一篇论文中,三位研究人员提出了一种类似的策略来扩大凹凸搜索,这是一种发现希格斯玻色子的经典粒子搜索技术。 作为这项工作的作者之一,劳伦斯伯克利国家实验室的研究员本·纳奇曼写道,总体思路是对机器进行训练,以寻找数据集中罕见的变化。

考虑到提到的猫和狗的精神,考虑一个最简单的示例,作为在包含北美森林观测资料的数据集中寻找新动物物种的尝试。 如果我们假设新动物将在某些地理区域中分组(这种想法对应于新粒子在一定质量附近分组的事实),则该算法应该能够通过对相邻区域的系统比较来选择它们。 如果不列颠哥伦比亚省有113只北美驯鹿,而华盛顿州则有19只北美驯鹿(尽管那里到处都有数百万只松鼠),该程序将无需直接研究就可以将驯鹿与松鼠区分开。 俄勒冈大学的理论粒子物理学专家蒂姆·科恩Tim Cohen)说:“这不是魔术,而是看起来像魔术。”

对于传统的粒子物理学搜索,与所描述的不同,研究人员必须对新现象的外观进行假设。 他们创建了一个新粒子行为的模型-例如,一个新粒子可能趋向于衰减成一组已知粒子。 并且只有在他们确定要寻找的东西之后,他们才能创建特殊的搜索策略。 一个研究生通常需要一年的时间来完成这项任务,但是纳赫曼认为可以更快,更彻底地完成这项工作。

提出的CWoLa算法意味着“无标签分类”(MSC),它能够在现有数据中搜索任何未知的粒子,这些粒子会分解为两个较轻的相同类型的未知粒子,或者分解为两个相同或不同类型的已知粒子。 使用通常的搜索方法,从事大型强子对撞机的团队可能要花至少20年的时间才能筛选出与第二种选择同时出现的所有可能性,而对于第一种选择,今天根本没有搜索策略。 从事ATLAS项目的Nachman说,KBM能够一次性完成所有这些搜索。

实验粒子物理学的其他专家也认为,这场比赛可能值得。 物理学家凯特·帕查尔Kate Pachal)说:“我们已经在不同的可预测位置进行了搜索,因此,对我们来说,另辟way ,填补我们尚未发现的空白非常重要。” 他和他的同事想到了开发可应对各种粒子质量的灵活软件的想法,但是这些软件都不具备机器学习的资格。 她说:“我认为是时候尝试了。”

希望神经网络将能够检测当前模型不可用的基础数据相关性。 其他机器学习技术已经成功提高了大型强子对撞机某些任务的效率,例如确定下夸克发出的喷气机 。 在这项工作中,很明显物理学家会错过一些信号。 加州大学欧文分校的粒子物理学专家丹尼尔·惠特森说:“他们错过了一些信息,如果您为该部门支付了100亿美元,就不会错过任何信息。”

但是,机器学习领域充满了关于程序混合了哑铃(或更糟 )的警示性故事 。 大型强子对撞机的一些人担心,所有这些短路径都将反映机器本身中的小怪兽的工作,因此实验人员非常小心地设法忽略了它们。 “当您发现异常时,尚无法立即得知-这是一种新的物理原理,还是探测器出现了问题?” 从事ATLAS项目的物理学家Till Eifert说。

Source: https://habr.com/ru/post/zh-CN420319/


All Articles