机器学习在粒子物理学中越来越多地被使用。



在大型强子对撞机上进行的实验每秒产生大约一百万千兆字节的数据。 即使经过缩减和压缩,按体积计算,仅一个小时内在大型强子对撞机上获得的数据就可以与Facebook全年收到的数据相提并论。

幸运的是,粒子物理学专家不必手动处理此数据。 他们与一种人工智能学习一起使用机器学习技术进行独立的数据分析。

“与我们为进行某种类型的分析而开发的传统计算机算法相比,我们对机器学习算法进行了设计,从而可以决定要执行哪种类型的分析,这为我们节省了无数的开发和分析工时,”他说。威廉和玛丽学院的物理学家亚历山大·拉多维奇(Alexander Radovich)正在新星中微子实验中工作。

Radovic和一组研究人员在2018年8月发表于《自然》的摘要中概述了MO在粒子物理学中的当前应用范围和未来前景。

筛选大数据


为了处理在现代实验中获得的大量数据,例如用于大型强子对撞机的数据,研究人员使用了“触发程序”(triggers),这是一种特殊的设备,可与软件结合使用,实时确定哪些数据需要留待分析以及哪些数据可以摆脱。 。

麻省理工学院(Massachusetts Institute of Technology)的迈克·威廉姆斯(Mike Williams)说,在一项实验中,一个LHCb检测器可以揭示为什么宇宙中的物质比反物质多得多,MO算法至少做出了70%的此类决定。提到的摘要。 他说:“ MO在实验中处理数据的几乎所有方面都发挥着作用,从触发器到剩余数据的分析,”

机器学习显示了分析方面的重大进步。 在大型强子对撞机上,巨大的ATLAS和CMS检测器使希格斯粒子得以发现,它拥有数百万个传感器,必须将其信号汇总才能获得有意义的结果。

ATLAS探测器的美国能源部国家能源加速器实验室(SLAC)的Michael Kagan说:“这些信号构成了一个复杂的数据空间。” “我们需要了解它们之间的关系才能得出结论-例如,探测器,粒子中的某些痕迹是由电子,光子或其他物质留下的。”

MO对于中微子的实验也是有益的。 服务于Fermilab的 NOva正在研究中微子在穿越地球时如何从一种物种转移到另一种物种。 这些中微子振荡有可能揭示出新型中微子的存在,根据一些理论,中微子可能是暗物质的粒子。 NOva检测器寻找中微子与检测器中的物质碰撞时出现的带电粒子,然后MO算法确定它们。

从机器学习到深度学习


MO领域的最新进展通常称为深度学习,它有望进一步扩大MO在粒子物理学中的范围。 GP通常意味着使用神经网络:计算机算法的结构受人脑神经元的密集密集网络的启发。

这些神经网络在处理测试数据(例如来自模拟)并接收有关其工作质量的反馈时,会通过培训独立地学习某些分析任务。

SLAC的合著者Kazuhiro Terao说,直到最近,神经网络的成功才受到限制,因为它们很难训练。SLAC的研究人员从事MicroBooNE中微子实验,该实验研究中微子振荡,是短期Fermilab计划的一部分。 该实验将成为未来深地下中微子实验的一部分 。 他说:“这些困难限制了我们使用简单神经网络深入两层的能力。” “由于算法和计算设备的发展,我们现在对如何创建和训练具有数百或数千个层的功能更强大的神经网络有了更多了解。”

民防技术上的许多突破是由技术巨头的商业发展以及他们在过去二十年中创造的数据爆炸所致。 “例如,NOva使用类似于GoogleNet架构的神经网络,” Radovic说。 “这将实验改进到仅通过将数据收集增加30%即可达到的程度。”

创新的丰硕土壤


MoD算法变得越来越复杂,并且每天都在进行微调,为解决粒子物理学领域的问题提供了前所未有的机会。 卡根说,可以应用这些新任务的许多任务都与计算机视觉有关。 “这类似于人脸识别,但是只有在粒子物理学中,图像属性才比耳朵或鼻子更抽象,更复杂。”

来自某些实验(例如NOvA和MicroBooNE)的数据可以很容易地转化为真实图像,而AI可以立即用于确定其特征。 另一方面,必须首先基于从数百万个传感器获得的复杂数据来重建LHC实验结果的图像。

“但是,即使数据看起来不像图像,如果我们正确地处理了数据,我们仍然可以采用计算机视觉的方法,” Radovic说。

这种方法可能非常有用的领域之一是分析大型强子对撞机上大量产生的粒子流。 喷射流是微粒的狭窄喷射流,其痕迹很难彼此分离。 计算机视觉技术可以帮助理解这些喷气机。

GO的另一个新应用是对粒子物理数据的模拟,例如,它可以预测大型强子对撞机中的粒子碰撞会发生什么,并将其与真实数据进行比较。 这些类型的仿真通常运行缓慢,并且需要非常大的处理能力。 人工智能可以更快地进行此类模拟,最终可以成为传统研究方法的有用补充。

“仅仅几年前,还没有人想到可以训练深度神经网络来“查看”基于随机噪声的数据,” Kagan说。 “尽管这项工作仍处于起步阶段,但看起来已经很有希望,并且将来可能会帮助解决数据问题。”

健康的怀疑论的好处


尽管有明显的突破,但MO爱好者经常会遭到同事的怀疑,尤其是因为MO算法的大部分工作都像“黑匣子”一样,几乎没有提供有关他们如何得出特定结论的信息。

威廉说:“怀疑主义非常健康。” “如果我们将MO用于丢失某些数据的触发器,例如在LHCb上,那么我们需要在此问题上格外小心,并将门槛提高到很高。”

因此,为了加强MO在粒子物理学中的地位,有必要不断地尝试加深对算法工作原理的理解,并在可能的情况下与真实数据进行交叉比较。

“我们一直需要尝试理解计算机算法的作用并评估其结果,” Terao说。 -这适用于所有算法,而不仅仅是MO。 因此,怀疑主义不应阻碍进步。”

快速的发展已经使一些研究人员梦想着在不久的将来可能会发生什么。 “今天,我们主要使用MO来查找数据中可以帮助我们回答某些问题的特征,” Terao说。 “在大约十年中,MO算法可能能够独立提出自己的问题,并了解他们发现了新的物理学。”

Source: https://habr.com/ru/post/zh-CN422173/


All Articles