ATLAS 事件显示了本研究中神经网络发现的与标准模型预测偏差最大的八个事件之一。(来源:欧洲核子研究中心)
粒子物理学家的任务是挖掘大量一直增长的碰撞数据,寻找尚未发现的粒子证据。特别是,他们正在寻找未包含在粒子物理标准模型中的粒子,科学家怀疑我们目前对宇宙构成的理解是不完整的。
近日,来自 ATLAS 合作组的 172 个研究机构的科学家,使用一种受大脑启发的机器学习算法——神经网络,来筛选大量粒子碰撞数据,搜索数据中的异常特征或非正常现象。
研究团队使用一种称为异常检测的机器学习方法来分析大量 ATLAS 数据。此前该方法从未应用于对撞机实验的数据。
神经网络发现了一个异常现象。能量约为 4.8 太电子伏(TeV)的奇异粒子衰变会产生 μ 子和其他粒子射流,其方式不符合神经网络对标准模型相互作用的理解。
该技术打破了寻找新物理学的传统方法。它独立于科学家的先入之见,因此不受其限制。
传统上,ATLAS 科学家依靠理论模型来指导他们的实验和分析,朝着最有希望发现的方向发展。这通常涉及执行复杂的计算机模拟,来确定碰撞数据的某些方面根据标准模型(Standard model,SM)会是什么样子。
科学家将这些标准模型预测与 ATLAS 的真实数据来进行比较。他们还将它们与新物理模型做出的预测作比较,例如那些试图解释暗物质和标准模型未解释的其他现象的预测。
但到目前为止,在 ATLAS 记录的数十亿次碰撞中,尚未观察到任何偏离标准模型的现象。自 2012 年发现希格斯玻色子(Higgs boson)以来,ATLA 实验还未曾发现任何新粒子。
该研究的主要作者、阿贡高能物理部门的物理学 Sergei Chekanov 说,「异常检测是一种非常不同的搜索方式,我们的目标不是寻找很具体的偏差,而是在完全未经探索的数据中找到不寻常的特征,这些特征可能与我们的理论预测不同。」
图示:数据和五个基准BSM(beyond the SM)模型的自动编码器异常分数的分布。(来源:论文)
为了执行此类分析,科学家将数据中的每个粒子相互作用表示为类似于二维码的图像。然后,该团队通过将神经网络暴露于 1% 的图像来训练其神经网络。
该网络由大约 200 万个互连节点组成,类似于大脑中的神经元。在没有人类指导或干预的情况下,它可以识别并记住图像中表征标准模型交互的像素之间的相关性。换句话说,它学会了识别符合规定标准模型预测的典型事件。
训练结束后,科学家们将其余 99% 的图像输入神经网络,来检测不正常的情况。当给定图像作为输入时,神经网络的任务是利用其对整个数据的理解来重新创建图像。
Chekanov 说:「如果神经网络遇到新的或不寻常的东西,它就会感到困惑,并且很难重建图像。如果输入图像与其产生的输出之间有很大差异,它会让我们大家都知道在这个方向上可能有一些有趣的东西值得探索。」
利用阿贡实验室计算资源中心的计算资源,神经网络分析了 2015 年至 2018 年收集的 LHC Run-2 数据中的约 1.6 亿个事件。
尽管神经网络在该数据集中未曾发现任何新物理学的明显迹象,但它确实发现了一个科学家认为值得进一步研究的非正常现象。能量约为 4.8 太电子伏的奇异粒子衰变会产生 μ 子(一种基本粒子)和其他粒子射流,其方式不符合神经网络对标准模型相互作用的理解。
「我们一定要进行更多研究,」Chekanov 说。「这可能是一种统计波动,但这种衰变有可能表明存在未被发现的粒子。」
该团队计划将该技术应用于 2022 年开始的 LHC Run-3 期间收集的数据。ATLAS 科学家将继续探索机器学习和异常检测作为绘制粒子物理学未知领域工具的潜力。