深度学习帮助探测引力波

利用人工智能寻找黑洞

1915 年，阿尔伯特·爱因斯坦在他的广义相对论中用几何语言对引力进行了描述。马克斯普朗克引力物理研究所的科学家 Nikhil Mukund 博士说道，“但是，凡要取代现有（牛顿）理论的新理论，都应该提供可通过实验验证的预测，而这些预测是该理论所特有的。”

爱因斯坦的相对论预测引力波是时空中的涟漪。这些引力波可以帮助我们测量包括中子星和黑洞在内的天体的距离、质量和旋转等属性。

1916 年，当时还没有工具用于测量由天体物理事件（如两颗恒星相撞）产生的引力波。在接下来的几十年里，科学家和工程师们逐渐开发出测量这些难以捉摸的引力波所需的技术。

Mukund 说道，“在二十世纪六十年代末七十年代初，经研究发现，干涉测量法是一种可行的解决方案。如果你使用正确的技术并抑制不同的噪声，则可以有效地检测到小至质子直径万分之一左右的扰动。这将足以探测到在几亿秒差距范围内发生的两个黑洞或两个中子星合并等事件。”

激光干涉仪是一种从激光束轨迹的扰动中提取信息的设备。干涉仪可将一个光束分成两个分量。这些分量光束将传播数公里，经两个镜子反射，在分束器处重新组合，从而产生建设性或破坏性干涉。传播中的引力波会在这些光束之间引入相对相移，从而改变最终的干涉图案。这些非常微小的扰动表明，引力波是由黑洞或中子星相撞等现象引起的。

干涉引力波探测器的第一个原型和二十世纪六十年代末进行的实验表明，激光干涉测量法可以实现探测引力波所需的测量。此后，全球科学界和工程界都努力搭建更好的干涉仪。在接下来的几十年里，马萨诸塞州、慕尼黑、格拉斯哥和其他地方都相继建起了类似的设施。最新一代的精密引力波天文台包括美国的 LIGO 探测器、意大利的 Virgo 探测器、德国的 GEO 600 探测器和日本的 KAGRA 探测器。

2015 年，LIGO 科学合作组织和 Virgo 合作组织联合发表了一篇论文，阐述了如何探测距离地球 13 亿光年的双恒星质量黑洞合并产生的引力波。

Mukund 说道，“这次探测打开了一扇通往宇宙的新窗口。此前，我们采用的是电磁方式，通过望远镜利用从无线电波到伽马射线的多种波长来观察宇宙。如今，我们找到了一种新方法来观察这些没有电磁特征的奇异天体，比如黑洞。我想说，这种方法就像十七世纪光学望远镜的发明一样令人兴奋。现在，我们已经确认探测到近 100 种此类起源，未来还会有更多新发现。”

使用神经网络探测黑洞

对引力波的可靠探测这个问题尚未完全得到解决。激光干涉仪接收到的信号很弱。由于探测器非常灵敏，因此，它们的输出可能会受到环境噪声的影响，这些噪声包括城市交通、机械装置、潮汐和地震活动造成的地面振动。科学界正在不断寻找新的方法来滤除信号中的噪声。

Mukund 使用了 Deep Learning Toolbox 为他的应用选择和微调神经网络。在这种情况下，他发现 Inception 卷积神经网络是一种适用于引力波探测的架构。

Mukund 说道，“虽然我们的初衷是探测非常灵敏的天体物理信号，但在过去 50 年左右的时间里，相关研发工作使得高精度传感器和作动器得到了发展。”

一些已开发的技术包括主动和被动地震隔振系统（用于保护光学元件免受干扰）、低噪声激光系统，以及基于干涉法的光学校准传感器。

Mukund 说道，“尽管我们以天体物理学和宇宙学为主要研究目标，但是许多已开发的技术也同样具有普适性。”

在该领域，最新的研究方向是利用先进的人工智能技术。在德国马克斯普朗克引力物理研究所和印度 IUCAA，Mukund 和他的同事们使用机器学习模型滤除了激光干涉仪（如 LIGO 干涉仪）接收到的真实信号中的噪声。为此，研究人员将引力波探测定义为有监督学习问题。机器学习模型从激光干涉仪中获得数据作为输入，并预测其中是否包含引力波信号或瞬态噪声。

一座中央建筑的鸟瞰图，干涉仪的两个长臂分别向左右延伸。 — 地面 GEO 600 干涉引力波探测器的鸟瞰图。（图片所有权：马克斯普朗克引力物理研究所）

Mukund 说道，“引力波研究界和数据分析界已经开发出求解爱因斯坦方程的模型。我们采用分析后牛顿、现象学和基于数值相对论的方法，生成来自两个相撞双黑洞或中子星的信号。”

研究人员应用这些数学模型来合成训练机器学习模型所需的数据。为了使数据更真实，他们添加了类 LIGO 探测器所采集的那种噪声。

Mukund 使用了 Deep Learning Toolbox™ 为他的应用选择和微调神经网络。在这种情况下，他发现 Inception 卷积神经网络是一种适用于引力波探测的架构。利用 Deep Learning Toolbox，他的团队基于他的数据集配置并重新训练了 Inception-v3 网络，以便对干涉仪信号进行分类。

Mukund 说道，“在我攻读博士学位的最后一年，我们就已经开始这项工作了，因此，我们必须在有限的时间内试验不同的网络架构。鉴于支持不同的架构和 GPU 计算，这就减少了在所有这些不同模型之间进行搜索所需的时间。”

Mukund 说道，“真是了不起。经过训练的网络不仅恢复了之前报告的所有 GW 事件，而且还帮助我们发现了之前未能探测到的双黑洞事件。”

解决控制问题

激光干涉测量法带来的一大挑战是控制光学元件。在使用该方法探测引力波时，这项挑战将变得更加严峻。与简单的迈克尔逊干涉仪不同，LIGO 和 GEO 600 等实验室用的干涉仪有数十面镜子，所有这些镜子都必须加以控制、校准和维护。

“我们正在尝试评估是否可以建立一个数据驱动的控制策略，该策略可以在人工设计的过滤器级别执行，甚至可能做得更好。”

Mukund 说道，“由于存在多个自由度，因此，即使在开始实验之前，我们也需要最大限度减少抖动。”

为了调节镜子，科学家们建立了数百个并行运行的控制回路，并且格外注意将所有光学元件之间的交叉耦合减至最少。

一群戴着防护眼镜的访客站在观景台上俯视光学元件。 — GEO 600 干涉仪无尘室内，其中陈列着分析光学元件。（图片所有权：马克斯普朗克引力物理研究所）

Mukund 说道，“这是一个非常复杂的光机械控制系统问题。迄今为止，我们一直采用的方法需要控制系统工程师和科学家们具备丰富的经验。”

以前，工程师和科学家们会研究系统，解耦不同的自由度，并根据他们掌握的知识确定最佳控制过滤器。他们会定期重新评估并修改控制系统的结果。

Mukund 说道，“这项工作一直是通过线性控制系统，根据人类知识，以分布式方式完成的。不过，我们有一个非线性系统，因此，我们必须使用经典控制理论，通过模型使这些系统线性化，然后确定最佳过滤器。但是，鉴于有很多交叉耦合，线性控制不是调整光学元件的最佳方式。”

最近，Mukund 一直致力于通过强化学习解决控制问题。

Mukund 说道，“我们正在尝试评估是否可以建立一个数据驱动的控制策略，该策略可以在人工设计的过滤器级别执行，甚至可能做得更好。”

强化学习不同于其他机器学习方法，因为前者基于动作、状态和奖励。强化学习智能体提供有一个环境和一组动作。它必须学会采取一系列动作，以达到最佳状态，并使其奖励最大化。

Mukund 说道，“设计强化学习控制策略的第一步是感知校准误差。传统测量方法是使用波前传感器。我们改用了由卷积层和 LSTM 层组成的神经传感器，通过分析光机械设计中的摄像机的视频来测量校准误差。”

AI 模型（暗线）只需查看 GW 探测器最敏感位置的干涉图像，便可预测关键光学元件的校准误差。这些预测结果与传统波前传感器的预测结果非常吻合。（图片所有权：马克斯普朗克引力物理研究所）

感知神经网络使用 Deep Learning Toolbox 创建，是用于确定环境状态的组件。动作空间包含对光学元件所做的调整。奖励函数基于经典控制理论的原理进行设计，旨在针对改善镜子校准的动作进行优化。

Mukund 说道，“这个奖励函数的好处是，我可以使用 Simulink Design Optimization™ 自动生成它的一部分。我们向它提供了我们的模型设定，比如带宽、设计性能、稳健性和速度。Simulink Design Optimization 很好地集成了 Reinforcement Learning Toolbox™，因此能够生成一个模板奖励，供我们将我们的物理知识添加到其中。”

Mukund 说道，“MATLAB^® 的一大优势在于，它让我可以对不同的强化学习算法进行快速迭代，这大大减少了确定最终选择所需的时间。我最终确定 Soft Actor-Critic 算法是解决控制问题的最优解决方案。”

环境的建模

团队在训练模型时还面临着另一项挑战。强化学习智能体需要通过多次试错来学习环境的动态特性和最优策略。最初，该智能体采取随机动作来探索它的环境，并学习不同的奖惩方案。它会逐渐收敛于最佳动作序列。然而，这个方案通常不适用于需要与物理设备和现实世界交互的应用。

“我们基于模型的强化学习设计非常有用，因为我们可以在仿真环境中测试不同的设置，并在将学习的模型部署到设备之前捕获并解决振荡等问题。”

Simulink 模型的流程图。 — Soft Actor-Critic 强化学习算法模型。（图片所有权：马克斯普朗克引力物理研究所）

Mukund 说道，“强化学习对训练回合数非常敏感。我们不能使用灵敏的 GEO 600 干涉仪进行实景训练，因为这需要时间，而且可能会使设备在最初的探索阶段受损。”

为了克服这一挑战，Mukund 和他的团队采用了基于模型的设计。根据他们使用 System Identification Toolbox™ 从物理系统中获得的测量结果，他们在 Simulink^® 中创建了一个仿真环境。他们基于 Simulink 模型训练了他们的强化学习智能体，因而无需与物理设备进行交互。

Mukund 说道，“我们正在测试强化学习模型的集合，该集合使用多个通过不同配置训练的智能体。我们基于模型的强化学习设计非常有用，因为我们可以在仿真环境中测试不同的设置，并在将学习的模型部署到设备之前捕获并解决振荡等问题。”

他们在 GEO 600 上成功使用了强化学习方法，这是他们首次在引力波探测器上实现基于神经网络的校准感知和控制。敏感度和占空比都有所提高，这在此方案中得到了见证，因此，Mukund 认为，人工智能 (AI) 在探测引力波方面的应用前景非常光明。

Mukund 说道，“人工智能是一个非常有趣且快速发展的领域，引力波研究界对此感到非常兴奋。在过去五年里，我们已将深度学习方法广泛用于数据分析。现阶段，我们希望能够在控制部分中应用强化学习。这项技术仍须经得起考验，才能不辜负大家对它的期望。但就目前来看，它的前景一片大好。下一代引力波探测器，如爱因斯坦望远镜 (Einstein Telescope) 和宇宙勘探者 (Cosmic Explorer)，将会更加精密。人工智能和强化学习尤其将成为应对这些挑战不可或缺的工具。”

阅读其他案例

信号处理

深度学习帮助探测引力波

利用人工智能寻找黑洞

使用神经网络探测黑洞

解决控制问题

环境的建模

阅读其他案例

通过激光干涉仪数据分析，确认人类首次成功探测到引力波

SLS 火箭助力猎户座飞船飞向月球

PocketQube 卫星扫描大气中的电子烟雾污染