在一眨眼的时间里,驱动核聚变反应的难以控制的、过热的等离子体就会失去稳定性,并逃离将其限制在环形核聚变反应堆内的强磁场。这些逃逸往往意味着核反应的结束,这对将核聚变发展成为无污染、几乎无限的能源构成了核心挑战。
但是一个由普林斯顿大学和普林斯顿等离子体物理实验室(PPPL)的工程师、物理学家和数据科学家组成的由普林斯顿大学领导的团队已经利用人工智能的力量来预测——然后实时避免——特定等离子体问题的形成。
在圣地亚哥的DIII-D国家聚变设施的实验中,研究人员展示了他们的模型,仅根据过去的实验数据进行训练,可以提前300毫秒预测潜在的等离子体不稳定性,即撕裂模式不稳定性。
虽然这给人类留下的时间不够慢,但人工智能控制器有足够的时间改变某些操作参数,以避免在等离子体的磁力线内发展成撕裂,破坏其平衡,并为反应结束的逃逸打开大门。
“通过从过去的实验中学习,而不是从基于物理的模型中吸收信息,人工智能可以制定一个最终的控制政策,在真实的反应堆中实时支持稳定的高功率等离子体状态,”研究负责人Egemen Kolemen说,他是机械和航空航天工程和安德林格能源与环境中心的副教授,也是PPPL的工作人员研究物理学家。
这项研究为比目前的方法更动态地控制聚变反应打开了大门,并为使用人工智能解决广泛的等离子体不稳定性提供了基础,这些不稳定性长期以来一直是实现持续聚变反应的障碍。该团队在2月21日的《自然》杂志上发表了他们的研究结果。
“以前的研究通常集中在抑制或减轻这些撕裂不稳定性在等离子体中发生后的影响,”第一作者、韩国中央大学(Chung-Ang University)物理学助理教授蔡敏·徐(Jaemin Seo)说,他在科尔曼小组担任博士后研究员期间完成了大部分工作。“但我们的方法使我们能够在这些不稳定性出现之前预测并避免它们。”
当两个原子——通常是像氢这样的轻原子——聚集在一起形成一个更重的原子时,就会发生核聚变,在这个过程中释放出大量的能量。这一过程为太阳提供了能量,进而使地球上的生命成为可能。
然而,让两个原子融合是棘手的,因为两个原子需要巨大的压力和能量来克服它们的相互排斥。
幸运的是,太阳巨大的引力和核心处极高的压力使聚变反应得以进行。为了在地球上复制类似的过程,科学家们转而使用极热的等离子体和极强的磁铁。
在被称为托卡马克的甜甜圈形状的装置中——有时也被称为“罐子里的星星”——磁场很难容纳超过1亿摄氏度的等离子体,比太阳中心还要热。
虽然有许多类型的等离子体不稳定性可以终止反应,但普林斯顿大学的研究小组专注于解决撕裂模式不稳定性,这是一种干扰,在这种干扰中,等离子体内部的磁力线实际上会断裂,并为等离子体随后的逃逸创造机会。
“撕裂模式的不稳定性是等离子体破坏的主要原因之一,当我们试图在产生足够能量所需的高功率下进行聚变反应时,它们将变得更加突出,”徐说。“这是我们需要解决的一个重要挑战。”
由于撕裂模式的不稳定性可以在几毫秒内形成和破坏聚变反应,研究人员转向人工智能,因为它具有快速处理和响应新数据的能力。
但开发一个有效的人工智能控制器的过程并不像在托卡马克上试验几个东西那么简单,因为托卡马克的时间有限,而且风险很高。
Kolemen小组的研究学者Azarakhsh Jalalvand将教授在托卡马克中运行聚变反应的算法与教授如何驾驶飞机进行了比较。
Jalalvand说:“你不会给他们一套钥匙,告诉他们要尽最大努力来教他们。”“相反,你会让他们在一个非常复杂的飞行模拟器上练习,直到他们掌握了足够的知识,可以尝试真实的东西。”
就像开发飞行模拟器一样,普林斯顿大学的研究小组利用过去在DIII-D托卡马克上的实验数据,构建了一个深度神经网络,能够根据实时等离子体特性预测未来撕裂不稳定的可能性。
他们用那个神经网络来训练强化学习算法。就像飞行员学员一样,强化学习算法可以尝试不同的策略来控制等离子体,在模拟环境的安全条件下,通过反复试验来学习哪些策略有效,哪些策略无效。
Jalalvand说:“我们不会教强化学习模型所有的聚变反应的复杂物理。”“我们告诉它目标是什么——保持高功率反应——要避免什么——撕裂模式不稳定——以及它可以转动的旋钮来实现这些结果。随着时间的推移,它学会了实现高权力目标的最佳途径,同时避免了不稳定的惩罚。”
虽然该模型经历了无数次模拟聚变实验,试图找到保持高功率水平同时避免不稳定的方法,但合著者SangKyeun Kim可以观察并改进其行为。
“在后台,我们可以看到模型的意图,”Kim说,他是PPPL的研究科学家,也是Kolemen小组的前博士后研究员。“模型想要的一些变化太快了,所以我们努力使模型平稳和平静。作为人类,我们在人工智能想要做什么和托卡马克可以容纳什么之间进行仲裁。”
一旦他们对人工智能控制器的能力有信心,他们就在D- iii - D托卡马克的实际聚变实验中对其进行了测试,观察控制器实时改变某些托卡马克参数以避免不稳定的发生。这些参数包括改变等离子体的形状和向反应输入能量的光束的强度。
“能够提前预测不稳定性可以使这些反应比目前更被动的方法更容易运行,”Kim说。“我们不再需要等待不稳定的发生,然后在等离子体被破坏之前采取快速纠正措施。”
虽然研究人员表示,这项工作是一个很有前途的概念验证,展示了人工智能如何有效地控制核聚变反应,但这只是Kolemen小组正在进行的推进核聚变研究领域的许多下一步工作之一。
第一步是在DIII-D托卡马克上获得更多人工智能控制器工作的证据,然后将控制器扩展到其他托卡马克上。
“我们有强有力的证据表明,控制器在DIII-D中工作得很好,但我们需要更多的数据来证明它可以在许多不同的情况下工作,”第一作者Seo说。“我们希望朝着更普遍的方向努力。”
第二条研究路线涉及扩展算法以同时处理许多不同的控制问题。虽然目前的模型使用有限数量的诊断来避免一种特定类型的不稳定,但研究人员可以提供其他类型不稳定的数据,并为人工智能控制器提供更多的旋钮来进行调整。
“你可以想象一个大的奖励函数,可以转动许多不同的旋钮,同时控制几种类型的不稳定性,”合著者里卡多·Shousha说,他是PPPL的博士后,也是Kolemen小组的前研究生,为DIII-D的实验提供了支持。
在为核聚变反应开发更好的人工智能控制器的过程中,研究人员可能还会对潜在的物理原理有更多的了解。通过研究人工智能控制器在试图控制等离子体时的决定(这可能与传统方法截然不同),人工智能不仅可以成为控制聚变反应的工具,还可以成为一种教学资源。
科尔曼说:“最终,这可能不仅仅是科学家开发和部署这些人工智能模型的单向互动。”“通过更详细地研究它们,它们可能也能教给我们一些东西。”