近日,核工業(yè)西南物理研究院聯(lián)合浙江大學(xué)、之江實(shí)驗(yàn)室等單位,在磁約束核聚變等離子體智能控制領(lǐng)域取得重要進(jìn)展。研究團(tuán)隊(duì)基于中國環(huán)流三號(hào)(HL-3)托卡馬克的實(shí)驗(yàn)數(shù)據(jù),成功開發(fā)并驗(yàn)證了一套具有國際先進(jìn)水平的等離子體控制方法,為未來聚變堆的穩(wěn)定、高效運(yùn)行探索了新的技術(shù)路徑。相關(guān)研究成果在國際頂級學(xué)術(shù)期刊《Nature》旗下的物理學(xué)Q1期刊《Communications Physics》上發(fā)表。

托卡馬克被認(rèn)為是有望率先實(shí)現(xiàn)聚變能源應(yīng)用的可控核聚變技術(shù)途徑,其核心挑戰(zhàn)在于對超高溫等離子體進(jìn)行長時(shí)間的精確約束和穩(wěn)定控制。傳統(tǒng)控制方法高度依賴復(fù)雜的物理模型和第一性原理模擬器,計(jì)算耗時(shí)長,難以滿足如強(qiáng)化學(xué)習(xí)等先進(jìn)控制算法的快速、高效訓(xùn)練的需求。因此,構(gòu)建兼具高精度與高效率的等離子體動(dòng)態(tài)預(yù)測模型,對未來聚變裝置如國際熱核聚變實(shí)驗(yàn)堆(ITER)的智能化運(yùn)行具有重要意義。
在此次研究中,團(tuán)隊(duì)創(chuàng)新性地構(gòu)建了一套完全基于中國環(huán)流三號(hào)歷史實(shí)驗(yàn)數(shù)據(jù)的動(dòng)理學(xué)模型。該模型融合了長短期記憶網(wǎng)絡(luò)(LSTM)、自注意力機(jī)制及計(jì)劃采樣等人工智能技術(shù),有效克服了在長期預(yù)測中由模型自回歸特性導(dǎo)致的累積誤差難題,能夠高保真地預(yù)測等離子體電流、位形等多個(gè)關(guān)鍵參數(shù)的演化。

與基于第一性原理的傳統(tǒng)建模方式相比,該數(shù)據(jù)驅(qū)動(dòng)模型顯著提升了強(qiáng)化學(xué)習(xí)智能體的訓(xùn)練效率——訓(xùn)練時(shí)間從數(shù)十小時(shí)大幅縮短至數(shù)十分鐘。研究團(tuán)隊(duì)將該智能體成功部署于中國環(huán)流三號(hào)的等離子體控制系統(tǒng),在真實(shí)的物理實(shí)驗(yàn)環(huán)境中完成了等離子體電流與位形參數(shù)的閉環(huán)磁控制。實(shí)驗(yàn)結(jié)果表明,該智能體不僅能精準(zhǔn)跟蹤復(fù)雜的等離子體位形目標(biāo),在面對訓(xùn)練中未出現(xiàn)過的新控制目標(biāo)時(shí),亦展現(xiàn)出優(yōu)異的“零樣本”適應(yīng)能力和控制魯棒性。
這項(xiàng)研究在國際上率先成功構(gòu)建了一條從真實(shí)實(shí)驗(yàn)數(shù)據(jù)到端到端智能控制的全新路徑,不僅為中國環(huán)流三號(hào)的高效運(yùn)行提供了快速可靠的智能控制解決方案,也為ITER及未來商用聚變堆的常態(tài)化、自動(dòng)化運(yùn)行控制奠定了重要的理論與實(shí)驗(yàn)基礎(chǔ)。