一種基于深度強化學習的加速器束流軌道控制方法及系統(tǒng),其用于將加速器的束流軌道控制在目標狀態(tài),所述方法利用訓練數(shù)據(jù)采用深度強化學習方法對深度神經(jīng)網(wǎng)絡(luò)進行預(yù)訓練,存儲訓練完的深度神經(jīng)網(wǎng)絡(luò)的權(quán)重參數(shù)及軌道控制策略的經(jīng)驗數(shù)據(jù);利用束流位置監(jiān)測器在線獲取束流軌道的狀態(tài)數(shù)據(jù),將其饋入到所述深度深度神經(jīng)網(wǎng)絡(luò),將所述深度神經(jīng)網(wǎng)絡(luò)的輸出耦接到束流軌道校正器;載入所述訓練完的深度神經(jīng)網(wǎng)絡(luò)的權(quán)重數(shù)據(jù)及軌道控制策略的經(jīng)驗數(shù)據(jù),所述深度神經(jīng)網(wǎng)絡(luò)通過預(yù)測控制并進行在線強化學習調(diào)整控制參數(shù)將束流軌道自適應(yīng)穩(wěn)定控制在目標狀態(tài)。
聲明:
“基于深度強化學習的加速器束流軌道控制方法及系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)