本發(fā)明公開一種基于課程學(xué)習(xí)的無人機(jī)空中博弈對抗的解決方法,包含以下步驟:(1)構(gòu)建仿真模擬環(huán)境;(2)收集飛行員控制飛機(jī)的真實(shí)軌跡數(shù)據(jù),將軌跡數(shù)據(jù)按照機(jī)動動作難度進(jìn)行課程目標(biāo)分類;(3)對指定課程目標(biāo)下的軌跡,通過模仿學(xué)習(xí)來優(yōu)化策略模型生成的軌跡和專家軌跡的相似度;(4)獲得預(yù)訓(xùn)練無人機(jī)策略模型;(5)基于預(yù)訓(xùn)練無人機(jī)策略模型,在模擬器中創(chuàng)建敵我雙方無人機(jī)智能體;(6)無人機(jī)在模擬器中獲得當(dāng)前時(shí)刻的觀測;(7)無人機(jī)與模擬環(huán)境進(jìn)行交互,將我方與敵方無人機(jī)對抗的任務(wù)建模為一個(gè)強(qiáng)化學(xué)習(xí)智能體與環(huán)境交互的問題,用強(qiáng)化學(xué)習(xí)算法優(yōu)化無人機(jī)對抗的飛行策略;(8)獲得無人機(jī)進(jìn)行空中博弈對抗的有效策略。
聲明:
“基于課程學(xué)習(xí)的無人機(jī)空中博弈對抗的解決方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)