本發(fā)明公開了一種基于深度強(qiáng)化學(xué)習(xí)的作戰(zhàn)策略優(yōu)化方法及系統(tǒng),該方法包括:構(gòu)建高超聲速滑翔彈模型,確定導(dǎo)彈的當(dāng)前狀態(tài);構(gòu)建神經(jīng)網(wǎng)絡(luò)模型,神經(jīng)網(wǎng)絡(luò)模型的輸入為突防環(huán)境,輸出為動(dòng)作集;根據(jù)突防環(huán)境,基于神經(jīng)網(wǎng)絡(luò)模型,得到預(yù)測(cè)動(dòng)作集;根據(jù)當(dāng)前狀態(tài)以及預(yù)測(cè)動(dòng)作集,計(jì)算導(dǎo)彈的下一步狀態(tài)并更新高超聲速滑翔彈模型;采用Minimax算法計(jì)算敵方狀態(tài);根據(jù)下一步狀態(tài)以及敵方狀態(tài)計(jì)算獎(jiǎng)懲函數(shù);根據(jù)獎(jiǎng)懲函數(shù)優(yōu)化神經(jīng)網(wǎng)絡(luò)模型;基于優(yōu)化后的神經(jīng)網(wǎng)絡(luò)模型得到最優(yōu)作戰(zhàn)策略。本發(fā)明具有短距離精確操作和長(zhǎng)期規(guī)劃預(yù)測(cè)的能力,推演效果符合預(yù)期,同時(shí)其具有較強(qiáng)的實(shí)時(shí)決策能力,可以很大程度的提高突防成功的概率,可作為滑翔彈突防的決策依據(jù)。
聲明:
“基于深度強(qiáng)化學(xué)習(xí)的作戰(zhàn)策略優(yōu)化方法及系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)