本發(fā)明提供了一種基于強(qiáng)化學(xué)習(xí)的無(wú)人機(jī)空戰(zhàn)機(jī)動(dòng)決策方法,首先創(chuàng)建飛機(jī)平臺(tái)的運(yùn)動(dòng)模型;然后分析影響空戰(zhàn)態(tài)勢(shì)的各主要因素,在運(yùn)動(dòng)模型和空戰(zhàn)態(tài)勢(shì)因素分析的基礎(chǔ)上,設(shè)計(jì)空戰(zhàn)機(jī)動(dòng)決策的動(dòng)態(tài)模糊Q學(xué)習(xí)模型,確定強(qiáng)化學(xué)習(xí)的各要素和算法流程;對(duì)空戰(zhàn)機(jī)動(dòng)決策的狀態(tài)空間進(jìn)行模糊化作為強(qiáng)化學(xué)習(xí)的狀態(tài)輸入;選取典型空戰(zhàn)動(dòng)作作為強(qiáng)化學(xué)習(xí)基本行動(dòng),通過(guò)各模糊規(guī)則的觸發(fā)強(qiáng)度加權(quán)求和實(shí)現(xiàn)連續(xù)行動(dòng)空間的覆蓋;在構(gòu)建的空戰(zhàn)優(yōu)勢(shì)函數(shù)為基礎(chǔ)通過(guò)設(shè)置權(quán)重和疊加獎(jiǎng)懲值的方法設(shè)置了強(qiáng)化學(xué)習(xí)的回報(bào)值。本發(fā)明可有效提高無(wú)人機(jī)進(jìn)行空戰(zhàn)機(jī)動(dòng)自主決策的能力,具有較高的魯棒性和自主尋優(yōu)性,在不斷的仿真和學(xué)習(xí)中無(wú)人機(jī)所做的決策水平不斷提高。
聲明:
“基于強(qiáng)化學(xué)習(xí)的無(wú)人機(jī)空戰(zhàn)機(jī)動(dòng)決策方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)