本發(fā)明涉及一種狀態(tài)自適應(yīng)的機(jī)群發(fā)動(dòng)機(jī)檢測(cè)任務(wù)動(dòng)態(tài)調(diào)度方法,包括以下步驟:步驟1.結(jié)合資源充足度與任務(wù)緊迫度進(jìn)行檢測(cè)系統(tǒng)狀態(tài)實(shí)時(shí)感知;步驟2.構(gòu)建/更新基于強(qiáng)化學(xué)習(xí)的系統(tǒng)狀態(tài)自適應(yīng)重調(diào)度決策網(wǎng)絡(luò),并根據(jù)系統(tǒng)狀態(tài)輸出重調(diào)度信號(hào);步驟3.根據(jù)重調(diào)度信號(hào)決定維持原調(diào)度方案或使用智能優(yōu)化算法進(jìn)行重調(diào)度問(wèn)題求解;步驟4.根據(jù)上一步方案效果計(jì)算獎(jiǎng)勵(lì)值,并感知此時(shí)的系統(tǒng)狀態(tài);步驟5.迭代多次后輸出訓(xùn)練完成的強(qiáng)化學(xué)習(xí)決策網(wǎng)絡(luò)參數(shù)值,利用訓(xùn)練完成的強(qiáng)化學(xué)習(xí)決策網(wǎng)絡(luò)進(jìn)行機(jī)群航空發(fā)動(dòng)機(jī)檢測(cè)任務(wù)動(dòng)態(tài)調(diào)度。本發(fā)明使用強(qiáng)化學(xué)習(xí)算法進(jìn)行了系統(tǒng)狀態(tài)自適應(yīng)重調(diào)度,克服了啟發(fā)式算法的短視性,實(shí)現(xiàn)了調(diào)度效率的長(zhǎng)效提升。
聲明:
“狀態(tài)自適應(yīng)的機(jī)群發(fā)動(dòng)機(jī)檢測(cè)任務(wù)動(dòng)態(tài)調(diào)度方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)