本發(fā)明提出了一種基于情景記憶的無人機控制決策方法,實現(xiàn)步驟為:構(gòu)建無人機控制場景;獲取各個無人機的觀測信息;構(gòu)建深度強化學(xué)習(xí)模型H并進(jìn)行初始化;構(gòu)建情節(jié)記憶探索表;對深度強化學(xué)習(xí)模型H迭代訓(xùn)練;使用訓(xùn)練后的深度強化學(xué)習(xí)模型H對無人機行為進(jìn)行自主控制。本發(fā)明使用多智能體分布式情節(jié)記憶探索表存儲智能體過去相似經(jīng)歷的最優(yōu)回報,并在智能體實際的探索過程中采用隨機動作和情節(jié)記憶探索表中最優(yōu)探索動作組合的形式進(jìn)行動作選取,提高無人機控制任務(wù)的完成率和深度強化學(xué)習(xí)算法的收斂時間。
聲明:
“基于情景記憶的無人機控制決策方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)