本發(fā)明公開了一種基于強化學(xué)習(xí)的無人飛行器自主編隊智能控制方法,應(yīng)用于多無人機系統(tǒng)。本發(fā)明方法首先構(gòu)建多無人飛行器系統(tǒng)模型,確定多無人飛行器協(xié)同編隊的任務(wù)目標;然后基于MADDPG框架構(gòu)建自主編隊協(xié)同控制器,布置在每個跟隨無人飛行器上;自主編隊協(xié)同控制器包括基于策略梯度的編隊行為者網(wǎng)絡(luò)和編隊目標行為者網(wǎng)絡(luò),以及基于值的編隊評價者網(wǎng)絡(luò)和編隊目標評價者網(wǎng)絡(luò);行為者網(wǎng)絡(luò)允許單個智能體策略網(wǎng)絡(luò)的優(yōu)化過程使用鄰居節(jié)點的觀測信息,訓(xùn)練完成之后每個智能體以分散的方式行動,本發(fā)明方法可實現(xiàn)多飛行器智能協(xié)同編隊,共同完成特定的隊形保持、沖突協(xié)調(diào)以及避免碰撞等協(xié)同問題,提高采樣效率,適用于大規(guī)模的多智能體系統(tǒng)。
聲明:
“基于強化學(xué)習(xí)的無人飛行器自主編隊智能控制方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)