本發(fā)明公開一種運(yùn)動(dòng)學(xué)約束條件下基于深度強(qiáng)化學(xué)習(xí)的UAV路徑規(guī)劃方法,具體步驟如下:S1:深度強(qiáng)化學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)根據(jù)多個(gè)任務(wù)點(diǎn)以及靜態(tài)障礙物的向量坐標(biāo)得出最短路徑;S2:無人機(jī)起飛后沿著最短路徑飛行執(zhí)行任務(wù);S3:當(dāng)探測(cè)到存在動(dòng)態(tài)障礙物,無人機(jī)向基地發(fā)送信號(hào),由超級(jí)計(jì)算機(jī)預(yù)測(cè)無人機(jī)接收信號(hào)時(shí)所在的位置;S4:根據(jù)動(dòng)態(tài)障礙物以及剩余任務(wù)點(diǎn)的坐標(biāo)使用深度強(qiáng)化學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)輸出得到新的飛行路徑,并通過無線電將新的路徑發(fā)送給無人機(jī);S5:無人機(jī)沿著新的路徑執(zhí)行任務(wù),執(zhí)行完所有任務(wù)后最終返回基地。本發(fā)明提出了一種基于online和offline的框架,不僅解決了Q?Learning中狀態(tài)和動(dòng)作都是高維的問題,而且在解決TSP問題的同時(shí)考慮運(yùn)動(dòng)學(xué)模型并避開動(dòng)態(tài)障礙物。
聲明:
“運(yùn)動(dòng)學(xué)約束條件下基于深度強(qiáng)化學(xué)習(xí)的UAV路徑規(guī)劃方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)