本發(fā)明公開了一種基于強(qiáng)化學(xué)習(xí)的高超聲速飛行器航跡規(guī)劃方法,本發(fā)明根據(jù)航跡規(guī)劃分2個(gè)階段:離線訓(xùn)練階段,訓(xùn)練一個(gè)不依賴于固定環(huán)境的RL智能體作為航跡規(guī)劃的基線策略;在線規(guī)劃階段,RL?CEM利用環(huán)境模擬器預(yù)測(cè)未來(lái)的狀態(tài)進(jìn)行規(guī)劃,之后選擇優(yōu)于基線策略的策略作為執(zhí)行策略,否則將使用基線策略。本發(fā)明提出的RL?CEM不僅有效地回避航跡規(guī)劃中的局部最優(yōu),還展現(xiàn)出了令人滿意的成功率。RL?CEM彌補(bǔ)了以往基于RL的航跡規(guī)劃方法容易陷入局部最優(yōu)、規(guī)劃失敗時(shí)無(wú)替代方案的缺點(diǎn)。本發(fā)明的航跡規(guī)劃方法回避了高超聲速飛行器復(fù)雜的動(dòng)力學(xué),僅通過其運(yùn)動(dòng)學(xué)來(lái)解決該問題。
聲明:
“基于強(qiáng)化學(xué)習(xí)的高超聲速飛行器航跡規(guī)劃方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)