本發(fā)明公開一種規(guī)則約束下基于深度強化學習的船舶避碰決策方法。該方法考慮船舶操縱特性,引入MMG模型,通過該模型推斷船舶實時的航行信息。然后設(shè)計了分場景、考慮駕駛經(jīng)驗的狀態(tài)空間和動作空間定義方法,并提出了避碰決策網(wǎng)絡(luò)構(gòu)建和訓練框架。此外,為了充分考慮規(guī)則,設(shè)計了一套分層的獎勵函數(shù)組合,并將其用于后期決策網(wǎng)絡(luò)的訓練。隨后通過引入DQN算法,構(gòu)建了避碰決策網(wǎng)絡(luò)訓練模型,并經(jīng)過大量的訓練獲得了可適用于不同場景的避碰決策網(wǎng)絡(luò)。最后,為了驗證所提方法的適用性,設(shè)計了多種仿真測試場景進行了綜合性能評價。該方法能夠使船舶在復(fù)雜環(huán)境下安全避碰,同時保證其符合規(guī)則和良好船藝的要求。
聲明:
“規(guī)則約束下基于深度強化學習的船舶避碰決策方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)