本發(fā)明涉及一種基于強化學習的無人艇混合感知自主避障方法及系統(tǒng),該方法包括以下步驟:1)搭建海洋環(huán)境;2)根據(jù)無人艇推進器情況設置動作空間,根據(jù)靜態(tài)海圖提供的全局規(guī)劃信息與雷達系統(tǒng)探測半徑范圍內(nèi)的障礙物信息學習得到強化學習狀態(tài)編碼;3)設置獎勵目標權(quán)重,獲得綜合獎勵函數(shù);4)搭建并訓練評價網(wǎng)絡與策略網(wǎng)絡;5)將強化學習狀態(tài)編碼分別輸入至評價網(wǎng)絡與策略網(wǎng)絡,將綜合獎勵函數(shù)輸入至評價網(wǎng)絡,根據(jù)學習到的策略網(wǎng)絡的均值對應的動作,決定控制器的輸出。與現(xiàn)有技術相比,本發(fā)明具有高度自我學習的能力,可以經(jīng)過簡單的部署訓練適應不同大規(guī)模復雜環(huán)境,進而實現(xiàn)自主感知、自主導航、自主避障。
聲明:
“基于強化學習的無人艇混合感知自主避障方法及系統(tǒng)” 該技術專利(論文)所有權(quán)利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)