本發(fā)明公開(kāi)了一種基于強(qiáng)化學(xué)習(xí)的聲吶圖像目標(biāo)識(shí)別方法,包括:(1)將卷積神經(jīng)網(wǎng)絡(luò)的層選擇過(guò)程建模為馬爾科夫決策過(guò)程;(2)定義強(qiáng)化學(xué)習(xí)Agent的狀態(tài)空間和動(dòng)作空間;(3)使用強(qiáng)化學(xué)習(xí)Q?Learn i ng算法讓Agent自動(dòng)構(gòu)建出一系列的卷積神經(jīng)網(wǎng)絡(luò);(4)從自動(dòng)生成的卷積神經(jīng)網(wǎng)絡(luò)中選出表現(xiàn)較好的網(wǎng)絡(luò)模型,調(diào)整參數(shù)并遷移到目標(biāo)檢測(cè)網(wǎng)絡(luò)中,如摘要附圖所示;(5)用聲吶圖像數(shù)據(jù)集對(duì)整個(gè)目標(biāo)檢測(cè)網(wǎng)絡(luò)進(jìn)行監(jiān)督式訓(xùn)練,完成聲吶圖像的目標(biāo)識(shí)別工作,基于強(qiáng)化學(xué)習(xí)的Q?Learn i ng算法來(lái)自動(dòng)化卷積神經(jīng)網(wǎng)絡(luò)的構(gòu)建過(guò)程,省去了大量手工調(diào)參投入,得到性能良好的卷積神經(jīng)網(wǎng)絡(luò),提高聲吶圖像識(shí)別的工作效率。
聲明:
“基于強(qiáng)化學(xué)習(xí)的聲吶圖像目標(biāo)識(shí)別方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)