本發(fā)明公開了一種基于深度強化學(xué)習(xí)的車輛自動循跡駕駛方法,包括如下步驟:步驟1、構(gòu)建雙重深度Q網(wǎng)絡(luò)進(jìn)行圖像特征提取;步驟2、采用經(jīng)驗回放方案進(jìn)行環(huán)境交互訓(xùn)練樣本采集和雙重網(wǎng)絡(luò)訓(xùn)練;步驟3、采用RMSprop算法優(yōu)化網(wǎng)絡(luò)的訓(xùn)練過程;步驟4、采用訓(xùn)練完畢的雙重深度網(wǎng)絡(luò)進(jìn)行預(yù)測,進(jìn)而實現(xiàn)自動循跡駕駛。本發(fā)明采取深度強化學(xué)習(xí)方法,直接實現(xiàn)從圖像采集到車輛控制的端到端網(wǎng)絡(luò)建立,避免了傳統(tǒng)方法中復(fù)雜的PID控制環(huán)節(jié),并且采用雙重深度網(wǎng)絡(luò)進(jìn)行動作預(yù)測,可以有效減少單一深度強化學(xué)習(xí)網(wǎng)絡(luò)中最大化偏差帶來的性能損失。
聲明:
“基于深度強化學(xué)習(xí)的車輛自動循跡駕駛方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)