本發(fā)明提供一種基于DRL的四足機(jī)器人路徑規(guī)劃方法,首先通過四足機(jī)器人自帶的RGB?D相機(jī)對(duì)環(huán)境進(jìn)行預(yù)掃描,基于柵格法對(duì)運(yùn)動(dòng)環(huán)境進(jìn)行建模得到環(huán)境地圖,進(jìn)而分解為一系列具有二值信息的柵格單元,得到初始狀態(tài),將其作為深度卷積神經(jīng)網(wǎng)絡(luò)的輸入,引入注意力機(jī)制優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)以解決深度強(qiáng)化學(xué)習(xí)DQN算法未能很好利用關(guān)鍵局部信息的問題;通過端對(duì)端訓(xùn)練,結(jié)合四足機(jī)器人的運(yùn)動(dòng)特點(diǎn)設(shè)置獎(jiǎng)勵(lì)函數(shù),利用置信區(qū)間上界探索策略對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到四足機(jī)器人所能夠執(zhí)行的八個(gè)動(dòng)作的Q值;最后運(yùn)用人工勢場算法不斷探測環(huán)境中的動(dòng)態(tài)障礙物并進(jìn)行實(shí)時(shí)避礙,實(shí)現(xiàn)有效的四足機(jī)器人路徑規(guī)劃。
聲明:
“基于DRL的四足機(jī)器人路徑規(guī)劃方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)