本發(fā)明公開了一種基于自適應(yīng)權(quán)重強化學(xué)習(xí)的六足機器人避障方法,步驟包括:由六足機器人通過測距傳感器測量機器人與附近各個障礙物的距離,并通過模糊隸屬度函數(shù)將測量的障礙物距離轉(zhuǎn)化為有限的狀態(tài)集合;根據(jù)有限的狀態(tài)集合建立六足機器人避障模型,再利用自適應(yīng)權(quán)重強化學(xué)習(xí)算法學(xué)習(xí)出最優(yōu)網(wǎng)絡(luò)模型參數(shù)θ*;根據(jù)上述訓(xùn)練好的最優(yōu)網(wǎng)絡(luò)模型參數(shù)θ*得到六足機器人避障的最優(yōu)目標(biāo)策略,由最優(yōu)目標(biāo)策略獲得六足機器人在t時刻避障所要采取的動作a
t。該避障方法能夠在障礙物數(shù)量較多的位置環(huán)境中實現(xiàn)較好的避障效果,具有良好的市場應(yīng)用前景。
聲明:
“基于自適應(yīng)權(quán)重強化學(xué)習(xí)的六足機器人避障方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)