本發(fā)明公開了一種基于雙層模糊強化學習的六足機器人避障方法,步驟包括:六足機器人通過身體前方三個超聲波傳感器測量出機器人與周圍障礙物的距離,然后將三個距離分別進行模糊推理,將測量的障礙物信息轉換為有限的狀態(tài);然后計算出輸出的動作變量,之后對動作變量再次進行模糊推理,結合兩次模糊推理再利用sarsa(λ)訓練出機器人在相應狀態(tài)下所要采取的動作。本發(fā)明采用模糊sarsa(λ)的方法,可以很好的解決強化學習難以利用與連續(xù)狀態(tài)的問題,也可以有效的解決模糊控制中模糊推理機制建立復雜的問題。
聲明:
“基于雙層模糊強化學習的六足機器人避障方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)