本發(fā)明涉及機器人智能控制領域,特別涉及基于模型預測控制優(yōu)化強化學習的四足機器人控制方法,包括:根據(jù)物理樣機的物理參數(shù)建立動力學模型,并將動力學模型轉化為狀態(tài)空間方程;根據(jù)狀態(tài)空間方程優(yōu)化模型預測控制,并將優(yōu)化后的模型預測控制部署到物理樣機上;建立強化學習模型,強化學習模型與環(huán)境、模型預測控制同時交互訓練物理樣機。通過基于模型預測控制優(yōu)化強化學習降低訓練過程中產(chǎn)生的無意義數(shù)據(jù),通過模型引導訓練降低對算力的需求,能直接部署于物理樣機訓練減少訓練過程解決了基于價值和策略的算法對數(shù)據(jù)和算力要求高,需要昂貴的計算機設備進行預訓練才能夠初步達到機器人的控制效果,在部署到物理樣機后還需進行長時間訓練的問題。
聲明:
“基于模型預測控制優(yōu)化強化學習的四足機器人控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)