本發(fā)明公開(kāi)一種基于分層強(qiáng)化學(xué)習(xí)的四足機(jī)器人運(yùn)動(dòng)規(guī)劃方法,該方法通過(guò)構(gòu)建基于深度強(qiáng)化學(xué)習(xí)的上層行為決策控制器以及基于模型預(yù)測(cè)控制的下層運(yùn)動(dòng)執(zhí)行控制器;對(duì)于上層的深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò),基于SAC算法設(shè)計(jì)四足機(jī)器人的狀態(tài)更新網(wǎng)絡(luò)、動(dòng)作執(zhí)行網(wǎng)絡(luò)以及獎(jiǎng)勵(lì)函數(shù)等,結(jié)合機(jī)器人周?chē)沫h(huán)境高度圖信息輸出對(duì)應(yīng)的行為控制參數(shù);對(duì)于下層執(zhí)行控制器中的模型預(yù)測(cè)控制器,通過(guò)求解基于上層輸入的控制參數(shù)二次規(guī)劃方程組來(lái)獲取對(duì)應(yīng)的控制指令。該分層控制框架結(jié)合了深度強(qiáng)化學(xué)習(xí)與模型預(yù)測(cè)控制的優(yōu)勢(shì),使四足機(jī)器人能夠根據(jù)當(dāng)前機(jī)身狀態(tài)以及地形環(huán)境做出更安全可靠的行為模式,保持機(jī)身姿態(tài)平穩(wěn),從而有效規(guī)避風(fēng)險(xiǎn),實(shí)現(xiàn)在復(fù)雜地形下的有效運(yùn)動(dòng)軌跡規(guī)劃。
聲明:
“基于分層強(qiáng)化學(xué)習(xí)的四足機(jī)器人運(yùn)動(dòng)規(guī)劃方法” 該技術(shù)專(zhuān)利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專(zhuān)利(論文)的發(fā)明人(作者)