一種基于視覺反饋和強化學(xué)習(xí)的柔性臂控制與規(guī)劃方法,包括:采集目標(biāo)定位訓(xùn)練樣本;對目標(biāo)定位深度神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練;設(shè)計針對所述柔性臂的基于Q?learning的強化學(xué)習(xí)算法;通過訓(xùn)練好的所述目標(biāo)定位深度神經(jīng)網(wǎng)絡(luò)進行目標(biāo)檢測,檢測的輸出作為強化學(xué)習(xí)的輸入量,進行強化學(xué)習(xí);根據(jù)強化學(xué)習(xí)結(jié)果,驅(qū)動所述柔性臂完成指定操控任務(wù)。本發(fā)明的有益效果是:適應(yīng)范圍廣,由于強化學(xué)習(xí)不依賴模型的控制特性,可以適用于解決多種復(fù)雜結(jié)構(gòu)的柔性機器人的控制問題,可以在柔性機器人操控領(lǐng)域廣泛應(yīng)用,為目前缺乏有效控制手段的柔性機器人領(lǐng)域提供重要的技術(shù)支持。
聲明:
“基于視覺反饋和強化學(xué)習(xí)的柔性臂控制與規(guī)劃方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)