本發(fā)明提供了一種基于深度強化學習PPO算法的磨削恒力控制方法,該方法首先對球形砂輪磨削過程時的末端執(zhí)行器進行受力分析,通過力處理獲取真實磨削力;利用深度強化學習PPO算法訓(xùn)練當前磨削力和預(yù)設(shè)磨削力之差與末端執(zhí)行器法向補償位移之間的關(guān)系模型,包括訓(xùn)練數(shù)據(jù)歸一化預(yù)處理、基于歐式距離的獎勵函數(shù)設(shè)計、針對性深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計與促進算法收斂設(shè)計;基于PPO算法的控制器訓(xùn)練與磨削機器人恒力控制器使用。本發(fā)明的方法不用提前建立磨削力誤差和法向位移之間的先驗?zāi)P?,能完成平面磨削和曲面磨削時把磨削力控制在目標磨削力內(nèi)的任務(wù),同時具有良好的自適應(yīng)能力。
聲明:
“基于深度強化學習PPO算法的磨削恒力控制方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)