本發(fā)明公開了一種基于模型參考強化學(xué)習(xí)的無人船容錯控制方法,該方法包括:對無人船的不確定性因素進行分析,構(gòu)建無人船名義動力學(xué)模型;基于無人船名義動力學(xué)模型,設(shè)計無人船標(biāo)稱控制器;基于最大熵的Actor?Critic方法,根據(jù)實際無人船系統(tǒng)、無人船名義動力學(xué)模型的狀態(tài)變量差值和無人船標(biāo)稱控制器的輸出,構(gòu)建基于模型參考強化學(xué)習(xí)的容錯控制器;根據(jù)控制任務(wù)需求,搭建強化學(xué)習(xí)評價函數(shù)和控制策略模型并訓(xùn)練容錯控制器,得到訓(xùn)練完成的控制策略。通過使用本發(fā)明,能夠顯著提高無人船系統(tǒng)的安全性和可靠性。本發(fā)明作為一種基于模型參考強化學(xué)習(xí)的無人船容錯控制方法,可廣泛應(yīng)用于無人船控制領(lǐng)域。
聲明:
“基于模型參考強化學(xué)習(xí)的無人船容錯控制方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)