本發(fā)明公開一種基于強(qiáng)化學(xué)習(xí)的線性系統(tǒng)數(shù)據(jù)驅(qū)動(dòng)模型預(yù)測控制方法,能夠保證控制算法的穩(wěn)定性,避免模型預(yù)測控制中復(fù)雜的終端約束、終端集、終端代價(jià)設(shè)計(jì)等。包括:在開環(huán)狀態(tài)下,對(duì)線性系統(tǒng)施加隨機(jī)的輸入,并測量線性系統(tǒng)的輸出,收集N組輸入?輸出軌跡,分別構(gòu)建漢克爾矩陣;在采樣時(shí)刻k,利用線性系統(tǒng)的歷史軌跡求解所述漢克爾矩陣優(yōu)化問題,預(yù)測得到線性系統(tǒng)未來的輸入、輸出和最小化目標(biāo)函數(shù);根據(jù)所述最小目標(biāo)函數(shù)利用強(qiáng)化學(xué)習(xí)方法迭代更新權(quán)重直到終端代價(jià)函數(shù)收斂;將預(yù)測得到的最優(yōu)控制輸入中的第一個(gè)元素作為輸入作用于系統(tǒng),并觀測系統(tǒng)輸出,循環(huán)直到系統(tǒng)穩(wěn)定。
聲明:
“基于強(qiáng)化學(xué)習(xí)的線性系統(tǒng)數(shù)據(jù)驅(qū)動(dòng)模型預(yù)測控制方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)