本發(fā)明公開了一種基于局部數(shù)據(jù)增強(qiáng)的流程工業(yè)強(qiáng)化學(xué)習(xí)控制的加速方法,包括:首先,在強(qiáng)化學(xué)習(xí)訓(xùn)練過程中,在歷史案例庫中檢索與當(dāng)前狀況相似的案例,將其作為局部模態(tài)下的鄰近數(shù)據(jù);其次,利用這些檢索到的基于案例的知識,在局部操作范圍內(nèi)建立輔助的局部動力學(xué)模型;然后,使用在線建立的局部動力學(xué)模型生成一系列虛擬的案例,作為經(jīng)驗回放緩沖區(qū)的增廣案例;最后,將生成的虛擬案例和交互獲得的真實案例合并,共同組成一個新的聯(lián)合經(jīng)驗回放緩沖區(qū),用于更新強(qiáng)化學(xué)習(xí)智能體。本發(fā)明可有效地提升強(qiáng)化學(xué)習(xí)智能體在跨模態(tài)/跨工況情況下的訓(xùn)練效率以及遷移學(xué)習(xí)能力,從而為流程工業(yè)智能優(yōu)化控制奠定基礎(chǔ)。
聲明:
“基于局部數(shù)據(jù)增強(qiáng)的流程工業(yè)強(qiáng)化學(xué)習(xí)控制的加速方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)