本發(fā)明涉及一種基于強(qiáng)化學(xué)習(xí)的火電燃燒優(yōu)化方法,包括以下步驟:1)獲取火力發(fā)電燃燒過程中的相關(guān)變量,定義M
t={i
t,s
t,p
t}為t時(shí)刻的數(shù)據(jù)信息;2)構(gòu)建預(yù)測(cè)網(wǎng)絡(luò),根據(jù)最近兩次歷史數(shù)據(jù)信息M
t?1、M
t以及下一時(shí)刻的可控輸入i
t+1預(yù)測(cè)下一時(shí)刻的中間狀態(tài)量s
t+1和性能指標(biāo)p
t+1;3)定義S
t={M
t?2,M
t?1,i
t}為馬爾科夫決策問題在t時(shí)刻的狀態(tài),以輸入對(duì)應(yīng)的增量矢量作為馬爾科夫決策問題的動(dòng)作A
t,并且以前后狀態(tài)的線性加權(quán)綜合指標(biāo)KPI的增量ΔCI
t作為馬爾科夫決策問題的獎(jiǎng)勵(lì)R
t,并定義狀態(tài)跳轉(zhuǎn);4)采用深度決定性策略梯度對(duì)馬爾科夫決策問題進(jìn)行求解。與現(xiàn)有技術(shù)相比,本發(fā)明具有泛化能力強(qiáng)、普遍適用性、快速響應(yīng)等優(yōu)點(diǎn)。
聲明:
“基于強(qiáng)化學(xué)習(xí)的火電燃燒優(yōu)化方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)