一種排水系統(tǒng)實(shí)時(shí)控制方法,引入強(qiáng)化學(xué)習(xí)方法,按照強(qiáng)化學(xué)習(xí)RL的模型結(jié)構(gòu)和運(yùn)行方式構(gòu)建:以排水系統(tǒng)模型為環(huán)境Environment,以深度神經(jīng)網(wǎng)絡(luò)為智能體Agent,通過智能體Agent與環(huán)境Environment之間交互運(yùn)行所獲取的大量狀態(tài)State、評價(jià)得分Reward、運(yùn)行策略Action數(shù)據(jù)反復(fù)進(jìn)行訓(xùn)練,不斷優(yōu)化智能體,實(shí)際應(yīng)用中通過智能體Agent生成運(yùn)行策略Action,以達(dá)到提升排水系統(tǒng)運(yùn)行效果的目標(biāo)。本發(fā)明借助強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)排水系統(tǒng)的優(yōu)化控制,相比于已有的啟發(fā)式實(shí)時(shí)控制來說,可以搜索全局最優(yōu)策略,更好的優(yōu)化排水系統(tǒng)運(yùn)行;相比于模型預(yù)測控制來說,可以避免預(yù)測誤差帶來的問題,可以提高排水系統(tǒng)實(shí)時(shí)控制的運(yùn)行效果。
聲明:
“排水系統(tǒng)實(shí)時(shí)控制方法與裝置” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)