本發(fā)明公開了一種基于多智能體強化學習和雙層策略分配的多區(qū)域熱電協調控制方法,包括:建立多區(qū)域熱電聯合系統(tǒng)數字孿生模型;創(chuàng)建多個區(qū)域智能體,并建立多個區(qū)域智能體間的通信機制;設計基于多智能體均衡學習算法的多區(qū)域均衡控制器,包括獎勵函數、均衡選擇函數和資格跡的選??;通過多區(qū)域均衡控制器對各個區(qū)域進行狀態(tài)估計、更新資格跡、獎勵值觀測和更新狀態(tài)?動作值函數操作后,再進行多個區(qū)域部分信息的交互,在線尋求各區(qū)域最優(yōu)均衡總控制策略;將區(qū)域熱電聯合系統(tǒng)中每臺機組作為一個機組智能體,以各機組的爬升時間作為一致性變量,采用一致性算法將各區(qū)域總控制策略分配給各個機組,實現區(qū)域內各機組之間的協調控制。
聲明:
“多智能體強化學習和雙層策略分配的多區(qū)域熱電協調控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)