基于分布式多智能體強(qiáng)化學(xué)習(xí)的電網(wǎng)多斷面功率自動控制方法,通過多智能體與電力仿真環(huán)境交互,能夠自主學(xué)習(xí)合適的用于復(fù)雜電網(wǎng)的多斷面功率控制策略。首先根據(jù)電網(wǎng)控制的需要選取N個目標(biāo)斷面,并依此構(gòu)建強(qiáng)化學(xué)習(xí)方法的環(huán)境、智能體、觀測狀態(tài)、動作、獎勵函數(shù)等基本元素;其次運行多斷面功率控制任務(wù)交互環(huán)境,創(chuàng)造初始潮流數(shù)據(jù)集;之后,為每個智能體構(gòu)造基于深度神經(jīng)網(wǎng)絡(luò)的決策網(wǎng)絡(luò)和估值網(wǎng)絡(luò),構(gòu)建MADDPG(多智能體深度確定性策略梯度)模型并引入分布式方法進(jìn)行訓(xùn)練自主學(xué)習(xí)最優(yōu)控制策略;最后,應(yīng)用訓(xùn)練完成的策略網(wǎng)絡(luò)自動斷面控制。本發(fā)明的優(yōu)點在于,采用多智能體強(qiáng)化學(xué)習(xí)方法處理復(fù)雜的電網(wǎng)多斷面功率控制問題,具有較高的控制成功率且無需專家經(jīng)驗,同時引入分布式方法大幅提升了智能體訓(xùn)練效率。
聲明:
“基于分布式多智能體強(qiáng)化學(xué)習(xí)的電網(wǎng)多斷面功率自動控制方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)