本發(fā)明涉及一種基于多模態(tài)強(qiáng)化學(xué)習(xí)的電網(wǎng)調(diào)控方法,包括以下步驟:步驟1、輸入電網(wǎng)的數(shù)據(jù)集;步驟2、構(gòu)建出包含數(shù)據(jù)集中電網(wǎng)設(shè)備節(jié)點(diǎn)狀態(tài)和故障處置的知識(shí)圖譜;步驟3、獲得能對(duì)當(dāng)前設(shè)備節(jié)點(diǎn)多模態(tài)狀態(tài)和故障處置動(dòng)作進(jìn)行的Embedding的多模態(tài)信息融合模塊;步驟4、選取步驟2中構(gòu)建的知識(shí)圖譜,根據(jù)當(dāng)前狀態(tài)到目標(biāo)狀態(tài)的情況定義出多跳評(píng)分函數(shù),用于評(píng)估兩個(gè)狀態(tài)之間的相關(guān)性;步驟5、構(gòu)建故障處置的元路徑;步驟6、產(chǎn)生強(qiáng)化學(xué)習(xí)的獎(jiǎng)勵(lì)函數(shù);步驟7、定義強(qiáng)化學(xué)習(xí)的馬爾可夫過程生成基于policy?based的強(qiáng)化學(xué)習(xí)框架;步驟8、訓(xùn)練產(chǎn)生基于多模態(tài)強(qiáng)化學(xué)習(xí)獲得的電網(wǎng)調(diào)控策略。本發(fā)明可解釋性強(qiáng)且預(yù)測準(zhǔn)確性高。
聲明:
“基于多模態(tài)強(qiáng)化學(xué)習(xí)的電網(wǎng)調(diào)控方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)