本發(fā)明公開(kāi)基于雙?深度期望Q?學(xué)習(xí)網(wǎng)絡(luò)算法的電網(wǎng)能量管理方法及系統(tǒng),首先基于貝葉斯神經(jīng)網(wǎng)絡(luò)對(duì)預(yù)測(cè)點(diǎn)
光伏出力不確定性建模并獲得光伏出力的概率分布;將光伏出力的概率分布輸入基于雙?深度期望Q?學(xué)習(xí)網(wǎng)絡(luò)算法的電網(wǎng)能量管理模型中得到相應(yīng)的
光伏發(fā)電出力策略;系統(tǒng)依據(jù)光伏發(fā)電出力策略運(yùn)行各光伏出力設(shè)備運(yùn)用;本發(fā)明將微電網(wǎng)經(jīng)濟(jì)調(diào)度問(wèn)題模擬為馬爾可夫決策過(guò)程,將目標(biāo)函數(shù)和約束條件映射成強(qiáng)化學(xué)習(xí)的獎(jiǎng)懲函數(shù),利用其學(xué)習(xí)和與環(huán)境交互的能力獲得最優(yōu)決策,借助貝葉斯神經(jīng)網(wǎng)絡(luò)對(duì)學(xué)習(xí)環(huán)境中光伏發(fā)電出力的不確定性建模在馬爾科夫決策過(guò)程中適當(dāng)考慮狀態(tài)隨機(jī)轉(zhuǎn)移,顯著提高算法的收斂速度。
聲明:
“基于深度期望Q-學(xué)習(xí)的電網(wǎng)能量管理方法及系統(tǒng)” 該技術(shù)專(zhuān)利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專(zhuān)利(論文)的發(fā)明人(作者)