本發(fā)明涉及一種基于強化學習的風蓄生態(tài)發(fā)電日隨機優(yōu)化調度方法,包括:預先構建目標函數(shù),所述目標函數(shù)以風電?抽蓄聯(lián)合系統(tǒng)實際出力與計劃出力偏差平方的期望值最小為目標;獲取當前風電出力實際值和風電出力預測值;利用Q(λ)?learning算法迭代求解目標函數(shù),得到調度策略:將當前水庫容量作為狀態(tài)初始值,利用啟發(fā)式貪婪策略在水庫進出流量集中選取動作,利用資格跡函數(shù)提取動作資格,利用啟發(fā)函數(shù)提取動作的啟發(fā)信息;計算執(zhí)行當前動作的獎勵值并更新Q值,得到Q值表;根據(jù)Q值表確定調度策略。
聲明:
“基于強化學習的風蓄生態(tài)發(fā)電日隨機優(yōu)化調度方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)