本發(fā)明公開了基于日內(nèi)多目標(biāo)強化學(xué)習(xí)的梯級電站離線調(diào)度方法及系統(tǒng),涉及電力系統(tǒng)調(diào)度技術(shù)領(lǐng)域,其技術(shù)方案要點是:根據(jù)日內(nèi)調(diào)度場景對調(diào)度任務(wù)進(jìn)行劃分,得到戰(zhàn)略任務(wù)以及兼顧任務(wù);利用貝葉斯回歸模型從日內(nèi)調(diào)度的決策因子中預(yù)測未來來水和電力需求的概率分布;根據(jù)戰(zhàn)略任務(wù)、兼顧任務(wù)和決策因子構(gòu)建梯級電站調(diào)度的調(diào)度仿真系統(tǒng);根據(jù)日內(nèi)調(diào)度場景確定多目標(biāo)的標(biāo)準(zhǔn)化回報函數(shù),并將標(biāo)準(zhǔn)化回報函數(shù)加入調(diào)度仿真系統(tǒng)以實現(xiàn)對調(diào)度策略進(jìn)行評價;根據(jù)調(diào)度策略的評價結(jié)果在調(diào)度仿真系統(tǒng)中訓(xùn)練調(diào)度策略,得到離線的調(diào)度優(yōu)化模型;進(jìn)行效果驗證。本發(fā)明使得梯級電站的調(diào)度策略生成過程準(zhǔn)確度較高,整體實現(xiàn)的可靠性較強。
聲明:
“基于日內(nèi)多目標(biāo)強化學(xué)習(xí)的梯級電站離線調(diào)度方法及系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)