本發(fā)明提出了一種電力系統(tǒng)深度強化學(xué)習(xí)緊急控制策略提取方法。通過引入電力系統(tǒng)節(jié)點模型多個歷史時刻的特征數(shù)據(jù)構(gòu)建觀測數(shù)據(jù);進一步構(gòu)建深度Q學(xué)習(xí)網(wǎng)絡(luò)模型,并采用隨機梯度下降優(yōu)化算法進行優(yōu)化訓(xùn)練得到電力系統(tǒng)緊急控制深度強化學(xué)習(xí)模型;基于已訓(xùn)練完成的深度Q學(xué)習(xí)網(wǎng)絡(luò)模型,在特定的故障場景下,生成數(shù)據(jù)集;并在此數(shù)據(jù)及上訓(xùn)練基于信息增益比的加權(quán)傾斜決策樹模型,以完成策略提?。辉O(shè)定策略保真度指標(biāo)、策略實際控制性能指標(biāo)、模型復(fù)雜度指標(biāo),以評估不同超參數(shù)下的模型性能,從而根據(jù)實際需求選出最優(yōu)模型,以用于電力系統(tǒng)緊急控制領(lǐng)域中。
聲明:
“電力系統(tǒng)深度強化學(xué)習(xí)緊急控制策略提取方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)