本發(fā)明公開了一種多智能體強化學(xué)習(xí)滾動調(diào)度方法、裝置、設(shè)備及存儲介質(zhì),所述方法通過構(gòu)建高比例新能源電力系統(tǒng)對應(yīng)日內(nèi)有功的滾動調(diào)度模型;對滾動調(diào)度模型進行多智能體的去中心化部分可觀馬爾科爾夫決策過程建模,獲得多智能體調(diào)度架構(gòu);獲取多智能體調(diào)度架構(gòu)的改進區(qū)域特征聚合圖的注意力網(wǎng)絡(luò),并獲取支持時空多維特征聚合的多智能體強化學(xué)習(xí)算法,根據(jù)注意力網(wǎng)絡(luò)和多智能體強化學(xué)習(xí)算法構(gòu)建基于多智能體強化學(xué)習(xí)的分布式日內(nèi)滾動調(diào)度算法的訓(xùn)練架構(gòu),建模求解速度快,訓(xùn)練過程簡單,符合電網(wǎng)調(diào)度實際應(yīng)用場景,提高了多智能體強化學(xué)習(xí)滾動調(diào)度的準(zhǔn)確性,提升了多智能體強化學(xué)習(xí)滾動調(diào)度的速度和效率。
聲明:
“多智能體強化學(xué)習(xí)滾動調(diào)度方法、裝置、設(shè)備及存儲介質(zhì)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)