本發(fā)明涉及一種基于遷移強化學習的碳排放指數(shù)預測與治理方法,是針對現(xiàn)有同類技術中碳排放指數(shù)遷移強化學習和預測治理方法較難準確精準預測,以及較難最大化治理的技術問題。其要點是該預測方法通過遷移學習方法對具有相似特征區(qū)域的碳排放模型進行遷移,共享碳排放指數(shù)預測的信息;將遷移學習預測到的碳排放指數(shù)作為強化學習狀態(tài)的輸入,結合強化學習MDP進行碳排放治理建模,構建獎賞函數(shù),運用強化學習算法實現(xiàn)預測。該治理方法利用MDP構建大規(guī)模自適應動態(tài)治理工具選擇和組合,并利用強化學習的方法進行最優(yōu)化策略求解,這個最優(yōu)策略將引導整個治理工具組合過程達到最終目標,最優(yōu)的工具組合方案即為MDP最優(yōu)策略所對應的動作序列。
聲明:
“基于遷移強化學習的碳排放指數(shù)預測與治理方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)