本發(fā)明公開了一種基于神經(jīng)網(wǎng)絡和強化學習的混合能量管理方法,屬于自動化技術領域。本發(fā)明采用模糊控制器的輸出作為神經(jīng)網(wǎng)絡初始的離線數(shù)據(jù)集來進行訓練,應用學習得到的神經(jīng)網(wǎng)絡產(chǎn)生新的數(shù)據(jù)加入至原有的數(shù)據(jù)集中,并反復更迭這兩個過程。針對每個時刻的狀態(tài),采用訓練之后的神經(jīng)網(wǎng)絡來預測當前狀態(tài)在采取相應動作之后轉移到的下一狀態(tài),根據(jù)累計獎勵最大化的原則選擇一定長度的最優(yōu)動作序列,選取動作序列的第一個動作作為當前狀態(tài)的最優(yōu)控制動作。利用該方法可有效減少能量的浪費并且通過超級電容輔助
鋰電池供電,減少了鋰電池的使用,達到了延長鋰電池壽命的目標。
聲明:
“基于神經(jīng)網(wǎng)絡和強化學習的混合能量管理方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)