本發(fā)明公開(kāi)了屬于
新能源汽車(chē)優(yōu)化管理技術(shù)領(lǐng)域的一種基于深度強(qiáng)化學(xué)習(xí)的集群電動(dòng)汽車(chē)充電行為優(yōu)化方法。本發(fā)明為基于雙延遲深度確定性策略梯度算法,實(shí)現(xiàn)對(duì)電動(dòng)汽車(chē)的功率連續(xù)可調(diào)充電過(guò)程進(jìn)行建模,訓(xùn)練智能體控制充電功率,優(yōu)化電動(dòng)汽車(chē)充電行為,將分時(shí)電價(jià)高時(shí)的負(fù)荷向電價(jià)低時(shí)進(jìn)行轉(zhuǎn)移,達(dá)到減少用戶充電開(kāi)銷(xiāo),平抑電網(wǎng)峰時(shí)負(fù)荷的目的;相較于傳統(tǒng)的優(yōu)化控制方法,TD3在速度和靈活性上優(yōu)勢(shì)明顯,且可以有效克服以往的強(qiáng)化學(xué)習(xí)方法動(dòng)作空間離散、訓(xùn)練收斂困難、穩(wěn)定性差的問(wèn)題。為增強(qiáng)智能體的泛化能力,本發(fā)明在原有狀態(tài)觀測(cè)上添加噪聲,模擬一組初始SOC不同,到達(dá)與駛離時(shí)間各異的電動(dòng)汽車(chē),并擴(kuò)展到集群電動(dòng)汽車(chē)充電行為控制。
聲明:
“基于深度強(qiáng)化學(xué)習(xí)的集群電動(dòng)汽車(chē)充電行為優(yōu)化方法” 該技術(shù)專(zhuān)利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專(zhuān)利(論文)的發(fā)明人(作者)