本發(fā)明涉及
新能源汽車(chē)制動(dòng)領(lǐng)域,具體涉及一種基于DDPG深度強(qiáng)化學(xué)習(xí)的AEB控制方法及系統(tǒng),包括構(gòu)建基于策略網(wǎng)絡(luò)和值網(wǎng)絡(luò)構(gòu)建動(dòng)作?評(píng)價(jià)網(wǎng)絡(luò),根據(jù)策略網(wǎng)絡(luò)選擇在當(dāng)前行駛狀態(tài)下的動(dòng)作,值網(wǎng)絡(luò)對(duì)選擇的動(dòng)作進(jìn)行評(píng)價(jià);構(gòu)建基于目標(biāo)策略網(wǎng)絡(luò)和目標(biāo)值網(wǎng)絡(luò)的目標(biāo)網(wǎng)絡(luò),使用經(jīng)驗(yàn)回放機(jī)制從樣本值中隨機(jī)獲取訓(xùn)練樣本對(duì)策略網(wǎng)絡(luò)和值網(wǎng)絡(luò)進(jìn)行離線(xiàn)訓(xùn)練和更新;目標(biāo)網(wǎng)絡(luò)根據(jù)在當(dāng)前行駛狀態(tài)下執(zhí)行動(dòng)作?評(píng)價(jià)網(wǎng)絡(luò)選擇的動(dòng)作后狀態(tài)的評(píng)價(jià)值和系統(tǒng)的獎(jiǎng)勵(lì)函數(shù)更新策略網(wǎng)絡(luò);將當(dāng)前行駛狀態(tài)輸入,通過(guò)基于策略網(wǎng)絡(luò)和值網(wǎng)絡(luò)構(gòu)建動(dòng)作?評(píng)價(jià)網(wǎng)絡(luò)選擇最優(yōu)的動(dòng)作;本發(fā)明采用優(yōu)化后的制動(dòng)策略能夠提高新能源汽車(chē)的經(jīng)濟(jì)效益,降低無(wú)效油耗,減緩車(chē)輛零件老化速度。
聲明:
“基于DDPG深度強(qiáng)化學(xué)習(xí)的AEB控制方法及系統(tǒng)” 該技術(shù)專(zhuān)利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專(zhuān)利(論文)的發(fā)明人(作者)