本發(fā)明涉及一種基于深度強(qiáng)化學(xué)習(xí)的擬人化自動(dòng)駕駛跟馳模型,應(yīng)用于自動(dòng)駕駛跟馳控制領(lǐng)域。基于上海自然駕駛實(shí)驗(yàn)數(shù)據(jù),將選取的快速路跟馳數(shù)據(jù)集分為訓(xùn)練數(shù)據(jù)和驗(yàn)證數(shù)據(jù)。使用深度確定性策略梯度(DDPG)深度強(qiáng)化學(xué)習(xí)方法,通過構(gòu)建仿真環(huán)境以使強(qiáng)化學(xué)習(xí)(RL)智能體通過一系列狀態(tài)、行動(dòng)和獎(jiǎng)勵(lì)值與環(huán)境交互,選取評(píng)價(jià)指標(biāo),設(shè)置獎(jiǎng)勵(lì)函數(shù),選擇神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),設(shè)置神經(jīng)網(wǎng)絡(luò)更新策略及超參數(shù),設(shè)置探索策略,構(gòu)建深度強(qiáng)化學(xué)習(xí)的擬人化跟馳模型。通過訓(xùn)練并測(cè)試模型,進(jìn)一步優(yōu)化模型。本發(fā)明模型在軌跡復(fù)現(xiàn)和泛化能力方面超越了傳統(tǒng)跟馳模型和近期數(shù)據(jù)驅(qū)動(dòng)跟馳模型,在模仿人類跟馳行為方面具有更高的優(yōu)越性。
聲明:
“基于深度強(qiáng)化學(xué)習(xí)的擬人化自動(dòng)駕駛跟馳模型” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)