本發(fā)明公開了一種基于強化學習的自動駕駛優(yōu)化方法及相關設備,所述方法包括:在虛擬仿真環(huán)境下,采集離線訓練數據和相應的真值;構建基于注意力機制的密集交通環(huán)境預測模型;利用所述基于注意力機制的密集交通環(huán)境預測模型對所述離線訓練數據進行訓練,得到初步的環(huán)境預測模型;將所述初步的環(huán)境預測模型代入到基于值的環(huán)境模型強化學習算法或者基于策略的環(huán)境模型強化學習算法中,在相應的虛擬仿真平臺進行強化學習訓練,獲得強化學習算法模型,所述強化學習算法模型用于為智能體通過密集交通環(huán)境提供最優(yōu)策略。本發(fā)明提高了密集交通模型的預測準確率和采樣效率,提高了車輛通過密集交通環(huán)境的成功率,提高了自動駕駛的安全性。
聲明:
“基于強化學習的自動駕駛優(yōu)化方法及相關設備” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)