本發(fā)明公開了一種自動駕駛決策方法、裝置、車輛及存儲介質(zhì)。其中,該方法包括:采集目標(biāo)車輛的行車環(huán)境數(shù)據(jù),行車環(huán)境數(shù)據(jù)包括目標(biāo)車輛的車輛數(shù)據(jù)和障礙物數(shù)據(jù);利用深度神經(jīng)網(wǎng)絡(luò)模型對行車環(huán)境數(shù)據(jù)進行分析,得到?jīng)Q策動作,其中,深度神經(jīng)網(wǎng)絡(luò)模型基于回報函數(shù)和深度強化學(xué)習(xí)算法構(gòu)建并訓(xùn)練,回報函數(shù)用于根據(jù)目標(biāo)車輛至少兩個時刻的行車速度和行車位移對深度神經(jīng)網(wǎng)絡(luò)模型進行訓(xùn)練;控制目標(biāo)車輛執(zhí)行決策動作。本發(fā)明解決了決策模型中的回報函數(shù)設(shè)計不合理,進而導(dǎo)致模型輸出的決策結(jié)果不夠合理的技術(shù)問題。
聲明:
“自動駕駛決策方法、裝置、車輛及存儲介質(zhì)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)