本發(fā)明公開了一種自動駕駛汽車強化學習方法、系統(tǒng)、裝置及存儲介質(zhì)。自動駕駛汽車強化學習方法包括:根據(jù)真實交通場景數(shù)據(jù)構(gòu)建仿真交通場景;根據(jù)仿真交通場景生成第一行為;根據(jù)仿真交通場景生成第二行為;設(shè)置偏差;根據(jù)第一行為、第二行為和偏差,采用數(shù)字孿生技術(shù)訓練自動駕駛汽車的強化學習模型。本發(fā)明通過構(gòu)建符合真實交通場景數(shù)據(jù)的仿真交通場景,并根據(jù)仿真交通場景設(shè)置第一行為和第二行為,使得交通場景中各車輛的行為考慮到了真實交通場景中的駕駛習慣和隨機事件;通過設(shè)置偏差,并采用數(shù)字孿生技術(shù)進行訓練測試,避免了真實環(huán)境中自車執(zhí)行器控制延遲帶來的性能影響,進一步提高了仿真交通場景的真實性和強化學習模型的可靠性。
聲明:
“自動駕駛汽車強化學習方法、系統(tǒng)、裝置及存儲介質(zhì)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)