本申請公開了一種基于強化學(xué)習的無人車避障方法及裝置,利用強化學(xué)習算法,在預(yù)先獲取的環(huán)境約束下,對動態(tài)窗口避障模型進行訓(xùn)練,得到預(yù)測窗口?;陬A(yù)測窗口和速度采樣約束,采樣多組速度,并針對每組采樣速度,生成一組軌跡。利用預(yù)先構(gòu)建的避障懲罰函數(shù)和評價函數(shù),對多組軌跡進行評分。從各組軌跡中選取評分最高的軌跡,作為目標軌跡。將目標軌跡所對應(yīng)的采樣速度,輸出至無人車的控制系統(tǒng)中,使得無人車依據(jù)目標軌跡所對應(yīng)的采樣速度進行驅(qū)動。利用強化學(xué)習對動態(tài)窗口避障模型進行訓(xùn)練,并利用避障懲罰函數(shù)從各組軌跡中選出避障性能較高的軌跡??梢?,利用本申請所述的方法,能夠提高無人車的避障性能,實現(xiàn)無人車的主動避障。
聲明:
“基于強化學(xué)習的無人車避障方法及裝置” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)