本申請公開了基于元強(qiáng)化學(xué)習(xí)的智能車輛交叉口決策方法、設(shè)備及介質(zhì),用以解決現(xiàn)有的車輛行為決策方法未考慮交叉口場景的復(fù)雜性和不確定性,且自適應(yīng)性欠佳的技術(shù)問題。該方法首先確定各第一交叉口場景中目標(biāo)車輛對應(yīng)的各環(huán)境車輛的第一觀測狀態(tài);然后獲取各第一觀測狀態(tài)對應(yīng)的第二觀測狀態(tài)、隨機(jī)動(dòng)作以及獎(jiǎng)勵(lì)值;對預(yù)先訓(xùn)練好的決策模型進(jìn)行再訓(xùn)練,得到基于時(shí)序的決策模型;確定各第二交叉口場景中目標(biāo)車輛的各環(huán)境車輛的第三觀測狀態(tài);分別確定各第二交叉口場景對應(yīng)的下降梯度,以確定相應(yīng)的元目標(biāo);根據(jù)元目標(biāo),確定基于時(shí)序的決策模型的敏感參數(shù);更新基于時(shí)序的決策模型。
聲明:
“基于元強(qiáng)化學(xué)習(xí)的智能車輛交叉口決策方法、設(shè)備及介質(zhì)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)