本發(fā)明公開了一種基于強化學(xué)習(xí)的十字路口交通信號燈控制方法,首先,將當(dāng)前時刻十字路口的通行狀態(tài)表示成Position和Speed矩陣;其次,在傳統(tǒng)強化學(xué)習(xí)算法Deep Q?network的基礎(chǔ)上根據(jù)State的特征構(gòu)建基于空間注意力機制的框架,其中主干網(wǎng)絡(luò)為卷積神經(jīng)網(wǎng)絡(luò);然后,根據(jù)貪婪策略隨機選取或者從模型預(yù)測一個Action執(zhí)行。如果當(dāng)前時刻的Action和前一時刻的相同,那么就直接執(zhí)行綠燈相位時間,并在此過程中不斷訓(xùn)練網(wǎng)絡(luò);否則,首先執(zhí)行黃燈相位時間,然后,再執(zhí)行綠燈相位時間,同樣在此過程中同樣不斷地訓(xùn)練網(wǎng)絡(luò);最后,所有訓(xùn)練回合結(jié)束后保存模型,然后測試并評估模型效果。本發(fā)明改進了現(xiàn)有的交通信號燈控制方法,使得車輛能夠更快的通過十字路口,一定程度上緩解了交通擁堵。
聲明:
“基于強化學(xué)習(xí)的十字路口交通信號燈控制方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)