本發(fā)明公開了一種網(wǎng)聯(lián)車探測狀態(tài)感知的交叉口強化學習信號控制方法,在網(wǎng)聯(lián)自動駕駛車輛具有一定市場滲透率的情況下,將交叉口進口道劃分為一定數(shù)目的網(wǎng)格,以網(wǎng)聯(lián)自動駕駛車輛作為移動傳感器,探測周圍車輛的實時位置、速度等數(shù)據(jù),將數(shù)據(jù)填充到相應的進口道網(wǎng)格中,形成網(wǎng)格填充矩陣。將信號燈視作智能體并設計馬爾可夫決策過程,以網(wǎng)格填充矩陣作為智能體狀態(tài),以相位切換為動作,以車輛更新等待時間為獎勵函數(shù)。采用深度策略梯度算法訓練智能體,可以減少車輛的等待時間,同時實現(xiàn)排隊長度以及平均速度的優(yōu)化。本發(fā)明提出的方法能夠在對信號交通口進行控制時減少交通擁堵,緩解因交通擁堵帶來的交通延誤和碳排放及能源消耗。
聲明:
“網(wǎng)聯(lián)車探測狀態(tài)感知的交叉口強化學習信號控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)