本發(fā)明公開了一種基于強化學習與動態(tài)配時的交通信號燈控制系統(tǒng)及方法,首先對十字路口進行建模,分別定義強化學習三要素state,reward,action;然后依據(jù)強化學習A2C算法構建策略網(wǎng)絡和評估網(wǎng)絡;最后收集路口實時信息,轉化為state向量后輸入到構建的策略網(wǎng)絡和評估網(wǎng)絡,輸出action概率分布,系統(tǒng)根據(jù)action概率分布選擇最合適的相位;決定相位后,接下來的一段時間就屬于該相位的綠燈時間;由自適應定時控制器構成的動態(tài)配時模塊根據(jù)實時的交通流信息,以最大化綠燈時間利用為目標,動態(tài)控制綠燈時間;當檢測到綠燈時間的損失,就終止當前相位。本發(fā)明克服了固定分配交通燈時長而導致綠燈利用率不高的缺陷,減少了車輛的平均等待時間和二氧化碳等有害氣體的排放。
聲明:
“基于強化學習與動態(tài)配時的交通信號燈控制系統(tǒng)及方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)