本發(fā)明提供了基于鄰居感知的多智能體強化學(xué)習(xí)的交通信號控制方法,包括:將自適應(yīng)交通信號控制問題建模為鄰居感知的馬爾可夫博弈,根據(jù)道路網(wǎng)絡(luò)將交叉口建模為連通的智能體;所述鄰居感知的馬爾可夫博弈中,智能體的觀測被定義為交叉口和它的鄰居信息;所有交叉口在時刻采取動作后所觀察到的智能體的獎勵定義為所有進入的隊列中等待車輛的平均數(shù)量;運行交通控制交互環(huán)境;確定智能體與其連接鄰居之間的相關(guān)性;根據(jù)智能體之間的相關(guān)性對各個分散的加強學(xué)習(xí)智能體的觀測和獎勵信息進行加權(quán),得到更新后的觀測和獎勵信息;根據(jù)更新后的觀測和獎勵信息訓(xùn)練智能體,進而每個智能體進行交通信號分散控制。本發(fā)明能夠達到緩解交通擁堵的技術(shù)效果。
聲明:
“基于鄰居感知的多智能體強化學(xué)習(xí)的交通信號控制方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)