一種基于快速梯度下降的單交叉口信號控制的交通狀態(tài)對抗擾動生成方法,根據(jù)已有的強(qiáng)化學(xué)習(xí)DQN算法訓(xùn)練的交通路口信號燈控制模型,利用基于FGSM攻擊并結(jié)合梯度值大小對對抗擾動進(jìn)行離散化處理生成對抗樣本,將對抗擾動與原始狀態(tài)相結(jié)合得到最終的擾動狀態(tài)輸入到智能體模型中,最后在sumo上對單交叉路口的流暢或擁堵程度檢驗效果。本發(fā)明可以在使輸出的擾動具有物理意義的情況下限制擾動的大小,從而高效的生成對抗?fàn)顟B(tài),增加路口的排隊長度和等待時間,大幅降低模型的性能,使交通路口流通度大大降低。
聲明:
“基于快速梯度下降的單交叉口信號控制的交通狀態(tài)對抗擾動生成方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)