本發(fā)明涉及一種基于強(qiáng)化學(xué)習(xí)的閑時(shí)交通指示燈控制方法,包括下列步驟:采用的SlimYOLOv3模型感知環(huán)境,解析場(chǎng)景,識(shí)別出場(chǎng)景中所有車(chē)輛類(lèi)型的目標(biāo),并通過(guò)在每個(gè)目標(biāo)周?chē)x邊界框來(lái)定位這些目標(biāo)的位置。采用基于DQN的強(qiáng)化學(xué)習(xí)方法訓(xùn)練交通指示燈控制智能體:a)定義動(dòng)作空間,交通指示燈以的概率隨機(jī)選取動(dòng)作,以的概率采用貪婪算法選取動(dòng)作;b)定義狀態(tài)空間:任意時(shí)刻觀測(cè)的路面狀態(tài)為各方向不同區(qū)間的車(chē)輛個(gè)數(shù),觀測(cè)狀態(tài)值為一個(gè)六維的向量;c)定義獎(jiǎng)勵(lì)函數(shù):三個(gè)區(qū)間路段、和的懲罰權(quán)重分別為、和,獎(jiǎng)勵(lì)值為各路段懲罰權(quán)重之和;d)采用基于DQN的強(qiáng)化學(xué)習(xí)方法學(xué)習(xí)出使得獎(jiǎng)勵(lì)值最高的策略,得到性能優(yōu)質(zhì)的交通指示燈控制智能體。
聲明:
“基于強(qiáng)化學(xué)習(xí)的閑時(shí)交通指示燈智能控制方法” 該技術(shù)專(zhuān)利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專(zhuān)利(論文)的發(fā)明人(作者)