本發(fā)明提出的一種基于深度強(qiáng)化學(xué)習(xí)的低時(shí)延高可靠性資源分配方法,考慮了處于基站覆蓋范圍外的NR?V2X側(cè)鏈資源分配,其中車輛根據(jù)自己觀測到的信息以及在訓(xùn)練階段得到的Q網(wǎng)絡(luò)調(diào)度5G網(wǎng)絡(luò)中供V2V用戶使用的URLLC切片資源。為了最大化V2V通信的能量效率,并且保證通信的可靠性以及時(shí)延要求,提出了一種使用集中式訓(xùn)練、分布式執(zhí)行的深度強(qiáng)化學(xué)習(xí)架構(gòu),借助DDQN學(xué)習(xí)方法訓(xùn)練出滿足上述要求的模型。將資源分配問題中目標(biāo)和約束的建模都轉(zhuǎn)化為深度強(qiáng)化學(xué)習(xí)中收益的設(shè)計(jì),可以有效解決V2V用戶信道分配和功率選擇的聯(lián)合優(yōu)化問題,可以在一系列連續(xù)動(dòng)作空間的優(yōu)化中表現(xiàn)穩(wěn)定。
聲明:
“基于深度強(qiáng)化學(xué)習(xí)的低時(shí)延高可靠性V2V資源分配方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)