本申請?zhí)峁┮环N基于深度強化學習的認知無線網(wǎng)絡動態(tài)頻譜接入方法,包括:對預先提出的動態(tài)頻譜接入問題進行建模和分析;預先構建雙深度強化學習網(wǎng)絡模型;根據(jù)第一深度強化學習網(wǎng)絡模型,獲取系統(tǒng)模型中次用戶基于動態(tài)頻譜接入策略的所有動態(tài)頻譜接入動作的Q值;各個次用戶選擇Q值最優(yōu)狀態(tài)下次用戶的動態(tài)頻譜接入動作;根據(jù)選擇的次用戶的動態(tài)頻譜接入動作選擇第二深度強化學習網(wǎng)絡模型的目標Q值;計算損失函數(shù),通過最小化損失函數(shù)訓練雙深度強化學習網(wǎng)絡模型,并更新雙深度強化學習網(wǎng)絡模型的權重。本申請滿足多用戶多信道認知無線網(wǎng)絡中大狀態(tài)動作空間的高計算需求,利用過去觀測來預測現(xiàn)實狀態(tài),加快收斂速度并提高預測精度。
聲明:
“基于深度強化學習的認知無線網(wǎng)絡動態(tài)頻譜接入方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)