本發(fā)明公開了一種基于注意力機制強化學習的邊緣網(wǎng)絡設備緩存方法,包括如下步驟:建立蜂窩網(wǎng)絡模型,蜂窩網(wǎng)絡模型包括用戶設備、邊緣網(wǎng)絡設備和核心網(wǎng)絡,每個邊緣網(wǎng)絡設備中均設有行動網(wǎng)絡模塊和評價網(wǎng)絡模塊;邊緣網(wǎng)絡設備接收所在區(qū)域內(nèi)的用戶設備發(fā)出的請求;每個邊緣網(wǎng)絡設備獲取其它邊緣網(wǎng)絡設備的觀測值;每個邊緣網(wǎng)絡設備依據(jù)緩存替換策略和觀測值選取動作;邊緣網(wǎng)絡設備發(fā)送動作和更新后的狀態(tài)到鄰接邊緣網(wǎng)絡設備;根據(jù)動作更新后的觀測值和動作價值函數(shù)對行動網(wǎng)絡模塊和評價網(wǎng)絡模塊的參數(shù)進行更新;根據(jù)目標函數(shù)對緩存替換策略進行優(yōu)化。本發(fā)明可以減少從云數(shù)據(jù)中心重復下載文件的次數(shù),降低延遲,提升網(wǎng)絡服務質(zhì)量與用戶體驗質(zhì)量。
聲明:
“基于注意力機制強化學習的邊緣網(wǎng)絡設備緩存方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)