一種基于聯(lián)邦強(qiáng)化學(xué)習(xí)的邊緣計(jì)算模型訓(xùn)練方法,涉及無線通信和信息安全。1)檢測信號覆蓋范圍內(nèi)的移動設(shè)備數(shù)量,構(gòu)建卷積神經(jīng)網(wǎng)絡(luò),初始化參數(shù);2)將各移動設(shè)備的參數(shù)組成狀態(tài)向量輸入卷積神經(jīng)網(wǎng)絡(luò)中,得選擇的移動設(shè)備和訓(xùn)練數(shù)據(jù)量;3)將全局模型參數(shù)和選擇的數(shù)據(jù)量發(fā)送給移動設(shè)備,接收移動設(shè)備的本地模型參數(shù),更新全局模型參數(shù);4)根據(jù)各移動設(shè)備的訓(xùn)練時間、目標(biāo)識別精度和能量消耗作為獎勵值,更新狀態(tài)向量、存儲向量;5)從內(nèi)存中隨機(jī)選取存儲的向量更新卷積神經(jīng)網(wǎng)絡(luò)的權(quán)重參數(shù);6)重復(fù)2)~5)至移動設(shè)備反饋的目標(biāo)識別精度的平均值大于所需的目標(biāo)識別精度。提高T秒內(nèi)目標(biāo)識別精度,減少訓(xùn)練時間和移動設(shè)備能量消耗。
聲明:
“基于聯(lián)邦強(qiáng)化學(xué)習(xí)的邊緣計(jì)算模型訓(xùn)練方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)