本申請(qǐng)公開(kāi)了一種基于多智能體強(qiáng)化學(xué)習(xí)的邊緣云可擴(kuò)展任務(wù)卸載方法,包括以下步驟:初始化每個(gè)Agent的網(wǎng)絡(luò)結(jié)構(gòu),每個(gè)Agent根據(jù)自己觀測(cè)的狀態(tài)與移動(dòng)邊緣網(wǎng)絡(luò)環(huán)境進(jìn)行交互,將輸入狀態(tài)與輸出行為保存至經(jīng)驗(yàn)回放池;每個(gè)智能體對(duì)經(jīng)驗(yàn)回放池中的數(shù)據(jù)進(jìn)行采樣,訓(xùn)練自己的actor和critic網(wǎng)絡(luò)并優(yōu)化參數(shù);在模型收斂至滿足迭代條件時(shí)生成卸載策略,并根據(jù)卸載策略進(jìn)行卸載決策。本申請(qǐng)實(shí)施例為基于多智能體強(qiáng)化學(xué)習(xí)的移動(dòng)邊緣計(jì)算卸載方法,不但更符合真實(shí)的應(yīng)用場(chǎng)景,更考慮了當(dāng)有新的用戶設(shè)備加入時(shí)系統(tǒng)的進(jìn)一步調(diào)整和訓(xùn)練,避免了新智能體從零開(kāi)始訓(xùn)練,保證了任務(wù)卸載策略的可擴(kuò)展性。
聲明:
“基于多智能體的邊緣云可擴(kuò)展任務(wù)卸載方法” 該技術(shù)專(zhuān)利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專(zhuān)利(論文)的發(fā)明人(作者)