本發(fā)明公開(kāi)一種基于多智能體強(qiáng)化學(xué)習(xí)的時(shí)延容忍網(wǎng)絡(luò)路由算法,其特征在于,步驟包括:一、將時(shí)延容忍網(wǎng)絡(luò)節(jié)點(diǎn)進(jìn)行Louvian分簇算法,提出了一種集中式加分布式的分層架構(gòu);二、結(jié)合正社會(huì)特性將DTN節(jié)點(diǎn)選擇下一跳問(wèn)題建模為分布式部分可觀測(cè)馬爾科夫決策過(guò)程(Dec?POMDP)模型;與現(xiàn)有技術(shù)相比,本專利技術(shù)方案對(duì)比現(xiàn)有的基于社會(huì)屬性的時(shí)延容忍網(wǎng)絡(luò)路由方案,提出了一種分層架構(gòu),能夠方便地捕捉邊緣設(shè)備的社會(huì)信息;一方面分布式地執(zhí)行計(jì)算中心下發(fā)的路由決策,另一方面在計(jì)算中心根據(jù)服務(wù)單元傳來(lái)的狀態(tài)集中式地訓(xùn)練路由算法。能夠更有效地利用社會(huì)特性進(jìn)行時(shí)延容忍網(wǎng)絡(luò)中的路由轉(zhuǎn)發(fā),使得投遞率提高和平均時(shí)延降低。
聲明:
“基于多智能體強(qiáng)化學(xué)習(xí)的時(shí)延容忍網(wǎng)絡(luò)路由算法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)