本發(fā)明公開了一種基于強(qiáng)化學(xué)習(xí)的多徑動(dòng)態(tài)復(fù)用與分組傳輸方法,1)將時(shí)間劃分為以100ms為長度的時(shí)間片,并進(jìn)行順序編號1,2,……,t,t+1,……;2)在每一個(gè)時(shí)間片的尾部,收集影響和反映各個(gè)鏈路傳輸質(zhì)量的因素,將這些數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化后做為外部環(huán)境觀測值;本發(fā)明基于深度強(qiáng)化學(xué)習(xí)的鏈路捆綁傳輸技術(shù),將鏈路捆綁傳輸控制作為智能體,將傳輸中影響鏈路質(zhì)量的因素作為環(huán)境,鏈路后續(xù)的傳輸質(zhì)量和穩(wěn)定性作為獎(jiǎng)勵(lì)和懲罰,從而建立強(qiáng)化學(xué)習(xí)模型,通過深度神經(jīng)網(wǎng)絡(luò)對策略進(jìn)行不斷優(yōu)化,從而達(dá)到不斷優(yōu)化傳輸策略的目的;具備更好的前瞻性。
聲明:
“基于強(qiáng)化學(xué)習(xí)的多徑動(dòng)態(tài)復(fù)用與分組傳輸方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)