本申請(qǐng)涉及一種基于深度強(qiáng)化學(xué)習(xí)的資源動(dòng)態(tài)調(diào)度方法。所述方法包括:根據(jù)動(dòng)態(tài)調(diào)度標(biāo)準(zhǔn)輸入的數(shù)據(jù)結(jié)構(gòu)對(duì)動(dòng)態(tài)任務(wù)調(diào)度需求進(jìn)行預(yù)處理,得到動(dòng)態(tài)調(diào)度的標(biāo)準(zhǔn)輸入數(shù)據(jù);通過(guò)動(dòng)態(tài)任務(wù)調(diào)度中預(yù)先設(shè)置的基本原則構(gòu)建影響域評(píng)價(jià)函數(shù),將影響域評(píng)價(jià)函數(shù)作為動(dòng)態(tài)調(diào)度智能體模型與環(huán)境交互的獎(jiǎng)勵(lì)函數(shù);利用獎(jiǎng)勵(lì)函數(shù)和動(dòng)態(tài)調(diào)度的標(biāo)準(zhǔn)輸入數(shù)據(jù)以及深度Q學(xué)習(xí)框架對(duì)動(dòng)態(tài)調(diào)度智能體模型進(jìn)行強(qiáng)化學(xué)習(xí)離線訓(xùn)練,得到訓(xùn)練好的動(dòng)態(tài)調(diào)度智能體模型;根據(jù)訓(xùn)練好的動(dòng)態(tài)調(diào)度智能體模型對(duì)測(cè)試集中新到達(dá)的動(dòng)態(tài)任務(wù)進(jìn)行在線快速資源調(diào)度,得到新調(diào)度方案包。采用本方法能夠提高資源動(dòng)態(tài)調(diào)度效率。
聲明:
“基于深度強(qiáng)化學(xué)習(xí)的資源動(dòng)態(tài)調(diào)度方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)