本發(fā)明公開(kāi)了一種基于強(qiáng)化學(xué)習(xí)的服務(wù)任務(wù)調(diào)度方法,能對(duì)一段較長(zhǎng)時(shí)間內(nèi)的服務(wù)任務(wù)需求下的服務(wù)人員調(diào)度給出較為合理的安排。首先根據(jù)服務(wù)任務(wù)需求對(duì)服務(wù)任務(wù)進(jìn)行數(shù)學(xué)建模,構(gòu)建服務(wù)任務(wù)環(huán)境。然后使用ε?Greedy方法在服務(wù)任務(wù)環(huán)境中進(jìn)行半隨機(jī)服務(wù)人員工作安排,同時(shí)使用強(qiáng)化學(xué)習(xí)方法對(duì)半隨機(jī)人員工作安排過(guò)程進(jìn)行學(xué)習(xí),即從不同調(diào)度安排之間的價(jià)值差異中進(jìn)行學(xué)習(xí),使深度神經(jīng)網(wǎng)絡(luò)近似不同調(diào)度安排的價(jià)值。最后通過(guò)使用深度神經(jīng)網(wǎng)絡(luò)對(duì)實(shí)際服務(wù)任務(wù)需求下不同調(diào)度安排的價(jià)值進(jìn)行預(yù)測(cè),然后選擇輸出較優(yōu)的滿足服務(wù)任務(wù)需求的服務(wù)人員調(diào)度安排的班表。本發(fā)明構(gòu)建的基于強(qiáng)化學(xué)習(xí)的服務(wù)任務(wù)調(diào)度方法具有安排速度快、任務(wù)班表安排合理的特點(diǎn)。
聲明:
“基于強(qiáng)化學(xué)習(xí)的服務(wù)任務(wù)調(diào)度方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)