本發(fā)明提供了一種使用平均場(chǎng)動(dòng)作價(jià)值學(xué)習(xí)優(yōu)化車間作業(yè)排程的方法,屬于人工智能和運(yùn)籌優(yōu)化交叉領(lǐng)域。本專利使用多智能體馬爾科夫決策過(guò)程建模車間作業(yè)排程的一次求解過(guò)程,在此過(guò)程中設(shè)備作為智能體根據(jù)本地觀測(cè)選擇作業(yè)進(jìn)行加工,而且每個(gè)作業(yè)按生產(chǎn)的時(shí)長(zhǎng)被動(dòng)態(tài)劃分為子作業(yè)。本方法使用模擬器處理對(duì)應(yīng)現(xiàn)實(shí)條件的復(fù)雜約束,由多分類平均場(chǎng)強(qiáng)化學(xué)習(xí)算法進(jìn)行多目標(biāo)優(yōu)化,從而對(duì)車間作業(yè)排程問(wèn)題的痛點(diǎn)進(jìn)行解耦,專注優(yōu)化訂單出貨代價(jià)時(shí)能將生產(chǎn)周期整體時(shí)間壓縮約30%,每個(gè)訂單平均等待時(shí)間壓縮約35%。
聲明:
“使用平均場(chǎng)動(dòng)作價(jià)值學(xué)習(xí)優(yōu)化車間作業(yè)排程的方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)