本發(fā)明公開了一種基于深度強化學(xué)習(xí)的反應(yīng)溫度控制方法和系統(tǒng),該控制方法通過溫度控制模型輸出用于調(diào)整加熱時間和溫度的控制參數(shù),其溫度控制模型基于柔性動作評價算法框架建立,可以通過深度強化學(xué)習(xí)的方式對溫度控制模型內(nèi)部的策略網(wǎng)絡(luò)進行權(quán)重更新,使得在經(jīng)過多次迭代學(xué)習(xí)后,策略網(wǎng)絡(luò)可以具備更好地預(yù)測準(zhǔn)確性,從而提高控制參數(shù)輸出的合理性,同時使評價網(wǎng)絡(luò)所輸出的評價值可以在該過程中對策略網(wǎng)絡(luò)輸出的控制參數(shù)進行準(zhǔn)確的評價,反向地對控制參數(shù)的調(diào)整作出指導(dǎo),最終的目的均是使得控制參數(shù)可以更為準(zhǔn)確地控制加熱設(shè)備,從而使膠體金制備過程中的溫度可以實現(xiàn)動態(tài)的穩(wěn)定,減少外界因素的干擾,從而達到最優(yōu)的制備效果。
聲明:
“基于深度強化學(xué)習(xí)的反應(yīng)溫度控制方法和系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)