本發(fā)明公開了一種基于強(qiáng)化學(xué)習(xí)的煙葉容重測量方法,包括:構(gòu)建基于強(qiáng)化學(xué)習(xí)的煙葉容重測量模型:以包含煙葉流量、加水量、筒溫、熱風(fēng)溫度、蒸汽質(zhì)量流量、出口水分和溫度的回潮滾筒的相關(guān)參數(shù)作為狀態(tài)數(shù)據(jù),采用強(qiáng)化學(xué)習(xí)算法中的動作網(wǎng)絡(luò)依據(jù)狀態(tài)數(shù)據(jù)推算得到煙葉容重測量值,并根據(jù)煙葉容重測量值與煙葉容重實(shí)際值計算動作獎勵值,并依據(jù)該動作獎勵值構(gòu)建TD誤差,依據(jù)TD誤差來構(gòu)建動作網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)算法中的評價網(wǎng)絡(luò)的損失函數(shù),依據(jù)損失函數(shù)優(yōu)化更新動作網(wǎng)絡(luò)和評價網(wǎng)絡(luò)參數(shù),優(yōu)化結(jié)束后,參數(shù)確定的動作網(wǎng)絡(luò)作為煙葉容重測量模型;應(yīng)用時,煙葉容重測量模型依據(jù)實(shí)時采集的回潮滾筒的相關(guān)參數(shù)實(shí)時推算輸出煙絲容重測量值。
聲明:
“基于強(qiáng)化學(xué)習(xí)的煙葉容重測量方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)