本發(fā)明公開了一種基于強(qiáng)化學(xué)習(xí)的機(jī)器學(xué)習(xí)模型預(yù)測(cè)時(shí)機(jī)估計(jì)模型,首先采集一組時(shí)間序列數(shù)據(jù)輸入到LSTM模型中,得到預(yù)測(cè)結(jié)果;然后將預(yù)測(cè)結(jié)果和時(shí)間序列數(shù)據(jù)同時(shí)輸入到強(qiáng)化學(xué)習(xí)模型中,采用兩次預(yù)測(cè)結(jié)果交叉熵的差值作為強(qiáng)化學(xué)習(xí)的獎(jiǎng)勵(lì)函數(shù),得到強(qiáng)化學(xué)習(xí)模型的決策;最后根據(jù)決策數(shù)值判斷預(yù)測(cè)結(jié)果是否準(zhǔn)確,如果不準(zhǔn)確,讀取下一時(shí)刻數(shù)據(jù)與前述的時(shí)間序列數(shù)據(jù)組合形成新的時(shí)間序列數(shù)據(jù)輸入到LSTM模型中進(jìn)行下一輪的預(yù)測(cè),循環(huán)進(jìn)行預(yù)測(cè)操作。
聲明:
“基于強(qiáng)化學(xué)習(xí)的機(jī)器學(xué)習(xí)模型預(yù)測(cè)時(shí)機(jī)估計(jì)模型” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)