本發(fā)明涉及一種強(qiáng)化學(xué)習(xí)單元匹配循環(huán)神經(jīng)網(wǎng)絡(luò)系統(tǒng)及其訓(xùn)練和預(yù)測(cè)方法,包括循環(huán)神經(jīng)網(wǎng)絡(luò)、強(qiáng)化學(xué)習(xí)單元和單調(diào)趨勢(shì)識(shí)別器,循環(huán)神經(jīng)網(wǎng)絡(luò)包括輸入、輸出和多個(gè)隱層,隱層包括多個(gè)隱層節(jié)點(diǎn),單調(diào)趨勢(shì)識(shí)別器判斷由輸入構(gòu)建的時(shí)間序列的趨勢(shì)狀態(tài),強(qiáng)化學(xué)習(xí)單元為根據(jù)輸入時(shí)間序列的趨勢(shì)狀態(tài),選擇一個(gè)隱層層數(shù)和隱層節(jié)點(diǎn)數(shù)與其變化規(guī)律相適應(yīng)的循環(huán)神經(jīng)網(wǎng)絡(luò)。本發(fā)明通過(guò)判斷輸入時(shí)間序列的趨勢(shì)狀態(tài),用趨勢(shì)狀態(tài)和不同隱層層數(shù)及隱層節(jié)點(diǎn)數(shù)分別表示Q值集的狀態(tài)與動(dòng)作,根據(jù)更新后的Q值集來(lái)選擇執(zhí)行最優(yōu)的動(dòng)作,增強(qiáng)了RLUMRNN的泛化能力和收斂速度,本發(fā)明應(yīng)用于旋轉(zhuǎn)機(jī)械的剩余壽命預(yù)測(cè)的精度高。
聲明:
“強(qiáng)化學(xué)習(xí)單元匹配循環(huán)神經(jīng)網(wǎng)絡(luò)系統(tǒng)及其訓(xùn)練和預(yù)測(cè)方法” 該技術(shù)專(zhuān)利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專(zhuān)利(論文)的發(fā)明人(作者)