本發(fā)明公開了一種基于強(qiáng)化學(xué)習(xí)的旋轉(zhuǎn)機(jī)械故障診斷網(wǎng)絡(luò)自動(dòng)搜索方法,基于給定的診斷任務(wù)控制器根據(jù)子模型當(dāng)前狀態(tài)對(duì)子模型進(jìn)行設(shè)計(jì),接著利用診斷數(shù)據(jù)訓(xùn)練驗(yàn)證子模型,其驗(yàn)證精度又參與到對(duì)控制器的訓(xùn)練。方法執(zhí)行過程中,子模型和控制器交替訓(xùn)練,最終控制器能針對(duì)具體診斷任務(wù)搜索出高診斷性能的子模型。在子模型訓(xùn)練過程中,方法設(shè)置了權(quán)值共享,有著相同權(quán)值數(shù)量的網(wǎng)絡(luò)層在不同子模型中可重用,降低訓(xùn)練時(shí)間提高了搜索效率;在控制器訓(xùn)練過程中,應(yīng)用了貪心策略,給予空間讓控制器自由探索降低陷入局部最優(yōu)的概率,應(yīng)用了經(jīng)驗(yàn)重放,讓控制器交替工作訓(xùn)練避免學(xué)習(xí)過程中參數(shù)的振蕩和發(fā)散,還應(yīng)用了迭代更新,使用副控制器來預(yù)測(cè)下一狀態(tài)的獎(jiǎng)勵(lì),降低了回報(bào)期望與未來收益的相關(guān)性,提高控制器的訓(xùn)練穩(wěn)定性。以上特點(diǎn)使得本發(fā)明方法在針對(duì)不同的診斷任務(wù)時(shí)能夠高效地搜索出具有高診斷性能的網(wǎng)絡(luò)模型,有效解決旋轉(zhuǎn)機(jī)械狀態(tài)診斷問題。
聲明:
“基于強(qiáng)化學(xué)習(xí)的旋轉(zhuǎn)機(jī)械診斷網(wǎng)絡(luò)自動(dòng)搜索方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)