本發(fā)明提供一種基于區(qū)塊鏈和強(qiáng)化學(xué)習(xí)的空調(diào)控制方法及其系統(tǒng),該方法包括在空調(diào)啟動或正常運(yùn)行時,基于接收到的控制指令和狀態(tài)參數(shù)s,根據(jù)獎勵機(jī)制產(chǎn)生在當(dāng)前狀態(tài)下的執(zhí)行獎勵;設(shè)定時間窗口Ti,判斷當(dāng)前時間是否在時間窗口Ti內(nèi),若判斷結(jié)果為是,則直接啟動強(qiáng)化學(xué)習(xí)的計(jì)算任務(wù),并輸出預(yù)測動作a;若判斷結(jié)果為否,則判斷是否有其他Master節(jié)點(diǎn)發(fā)送的計(jì)算任務(wù),如是,則啟動計(jì)算任務(wù);由區(qū)塊鏈節(jié)點(diǎn)記錄當(dāng)前狀態(tài)、獎勵和動作,并將動作傳遞給空調(diào),至此完成一輪計(jì)算任務(wù)。該系統(tǒng)應(yīng)用于上述的方法。本發(fā)明應(yīng)用于空調(diào)的節(jié)能控制領(lǐng)域,用以解決目前現(xiàn)有技術(shù)中存在的訓(xùn)練困難、穩(wěn)定性差、浪費(fèi)計(jì)算資源、消耗電力等各種問題。
聲明:
“基于區(qū)塊鏈和強(qiáng)化學(xué)習(xí)的空調(diào)控制方法及其系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)