本發(fā)明公開了一種強(qiáng)化學(xué)習(xí)中超高精度探索環(huán)境下的狀態(tài)空間處理方法,系統(tǒng)及電子設(shè)備,涉及超高精度環(huán)境狀態(tài)空間處理方法、系統(tǒng)及電子設(shè)備領(lǐng)域。本發(fā)明利用環(huán)境引擎對(duì)所述智能體在環(huán)境中對(duì)于威脅物和目標(biāo)點(diǎn)的相關(guān)物理量進(jìn)行采集,通過空間狀態(tài)處理模塊建立倒空間物理量規(guī)范,將原始空間相關(guān)物理量進(jìn)行倒空間狀態(tài)處理,放大所述智能體在相鄰時(shí)刻間的動(dòng)作上物理特征差異。再通過策略分析和策略執(zhí)行結(jié)構(gòu)對(duì)所述物理特征進(jìn)行分析和智能體動(dòng)作執(zhí)行,執(zhí)行的結(jié)果經(jīng)環(huán)境引擎處理輸入條件,輸入至內(nèi)部Reward函數(shù),根據(jù)Reward函數(shù)輸出結(jié)果對(duì)智能體動(dòng)作制定強(qiáng)化學(xué)習(xí)策略,保證了智能體可在環(huán)境序列間狀態(tài)差異相對(duì)自身差異數(shù)量級(jí)過小的情況下進(jìn)行有效的學(xué)習(xí)訓(xùn)練。
聲明:
“強(qiáng)化學(xué)習(xí)中超高精度探索環(huán)境下的狀態(tài)空間處理方法、系統(tǒng)及電子設(shè)備” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)