本發(fā)明公開(kāi)了一種面向深度強(qiáng)化學(xué)習(xí)模型對(duì)抗攻擊的防御方法及應(yīng)用,包括:利用視覺(jué)預(yù)測(cè)模型對(duì)輸入的前一時(shí)刻環(huán)境狀態(tài)進(jìn)行預(yù)測(cè)輸出預(yù)測(cè)當(dāng)前環(huán)境狀態(tài),并獲得預(yù)測(cè)當(dāng)前環(huán)境狀態(tài)在深度強(qiáng)化學(xué)習(xí)策略下的下一幀預(yù)測(cè)環(huán)境狀態(tài)值;獲取深度強(qiáng)化學(xué)習(xí)模型輸出的實(shí)際當(dāng)前環(huán)境狀態(tài),并獲得實(shí)際當(dāng)前環(huán)境狀態(tài)在深度強(qiáng)化學(xué)習(xí)策略下添加擾動(dòng)的環(huán)境狀態(tài)值;利用判別模型對(duì)預(yù)測(cè)環(huán)境狀態(tài)值和添加擾動(dòng)的環(huán)境狀態(tài)值進(jìn)行判別,根據(jù)判別結(jié)果獲得深度強(qiáng)化學(xué)習(xí)模型是否被攻擊;在深度強(qiáng)化學(xué)習(xí)模型被攻擊時(shí),提取實(shí)際當(dāng)前環(huán)境狀態(tài),利用兩個(gè)防御模型對(duì)實(shí)際當(dāng)前環(huán)境狀態(tài)進(jìn)行防御;深度強(qiáng)化學(xué)習(xí)模型利用防御后的實(shí)際當(dāng)前環(huán)境狀態(tài)進(jìn)行學(xué)習(xí)預(yù)測(cè)輸出。
聲明:
“面向深度強(qiáng)化學(xué)習(xí)模型對(duì)抗攻擊的防御方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)