本發(fā)明涉及機(jī)械學(xué)習(xí)技術(shù)領(lǐng)域,具體涉及一種基于強(qiáng)化學(xué)習(xí)DQN算法的Deepfake檢測(cè)方法,包括如下步驟:步驟1,采集樣本數(shù)據(jù)劃分為訓(xùn)練集S和測(cè)試集T;步驟2,將訓(xùn)練集S輸入Q網(wǎng)絡(luò),將訓(xùn)練集S的[狀態(tài)?動(dòng)作對(duì)](s
i,a
i)和Q網(wǎng)絡(luò)輸出的Q(s
i,a′
i)輸入到判別器D中,獲得置信度δ;用置信度δ求導(dǎo)更新Q網(wǎng)絡(luò)的模型參數(shù)θ
i,得到Q網(wǎng)絡(luò)檢測(cè)模型;步驟3,測(cè)試Q網(wǎng)絡(luò);步驟4,將Q網(wǎng)絡(luò)檢測(cè)模型應(yīng)用于Deepfake的真假判別中。本發(fā)明通過強(qiáng)化學(xué)習(xí)DQN算法用一組真假已知的樣本來(lái)訓(xùn)練一個(gè)Q網(wǎng)絡(luò),通過強(qiáng)化學(xué)習(xí)DQN算法更新Q值,最終使Q網(wǎng)絡(luò)訓(xùn)練成為一個(gè)能對(duì)視頻或圖片的真假做出判斷的模型,不需要設(shè)計(jì)復(fù)雜的框架結(jié)構(gòu),泛化能力強(qiáng),應(yīng)用場(chǎng)景廣泛。
聲明:
“基于強(qiáng)化學(xué)習(xí)DQN算法的Deepfake檢測(cè)方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)