本發(fā)明方法提供一種增強(qiáng)現(xiàn)實環(huán)境下多智能體對抗仿真環(huán)境實現(xiàn)方法,利用深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)結(jié)合課程學(xué)習(xí)預(yù)測各個智能體行為并作出決策,再將訓(xùn)練完成的強(qiáng)化學(xué)習(xí)智能體模型遷移至增強(qiáng)現(xiàn)實環(huán)境中,能夠解決增強(qiáng)現(xiàn)實對抗仿真環(huán)境中虛擬多智能體協(xié)作策略單一造成的人機(jī)交互體驗不佳的問題,具有使真實用戶和虛擬多智能體之間協(xié)作對抗策略靈活多變的效果。
聲明:
“基于強(qiáng)化學(xué)習(xí)的增強(qiáng)現(xiàn)實多智能體協(xié)作對抗實現(xiàn)方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)