本發(fā)明公開了提出一種基于隊友感知的多智能體協(xié)作通信策略的訓(xùn)練系統(tǒng)和方法,借助于隊友建模方法,在與隊友交互的過程中,為隊友生成定制化、稀疏化的消息。通過多智能體強(qiáng)化學(xué)習(xí)通信方法,使得智能體能夠在帶寬受限的條件下學(xué)得能夠抗干擾的高效協(xié)作通信策略,訓(xùn)練得到的智能體協(xié)作通信策略可以使智能體既能根據(jù)自身得到的觀測信息選擇合理的協(xié)作動作,又能夠在合適時刻向隊友發(fā)送信息以促進(jìn)協(xié)作,或根據(jù)收到的隊友信息進(jìn)行配合。本發(fā)明在帶寬受限的實際場景中僅通過少量節(jié)點間的通信實現(xiàn)緊密有效的協(xié)作,能夠保證多智能體協(xié)作通信過程中的抗干擾能力。
聲明:
“基于隊友感知的多智能體協(xié)作通信策略的訓(xùn)練系統(tǒng)和方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)