本申請公開了一種多智能體信息融合方法、裝置、電子設(shè)備及可讀存儲介質(zhì)。其中,方法包括構(gòu)建操作預(yù)測網(wǎng)絡(luò)模型和門控注意力機制模型,門控注意力機制模型根據(jù)不同來源信息以交互過程中學(xué)習(xí)的比例進行融合,且各智能體基于自身數(shù)據(jù)和通信信息融合結(jié)果共同確定是否接收通信信息融合結(jié)果。將多智能體應(yīng)用模擬環(huán)境的狀態(tài)信息輸入至操作預(yù)測網(wǎng)絡(luò)模型,得到各智能體的預(yù)測動作;根據(jù)多智能體應(yīng)用模擬環(huán)境基于各智能體的預(yù)測動作信息輸出的各預(yù)測動作得分和下一時刻的狀態(tài)信息、每個智能體的價值評估信息,基于門控注意力機制模型的強化學(xué)習(xí)算法更新操作預(yù)測網(wǎng)絡(luò)模型,循環(huán)訓(xùn)練操作預(yù)測網(wǎng)絡(luò)模型直至收斂。本申請?zhí)嵘硕嘀悄荏w信息融合效果。
聲明:
“多智能體信息融合方法、裝置、電子設(shè)備及可讀存儲介質(zhì)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)