用于在多主體強化學習中利用遞歸推理圖的系統(tǒng)和方法,所述系統(tǒng)和方法包括:接收與在多主體環(huán)境內(nèi)行進的自我主體和目標主體相關(guān)聯(lián)的數(shù)據(jù);以及利用多主體中心參與者評論者框架分析與所述自我主體和所述目標主體相關(guān)聯(lián)的所述數(shù)據(jù)。所述系統(tǒng)和方法還包括:基于所述多主體參與者評論者框架執(zhí)行k級遞歸推理以計算所述自我主體和所述目標主體的更高級別遞歸動作。所述系統(tǒng)和方法還包括基于以下至少一者控制所述自我主體和所述目標主體中的至少一者在所述多主體環(huán)境內(nèi)操作:與所述自我主體相關(guān)聯(lián)的主體動作策略和與所述目標主體相關(guān)聯(lián)的主體動作策略。
聲明:
“用于在多主體強化學習中利用遞歸推理圖的系統(tǒng)和方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)