本發(fā)明公開了一種強(qiáng)化學(xué)習(xí)多智能體溝通與決策方法,包括:根據(jù)各個(gè)智能體的觀測(cè)狀態(tài)信息通過神經(jīng)網(wǎng)絡(luò)提取相應(yīng)的狀態(tài)特征;將所有智能體的狀態(tài)特征作為溝通信息輸入至VLAD層中進(jìn)行軟分配與聚類,得到聚類后的溝通信息;將聚類后的溝通信息分發(fā)給各個(gè)智能體,由各個(gè)智能體將自身的狀態(tài)特征與接收到的聚類后的溝通信息進(jìn)行聚合,并通過智能體內(nèi)部的全連接神經(jīng)網(wǎng)絡(luò)進(jìn)行動(dòng)作決策。該方法可以對(duì)各智能體的狀態(tài)信息進(jìn)行聚類并與其他智能體進(jìn)行溝通,進(jìn)而提高智能體的決策水平。
聲明:
“強(qiáng)化學(xué)習(xí)多智能體溝通與決策方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)