本發(fā)明公開了一種基于軟啟動的非完美信息博弈智能策略求解方法,屬于人工智能領(lǐng)域。本方法包含如下步驟:1、構(gòu)建初始智能博弈決策模塊;2、博弈信息預(yù)處理;3、博弈策略模型軟啟動;4、博弈策略模型自訓(xùn)練;5、博弈決策后處理;6、模型輸出決策結(jié)果。本方法提出一種模型軟啟動方法與模型策略后處理方法,對已有博弈信息進(jìn)行預(yù)處理,構(gòu)建非完美信息博弈信息的高效、無損編碼,并通過已有策略生成狀態(tài)動作值函數(shù),結(jié)合自博弈生成的狀態(tài)動作值函數(shù),對模型進(jìn)行軟啟動,訓(xùn)練策略模型預(yù)測,從而增強(qiáng)訓(xùn)練策略的多樣性,提升策略模型的訓(xùn)練效果,最終模型根據(jù)當(dāng)前狀態(tài)下的信息,進(jìn)行后處理,選擇最符合當(dāng)前狀態(tài)下的決策。
聲明:
“基于軟啟動的非完美信息博弈智能策略求解方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)