本發(fā)明提出了一種基于擬合強化學(xué)習(xí)的空戰(zhàn)行為建模方法,解決了虛擬空戰(zhàn)仿真中戰(zhàn)術(shù)動作的智能決策問題。本方法包含:對飛機作戰(zhàn)過程的軌跡進行采樣;在狀態(tài)空間中對效用函數(shù)進行擬合,通過貝爾曼迭代和最小二乘法擬合對效用函數(shù)進行近似計算;作戰(zhàn)決策,通過前瞻測試,在預(yù)測過程中采用所擬合的效用函數(shù)進行動作決策,根據(jù)預(yù)測的執(zhí)行結(jié)果確定最終執(zhí)行的動作。本發(fā)明方法可有效提高效用函數(shù)的擬合效率以及獲取效率,相對傳統(tǒng)方法,本發(fā)明方法能更快地獲取最優(yōu)行動策略。
聲明:
“基于擬合強化學(xué)習(xí)的空戰(zhàn)行為建模方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)