本申請?zhí)峁┝艘环N基于深度強化學習的機器人自主尋源方法及裝置。所述方法包括:建立放射源計數(shù)衰減模型和放射源計數(shù)分布模型;基于實際環(huán)境,建立尋源模擬環(huán)境,所述尋源模擬環(huán)境包括探測器、放射源和屏蔽物;基于所述放射源計數(shù)衰減模型和放射源計數(shù)分布模型,利用所述探測器在所述尋源模擬環(huán)境中沿著不同路徑測量不同位置的所述放射源的放射性活度,并依據(jù)價值函數(shù),確定探測器在每個狀態(tài)下,不同動作對應的價值函數(shù)值,多次訓練后以建立深度強化學習模型;基于所述深度強化學習模型,在實際環(huán)境中找到放射源。
聲明:
“基于深度強化學習的機器人自主尋源方法及裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)