本發(fā)明實施例提供一種面向空間博弈的策略梯度強化學習自主驅(qū)離策略,包括:選取一護衛(wèi)星作為第一航天器和第二航天器的參照點,獲取第二航天器的預定的水滴運動軌跡,在仿真環(huán)境中建立CW軌道相對運動學模型;獲取t0時刻第一航天器和第二航天器的觀測量,根據(jù)所述水滴運動軌跡獲取所述第二航天器的速度增量;將t0時刻第一航天器的觀測量輸入訓練效果收斂的動作網(wǎng)絡計算t0時刻所述第一航天器的速度增量,進行軌道控制;計算t0+T時刻第一航天器觀測量,根據(jù)所述t0時刻第二航天器的速度增量計算t0+T時刻第二航天器的觀測量;根據(jù)t0+T時刻第一航天器和第二航天器的觀測量計算距離并進行驅(qū)離判定。利用本發(fā)明實施例提供的技術方案可以實現(xiàn)航天器之間的準確驅(qū)離控制及判定。
聲明:
“面向空間博弈的自主驅(qū)離方法、裝置和存儲介質(zhì)” 該技術專利(論文)所有權(quán)利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)