本發(fā)明涉及一種多任務深度強化學習的深空探測器軟著陸路徑規(guī)劃方法,屬于人工智能與深空探測技術(shù)領域。本發(fā)明基于深度確定性策略強化學習算法DDPG,采用多任務學習,充分利用智能體之間的對抗與協(xié)作關系,提升了每個智能體應對不確定情況的能力,提高模型整體的泛化性能。通過采用融合時間上下文信息的自注意力機制,不僅避免智能體陷入局部最優(yōu)狀態(tài),而且使智能體更加聚焦到有利于自身獲得最大回報的信息進行學習,進一步提高探測器著陸的成功率。本方法能夠?qū)崿F(xiàn)深空探測器的穩(wěn)定著陸,為后續(xù)實現(xiàn)小行星探測、自主取樣和航天員登陸活動奠定基礎。
聲明:
“多任務深度強化學習的深空探測器軟著陸路徑規(guī)劃方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)