本發(fā)明公開了一種空間精細(xì)操作的多任務(wù)強(qiáng)化學(xué)習(xí)基準(zhǔn)平臺(tái)設(shè)計(jì)方法,屬于空間技術(shù)領(lǐng)域。本發(fā)明方法包括:搭建多任務(wù)空間操作的訓(xùn)練環(huán)境,構(gòu)建多模態(tài)觀測(cè)信息的提取基準(zhǔn),建立多任務(wù)空間操作學(xué)習(xí)的評(píng)價(jià)基準(zhǔn),將干擾變量總數(shù)、干擾變量攝動(dòng)方差、接觸動(dòng)力學(xué)攝動(dòng)方差等引入策略優(yōu)化,可更好應(yīng)對(duì)空間環(huán)境的多源干擾與非結(jié)構(gòu)化特點(diǎn)。針對(duì)真實(shí)環(huán)境數(shù)據(jù)采樣的高成本、低安全問題,本發(fā)明實(shí)現(xiàn)了機(jī)器人設(shè)置與真實(shí)環(huán)境相近的虛擬環(huán)境,利用虛擬環(huán)境數(shù)據(jù)采樣代替真實(shí)環(huán)境數(shù)據(jù)采樣,有利于提升算法的可復(fù)用性。
聲明:
“空間精細(xì)操作的多任務(wù)強(qiáng)化學(xué)習(xí)基準(zhǔn)平臺(tái)設(shè)計(jì)方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)