本發(fā)明公開了一種結(jié)合知識轉(zhuǎn)移的強(qiáng)化學(xué)習(xí)方法,步驟如下:S1、設(shè)計(jì)BP神經(jīng)網(wǎng)絡(luò)自主任務(wù)間映射關(guān)系;S2、對源任務(wù)學(xué)習(xí)經(jīng)驗(yàn)進(jìn)行案例存儲(chǔ),并構(gòu)建線性感知器來學(xué)習(xí)源域和目標(biāo)域之間的動(dòng)作映射關(guān)系;S3、運(yùn)用基于案例推理機(jī)理;S4、進(jìn)行相似度計(jì)算與案例檢索,并運(yùn)用所學(xué)到的案例庫中的經(jīng)驗(yàn)作為啟發(fā)式來加速相關(guān)但不同任務(wù)的學(xué)習(xí);及其應(yīng)用于無人車自主技能的學(xué)習(xí)方法;本發(fā)明結(jié)合強(qiáng)化學(xué)習(xí)與遷移學(xué)習(xí)的優(yōu)勢,可實(shí)現(xiàn)機(jī)器人從簡單領(lǐng)域或源域獲得的經(jīng)驗(yàn)通過遷移加速應(yīng)用到復(fù)雜領(lǐng)域或目標(biāo)域中;學(xué)習(xí)速度快,可避免維數(shù)災(zāi)難;顯著的提高了無人車自主技能學(xué)習(xí)的速度和效率。
聲明:
“結(jié)合知識轉(zhuǎn)移的強(qiáng)化學(xué)習(xí)方法及其應(yīng)用于無人車自主技能的學(xué)習(xí)方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)