一種基于強(qiáng)化學(xué)習(xí)算法與未知干擾觀測(cè)器的多AUV編隊(duì)分布式控制方法,屬于機(jī)器人控制技術(shù)領(lǐng)域。為了解決現(xiàn)有的控制方法對(duì)AUV編隊(duì)進(jìn)行控制存在控制精度差的問(wèn)題,本發(fā)明針對(duì)多AUV編隊(duì)中的AUV,利用縱向和艏向的復(fù)合控制系統(tǒng)進(jìn)行控制;縱向和艏向的復(fù)合控制系統(tǒng)包括:基于縱向干擾觀測(cè)器確定的縱向分布式控制器、基于艏向干擾觀測(cè)器確定的艏向分布式控制器,以及用于確定控制器控制增益的Actor?Critic算法;Actor?Critic算法由Actor當(dāng)前網(wǎng)絡(luò)、Actor目標(biāo)網(wǎng)絡(luò)、Critic當(dāng)前網(wǎng)絡(luò)和Critic目標(biāo)網(wǎng)絡(luò)四個(gè)網(wǎng)絡(luò)構(gòu)成,四個(gè)網(wǎng)絡(luò)均使用RBF神經(jīng)網(wǎng)絡(luò)。本發(fā)明主要用于水下機(jī)器人的控制。
聲明:
“基于強(qiáng)化學(xué)習(xí)算法與未知干擾觀測(cè)器的多AUV編隊(duì)分布式控制方法” 該技術(shù)專(zhuān)利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專(zhuān)利(論文)的發(fā)明人(作者)