本發(fā)明涉及一種基于強(qiáng)化學(xué)習(xí)的變電站內(nèi)巡檢機(jī)器人路徑規(guī)劃方案,該方案針對(duì)變電站巡檢場景,在獲取實(shí)際變電站環(huán)境信息之后,通過柵格法建立變電站環(huán)境模型,并采用SARSA算法設(shè)計(jì)巡檢機(jī)器人路徑規(guī)劃方案,以貪婪策略代替Q?learning中的貪婪策略,通過更為保守的路徑規(guī)劃,減少巡檢機(jī)器人與障礙物發(fā)生碰撞的概率,大大延長其使用壽命。此外,通過對(duì)SARSA算法中獎(jiǎng)賞的設(shè)計(jì),減少機(jī)器人到達(dá)同一個(gè)巡檢點(diǎn)位的次數(shù),保證機(jī)器人快速高效地完成巡檢任務(wù)。與現(xiàn)有技術(shù)相比,本發(fā)明能夠?qū)崿F(xiàn)以巡檢機(jī)器人為主體的自主路徑選擇與安全避障,達(dá)到性能的快速高效收斂,對(duì)場景的適應(yīng)能力更強(qiáng),業(yè)務(wù)性能更優(yōu)。
聲明:
“基于強(qiáng)化學(xué)習(xí)的變電站內(nèi)巡檢機(jī)器人路徑規(guī)劃方案” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)