本發(fā)明提出了一種基于自舉DQN的增強學(xué)習(xí)深度搜索方法,主要內(nèi)容包括自舉Deep?Q?Network(DQN)、深度搜索和環(huán)境背景;其中自舉Deep?Q?Network包括自舉樣本和自舉DQN,深度搜索包括深度搜索測試和自舉DQN驅(qū)動深度搜索,環(huán)境背景包括生成在線自舉DQN和自舉DQN驅(qū)動。自舉DQN是一種結(jié)合了深度學(xué)習(xí)與深度探索的實用強化學(xué)習(xí)算法,證明了自舉可以對深度神經(jīng)網(wǎng)絡(luò)產(chǎn)生有效的不確定性估計,也可擴展到大規(guī)模的并行系統(tǒng),在多個時間步驟上對信息進行排序,保證樣本的多樣性;在復(fù)雜的環(huán)境中自舉DQN作為有效的增強學(xué)習(xí)中的一種算法,并行處理大量數(shù)據(jù),計算成本低,學(xué)習(xí)效率高,性能表現(xiàn)優(yōu)異。
聲明:
“基于自舉DQN的增強學(xué)習(xí)深度搜索方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)