亚洲欧美国产精品粉嫩|亚洲精品精品无码专区|国产在线无码精品电影网|午夜无码久久久久久国产|亚洲国产精品一区二区动图|国产在线精品一区在线观看|欧美伊人久久久久久久久影院|中文字幕日韩av在线一区二区

合肥金星智控科技股份有限公司
宣傳

位置:中冶有色 >

有色技術(shù)頻道 >

> 化學(xué)分析技術(shù)

> 基于隨機(jī)微分方程的連續(xù)性強(qiáng)化學(xué)習(xí)系統(tǒng)及方法

基于隨機(jī)微分方程的連續(xù)性強(qiáng)化學(xué)習(xí)系統(tǒng)及方法

658   編輯:管理員   來源:中冶有色技術(shù)網(wǎng)  
2023-03-19 07:02:28
本發(fā)明公布了一種基于隨機(jī)微分方程的連續(xù)性強(qiáng)化學(xué)習(xí)系統(tǒng)及方法,系統(tǒng)包括動(dòng)作策略生成器APG、環(huán)境狀態(tài)估計(jì)器ESE、值估計(jì)器VE,記憶存儲(chǔ)模塊MS和外部環(huán)境EE;具體步驟如下:初始化動(dòng)作策略生成器APG、環(huán)境狀態(tài)估計(jì)器ESE和值估計(jì)器VE;動(dòng)作策略生成器APG計(jì)算輸出動(dòng)作值增量Δak;外部環(huán)境EE輸出下一步動(dòng)作值ak+1、下一步環(huán)境狀態(tài)值sk+1以及當(dāng)前步獎(jiǎng)勵(lì)值Rk,并存儲(chǔ)至記憶存儲(chǔ)模塊MS中;環(huán)境狀態(tài)估計(jì)器ESE更新環(huán)境狀態(tài)參數(shù)集θp和預(yù)測(cè)未來環(huán)境狀態(tài)估計(jì)值s′k;VE優(yōu)化器更新Q函數(shù)網(wǎng)絡(luò)并預(yù)測(cè)未來獎(jiǎng)勵(lì)估計(jì)值R′k;APG優(yōu)化器更新動(dòng)作值參數(shù)集θv。本方法基于隨機(jī)微分方程作為基礎(chǔ)模型,能實(shí)現(xiàn)動(dòng)作控制的連續(xù)性且能控制訓(xùn)練過程方差,能夠通過預(yù)測(cè)環(huán)境的變化來選擇動(dòng)作以實(shí)現(xiàn)更好的環(huán)境交互。
聲明:
“基于隨機(jī)微分方程的連續(xù)性強(qiáng)化學(xué)習(xí)系統(tǒng)及方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)
分享 0
         
舉報(bào) 0
收藏 0
反對(duì) 0
點(diǎn)贊 0
標(biāo)簽:
化學(xué)分析
全國熱門有色金屬技術(shù)推薦
展開更多 +

 

中冶有色技術(shù)平臺(tái)

最新更新技術(shù)

報(bào)名參會(huì)
更多+

報(bào)告下載

第二屆中國微細(xì)粒礦物選礦技術(shù)大會(huì)
推廣

熱門技術(shù)
更多+

衡水宏運(yùn)壓濾機(jī)有限公司
宣傳
環(huán)磨科技控股(集團(tuán))有限公司
宣傳

發(fā)布

在線客服

公眾號(hào)

電話

頂部
咨詢電話:
010-88793500-807
專利人/作者信息登記