本發(fā)明公開了一種基于深度強化學習的數(shù)據(jù)儀表板生成方法,包括:(1)將儀表板生成問題刻畫為馬爾可夫決策問題,即將馬爾可夫決策問題中的狀態(tài)空間視為由圖表組成的儀表板,將動作空間視為對圖表的操作動作和圖表參數(shù);(2)構建包含嵌入網(wǎng)絡、決策網(wǎng)絡和評價網(wǎng)絡的深度強化學習模型;(3)構建儀表板特征,利用嵌入網(wǎng)絡提取儀表板特征的共享嵌入向量,利用決策網(wǎng)絡根據(jù)輸入的共享嵌入特征經(jīng)計算預測對圖表的操作動作和圖表參數(shù)選擇,并計算決策網(wǎng)絡獲得的即時獎勵,利用評價網(wǎng)絡根據(jù)共享嵌入向量產生圖表的操作動作和圖表參數(shù)的預期回報;(4)根據(jù)圖表操作和圖表參數(shù)進行圖表繪制以更新儀表板。該方法能夠快速準確地生成儀表板。
聲明:
“基于深度強化學習的數(shù)據(jù)儀表板生成方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)