本發(fā)明至少涉及用于基于強化學習的推薦系統(tǒng)的交互仿真方法和裝置。具體公開了一種用于基于強化學習的推薦系統(tǒng)的交互仿真方法,包括:對用戶行為的多個歷史數(shù)據(jù)項的向量化表示進行歸一化處理,以得到多個單位向量數(shù)據(jù);采用空間索引方法基于所述多個單位向量數(shù)據(jù)構(gòu)建樹狀索引結(jié)構(gòu);在樹狀索引結(jié)構(gòu)中檢索與給定數(shù)據(jù)項最相似的歷史數(shù)據(jù)項;以及根據(jù)所述最相似的歷史數(shù)據(jù)項模擬用戶對于給定數(shù)據(jù)項的反饋。
聲明:
“用于基于強化學習的推薦系統(tǒng)的交互仿真方法和裝置” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)