本公開提供了一種基于強化學習模型的查詢推薦方法、裝置、電子設備、計算機可讀存儲介質(zhì)和計算機程序產(chǎn)品。上述方法和裝置可用于人工智能技術(shù)領域。基于強化學習模型的查詢推薦方法包括:響應于查詢請求,獲取查詢數(shù)據(jù);以及將所述查詢數(shù)據(jù)作為強化學習模型的輸入,根據(jù)所述強化學習模型的預測參數(shù),得到查詢推薦結(jié)果,其中,所述預測參數(shù)包括注意力值,所述預測參數(shù)為執(zhí)行參數(shù)優(yōu)化方法得到。通過能夠反映用戶注意力值的預測參數(shù),在強化學習模型中計算得到查詢推薦結(jié)果。因此本公開不需要人工構(gòu)造用戶和查詢之間的依賴關(guān)系,也不需要對查詢和推薦的上下文進行感知,使得推薦查詢變得簡單、智能和準確。
聲明:
“查詢推薦方法、裝置、電子設備、介質(zhì)和程序產(chǎn)品” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)