本申請實施例公開了一種內容推薦方法、模型訓練方法、裝置及電子設備,通過引入價值評估模型來得到樣本推薦分值,使得決策模型與價值評估模型形成強化學習架構,可以提升決策模型的訓練效果,提升利用決策模型在目標推薦位置進行內容推薦的準確性;并且,通過進一步引入點擊率預測模型,即便是針對未被推薦過的樣本內容,也能夠更加準確地對樣本內容被推薦后的點擊率進行預測,提升對價值評估模型的訓練效果,提升強化學習的效果,從而進一步提升決策模型的模型性能。后續(xù)在利用決策模型對目標對象進行內容推薦時,即便是針對未被推薦過的內容也能夠有效地提升推薦的準確率,可以廣泛應用于云技術、人工智能等領域。
聲明:
“內容推薦方法、模型訓練方法、裝置及電子設備” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)