本申請是對話信息獲取方法、裝置、設(shè)備及存儲介質(zhì),涉及人工智能技術(shù)領(lǐng)域。所述方法包括:獲取第一對話信息;基于第一對話信息,通過第一對話模型進行數(shù)據(jù)處理,獲得第二對話信息;基于第一對話信息以及第二對話信息,通過第一判別器進行數(shù)據(jù)處理,獲得第一置信分數(shù);基于第一置信分數(shù),對第一對話模型進行參數(shù)更新。上述方案,訓練好的判別器可以對輸入第一對話模型的第一對話信息,以及第一對話模型輸出的第二對話信息之間的匹配度進行檢測,并將匹配分數(shù)作為獎勵值,且每一輪對話都可以獲得該輪對話對應(yīng)的獎勵值,提高了獎勵值產(chǎn)生的密度,從而提高了通過強化學習訓練得到的第一對話模型的訓練效率。
聲明:
“對話信息獲取方法、裝置、設(shè)備及存儲介質(zhì)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)