本申請(qǐng)涉及人工智能技術(shù)領(lǐng)域,公開了一種對(duì)話方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì),對(duì)話方法包括:獲取用戶輸入的目標(biāo)問(wèn)句;基于訓(xùn)練后的強(qiáng)化學(xué)習(xí)模型,確定與所述目標(biāo)問(wèn)句對(duì)應(yīng)的反饋動(dòng)作;其中,所述強(qiáng)化學(xué)習(xí)模型是基于至少兩輪樣本對(duì)話、以及至少兩輪樣本對(duì)話所確定的獎(jiǎng)勵(lì)函數(shù)訓(xùn)練得到的;每一輪樣本對(duì)話包括樣本問(wèn)句和對(duì)應(yīng)的樣本答句;確定與所述反饋動(dòng)作對(duì)應(yīng)的目標(biāo)答句,并輸出所述目標(biāo)答句。本申請(qǐng)?zhí)峁┑膶?duì)話方法使得最終訓(xùn)練得到的強(qiáng)化學(xué)習(xí)模型的預(yù)測(cè)準(zhǔn)確率更高。
聲明:
“對(duì)話方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)