本申請(qǐng)涉及人工智能領(lǐng)域,具體公開(kāi)了一種AI模型訓(xùn)練方法、模型使用方法、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì),所述方法包括:獲取多個(gè)樣本生成模型,并根據(jù)多個(gè)所述樣本生成模型進(jìn)行對(duì)弈,得到第一對(duì)弈數(shù)據(jù);獲取第二對(duì)弈數(shù)據(jù),并根據(jù)所述第二對(duì)弈數(shù)據(jù)和所述第一對(duì)弈數(shù)據(jù)對(duì)待訓(xùn)練模型進(jìn)行訓(xùn)練,所述第二對(duì)弈數(shù)據(jù)為真實(shí)對(duì)弈數(shù)據(jù);當(dāng)所述待訓(xùn)練模型收斂時(shí),將所述待訓(xùn)練模型作為待評(píng)測(cè)模型,與對(duì)比模型進(jìn)行多次對(duì)弈,并得到對(duì)弈結(jié)果;當(dāng)所述對(duì)弈結(jié)果達(dá)到預(yù)設(shè)指標(biāo)時(shí),確定所述待評(píng)測(cè)模型為AI模型,完成AI模型訓(xùn)練。提高訓(xùn)練出的強(qiáng)化學(xué)習(xí)模型的擬人性。
聲明:
“AI模型訓(xùn)練方法、模型使用方法、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)” 該技術(shù)專(zhuān)利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專(zhuān)利(論文)的發(fā)明人(作者)