本發(fā)明提供一種基于web檢索的實(shí)體翻譯方法。包括:利用知識(shí)庫(kù)中的實(shí)體描述信息和待翻譯實(shí)體進(jìn)行web檢索;利用所述知識(shí)庫(kù)中的實(shí)體描述信息對(duì)歷史檢索結(jié)果進(jìn)行序列標(biāo)注得到至少一個(gè)候選實(shí)體翻譯;據(jù)歷史檢索結(jié)果中的當(dāng)前字/詞的TF?IDF值以及所述當(dāng)前字/詞與所述待翻譯實(shí)體共現(xiàn)概率得到至少一個(gè)候選增強(qiáng)詞;統(tǒng)計(jì)所述候選實(shí)體翻譯和所述候選增強(qiáng)詞之間的相關(guān)統(tǒng)計(jì)量,生成或者更新檢索狀態(tài)表;將所述檢索狀態(tài)表作為強(qiáng)化學(xué)習(xí)的狀態(tài)集,將所述至少一個(gè)候選增強(qiáng)詞以及特殊“結(jié)束”動(dòng)作作為強(qiáng)化學(xué)習(xí)的動(dòng)作集,通過(guò)強(qiáng)化學(xué)習(xí)機(jī)制得到最優(yōu)檢索增強(qiáng)詞選擇策略,并在結(jié)束時(shí)以出現(xiàn)次數(shù)最高的候選實(shí)體翻譯作為最終實(shí)體翻譯。本發(fā)明能夠提高實(shí)體翻譯的準(zhǔn)確性和翻譯效率,同時(shí)能夠避免未登錄詞和實(shí)體名歧義性的問(wèn)題。
聲明:
“基于web檢索的實(shí)體翻譯方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)