本發(fā)明實施例提供一種語言模型建立方法及裝置。所述方法包括獲取語料庫,語料庫包括至少一個經過分詞處理的句子;根據(jù)策略函數(shù)對所述語料庫中的每個句子進行篩選,將滿足預設篩選條件的句子組成分詞詞典;通過對分詞詞典中每個句子的分析得到語言模型;用語言模型對預先獲取的聲學模型進行解碼以計算損失函數(shù);若根據(jù)損失函數(shù)和預設的獎勵函數(shù)得到的獎勵值滿足預設的優(yōu)化條件,則判斷所述語言模型建立完成,本發(fā)明實施例通過策略函數(shù)對獲取的語料庫進行篩選,然后將得到語言模型對聲學模型進行解碼得到CTC函數(shù),再通過得到的獎勵函數(shù)對策略函數(shù)進行優(yōu)化改進,從而通過強化學習的方法快速得到需要的語言模型,且能夠提高語音識別的準確率。
聲明:
“語言模型建立方法及裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)