本發(fā)明公開了一種基于深度學(xué)習(xí)的化學(xué)反應(yīng)事件抽取方法和系統(tǒng)。本方法包括以下步驟:S1從pdf文獻(xiàn)中截取與化學(xué)反應(yīng)相關(guān)的文本圖片,并利用OCR技術(shù)將其轉(zhuǎn)換為文本文件;S2借助NLP工具包對其進(jìn)行分句分詞,獲取標(biāo)準(zhǔn)化的數(shù)據(jù);S3搭建神經(jīng)網(wǎng)絡(luò)模型識別與化學(xué)反應(yīng)事件相關(guān)的實體;S4調(diào)整輸入特征,利用網(wǎng)絡(luò)模型對句子中的觸發(fā)詞進(jìn)行抽?。籗5引入圖卷積網(wǎng)絡(luò),檢測事件元素,建立觸發(fā)詞與相應(yīng)反應(yīng)實體間的關(guān)系,從而完成對一個化學(xué)反應(yīng)事件的完整描述。本發(fā)明通過構(gòu)建深度學(xué)習(xí)模型從化學(xué)文獻(xiàn)中抽取涵蓋化學(xué)反應(yīng)的相關(guān)文本,將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù),豐富了化學(xué)反應(yīng)數(shù)據(jù)庫,推動了相關(guān)領(lǐng)域的任務(wù)進(jìn)展。
聲明:
“基于深度學(xué)習(xí)的化學(xué)反應(yīng)事件抽取方法和系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)