本發(fā)明公開一種從研究文獻中提取天然產(chǎn)物數(shù)據(jù)信息的方法,包括:對研究文獻文本內(nèi)容進行預處理,以得到多個預處理語句;從所述多個預處理語句中獲取生物物種描述語句和化學成分描述語句;從所述生物物種描述語句中獲取生物物種信息;從所述化學成分描述語句中獲取化學物質(zhì)信息;至少關聯(lián)存儲所述生物物種信息和所述化學物質(zhì)信息。本申請實施例自動分析天然產(chǎn)物研究文獻的文本內(nèi)容,并自動識別和提取其中的天然產(chǎn)物化學成分數(shù)據(jù)信息,用于計算機大規(guī)模批量生產(chǎn)具有科學研究價值的天然產(chǎn)物數(shù)據(jù),從而避免人工標引數(shù)據(jù)周期長、成本高等缺陷,達到短時間、低消耗獲取一定規(guī)模天然產(chǎn)物化學成分數(shù)據(jù)集的目的。
聲明:
“從研究文獻中提取天然產(chǎn)物數(shù)據(jù)信息的方法及系統(tǒng)” 該技術專利(論文)所有權(quán)利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)