本發(fā)明公開了一種基于es倒排索引的化學分子式檢索方法,本發(fā)明結(jié)合大數(shù)據(jù)平臺對檢索過程進行重新設計,首先通過對es數(shù)據(jù)庫中的分子式進行分詞得到的子結(jié)構(gòu)建立倒排索引,并對es數(shù)據(jù)庫中的分子式計算哈希表示;檢索時對分子式進行分詞得到子結(jié)構(gòu),并計算哈希表示,利用倒排索引得到子結(jié)構(gòu)匹配的分子式集合,再與得到的分子式集合的哈希表示一一比較,得到輸入分子式與分子式集合中每個分子式之間的相似度,按照應用需要輸出檢索結(jié)果。本發(fā)明的比較范圍為分子式集合,而不是數(shù)據(jù)庫中全部的分子式,減少了比較的次數(shù),進一步加快了分子式的檢索。
聲明:
“基于es倒排索引的化學分子式檢索方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)