本發(fā)明公開(kāi)了基于MIML的OGC地理信息服務(wù)語(yǔ)義檢索方法,屬于機(jī)器學(xué)習(xí)和地理技術(shù)領(lǐng)域,該方法能夠有效地解決地理信息服務(wù)語(yǔ)義的歧義性。該方法包括如下步驟:步驟1:參考地質(zhì)礦產(chǎn)術(shù)語(yǔ)分類標(biāo)準(zhǔn),通過(guò)Protégé軟件建立的礦產(chǎn)領(lǐng)域的本體庫(kù)模型。步驟2:采用DOM4J對(duì)XML文件進(jìn)行文件的主題詞匯提取,得到關(guān)鍵字title,abstract,keyword,layer?keyword。步驟3:將解析的四個(gè)標(biāo)簽作為描述XML文件的內(nèi)容與protege軟件建立的本體庫(kù)相結(jié)合,利用TF?IDF算法篩選出每個(gè)XML文件中出現(xiàn)最多的10個(gè)主題詞匯。步驟4:MIMLBoost算法將XML文件變?yōu)橐粋€(gè)示例包,每個(gè)主題詞匯作為一個(gè)標(biāo)記。當(dāng)詞匯在示例包的每個(gè)示例中均出現(xiàn)時(shí)認(rèn)為這個(gè)詞匯可以作為主題詞匯從而將之提取出來(lái)。步驟5:輸入查詢?cè)~匯得到與之相關(guān)的文件。
聲明:
“基于MIML的OGC地理信息服務(wù)語(yǔ)義檢索方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)