本發(fā)明公開了一種基于共現(xiàn)分析和譜聚類的醫(yī)療數(shù)據(jù)信息檢索方法,對檢索任務(wù)詞匯進行查詢擴展,將擴展后的檢索任務(wù)詞匯分類為檢索詞、擴展詞和特征詞,對文獻進行首次記分,如果首次得分大于閾值T則選中文獻,小于閾值T則放棄文獻;對選中文獻進行二次計分和共現(xiàn)分析,得到二次得分和共現(xiàn)得分,并通過首次得分、二次得分和共現(xiàn)得分計算文獻的綜合得分;使用詞袋模型將文獻的化學詞列表、醫(yī)學主題詞列表、摘要和關(guān)鍵詞列表組成描述文獻的向量,以向量距離矩陣作為譜聚類的輸入對選中文獻進行聚類,輸出聚類簇;輸出平均綜合得分最高的那個類作為檢索結(jié)果,并對檢索結(jié)果中的文獻按綜合得分進行降序排序輸出。
聲明:
“基于共現(xiàn)分析和譜聚類的醫(yī)療數(shù)據(jù)信息檢索方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)