本發(fā)明提出了一種跨媒體圖像檢索方法及系統(tǒng),包括:獲取數(shù)據(jù)庫中所有圖片和待檢索的文本標(biāo)題;將所述圖片輸入到預(yù)先構(gòu)建的圖片標(biāo)題生成模型,得到所述圖片對應(yīng)的文本標(biāo)題,并將所述圖片與所述圖片對應(yīng)的文本標(biāo)題以對的形式更新數(shù)據(jù)庫中原始圖片;采用文本匹配的檢索方法從更新后的數(shù)據(jù)庫中檢索所述待檢索的文本標(biāo)題對應(yīng)的圖片;其中,所述圖片標(biāo)題生成模型是基于卷積神經(jīng)網(wǎng)絡(luò)?循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,并采用強(qiáng)化學(xué)習(xí)方法對所述圖片標(biāo)題生成模型的參數(shù)優(yōu)化后得到。本發(fā)明的技術(shù)方案采用卷積神經(jīng)網(wǎng)絡(luò)—循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到了實(shí)體之間的關(guān)系,并采用強(qiáng)化學(xué)習(xí)方法對圖片標(biāo)題生成模型的參數(shù)進(jìn)行優(yōu)化,提高了檢索的效率。
聲明:
“跨媒體圖像檢索方法及系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)