本發(fā)明提供的基于匹配學(xué)習(xí)的多標(biāo)簽分類學(xué)習(xí)方法,首先對(duì)客戶端數(shù)據(jù)進(jìn)行特征值計(jì)算,得到訓(xùn)練集;設(shè)定訓(xùn)練集中的正負(fù)標(biāo)簽;然后計(jì)算訓(xùn)練集中特征集合的嵌入式表征E;計(jì)算正標(biāo)簽的嵌入式表征Z+和負(fù)標(biāo)簽的嵌入式表征Z?;接著對(duì)E和Z+作損失計(jì)算,對(duì)E與Z?作損失計(jì)算;依據(jù)正負(fù)損失值,采用梯度下降算法對(duì)訓(xùn)練集進(jìn)行模型訓(xùn)練;當(dāng)訓(xùn)練模型的損失值不再下降時(shí),訓(xùn)練結(jié)束,否則再次訓(xùn)練;最后采用測(cè)試集測(cè)試該訓(xùn)練模型。本發(fā)明考慮了長(zhǎng)尾標(biāo)簽對(duì)傳統(tǒng)極大規(guī)模多標(biāo)簽分類模型學(xué)習(xí)的不利影響,提出利用特征集合和標(biāo)簽集合的匹配學(xué)習(xí)方法。此外,為保證模型能夠擴(kuò)展到大規(guī)模數(shù)據(jù)集上,采用梯度下降算法的模型學(xué)習(xí)方式,既可保證模型并行化學(xué)習(xí),還可支持模型在線增量學(xué)習(xí)。
聲明:
“基于匹配學(xué)習(xí)的多標(biāo)簽分類學(xué)習(xí)方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)