本發(fā)明涉及人工智能技術(shù)領(lǐng)域,具體公開了一種基于樣本包絡(luò)多層聚類的數(shù)據(jù)集平衡化學(xué)習(xí)方法,包括步驟:選擇不平衡訓(xùn)練集,該不平衡訓(xùn)練集由少數(shù)類樣本和多數(shù)類樣本組成;對少數(shù)類樣本和多數(shù)類樣本構(gòu)造對應(yīng)的包絡(luò)化少數(shù)類樣本和包絡(luò)化多數(shù)類樣本;對包絡(luò)化少數(shù)類樣本進(jìn)行深度樣本變換,得到對應(yīng)的L層包絡(luò)化少數(shù)類深度樣本,L≥1;將包絡(luò)化少數(shù)類樣本與每層包絡(luò)化少數(shù)類深度樣本進(jìn)行融合,得到樣本數(shù)目與包絡(luò)化多數(shù)類樣本平衡的包絡(luò)化少數(shù)類平衡樣本;將包絡(luò)化少數(shù)類平衡樣本與包絡(luò)化多數(shù)類樣本融合,得到平衡訓(xùn)練集。本發(fā)明增加了少數(shù)類樣本的多樣性,提高了少數(shù)類樣本的質(zhì)量,從而增加了模型對少數(shù)類樣本的學(xué)習(xí)能力,提升了其分類或預(yù)測的準(zhǔn)確性。
聲明:
“基于樣本包絡(luò)多層聚類的數(shù)據(jù)集平衡化學(xué)習(xí)方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)