一種不均衡數(shù)據(jù)下最優(yōu)化學(xué)習(xí)樣本合成算法選擇及參數(shù)確定方法,以數(shù)據(jù)特征對(duì)診斷結(jié)果的貢獻(xiàn)能力為出發(fā)點(diǎn),分析樣本均衡度對(duì)其區(qū)分能力的影響,提出以最大化特征區(qū)分能力為指標(biāo)來選擇樣本合成采樣算法。同時(shí),構(gòu)建激活函數(shù)來描述樣本數(shù)量對(duì)分類能力的影響。在此基礎(chǔ)上,提出有效特征區(qū)分度指標(biāo),并通過對(duì)該指標(biāo)的最大化來獲得最優(yōu)樣本均衡度。本發(fā)明所涉及的過程均以特征對(duì)樣本的正確分類為目標(biāo),且僅需要對(duì)原始數(shù)據(jù)進(jìn)行操作,可以在不增加樣本采集及引入新特征的情況下獲得更高的診斷效果。另外,沒有特征數(shù)量方面要求,不會(huì)因?yàn)閿?shù)據(jù)特征數(shù)量多少影響最終計(jì)算的最優(yōu)樣本均衡度的準(zhǔn)確率。
聲明:
“不均衡數(shù)據(jù)下最優(yōu)化學(xué)習(xí)樣本合成算法選擇及參數(shù)確定方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)