本發(fā)明公開了一種基于深度學(xué)習(xí)的蛋白質(zhì)相互作用位點(diǎn)預(yù)測(cè)方法,屬于生物信息學(xué)分析技術(shù)領(lǐng)域,首先,從PDB數(shù)據(jù)庫(kù)獲取公開的蛋白質(zhì)數(shù)據(jù)集,基于數(shù)據(jù)集中蛋白質(zhì)的序列信息生成位置特異性得分矩陣并提取給定蛋白質(zhì)序列的物理化學(xué)特征,從而形成蛋白質(zhì)中每一個(gè)氨基酸殘基的表示。由于蛋白質(zhì)序列中非相互作用殘基遠(yuǎn)遠(yuǎn)多于相互作用殘基,采用下采樣策略來消除類別不平衡性以獲得高質(zhì)量且低偏差的數(shù)據(jù)集。將平衡后的數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集,對(duì)于訓(xùn)練集利用變分自編碼器進(jìn)一步提取蛋白質(zhì)序列的高級(jí)抽象特征,再利用多層感知機(jī)對(duì)氨基酸殘基進(jìn)行分類。將訓(xùn)練好的模型在測(cè)試集上測(cè)試,得到預(yù)測(cè)結(jié)果。本發(fā)明計(jì)算成本低且預(yù)測(cè)精度較高。
聲明:
“基于深度學(xué)習(xí)的蛋白質(zhì)相互作用位點(diǎn)預(yù)測(cè)方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)