本發(fā)明提出一種基于SMILES的機(jī)器學(xué)習(xí)方法,包括:將SMILES字符串轉(zhuǎn)化為多個(gè)BASE64字符;通過(guò)One?Hot編碼獲取該BASE64字符的向量矩陣;將該向量矩陣作為訓(xùn)練集,對(duì)機(jī)器學(xué)習(xí)模型訓(xùn)練以進(jìn)行化學(xué)任務(wù)。以及一種基于SMILES的機(jī)器學(xué)習(xí)系統(tǒng),和一種數(shù)據(jù)處理裝置。采用了本方法預(yù)處理后得到的字符串相較于原SMILES包含了更多的信息,其不僅包含字符信息還包含字符之間的隱含信息。將本方法應(yīng)用到基于SMILES的新型分子設(shè)計(jì)、分子屬性預(yù)測(cè)等化學(xué)任務(wù)中時(shí),可以提取出更多的分子特征,提高了模型重構(gòu)分子及分子屬性預(yù)測(cè)的精度。
聲明:
“基于SMILES的機(jī)器學(xué)習(xí)方法及系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)