基于Agraph卷積的分類模型,用于從越南傳統(tǒng)草藥數(shù)據(jù)庫中識(shí)別抗癌代謝物的分類模型
一、文章概述
幾千年來,越南一直是豐富多樣的草藥來源,在藥物開發(fā)中發(fā)揮各種目的,以解決健康問題,如癌癥。聲稱化學(xué)信息學(xué)相關(guān)的原理,結(jié)構(gòu)相似的化合物很可能有類似的生物活性,本研究采用分子圖卷積,機(jī)器學(xué)習(xí)體系結(jié)構(gòu)從小分子提取特征的作為無向圖,預(yù)測(cè)基于代謝物的結(jié)構(gòu)越南草藥的抗癌能力。除了分子圖卷積,擴(kuò)展連接指紋,一種傳統(tǒng)的利用分子細(xì)節(jié)的飽和器(ECFP),以進(jìn)行性能比較。最后,我們成功地構(gòu)建了一個(gè)基于圖卷積的神經(jīng)網(wǎng)絡(luò),具有較高的預(yù)測(cè)精度,表明該模型在檢測(cè)抗癌活性方面是可靠的。
二、圖文導(dǎo)讀
圖1.從NCI-60數(shù)據(jù)集建立訓(xùn)練和預(yù)測(cè)抗癌活性的數(shù)據(jù)集。
圖2.在迭代0時(shí),部分分子的說明。N表示氮原子,被認(rèn)為是檢測(cè)原子或核心原子,其標(biāo)識(shí)符為d。C和O分別表示碳,標(biāo)識(shí)符為b的氧原子和標(biāo)識(shí)符為a的氧原子。一行代表單鍵,雙線代表雙鍵。
圖3.在迭代0和迭代1時(shí),N個(gè)原子的標(biāo)識(shí)符d的說明。每次迭代后,子結(jié)構(gòu)表示在化學(xué)結(jié)構(gòu)洞察力方面變得更加豐富。
圖4.在圖卷積層中的操作說明。C1、C2和C3的陣列表示C原子的特征向量。N原子和O原子分別使用相同的符號(hào)。核心原子,氮,被標(biāo)記為藍(lán)色。為了進(jìn)行卷積,形成與3個(gè)相鄰原子相關(guān)的核心原子的新特征,這個(gè)總和將由一個(gè)激活函數(shù)進(jìn)行和包裹。新的特征向量被標(biāo)記為紅色。類似地,同樣的過程將應(yīng)用于分子結(jié)構(gòu)中的所有節(jié)點(diǎn),這將為每個(gè)節(jié)點(diǎn)產(chǎn)生全新的特征向量。
圖5.在兩個(gè)相鄰原子的核心原子上的圖卷積層的說明。
圖6.基于勞盟-俄羅斯石油公司的分類性能。
三、全文總結(jié)
我們成功地構(gòu)建了抗癌活性預(yù)測(cè)模型,盡管數(shù)據(jù)集規(guī)模小,結(jié)果有希望。此外,我們還成功地從NCI-60數(shù)據(jù)庫中抓取微笑數(shù)據(jù),并進(jìn)行過濾,獲得最終清理后的數(shù)據(jù)集,從而取得了良好的性能。在未來,該模型將作為一個(gè)獨(dú)立的版本構(gòu)建,作為挖掘越南藥用植物的工具。基于這項(xiàng)研究,DeepChem不僅有能力發(fā)現(xiàn)抗癌候選藥物,而且還可以用于對(duì)針對(duì)其他疾病的潛在候選藥物進(jìn)行圖挖掘。
文章鏈接:
http://n.ustb.edu.cn/https/77726476706e69737468656265737421f4fb0f9d243d265f6c0f/doi/10.1145/3184066.3184090
本信息源自互聯(lián)網(wǎng)僅供學(xué)術(shù)交流 ,如有侵權(quán)請(qǐng)聯(lián)系我們立即刪除。
| 溫馨提示:蘇州北科納米供應(yīng)產(chǎn)品僅用于科研,不能用于人體,不同批次產(chǎn)品規(guī)格性能有差異。網(wǎng)站部分文獻(xiàn)案例圖片源自互聯(lián)網(wǎng),圖片僅供參考,請(qǐng)以實(shí)物為主,如有侵權(quán)請(qǐng)聯(lián)系我們立即刪除。 |


