近年来,针对转录和表观遗传相关疾病的新式医治战略展示出相当大的潜力,表观遗传类靶标被认为是未来十年里最具有远景性的一类药靶。可是,这类靶标功用相关性杂乱,结构在其催化结构域或蛋白互作结构域则或许高度保存,带来小分子按捺剂的选择性机制不清晰、特定的表型与特定的蛋白活性联络困难等应战。因而,活性分子表观遗传靶标谱猜测(Epigenetic target profiling)在高选择性的表观遗传药物(epi-drugs)开发前期阶段扮演着很重要的人物。准确猜测表观遗传靶标谱有助于清晰药物选择性,说明药物脱靶效应副作用以及药物重定位等。但是,现有的猜测办法因为数据量和算法约束,其猜测精度不能够满意相关药物开发的需求。
来自浙江大学和澳门理工大学的研讨团队根据多任务学习、比照学习和自适应学习等新一代AI技能,开发了一种用于表观遗传靶标谱猜测的模型——AMGC,相较于其他测验办法展示出了更强壮的猜测功能和必定的可解释性,有望通过用户友爱的在线网站便利研讨者进行表观遗传靶标谱的猜测作业()。本文于2月28日以“AMGC a multiple-task graph neutral network for epigenetic target profiling”为题在Cell Press细胞出版社旗下期刊Cell Reports Physical Science在线宣布。
在AMGC模型中,方针分子首要被表征成为图的方式,进入数个图卷积层进行信息的加工和传递,再通过注意力机制层交融不同原子的信息,终究进入多任务的全衔接层来猜测终究成果。此外,AMGC引入了比照学习和自适应学习等机制,来增强模型的泛化功能。内部测验集和外部测验集上的猜测成果为,AMGC均取得了优于传统描述符加经典机器学习算法,以及根据其它图神经网络的多任务模型。
AMGC能够终究靠提取每个原子对猜测成果的奉献权重来显现其可解释性。如图2a所示,JAK1靶标结构中残基LEU-932中的氧原子和氮原子与化合物1~4中的氮原子构成氢键,残基ASP-994与化合物3的羟基构成氢键。AMGC能够杰出显现这四个化合物中构成氢键的原子。此外,与前三个化合物比较,化合物4用于构成氢键的极性基团较少,因而其被猜测为活性的概率也最小。在图4b中,LSD1靶标结构中的ASP-555残基能够与其内源性分子六元环上的氨基构成盐桥和氢键,TYR-761残基能够与五元环构成π-π相互作用。AMGC模型在化合物5~8上的猜测成果杰出了相对应方位上原子的重要性。
作者额定收集了组蛋白去乙酰化酶(histone deacetyltransferases, HDACs)一系列有试验活性值的按捺剂小分子。在这些分子的按捺谱图猜测中,AMGC取得了比之前的SOTA模型ETP更高的召回率。此外,在化合物CN88的猜测中,AMGC针对9个组蛋白去乙酰化酶均做出了正确的猜测,在化合物CN143的猜测中,AMGC命中了8个组蛋白去乙酰化酶靶标中的6个。这说明AMGC有望被进一步地应用于高选择性的表观遗传药物开发作业。