丁香实验_LOGO
登录
提问
我要登录
|免费注册

使用深层多尺度图神经网络筛选药物的蛋白质作用靶点怎么进行预训练呀?

user-title

dxy_0mh3wjy4


wx-share
分享

4 个回答

user-title

dxy_jgd0jwa6

有帮助

请参考文章题目为“STRATEGIES FOR PRE-TRAINING GRAPH NEU NETWORKS”.这篇文章中,作者开发了一种新型的GNNs预训练策略。作者的策略成功的关键是将节点级和图级预训练与表现型GNN结合起来考虑。这确保了节点嵌入捕捉到了局部邻域语义,这些语义被汇集到一起以获得有意义的图级表示,反过来,这些表示又被用于下游任务。在多个数据集、不同的下游任务和不同的 GNN 架构上的实验表明,新的预训练策略比非预训练的模型实现了一致的更好的分布外泛化。


作者的工作向图上的迁移学习迈出了重要的一步,并解决了之前研究中观察到的负迁移问题。未来的工作还有很多有趣的途径。例如,通过改进GNN架构以及预训练和微调方法进一步提高泛化,是一个富有成效的方向。调查预训练的模型学到了什么也将有助于帮助科学发现(Tshitoyan等人,2019年)。最后,将该方法应用到其他领域也是有趣的,例如物理学、材料科学、结构生物学,其中许多问题可以被定义为图上的交互。

user-title

土井挞克树

有帮助

contact map是经常用的预训练软件,输入相应的药物和靶蛋白就可以进行预训练

user-title

周末也要努力呀

有帮助

可以采用以下步骤进行预训练:

1. 数据准备:收集药物和蛋白质的相关数据集,包括药物的分子结构和蛋白质的序列信息。可以从公开数据库中获取这些数据集。

2. 特征提取:对药物和蛋白质的数据进行特征提取。对于药物,可以使用分子指纹或化学描述符来表示其分子结构。对于蛋白质,可以使用蛋白质序列的编码表示,如one-hot编码或嵌入表示。

3. 构建图结构:将药物和蛋白质的特征转化为图结构。可以根据药物的分子结构构建分子图,其中每个原子和键都表示为节点和边。对于蛋白质,可以使用蛋白质序列之间的相似性构建蛋白质图,其中每个氨基酸残基表示为节点,相似性表示为边。

4. 构建深层多尺度图神经网络模型:根据预定义的网络结构,构建深层多尺度图神经网络模型。该模型可以包括多个图卷积层和池化层,以及全连接层和输出层。

5. 预训练:使用数据集进行模型的预训练。可以使用无监督学习方法,如自编码器或图自编码器,来学习药物和蛋白质的表示。预训练的目标是最大化重构误差或最小化表示的差异。

6. 微调:在预训练之后,使用有监督学习方法对模型进行微调。可以使用已知的药物-蛋白质相互作用数据进行模型的优化,以最大化预测的准确性。

7. 模型评估:使用测试集对模型进行评估,并计算其在预测药物-蛋白质相互作用上的准确性和性能指标。



user-title

高山云初

有帮助

利用contact map,将gnn同时应用于蛋白质和分子图上,以提高性能,并在基准数据集中获得了良好的预测结果。

提问
扫一扫
丁香实验小程序二维码
实验小助手
丁香实验公众号二维码
扫码领资料
反馈
TOP
打开小程序