dxy_0mh3wjy4
dxy_jgd0jwa6
请参考文章题目为“STRATEGIES FOR PRE-TRAINING GRAPH NEU NETWORKS”.这篇文章中,作者开发了一种新型的GNNs预训练策略。作者的策略成功的关键是将节点级和图级预训练与表现型GNN结合起来考虑。这确保了节点嵌入捕捉到了局部邻域语义,这些语义被汇集到一起以获得有意义的图级表示,反过来,这些表示又被用于下游任务。在多个数据集、不同的下游任务和不同的 GNN 架构上的实验表明,新的预训练策略比非预训练的模型实现了一致的更好的分布外泛化。
作者的工作向图上的迁移学习迈出了重要的一步,并解决了之前研究中观察到的负迁移问题。未来的工作还有很多有趣的途径。例如,通过改进GNN架构以及预训练和微调方法进一步提高泛化,是一个富有成效的方向。调查预训练的模型学到了什么也将有助于帮助科学发现(Tshitoyan等人,2019年)。最后,将该方法应用到其他领域也是有趣的,例如物理学、材料科学、结构生物学,其中许多问题可以被定义为图上的交互。
毛利小五郎的徒弟
contact map是经常用的预训练软件,输入相应的药物和靶蛋白就可以进行预训练
周末也要努力呀
可以采用以下步骤进行预训练:
1. 数据准备:收集药物和蛋白质的相关数据集,包括药物的分子结构和蛋白质的序列信息。可以从公开数据库中获取这些数据集。
2. 特征提取:对药物和蛋白质的数据进行特征提取。对于药物,可以使用分子指纹或化学描述符来表示其分子结构。对于蛋白质,可以使用蛋白质序列的编码表示,如one-hot编码或嵌入表示。
3. 构建图结构:将药物和蛋白质的特征转化为图结构。可以根据药物的分子结构构建分子图,其中每个原子和键都表示为节点和边。对于蛋白质,可以使用蛋白质序列之间的相似性构建蛋白质图,其中每个氨基酸残基表示为节点,相似性表示为边。
4. 构建深层多尺度图神经网络模型:根据预定义的网络结构,构建深层多尺度图神经网络模型。该模型可以包括多个图卷积层和池化层,以及全连接层和输出层。
5. 预训练:使用数据集进行模型的预训练。可以使用无监督学习方法,如自编码器或图自编码器,来学习药物和蛋白质的表示。预训练的目标是最大化重构误差或最小化表示的差异。
6. 微调:在预训练之后,使用有监督学习方法对模型进行微调。可以使用已知的药物-蛋白质相互作用数据进行模型的优化,以最大化预测的准确性。
7. 模型评估:使用测试集对模型进行评估,并计算其在预测药物-蛋白质相互作用上的准确性和性能指标。
高山云初
利用contact map,将gnn同时应用于蛋白质和分子图上,以提高性能,并在基准数据集中获得了良好的预测结果。