1.基于有监督的协同图对比学习的药物‑靶标相互作用预测方法,其特征在于,所述方法具体包括以下步骤:步骤S1、从数据库中提取出药物信息、蛋白质信息、疾病信息以及药物副作用信息,并根据提取出的信息构建药物异构信息网络和蛋白质异构信息网络;
步骤S2、基于第一编码器得到药物异构信息网络中每种药物的最终表示,基于第二编码器得到蛋白质异构信息网络中每种蛋白质的最终表示;
所述基于第一编码器得到药物异构信息网络中每种药物的最终表示,其具体过程为:对于药物异构信息网络中的任意一种药物对应的节点,根据药物异构信息网络得到包含该节点的全部元路径后,再分别将每个元路径输入到第一编码器中,通过第一编码器分别输出各个元路径的表示;
使用注意力机制赋予不同元路径以不同的权重,根据权重将各个元路径的表示进行加权求和,将加权求和结果作为该节点所对应的药物的最终表示;
同理,分别得到其它各种药物的最终表示以及每种蛋白质的最终表示;
步骤S3、对于任意一种药物,将步骤S2中得到的该种药物的最终表示分别与得到的每种蛋白质的最终表示进行拼接,得到包含该种药物的全部药物蛋白对;
同理,分别得到包含其它各种药物的全部药物蛋白对;
步骤S4、基于步骤S3中获得的药物蛋白对构建药物蛋白对网络,再从构建的药物蛋白对网络中提取出药物蛋白对之间的拓扑结构特征以及语义结构特征;
步骤S5、利用步骤S4中提取出的药物蛋白对之间的拓扑结构特征以及语义结构特征对第三编码器、第四编码器和多层感知机进行训练,其中:拓扑结构特征作为第三编码器的输入,语义结构特征作为第四编码器的输入,将第三编码器和第四编码器的输出进行拼接后,拼接结果作为多层感知机的输入;
步骤S6、对于关系待预测的药物与蛋白质,得到待预测药物的最终表示与待预测蛋白质的最终表示后,将得到的最终表示进行拼接,得到待预测关系的药物蛋白对;
基于待预测关系的药物蛋白对与步骤S3中得到的药物蛋白对重新构建药物蛋白对网络,根据重新构建的药物蛋白对网络,得到新的拓扑结构特征以及语义结构特征,并将新的拓扑结构特征以及语义结构特征分别输入到训练好的第三编码器和第四编码器;
再将训练好的第三编码器与第四编码器的输出结果进行拼接,拼接结果再输入训练好的多层感知机,通过多层感知机输出药物与蛋白质关系的预测结果。
2.根据权利要求1所述的基于有监督的协同图对比学习的药物‑靶标相互作用预测方法,其特征在于,所述步骤S1的具体过程为:从DrugBank数据库中提取药物信息,所述药物信息包括药物间相互作用信息和已知的药物与蛋白质间相互作用信息;
从HPRD数据库中提取蛋白质信息,所述蛋白质信息为蛋白质间相互作用信息;
从毒理基因组学数据库中提取疾病信息,所述疾病信息包括疾病与药物间关系信息以及疾病与蛋白质间关系信息;
从SIDER数据库中提取药物副作用信息,所述药物副作用信息为药物与副作用间关系信息;
根据药物间相互作用信息、药物与蛋白质间相互作用信息、疾病与药物间关系信息以及药物与副作用间关系信息构建药物异构信息网络;
药物、蛋白质、疾病以及副作用作为药物异构信息网络中的节点,若某两个节点之间存在关系,则这两个节点在药物异构信息网络中存在边,否则,这两个节点在药物异构信息网络中不存在边;
根据药物与蛋白质间相互作用信息、蛋白质间相互作用信息以及疾病与蛋白质间关系信息构建蛋白质异构信息网络;
药物、蛋白质、疾病作为蛋白质异构信息网络中的节点,若某两个节点之间存在关系,则这两个节点在蛋白质异构信息网络中存在边,否则,这两个节点在蛋白质异构信息网络中不存在边。
3.根据权利要求2所述的基于有监督的协同图对比学习的药物‑靶标相互作用预测方法,其特征在于,所述使用注意力机制赋予不同元路径以不同的权重,根据权重将各个元路径的表示进行加权求和,将加权求和结果作为该节点所对应的药物的最终表示;其具体为:其中, 是第一编码器输出的第i个元路径的表示,W是权重矩阵,b是偏置向量,q表示转换向量, 是赋予第i个元路径的权重;
对各个元路径的表示进行加权求和:
其中,hdrug是该节点所对应的药物的最终表示,i=1,2,…Md,Md是元路径的总个数。
4.根据权利要求3所述的基于有监督的协同图对比学习的药物‑靶标相互作用预测方法,其特征在于,所述步骤S4中,基于步骤S3中获得的所有药物蛋白对构建药物蛋白对网络,其具体过程为:由已知存在关系的药物和蛋白质拼接起来的药物蛋白对被认为是正确的药物蛋白对,其它的药物蛋白对被认为是非正确的药物蛋白对;
若拼接成的两对药物蛋白对之间共用药物或蛋白质,则两对药物蛋白对之间有关联,否则两对药物蛋白对之间没有关联,根据得到的所有药物蛋白对之间的关联关系构建药物蛋白对网络。
5.根据权利要求4所述的基于有监督的协同图对比学习的药物‑靶标相互作用预测方法,其特征在于,所述第三编码器和第四编码器采用对比学习的方式进行训练;
直至多层感知机输出的预测结果满足精度要求时停止训练,获得训练好的第三编码器、第四编码器以及多层感知机。
6.根据权利要求5所述的基于有监督的协同图对比学习的药物‑靶标相互作用预测方法,其特征在于,所述第一编码器、第二编码器、第三编码器以及第四编码器均为GCN。