1.基于多通道图卷积网络的药物靶标相互作用预测方法,其特征在于,所述方法具体包括以下步骤:
步骤一、从数据库中提取出药物信息、蛋白质信息、疾病信息以及药物副作用信息,并根据提取出的信息构建异构网络;
再采用Jaccard相似度方法和随机重启游走方法对构建的异构网络进行处理,得到药物扩散状态矩阵和蛋白质扩散状态矩阵;
步骤二、分别对药物扩散状态矩阵和蛋白质扩散状态矩阵进行降噪降维,得到药物特征矩阵和蛋白质特征矩阵;
步骤三、将步骤二得到的药物特征矩阵和蛋白质特征矩阵拼接,在拼接得到的各个药物蛋白对中,已知存在关系的药物和蛋白质形成的药物蛋白对是正确的,其余的药物蛋白对是不正确的;
步骤四、在正确的药物蛋白对中随机选取出一部分药物蛋白对,作为训练集正例,在剩余的正确药物蛋白对中再随机选取出一部分,作为测试集正例;
在不正确的药物蛋白对中随机选取出与训练集正例数量相等的药物蛋白对,作为训练集负例,在剩余的不正确药物蛋白对中再随机选取出与测试集正例数量相等的药物蛋白对,作为测试集负例;
若两个药物蛋白对之间共用药物或共用蛋白质,则认为两个药物蛋白对之间有关联,否则两个药物蛋白对之间没有关联,根据训练集正例和训练集负例来构建第一药物蛋白对网络,根据测试集正例和测试集负例来构建第二药物蛋白对网络;
步骤五、采用第一药物蛋白对网络对多通道图卷积网络进行训练,其具体过程为:分别采用图卷积网络对第一药物蛋白对网络中药物蛋白对之间的拓扑关系和药物蛋白对特征之间的邻近关系进行特征提取,得到拓扑关系嵌入Zt和特征邻近关系嵌入Zf;
对Zt和Zf进行处理得到共同嵌入Zc;
使用注意力机制对Zt、Zf和Zc进行处理得到特征Z;
将特征Z输入多层感知机进行二分类,多层感知机输出对药物和蛋白质关系的预测结果;
利用第二药物蛋白对网络对多通道图卷积网络进行测试,直至多层感知机输出的对第二药物蛋白对网络中药物和蛋白质关系的预测结果满足精度要求时,则停止训练,获得训练好的多通道图卷积网络;
步骤六、对于关系待预测的药物蛋白对,重复执行步骤一至步骤三的过程后,从步骤三得到的药物蛋白对中随机选取出一部分,利用关系待预测的药物蛋白对和随机选取出的药物蛋白对构建第三药物蛋白对网络;
构建的第三药物蛋白对网络经过训练好的多通道图卷积网络和注意力机制的处理后,再将处理结果输入多层感知机,获得对待预测的药物蛋白对的关系预测结果。
2.根据权利要求1所述的基于多通道图卷积网络的药物靶标相互作用预测方法,其特征在于,所述步骤一中,从数据库中提取出药物信息、蛋白质信息、疾病信息以及药物副作用信息,并根据提取出的信息构建异构网络;其具体过程为:从DrugBank数据库中提取药物信息,所述药物信息包括药物间相互作用信息和已知的药物靶点相互作用信息;
从HPRD数据库中提取蛋白质信息,所述蛋白质信息为蛋白质间相互作用信息;
从毒理基因组学数据库中提取疾病信息,所述疾病信息包括疾病与药物间关系信息以及疾病与蛋白质间关系信息;
从SIDER数据库中提取药物副作用信息,所述药物副作用信息为药物与副作用间关系信息;
从提取出的信息中得到M种药物、N种蛋白质、O种副作用和W种疾病,并根据从各数据库中提取出的信息构建异构网络;
所述异构网络包括药物和药物关系网络、药物和疾病关系网络、药物和药物副作用关系网络、药物和蛋白质关系网络、蛋白质和蛋白质关系网络、蛋白质和疾病关系网络、药物化学性质相似性网络以及蛋白质基因序列相似性网络。
3.根据权利要求2所述的基于多通道图卷积网络的药物靶标相互作用预测方法,其特征在于,所述步骤一中,采用Jaccard相似度方法和随机重启游走方法对构建的异构网络进行处理,得到药物扩散状态矩阵和蛋白质扩散状态矩阵;其具体过程为:对于药物和药物副作用关系网络,将药物和药物副作用关系网络表示为矩阵C的形式:其中,ci′j′=0或1,ci′j′=1代表第i′种药物和第j′种药物副作用有关系,ci′j′=0代表第i′种药物和第j′种药物副作用没有关系,i′=1,2,…,M,j′=1,2,…O;
采用Jaccard相似度方法计算矩阵C的第i行和第j行的相似度,i=1,2,…,M,j=1,
2,…,M,将计算出的第i行和第j行的相似度作为相似度矩阵H中的第i行第j列的元素,遍历完成矩阵C中的每两行后,得到相似度矩阵H;
再采用随机重启游走方法对相似度矩阵H进行处理,得到药物和药物副作用关系网络对应的扩散状态矩阵;
同理,获得药物和药物关系网络对应的扩散状态矩阵、药物和疾病关系网络对应的扩散状态矩阵、蛋白质和蛋白质关系网络对应的扩散状态矩阵、蛋白质和疾病关系网络对应的扩散状态矩阵、药物化学性质相似性网络对应的扩散状态矩阵以及蛋白质基因序列相似性网络对应的扩散状态矩阵;
将药物和药物副作用关系网络对应的扩散状态矩阵、药物和药物关系网络对应的扩散状态矩阵、药物和疾病关系网络对应的扩散状态矩阵和药物化学性质相似性网络对应的扩散状态矩阵拼接为一个特征矩阵D,将特征矩阵D作为药物扩散状态矩阵;
将蛋白质和蛋白质关系网络对应的扩散状态矩阵、蛋白质和疾病关系网络对应的扩散状态矩阵以及蛋白质基因序列相似性网络对应的扩散状态矩阵拼接为一个特征矩阵P,将特征矩阵P作为蛋白质扩散状态矩阵。
4.根据权利要求3所述的基于多通道图卷积网络的药物靶标相互作用预测方法,其特征在于,所述矩阵C的第i行和第j行的相似度的计算方法为:其中,J(A,B)为矩阵C的第i行和第j行的相似度,A为矩阵C的第i行,B为矩阵C的第j行。
5.根据权利要求4所述的基于多通道图卷积网络的药物靶标相互作用预测方法,其特征在于,所述步骤二中,对药物扩散状态矩阵和蛋白质扩散状态矩阵进行降噪降维采用的是去噪自动编码方法。
6.根据权利要求5所述的基于多通道图卷积网络的药物靶标相互作用预测方法,其特征在于,所述药物和蛋白质关系网络表示为矩阵的形式后,矩阵中的元素1代表药物和蛋白质已知存在关系。
7.根据权利要求6所述的基于多通道图卷积网络的药物靶标相互作用预测方法,其特征在于,所述对Zt和Zf进行处理得到共同嵌入Zc,其具体过程为:使用一个权值共享的图卷积网络对Zt和Zf进行处理得到嵌入Zct和Zcf,对Zcf和Zct求和取平均得到共同嵌入Zc。
8.根据权利要求7所述的基于多通道图卷积网络的药物靶标相互作用预测方法,其特征在于,所述使用注意力机制对Zt、Zf和Zc进行处理得到特征Z,其具体过程为:Z=α1*Zc+α2*Zf+α3*Zt其中α1、α2、α3分别表示嵌入的权重。