1.一种融合多种拓扑信息的生物网络比对方法,其特征在于,包括:步骤1读取网络及其序列相似性得分,分别计算两个网络的相关值矩阵,并对网络进行模块划分,同一模块内的结点具有较高的相似性;
步骤2计算模块内结点的相似性得分,并对模块进行两两结点比对;
步骤3计算模块间的相似性得分,并对模块进行比对;
步骤4将步骤2,3中得到的结点映射关系进行整合,筛选,得到1对1的结点映射关系;
步骤5删除已比对结点,并重复步骤2‑5,小网络中的结点全部被比对上,或模块间相似性得分为0,算法停止;
模块划分具体如下:
模块划分是针对单个网络进行的;
首先,计算网络的相关值矩阵,该矩阵给出了结点间的相似性关系,本发明给出了结点间关系的四种定义,分别为强相关,弱相关,相关与不相关;
如果两个结点间有一条边相连,则称该对结点为强相关;
若结点间不存在直接相连的边,但可以通过其他结点间接相连,则称为弱相关;
符合强相关和弱相关的结点也称为相关;
不存在相关关系的结点对均称为不相关;
相关值计算公式如下:
*
其中,Θ强相关结点集,Φ为弱相关结点集, 为不相关结点集;max{1,|Φ |M}指所有相关结点中所经过的中间边数目的最大值, 指从结点u到v所经过的中间边数目;
公式1)为归一化后的相关值,其值越大,表示结点间的相似性越高;
然后,根据相关值矩阵,分别对G1,G2进行模块化分,得到模块集合CG1,CG2;详细步骤如下:a)构建关于网络G=(V,E)中所有结点对的相关值矩阵Ψ;
b)对于 初始化|V|个分别以 为模块中心的模块,记为
c)模块 的构建方法为:根据Ψ,得到其他结点与 的相关值,并将其按降序排列,选取相关值在前25%的结点加入到模块 其他模块构造方法类似,最终得到模块内结点比对具体如下:将网络G1,G2分别模块化后得到两个模块集合C1,C2;将C1中的每个模块与C2中的每个模块分别使用种子扩展方法进行比对,得到|C1|*|C2|对模块比对结果,|C1|,|C2|分别指模块的数目;
其中模块比对过程中用到的结点相似性得分函数为:为结点(s,t)间的总相似性得分,B(s,t)为结点(s,t)的序列相似性得分,该得分由BLAST++工具计算得出,用以评价结点间的生物相似性,值越大,结点相似性越高;
为结点间的拓扑相似性得分,它由一种基于特征向量中心性的拓扑向量元组计算而来,其中
1) 表示结点 的度,即 的邻居数;
2) 表示结点 的特征向量中心性,用以衡量结点在网络中的中心性地位;
3) 表示结点 邻居的平均特征向量中心性;
因此,结点对(s,t)的拓扑相似得分 具体计算公式如公式3);其值越小,结点间越相似;
使用种子扩展方法将CG1中的模块分别与CG2中的模块两两进行模块内比对的详细步骤如下:a)输入待比对模块
b)首先将 比对上;
c)分别获取 的邻居,
d)计算 中结点对的相似性 并使用匈牙利算法将 结点进行比对,其中 为 与
的笛卡尔乘积;
e)将已扩展结点 移除,并对剩余已比对结点对依次重复步骤c)d);
f)获得模块内结点比对结果
模块间比对具体如下:
将每个模块看作一个结点,构建完全二部图,边的权重为模块间的相似性得分;接着使用最大加权二部图匹配算法进行模块匹配,得到模块间比对结果;其中模块间相似性得分计算如下:为步骤2中得到的一个模块内比对结果中所比对上的结点对数目,为该比对结果中结点对的序列相似性之和。
2.如权利要求1所述的融合多种拓扑信息的生物网络比对方法,其特征在于,其中,为模块间的局部边保守得分,用以衡量该比对结果的边保守性,具体计算如下:
令eij表示网络Gi中模块C(j)的局部边集,Ei为Gi的边集,V(C(j))为模块C(j)的结点集,eij表示如下:ei,j={(s1,s2)|s1,s2∈V(C(j))∧(s1,s2)∈Ei} 5)对于网络G1=(V1,E1),G2=(V2,E2), 如果则称 为一对模块
保守边;
表示模块 的保守边逻辑矩阵,其每个元素计算方式如下:模块 的局部边保守得分计算如下:
。
3.如权利要求1所述的融合多种拓扑信息的生物网络比对方法,其特征在于,其中,根据模块相似性得分对CG1,CG2进行模块间比对的详细步骤如下:a)输入网络G1,G2的模块集合CG1,CG2;
b)将CG1,CG2的每一个模块分别看作一个结点,构建完全二分图 边的权重为相似性得分c)使用匈牙利算法对 进行求解,即可得到一对一的模块比对
4.如权利要求1所述的融合多种拓扑信息的生物网络比对方法,其特征在于,已有比对数据处理具体如下:将已有的结点映射关系构建超图,超图的结点为已比对的结点,每对模块的比对结果抽象为超图的一条超弧,使用超图匹配算法得到1对1的结点映射关系。
5.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1到4任一项所述方法的步骤。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1到4任一项所述方法的步骤。
7.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1到4任一项所述的方法。