1.一种全局生物网络比对方法,其特征在于,包括:
分别提取源网络和目标网络中所有节点,提取序列相似性文件中所述源网络节点和所述目标网络节点之间的序列信息;
计算所述源网络中每个节点与所述目标网络中所有节点之间的拓扑信息,所述拓扑信息的计算公式为:其中,u为所述源网络中的节点,v为所述目标网络中的节点,deg(u)和deg(v)分别为节点u和节点v的度;
融合源网络节点与目标网络节点之间的拓扑信息和序列信息,计算所述源网络中每个节点与所述目标网络中所有节点之间的相似性得分,其公式:0
S(u,v)=(1‑α)*ST(u,v)+α*SE(u,v);
其中, 为所述源网络中节点u和所述目标网络中节
点v的序列信息,α为调节拓扑和序列间的权重,BLAST(u,v)为所述节点u和所述节点v的bit‑score得分;
基于所述源网络内邻居节点对所述节点u的干扰及所述目标网络邻居节点对所述节点v的干扰,将相似性得分更新为:其中,t为标识迭代次数,γ为起到调节权重的作用;|N(u)|为节点u的邻居节点的个数;|N(v)|为v节点的邻居节点的个数,M为邻居节点间比对上的节点对集合;
基于初始源网络节点序列,利用贪心算法不断选取源网络节点与该节点相似性得分最高的目标网络节点比对为节点对,直至所述源网络中的所有节点均比对完成,将所有节点对组合为一个个体;
随机生成源网络节点序列,按照序列中源网络节点出现的顺序,选择与该节点相似性得分最高的目标网络节点比对为节点对,直至源网络节点序列都比对完成,生成个体,重复随机比对的步骤,生成其余个体,将所有个体组合为初始种群;
利用蝙蝠算法对所述初始种群进行全局搜索和局部搜索生成新的个体,重复全局搜索和局部搜索的步骤迭代优化种群,直至达到预设迭代次数,输出目标种群;
计算所述目标种群中所有个体的目标函数值,选取所述目标函数值最大的个体作为所述源网络和所述目标网络的比对结果;
所述目标函数值的计算方法如公式:
SS(A)=CE(A)+PS(A)
其中,A即一个比对结果, 即比对结果
中保守边数目,即源网络中的边在目标网络中也有映射边的数目,其中f(ui)表示节点ui在比对结果中的匹配节点,f(uj)表示节点uj在比对结果中的匹配节点;PS(A)即保守节点的序列相似性得分 。
2.如权利要求1所述的全局生物网络比对方法,其特征在于,所述全局搜索包括:根据蝙蝠算法计算所述初始种群中每个个体中源网络节点的速度,若当前源网络节点速度为0,则保持当前源网络节点的匹配;
若当前源网络节点速度为1,则在所述目标网络中未比对上的节点中进行随机匹配,产生新的个体。
3.如权利要求2所述的全局生物网络比对方法,其特征在于,所述局部搜索包括:保留所述全局搜索的结果,将每个个体中源网络节点速度为1的节点对组成一个交换集合;
将所述交换集合中的源网络节点随机交换比对目标网络节点,产生新的个体。
4.一种全局生物网络比对的装置,其特征在于,包括:
读取模块,用于分别提取源网络和目标网络中所有节点,提取序列相似性文件中所述源网络节点和所述目标网络节点之间的序列信息;
计算拓扑信息模块,用于计算所述源网络中每个节点与所述目标网络中所有节点之间的拓扑信息,所述拓扑信息计算公式为:其中,u为所述源网络中的节点,v为所述目标网络中的节点,deg(u)和deg(v)分别为节点u和节点v的度;
计算相似性模块,用于融合源网络节点与目标网络节点的拓扑信息和序列信息,计算所述源网络中每个节点与所述目标网络中所有节点之间的相似性得分,其公式:0
S(u,v)=(1‑α)*ST(u,v)+α*SE(u,v);
其中, 为所述源网络中节点u和所述目标网络中节
点v的序列信息,α为调节拓扑和序列间的权重,BLAST(u,v)为所述节点u和所述节点v的bit‑score得分;
基于所述源网络内邻居节点对所述节点u的干扰及所述目标网络邻居节点对所述节点v的干扰,将相似性得分更新为:其中,t为标识迭代次数,γ为起到调节权重的作用;|N(u)|为节点u的邻居节点的个数;|N(v)|为v节点的邻居节点的个数,M为邻居节点间比对上的节点对集合;
生成种群模块,用于基于初始源网络节点序列,利用贪心算法不断选取源网络节点与该节点相似性得分最高的目标网络节点比对为节点对,直至所述源网络中的所有节点均比对完成,将所有节点对组合为一个个体;随机生成源网络节点序列,按照序列中源网络节点出现的顺序,选择与该节点相似性得分最高的目标网络节点比对为节点对,直至源网络节点序列都比对完成,生成个体,重复随机比对的步骤,生成其余个体,将所有个体组合为初始种群;
迭代优化模块,用于利用蝙蝠算法对所述初始种群进行全局搜索和局部搜索生成新的个体,重复全局搜索和局部搜索的步骤迭代优化种群,直至达到预设迭代次数,输出目标种群;
选取模块,用于计算所述目标种群中所有个体的目标函数值,选取所述目标函数值最大的个体作为所述源网络和所述目标网络的比对结果;所述目标函数值的计算方法如公式:SS(A)=CE(A)+PS(A)
其中,A即一个比对结果,
即比对结果中保守边数目,即源网络中的边在目标网络中也有映射边的数目,其中f(ui)表示节点ui在比对结果中的匹配节点,f(uj)表示节点uj在比对结果中的匹配节点;PS(A)即保守节点的序列相似性得分 。
5.一种全局生物网络比对的设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至3任一项所述一种全局生物网络比对方法的步骤。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至3任一项所述一种全局生物网络比对方法的步骤。