1.一种基于多残基接触图协同约束的蛋白质结构预测方法,其特征在于:所述方法包括以下步骤:
1)给定目标蛋白的序列信息;
2)根据目标蛋白序列从ROBETTA服务器上得到片段库文件,其中包括3片段库文件和9片段库文件;
3)根据目标蛋白序列,利用RaptorX‑Contact服务器、ResPRE服务器、DeepMetaPSICOV服务器、NeBcon服务器得到四张contactmap,分别为contactRaptorX、contactResPRE、contactDeepMetaPSICOV和contactNeBcon;
4)设置参数:种群大小NP,算法的迭代次数G,交叉因子CR,置迭代代数g=0;
5)种群初始化:随机片段组装生成NP个初始构象Ci,i={1,2,…,NP};
6)将种群中的构象个体Ci,i∈{1,2,3,…,NP}看作目标构象个体 对每个 执行以下操作生成变异构象
6.1)在1到NP范围内随机生成正整数n1,n2,n3,且n1≠n2≠n3≠i;
6.2)在构象Cn1位置上随机选取一个9片段替换构象Cn3的相同位置所对应的片段,再从构象Cn2位置上随机的选取一个与构象Cn1选取位置不相同的9片段替换构象Cn3的相同位置所对应的片段,然后对构象Cn3进行3片段组装生成变异构象个体
7)对变异构象 i∈{1,2,3,…,NP}执行交叉操作生成测试构象
7.1)生成随机数rand1,其中rand1∈(0,1);
7.2)若随机数rand1≤CR,则从目标构象 中随机选择一个3片段替换到变异构象的相应位置,否则变异构象 不变;
8)对每个目标构象 和测试构象 进行选择操作;
8.1)用Rosetta score3能量函数分别计算 和 的能量: 和
8.2)若 则构象 被拒绝,否则继续执行步骤8.3);
8.3)首先,把 和 的L×L二维contactmap分别转化为长度为L×L的一维向量和 把c on ta ct Ra p to rX 、contactResPRE、contactDeepMetaPSICOV和contactNeBcon转化为4个长度为L×L的一维向量
和 其中L为蛋白质序列的
长度;然后分别计算 和 与 余弦相似度并求和得到 和 计算方法如下:
8.4)若 则构象 替换构象 且转到步骤9);
9)g=g+1,迭代运行步骤6)~8),至g>G为止;
10)输出结果。