1.一种基于残基接触信息的群体蛋白质结构预测方法,其特征在于:所述预测方法包括以下步骤:
1)给定目标蛋白的序列信息;
2)根据目标蛋白序列从ROBETTA服务器上得到片段库文件,其中包括3片段库文件和9片段库文件;
3)根据目标蛋白序列,利用RaptorX‑Contact服务器预测得到目标蛋白序列的残基‑残基接触置信度;
4)设置参数:种群大小NP,算法的迭代次数G,交叉因子CR,温度因子β,置迭代代数g=
0;
5)种群初始化:随机片段组装生成NP个初始构象Ci,i={1,2,…,NP};
6)将种群中的每个构象个体Ci,i∈{1,2,3,…,NP}看作目标构象个体 执行以下操作生成变异构象
6.1)在1到NP范围内随机生成正整数n1,n2,n3,且n1≠n2≠n3≠i;
6.2)在构象Cn1位置上随机选取一个9片段替换构象Cn3的相同位置所对应的片段,再从构象Cn2位置上随机的选取一个与构象Cn1选取位置不相同的9片段替换构象Cn3的相同位置所对应的片段,然后用对构象Cn3进行片段组装生成变异构象个体
7)对每个变异构象 i∈{1,2,3,…,NP}执行交叉操作生成测试构象
7.1)生成随机数rand1和随机正整数rand2,其中rand1∈(0,1),rand2∈(1,L),其中L为序列长度;
7.2)若随机数rand1≤CR,变异构象 的片段rand2替换为目标构象 中对应位置的片段,否则变异构象 不变;
8)对每个目标构象 和测试构象 进行选择操作;
8.1)用Rosetta score3能量函数分别计算 和 的能量: 和
8.2)若 则构象 替换构象 且转到步骤9),否则继续执行步骤8.3);
8.3)分别计算目标构象 和测试构象 中每个残基对的残基接触能量E(m,n):其中,E(m,n)表示残基m和残基n之间的接触能量,权重 Smn是残基m和残基n具有接触的置信度;dmn为残基m和残基n之间的Cα原子距离;
8.4)根据公式(2)分别计算构象 和 的残基接触总能量 和
8.5)若 大于 则构象 替换构象 并转到步骤9),否则进行步骤8.6);
8.6)计算目标构象和测试构象的残基接触能量差 按照概率以蒙特卡洛准则接受构象 并转到步骤9),其中β为温度因子;
9)g=g+1,迭代运行步骤6)~8),至g>G为止;
10)输出结果。