1.一种基于构象多样性策略的蛋白质三维结构预测方法,其特征在于:所述蛋白质三维结构预测方法包括以下步骤:
1)给定预测蛋白质序列信息;
2)设置系统参数:种群规模N,种群的进化次数Gmax,重组概率pc,变异概率pm;
3)第一阶段,种群初始化:迭代Rosetta协议第一阶段的片段组装,产生具有N个个体的初始种群 令
4)第二、三、四阶段基于相应的Rosetta协议,分别执行步骤5)至步骤9);
5)开始迭代,设g=1,其中种群代数g∈{1,2,...,Gmax};
new new
6)对种群P 中的每一个个体Pi ,其中i∈{1,2,...,N},使用Rosetta协议相应阶段的片段组装进行构象搜索,产生下一代种群P={P1,P2,...,PN},g=g+1;
7)对种群P中的个体执行遗传算子操作和局部搜索,产生新的种群P*,过程如下:
7.1)对种群P中的个体随机两两配对,生成N/2对父本<Pi,Pj>,其中i,j均∈{1,
2,...,N},且i≠j;
7.2)执行重组操作:对每一对父本,生成随机数rand1∈[0,1];当rand1≤pc,随机交换Pi和Pj的一个loop区域的残基二面角值,产生对应的新构象个体Pi′,Pj′,所有父本执行完重组操作后形成新的种群P′;
7.3)执行变异操作:对种群P′中的每一个个体Pi′,其中i∈{1,2,...,N},进行变异,过程如下:
7.3.1)检测个体Pi′的每一个滑动窗口Wik中是否含有二级结构为loop的残基,其中k∈{1,2,...,l-f+1},l表示蛋白质序列的长度,f∈{3,9}表示片段的长度,第二、三阶段f=9,第四阶段f=3;
7.3.2)若Wik中含有二级结构为loop残基:生成随机数rand2∈[0,1];rand2≤pm,执行一次片段插入,对该窗口中的loop残基进行变异;
7.3.3)遍历完所有窗口后,产生新的个体Pi″;
7.3.4)所有个体执行完变异操作后形成新的种群P″;
7.4)执行局部搜索操作:对种群P″中的每一个个体Pi″,其中i∈{1,2,...,N},使用Rosetta协议相应阶段的片段组装进行局部搜索,产生新的个体Pi*;所有个体执行完局部搜索操作后形成新的种群P*;
8)生成候选个体集合 其中M表示集合 中的个体数量;计算每一个候选个体 的能量 和多样性 其中t∈{1,2,...,M};过程如下:
8.1)候选个体的能量 由Rosetta协议相应阶段的能量函数计算;
8.2)候选个体的多样性 其中均方根
误差 表示构象xt和xl的相似程度,l∈{1,2,...,M};Γ=<γ1,γ2,...,γG>表示构象的折叠状态,其中γe表示构象中二级结构元素间的位置关系,e∈{1,2,...G};G=2m(m-1),m表示构象中二级结构元素的个数;
9)从候选个体集合中选择优秀个体进入下一代,过程如下:
9.1)根据构象的能量和多样性对候选个体进行排序;执行M次循环排序,每次循环执行步骤9.2);
9.2)设h=1,其中h∈{1,2,...,M-1},过程如下:
9.2.1)生成随机数rand3∈[0,1];
9.2.2)若 且 交换 和 的位
置,转至步骤9.2.7);否则,执行步骤9.2.3);
9.2.3)若 且 交换 和 的位
置,转至步骤9.2.7);否则,执行步骤9.2.4);
9.2.4)若 且 且rand3≤0.5,交换和 的位置,转至步骤9.2.7);否则,执行步骤9.2.5);
9.2.5)若rand3≤0.5且 交换 和 的位置,转至步骤
9.2.7);否则,执行步骤9.2.6);
9.2.6)若rand3>0.5且 交换 和 的位置,转至步骤
9.2.7);
9.2.7)h=h+1,若h≤M-1,转至9.2.1);否则,结束本次循环;
9.3)执行完M次循环排序后,生成有序的候选个体集合
9.4)选择集合 的前N个个体形成下一代种群Pnew;
9.5)g=g+1,若g≤Gmax,转至步骤7);否则,结束本阶段循环;
10)根据Rosetta协议输出预测结果。