1.一种全局和局部下界估计协同的群体蛋白质结构预测方法,其特征在于:所述方法包括以下步骤:
1)输入待测蛋白质的序列信息,并从ROBETTA服务器上得到片段库;
2)参数设置:设置种群规模NP,交叉概率CR,片段长度l,温度因子KT,全局斜率控制因子M,局部斜率控制因子M′,邻近个体的数量N,最大迭代次数Gmax,并初始化迭代次数g=0;
3)从各残基位对应的片段库中随机选择片段组装生成初始构象种群P={C1,C2,...,CNP},其中,Ci,i={1,2,…,NP}为种群P中的第i个构象个体;
4)根据Rosetta socre3能量函数计算当前种群中每个构象的能量值;
5)根据每个构象Ci,i∈{1,2,…,NP}的碳α原子坐标表示其空间位置坐标并计算每个构象Ci的支撑向量li:
其中,E(Ci)为构象Ci的能量, 为构象Ci位置坐标的第t维元素,为松弛变量,M为斜率控制因子;
6)对种群中的每个构象Ci,i∈{1,2,…,NP}执行如下操作:
6.1)将构象Ci看作目标构象,根据空间位置坐标计算Ci与其它NP-1个构象之间的欧氏距离;
6.2)选出与目标构象距离最近的N个构象,从这N个邻近构象中随机选取两个不同的构象Ca和Cb,并从其余NP-N-1个构象中随机选取一个与Ci不同的构象Cc;
6.3)分别从Ca和Cb中随机选择一个残基位不同的长度为l的片段替换构象Cc中对应位置的片段,生成变异构象Cmutant;
6.4)随机生成一个0和1之间的小数R,如果R
6.5)根据Ctrial的空间位置坐标计算它与种群中所有构象之间的欧氏距离,并选出与其最近的构象Cnb;
6.6)计算构象Cnb的抽象凸下界估计支撑向量l:其中,E(Cnb)为构象Cnb的能量, 为构象Cnb空间位置坐标的第t维元素,为松弛变量;
6.7)计算测试构象Ctrial的能量局部下界估计值 其中为支撑向量lnb的第t维元素, 为测试构象Ctrial位置坐标的第t维元素;
6.8)计算测试构象Ctrial的能量全局下界估计值 其中 为支撑向量li的第t维元素;
6.9)计算构象Ctrial的能量下界估计值
6.10)如果U(Ctrial)>E(Ci),则构象Ci保持不变,其中E(Ci)为目标构象的能量值;
6.11)如果U(Ctrial)≤E(Ci),根据Rosetta score3能量函数计算测试构象Ctrial的能量值E(Ctrial);如果E(Ctrial)
7)g=g+1,如果g>Gmax,则输出能量最低的构象作为最终预测结构,否则返回步骤5)。