1.一种基于动态抽象凸下界估计的群体蛋白质结构预测方法,其特征在于:所述方法包括以下步骤:
1)输入待测蛋白质的序列信息,并从ROBETTA服务器上得到片段库;
2)参数设置:设置种群规模NP,交叉概率CR,片段长度l,温度因子KT,斜率控制因子M,初始片段组装次数N,最大迭代次数Gmax,并初始化迭代次数g=0;
3)根据输入序列生成二面角φ、ψ、ω分别为‑150°、‑150°、180°的直链,以此直链为起点启动NP条蒙特卡洛轨迹,每条轨迹随机片段组装N次生成一个构象个体,从而生成初始构象种群P={C1,C2,...,CNP},其中,Ci,i={1,2,…,NP}为种群P中的第i个构象个体;
4)根据Rosetta socre3能量函数计算当前种群中每个构象的能量值;
5)根据当前种群中每个构象Ci,i∈{1,2,…,NP}的碳α原子坐标表示其空间位置坐标并计算每个构象Ci的抽象凸下界估计支撑向量li:其中,E(Ci)为构象Ci的能量, 为构象Ci位置坐标的第t维元素,为构象Ci的空间位置坐标的松弛变量;
6)对种群中的每个构象Ci,i∈{1,2,...,NP}执行如下操作:
6.1)将构象Ci看作目标构象,并将整个种群随机分成两个大小相等的子种群;
6.2)分别选出这两个子种群中能量最低的构象,分别记作 和 如果 或与构象Ci相等,则以对应的子种群中能量次低的构象代替;
6.3)从目标构象Ci所属的子种群中随机选取一个与Ci、 和 均不相同的构象Ca;
6.4)分别从 和Ca中随机选择一个残基位不同的长度为l的片段替换构象Ci中对应位置的片段,生成变异构象Cmutant;
6.5)随机生成一个0和1之间的小数R,如果R
6.6)计算测试构象Ctrial的能量下界估计值
6.7)如果 则目标构象Ci保持不变,其中E(Ci)为目标构象的能量值;
6.8)如果 则根据Rosetta score3能量函数计算测试构象Ctrial的能量值E(Ctrial);如果E(Ctrial)
6.9)如果Ctrial成功替换Ci,则根据如下公式计算构象Ctrial的抽象凸下界估计支撑向量ltrial,并用ltrial替换Ci的支持向量li;
其中,E(Ctrial)为构象Ctrial的能量, 为构象Ctrial空间位置坐标的第t维元素, 为Ctrial空间坐标的松弛变量;
7)g=g+1,如果g>Gmax,则输出能量最低的构象作为最终预测结构,否则返回步骤6)。