1.一种基于简约抽象凸估计的蛋白质构象空间优化方法,其特征在于:所述优化方法包括以下步骤:
1)输入待测蛋白质的序列信息;
2)根据序列信息从ROBETTA服务器上得到片段库;
3)参数设置:设置种群规模NP,交叉概率CR,片段长度S,最大迭代次数Gmax,学习代数Glen,斜率控制因子M,并初始化迭代次数g=0;
4)种群初始化:对各残基位对应的片段进行随机组装生成初始种群P={C1,C2,...,CNP},Ci,i={1,2,…,NP}为种群P中的第i个构象个体;
5)对种群中的每个构象Ci,i∈{1,2,…,NP}作如下处理:
5.1)从当前种群中随机选取四个互不相同的构象个体Ca、Cb、Cc和Cd,其中a≠b≠c≠d≠i;
5.2)根据Rosetta score3能量函数计算Ca、Cb、Cc和Cd的能量,并选出一个能量最低的构象记作Clbest;
5.3)分别从除了Clbest以外的其它三个构象中随机选取一个位置互不相同的片段替换构象Clbest对应位置的片段得到变异构象Cmutant;
5.4)随机生成一个0和1之间的随机小数R,如果R
5.5)以所有Cα原子坐标表示每个构象的位置,计算当前种群中每个构象个体与测试构象Ctrial之间的欧氏距离,选出与测试构象最近的构象个体Cnb;
5.6)计算测试构象Cnb的抽象凸下界估计支撑向量l:其中,E(Cnb)为根据Rosetta score能量函数计算得到的构象Cnb的能量,为构象Cnb位置坐标的第t维元素, 为松弛变量,M为斜率控制因子;
t
5.7)计算测试构象Ctrial的能量下界估计值 其中l为支撑向量l的第t维元素, 为测试构象Ctrial位置坐标的第t维元素;
5.8)根据Rosetta score3能量函数计算构象Ci能量值E(Ci);
5.9)如果g
5.9.1)根据Rosetta score3能量函数计算测试构象Ctrial的能量值E(Ctrial);
5.9.2)计算构象Ci的个体斜率控制因子Ki:
5.9.3)如果Ki>M,则M=Ki;
5.9.4)如果E(Ctrial)>E(Ci),则测试构象Ctrial替换构象Ci,否则构象Ci保持不变;
5.10)如果g≥Glen,则进行如下操作:
5.10.1)如果 则构象Ci保持不变,否则进行步骤5.10.2);
5.10.2)根据Rosetta score3能量函数计算测试构象Ctrial的能量值E(Ctrial),并根据步骤5.9.4)选择构象;
6)g=g+1,如果g>Gmax,则输出能量最低的构象作为最终预测结构,否则返回步骤5)。