1.一种基于Rosetta局部增强的群体蛋白质结构预测方法,其特征在于:所述蛋白质结构预测方法包括以下步骤:
1)输入待测蛋白质的氨基酸序列信息;
2)初始化:设置种群规模NP,交叉概率CR,策略选择因子CS,多样性接受概率RS,Rosetta轨迹长度T,片段长度L1,L2;
3)根据序列信息以片段长度L1进行随机片段组装生成初始构象种群P={C1,C2,...,CNP},其中,Ci的表示当前种群中的第i个构象个体,并根据能量函数Rosetta Score0计算各构象个体的能量,同时初始化迭代次数G=0;4)采用能量函数Rosetta Score0评价构象的质量,以片段长度L1对初始种群中的每个构象个体执行轨迹长度为T的Rosetta局部增强,并计算每个构象的特征向量;
5)对步骤4)中增强后的每个构象个体Ci,i∈{1,2,…,NP}作如下处理:
5.1)设置能量函数和片段长度:
5.1.1)如果当前迭代次数0<G≤Gmax/3,则片段长度l=L1,且选用能量函数Rosetta Score1;
5.1.2)如果当前迭代次数Gmax/3<G≤2Gmax/3,则片段长度l=L1,且选用能量函数Rosetta Score2;
5.1.3)如果当前迭代次数G>2Gmax/3,则片段长度l=L2,且选用能量函数Rosetta Score3
5.2)如果当前迭代次数G为Gmax/3的整数倍,则对以片段长度l对构象个体Ci执行轨迹长度为T的Rosetta局部增强,并根据步骤5.1)中设置的能量函数进行评价;
5.3)计算目标构象Ci的特征向量,以及Ci与当前种群中其他构象之间的特征向量欧氏距离,并以最小距离为Ci的多样性值Di;
5.4)根据序列信息,利用DSSP得到待测蛋白的loop区域,并随机生成一个0到1之间的随机数p;
5.5)如果p
5.6)如果p≥1-CS,则选出当前能量值最低的构象个体Cbest,并从当前种群中选取两个互不相同的构象个体Ca和Cb,其中,a≠b≠i,a,b∈[1,NP],从构象个体Ca和Cb中各随机选取一个片段替换Cbest中对应位置的片段,并从Cbest中随机选取一个不包含loop区域的窗口进行片段组装生成变异构象Cmutant;
5.7)随机生成一个0与1之间随机数p′,如果p′>CR,则随机选取一个loop区域,替换目i mutant trial trial标构象个体C与变异构象个体C 在该区域的二面角,从而生成测试构象C ,否则C直接等于变异构象Cmutant;以片段长度l对测试构象个体Ctrial执行轨迹长度为T的Rosetta局部增强;
5.8)计算增强后测试构象的特征向量,并计算测试构象的特征向量与当前种群中各构trial象个体的特征向量之间的距离,以最小距离为测试构象的多样性值D ;
5.9)计算测试构象Ctrial的能量函数值Etrial,并进行如下操作:
5.9.1)如果Etrial小于当前目标构象个体Ci的能量函数值Ei,则测试构象Ctrial替换目标构象Ci;
5.9.2)如果Etrial大于当前目标构象个体Ci的能量函数值Ei,且测试构象的多样性值Dtrial大于目标构象的多样性值Di,则随机生成一个0与1之间随机数,如果p″>RS,则测试构象Ctrial替换目标构象Ci;
6)判断是否满足终止条件,若满足则输出结果并退出,否则返回步骤5)。
2.如权利要求1所述的一种基于Rosetta局部增强的群体蛋白质结构预测方法,其特征在于:所述步骤2)中,设置最大迭代次数Gmax,所述步骤6)中,对种群中的每个构象个体都执行完步骤5)以后,迭代次数G=G+1,终止条件为迭代次数G达到最大迭代次数Gmax。