1.一种基于二级结构相似性选择策略的蛋白质结构预测方法,其特征在于:所述包括以下步骤:
1)设置种群规模NP、迭代次数G、交叉概率CR、玻尔兹曼温度因子KT,输入查询序列,片段库,预测的二级结构信息,迭代次数g=0;
2)对种群所有构象进行初始化,对种群中每个构象进行片段组装,直到构象的每个残基的二面角至少被替换过一次;
3)构象交叉,操作如下:
3.1)选第i,i∈[1,NP]个构象Ci为目标构象,产生一个随机数r,r∈[0,1],如果r小于CR,则跳到3.2),否则跳至步骤4);
3.2)随机选择一个构象Cj,j≠i,根据Ci残基位置随机选择一个交叉点p,产生一个随机数r′,r′∈[3,9];
3.3)针对构象Ci和Cj,从交叉点p开始互换r′个二面角对,产生两个构象C′i和C′j,并用Rosetta能量函数“score3”分别计算其能量值;
4)构象变异,对构象C′i和C′j,变异过程如下:
4.1)对构象C′i和C′j进行9残基片段组装,生成两个构象C″i和C″j,并用Rosetta能量函数“score3”分别计算其能量值,若变异后的能量值比变异前能量值变小,则接收变异构象C″i和C″j,若能量值变大,则以Boltzmann概率 接收变异后个体C″i和C″j,其中ΔE为片段组装前后构象的能量差值;
4.2)分别对构象Ci、C″i和C″j求二级结构相似性分值Ess:其中L是查询序列长度, 是查询序列query第l个残基预测的二级结构, 是测试构象第l个残基的二级结构,其值由计算二级结构算法DSSP求得;
4.3)从构象Ci、C″i和C″j中选择二级结构相似得分E′ss最高的构象作为变异成功构象;
5)基于二级结构相似性进行选择,过程如下:
5.1)对种群中的每个构象求二级结构相似性分值Ess,并求出最小的二级结构相似性分值E″ss;
5.2)如果E′ss大于E″ss,则用E′ss对应得构象替换E″ss对应得构象实现种群更新;
6)g=g+1,判断是否达到最大得迭代次数G,若不满足条件终止条件,则i+1返回步骤
3),否则输出最后预测结果。