1.一种基于动态片段长度的群体蛋白质结构预测方法,其特征在于:所述方法包括以下步骤:
1)输入待测蛋白质的序列信息,并从ROBETTA服务器上得到片段库;
2)参数设置:设置种群规模NP,交叉概率CR,温度因子KT,最大迭代次数Gmax,片段长度集l={l1,l2,...,lM},每个片段长度的选择概率pm,m=1,2,...,M,并初始化迭代次数g=
0,其中M为片段长度集的规模;
3)从各残基位对应的片段库中随机选择片段组装生成初始构象种群Pinitial={C1,C2,...,CNP},其中,Ci,i={1,2,…,NP}为种群P中的第i个构象个体;
4)根据Rosetta Score3计算当前种群中每个构象个体的能量值;
5)对种群中的每个构象Ci,i∈{1,2,…,NP}执行如下操作:
5.1)将构象Ci看作目标构象,从当前种群中随机选出NP/2个构象组建子种群,然后根据能量从低到高对该子种群进行排序;
5.2)从排序后的子种群的前NP/5个构象中,随机选择一个与Ci不同的构象,记作Clbest;
5.3)从当前种群中随机选择三个互不相同且与Ci和Clbest均不同的构象Ca、Cb和Cc;
5.4)利用轮盘赌算法,根据每个片段长度的选择概率,从片段长度集中选取一个片段长度lm;
5.5)分别从Ca、Cb和Cc中随机选择一个残基位不同的长度为lm的片段替换构象Clbest中对应位置的片段,生成变异构象Cmutant;
5.6)随机生成一个0和1之间的小数R,如果R
5.7)根据Rosetta score3能量函数计算测试构象Ctrial的能量值;
5.8)如果Ctrial的能量值小于Ci的能量值,则Ctrial替换Ci;否则根据玻尔兹曼概率接受Ctrial,其中ΔE为Ctrial的能量值与Ci的能量值误差的绝对值;
5.9)如果Ctrial在步骤5.8)中被接受,则第m个片段长度在第g代中的成功次数
6)g=g+1,如果g>20,则根据公式(1)更新每个片段长度的选择概率pm,m=1,2,...,M;
7)如果g>Gmax,则输出能量最低的构象作为最终预测结构,否则返回步骤5)。