1.一种基于特定距离约束的蛋白质结构预测方法,其特征在于:所述方法包括以下步骤:
1)输入查询序列,利用MetaPSICOV预测查询序列的残基间距离接触信息,利用Robetta构建查询序列的片段库;
2)根据两个残基间属于接触的置信度,对预测的残基间距离接触信息按从大到小排序,选前K个残基间距离接触,其中K是查询序列长度;
3)设置初始种群规模NP、最大迭代次数Gen、交叉概率CR、片段组装次数M,输入查询序列、片段库、残基间接触信息和迭代次数g=0;
4)初始化种群,对种群中每个构象Ci进行M 次片段组装,其中i∈[1,NP]是种群中构象索引值;
5)构象交叉,操作如下:
5.1)选择第i个构象Ci为目标构象,产生一个随机数r,r∈[0,1],如果r小于CR,则继续步骤5.2),否则随机选择种群中两个构象作为构象C′i和C′j,跳至步骤6);
5.2)随机选择一个构象Cj,j≠i,利用计算二级结构算法DSSP获取构象Ci的二级结构信息;
5.3)根据Ci残基位置随机选择一个交叉点p,判断交叉点p对应的残基的二级结构类型S,S∈{H,E,L},H、E和L分别代表螺旋、片层、无规则折叠;
5.4)针对Ci和Cj,从交叉点p开始依次互换二面角对直到另一个交叉点处残基的二级结构S′≠S,S′∈{H,E,L},产生两个新构象C′i和C′j;
6)构象变异,对构象C′i和C′j,变异过程如下:
6.1)对构象C′i和C′j进行9残基片段组装,生成两个构象C″i和C″j;
6.2)分别对构象C″i和C″j求残基间距离约束分值Eco:其中N是残基接触总数, 是查询序列中第k个残基对p和q被预测为有接触的置信度,是测试构象的第k个残基对p和q之间的碳β距离,dcon是预测为接触的阈值,
6.3)从构象C″i和C″j中选择残基间距离约束分值E′co最高的构象作为变异成功构象;
7)基于特定距离约束进行选择,过程如下:
7.1)对种群中的每个构象求残基间距离约束分值Eco,并求出最小的残基间距离约束分值E″co;
7.2)如果E′co大于E″co,则用E′co对应的构象替换E″co对应的构象实现种群更新,跳到8),否则根据E′co和E″co计算接受概率pcon:其中n是被预测为接触但在实际构象中残基间距离大于 的残基对总数,KTcon为温度因子;
7.3)产生一个随机数r′,r′∈[0,1],如果r′小于pcon,则用E′co对应的构象替换E″co对应的构象实现种群更新;
8)g=g+1,判断是否达到最大迭代次数Gen,若不满足条件终止条件,则遍历种群执行步骤5),否则输出最后预测结果。