1.一种基于残基间接触约束的蛋白质结构预测方法,其特征在于:所述方法包括以下步骤:
1)输入查询序列,并利用RaptorX-Contact预测查询序列的残基间距离接触信息;
2)设置初始种群规模NP、最大迭代次数Gen、交叉概率CR、片段组装次数N,输入查询序列、片段库、残基间接触信息,迭代次数g=0;
3)采用禁忌搜索的方法初始化种群,对种群中每个构象Ci做以下操作,其中i∈[1,NP]是种群中构象索引值,过程如下:
3.1)对构象Ci进行N次片段组装,并且记录片段组装时所用的片段;
3.2)设置构象Ci片段组装时所用的片段对Cj为禁忌采样片段,其中j∈[1,NP]且j≠i;
4)构象交叉,操作如下:
4.1)选第i个构象Ci为目标构象,产生一个随机数r,r∈[0,1],如果r小于CR,则跳到
4.2),否则跳至步骤5);
4.2)随机选择一个构象Cj,j≠i,利用计算二级结构算法DSSP获取构象Ci的二级结构信息;
4.3)根据Ci残基位置随机选择一个交叉点p,判断交叉点p对应的残基的二级结构类型S,S∈{H,E,L},H、E和L分别代表螺旋、片层、无规则折叠;
4.4)针对Ci和Cj,从交叉点p开始依次互换二面角对直到另一个交叉点处残基的二级结构S′≠S,S′∈{H,E,L},产生一个新构象C′i;
5)构象变异,对构象C′i和C′j,变异过程如下:
5.1)对构象C′i和C′j进行9残基片段组装,生成两个构象C″i和C″j;
5.2)分别对构象C″i和C″j求残基间距离约束分值Eco:其中N是残基接触总数, 是查询序列query第k个残基对p和q被预测为有接触的置信度, 是测试构象k个残基对p和q的真实距离,dcon是预测为接触的阈值,
5.3)从构象C″i和C″j中选择残基间距离约束分值E′co最高的构象作为变异成功构象;
6)基于残基间距离约束进行选择,过程如下:
6.1)对种群中的每个构象求残基间距离约束分值Eco,并求出最小的残基间距离约束分值E″co;
6.2)如果E′co大于E″co,则用E′co对应得构象替换E″co对应得构象实现种群更新,否则种群保持不变;
7)g=g+1,判断是否达到最大迭代次数Gen,若不满足条件终止条件,则遍历种群执行步骤4),否则输出最后预测结果。