1.一种基于特定片段交叉的蛋白质结构预测方法,其特征在于:所述包括以下步骤:
1)输入查询序列,利用Psipred预测查询序列的二级结构信息;
2)设置种群规模NP、最大迭代次数G、交叉概率CR、设置变异失败次数M,允许最大变异次数N,玻尔兹曼温度因子KT,输入片段库,预测的二级结构信息,迭代次数g=0;
3)对种群所有构象进行初始化,对种群中每个构象进行片段组装,直到构象的每个残基二面角至少被替换过一次;
4)构象交叉,操作如下:
4.1)选第i,i∈[1,NP]个构象Ci为目标构象,产生一个随机数r,r∈[0,1],如果r小于CR,则跳到4.2),否则跳至步骤5);
4.2)随机选择一个构象Cj,j≠i,利用计算二级结构算法DSSP获取构象Ci的二级结构信息;
4.3)根据Ci残基位置随机选择一个交叉点p,判断交叉点p对应的残基被预测的二级结构的类型;
4.4)针对Ci和Cj,从交叉点p开始依次互换二面角对直到从交叉点p起预测的二级结构类型和交叉点p处对应的二级结构类型不同为止,产生一个构象C′i,并用Rosetta能量函数“score3”计算其能量值;
5)构象变异,对构象C′i变异过程如下:
5.1)对构象C′i进行9残基片段组装,生成构象C″i,并用Rosetta能量函数“score3”计算其能量值,若变异后的能量值比变异前能量值变小,则接收变异构象C″i,若能量值变大,则以Boltzmann概率 接收变异后个体C″i,其中ΔE为个体C″i和C′i的能量差值;
5.2)如果拒绝接收变异后的构象C″i,则变异失败次数T加一;
5.3)如果M等于允许最大变异次数N,则直接接收变异后的构象C″i,否则返回步骤5.1);
6)基于按比例的适应度分配方法进行选择,过程如下:
6.1)对构象C″i求适应度值
其中L是查询序列长度, 是查询序列query第l个残基预测的二级结构, 分别是测试构象第l个残基的二级结构,其值由DSSP求得;
6.2)对种群中每个构象Ci,求适应度值
6.3)计算构象C″i被选择的概率Pi:
6.4)产生一个随机数r′,r′∈[0,1],如果r′小于Pi,则用构象C″i替换构象Ci实现种群更新,否则保持种群不变;
7)g=g+1,判断是否达到最大迭代次数G,若不满足条件终止条件,则遍历种群执行步骤4),否则输出最后预测结果。