1.一种下界估计策略自适应蛋白质结构预测方法,其特征在于:所述方法包括以下步骤:
1)给定目标蛋白的序列信息;
2)根据目标蛋白序列从ROBETTA服务器上得到片段库文件,其中包括3片段库文件和9片段库文件;
3)设置参数:种群大小NP,算法的最大迭代代数G,交叉因子CR,温度因子β,学习周期LP,第一种变异策略被选择的概率 第二种变异策略被选择的概率 第三种变异策略被选择的概率 第四种变异策略被选择的概率 g表示当前的代数,策略数量k,第g代第k种策略成功次数 置迭代代数g=0,斜率控制因子M;
4)种群初始化:随机片段组装生成NP个初始构象Ci,i={1,2,…,NP};
5)将每个构象Ci,i={1,2,…,NP}的每个碳α原子的三维坐标组合成该构象的位置坐标代表第i个构象的第一个碳α原子的三维坐标,L为蛋白质序列长度;
6)对种群中的每个个体Ci进行如下操作:
6.1)将Ci设为目标个体 生成随机数pSelect,其中pSelect∈(0,1);
6.2)若 则从种群中随机选出三个互不相同的个体Ca、Cb和Cc,分别从Cb、Cc中随机选择一个位置不同的3片段,分别替换Ca对应位置的片段生成变异构象Cmutant,并把k置为1;
6.3)若 则先从种群中选择一个能量最低的个体Cbest,再从种群中随机选出两个互不相同的个体Ca、Cb, 分别从Ca、Cb和Cbest中随机选择一个位置不同的3片段,分别替换 对应位置的片段生成变异构象Cmutant,并把k置为2;
6.4)若 则从种群中随机选出四个互不相同的个体Ca、Cb、Cc和Cd, 分别从Cb、Cc、Cd中随机选择一个位置不同的3片段,分别替换Ca对应位置的片段生成变异构象Cmutant,并把k置为3;
6.5)若 则从种群中随机选出两个互不相同的个体Ca和Cb,分别从Ca、Cb中随机选择一个位置不同的3片段,分别替换 对应的位置片段生成变异构象Cmutant,并把k置为4;
6.6)对Cmutant进行一次片段组装生成新构象Cmutant′;
6.7)生成随机数pCR,其中pCR∈(0,1),若pCR<CR,则从 中随机选择一个3片段,替换到Cmutant′对应的位置的片段生成测试构象Ctrial,否则直接把Cmutant′记为Ctrial;
6.8)从种群中找出距离Ctrial最近的个体Cnear,将对应构象每个碳α原子的三维坐标组合成该构象的位置坐标,则Ctrial和Cnear的位置坐标分别为
6.9)若g=0,则用Rosetta score3能量函数计算Ctrial、Cnear的能量score3(Ctrial)、score3(Cnear),用公式(1)、(2)计算M和Mi,Mi表示由第i个构象计算出的斜率控制因子,分别是Xnear、Xtrial第j维坐标;
6.10)如果 则Ctrial替换 否则按照概率以蒙特卡洛准则接收构象,若接收构象,则
6.11)若g>0,用公式(3)计算Ctrial的下界估计UEtrial;
如果 则Ctrial被拒绝,否则由公式(1)、(2)计算M,并且如果则Ctrial替换 否则按照概率
以蒙特卡洛准则接收构象,若接收构象,则
7)当g>0时,由公式(4)计算参数Mg,Mg表示第g代的M, 表示第g代计算出的Mg集合里第i个常量M,n为集合的大小,操作如下:如果Mg
8)当g>LP时,根据公式(5)更新变异策略选择的概率 c是一个很小的常数:
9)g=g+1,迭代运行步骤5)~9),至g>G为止;
10)输出能量最低的构象为最终结果。