1.一种群体爬山迭代蛋白质构象空间优化方法,其特征在于:所述构象空间优化方法包括以下步骤:
1)输入目标蛋白质的序列信息;
2)设置参数:种群规模NP,迭代次数Gmax,交叉迭代次数HC,变异迭代次HM;
3)种群初始化:迭代Rosetta协议第一、二、三、四阶段,产生具有NP个个体的种群P={P1,P2,...,PNP};
4)迭代爬山搜索,过程如下:
4.1)设g=1,其中g∈{1,2,...,Gmax};
4.2)从种群P中随机选择两个个体P1,P2,并选择P1,P2中Rosetta score3能量最低的个体作为交叉阶段最优个体Pcbest;
4.3)迭代交叉阶段,过程如下:
4.3.1)设hc=1,其中hc∈{1,2,...,HC};
4.3.2)生成均匀随机整数rand1,rand1∈[1,L],其中L表示目标蛋白质的序列的长度;
4.3.3)以第rand1号残基为交叉点,交换P1,P2交叉点前后的结构,生成交叉后的个体Pc1,Pc2,并选择Pc1,Pc2中Rosetta score3能量最低的个体作为测试个体Pctrial;
4.3.4)根据Metropolis准则决定个体Pctrial是否替换Pcbest,过程如下:
4.3.4.1)用Rosetta score3能量函数计算Pcbest和Pctrial的能量 和 令
4.3.4.2)按如下公式计算替换概率p,其中KT为温度参数,默认设置为2;
4.3.4.3)生成随机均匀小数rand2,rand2∈[0,1];
4.3.4.4)若rand2≤p,用Pctrial替换Pcbest;否则,保持Pcbest不变;
4.3.5)hc=hc+1;
4.3.6)若hc≤HC,转至步骤4.3.2);否则,结束迭代交叉阶段,进入迭代变异阶段;
4.4)迭代变异阶段,过程如下:
4.4.1)令 其中 和 分别表示变异阶段的最优个体和目标个体;
4.4.2)设hm=1,其中hm∈{1,2,...,HM};
4.4.3)对 的每一个片段窗口执行变异操作,选出最优的变异个体,过程如下:
4.4.3.1)设片段窗口号hw=1,其中hw∈{1,2,...,L-2},L表示预测蛋白质的序列的长度;
4.4.3.2)从第hw号窗口对应的片段库中随机选择一个片段,用该片段替换第hw号窗口的片段,生成变异个体
4.4.3.3)根据Metropolis准则决定是否用个体 替换
4.4.3.4)hw=hw+1;
4.4.3.5)若hw≤L-2,转至步骤4.4.3.2);否则,转至步骤4.4.4);
4.4.4)若在步骤4.4.3)中 被成功替换过,则令
4.4.5)hm=hm+1;
4.4.6)若hm≤HM,转至步骤4.4.3);否则,结束迭代变异阶段,进入选择阶段;
4.5)选择阶段,过程如下:
4.5.1)根据Rosetta score3能量函数从种群P中选择能量最高的两个个体
4.5.2)分别用Pcbest和 替换 和
4.6)g=g+1;
4.7)若g≤Gmax,转至步骤4.2);否则,结束迭代爬山搜索;
5)根据Rosetta聚类算法对种群P中的个体聚类,选出最大类的类心构象个体作为最终预测结果。