1.一种基于种群熵的阶段性蛋白质结构预测方法,其特征在于:所述蛋白质结构预测方法包括以下步骤:
1)输入预测蛋白质的序列信息;
2)设置参数:种群规模NP,最大迭代次数G1、G2,交叉概率CR,聚类数K;
3)种群初始化:迭代Rosetta协议第一、二阶段,产生具有NP个个体的种群P={P1,P2,...,PNP};
4)探索阶段,过程如下:
4.1)设g1=1,其中g1∈{1,2,...,G1};
4.2)设n1=1,其中n1∈{1,2,...,NP};
4.3)令 表示种群P中的第n1个个体;
4.4)变异操作,过程如下:
4.4.1)从种群P中随机选择两个互异且不同于 的个体Pselect1、Pselect2;
4.4.2)在[0,L-9]内生成均匀随机整数rand1和rand2,其中L表示氨基酸序列长度;
4.4.3)将Ptarget的第rand1至rand1+8号残基的二面角值替换成Pselect1对应残基号的二面角值,将Ptarget的第rand2至rand2+8号残基的二面角值替换成Pselect2对应残基号的二面角值;
4.5)生成均匀随机小数rand3,rand3∈[0,1];若CR<rand3,转至步骤4.6);
否则,执行交叉操作,过程如下:
4.5.1)在[0,L-9]内生成均匀随机整数rand4;
4.5.2)将Ptarget的第rand4至rand4+8号残基的二面角值替换成 对应残基号的二面角值;
target trial
4.6)利用Rosetta协议第三阶段对P 执行局部搜索操作,生成构象P ;
4.7)选择操作,过程如下:
4.7.1)计算Ptrial与种群P中除 外的每一个个体之间的均方根偏差RMSD,并选出与Ptrial的RMSD最小的个体Pselect;
4.7.2)用Rosetta score5能量函数计算Ptrial和Pselect的能量,并根据Metropolis准则决定是否用Ptrial替换种群P中的个体Pselect;
4.8)n1=n1+1;若n1≤NP,转至步骤4.3);
4.9)g1=g1+1;若g1≤G1,转至步骤4.2);否则结束探索阶段;
5)利用PAM聚类方法对种群P进行聚类,过程如下:
5.1)计算种群P中任意两个个体的RMSD,得到相异度矩阵D(NP×NP),Dmn表示种群中第m个个体与第n个个体的RMSD,其中m和n均∈{1,2,...,NP};
5.2)根据相异度矩阵D(NP×NP),利用PAM聚类方法对种群进行聚类,得到K个聚类中心以及每个类所包含的个体;
6)增强阶段,过程如下:
6.1)令
6.2)设g2=1,其中g2∈{1,2,...,G2};
6.3)设n2=1,其中n2∈{1,2,...,NP};
6.4)令 表示种群Pnew中的第n2个个体;
6.5)变异操作,过程如下:
6.5.1)若g2=1,执行步骤6.5.2);否则,转至步骤6.5.3);
6.5.2)第一代变异操作,过程如下:
6.5.2.1)从种群Pnew中随机选择两个互异且不同于 的个体
6.5.2.2)在[0,L-3]内生成均匀随机整数rand5和rand6,其中L表示氨基酸序列长度;
6.5.2.3)将Ptarget的第rand5至rand5+2号残基的二面角值替换成 对应残基号的二面角值,将Ptarget的第rand6至rand6+2号残基的二面角值替换成 对应残基号的二面角值;
6.5.2.4)转至步骤6.6);
6.5.3)生成均匀随机小数rand7,rand7∈[0,1];若在步骤6.11)中计算的相邻两代种群间的熵值E≥rand7,执行步骤6.5.4);否则,执行步骤6.5.5);
6.5.4)利用熵值E指导变异操作,过程如下:
6.5.4.1)从种群Pnew中选出能量最低的两个个体target
6.5.4.2)在[0,L-3]内生成均匀随机整数rand8和rand9,其中L表示构象P 的残基数;
6.5.4.3)将Ptarget的第rand8至rand8+2号残基的二面角值替换成 对应残基号的二面角值,将Ptarget的第rand9至rand9+2号残基的二面角值替换成 对应残基号的二面角值;
6.5.5)无熵值E指导的变异操作,过程与步骤6.5.2)相同;
6.6)生成均匀随机小数rand10,rand10∈[0,1];若CR<rand10,转至步骤6.7);否则,执行交叉操作,过程如下:
6.6.1)在[0,L-3]内生成均匀随机整数rand11;
6.6.2)将Ptarget的第rand11至rand11+2号残基的二面角值替换成 对应残基号的二面角值;
6.7)利用Rosetta协议第四阶段对Ptarget执行局部搜索操作,生成构象Ptrial;
6.8)用Rosetta score3能量函数计算Ptrial和 的能量;根据Metropolis准则决定是否用Ptrial替换种群Pnew中的个体
6.9)n2=n2+1;若n2≤NP,转至步骤6.4);
6.10)保持K个聚类中心不变,重新划分聚类,过程如下:
6.10.1)设n=1,其中n∈{1,2,...,NP};
6.10.2)计算种群Pnew中第n个个体 与K个聚类中心的RMSD,将 划分到与其RMSD最小的聚类中心所在的类;
6.10.3)n=n+1;若n≤NP,转至步骤6.10.2);
6.11)计算相邻两代种群间的熵值,过程如下:
6.11.1)根据相邻两代种群P和Pnew的K个类中个体的相互转移确定转移矩阵T(K×K),Tij表示上一代种群P的第i个类中的个体在新一代种群Pnew转移到第j个类的概率,其中i和j均∈{1,2,...,K};
6.11.2)根据公式 计算熵值;
6.12)P=Pnew;
6.13)g2=g2+1;若g2≤G2,转至步骤6.3);否则结束增强阶段;
7)根据Rosetta聚类算法对种群P中的个体聚类,选出最大类的类心构象作为最终预测结果。