1.一种基于二面角熵值的蛋白质两阶段构象空间优化方法,其特征在于:所述蛋白质两阶段构象空间优化方法包括以下步骤:
1)输入预测蛋白质的序列信息和二级结构信息;
2)设置参数:种群规模NP,探索阶段最大迭代次数 增强阶段最大迭代次数 熵值收敛阈值α;
3)种群初始化:迭代Rosetta协议第一、二阶段,产生具有NP个个体的初始种群init
并令P={P1,P2,...,PNP}=P ;
4)计算种群二面角熵值,过程如下:
4.1)以10°为基准,将二面角范围[‑180°,180°)划分成36个二面角区块;
4.2)统计种群中所有构象的每一个残基的二面角φ和ψ落在每一个块的概率 和其中i表示残基号,i∈{1,2,...,l},l表示蛋白质序列长度,j表示二面角区块,j∈{1,
2,...,36};得到每一个残基二面角的分布概率;
4.3)根据公式 和 求出每一个残基二面角φ和ψ的熵值;
4.4)根据公式 求出种群二面角熵值;
5)探索阶段,过程如下:
5.1)开始迭代,设g1=1,其中迭代次数
5.2)对种群P中的每一个个体执行Rosetta协议第三阶段组装;
5.3)执行步骤4),计算种群二面角熵值
5.4)若g1>20,判断熵值是否收敛,过程如下:
5.4.1)根据公式 其中k∈{1,2,...,20},计算当前代与其前20代的每一个熵值变化;
5.4.2)根据公式εmax=max{ε1,ε2,...,ε20}计算最大熵值变化;
5.4.3)若εmax<α,结束探索阶段,进入步骤6)增强阶段;否则,执行步骤5.5);
5.5)g1=g1+1;
5.6)若 转至步骤5.2)执行下一次迭代;否则,结束探索阶段,进入步骤6)增强阶段;
6)增强阶段,过程如下:
6.1)开始迭代,设g2=1,其中迭代次数
6.2)对种群P中的每一个个体执行Rosetta协议第四阶段组装;
6.3)对种群P中的每一个个体进行局部扰动,过程如下:*
6.3.1)令P=Pn,其中Pn表示种群P中的个体,n∈{1,2,...,NP};
6.3.2)随机选择一个loop区域的残基位置r;
6.3.3)生成随机小数rand1,rand1∈[0,1];
6.3.4)若rand1<0.5,执行步骤6.3.5);否则,执行步骤6.3.6)*
6.3.5)对构象P中的第r个残基的二面角φ进行局部扰动,过程如下:*
6.3.5.1)读取构象P中的第r个残基的二面角φ的值phi;
6.3.5.2)生成随机数rand2,rand2∈[‑5°,5°];
6.3.5.3)phi=phi+rand2;
*
6.3.5.4)将构象P中的第r个残基的二面角φ的值替换为phi;
*
6.3.6)对构象P中的第r个残基的二面角ψ进行局部扰动,过程如下:*
6.3.6.1)读取构象P中的第r个残基的二面角ψ的值psi;
6.3.6.2)生成随机数rand3,rand3∈[‑5°,5°];
6.3.6.3)psi=psi+rand3;
*
6.3.6.4)将构象P中的第r个残基的二面角ψ的值替换为psi;
*
6.3.7)若P中扰动的二面角与Pn中对应的二面角落在同一个二面角区块,执行步骤
6.3.8);否则,执行步骤6.3.9)*
6.3.8)用Rosetta score3能量函数计算P和Pn的能量;根据Metropolis准则决定是否*
用P替换Pn,即决定是否接受对构象Pn的局部扰动;
6.3.9)根据二面角能量指导构象更新,过程如下:*
6.3.9.1)根据探索阶段最后一代的残基二面角分布概率,确定P中扰动的二面角及Pn*
中对应的二面角所在二面角区块的分布概率p和pn;
* *
6.3.9.2)根据公式e=‑ln(p)和en=‑ln(pn)计算二面角能量;
*
6.3.9.3)根据Metropolis准则决定是否用P 替换Pn,即决定是否接受对构象Pn的局部扰动;
6.4)g2=g2+1;
6.5)若 跳转至步骤6.2)执行下一次迭代;否则,结束增强阶段
7)根据Rosetta协议输出预测结果。