1.一种基于抽象凸估计的多阶段差分进化蛋白质结构预测方法,其特征在于:所述蛋白质结构预测方法包括以下步骤:
1)选取蛋白质力场模型,即能量函数E(X);
2)给定输入序列信息;
3)初始化:种群规模NP,交叉概率CR,阶段控制参数μ,支撑面斜率控制因子M;根据输入序列产生初始构象种群 其中,N表示维数, 表示第i个构象Ci的第N维坐标,并初始化迭代次数G=0;
4)随机生成正整数rand1,rand2,rand3∈{1,2,3,......NP},且rand1≠rand2≠rand3≠i;再生成4个随机整数randrange1,randrange2,randrange3,randrange4;其中randrange1≠randrange2,randrange3≠randrange4∈{1,2,…,L},L为序列长度;令a=min(randrange1,randrange2),b=max(randrange1,randrange2),k∈[a,b];令c=min(randrange3,randrange4),d=max(randrange3,randrange4),p∈[c,d];其中min表示取两个数的最小值,max表示取两个数的最大值;
5)如果G=0,对于当前种群中的每个构象个体Ci,i∈{1,2,3,…,NP},令Ctarget=Ci,Ctarget表示目标构象个体,执行如下操作生成测试构象个体Ctrial:
5.1)用Crand2上位置a到位置b的片段的氨基酸k所对应的二面角替换Crand1的相同位置所对应的二面角;再使用Crand3上位置c到位置d的片段的氨基酸p所对应的二面角替换Crand1上相同位置所对应的二面角,然后将所得Crand1进行片段组装得到变异构象个体Cmutant;
5.2)生成随机数rand4,rand5,其中rand4∈(0,1),rand5∈(1,L),若rand4≤CR,则利用目标构象Ctarget中的rand5片段替换变异构象Cmutant中的rand5片段,从而生成测试构象Ctrial;若rand4>CR,则Ctrial直接等于变异构象Cmutant;
6)如果G>0,则执行如下阶段性操作:
6.1)计算第G-1次迭代中生成的每个测试构象个体的能量下界估计值:
6.1.1)计算当前种群中每个构象个体到测试构象个体之间的距离
其中 表示第i个构象Ci的第j维坐标, 表示测试构象Ctrial的第j维坐标,di表示第i个构i象C到测试构象的距离;
6.1.2)根据距离对所有构象进行升序排列,选取前两个构象个体并记为并计算其下界估计支撑面:
其中, 为所选构象 的能量函数值, N+1为所选构
象个体 的第j为坐标, 为辅助变量,M为支撑面斜率控制因子;
6.1.3)计算测试构象Ctrial的能量下界估计值 其中max表示求最大值,min表示求最小值, 为测试构象向量 的第j维元素,为支撑向量lk的第j维元素;
6.2)计算所有测试构象的平均估计误差 其中 表
示第i个测试构象的能量下界估计值, 表示第i个测试构象的实际能量函数值,如果G=0,则最大平均估计误差为UEmax;
6.3)对平均估计误差UE进行归一化处理,UE的归一化值为
其中UEmin=0为最小平均估计误差;
6.4)根据归一化平均估计误差值判断算法所处的阶段,并采样不同的策略生成变异构象Cmutant:
6.4.1)如果 则用Crand1上位置a到位置b的片段的氨基酸k所对应的二面角替换Ctarget的相同位置所对应的二面角;再使用Crand2上位置c到位置d的片段的氨基酸所对应的二面角替换Ctarget上相同位置所对应的二面角,然后将所得Ctarget进行片段组装得到变异构象Cmutant,其中μ为阶段控制参数;
6.4.2)如果 则根据如下操作生成变异构象Cmutant:
a)根据能量函数值对当前种群中的构象个体进行降序排列,选取前NP/5个构象并计算所选构象的质心构象Ccentroid=(xcentroid,1,xcentroid,2,…,xcentroid,N),其中,构象Ccentroid的第j维元素 j=1,
2,…,N, 表示第m个选取构象 的第N维坐标, 为构象 的实际能量函数值;
b)从当前种群中随机选取两个不同的构象Crand1和Crand2,其中rand1≠rand2∈[1,NP],提取构象Crand1位置a到位置b的片段的氨基酸所对应的二面角替换质心构象Ccentroid的相同位置所对应的二面角,同时使用Crand2上位置c到位置d的片段的氨基酸所对应的二面角替换质心构象Ccentroid相同位置所对应的二面角,然后将所得Ccentroid进行片段组装得到变异构象个体Cmutant;
6.4.3)如果 找出当前种群中能量最低的构象Cbest,用Cbest上位置a到位置b的片段的氨基酸k所对应的二面角替换Ctarget的相同位置所对应的二面角;再使用Crand1上位置c到位置d的片段的氨基酸p所对应的二面角替换Ctarget上相同位置所对应的二面角,然后将所得Ctarget进行片段组装得到变异构象个体Cmutant;
6.4.4)根据步骤5.2)生成测试构象个体Ctrial;
7)分别计算目标构象和测试构象的能量函数值f(Ctarget)和f(Ctrial),如果f(Ctrial)<f(Ctarget),则测试构象个体替换目标构象个体;
8)判断是否满足终止条件,若满足则输出结果并退出,否则返回步骤4)。
2.如权利要求1所述的一种基于抽象凸估计的多阶段差分进化蛋白质结构预测方法,其特征在于:所述步骤8)中,对种群中的每一个个体都执行完步骤4)—8)以后,迭代次数G=G+1,终止条件为迭代次数G达到最大迭代次数Gmax。