1.一种蛋白质结构预测能量函数权重优化方法,其特征在于:所述方法包括以下步骤:
1)给定需要确定权重的蛋白质能量函数E,以及各能量项E1,E2,...,EN,其中N为能量项的数量,En表示能量函数E的第n个能量项,n=1,2,...,N;
2)参数设置:设置种群规模NP,交叉概率CR,步长因子F,蛋白质样本构象数量S,最大迭代次数Gmax,并初始化迭代次数g=0;
3)将所有能量项的权重设置为1,运用该能量函数对应的蛋白质结构预测方法生成S个样本构象,并记录第s个样本的第n项能量项的值 s=1,2,...,S,n=1,2,...,N,以及该样本与天然态结构之间的均方根偏差Rs;
4)将所有能量项权重组成的权重向量W=(W1,W2,...,WN)看作一个个体,其中Wn表示能量项En的权重,在(0,1]内随机生成NP个初始个体,组成初始种群其中Wi,g,i=1,2,...,NP表示第g代种群中的第i个个体;
5)计算每个个体Wi,g,i=1,2,...,NP的均方根偏差和能量的相关系数C(Wi,g):其中 为根据第g代的第i个个体Wi,g对应的权重计算得到的第s个样本的能量值, 为Wi,g的第n维变量, 为所有样本均方根偏差的平均值,为所有样本能量的平均值;
6)对种群中的每个个体Wi,g,i∈{1,2,...,NP}执行如下操作:
6.1)将个体Wi,g看作目标个体,根据相关系数对当前种群中的个体从大到小进行排序,并将排名靠前的NP/2的个体定为较优子种群,其余的为较差子种群;
6.2)分别从较优子种群和较差子种群中的随机选择一个与目标个体不同的个体Wa,g和Wb,g,并从整个种群中随机一个与目标个体以及Wa,g和Wb,g均不相同的个体Wc,g;
6.3)根据公式(2)生成变异个体Vi,g:
其中, n=1,2,...,N为变异个体Vi,g的第n维向量;
6.4)对变异个体进行交叉生成测试个体Ui,g:
其中, n=1,2,...,N为测试个体Ui,g的第n维向量,randb(0,1)为0到1之间的随机小数,rnbr(n)为1到N之间的随机整数;
6.5)根据公式(1)计算测试个体Ui,g的相关系数C(Ui,g);
6.6)如果C(Ui,g)
6.7)如果C(Ui,g)≥C(Wi,g),则用测试个体Ui,g替换目标个体Wi,g;
7)g=g+1,如果g>Gmax,则输出相关系数最大的个体为最终的能量项权重值,并以此权重对应的能量函数对构象空间进行优化,输出能量最低的构象作为最后的预测结构;否则返回步骤6)。