1.一种结构特征向量辅助的蛋白质结构预测方法,其特征在于,所述蛋白质结构预测方法包括以下步骤:
1)参数设置,过程如下:
初始种群规模为population,最大迭代代数为generation,种群长度为length,交叉起始位置为crossbegin,交叉结束位置为crossend,交叉片段长度为fraglength;
2)确定结构特征向量USR,过程如下:对于两个不同的构象M和N,ConfUSR(M)=(Ax(M),Cx(M),Dx(M))和ConfUSR(N)=(Ax(N),Cx(N),Dx(N))分别表示这两个构象的结构特征向量,其中,A为中心原子的坐标,C为与中心最远的原子的坐标,D为与中心最远的原子最远的原子的坐标,而这两个构象之间的距离则用来表示;
3)种群初始化操作,过程如下:
使用Rosetta‑abinitio第一阶段对种群population个体进行片段长度为9的片段组装,直到每个位置的残基都被替换一次,完成初始化操作,得到population个初始个体;
4)种群交叉操作:
在种群中随机选择两个个体xi,xj,i,j∈[1,population],i≠j,随机选择序列中一个片段进行交叉,操作如下:
4.1)随机生成一个长度为population的数组,数组包含从1到population的随机整数排序;
4.2)依次选取两个个体xi,xj进行交叉,片段长度为随机整数fraglength∈[3,10],交叉操作的起始位置为crossbegin∈[1,length‑fraglength]为随机整数,交叉结束位置为crossend=crossbegin+fraglength,在交叉区间[crossbegin,crossend]中交换xi,xj相应位置残基的角度信息,生成新的个体x′i,x′j;
5)种群变异操作:
对新生成的个体依次进行变异操作,操作如下:
5.1)对个体x′i,x′j进行片段组装,根据公式 进行片段长度为
3或者9的片段组装,其中p为[0,1]之间的随机数;
5.2)在片段组装之后,利用能量函数分别对组装前后的个体进行评价得到Ei和Ei′,若Ei<Ei′,则跳回至步骤4.1)重新进行片段组装并判断,若Ei>Ei′,则结束变异操作并得到新的个体x″i,x″j;
6)种群选择操作:
将初始种群和变异后得到的新种群混合成为一个新的种群,在该种群中用结构特征向量来辅助选择较优的个体,操作如下:
6.1)使用能量函数分别评价新种群中每个个体的能量,得到其中能量最小的个体xk,并对其计算结构特征向量 在种群中找到与xk结构特征向量距离最短的个体,在两者中选取能量较小的个体并保存到下一代种群中;
6.2)将上述两个个体删除后,随机选择一个个体,并在种群中获得与其结构特征向量距离最短的个体,分别用能量函数对这两个个体进行评价,选择能量较小的个体更新到下一代的初始种群中;
6.3)循环步骤6.2),直至下一代的初始种群更新完毕,种群规模为population,迭代代数加1;
7)判断是否达到最大迭代代数generation,若满足终止条件,则输出结果,否则转至步骤4)。