1.一种基于局部结构比对的蛋白质构象空间优化方法,其特征在于,所述方法包括以下步骤:
1)给定输入序列信息;
2)选取Rosetta score3能量函数E(x),根据ROBETTA获得片段库;
3)参数初始化:设置种群规模Ps,迭代计数器g,最大遗传代数Gmax,初始种群搜索轨迹长度N,温度因子KT,片段长度m,参数n;
4)初始化种群:启动Ps条Monte Carlo轨迹,每条轨迹搜索N次,即生成Ps个初始个体;
5)对每个目标个体xi,i∈{i=1,2,...,Ps}进行如下操作:
5.1)随机选择一个个体xj,j∈{1,2,...,Ps}且j≠i,进行交叉操作:
5.1.1)根据Rosetta score3函数分别计算个体xi和xj的能量E(xi)和E(xj);
5.1.2)如果E(xj)<E(xi),则执行步骤5.1.3)和5.1.4),否则x′i=xi,转至步骤5.2);
5.1.3)产生一个随机整数r1∈[3,10]作为交叉片段长度,接着随机产生一个交叉起始位置r2∈[1,l‑r1],进而确定出交叉区域[r1,r1+r2],其中l为序列长度;
5.1.4)在交叉区域[r1,r1+r2]内,用个体xj的扭转角度依次替换个体xi中对应的扭转角,生成交叉个体x′i;
5.2)对个体x′i进行基于片段结构的变异操作:
5.2.1)随机产生一个整数u∈[1,l‑m],进而确定出个体x′i的片段插入窗口[u,m+u]以及片段库中对应的片段 其中h是片段库中对每一个片段的编号;
5.2.2)选取结构比对向量:在片段结构中,a是N端的N原子到Cα原子的单位向量,b是C端的C原子到Cα原子的单位向量,R是N端的Cα原子到C端的Cα原子的向量;
5.2.3)根据公式 计算个体x′i的片段插入窗口中N端的Cα原子到C端的Cα原子的欧氏距离;
5.2.4)根据公式 计算个体x′i的片段插入窗口中a‑R‑b组成的二面角;
5.2.5)与步骤5.2.3)同理,依次计算片段库中对应的片段 的两端Cα原子之间的欧氏距离
5.2.6)与步骤5.2.4)同理,依次计算片段库中对应的片段 中的二面角值
5.2.7)根据公式 计算片段库中每个片段 与个体x′i中窗口片段之间的比对值;
5.2.8)根据Δd的大小进行排序,选出最小的前n片段作为潜在片段,并重新编号
5.2.9)根据公式 依次计算每个潜在片段 的适应值;
5.2.10)选取Δq最小的一个片段,并用该片段的扭转角替换个体x′i中的扭转角,生成变异分体x″i;
5.3)进行如下的选择操作:
5.3.1)根据Rosetta score3函数计算个体x″i的能量;
5.3.2)判断E(x″i)是否小于E(xi),如果E(x″i)<E(xi),则变异个体x″i替换个体xi,并作为下一代的目标个体,执行步骤6),否则执行步骤5.3.3);
5.3.3)根据公式 计算概率pe;
5.3.4)产生一个0到1的随机数rand,如果pe>rand,则变异个体x″i替换个体xi,并作为下一代的目标个体,否则个体xi被保留,并作为下一代的目标个体;
6)对种群中的每一个个体都执行完步骤5)以后,迭代次数g=g+1,判断g是否大于Gmax,若g>Gmax,则停止迭代并退出,否则返回步骤5)。