1.一种基于差分进化局部扰动的蛋白质构象空间优化方法,其特征在于,所述构象空间优化方法包括以下步骤:
1)输入预测蛋白质的序列信息;
2)设置参数,过程如下:
2.1)构象搜索差分进化参数:种群规模NP,迭代次数G;
2.2)二面角扰动差分进化参数:种群规模NP′,迭代次数G′,交叉概率CR,变异算子F;
3)种群初始化:迭代Rosetta协议第一、二、三阶段,产生具有NP个个体的种群P={P1,P2,...,PNP},其中Pn表示种群P中的第n个个体,n∈{1,2,...,NP};
4)设g=1,其中g∈{1,2,...,G};
5)设n=1,其中n∈{1,2,...,NP};
6)变异操作,过程如下:
6.1)从种群P中随机选择三个互不相同的个体Pselect1、Pselect2、Pselect3;
6.2)在[0,L‑3]内生成两个不同的均匀随机整数rand1和rand2,其中L表示氨基酸序列的长度;
6.3)将Pselect1的第rand1至rand1+2号残基的二面角值替换成Pselect2对应残基的二面角值,将Pselect1的第rand2至rand2+2号残基的二面角值替换成Pselect3对应残基的二面角值,形mutate
成变异后的个体P ;
7)交叉操作,过程如下:
7.1)在[0,L‑3]内生成与rand1和rand2不同的均匀随机整数rand3;
mutate
7.2)将P 的第rand3至rand3+2号残基的二面角值替换成Pn对应残基的二面角值,形cross
成交叉后的个体P ;
cross
8)利用Psipred算法获取P 的二级结构信息,随机选择一段二级结构为loop且长度大于4的区域,记作[b,e],其中b和e分别表示该区域第一个残基和最后一个残基的残基号;
cross
9)利用Rosetta协议第四阶段使用的片段组装技术对P 的[b,e]区域执行一次片段assem
组装,得到片段组装后的个体P ;
assem
10)对P 的[b,e]区域进行局部扰动,过程如下:assem
10.1)以P 第b至e号残基二面角 和ψ对应的键作为旋转轴,取键方向上的单位向量得到旋转轴坐标,记作Ω={ω1,ω2,...,ωS},其中S表示旋转轴数量,ωs=(xs,ys,zs)表示第s个旋转轴的坐标,s∈{1,2,...,S};
10.2)记旋转角度Φ={φ1,φ2,...,φS},其中φs表示第s个旋转轴对应的旋转角度,assem
即P 的[b,e]区域第s个二面角的扰动角度;
assem
10.3)以P 第e至L号残基的Cα原子作为旋转点,记作X={χ1,χ2,...,χK},其中K表示旋转点数量,χk=(xk,yk,zk)表示第k个旋转点的坐标,k∈{1,2,...,K};
10.4)模型评估,过程如下:
10.4.1)将X中的旋转点χk依次按照旋转角φs绕旋转轴ws旋转,其中k∈{1,2,...,K},s∈{S,S‑1,...,1};得到旋转后的X′={χ′1,χ′2,...,χ′K},χ′k=(x′k,y′k,z′k);
10.4.2)打分函数,按如下公式计算Φ对应的得分:
10.5)求解最优的Φ,使其得分最低,过程如下:
10.5.1)初始化:生成初始种群Γ={Φ1,Φ2,...,ΦNP′},其中
10.5.2)设g′=1,其中g′∈{1,2,...,G′};
10.5.3)设n′=1,其中n′∈{1,2,...,NP′};
10.5.4)变异操作,过程如下:
10.5.4.1)从种群Γ中选择得分最低的个体,记作Φbest;再随机选择两个互不相同且与Φbest不同的个体,记作Φselect1、Φselect2;
mutate
10.5.4.2)按如下方式生成变异后的个体Φ :
10.5.5)交叉操作,过程如下:
10.5.5.1)在[1,S]内生成均匀随机整数srand;
10.5.5.2)生成S个均匀随机小数Rs,Rs∈[0,1],s∈{1,2,...,S};
cross
10.5.5.3)按如下方式生成交叉后的个体Φ :
10.5.6)选择操作,过程如下:cross n′ cross
10.5.6.1)根据步骤10.4)计算Φn′和Φ 的得分D 和D ;
cross n′ cross
10.5.6.2)若D <D ,用Φ 替换种群Γ中的个体Φn′;
10.5.7)n′=n′+1;若n′≤NP′,转至步骤10.5.4);
10.5.8)g′=g′+1;若g′≤G′,转至步骤10.5.3);
10.5.9)从种群中选择五个能量最低的个体作为候选扰动角度,记作Η={Φ1,Φ2,Φ3,Φ4,Φ5};
10.6)选择扰动,过程如下:
10.6.1)设i=1,其中i∈{1,2,3,4,5};
assem
10.6.2)将H中的第i个个体Φi的扰动角度添加到P 对应的二面角上,形成扰动后的perturb
个体P ;
assem perturb assem perturb
10.6.3)用Rosetta score3能量函数计算P 和P 的能量E 和E ,并按照如下公式计算接收扰动的概率:trial perturb
10.6.4)生成均匀随机小数rand4,rand4∈[0,1];若pacc<rand4,令P =P ,转至步骤11);否则,转至步骤10.6.5);
trial assem
10.6.5)i=i+1;若i≤5,转至步骤10.6.2);否则,令P =P ;
trial
11)用Rosetta score3能量函数计算P 和Pn的能量,根据Metropolis准则决定是否trial
用P 替换种群P中的个体Pn;
12)n=n+1;若n≤NP,转至步骤6);
13)g=g+1;若g≤G,转至步骤5);
14)利用SPICKER聚类算法输出最终的预测结果。