1.一种基于片段库信息增强的蛋白质结构预测方法,其特征在于:所述蛋白质结构预测方法包括以下步骤:
1)输入预测蛋白质的序列信息和预测的二级结构信息;
2)设置参数:片段长度为3的片段库过滤因子filter3,片段长度为9的片段库过滤因子filter9,片段组装次数M,玻尔兹曼温度因子KT;
3)筛选片段库信息,过程如下:
3.1)设r=1,r∈{1,2,…,L-f+1};其中r表示滑动窗口编号,L为蛋白质序列长度,f∈{3,9}为滑动窗口的宽度;
3.2)计算滑动窗口的二级结构最高分,过程如下:
3.2.1)设第n号残基预测的二级结构为α-helical、β-strand和loop的置信度分别为和 其中n∈{r,r+1,…,r+f-1};
3.2.2)第r个滑动窗口的二级结构总分为:
3.3)对滑动窗口对应的片段库进行筛选,过程如下:
3.3.1)设k=1,k∈{1,2,…,200};其中k表示片段库中片段的编号;
3.3.2)计算片段k的二级结构得分:其中 表示第n号残基在该片段中的真实二级结构,H和E分别表示二级结构为α-helical和β-strand;
3.3.3)决定是否从片段库中去除片段k,过程如下:
3.3.3.1)若f=3,执行步骤2.3.3.2);否则执行步骤2.3.3.3);
3.3.3.2)若 则将片段k从片段库中去除,转至步骤2.3.4);
3.3.3.3)若 则将片段k从片段库中去除;
3.3.4)k=k+1;
3.3.5)若k≤200,转至步骤2.3.2);否则,转至步骤2.4);
3.4)r=r+1;
3.5)若r≤L-f+1,转至步骤2.2);否则,片段库筛选完成,得到信息增强的片段库;
4)利用信息增强的片段库进行片段组装,过程如下:
4.1)设m=1,m∈{1,2,…,M};
4.2)执行片段插入操作,过程如下:
4.2.1)若m≤0.5*M,执行步骤4.2.2);否则执行步骤4.2.3);
4.2.2)从当前构象Ptarget中随机选择一个窗口宽度为3的滑动窗口,从该滑动窗口对应的片段长度为3的片段库中随机选择一个片段替换原有片段,生成新的构象Ptrial,转至步骤
4.3);
4.2.3)从当前构象Ptarget中随机选择一个窗口宽度为9的滑动窗口,从该滑动窗口对应的片段长度为9的片段库中随机选择一个片段替换原有片段,生成新的构象Ptrial;
4.3)利用能量函数计算构象Ptarget和Ptrial的能量Etarget和Etrial;
4.4)计算替换概率:
4.5)生成均匀随机小数prand,prand∈[0,1];若prand<p,用新构象替换当前构象Ptarget=Ptrial,否则不进行替换;
4.6)m=m+1;
4.7)若m≤M,转至步骤4.2);否则,片段组装完成;
5)输出片段组装后的构象作为预测结果。