1.一种基于差分进化的蛋白质二聚体结构预测方法,其特征在于,所述预测方法包括以下步骤:
1)输入待预测蛋白质二聚体中的两条链的序列信息,分别记作Chain1与Chain2;
2)对于输入的序列信息Chain1与Chain2,使用I-TASSER服务器预测出对应的三维空间结构信息,分别记作T1与T2;
3)计算T1与T2的中心点坐标,分别记作o1与o2:
其中,N1与N2分别表示T1与T2中含有的氨基酸数目, 与 分别表示T1与T2中的第i个氨基酸的中心碳原子Cα的坐标;
4)计算T1中每个氨基酸的Cα的坐标 与o1之间的欧氏距离 并在所有氨基酸对应的 计算得到后,选择最大的 记作
5)计算T2中每个氨基酸的Cα的坐标 与o2之间的欧氏距离 并在所有氨基酸对应的 计算得到后,选择最大的 记作
6)参数设置:设置种群规模NP,突变因子F,交叉概率CR,最大迭代次数Gmax,初始化迭代次数G=0;
7)种群初始化:随机生成初始化种群P={S1,S2,...,Si,...,SNP},Si=(si,1,si,2,si,3,si,4,si,5,si,6)为种群P中的第i个个体,si,1、si,2、si,3、si,4、si,5与si,6为Si的6个元素,其中si,1与si,2的取值范围为0到1,si,3的取值范围为0到 si,4、si,5与si,6的取值范围为0到2π;
8)对于种群中的每个个体Si,根据如下方式组装T1与T2,并计算该个体的得分score(Si):
8.1)根据Si中的后三个元素si,4、si,5与si,6,计算出一个三维空间旋转矩阵R:
8.2)固定T1,将T2中的所有原子坐标信息,根据旋转矩阵R进行旋转,将旋转后的T2记作
8.3)根据Si中的前三个元素与o1,计算出一个新的三维空间点onew:其中ζ=1-2·si,1, T表示向量的转置;
8.4)固定T1,将 平移,使得平移后的 的中心点与onew重合,记平移后的 为此时,T1与 形成的复合物被看作为个体Si对应的蛋白质二聚体空间构象,记作
8.5)在 中,根据T1与 之间的交互残基对数目ninter与冲突残基对的数目nclash,计算得分score(Si):score(Si)=ninter-nclash
其中,当分别来自T1与 的残基AA1,k与AA2,l的Cα原子之间的欧氏距离处于区间[dlow,dhigh]时,交互残基对数目ninter加1,当分别来自T1与 的残基AA1,k与AA2,l的Cα原子之间的欧氏距离处于区间[0,dlow)时,冲突残基对数目nclash加1;
9)根据差分进化算法,对种群P中的每个个体Si,i∈{1,2,…,NP}作如下处理:
9.1)从当前种群中P随机选择三个不同的个体Sa、Sb与Sc,其中a≠b≠c≠i,根据如下等式生成一个突变个体Smutant:Smutant=Sa+F·(Sb-Sc)
9.2)将Si中的元素信息复制到交叉个体Scross中,再在Scross的6个元素中随机选择一个元素scross,j,使用Smutant中对应的元素smutant,j替换,最后,对于Scross中的每一个元素,使用随机生成的0到1之间的随机数R来控制是否使用Smutant中对应的元素来替换:若R<CR,则替换,否则不替换;
9.3)根据步骤8),分别计算Scross与Si对应的得分score(Scross)与score(Si);
9.4)如果score(Scross)>score(Si),则使用Scross替换种群P中的Si,否则Si保留在种群P中;
10)G=G+1,如果G>Gmax,则根据当前种群P中得分最高的个体Sbest,使用步骤8)组装T1与T2,生成的新空间构象decoybest作为最终的预测结构输出,否则返回步骤9)。