1.一种基于抽象凸下界估计的蛋白质结构预测方法,包括以下步骤:
1)选取合适的力场模型,本发明采用ECEPP/3力场模型能量函数的表示形式如下:式中 表示肽链中原子个数,为第i个原子的坐标 Ebond为键长贡献项,BOND为键长集合,b为1-2原子之间的距离,b0为1-2原子之间平衡状态下键长,kb为键长强度;Eangle为键角贡献项,ANGLE为键角集合,a为两键矢量之间的夹角,a0为平衡状态下键角,ka为键角的强度;Etorsion为正常二面角贡献项,采用余弦函数的形式描述,TOR为正常二面角集合,MUL为二面角多样性集合,τ为正常二面角,m为多样性,Vm,τ为二面角τ对应于多样性m的势垒高度,γm,τ为二面角τ对应于多样性m的初始相位;Eelectrostatic为静电力贡献项,ES为静电作用力原子集合,qi为原子i的部分电荷,qj为原子j的部分电荷,ε为介电常数;Evdw为范德华力相互作用贡献项,采用Lennard-Jones势描述,VDW为范德华作用力集合,rij为原子i与原子j之间的欧氏距离,参数Aij和Bij依赖于特定原子类型和相互作用的特征;Ehydrogen为氢键相互作用贡献项,HB为氢键作用力集合,Cij和Dij依赖于相互作用特征;Eother为其它额外的能量贡献项;
2)将力场模型转换为单位单纯形约束下的目标函数,并通过局部优化的方法获得其简化的势能模型;
3)参数初始化:设置群体规模popSize,变异因子F为0.5,交叉因子CR为0.1,低估概率underFactor,常数M,支撑向量规模K=N+1,N为肽链中二面角的自由度,支撑向量阈值KT,初始群体 其中 称为单位单纯形,计算f5(xi),i∈I,其中f5为简化势能模型对应的目标函数 并设为区域I上的最小值,其中I={1,2,...,popSize};
4)对每一个目标个体xi∈S,i=1,2,…,popSize,作如下处理:
4.1)任意选取三个个体{xa,xb,xc|a,b,c∈{1,2,...,popSize},a≠b≠c≠i};
4.2)对{xa,xb,xc}执行变异操作 生成变异个体i
4.3)对目标个体x和变异个体 执行交叉操作,生成测试个体
4.3.1)设置j=1;
4.3.2) 其中randb(j)产生0到1之间的随机数;rnbr(i)产生1到N+1之间的任一个整数;
4.3.3)j=j+1;
4.3.4)如果j
4.4)i=i+1;如果i
5)对目标个体xi∈S和测试个体 i=1,2,…,popSize,逐个更新操作:
5.1)设置i=1;
5.2)查询包含 的子区域 计算 其中 为低估支撑面在 子区域中唯一的最优解, 为唯一对应于子区域 的支撑向量矩阵对角项;
5.3)如果 转至5.9);
5.4)如果K
5.5)如果random(0,1)
5.6)计算 其中 为给定区域中的唯一最优解;
5.7)如果 转至5.9);
5.8)计算 如果 则置 K=K+1,更新树结构TK;
5.9)i=i+1;如果i≤popSize,转至5.2);
6)置
7)判断是否满足终止条件,如不满足转至步骤3);
8)输出结果,退出。
2.如权利要求1所述的基于抽象凸下界估计的蛋白质结构预测方法,其特征在于:步骤
2)中模型变换方法为,模型(I)中b,a,τ,rij变量均为 个原子坐标 的函数,经过平移及旋转变换后问题维数为 给定肽链中所有原子坐标,可计算得到能量值;
通常在生物学条件下,键长偏差小于 键角偏差小于2°;因此,考虑肽链分子的键长、键角均固定在平衡状态,设置Ebond=Eangle=Eother=0,可将其维数降至 其中 为肽链分子中共价键总数, 为肽链分子中独立键角总数;与此同时,该简化过程也引入高价的非线性等式约束条件;为了消除高价非线性等式约束条件,设代入模型(I),可得到:
式中 为肽链二面角向量;N为肽链中二
面角的自由度,即优化问题维数,NRES表示残基个数, 为第i个残基侧链二面角的个数;且满足 为第i个残基主链C–N–Cα–C四个原子之间的二面角,ψi为第i个残基主链N–Cα–C–N四个原子之间的二面角,ωi为第i个残基主链Cα–C–N–Cα四个原子之间的二面角, 为第i个残基侧链第 个二面角变量。
3.如权利要求2所述的基于抽象凸下界估计的蛋白质结构预测方法,其特征在于:将给定的力场模型转换为单位单纯形,并获得简化的力场模型:设τ′t=τt+π,常数 其中τt为模型(II)中二面角变量,t=1,2,...,N,N为二面角自由度,即优化问题维数;则由模型(II)约束条件可知:τ′t≥0,t=1,2,...,N;采用下列投影变换:将模型(II)边界约束可行域一对一地映射成单位单纯形 将式(2)代入模型(II)可得:
min f3(x)=f2(2πNx1-π,2πNx2-π,...,2πNxN-π),x∈S. (III)近一步,应用局部优化方法,得到以下松弛模型:其中 为以x为初始点在模型(III)势能曲面上应用局部最小化算法得到的局优解;
显然,模型(IV)为模型(III)松弛势能曲面,即min f3(x)=min f4(x)。