1.一种基于简约空间抽象凸下界估计的蛋白质构象优化方法,其特征在于:所述蛋白质构象优化方法包括以下步骤:
1)根据粗粒度能量模型,采用基于知识的Rosetta Score3能量模型作为目标函数,如式(1)所示,并初始化种群:其中 表示N,C,O和CF原子的总数, 表示第i个原子的坐标
2)对1)中的目标函数进行模型转换:
2.1)采用坐标变换方法,将计算模型f1转化为二面角优化空间能量模型f2:其中 为骨架二面角向量,NRES表示残基个数, 分别表示第i个残基中原子C-N-Cα-N,N-Cα-C-N,Cα-C-N-Cα的二面角;
2.2)采用超速形状识别方法,提取蛋白质结构的4个特征点,分别是:分子质心CTD,离CTD最近的原子CST,离CTD最远的原子FCT,离FCT最远的原子FTF,通过计算蛋白质分子粗粒度骨架模型中所有原子与四个特征点的平均距离,距离方差,以及距离偏差指标,组成蛋白质结构的12维特征向量 综合考虑精度和复杂度的因素,选择 作为蛋白质结构特征坐标,基于模型(1),得到如下特征空间能量模型f3:其中 表示蛋白质粗粒度骨架模型中所有原子与特征点CTD,CST,FCT,FTF的平均距离;
2.3)基于Karmarker摄影变换,将模型(3)转换为单位单纯形S约束下的非线性优化问题f4:
2.4)针对f4,采用严格递增射凸函数变换方法,在目标函数项增加一个正常数,将其转换为单位单纯形约束下的严格递增射凸函数f5(x′);
2.5)对于K个采样点,针对第i个采样点x′i,计算其抽象凸次微分,构建f5(x′)在采样点x′i处的支撑弱函数h(x′i):
2.6)建立max-min分段线性能量模型f6(x′):f6(x′)=maxh(x′i),i=1,2,…,K (6)
2.7)考虑K+1维支撑向量矩阵L:其中 为支撑向量;
2.8)建立N叉树来保存下界估计信息;
3)构建简约空间低估模型:
3.1)对初始种群中的每个构象建立支撑向量;
3.2)找出N叉树中不满足条件 的叶子节点,用构建的支撑向量替换;
3.3)判断替换后的节点是否满足 满足,则保留这个节点,不满足,则删除;
4)执行搜索过程:
4.1)设置终止条件;
4.2)在种群中随机选出两个不同的个体;
4.3)通过交叉变异产生新的个体:随机选择所选父代个体中相同长度的片段进行交换,再对其做片段组装,生成新的个体;
4.4)判断新生成的个体落在哪一个搜索区域;
4.5)计算其下界估计值E′C;
4.6)计算E′C与所选父代个体中能量值较小的个体的能量值的差值δ1,如果δ1>0,则跳出本次计算,若δ1<0,计算其真实能量EC;
4.7)计算EC与所选父代个体中能量值较小的个体的能量值的差值δ2,若δ2<0,则用其替换种群中所选父代能量值较高的个体;
5)判断是否满足终止条件,如否,转4.2);如是,则结束。
2.如权利要求1所述的基于简约空间抽象凸下界估计的蛋白质构象优化方法,其特征在于:所述终止条件为迭代次数达到设置值。