1.一种基于转移熵的策略自适应蛋白质构象空间优化方法,其特征在于:所述方法包括以下步骤:
1)给定输入序列信息,以及蛋白质力场模型,即能量函数Rosetta Score3;
2)初始化:迭代Rosetta协议第一、二阶段,产生具有NP个构象的种群Pg,记为i∈{1,2,…,NP},其中 为第g代种群的第i个构象,初始化迭代次数g=0;
3)使种群Pg进行初步探测,迭代n次后生成背景点种群Bg,过程如下:
3.1)给定初始点 置i=1,则 的搜索方向为 其中为 的 梯 度 , 为 满足 拟 牛 顿条 件的 矩 阵 , 的 搜 索 步长 满 足当m=1时, 为单位矩阵,故 经探测后得到
3.2)i=i+1,重复步骤3.1)直至i=NP完成第g代种群Pg的一次探测,重置i=1;
3.3)计算 当m≠1时,拟牛顿矩阵 的计算公
式如下所示:
而 的搜索方向和搜索步长同步骤3.1),故 经探测后得
3.4)i=i+1,重复步骤3.3)直至i=NP完成第g代种群Pg的再一次探测,重置i=1;
3.5)m=m+1,重复步骤3.3)-3.4)直至m=n完成第g代种群Pg的n次探测,生成背景点种群Bg;
4)采用K-medoids方法对背景点种群Bg进行聚类,得到K个类,其中聚类依据为不同构象之间的均方根偏差RMSD值;
5)计算种群Pg的转移熵 过程如下:
5.1)当g=0时,记Eg=0;
5.2)当g≠0时,依据构象的时序关系,统计相邻两代种群Pg-1和Pg中从第i类转移至第j类的概率,记为zij,从而构建转移矩阵Z=[zij]K×K,其中i和j均∈{1,2,...,K};
5.3)根据公式 计算熵值,并根据公式 归一化得
到转移熵 其中Emin=0,
6)根据前后两代的转移熵实现策略自适应操作,过程如下:
6.1)在[0,L-9]内生成均匀随机整数rand1、rand2和rand3,其中L表示氨基酸序列长度;
6.2)当 时,从种群Pg中选定目标构象 并从种群Pg中随机选择构象r1≠r2≠i,将 的第rand1至rand1+8号残基的二面角值替换成 对应残基号的二面角值,将 的第rand2至rand2+8号残基的二面角值替换成 对应残基号的二面角值,生成变异个体 再将 的第rand3至rand3+8号残基的二面角值替换成变异个体 对应残基号的二面角值,生成试验个体
6.3)当 时,从种群Pg中选定目标构象 并从种群Pg中选择最优和次优构象将 的第rand1至rand1+8号残基的二面角值替换成 对应残基号的二面角值,将 的第rand2至rand2+8号残基的二面角值替换成 对应残基号的二面角值,生成变异个体 再将 的第rand3至rand3+8号残基的二面角值替换成变异个体 对应残基号的二面角值,生成试验个体
7)选择操作:用Rosetta score3能量函数计算 和 的能量;根据Metropolis准则决定是否用 替换
8)判断是否满足终止条件,若满足则输出结果并退出,否则g=g+1并返回步骤5)。
2.如权利要求1所述的一种基于转移熵的策略自适应蛋白质构象空间优化方法,其特征在于:所述步骤2)中,设置最大迭代次数Gmax,所述步骤8)中,终止条件为迭代次数g达到预设最大迭代次数Gmax,若满足根据Rosetta聚类算法对种群Pg中的构象聚类,选出最大类的类心构象作为最终预测结果。