1.一种双重分布估计引导的蛋白质构象空间搜索方法,其特征在于:所述方法包括以下步骤:
1)给定输入序列信息;
2)参数初始化:设置Monte Carlo轨迹条数K、迭代次数G和能量平衡因子δ;
3)构象初始化:根据给定输入序列,生成K个伸展链初始个体;
4)对步骤3)中的K个个体根据RosettaScore3分别计算能量,加上能量平衡因子δ后,存入能量列表EnergyList中;
5)对EnergyList中的所有元素求和得到能量总和Esum;
6)对EnergyList执行反转操作,即将其中所有元素逆序排列;
7)对EnergyList中的元素执行以下操作:EnergyList[i]/Esum,其中i表示列表索引值,i的取值从0到K-1;
8)将EnergyList[i]/Esum存入对应位置的能量分布概率列表pCur中;
9)创建接收列表AcceptList;
10)计算总评价次数Asum;
11)对AcceptList中的每个元素做以下操作:AcceptList[i]=1,其中i表示列表索引值,i的取值从0到K-1;
12)将1/Asum存入对应位置的接受分布概率列表pHis中;
13)开始迭代:
13.1)根据pCur和pHis这两个概率分布,选出一条Monte Carlo轨迹,执行片段组装过程,生成新的构象pMC;
13.2)根据RosettaScore3计算新生成构象的能量E(pMC);
13.3)依据Bolztmann准则接受新生成的构象,如果没有接收当前构象,直接转到步骤
14),如果接受当前构象,则取得该轨迹在列表中的索引值j;
13.4)EnergyList[j]更新为E(pMC)+δ,重新计算Esum,Asum增加1,AcceptList[j]增加1;
13.5)重新计算pCur和pHis:pCur[i]=EnergyList[i]/Esum,pHis[i]=AcceptList[i]/Asum;
14)判断是否达到最大迭代次数G;
14.1)若当前迭代次数小于G,返回步骤13);
14.2)若当前迭代次数等于G,结束。