1.一种蛋白质结构预测算法评价指标构建方法,其特征在于:所述评价指标构建方法包括以下步骤:
1)给定输入序列信息,利用Robetta服务器获得该序列的片段库;
2)对搜索空间初步探索并建立Markov状态模型,过程如下:
2.1)获取m个背景点:运行Rosetta Abinitio协议m次,记录每次运行的构象结果,作为背景点;
2.2)计算m个背景点之间的方均根差距离,组成距离矩阵D;
2.3)根据距离矩阵D,利用k‑mediods聚类方法对m个背景点分类,得到k个簇心,作为k个Markov状态,其中k
2.3.1)从m个背景点中随机选取k个点作为当前的簇心;
2.3.2)对每个背景点bi,i∈{1,...,m}分类:计算背景点与k个簇心的距离则该背景点所属类别号为ci,ci满足条件
2.3.3)找出每一类别背景点的簇心,计算每个点距离同一类别其他所有点的距离之和,距离之和最短的对应点为该类的簇心;
2.3.4)如果簇心改变,则返回步骤2.3.2),继续聚类迭代过程;否则,簇心不变,执行下一步;
3)评价基于种群的蛋白质结构预测方法,过程如下:
3.1)对初始化种群进行分类,表示初始状态:种群规模为NP,种群表示为P={C1,C2,...,CNP},Cn,n∈{1,...,NP}为第n个种群个体,计算个体Cn与k个簇心的均方根偏差(RMSD)距离,若Cn与第p个簇心距离最近,那么该个体当前状态staten=p,p∈{1,...,k},表明个体Cn属于第p类,整个种群的状态表示为statelast={state1,state2,...,stateNP},statelast表示上一代种群状态;
3.2)对种群执行下一次迭代过程得到下一代种群,其中迭代过程的步骤由算法决定;
3.3)计算当前种群状态:对当前种群中个体Cn,n∈{1,...,NP}分类,计算个体Cn与k个簇心的RMSD距离,若Cn与第q个簇心距离最近,那么该个体当前状态state′n=q,q∈{1,...,k},表明个体Cn属于第q类,整个种群的状态表示为state′now={state′1,state′2,...,state′NP},state′now表示当前种群状态;
3.4)根据前后两代的状态统计得出Markov状态转移矩阵T:对构象Cn,n∈{1,...,NP}的前后两次状态staten=p和state′n=q表明一次从状态p到状态q的转移,则tpq=tpq+1/k,tpq为矩阵T第p行第q列的数值,表示该状态转移频率,其初始值为0;
3.5)根据状态转移矩阵T计算香农熵值Entropy=∑‑tpq ln tpq;
3.6)更新当前种群状态statelast=state'now;
3.7)判断算法迭代过程是否结束,若结束,输出最后预测结果和历代熵值并结束以上步骤;否则,返步骤3.2)。