1.一种基于模板自适应选择的多域蛋白结构组装方法,其特征在于:所述多域蛋白结构组装方法包括以下步骤:
1)输入各单域蛋白的三维结构;
2)设置组装模板数量T,最大迭代次数Imax,冲突距离阈值dcl,相互作用阈值dct,各模板的选择概率pt,t=1,2,...,T,pt表示第t个模板的选择概率,学习间隔Iinter;
3)利用模板比对工具TM-align对多域蛋白库中的每个模板进行打分,并根据打分进行降序排列;
4)选出打分最高的前T个模板进行组装,过程如下:
4.1)将各单域蛋白重叠到各个模板上,得到T个结构,并根据如下公式对各结构进行打分:其中,w1、w2、w3和w4为各能量项的权重, 和 分别表示第n个单域蛋白的第i个Ca原子的坐标和第n+1个单域蛋白的第j个Ca原子的坐标, 表示 和 之间的欧氏距离,Xl和 分别表示组装结构中第l个Ca原子的坐标和各域重叠到模板上后整个多域蛋白结构的第l个Ca原子的坐标, 为Xl和 之间的欧氏距离,L为蛋白的序列长度, 为距离 相互作用阈值dct的Ca原子数量,n0为归一化常数,其取值为0.306×(ln+ln+1),ln和ln+1分别为第n个单域蛋白和第n+1个单域蛋白的序列长度, 和 分别表示第n个单域蛋白的最后一个Ca原子的坐标和第n+1个单域蛋白的第一个Ca原子的坐标, 为他们之间的欧氏距离,D表示单域蛋白的总数量;
4.2)根据各模板的选择概率,利用轮盘赌选择出一个模板得到的结构,并根据4.1)计算其得分Eold;
4.3)对4.2)中选择的结构中所有的Ca原子坐标进行随机选择和平移,从而得到一个新的结构,并根据4.1)计算新结构的得分E;
4.4)如果E小于Eold,则新结构替换当前模板的结构;否则,如果满足则新结构替换当前模板的结构,并记录当前的迭代次数以及被接收的所有新结构,其中rand(0,1)为0和1之间的随机数,e为自然常数;
4.5)如果当前迭代次数为Iinter的整数倍,则计算各模板的选择概率pt,t=1,2,...,T,pt的值等于第t个模板产生的结构成功替换的次数除以第t个模板在步骤4.2)中被选择的次数;
4.6)如果迭代次数达到最大迭代次数Imax,则继续步骤5),否则重复步骤4.2)~4.6);
5)利用近天然态蛋白聚类工具SPICKER对迭代过程中所有被接收的新结构进行聚类,从而选择出规模最大的类的中心结构为最终组装结构。