1.一种基于模板的多域蛋白结构组装方法,其特征在于:所述多域蛋白结构组装包括以下步骤:
1)输入各单域蛋白的三维结构和其对应的多域蛋白的序列信息;
2)设置最大迭代次数Imax,冲突距离阈值dclash,相互作用阈值dcontact,相互作用的原子数量常数n0;
3)针对PDB库中每一个多域蛋白执行如下操作,从而确定组装模板:
3.1)根据蛋白质结构比对工具TM-align找出第一个蛋白最佳比对位置,并记录其模板比对得分TM-score1;
3.2)从第一个域蛋白比对的最后一个的残基位置开始,利用TM-align找出第二个域蛋白的最佳比对位置,并及记录TM-score2;
3.3)重复步骤3.2)依次找到其它域蛋白的最佳比对位置,并记录TM-socre3,TM-socre4,…,TM-socreN,N为域蛋白的总数量;
3.4)计算该模板的得分 其中scorei表示第i个模板的得分,TM-scorei表示第i个域蛋白的比对得分,Li为第i个域蛋白的序列长度;
3.5)通过步骤3.1)-3.4)计算得到每一个模板的得分后,选取得分最高的蛋白作为模板;
4)通过如下方法将各域蛋白重叠到模板上,过程如下:
4.1)将查询蛋白的Cα原子与模板的Cα一一比对,然后根据Kabsch方法求得旋转矩阵和平移向量(t1,t2,t3),ust,s=1,2,3,t=1,2,3表示旋转矩阵的第s行的第t个元素,ts表示第s个平移向量;
4.2)针对查询蛋白的每一个Cα原子 作旋转平移
其中, 表示第n个域蛋白的第m个Cα原子的第s维坐标;
5)固定第n个域蛋白的位置,根据如下公式将第n+1个域蛋白平移,使其连接点之间的均方根偏差RMSD为其中,ln为第n个域蛋白的长度, 为第n个域蛋白的最后一个Cα原子的第s维坐标,为第n+1个域蛋白的第一个Cα原子的第s维坐标,dn,n+1为第n个域蛋白的最后一个Cα原子和第n+1个域蛋白的第一个Cα原子之间的欧氏距离;
6)计算当前蛋白与模板之间的Cα原子的均方根偏差ERMSD;
7)计算第n个域蛋白的Cα原子和第n+1个域蛋白中Cα原子两两之间的欧氏距离,并统计距离小于dclash的数量nclash,并记录对应的距离 计算域之间的冲突得分
8)统计步骤7中距离小于dcontact的数量ncontact,并计算相互作用得分
9)计算当前蛋白的能量E=w1ERMSD+w2Eclash+w3Econtact,其中,w1,w2,w3为各自的权重值;
10)通过以下操作迭代确定能量最低的组装结构,过程如下:
10.1)确定旋转轴: X3=θ,其中,θ=1-2rand[0,1],φ=2πrand[0,1],rand[0,1]为0和1之间的随机小数;
10.2)随机生成旋转角γ=2rand[0,1]-1和组装平移向量(T1,T2,T3),其中Ts=0.3(2rand[0,1]-1),s=1,2,3;
10.3)确定组装旋转矩阵:
其中,α=cosγ,β=sinγ,Ust表示组装旋转矩阵的第s行的第t个元素,s=1,2,3,t=1,2,3;
10.4)对第n+1个域蛋白的每一个Cα原子作旋转和平移操作:其中, 表示第n+1个域蛋白的第一个Cα原子的第s维坐标,s=1,2,3, 表示第n+1个域蛋白的第m个Cα原子的第s维坐标,s=1,2,3;
10.5)根据步骤6)-9)计算当前组装结构的能量,如果能量减小,则接受当前组装结构;
11)重复步骤10)Imax次,则最后一次的结构为第n个域蛋白和第n+1个域蛋白的组装结构;
12)当第n+1个蛋白组装完成后,则固定前n+1个域蛋白的结构,根据步骤5)-11)组装第n+2个域蛋白,直到所有N个域蛋白组装完成后,输出最后的组装结构。