1.一种基于接触概率辅助的蛋白质ATP对接方法,其特征在于:所述对接方法包括以下步骤:
1)输入目标蛋白质和ATP的结构,分别记为R和A;
2)分别使用ATPbind服务器、TargetS服务器、TargetSOS服务器、TargetNUCs服务器和TargetATPsite服务器预测目标蛋白质R的所有ATP绑定残基;
3)对于每一个可能的绑定残基,若有三个及三个以上的服务器预测其为绑定残基,则将其作为绑定残基,最终得到h个蛋白质绑定残基,记为r1,r2,...,rh;
4)计算所有绑定残基r1,r2,...,rh中心碳原子Cα坐标的平均值,得到绑定残基中心坐标CR;计算A中所有原子坐标的平均值,得到A的中心坐标CA,移动A使得CA和CR的坐标重合;
5)从PDB数据库中提取每种类型的绑定残基与每一个ATP原子形成接触的概率,过程如下:
5.1)对于PDB库中的每一个复合物,计算所有残基类型为g的绑定残基的Cα原子与ATP中第j个原子之间的平均距离dg,j,若 则令 否则,令 其中g={1,
2,…,21}表示21种残基类型,j={1,2,…,31}表示31个ATP原子, 表示第k个复合物中残基类型为g的绑定残基与ATP中第j个原子之间是否存在接触;
5.2)计算所有复合物的 的平均值,记作cg,j,得到一个21×31维的接触概率矩阵:
6)参数设置:设置种群规模NP,缩放因子F0,交叉概率CR,最大迭代次数Gmax,初始化迭代次数G=0;
7)种群初始化:随机生成初始种群P={S1,S2,...,Si,...,SNP},Si=(si,1,si,2,si,3,si,4,si,5,si,6)为种群P的第i个个体,si,1、si,2、si,3、si,4、si,5与si,6为Si的6个元素,其中si,1、si,2和si,3的取值范围是 si,4、si,5与si,6的取值范围为0到2π;
8)对于种群中的每个个体Si,根据如下方式将蛋白质与ATP对接,并计算该个体的得分Ei:
8.1)根据Si中的后三个元素si,4、si,5与si,6,计算出一个空间旋转矩阵R:
8.2)将A中所有原子坐标根据旋转矩阵R进行旋转得到新的ATP结构AR;
8.3)根据Si中的前三个元素si,1、si,2、si,3,将AR中的所有坐标执行如下的平移过程,计算得出新的ATP结构AT:T R
其中 是A的第j个原子的坐标, 分别是A中第j个原子的X,Y,Z坐标,j=1,2,...,31;
8.4)计算h个绑定残基Cα原子与ATP所有原子间的距离,并按照如下公式计算得分Ei:其中g表示当前绑定残基的类型;cg,j是g类型绑定残基与ATP中第j个原子间存在接触的概率,对应于接触矩阵C中第g行第j列的数值;dh,j是当前绑定残基Cα原子与ATP中第j个原子之间的距离;dmin=0.75×(rh+rj),rh和rj分别表示当前绑定残基的Cα原子和ATP中第j个原子的范德华半径;
9)根据差分进化算法,对种群P中的每个个体Si,i∈{1,2,…,NP}执行如下操作:
9.1)从当前种群P中随机选择三个不同的个体Sa、Sb与Sc,其中a、b和c分别∈{1,2,…,NP},且a≠b≠c≠i,根据如下公式生成突变个体Smutant:Smutant=Sa+F·(Sb-Sc)
9.2)根据如下过程生成交叉个体Scross1和Scross2:其中scross1,t、smutant,t、scross2,t和si,t分别是Scross1、Smutant、Scross2和Si中的元素,t=1,
2,...,6,trand为1到6之间的随机整数,rand(0,1)为0到1之间的随机小数;
9.3)根据步骤8),分别计算Scross,Scross1和Si对应的得分Ecross1,Ecross2和Ei;
9.4)选择Scross1,Scross2和Si中得分最低的个体替换种群P中的Si;
10)G=G+1,如果G≥Gmax,则记录当前种群P中最低的得分Emin和对应的ATP结构信息将 作为最终的ATP位置信息输出,否则返回步骤9)。