1.一种基于距离和角度信息的蛋白质ATP对接方法,其特征在于:所述对接方法包括以下步骤:
1)输入蛋白质和ATP的结构信息,分别记为D和A;
2)对于输入的蛋白质结构信息D,使用ATPbind服务器预测出蛋白质所有的ATP绑定残基,分别记为r1,r2,...,rn,其中n为预测出的ATP绑定残基个数;
3)根据r1,r2,...,rn的中心碳原子Cα坐标信息,取所有Cα坐标值的平均值,聚类出一个中心点CD;根据A中各原子坐标信息,取所有原子坐标值的平均值,聚类出一个中心点CA;移动ATP结构使得CA和CD的坐标重合;
4)对于PDB数据库中每个与蛋白质结合的ATP分子A(j),其中j=1,2,...,N,N为PDB数据库中ATP的数目,定义与蛋白质绑定残基的Cα原子距离最近的ATP原子为绑定原子其中n为该ATP的绑定原子与蛋白质的绑定残基组成绑定对的个数,若距离最近的ATP原子已与之前的残基绑定过,则与次近的ATP原子进行绑定;
5)计算每一个绑定对的ATP原子与蛋白质绑定残基的Cα原子的距离 其中T为 原子的类型,Y是与 绑定的蛋白质残基的类型,计算 与Y和Y′类型绑定残基的Cα原子的夹角∠YTY′j,k,其中,Y′是除与 绑定残基外的蛋白质绑定残基类型,k=1,2,...,n-1;
6)计算T类型的 原子与Y类型的蛋白质绑定残基间相互作用的平均距离,记作D(T,Y):计算T类型的 原子与Y类型和Y′类型的蛋白质绑定残基形成的夹角的平均值,记作∠YTY′:
7)根据步骤5)中所有绑定对的蛋白质残基和 的原子类型,将A和D分成M种绑定对组合方式,对每一种组合进行如下计算;
8)参数设置:设置种群规模NP,缩放因子F,交叉概率CR,最大迭代次数Gmax,初始化迭代次数g=0;
9)种群初始化:随机生成初始种群P={S1,S2,...,Si,...,SNP},Si=(si,1,si,2,si,3,si,4,si,5,si,6)为种群P的第i个个体,其中si,1、si,2和si,3的取值范围是 si,4、si,5与si,6的取值范围为0到2π;
10)对于种群中的每个个体Si,根据如下方式将蛋白质与ATP对接,并计算该个体的得分score(Si):
10.1)根据Si中的后三个元素si,4、si,5、si,6,计算三维空间旋转矩阵R:
10.2)将A中所有原子根据旋转矩阵R进行坐标旋转得到Ar;
10.3)根据Si中的前三个元素si,1、si,2、si,3,将Ar中的所有原子进行坐标平移得到Ap,过程如下:其中 分别是Ar中原子的X,Y,Z坐标,f=1,2,...,m,m是ATP中的原子个数;
10.4)根据步骤6),计算得分score(Si):
其中 是ATP中T类型原子与Y类型蛋白质绑定残基Cα原子的距离,∠YTY′h是ATP中T类型原子与其绑定的Y类型蛋白质绑定残基以及非绑定的Y'类型蛋白质绑定残基的Cα原子所形成夹角的角度;
11)根据差分进化算法,对种群P中的每个个体Si,i∈{1,2,…,NP}作如下处理:
11.1)从当前种群P中随机选择三个不同的个体Sa、Sb与Sc,其中a≠b≠c≠i,根据如下等式生成一个突变个体Smutant:Smutant=Sa+F·(Sb-Sc)
11.2)根据如下过程生成交叉个体Scross:
其中scross,j、smutant,j和si,j分别是Scross、Smutant和Si中的元素,j=1,2,...,6,jrand为1到6之间的随机整数,rand(0,1)为0到1之间的随机小数;
11.3)根据步骤10),分别计算Scross与Si对应的得分score(Scross)与score(Si);
11.4)如果score(Scross)<score(Si),则使用Scross替换种群P中的Si,否则Si保留在种群P中;
t
12)g=g+1;如果g>Gmax,则记录当前种群P中最低的得分score(Si) 和对应的ATP结构信息Atp,t=1,2,...,M;否则返回步骤12);
13)迭代步骤8)至步骤12),直到M种组合计算完成;从A1p,A2p,...,AMp中找出得分最低的结构信息作为最终的ATP结构信息输出。