1.一种快速精确的蛋白质绑定口袋结构对齐方法,其特征在于,所述对齐方法包括以下步骤:
1)输入待对齐的两个蛋白质绑定口袋结构信息,分别记作A和B;
2)分别抽取两个蛋白质绑定口袋中所有残基的中心碳原子Cα的坐标信息,记为与 其中 与 分别表示A与B中的第i个与第j个残基的Cα的坐标信息,N与M分别是A与B的残基数目;
A A
3)对P中的每个元素 计算它与P中其它元素的欧氏距离,并将这些距离值按照从小到大排序,选择最小的K个值作为元素 的特征向量,记作其中K≤N且K≤M;
B B
4)对P中的每个元素 计算它与P中其它元素的欧氏距离,并将这些距离值按照从小到大排序,选择最小的K个值作为元素 的特征向量,记作其中K≤N且K≤M;
5)计算蛋白质绑定口袋A与B的初始化的打分矩阵,记作Minit:其中, 表示 中的第k个元素, 表示 中的第k个元素,Minit(i,j)表示矩阵Minit中的第i行第j列中的值;
6)使用贪心算法在初始化打分矩阵Minit上搜索一个初始化的残基对齐信息,记作Aliinit,其中打分矩阵Minit中的任意一行或一列至多只能有一个元素被贪心算法选中,且贪心算法每次都会选择Minit中可选元素中的最大值,若Minit中第i行第j列元素被选中,则表明在Aliinit中A的第i个残基与B的第j个残基是对齐的;
7)根据Aliinit信息,使用Kabsch算法计算A与B已对齐残基的Cα坐标之间的旋转平移矩阵,并使用该旋转平移矩阵叠加A与B的结构,使得A与B重叠,再通过下式计算得到一个新的打分矩阵,记作Mnew:
其中, 表示A中第i个残基的Cα原子与B中第j个残基的Cα原子经过旋转平移后的欧氏距离,Mnew(i,j)表示矩阵Mnew中的第i行第j列中的值;
8)使用贪心算法在新的打分矩阵Mnew上搜索一个新的残基对齐信息,记作Alinew,如果Alinew与Aliinit一致,将Alinew作为最终的对齐信息Alifinal,否则使用Alinew更新Aliinit,然后返回步骤7)。
2.如权利要求1所述的一种快速精确的蛋白质绑定口袋结构对齐方法,其特征在于,所述步骤8)中,将Alinew作为最终的对齐信息Alifinal,根据Alifinal,计算蛋白质绑定口袋A和B的结构相似性,记作Sim:
其中,(i,j)表示A的第i个残基与B的第j个残基在Alifinal中是对齐的, 表示A中第i个残基的Cα原子与B中第j个残基的Cα原子经过与Alifinal对应的旋转平移后的欧氏距离,为尺度函数,a、b、c均为参数。