1.一种蛋白质表面残基的快速确定方法,其特征在于,所述快速确定方法包括以下步骤:
1)输入待确定表面残基的蛋白质结构信息,记作A;
2)将A中的每个残基的中心碳原子Cα看做是笛卡尔坐标系下的一个坐标点,记作R={R1,R2,…,RN},其中Ri为表示A的第i个残基的Cα的坐标点,N是A的残基数目;
3)从蛋白质结构信息A中,抽取R中所有坐标点的坐标信息,记为P={p1,p2,…,pN},其中pi=(xi,yi,zi)T表示坐标点Ri的坐标信息,xi、yi与zi分别表示坐标点Ri在笛卡尔坐标系下的三个维度信息,T表示向量的转置;
4)计算R中所有坐标点的中心点O的坐标信息,记作o:
并计算R中所有坐标点与O之间的欧氏距离,记作D={d1,d2,…,dN},其中di表示坐标点Ri与O之间的欧氏距离;
5)针对R中的任意两个不同坐标点Ri与Rj,计算它们与O组成的角∠RiORj的余弦值其中,||·||为向量的模运算符;
6)计算R中距离最远的两个坐标点的距离,记作df:
并根据计算得到的df,计算阈值thcos:
thcos=cos(2·arcsin(k/df))
其中,k为控制thcos大小的参数,cos与arcsin分别为余弦与反正弦运算符;
7)选择D中值最大的元素,记为di′,并将其对应坐标点Ri′对应的残基标记为表面残基,然后将元素di′从D中移除,再将Ri′从R中移除,最后检查R中余下的每一个坐标点Rj,若大于thcos,则将Rj标记为非表面残基,从R和D中移除Rj与dj;
8)若D中元素数目不为0,返回步骤7),否则,将A中所有残基是否为表面残基的标记信息返回。