欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019102689308
申请人: 浙江工业大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2023-12-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于接触图与模糊C均值聚类的蛋白质结构域划分方法,其特征在于,所述划分方法包括以下步骤:

1)输入待进行结构域划分的蛋白质序列信息,记作S;

2)使用RaptorX-Contact服务器对蛋白质序列S进行接触图预测,预测出的接触图信息记作 其中L表示蛋白质序列S的残基数目,mi,j∈{0,1}表示S中的第i残基Ri与第j个残基Rj的接触状态:mi,j=1表示两个残基接触,mi,j=0表示两个残基不接触;

3)对M中的任意元素mi,j,使用一个2k+1行2k+1列的权重矩阵W:进行如下处理,得到

其中

4)使用步骤3)将M中的所有元素依次进行处理,并使用得到的所有 组成一个新的接触图信息

5)使用 中第i列的所有元素组成蛋白质序列S中的第i个残基Ri的特征向量,记作

6)使用模糊C均值聚类算法,将所有xi聚类成N个簇,分别记作C1,C2,…,CN;

7)对于任意一个簇Cn,n=1,2,…,N,中的任意一个元素 进行如下操作:若 或也在Cn中,则 保留;否则将 从Cn中移除,并放入集合 中;

8)对 中的任意一个元素 进行如下操作:若 或 在Cn,n=1,2,…,N,中,则将放入Cn中;

9)对于任意一个簇Cn,n=1,2,…,N,进行如下操作:将Cn中的每个元素 对应的残基放入集合Dn中;

10)根据残基在蛋白质中的位置信息对每个集合Dn,n=1,2,…,N,中的所有残基进行排序;排序后的每个集合Dn,n=1,2,…,N,表示输入蛋白质中对应的一个结构域;

11)使用I-TASSER服务器分别对划分出的每个结构域进行结构预测。