欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2018107634078
申请人: 浙江工业大学
专利类型:发明专利
专利状态:已下证
更新日期:2023-12-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于片段重采样的群体蛋白质结构预测方法,其特征在于:所述方法包括以下步骤:

1)参数设置:设置初始构象个数N,初始种群NP,交叉概率CR,交叉代数G,最大迭代次数Gmax,平均残基对距离分数的阈值δ,聚类中心个数X,每个残基位置的片段数量M,设置能量函数;

2)输入目标蛋白质序列,使用PSIPRED服务器预测目标序列的二级结构,得到每个残基的二级结构,标记二级结构为Loop类型的残基,运行Rosetta得到N个目标蛋白质的候选构象,使用能量函数计算N个构象的能量,挑选出前NP个能量较低的构象作为初始种群P;

3)种群交叉操作,过程如下:

3.1)对种群P中的NP个个体两两配对,组成NP/2对,并对其编号a1,a2,...,aNP/2,其中aj,j∈[1,NP/2]表示第j组;

3.2)随机选择其中的一组aj,根据交叉概率CR判断是否对这两个个体进行交叉,若交叉,则随机选取这一组个体对应的Loop区域进行交换生成两个新的子代,否则,保留aj中个体不变,遍历所有组后得到交叉后的种群P′;

4)把交叉后得到的种群P′和初始种群P合并到一起,使用能量函数计算合并种群P′UP中所有个体的能量,挑选出能量较小的前NP个个体,并令G=G+1;

5)判断是否到达最大迭代次数Gmax,若G≤Gmax,则返回步骤3);若G>Gmax,则执行步骤

6);

6)根据平均残基对距离分数提取新的片段,过程如下:

6.1)选择一个构象,计算这个构象每个残基与其它NP‑1个构象对应位置残基的平均残基对距离分数,依次选择每个构象,直到计算完所有构象的平均残基对距离分数,使用如下计算公式:

其中,i表示选择的残基编号,j表示构象的编号,k表示除了构象j之外的其它所有的构象的编号,n表示构象总数量,Xij,Yij,Zij表示这个残基Cα原子的笛卡尔坐标;

6.2)在目标蛋白质序列上设置一个3或9个残基长度的滑动窗口,计算这个窗口对应的

3残基或者9残基片段的平均残基对距离分数,对蛋白质序列上的每个残基,从被选择的构象与其它构象中产生3片段或者9片段的片段库;

7)对每个残基位置上得到的片段,首先去除平均残基对距离分数大于δ的片段,然后使用K均值方法聚类,得到X个聚类中心,根据聚类中心的大小数量,成比例的从X个聚类中心选择M个片段,构建新的片段库;

8)使用得到的新的片段库,再次运行Rosetta产生N个构象,使用能量函数计算构象的能量,挑选出能量最低的构象输出,得到最终的目标蛋白的三维结构。