欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2018109937499
申请人: 浙江工业大学
专利类型:发明专利
专利状态:已下证
更新日期:2023-12-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于有偏采样的蛋白质结构预测方法,其特征在于,所述方法包括以下步骤:

1)给定输入序列信息;

2)利用PSIPRED平台预测目标蛋白的二级结构信息,利用ROSETTA平台构建9片段的片段库;

3)选取Rosetta score3能量函数E(x);

4)参数初始化:设置种群规模Ps,迭代计数器g,最大遗传代数Gmax,初始种群搜索轨迹长度N,交叉片段长度c;

5)初始化种群:启动Ps条Monte Carlo轨迹,每条轨迹搜索N次,即生成Ps个初始个体;

6)对每个目标个体xi,i∈{i=1,2,. ..,Ps}进行如下操作:

6.1)随机选择一个个体xj,j∈{1,2,...,Ps}且j≠i,进行交叉操作:

6.1.1)产生一个随机整数r∈[1,l‑c],确定出交叉区域[r,c+r],其中l为序列长度;

6.1.2)根据预测的二级结构知识,确定出目标蛋白在区域[r,c+r]中对应的二级结构Src={qk|r≤k≤r+c},其中,qk∈{H,E,L}是在目标蛋白中预测的第k氨基酸对应的二级结构类型;

6.1.3)利用DSSP测定个体xi的二级结构,并确定出交叉区域对应的二级结构序列其中, 是构象xi中第k个残基对应的二级结构类型;

6.1.4)根据公式 计算个体xi中交叉片段的得分,其中,f(k)根据如下公式计算:

其中,pk代表在预测的二级结构知识中第k个氨基酸的二级结构被预测为qk的置信度;

6.1.5)与步骤6.1.3)同理,确定出个体xj中区域[r,c+r]对应的二级结构序列

6.1.6)与步骤6.1.4)同理,计算个体xj中交叉片段的二级结构得分 6.1.7)比较与 的大小,如果 则xi′=xi,并进入步骤6.2),否则,执行步骤6.1.8);

6.1.8)用个体xj中[r,c+r]区域的扭转角度依次替换个体xi中对应区域的扭转角,生成交叉个体xi′;

6.2)对个体x′i进行如下的变异操作:

6.2.1)随机产生一个整数u∈[1,l‑9],进而确定出个体x′i的片段插入窗口[u,9+u]以及片段库中对应的片段 其中h是片段库中对每一个片段的编号;

6.2.2)根据片段库中的信息确定出在第u个位置处,每个片段 的二级结构其中, 是片段库中第h个片段的第t个氨基酸对应的二级结构类型;

6.2.3)与步骤6.1.4)同理计算得到在第u个位置处,片段库中每个片段 的二级结构得分

6.2.4)根据公式 计算在第u个位置处每个片段的适应值;

6.2.5)以 为每个片段的适应值,利用轮盘赌的方式随机选取一个片段,并用该片段的扭转角替换个体x′i中的扭转角,生成变异分体x″i;6.3)根据能量和二级结构得分进行如下的选择操作:

6.3.1)利用DSSP分别测定出个体xi和x″i的二级结构序列 和

6.3.2)与步骤6.1.4)同理,分别计算个体xi和x″i的二级结构得分ssi和ss″i;

6.3.3)比较ssi和ss″i的大小,如果ssi<ss″i,则变异个体x″i换个体xi,并作为下一代的目标个体,执行步骤7),否则执行步骤6.3.4)和步骤6.3.5);

6.3.4)根据Rosetta score3函数分别计算个体xi和x″i的能量E(xi)和E(x″i);

6.3.5)比较E(xi)和E(x″i)的大小,如果E(x″i)<E(xi),则变异个体x″i换个体xi,并作为下一代的目标个体,执行步骤7),否则个体xi被保留,并作为下一代的目标个体,执行步骤7);

7)对种群中的每一个个体都执行完步骤6)以后,迭代次数g=g+1,判断g是否大于Gmax,若g>Gmax,则停止迭代并退出,否则返回步骤6)。