1.一种基于构象多样性采样的蛋白质个体空间优化方法,其特征在于,所述方法包括以下步骤:
1)输入预测蛋白质的序列信息,读取序列长度L;设置参数:种群N,迭代次数G,交叉概率Pc;
2)根据目标蛋白序列信息,利用Robetta构建片段库,利用PSIPRED预测目标序列的二级结构信息;
3)迭代Rosetta第一、二阶段,生成具有N个个体的初始种群
4)设g=0,其中g∈{1,2,...,G};
5)若g=0,对种群中的个体进行片段组装,生成新的种群P={P1,P2,...,PN};
6)基于Rosetta协议第三、四阶段,分别执行步骤7)至步骤11);
7)对种群中的个体随机两两配对,形成N/2个父本对;
8)交叉操作,过程如下:
8.1)设P1*、 为两个父本个体,随机选择一段loop区域;
8.2)产生一个随机小数r1,r1∈[0,1],若r1<Pc,交换P1*、 中选定loop区域的所有残基二面角,生成两个新的个体P1′、P′2;
8.3)迭代步骤8.1)和8.2),直至所有父本对交叉完成,生成新的种群P′={P1′,P′2,...P′N};
9)变异操作,过程如下:
9.1)对种群P′中的个体Pi′,产生一个随机整数r2,r2∈[0,L-3],从该对应的3残基片段库中随机选择一个片段进行替换;
9.2)迭代步骤9.1),直至所有个体完成变异,生成新的种群P″={P1″,P″2,...P″N};
10)选择操作,过程如下:
10.1)产生一个随机小数rb,rb∈[0,1],若rb<0.5,用能量函数对父代种群P和子代种群P″中的个体进行打分,将个体按能量由低到高排序,选出能量低的前N条个体作为下一代种群;否则,执行步骤10.2);
10.2)按如下公式计算父代种群P和子代种群P″中所有个体的多样性:diversity(Ci)=max{RMSDdif(Ci,Cj)|Cj∈{P∪P″},Ci≠Cj}其中 RMSE′ato表示个体Ci和个体Cj氨基酸序列为0~L/2对应结构的相似性,RMSE″ato表示个体Ci和个体Cj氨基酸序列为L/2~L对应结构的相似性;
C′i和C′j表示个体Ci和个体Cj氨基酸序列为0~L/2对应的结构;
C′i和C′j表示个体Ci和个体Cj氨基酸序列为0~L/2对应的结构;
和 分别表示C′i和C′j中第i个原子的三维坐标,L为结构的序列长度,最后将个体按照多样性大小由高到低排序,选出多样性最大的前N条个体作为下一代种群;
11)g=g+1,若g≤Gmax,转至步骤7),否则结束循环;
输出预测结果。