1.一种基于深度学习Residue2vec的蛋白质结构预测方法,其特征在于:所述优化方法包括以下步骤:
1)给定输入序列信息;
2)构建模板库中的残基向量:
2.1)从蛋白质数据库网站上下载分辨率小于 的高精度蛋白质,其中 为距离单位, 米;去除相似度大于预设阈值的冗余多肽链,得到非冗余蛋白质模板库;
2.2)通过滑动窗口将非冗余蛋白质模板分割为长度为n的残基;
2.3)通过CBOW模型结合Huffman编码,在神经网络中对残基模型进行建模,同时也获得残基在向量空间中的表示;
2.4)针对查询序列中每个位置上的残基,通过残基向量计算距离来判断残基间的相似性;
2.5)选取与查询序列每个残基位置上距离最近的前N个残基,构建了查询序列的片段库;
3)初始化:最大迭代次数iteration,能量函数选用Rosetta Score3,温度为T,玻尔兹曼常数为k;
4)开始迭代,设置i=1:
4.1)通过Rosetta Score3能量函数计算构象能量为E1,随机选取构象中某一位置上长度为n的残基,随机从片段库中选一个残基片段将其替换;
4.2)计算片段替换后的残基能量E2,比较E1和E2,若E2
4.3)若构象在连续的预设次数迭代中均未改变时,则提高温度T来改变接收概率,当构象再次被接收时,温度恢复至初始值;
5)i=i+1,并判断i是否大于设定的最大迭代次数iteration,如果不满足则转至4.1);
如果满足,则输出结果。