欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2018116434615
申请人: 陕西师范大学
专利类型:发明专利
专利状态:已下证
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于混合蛙跳算法识别关键蛋白质的方法,其特征在于,包括以下步骤:

1)将蛋白质相互作用网络转化为无向图

将蛋白质相互作用网络转化成一个无向图G=(V,E),其中,V={vi,i=1,2,…,n}为结点vi的集合,E为边e的集合,结点vi表示蛋白质,边e表示蛋白质之间的相互作用;

2)对蛋白质相互作用网络中的边和结点进行处理

计算蛋白质结点的局部平均连通性LAC、蛋白质结点的亚细胞定位分值SC和蛋白质复合物分值PC,计算连接两蛋白质结点的边的结构相似性SS和功能相似性FS;

连接两蛋白质结点的边的权值由式(9)得到:

Weij=SSij×FSij                       式(9)其中,SSij为连接两蛋白质结点的边的结构相似性,按照式(7)计算:式中,Γ(i),Γ(j)分别表示结点vi,vj的邻居结点集再加上vi,vj;

FSij为连接两蛋白质结点的边的功能相似性,按照式(8)计算:式中,g(i),g(j)分别表示注释结点vi和vj的GO术语集合每个蛋白质结点的最终权值FnW(vi)由式(10)得到:其中,InW(vi)为每个蛋白质结点的初始权值,由式(6)得到:InW(vi)=SC(vi)×PC(vi)                式(6);

3)随机产生初始青蛙种群

令F为青蛙种群规模,C为需要识别的候选关键蛋白质的数目,即一只青蛙个体的长度,将所有蛋白质结点按照LAC值降序排序,为缩小关键蛋白质的搜索范围,取前2×C个LAC值中大的结点来产生初始种群,TopV为这些蛋白质结点集合;

4)全局搜索过程,将蛙群划分族群

按青蛙个体的适应值Essentiality(f)对青蛙种群进行降序排序,其中f=1,2…F,记录适应值最高的青蛙Px,把F只青蛙分配到m个族群Y1,Y2,…,Ym中去,满足Yk=[X(j)|X(j)=X(k+m×(j‑1)),j=1,2,…,n,k=1,2,…,m],其中,X(j)表示排序后蛙群中的第j只青蛙;

青蛙个体的适应值Essentiality(f)由式(11)得到:

5)在每个族群中进行元进化,即进行局部搜索:k,iter分别表示族群计数器和局部进化计数器,分别用来与族群总数m和局部最大进化次数maxiter进行比较,k=1,iter=1,maxiter∈[50,100];

6)将所有族群的青蛙进行混合,按新的适应值对所有青蛙个体重新进行排序和族群划‑4分,并记录新的全局最优青蛙个体Px(新),如果Px(新)和Px的适应值之差不小于10 ,转向步骤5);否则,转向步骤7);

7)产生关键蛋白质

将最优青蛙个体中的蛋白质作为关键蛋白质输出。

2.根据权利要求1所述的基于混合蛙跳算法识别关键蛋白质的方法,其特征在于,步骤

2)中,蛋白质结点的局部平均连通性LAC由式(1)得到:式中, 表示结点vi的邻居结点集, 是由 中的结点构成的子图, 表示集合 中的任一结点vj在子图 中的邻居结点的数目。

3.根据权利要求1所述的基于混合蛙跳算法识别关键蛋白质的方法,其特征在于,蛋白质结点的亚细胞定位分值SC由式(2)得到:式中,Cl表示一种亚细胞组分,l=1,2…11,SI(Cl)表示亚细胞组分Cl的重要性得分,由式(3)得到:式中,num()代表Cl中所包含的关键蛋白质的数目,Tnum代表的是关键蛋白总数目;

按式(4)计算蛋白质结点的蛋白质复合物分值:

式中,F(vi)表示结点vi出现在已知蛋白质复合物中的频率,由式(5)得到,FM是所有蛋白质结点中出现在已知蛋白质复合物中的最大频率;

式中,N代表已知蛋白质复合物总数目,若蛋白质结点出现在蛋白质复合物Pt中,则Pt(i)=1,否则Pt(i)=0;

每个蛋白质结点的初始权值由式(6)得到:

InW(vi)=C(vi)×PC(vi)式(6)。

4.根据权利要求1所述的基于混合蛙跳算法识别关键蛋白质的方法,其特征在于,步骤

5)具体操作如下:

5‑1)对第k个青蛙族群中的蛙进行局部思想交流,即进行局部更新,k=k+1;

5‑2)在青蛙族群Yk中,选出s只青蛙进入子族群sub_Yk,s

5‑3)根据子族群中局部最优青蛙Pb来更新最差青蛙Pw的位置,对于最差青蛙个体Pw,判断它的每一维分量蛋白质是否出现在局部最优青蛙个体Pb中,如若出现,则使该分量蛋白质保持不变;否则的话,选取Pb中的一个分量蛋白以一定概率进行替换,即最差青蛙Pw的位置根据公式Pnl1=update1(Pw,Pb,r1)进行更新,式中r1为用Pb中的分量蛋白质对Pw中的蛋白质进行替换的概率,Pnl1为最差青蛙Pw根据局部最优青蛙Pb更新之后的新位置;

5‑4)如果通过步骤5‑2)改进了最差青蛙的位置,即最差青蛙在新位置上的适应值比原位置上的适应值高,就用新产生的位置Pnl1取代原来的位置Pw,否则就采用全局最优青蛙Px重新更新最差青蛙个体的位置,判断最差青蛙个体Pw每一维分量蛋白质是否出现在全局最优青蛙个体Px中,如若出现,则使该分量蛋白质保持不变;否则的话,选取Px中的一个分量蛋白进行替换,即最差青蛙Pw的位置根据公式Pnl2=update2(Pw,Px,r2)进行更新,式中r2为用Px中的分量蛋白质对Pw中的蛋白质进行替换的概率,Pnl2为最差青蛙Pw根据全局最优青蛙Px更新之后的新位置;

5‑5)如果通过步骤5‑3)改进了最差青蛙的位置,即最差青蛙在新位置上的适应值比原位置上的适应值高,就用新产生的位置Pnl2取代原来的位置Pw,否则随机产生处于湿地中的任意位置的蛙来替代最差的蛙,即最差青蛙Pw的位置根据公式Pnl3=update3(Pw,TopV,r3)进行更新,式中r3为Pw中的每一维分量蛋白质被替换的概率,Pnl3为最差青蛙Pw随机更新之后的新位置;

只要执行以上步骤5‑3)、步骤5‑4)和5‑5中的任何一次更新,都要重新计算本子群的最优青蛙个体Pb和最差青蛙个体Pw;

5‑6)如果iter<=maxiter,则转向步骤5‑2);

5‑7)如果k<=m,则转向步骤5‑1),否则转向步骤6。

5.根据权利要求4所述的基于混合蛙跳算法识别关键蛋白质的方法,其特征在于,步骤

5‑3)中,最差青蛙Pw的位置更新后得到的新位置Pnl1的计算方法采用算法update1(Pw,Pb,r1),具体方法如下:Step1:找出在Pb中出现,未在Pw中出现的蛋白质集合Pset1;

Step2:对于分量蛋白质vi∈Pw,判断是否在Pb中出现;

Step3:如果 并且随机数rand>r1,则从集合Pset1随机选取一个蛋白质vj替换vi,并且Pset1=Pset1‑{vj};

Step4:重复Step 2‑3,直到Pw中所有的蛋白质都判断完毕。

6.根据权利要求4所述的基于混合蛙跳算法识别关键蛋白质的方法,其特征在于,在步骤5‑4)中,最差青蛙Pw的位置更新后得到的新位置Pnl2的计算方法采用算法update2(Pw,Px,r2),具体方法如下:Step1:找出在Px中出现,未在Pw中出现的蛋白质集合Pset2;

Step2:对于分量蛋白质vi∈Pw,判断是否在Px中出现;

Step3:如果 并且随机数rand>r2,则从集合Pset2随机选取一个蛋白质vj替换vi,并且Pset2=Pset2‑{vj};

Step4:重复Step 2‑3,直到Pw中所有的蛋白质都判断完毕。

7.根据权利要求4所述的基于混合蛙跳算法识别关键蛋白质的方法,其特征在于,在步骤5‑5)中,最差青蛙Pw的位置更新后得到的新位置Pnl3的计算方法采用算法update3(Pw,TopV,r3),具体方法如下:Step1:找出在TopV中出现,未在Pw中出现的蛋白质集合Pset3;

Step2:对于分量蛋白质vi∈Pw,判断是否在TopV中出现;

Step3:如果 并且随机数rand>r3,则从集合Pset3随机选取一个蛋白质vj替换vi,并且Pset3=Pset3‑{vj};

Step4:重复Step 2‑3,直到Pw中所有的蛋白质都判断完毕。