欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2018101119976
申请人: 陕西师范大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种采用果蝇优化算法识别关键蛋白质的方法,其特征在于,包括以下步骤:

1)将蛋白质相互作用网络转化为无向图

将蛋白质相互作用网络转化为一个无向图G=(V,E),其中,V={v1,v2,…,vi,…,vn}为结点vi的集合,E为边e的集合,结点vi表示蛋白质,边e表示蛋白质之间的相互作用,n表示蛋白质结点的个数;

2)构建动态蛋白质相互作用网络

基因表达数据有三个周期,每个周期有12个时间点,在时间点t时,蛋白质vi的基因表达值FT(s)若大于基因表达阈值AT(s),则被认为蛋白质vi在时间点t具有活性,否则认为该结点在时间点t不具有活性;

将所有时间点的活性的蛋白质组合到一起,对应到原静态蛋白质相互作用网络中形成一个具有12个子网的新的蛋白质相互作用网络,即动态蛋白质相互作用网络;

3)对动态蛋白质相互作用网络的边和结点的预处理结点预处理包括计算结点的度、结点的局部平均连通性、在动态网络中结点的局部平均联通性以及结点的亚细胞定位得分;边的预处理包括计算边的聚集系数、边的功能相似性;然后计算得到新的中心性方法和动态网络中新的中心性方法;

4)随机初始化果蝇群体的位置

随机选取p个蛋白质作为一个果蝇,将p个蛋白质的序列号作为果蝇的位置,EP代表随机选取的p个蛋白质的集合;iter,maxiter分别表示当前迭代次数和最大迭代次数,iter=

1,matxiter=100;

5)利用嗅觉搜寻食物随机方向和距离

将EP与已知关键蛋白质标准库进行对比,令m为EP集合中关键蛋白质的个数,将EP集合之外的n-p个蛋白质的度进行降序排序,然后将EP中不是关键蛋白的p-m个蛋白质在n-p个蛋白质组成的降序排列集合中进行位置更新;

6)通过计算得到果蝇个体的味道浓度判定值S(q);

7)计算果蝇个体的味道浓度值

根据步骤6)求得的味道浓度的判定值S(q),将其带入味道浓度判定函数中,计算当前每个果蝇个体的味道浓度值smell(q);

8)找出当前种群中最高气味浓度值

根据味道浓度值smell(q),根据公式[bestSmellbestIndex]=max(smellq)找出果蝇群体中味道浓度值中的最大浓度值,式中,bestSmell为最大浓度值,bestIndex为最大浓度值的坐标;

9)利用视觉向食物飞去

判断当前种群味道浓度值bestSmell是否优于前一次迭代的最大味道浓度bestSmell,若是则保留最佳味道浓度的值和它的位置bestIndex,此时,果蝇利用视觉往该位置飞去;

iter迭代加1;

10)产生关键蛋白质

若iter的值小于等于maxiter,则转向步骤5);否则,将位置bestIndex中的蛋白质作为关键蛋白质输出。

2.根据权利要求1所述的采用果蝇优化算法识别关键蛋白质的方法,其特征在于,步骤

2)中,蛋白质vi的基因表达值FT(s)由式(1)得到:式中,T(s)代表蛋白质vi在时间点t的基因表达值;

基因表达阈值AT(s)由式(2)得到:

式中,μ(s)代表蛋白质vi的平均基因表达值,σ(s)是基因表达值的标准差。

3.根据权利要求1所述的采用果蝇优化算法识别关键蛋白质的方法,其特征在于,步骤

3)中,结点预处理具体包括:

按式(3)计算结点的度:

式中,n表示网络中蛋白质结点总数;当结点vi和vj之间有边相连时,aij的值为1,否则为

0;

按式(4)计算结点的局部平均连通性:

式中,Nv表示蛋白质v的邻居结点的集合,|Nv|表示蛋白质v的邻居结点的个数,Cv代表由Nv引导的子图, 代表在Cv中蛋白质u的局部联通;

按式(5)计算在动态网络中结点的局部平均联通性:式中,N代表了动态网络中时序网络的个数,LACi(v)表示在i时间点的LAC值,LAC代表了结点的局部平均连通性,由公式(4)得到,tim(v)代表了时序网络中包含蛋白质结点v的次数;

按式(6)计算结点的亚细胞定位得分:

式中,|v|代表蛋白质v在细胞核中出现的次数,|Cmax|是在细胞核中出现次数最多的蛋白质的次数;

边的预处理包括:

按式(7)计算边的聚集系数:

式中,Z(vi,vj)表示包含边(vi,vj)的三角形个数,di,dj分别是结点vi和vj的度;

按式(8)计算边的功能相似性:

式中, 是与蛋白质结点vi有关的GO术语k的S值, 是与蛋白质结点vj有关的GO术语k的S值;

按式(9)计算新的中心性方法:

式中,N(v)为蛋白质结点vi的邻居结点的集合,ECC是蛋白质结点vi和蛋白质结点vj之间的边聚集系数,由公式(7)得到;GO_sim(vi,vj)代表蛋白质结点vi和蛋白质结点vj之间的功能相似性系数,由公式(8)得到;

按式(10)计算动态网络中新的中心性方法:

式中,N代表了动态网络中时序网络的个数,EGi(u)代表了在时间点i时EG的值,EG代表了新的中心性方法,由公式(9)得到;tim(v)代表了时序网络中包含蛋白质结点v的次数。

4.根据权利要求3所述的采用果蝇优化算法识别关键蛋白质的方法,其特征在于,步骤

6)中,果蝇个体的味道浓度判定值S(q)由式(11)计算得到:式中,p代表EP候选集中关键蛋白质的个数,vi代表候选关键蛋白质集中的蛋白质结点,DLAC是动态网络中结点vi的局部平均连通性由公式(5)得到,DEG是动态网络中结点vi新的中心性方法由公式(9)得到。

5.根据权利要求3所述的采用果蝇优化算法识别关键蛋白质的方法,其特征在于,按照式(12)计算当前每个果蝇个体的味道浓度值smell(q):式中,α∈[0,1]用来调节拓扑特性和亚细胞定位信息在识别关键蛋白之中的比例,NSL(vi)由公式(6)得到。