欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2018115502973
申请人: 长沙学院
专利类型:发明专利
专利状态:已下证
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于张量随机游走的关键蛋白质识别方法,其特征在于,包括以下步骤:S1:获取酵母蛋白质相互作用网络拓扑结构、蛋白质结构域信息、基于时间序列的基因表达信息以及蛋白质同源信息;

S2:根据蛋白质相互作用网络拓扑结构、蛋白质结构域信息以及基于时间序列的基因表达信息,建立蛋白质节点相互作用中不同蛋白质节点间的关联关系;根据所述蛋白质同源信息对蛋白质节点的枢纽得分进行初始化;

S3:以蛋白质相互作用中不同蛋白质节点间的关联关系建立张量模型;

S4:基于所述张量模型进行迭代计算得到每个蛋白质节点的枢纽得分并进行排序,将序列排行前n个蛋白质节点作为关键蛋白质;

所述蛋白质节点的枢纽得分的计算公式如下:其中N(v)表示蛋白质节点v在参考物种S中拥有直系同源蛋白质的次数;

蛋白质节点的枢纽得分与邻居节点枢纽得分和边重要性得分相关联;

对随机游走算法进行一次扩展得到的二维张量模型的两个状态转移模型为:其中, 表示访问第j个蛋白质节点和选中第k种类型边时,下一刻访问第i个蛋白质节点的概率, 表示从第j个蛋白质节点出发到第i个蛋白质节点,选中第k种类型的边的概率,n表示蛋白质数量,m表示蛋白质之间存在m种类型的联系。

2.根据权利要求1所述的一种基于张量随机游走的关键蛋白质识别方法,其特征在于,通过聚集系数计算蛋白质相互作用网络中不同蛋白质节点间的关联关系的计算公式如下:Ni和Nj分别表示蛋白质节点pi和蛋白质节点pj的邻居节点的集合,Ni∩Nj表示蛋白质节点pi和蛋白质节点pj的共同邻居节点集合。

3.根据权利要求1所述的一种基于张量随机游走的关键蛋白质识别方法,其特征在于,根据蛋白质结构域信息计算不同蛋白质节点间的关联关系的计算公式如下:Weight(pi,pj)=P_D(pi)×P_D(pj)其中,D表示不同结构域构成的集合,Dj表示包含结构域j的蛋白质数量;如果蛋白质pi包含结构域j,则tij=1,则否为0。

4.根据权利要求1所述的一种基于张量随机游走的关键蛋白质识别方法,其特征在于,根据时间序列的基因表达信息计算不同蛋白质节点间的关联关系的计算公式如下:一个给定蛋白质v,它的n个不同时刻的基因表达可以用一个向量表示:Gen(v)={T(v,

1),T(v,2),...,T(v,n)},其中,T(v,i)表示基因v在第i时刻的表达水平。

5.根据权利要求1所述的一种基于张量随机游走的关键蛋白质识别方法,其特征在于,所述张量模型由随机游走算法扩展得到,扩展的方式为模拟高阶马尔可夫链的方式进行扩展。

6.根据权利要求1所述的一种基于张量随机游走的关键蛋白质识别方法,其特征在于,对所述张量模型进行迭代计算每个蛋白质节点的枢纽得分包括以下步骤:S401:根据节点枢纽得分由邻居节点枢纽得分和与之相连的边的重要性共同决定的原则,计算节点的枢纽得分如下:

其中,yL(i)表示节点i在第L步迭代时的枢纽得分,d为跳转概率,此处可以设置为y0(i);

S402:根据重要性边连接两个高枢纽得分节点的原则,计算不同类型边的重要性得分如下:

S403:如果||YL‑YL‑1||+||ZL‑ZL‑1||≥ε,使L=L+1,返回S401继续进行迭代,否则,迭代终止。