欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019113564734
申请人: 湖南师范大学
专利类型:发明专利
专利状态:已下证
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于蛋白质成簇特性和活性共表达的关键蛋白质识别方法,其特征在于,包括以下步骤:a.利用边聚集系数描述蛋白质相互作用网络成簇的特性;

b.通过设置阈值参数来设定基因活性表达,并采用布尔值描述;

c.基于基因活性表达的布尔值定义了计算方法,利用Jaccard系数来计算活性共表达的得分;

d.基于蛋白质成簇特性和活性共表达得出的关键性综合得分并输出排序结果;具体为通过结合边聚集系数计算的成簇特性和Jaccard相关系数计算的活性共表达得分得出关键性综合得分,然后对所有蛋白质按照关键性综合得分排序并输出排序结果;边聚集系数和Jaccard相关系数的结合计算关键性综合得分公式如下:Jc(i,j)=J(i,j)*ECC(i,j),其中J(i,j)表示的是Jaccard相关系数计算出来的得分,ECC(i,j)表示的是边聚集系数计算出来的得分,所述边聚集系数的公式如下:其中 表示的是PPI网络中由边(i,j)参与形成的实际三角形的个数,ki和kj表示的是蛋白质i和蛋白质j的度的个数,min(ki‑1,kj‑1)表示的是蛋白质i和蛋白质j的度的最小数决定的可能形成的三角形的个数;

对于蛋白质i,定义它的JDC值为该蛋白质与其领域属于同一簇的概率之和,其计算公式如下:其中Di表示的是蛋白质i的所有邻域,JDC度量出来的值取决于

具有成簇特性的蛋白质活性共表达的相似性。

2.根据权利要求1所述的基于蛋白质成簇特性和活性共表达的关键蛋白质识别方法,其特征在于,步骤b中阈值参数根据基因表达数据的均值和标准差来计算的,阈值参数来设定基因活性表达为大于阈值参数的基因活性为1,小于等于阈值参数的基因活性为0。

3.根据权利要求2所述的基于蛋白质成簇特性和活性共表达的关键蛋白质识别方法,其特征在于,阈值参数计算公式如下:其中U(i)表示的是基因i表达数据的平均

表达程度,σ(i)表示的是基因i表达数据的标准差,V(i)表示的是蛋白质i表达数据的波动性,S(i)表示的是基因i确定的阈值参数。

4.根据权利要求3所述的基于蛋白质成簇特性和活性共表达的关键蛋白质识别方法,其特征在于,步骤c中Jaccard相关系数的值在0到1的范围内,基因i和基因j的活性共表达的公式为:其中S(i),S(j)表示的是基因i和j二值化后的基因表达数据。

5.根据权利要求1‑4任一项所述的基于蛋白质成簇特性和活性共表达的关键蛋白质识别方法,其特征在于,蛋白质的蛋白质相互作用网络数据和基因表达数据从公共数据库中获得,所述的公共数据库包括DIP和NCBI数据库。