欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2017109022480
申请人: 杭州电子科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种改进的基于协同过滤的miRNA-疾病关联预测方法,其特征在于将miRNA-疾病预测问题看作是一种推荐修补问题;基于已知miRNA疾病关联的二分网络,根据miRNA对相关疾病的已知偏好,推荐使用miRNA,反之亦然;通过整合相似的疾病语义,将miRNA功能相似性纳入网络工作并建立孤立顶点;具体的:首先定义和计算测量一种疾病对另一种疾病的重要性矩阵SIGd;当疾病d(i)认为疾病d(j)更重要时,SIGd(d(i),d(j))的得分更高;当一种疾病在评估潜在相关的miRNA时,会从对miRNA的优先性高度重视的疾病中获得更多的建议;类似地定义和计算SIGr以测量两种miRNA的重要性;其次使用显著矩阵和相似矩阵作为权重来计算得分;相似性矩阵被定义为表示miRNA或疾病之间的相似性,则miRNA-疾病关联的最终得分是miRNA与疾病的评分分数和该疾病对miRNA的评分评分的总和。

2.根据权利要求1所述的一种改进的基于协同过滤的miRNA-疾病关联预测方法,其特征在于具体实现步骤如下:步骤1:从HMDD数据库下载人类已知的miRNA与疾病相关联的数据;构建Matrix A来代表疾病和miRNA之间的关联,当疾病d(i)和miRNAm(j)被验证为相关时,条目A(d(i),m(j))被设置为1;其他未经确认的条目设置为0;变量nm,nd分别表示数据库中miRNA和疾病的数量;

根据HMDD数据库,使用的Matrix A有383种疾病和495种miRNA,5430种经实验验证的miRNA-疾病关联;

步骤2:建立疾病语义相似模型Ⅰ;

通过两个模型来计算疾病之间的语义相似性;使用DAG代表疾病,对于特定疾病D,DAG(D)=(D,T(D),E(D)),其中节点集T(D)包含疾病节点本身及其祖节点,E(D)表示父节点直接到子节点的边集;DAG(D)描述了这种疾病节点及其祖先疾病,而边缘将父节点链接到子节点;疾病D的语义价值定义如下:其中Δ是语义贡献衰落参数;语义贡献随着疾病距离的增加而减小;疾病语义相似性评分是基于疾病DAG之间的共同子图的测量来计算的;语义相似矩阵SS1定义如下:步骤3:建立疾病语义相似性模型Ⅱ;

在疾病语义相似模型Ⅰ中,DAG(D)相同深度的不同祖先疾病具有相同的语义贡献;但是,DAG中较不常见的疾病应该比其他疾病更为重要,因为它更具体;定义的疾病语义相似性和疾病D的语义价值的第二个模型计算如下:D′D(d)=-log(the number of DAGs including d/nd)      (5)疾病语义相似性评分测量不同DAG之间共享部分的大小;语义相似性的矩阵SS2定义如下:疾病语义相似度的最终语义相似性矩阵是计算上述两个语义相似性矩阵SS1和SS2的平均值,并定义如下:步骤4:建立miRNA功能相似性矩阵FS;

功能相似的miRNA通常参与类似的疾病过程,反之亦然;因此,引入miRNA功能相似性矩阵FS来提高计算模型的准确性;通过测量评估两组miRNA相关疾病的语义相似性,能够得出miRNA U和miRNA V之间的相似性可能性得分;

步骤5:基于双向协同过滤对miRNA-疾病关联预测

将miRNA-疾病关联预测问题看作是基于双向一类协同过滤的推荐问题;基于不同用户的偏好,通过协同过滤算法向用户推荐项目。

3.根据权利要求2所述的一种改进的基于协同过滤的miRNA-疾病关联预测方法,其特征在于步骤4所述的相似性可能性得分计算过程如下:

4-1.计算语义疾病du和dv之间的相似性;

4-2.计算疾病du与DTV,疾病dv和DTU之间的相似性;DT表示与miRNA相关的疾病的集合;

4-3.计算miRNA U和miRNA V之间的功能相似性;其中S(du,dv)由(7)和下列式子给出:S(LN,DTv)=max(SS(LN,PN),SS(LN,BN))   (8)miRNA功能相似性矩阵FS是对称的,且其对角线上均为1;条目FS(m(i),m(j))记录miRNAm(i)和miRNAm(j)之间的相似性。

4.根据权利要求3所述的一种改进的基于协同过滤的miRNA-疾病关联预测方法,其特征在于步骤5具体如下:在miRNA疾病协会预测问题中,疾病或miRNA被看作是用户,而另一种则被看作是物品;

疾病和miRNA之间的联系代表了被认为是体重的已知关联;尝试将miRNA推荐给疾病,反之亦然;使用邻接矩阵A来表示二分法网络;矩阵F表示输出等级矩阵;两个矩阵具有nd行和nm列;为了进行协同过滤,将Sig(d(i),d(j))定义为疾病d(j)和疾病d(i)其意义及定义如下:sig(d(i),d(j))=fsrc(d(i))*fdst(d(i))*∑m(k)flink(m(k))   (10)定义是基于两个疾病共享更多已知的相关miRNA的意义更大的假设;使用K(v)来表示连接到顶点v的边的数量;有意义的定义的三个部分解释如下:首先fsrc(d(i))=1/K(d(i)),是用户d(i)的体验;如果他已经买了更多的物品,他们能够说一个用户更有经验,他会考虑更多的建议;但他认为的建议越多,每个建议的质量就越低;

其次,fdst(d(j))=1/(K(d(j))-M(d(i),d(j))+1)是用户d(i)与用户d(j)的相似度;矩阵M记录两个用户之间的公共选定项目;用户d(j)选择的项目越多,用户d(i)考虑的偏好就越小;另一方面,如果两个用户共享大量选择的项目,则相似度很高;

再其次,项目m(k)的贡献定义为flink(m(k))=1/K(m(k)),这是m(k)的程度的倒数,因为购买量少的的项目提供更多的信息;

然后每种疾病对miRNA m(k)的偏好通过Sig(d(i),d(j))加权的方程式(11)表示;

引入相似矩阵来改进协同过滤算法;由于潜在的miRNA疾病关联,通过添加两个方向的推荐评分来评估一个关联,具体如下:首先,计算有效性矩阵和相似度矩阵;

然后,将有效性矩阵和相似矩阵作为推荐算法的加权矩阵;

最后,将加权矩阵乘以相邻矩阵,以推荐miRNA的疾病,并分别为疾病推荐miRNA;如果miRENA喜欢该疾病或该疾病倾向于miRNA,则miRNA-疾病关联得分更高;最终得分如式(12)所示计算:F=(Sigd+SS)*A+A*(Sigm+FS)         (12)。