1.一种基于协同滤波的MiRNA-疾病关联预测方法,其特征在于包括如下步骤:步骤1、获取记录疾病和miRNA之间的关系的邻接矩阵;
根据疾病和miRNA之间的验证得到连接图,并将连接图作为输入,邻接矩阵是根据连接图获取得到的;设d(i)为第i种疾病,m(j)为第j个miRNA,A(i,j)为邻接矩阵;如果miRNA和疾病之间存在关系,则矩阵中相应位置的元素数字为1,否则元素数字为0;依据这种规则同时基于连接图来得到邻接矩阵A(i,j);
步骤2、获取重要性矩阵,具体参看如下三个因素:⑴.考虑了与某种疾病相关的多种miRNA的数目;
此因素由某种疾病与多种miRNA的边缘连接程度体现;用符号K(d(i))来表示疾病d(i)与之相关的miRNA的边缘连接程度,fs(d(i))代表与某种疾病相关的多种miRNA因素:fs(d(i))代表了与第i种疾病d(i)相关的miRNA因素;在已验证的miRNA疾病关系中,如果该种miRNA与多种相似的疾病有关系,此种miRNA也将会为其他类似的疾病起到指导作用;
⑵.疾病之间的相似性;
引入符号M(d(i),d(j))来表示与疾病d(i)和疾病d(j)都有关联的miRNA;fo(d(j))表示为疾病d(j)与疾病d(i)的相似性:如果两种疾病与之相关的miRNA种类相同数目越多,则它们的相似性越高,因此两种相似疾病之间的重要性高;同时,一种疾病d(j)选择的miRNA越多,另一种疾病d(i)所考虑有关d(i)的miRNA就会越少;
⑶.某种miRNA相关的多种疾病的数目;
此因素由某种miRNA与多种疾病的边缘连接程度体现;用fl(m(k))来表示与某种miRNA相关的多种疾病因素:
如果两种疾病都选择与其他疾病无关的miRNA,那么它们具有共有miRNA的可能性高;
考虑上述三种因素对重要性矩阵的影响,将公式(1)(2)(3)合并得到最终的重要性矩阵Sig(d(i),d(j))的表达式:步骤3、通过邻接矩阵和重要性矩阵的乘法计算评分矩阵;
传统的协同滤波提到预测由用户A和B之间的共同项目的相似度和平均得分组成;在本方法中miRNA疾病关联预测由邻接矩阵和重要性矩阵组成,评分矩阵是邻接矩阵和重要矩阵的乘积,邻接矩阵和重要性矩阵的乘积反映了miRNA与疾病之间的真实关系;评分矩阵本质上由重要性矩阵决定;评分矩阵F(i,j)的表达式由如下公式表示:F(i,j)=A(i,j)*Sig(d(i),d(j)) (5)步骤4、根据阈值设置进行预测;
用评分矩阵的计算方法获得一个阈值,并将设置的阈值与评分矩阵计算获得的阈值进行比较,从而证明miRNA-疾病是否具有关系。