欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2021110563169
申请人: 东北林业大学
专利类型:发明专利
专利状态:已下证
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.基于XGboost算法的DNA结合蛋白识别方法,其特征在于,利用DNA结合蛋白识别分类器对待识别的DNA结合蛋白进行识别,所述的DNA结合蛋白识别分类器的确定过程包括以下步骤:

S1、获取处理的DNA结合蛋白特征数据集;DNA结合蛋白特征数据集包括训练集和测试集;

S2、采用不同的提取算法提取DNA结合蛋白数据集的数据特征,得到多个特征文件;

S3、将不同特征提取算法提取的序列特征矩阵拼接起来,得到拼接后的特征矩阵;

S4、对S3生成的特征矩阵进行规范化处理,得到规范化处理后的特征矩阵;

S5、使用MRMD算法将S4生成的矩阵进行降维处理;

S6、使用XGboost算法构建并训练DNA结合蛋白识别分类器模型。

2.根据权利要求1所述的基于XGboost算法的DNA结合蛋白识别方法,其特征在于,S2采用不同的提取算法提取原始的DNA结合蛋白数据集的数据特征的过程使用的提取算法为global encoding method of protein sequence、Multi‑scale Continuous and Discontinuous、Novel Matrix‑Based Sequence Representation Model with Amino Acid、Position‑Specific Scoring Matrix PSSM‑AB、PSSM‑Pse和PSSM‑DWT。

3.根据权利要求2所述的基于XGboost算法的DNA结合蛋白识别方法,其特征在于,S4所述的进行规范化处理的过程使用的是零‑均值规范化算法。

4.根据权利要求3所述的基于XGboost算法的DNA结合蛋白识别方法,其特征在于,所述的MRMD算法采用MRMD3.0算法。

5.基于XGboost算法的DNA结合蛋白识别系统,其特征在于,所述系统用于执行权利要求1至4之一所述的基于XGboost算法的DNA结合蛋白识别方法。

6.一种存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如权利要求1至4之一所述的基于XGboost算法的DNA结合蛋白识别方法。

7.一种设备,其特征在于,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如权利要求1至4之一所述的基于XGboost算法的DNA结合蛋白识别方法。