1.一种基于深度学习和机器学习的抗病毒肽预测方法,其特征在于,具体步骤如下:步骤1、获取序列数据,其中所获取的序列数据为待预测的肽序列;
步骤2、对待预测的肽序列进行预处理;
步骤3、将步骤2中得到的数据进行预测,并输出预测结果,所述步骤2包括:
步骤2.1、获取特征矩阵,按照预设的特征提取方法分别提取待预测的肽序列的特征并分别存储,定义待预测的肽序列数量为M,提取特征维度为N,将最后结果保存为维度为M*N的特征矩阵,按照18种特征提取方法分别提取待预测的肽序列的特征并分别存储;
步骤2.2、对步骤1中的待预测的肽序列进行独热码编码;
所述步骤3包括:
步骤3.1、通过步骤2中获取的数据进行初步预测,并输出初步预测结果;
步骤3.1.1、将步骤2.2中获得独热码导入至第一神经网络输出预测概率及预测标签;
步骤3.1.2、将步骤2.1中获得的18种特征矩阵分别导入LightGBM中,并分别输出18维的预测概率以及18维的预测标签结果并保存;
步骤3.1.3、将步骤2.1中获得的18种特征矩阵分别导入至第二神经网络并输出18维的预测概率以及18维的预测标签结果并保存;
步骤3.1.4、将步骤3.1.1、步骤3.1.2、步骤3.1.3中分别输出的预测概率和预测标签全部导出,并将所有结果拼接成共计74维初步预测数据;
步骤3.2、将初步预测结果导入最终支持向量机SVM分类模型中得到最后预测,并输出预测结果。
2.根据权利要求1所述的一种基于深度学习和机器学习的抗病毒肽预测方法,其特征在于,所述步骤2.2中,首先将待预测的肽序列统一成同一长度,序列不足的末尾补X,超出长度的进行截取前一部分,然后按照独热码编码规则进行编码得到独热码。