1.一种基于XGBoost的凝血检测中血液样本的分类方法,其特征在于,包括:获取待检测血液样本的凝血指标数据;所述凝血指标数据的凝血指标包括凝血酶原时间、活化部分凝血活酶时间、纤维蛋白原、凝血酶时间、D二聚体和纤维蛋白降解产物;
将所述血液样本的凝血指标数据输入预训练的基于XGBoost的凝血检测中血液样本的分类模型中,对所述血液样本的凝血指标数据,按照预设的各个凝血指标的权重进行低层次特征和高层次特征提取,并将提取的低层次特征和高层次特征进行融合,获取检测项目特征;其中,各个凝血指标的权重的确定方法,包括:获取包括凝血指标数据的数据集;对所述数据集按照是否含有血栓凝块进行手动标记;
利用双侧T检验比较数据集中有血栓凝块的数据均值和无血栓凝块的数据均值;
在有血栓凝块的数据和无血栓凝块的数据两组数据之间以及两组数据中分别计算皮尔逊相关系数;
根据所述皮尔逊相关系数,利用Logistic回归估计确定各个凝血指标与是否存在血栓凝块间的相关性;
根据各个凝血指标与是否存在血栓凝块间的相关性确定进行特征提取的权重;
利用基于XGBoost的分类器,根据所述检测项目特征获取待检测血液样本的凝血检测分类结果;其中,所述基于XGBoost的分类器通过贝叶斯网络,采用5折交叉验证的方式进行参数优化。
2.如权利要求1所述的基于XGBoost的凝血检测中血液样本的分类方法,其特征在于,在获取待检测血液样本的凝血指标数据之后,还包括对凝血指标数据的预处理,包括:对凝血指标数据进行归一化处理;
遍历所述归一化处理后的凝血指标数据,查找缺失值,并利用正向填充策略对所述缺失值进行填充;
进行异常值去除。
3.如权利要求1所述的基于XGBoost的凝血检测中血液样本的分类方法,其特征在于,所述基于XGBoost的分类器通过贝叶斯网络,采用5折交叉验证的方式进行参数优化的步骤,包括:实施5折交叉验证,得到5个XGBoost分类器模型;
利用训练集对所述5个XGBoost分类器模型进行训练,实现对血液样本状态的检测;其中,将预处理后的待检测血液样本的凝血指标数据划分为测试集和训练集;所述训练集分成五个子集,每个子集轮流用作内部验证集;
利用内部验证集对其他子集训练的XGBoost分类器模型进行预测精度评估;
使用贝叶斯网络对所述XGBoost分类器模型进行参数优化。
4.如权利要求3中所述的基于XGBoost的凝血检测中血液样本的分类方法,其特征在于,还包括对于训练好的基于XGBoost的凝血检测中血液样本的分类模型进行模型评价,包括:通过内部验证集对其他子集训练的XGBoost分类器模型进行预测精度评估的过程中获取所述XGBoost分类器模型的预测值;
将每个测试样本的预测值和二进制真实值结合,得到平均工作特性曲线和基于XGBoost的凝血检测中血液样本的分类模型的混淆矩阵;
根据所述混淆矩阵,利用无梯度优化算法确定使训练集效用分数最大的截止阈值作为所述工作特性曲线的最佳阈值;
筛选符合所述最佳阈值的基于XGBoost的凝血检测中血液样本的分类模型的分类结果,作为待检测血液样本的凝血检测分类结果。
5.如权利要求4中所述的基于XGBoost的凝血检测中血液样本的分类方法,其特征在于,使用贝叶斯网络对所述XGBoost分类器模型进行参数优化采用下述四种策略中的一种或多种组合:L2范数正则化、学习率衰减策略、丢失法和提前停止策略。
6.一种基于XGBoost的凝血检测中血液样本的分类系统,其特征在于,包括:数据获取单元,用于获取待检测血液样本的凝血指标数据;所述凝血指标数据的凝血指标包括凝血酶原时间、活化部分凝血活酶时间、纤维蛋白原、凝血酶时间、D二聚体和纤维蛋白降解产物;
特征提取单元,用于将所述血液样本的凝血指标数据输入预训练的基于XGBoost的凝血检测中血液样本的分类模型中,对所述血液样本的凝血指标数据,按照预设的各个凝血指标的权重进行低层次特征和高层次特征提取,并将提取的低层次特征和高层次特征进行融合,获取检测项目特征;其中,各个凝血指标的权重的确定方法,包括:获取包括凝血指标数据的数据集;对所述数据集按照是否含有血栓凝块进行手动标记;利用双侧T检验比较数据集中有血栓凝块的数据均值和无血栓凝块的数据均值;在有血栓凝块的数据和无血栓凝块的数据两组数据之间以及两组数据中分别计算皮尔逊相关系数;根据所述皮尔逊相关系数,利用Logistic回归估计确定各个凝血指标与是否存在血栓凝块间的相关性;根据各个凝血指标与是否存在血栓凝块间的相关性确定进行特征提取的权重;
检测结果确定单元,用于利用基于XGBoost的分类器,根据所述检测项目特征获取待检测血液样本的凝血检测分类结果;其中,所述基于XGBoost的分类器通过贝叶斯网络,采用5折交叉验证的方式进行参数优化。
7.如权利要求6中所述的基于XGBoost的凝血检测中血液样本的分类系统,其特征在于,包括数据预处理单元,用于对凝血指标数据进行归一化处理;遍历所述归一化处理后的凝血指标数据,查找缺失值,并利用正向填充策略对所述缺失值进行填充;进行异常值去除。
8.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至5中任一所述的基于XGBoost的凝血检测中血液样本的分类方法中的步骤。
9.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5中任一所述的基于XGBoost的凝血检测中血液样本的分类方法。