欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019108506476
申请人: 浙江大学
专利类型:发明专利
专利状态:已下证
更新日期:2023-08-24
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.基于递归分区计算的高血压用药推荐模型及其构建方法,其特征在于,包括以下步骤:S1、通过ICD编码获取高血压数据集合,并将数据集解析并处理为标准化的文本病历格式;

S2、将步骤S1中的文本病历格式化为多个分类变量,将数据集合通过基于年龄的分层抽样方法分为测试样本集和验证样本集;

S3、通过决策树框架、定义高血压用药推荐模型;

S4、通过测试样本集,计算模型的拟合度,具体包括:S41、高血压用药特征参数的评估:选择一个预测变量将测试样本分为单一用药和联合用药两类,通过递归分区算法实现单一用药和联合用药两类之间的拟合度最大化;S42、各类别内输出变量之间数值变异最小化:对于每个子类,重复步骤S41的操作,直到各类别内的输出变量不能被精准区分为止;

S5、判断S4中初始高血压用药节点的复杂度;

S6、建立模型参数池,设定参数组合的集合;

S7、求解模型最优参数:S71、遍历S6步骤得到的所有参数组合,通过交叉验证测试样本集数据获得的模型来预测验证样本集数据的用药推荐结局,并与验证样本集数据的实际结局方案进行比较,计算错分率,S72、得到错分率最低的参数组合作为最优参数组合进行输出;

S8、模型构建及预测:S81、模型构建:通过步骤S4、S5、S6、S7的步骤,将测试集中每个样本归类到终端节点的用药方案,并根据终端节点中本单元用药方案的众数判断节点的属性;S82、样本预测:对于验证集中的每一个样本执行高血压用药推荐模型,得到其终端节点,并根据S81得到模型预测的所属用药方案,从而实现模型的评价与校验。

2.如权利要求所述的基于递归分区计算的高血压用药推荐模型及其构建方法,其特征在于,所述S41中递归分区算法包括分组方案Gini纯度的计量和为每个分组分配数据,Gini的计量公式为: 其中fi(i=1,…,p)是第i个待预测分类节点中的相对频率;

进一步通过相对频率的计量,Gini指数计算从一个分组方案中随机选取两个不同类型的概率;假设每次分割为k个子节点,包含n1,n2,…,nk都应该造成纯度的最大增量,而从最大限度的降低Gini指数,即最小化每个分组的Gini指数数值,通过公式实现:

3.如权利要求所述的基于递归分区计算的高血压用药推荐模型及其构建方法,其特征在于,S41还包括分割节点选择:确定高血压用药推荐模型的分割点时,每个样本分配到一个类别中,每个类别包含一定比例的单一用药样本和联合用药样本,通过样本的预测变量和损失函数fi,判断每个样本的可能结局,并定义分组中所有个体的分类。

4.如权利要求所述的基于递归分区计算的高血压用药推荐模型及其构建方法,其特征在于,S42还包括定义分组中所有个体的分类规则:如果分组中个体指定单一用药j的代价低于指定给联合用药的代价,则为分组指定类j,其中代价Cj通过公式计算:

5.如权利要求所述的基于递归分区计算的高血压用药推荐模型及其构建方法,其特征在于,步骤S5通过以下步骤实现:S51、交叉验证误差的标准差计算:通过交叉验证获得测试样本的交叉验证误差,计算交叉验证误差的标准差;S52、用药方案的分支数确定:通过判断最小的交叉验证误差的标准差,确定用药方案的分支数;S53、根据步骤S51和S52确定用药节点间的初始复杂度。

6.如权利要求所述的基于递归分区计算的高血压用药推荐模型及其构建方法,其特征在于,所述步骤S5后还包括步骤S54、判断模型是否需要修正,若是,则通过交叉验证方法进行修正;若否跳转至步骤S6。

7.如权利要求所述的基于递归分区计算的高血压用药推荐模型及其构建方法,其特征在于,所述步骤S6具体包括以下三种类别:迭代次数为1至10(n)的整数,分支节点数为5、

10、15、20,复杂度为0.001(0~0.005),通过上述三种参数设定多种参数组合。

8.如权利要求所述的基于递归分区计算的高血压用药推荐模型及其构建方法,其特征在于,所述步骤S7后还包括步骤S73、当最优参数解无法获取时,通过标定模型的待验参数返回步骤S4。

9.如权利要求2所述的基于递归分区计算的高血压用药推荐模型及其构建方法,其特征在于,所述的模型第一个分类节点为是否老年患者,如为老年患者则形成第1个分类;针对第一个分类节点进一步判断患者是否伴有糖尿病,如患者伴有糖尿病则形成第2个分类;

如患者不伴有糖尿病,则判断患者是否伴有动脉粥样硬化,如存在动脉粥样硬化则形成第3个分类;如不存在动脉粥样硬化,则判断患者是否伴有慢性肾病,如存在慢性肾病则形成第

4个分类;如不存在慢性肾病,则判断患者BMI指数,如患者为肥胖患者,则形成第5个分类;

如患者BMI指数正常,则判断患者性别,如患者为女性则形成第6个分类,如为男性则形成第

7个分类。

10.如权利要求2所述的基于递归分区计算的高血压用药推荐模型及其构建方法,其特征在于,所述模型的第1个分类、第2个分类、第3个分类推荐为联合用药方案;所述的第4个类、第5个分类、第6个分类、第7个分类为单独用药方案。