1.一种用于描述压力的HRV特征范围估计方法,其特征在于:包括以下步骤:
步骤1、利用节奏大师游戏诱发受试者产生压力,同时采集受试者的心电信号,并根据游戏的难度级别、游戏中的参数、面部表情和问卷调查结果综合评定此次受试者的压力状态标签;
步骤2、从采集的心电信号中提取HRV时域及频域特征,构建特征集;
步骤3、根据改进的C4.5决策树算法,将步骤2得到的特征集构建出多颗树,并根据参数控制策略选取出合适的多颗树模型;
步骤4、将选择出来的多棵树合并成一棵新树,并从中提取各HRV特征的取值范围。
2.根据权利要求1所述的一种用于描述压力的HRV特征范围估计方法,其特征在于:所述步骤2的HRV时域特征包括SDNN、RMSSD、NN50、PNN50;频域特征包括LF、HF、LF/HF、VAI。
3.根据权利要求1或2所述的一种用于描述压力的HRV特征范围估计方法,其特征在于:
所述步骤3包括以下具体步骤:
(1)设HRV特征与压力标签表示的数据集为
D={(x1,y1),(x2,y2),…,(xi,yi),…,(xN,yN)}
其中,N为样本条数, 为HRV的特征向量,n为每条样本所含
特征的个数,yi∈γ={c1,c2,...,cm}为HRV特征代表的类别,在此,取m=2,则c1=0代表放松状态,c2=1代表高压力状态,假设数据集D的特征集为A={A1,A2,A3,...,An};
(2)对特征集A中的每个特征,将数据集D在该特征上的取值进行排序,寻找每个特征对应的高阈值和低阈值:对特征集A中的每一个特征Ai,i=1,2,...,n,将数据集D在该特征上的取值升序排列,从最小值对应的类别依次找到第一个和最小值类别不同的样本,将此样本的该特征值作为划分的一个低阈值li,i=1,2,...n,因此,对于特征Ai,小于低阈值的样本一定属于同一类,同时记录下数据集D中该特征值小于此低阈值样本数l_samplei,i=1,2,...,n;同理,将数据集D在该特征上的取值降序排列,从最大值对应的类别依次找到第一个和最大值类别不同的样本,将此样本的该特征值作为划分的一个高阈值hi,i=1,2,...,n;因此,对于特征Ai,大于高阈值的样本一定属于同一类;同时记录下数据集D中该特征值大于此高阈值样本数h_samplei,i=1,2,...,n;若一个特征的低阈值li大于其高阈值hi,则将(li+hi)/2作为该特征的唯一阈值;
(3)利用高低阈值分割数据集,依次寻找信息增益比最大的特征,构建决策树:
对特征集A中的每一个特征Ai,i=1,2,...,n,按照其对应的低阈值li和高阈值hi将数据集分割为三个非空子集,对于只有唯一阈值的特征,将数据集分割为两个非空子集,并计算其对数据集D的信息增益比,选择信息增益比最大的特征Ag,g∈(1,n)作为根结点,之后在选择内部节点时,依次计算剩余特征的高低阈值划分的子集对数据集D的信息增益比,选择信息增益比最大的特征作为节点,直至最后一个特征被使用完毕或每个HRV向量都可以准确分类,由此来构建决策树;
(4)重复所述步骤3的第(2)步和第(3)步构建多颗决策树:
将N条样本随机平均分为d组,每组样本容量为N/d;并根据步骤3的第(2)步和第(3)步构建决策树T,每组均构建k个决策树,同时记录下每棵树每层所用的特征Ai、低阈值li、高阈值hi、该特征值小于低阈值样本数l_samplei、该特征值大于高阈值样本数h_samplei,即特征记录;
(5)根据参数控制策略选取出合适的多颗树模型:
假设树集合为F,将步骤3第(4)步中的每组样本按训练集和测试集为a:b随机分割,若树T的识别准确率大于等于p,(0≤p≤1),则将树T添加到树集合F中,最终d组共得到符合条件的k'(k'≤d*k)个分类树{T1,T2,T3,...,Tk'}。
4.根据权利要求1或2所述的一种用于描述压力的HRV特征范围估计方法,其特征在于:
所述步骤4包括以下具体步骤:
(1)依次统计k'个分类树每层所使用的特征及其出现的次数:
根据树集合F中k'个分类树记录的信息,统计k'个分类树第一层使用的各个特征Ai,i=
1,2,...,n及其出现的次数ai,i=1,2,...,n,第二层、第三层…按照上述过程进行统计;
(2)对步骤4的第(1)步中统计的每个特征出现的次数进行排序,其中每个特征只参与一次排序:将每层的各个特征出现的次数按降序排列,得到相应的特征排序,若不同层次使用的特征有重复,则以最高层出现的次数为准参与排序,即每个特征只参与一次排序,则依照层序得到一个相应的总的特征排序A1',A2',...An';
(3)对步骤4的第(2)步特征排序中的每一个特征Ai',确定其对应的高低阈值:
对特征排序中的每一个特征Ai',i=1,2,...n,依序在k'个分类树的所有层的特征记录中筛选出Ai'的特征记录集合B,在特征记录集合B中对l_samplei即数据集D中特征值小于对应低阈值的样本数降序排列,得到l_samplei'=max{l_sample1',l_sample2',...},然后在特征记录集合B中对h_samplei即数据集D中特征值大于对应高阈值的样本数降序排列,得到h_samplei'=max{h_sample1',h_sample2',...},则对特征Ai',低阈值为l_samplei'对应的li',高阈值为h_samplei'对应的hi';
(4)将选择出来的多棵树进行树的合并;
按照特征排序A1',A2',...An',每次依次选择一个属性作为树或者子树的根节点,并记录下每个结点的信息(Ai',li',hi');Ai'即该结点所用特征,li'为该特征对应的低阈值,hi'为该特征对应的高阈值;小于低阈值li'的分支对应的结点为叶子结点,标记结果为c2=1,大于高阈值hi'的分支对应的为叶子结点,标记结果为c1=0,对于落在低阈值和高阈值区间内的样本,递归调用步骤(3)-(4)构建子树,直至属性使用完毕或者每一个HRV向量都可以准确分类,合并后的最优新树T”即构建完毕;
(5)提取各个HRV特征取值范围;
根据步骤4的第(4)步得到的最优新树T”估计出各HRV特征范围:特征Ai'的放松范围是[0,li'),高压范围是(hi',+∞),其中i=1,2,...n;即对一个HRV特征向量,根据其特征值A1'判断放松或者高压状态,若特征值A1'在[0,l1')区间范围内,则为放松状态,若特征值A1'在(h1',+∞)区间范围内,则为高压力状态,否则,根据其特征值A2'判断放松或者高压状态......直至获得其类别。