1.用于大数据分析的健康数据采集方法,其特征在于,该方法包括以下步骤:
采集病人的所有时刻的心电数据;
使用游程编码对病人的心电数据压缩,获得若干个压缩元组;根据每个压缩元组的局部差异获得每个压缩元组的分割强度,利用分割强度将心电数据进行划分获得若干个分量数据段;根据所有分量数据段的主成分,获得所有分量数据段的标准数据段;根据每个压缩元组与标准数据段的压缩元组对齐关系获得每个分量数据段的每个压缩元组的对齐压缩元组,根据每个压缩元组与对齐压缩元组获得每个分量数据段的每个压缩元组的时间偏移程度,并获得每个分量数据段的每个压缩元组的心电数据偏移程度;根据每个分量数据段的所有时间偏移程度和心电数据偏移程度获得每个分量数据段的异常程度;根据异常程度将每个心电数据段划分为正常数据集合和异常数据集合;
将采集的且属于正常数据集合的心电数据存储在第一存储区,将采集的且属于异常数据集合的心电数据存储在第二存储器。
2.根据权利要求1所述用于大数据分析的健康数据采集方法,其特征在于,所述根据每个压缩元组的局部差异获得每个压缩元组的分割强度包括:将第i个压缩元组记为(M
式中f
3.根据权利要求1所述用于大数据分析的健康数据采集方法,其特征在于,所述利用分割强度将心电数据进行划分获得若干个分量数据段的具体方式为:将第i个压缩元组的分割强度记为f
计算所有压缩元组的分割强度获得所有分割点,将第一个心电数据和最后一个心电数据记为分割点,从第一个分割点开始,将每两个分割点之间的所有心电数据和两个分割点中的第一个分割点的心电数据记为一个心电数据段,以此类推,直至心电数据中仅存在最后一个分割点时结束,将最后一个分割点合并到最后一个心电数据段,获得若干个心电数据段,对每个心电数据段扩充获得分量数据段。
4.根据权利要求3所述用于大数据分析的健康数据采集方法,其特征在于,所述对每个心电数据段扩充获得分量数据段包括:选取所有心电数据段中心电数据个数最多的心电数据段,将心电数据个数最多的心电数据段的心电数据个数记为扩充长度;选取任意一个心电数据段,如果心电数据段的心电数据个数小于扩充长度,则第一次复制心电数据段并填充在心电数据段之后获得第一心电数据段,当第一心电数据段的长度小于扩充长度,则第二次复制心电数据段复制心电数据段并填充在第一心电数据段之后获得第二心电数据段,以此类推,直至填充后的心电数据段的心电数据个数与扩充长度相等,将填充后的心电数据段记为一个分量数据段;对所有心电数据段填充,获得若干个分量数据段。
5.根据权利要求1所述用于大数据分析的健康数据采集方法,其特征在于,所述根据所有分量数据段的主成分,获得所有分量数据段的标准数据段包括:每个分量数据段的心电数据为一组心电数据的序列,将每个心电数据的序号记为一个维度,将每一个心电数据记为一个在所述维度下的向量,将每个分量数据段的所有维度下的向量记为一组多维向量,每一组多维向量的最大维度等于扩充长度,所有分量数据段组成多组多维向量,使用PCA算法获得所有分量数据段的若干主成分,每个所述主成分具有多个维度,计算所有主成分在每一个维度的心电数据均值,记为每一个维度的标准数据,所有维度的标准数据经过游程编码压缩得到标准数据段。
6.根据权利要求1所述用于大数据分析的健康数据采集方法,其特征在于,所述获得每个分量数据段的每个压缩元组的对齐压缩元组包括:将第j个分量数据段的心电数据序列记为第j个查询序列,将标准数据段的心电数据序列记为模板序列,将第j个查询序列和模板序列输入到动态时间规整算法DTW中,根据查询序列中第k个压缩元组与模板序列的心电数据长度和心电数据取值,获得第j个分量数据段中第k个压缩元组在标准数据段上的对齐压缩元组。
7.根据权利要求1所述用于大数据分析的健康数据采集方法,其特征在于,所述获得每个分量数据段的每个压缩元组的时间偏移程度包括:第j个分量数据段中第k个压缩元组的时间偏移程度dt
dt
式中t′为第j个分量数据段中第k个压缩元组的第一个心电数据的时间坐标,s为第j个分量数据段中第k个压缩元组在标准数据段上的对齐压缩元组的第一个心电数据的时间坐标。
8.根据权利要求1所述用于大数据分析的健康数据采集方法,其特征在于,所述获得每个分量数据段的每个压缩元组的心电数据偏移程度包括:将第j个分量数据段中第k个压缩元组记为(M
式中m
9.根据权利要求1所述用于大数据分析的健康数据采集方法,其特征在于,所述根据每个分量数据段的所有时间偏移程度和心电数据偏移程度获得每个分量数据段的异常程度包括:第j个分量数据段B
其中,
对第j个分量数据段的异常系数进行线性归一化,得到的结果记为第j个分量数据段的异常程度。
10.用于大数据分析的健康数据采集系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程度,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1~9任意一项用于大数据分析的健康数据采集方法的步骤。