欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2023106234844
申请人: 杭州医初科技有限公司
专利类型:发明专利
专利状态:授权未缴费
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种医疗数据的采集分析系统,其特征在于,包括:

患者相关数据采集模块,用于获取某一地区的所有糖尿病患者的相关数据,其中,所述相关数据包括年龄、性别、家族史和治疗记录;

患者相关信息语义理解模块,用于将各个所述糖尿病患者的相关数据分别通过包含词嵌入层的语义编码器以得到多个糖尿病患者语义理解特征向量;

患者信息语义关联模块,用于将所述多个糖尿病患者语义理解特征向量排列为二维特征矩阵后通过作为特征提取器的卷积神经网络模型以得到糖尿病患者间语义关联特征矩阵;

体检数据采集模块,用于获取待诊断患者的体检数据;

体检语义理解模块,用于将所述待诊断患者的体检数据通过所述包含词嵌入层的语义编码器以得到待诊断患者体检数据语义理解特征向量;

查询模块,用于以所述待诊断患者体检数据语义理解特征向量作为查询特征向量,计算其与所述糖尿病患者间语义关联特征矩阵之间的矩阵乘积以得到分类特征向量;

特征优化模块,用于对所述分类特征向量进行特征分布优化以得到优化分类特征向量;以及患病风险预警模块,用于将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示待诊断患者发展为糖尿病的风险等级;

其中,所述特征优化模块,用于:以如下优化公式对所述分类特征向量进行高斯概率密度的流形曲面维度正交化以得到所述优化分类特征向量;

其中,所述优化公式为:

其中 是所述分类特征向量的第 个位置的特征值, 和 分别是所述分类特征向量中各个位置特征值集合的均值和标准差,且 所述优化分类特征向量的第 个位置的特征值。

2.根据权利要求1所述的医疗数据的采集分析系统,其特征在于,所述患者相关信息语义理解模块,包括:第一分词单元,用于对各个所述糖尿病患者的相关数据进行分词处理以将各个所述糖尿病患者的相关数据转化为由多个词组成的词序列;

第一词嵌入单元,用于使用所述包含词嵌入层的语义编码器的词嵌入层分别将所述词序列中各个词映射为词嵌入向量以得到词嵌入向量的序列;

第一上下文编码单元,用于使用所述包含词嵌入层的语义编码器的转换器对所述词嵌入向量的序列进行基于转换器思想的全局上下文语义编码以得到多个全局上下文语义特征向量;以及第一级联单元,用于将所述多个全局上下文语义特征向量进行级联以得到所述多个糖尿病患者语义理解特征向量。

3.根据权利要求2所述的医疗数据的采集分析系统,其特征在于,所述第一上下文编码单元,包括:查询向量构造子单元,用于将所述词嵌入向量的序列进行一维排列以得到全局特征向量;

自注意子单元,用于计算所述全局特征向量与所述词嵌入向量的序列中各个词嵌入向量的转置向量之间的乘积以得到多个自注意力关联矩阵;

标准化子单元,用于分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵;

关注度计算子单元,用于将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值;

注意力施加子单元,用于分别以所述多个概率值中各个概率值作为权重对所述词嵌入向量的序列中各个词嵌入向量进行加权以得到所述多个上下文语义特征向量;以及级联子单元,用于将所述多个上下文语义特征向量进行级联以得到所述多个全局上下文语义特征向量。

4.根据权利要求3所述的医疗数据的采集分析系统,其特征在于,所述患者信息语义关联模块,用于:使用所述作为特征提取器的卷积神经网络模型的各层在层的正向传递中分别对输入数据进行:对输入数据进行卷积处理以得到卷积特征图;

对所述卷积特征图进行沿通道维度的池化以得到池化特征图;以及对所述池化特征图进行非线性激活以得到激活特征图;

其中,所述作为特征提取器的卷积神经网络的最后一层的输出为所述糖尿病患者间语义关联特征矩阵,所述作为特征提取器的卷积神经网络的第一层的输入为所述多个糖尿病患者语义理解特征向量排列得到的二维特征矩阵。

5.根据权利要求4所述的医疗数据的采集分析系统,其特征在于,所述体检语义理解模块,包括:第二分词单元,用于对所述待诊断患者的体检数据进行分词处理以将所述待诊断患者的体检数据转化为由多个词组成的词序列;

第二词嵌入单元,用于使用所述包含词嵌入层的语义编码器的词嵌入层分别将所述词序列中各个词映射为词嵌入向量以得到词嵌入向量的序列;

第二上下文编码单元,用于使用所述包含词嵌入层的语义编码器的转换器对所述词嵌入向量的序列进行基于转换器思想的全局上下文语义编码以得到多个全局上下文语义特征向量;以及第二级联单元,用于将所述多个全局上下文语义特征向量进行级联以得到所述待诊断患者体检数据语义理解特征向量。

6.根据权利要求5所述的医疗数据的采集分析系统,其特征在于,所述查询模块,用于:以如下公式计算所述待诊断患者体检数据语义理解特征向量和所述糖尿病患者间语义关联特征矩阵之间的矩阵乘积以得到分类特征向量;

其中,所述公式为:

其中 表示所述待诊断患者体检数据语义理解特征向量, 表示所述糖尿病患者间语义关联特征矩阵, 表示所述分类特征向量。

7.根据权利要求6所述的医疗数据的采集分析系统,其特征在于,所述患病风险预警模块,包括:全连接编码单元,用于使用所述分类器的多个全连接层对所述优化分类特征向量进行全连接编码以得到编码分类特征向量;以及分类结果生成单元,用于将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。

8.一种医疗数据的采集分析方法,其特征在于,包括:

获取某一地区的所有糖尿病患者的相关数据,其中,所述相关数据包括年龄、性别、家族史和治疗记录;

将各个所述糖尿病患者的相关数据分别通过包含词嵌入层的语义编码器以得到多个糖尿病患者语义理解特征向量;

将所述多个糖尿病患者语义理解特征向量排列为二维特征矩阵后通过作为特征提取器的卷积神经网络模型以得到糖尿病患者间语义关联特征矩阵;

获取待诊断患者的体检数据;

将所述待诊断患者的体检数据通过所述包含词嵌入层的语义编码器以得到待诊断患者体检数据语义理解特征向量;

以所述待诊断患者体检数据语义理解特征向量作为查询特征向量,计算其与所述糖尿病患者间语义关联特征矩阵之间的矩阵乘积以得到分类特征向量;

对所述分类特征向量进行特征分布优化以得到优化分类特征向量;以及将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示待诊断患者发展为糖尿病的风险等级;

其中,对所述分类特征向量进行特征分布优化以得到优化分类特征向量,包括:以如下优化公式对所述分类特征向量进行高斯概率密度的流形曲面维度正交化以得到所述优化分类特征向量;

其中,所述优化公式为:

其中 是所述分类特征向量的第 个位置的特征值, 和 分别是所述分类特征向量中各个位置特征值集合的均值和标准差,且 所述优化分类特征向量的第 个位置的特征值。