知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13336804447 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13336804447

知嘟嘟经纪人

一种基于时空注意力机制的手语识别方法

面议

专利号： 2019110233227

申请人：重庆邮电大学

专利类型：发明专利

专利状态：已下证

专利领域：计算；推算；计数

更新日期：2025-12-18

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.一种基于时空注意力机制的手语识别方法，其特征在于，包括以下步骤：S1数据预处理，对手语视频进行采样，并对采样后的图片进行图像尺度归一化处理；

S2构建残差3D卷积神经网络，提取输入视频的短期的时空特征，在残差3D卷积神经网络中引入空间注意力模块；所述空间注意力模块为：S21:输入的特征图x首先经过两层3D卷积网络得到特征图Hx：Hx＝x*Wh其中，*表示三维卷积操作，Wh是一个3维张量，表示待学习的权重参数；

S22:Hx分别通过掩膜分支和残差分支被变换到两个不同的特征空间Fx和Gx；掩膜分支通过下采样和上采样处理使高低维度的特征更好地组合在一起，残差分支的目的是提取更深层次的时空特征；对两个特征空间进行组合变换，再经过归一化处理生成空间注意力图αx：其中，为哈达玛积，也就是逐元素相乘，σ表示Softmax激活函数，Fx和Gx分别是掩膜分支和残差分支的输出；

S23:注意力层输出为为了更好地利用前层的信息，最终的输出为：Ox＝x+Sx；

S3构建卷积长短时记忆网络，将短期的时空特征经过卷积长短时记忆网络解析后提取出长时间的时空特征，在卷积长短时记忆网络中引入时间注意力模块，生成视频帧的时间注意力权重，结合不同视频帧的时间注意力生成视频的特征表示；

S4经过Softmax分类器，输出手语分类类别。

2.根据权利要求1所述一种基于时空注意力机制的手语识别方法，其特征在于：所述数据预处理包括将每一个手语视频采样为32帧；帧数大于32的视频，将多余的帧数平均分配到首尾两端进行删除，保留中间的关键帧；而对于帧数小于32的视频为了保证数据的时序性，则重复最后一帧。

3.根据权利要求1所述一种基于时空注意力机制的手语识别方法，其特征在于：所述残差3D卷积神经网络中具有4个残差块；每个残差块包含六层3D卷积层，一层下采样层和一层上采样层，前两层3D卷积层提取的特征经过捷径连接与最后一层卷积层的输出进行相加。

4.根据权利要求3所述一种基于时空注意力机制的手语识别方法，其特征在于：所述下采样层采用最大值池化，所述上采样层采用双线性插值。

5.根据权利要求1所述一种基于时空注意力机制的手语识别方法，其特征在于：所述两个分支其中掩膜分支需要经过下采样和上采样处理，残差分支经过四层3D卷积处理。

6.根据权利要求1所述一种基于时空注意力机制的手语识别方法，其特征在于：步骤S3所述卷积长短时记忆网络为：令空间注意力网络的输出特征为{x1,x2,...,xt,...}，则每个卷积长短时记忆单元按照如下方式更新参数：it＝σ(wxi*xt+whi*ht‑1+bi)

ft＝σ(wxf*xt+whf*ht‑1+bf)

ot＝σ(wxo*xt+who*ht‑1+bo)

其中，it,ot,ft分别表示步长t时的输入门、输出门、遗忘门的向量；xt是数据的输入；ct为存储细胞状态；ht表示t时刻卷积长短时记忆单元的输出；w～,b～分别表示相应的系数矩阵和偏置向量；*表示卷积计算，代表哈达玛积。

7.根据权利要求1所述一种基于时空注意力机制的手语识别方法，其特征在于：所述引入时间注意力模块的步骤包括：S31:计算在每个时间步长t时的时间注意力权重β＝{β1,β2,...,βt,...}，如下公式计算：βt＝ReLU(Wg*ht)