欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020106192320
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-26
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于扰动视觉解释的视频异常事件检测方法,其特征在于,包括:获取视频数据集,将数据集输入到优化的深度学习模型中进行模型训练;实时获取视频数据,将获取的数据输入到训练好的深度学习模型中,得到检测结果;所述模型训练的过程包括:将训练集的数据进行预处理,并将处理好的数据集输入到空间编码器中学习每个视频帧的空间结构;将空间编码器处理后的数据输入到时间自编码中学习空间结构的时间模式,得到特征图;采用删除解释和保留解释方法对特征图进行处理得到解释图;将特征图输入到解码器中进行反卷积操作,得到重建帧;根据输入帧和重建帧计算输入图像的规律性分数;将得到的规律性分数进行划分,得到视频异常与视频正常的分类,完成模型训练。2.根据权利要求1所述的一种基于扰动视觉解释的视频异常事件检测方法,其特征在于,所述深度学习模型包括编码器和解码器;所述编码器包括由三个卷积层组成空间编码器以及由三层卷积长短时记忆模型组成的时间自编码器;解码器为三层反卷积层组成的空间自编码器。3.根据权利要求2所述的一种基于扰动视觉解释的视频异常事件检测方法,其特征在于,所述长短时记忆模型为:ft=σ(WXF*Xt+WHF*ht‑1+WCFoCt‑1+bF)it=σ(WXI*Xt+WHI*ht‑1+WCIoCt‑1+bI)Ct=ftoCt‑1+it·tanh(WXC*Xt+WHC*ht‑1+bc)Ot=σ(WXO*Xt+WHO*ht‑1+WCOoCt+bo)ht=Ototanh(Ct)其中,it表示输入门,ft表示遗忘门,Ct表示细胞更新状态单元,Ot表示输出门,ht表示短期记忆,*代表卷积操作,o表示Hadamard乘积,σ表示sigmoid激活函数,tanh(.)表示tanh激活函数,Ct‑1表示细胞过去状态单元,ht‑1表示上一时刻的输出值,Xt表示当前的输入值,WXF表示输入数据时遗忘门的权重矩阵,WHF表示上一时刻遗忘门的权重矩阵,WCF表示在遗忘门中细胞过去状态单元的权重矩阵,bF表示遗忘门的偏置向量,WXI表示输入数据时输入门的权重矩阵,WHI表示上一时刻输入门的权重矩阵,WCI表示在输入门中细胞过去状态单元的权重矩阵,bI表示输入门的偏置向量,WXC表示输入数据时输入门的权重矩阵,WHC表示上一时刻细胞更新状态单元的权重矩阵,bc表示长期记忆偏置向量,WXO表示输入数据时输出门的权重矩阵,WHO表示上一时刻输出门的权重矩阵,WCO表示输出门中细胞过去状态单元的权重矩阵,bo表示输出门的偏置向量。4.根据权利要求1所述的一种基于扰动视觉解释的视频异常事件检测方法,其特征在于,得到解释图的过程包括:计算输入视频帧的掩码;将输入视频帧与计算得到的掩码相乘,得到解释图即对解释图进行优化处理;其中,表示掩码,x表示输入视频帧。5.根据权利要求4所述的一种基于扰动视觉解释的视频异常事件检测方法,其特征在

于,计算掩码的过程包括:输入特征图像x,通过移除与目标类CT相关或不相关的像素点得

到掩码保留解释的掩码为:删除解释的掩码为:其中,表示掩码,CT表示目标类,表示取最小值,表示取最大

值,表示相似性度量,表示原始图像输入模型后的输出,表示解释图输入模型后

的输出,λ表示系数,表示初始化掩码,其中H表高度,W表示宽度,||.||1

表示在保留解释中表示最小化,在删除解释中表示最大化。6.根据权利要求4所述的一种基于扰动视觉解释的视频异常事件检测方法,其特征在于,所述对解释图进行优化处理包括在模型的所有非线性层之后增加约束,在进行约束后,采用调整公式对解释图进行调整,得到优化后的解释图。7.根据权利要求6所述的所述一种基于扰动视觉解释的视频异常事件检测方法,其特征在于,约束条件为:其中,表示对网络中第l层的第i神经元的非线性层进行激活后的激活函数;所述调整公式对解释图进行调整的过程包括:其中,表示调整后的解释图激活,表示原始解释图的激活,表示原始图像的激活,eCT表示解释图,bu表示激活函数的上边界值,bl表示激活函数的下边界值。8.根据权利要求1所述的一种基于扰动视觉解释的视频异常事件检测方法,其特征在于,所述计算输入图像的规律性分数包括:计算输入视频序列中第t帧中的一个像素强度值I在位置(x,y)的重构误差e(x,y,t);根据重构误差计算视频序列中输入帧与重建帧的欧氏距离e(t);根据欧氏距离计算输入视频的异常分数Sa(t)与规律性分数Sr(t)。9.根据权利要求8所述的一种基于扰动视觉解释的视频异常事件检测方法,其特征在于,所述计算异常分数Sa(t)与规律性分数Sr(t)的公式包括:Sr(t)=1‑Sa(t)其中,e(t)表示输入视频中的输入帧与重建帧之间的欧氏距离,e(t)min表示模型训练过程中的最小欧氏距离,e(t)max表示模型训练过程中的最大欧氏距离。