欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2013107225637
申请人: 浙江工业大学
专利类型:发明专利
专利状态:已下证
专利领域: 电通信技术
更新日期:2023-12-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于机器学习的视频异常检测方法,其特征在于:所述异常检测方法包括以下步骤:

1)视频读入:将视频文件以一帧一帧的bmp图像数据读入;

2)视频异常检测:对分解出的图像进行检测,过程如下:

a)画面过亮、画面过暗检测过程:首先对图像进行灰度化处理,得到灰度图,f(x,y)表示灰度图中(x,y)点上的像素值,设立亮度阀值light,暗度阀值dark,当f(x,y)>light时,该点记为过亮点,当f(x,y)<dark时,该点记为过暗点,统计视频镜头区域的过亮点、过暗点个数NUMlight、NUMdark设立阀值Tα和Tβ,如果NUMlight>Tα,则当前帧为过亮帧;如果NUMdark>Tβ,则当前帧为过暗帧;

b)增益紊乱的检测过程:图像颜色紊乱,采用YUV颜色空间进行判断,Y代表灰度,U分量和V分量决定了颜色本身偏蓝或偏红的色度;YUV颜色空间的基本原理是建立二维坐标,以U为横坐标,V为纵坐标,将颜色分为4个色区,设立阀值TD,如果d>TD,则(U,V)为颜色深点;对图像进行2*2分区,当总的颜色深点的点数大于图像面积的1/2,且每个色区、图像分区的颜色深点存在及个数均匀时,则当前帧为增益紊乱帧,距离 越大颜色越深;

c)模糊、被遮挡检测过程:对f(x,y)与Sobel算子进行卷积求取图像x和y方向的梯度图fx(x,y)和fy(x,y),然后求得f(x,y)的梯度,设阀值Tγ,如果|f(x,y)|>Tγ,则记为边缘点;

对图像进行分区,设立阀值TA,如果每个分区的边缘点个数都小于TA,且图像的平均灰度F满足Tβ<F<Tα,则判断为模糊帧;如果部分区域的边缘点个数小于TA,且该部分平均灰度F满足F<Tβ,其他区域边缘点个数大于TA,则判断为被遮挡帧;

d)条带状干扰、滚屏的检测过程:同步骤c)求得图像的梯度|f(x,y)|,根据阀值对图像像素点进行标记,分别为边缘点和非边缘点;统计每一行的边缘点个数Ni及每一列的边缘点个数Mj,i=1,2,…,H,j=1,2,…,W,其中H代表图像高,W是图像宽;当至少有一行Ni>

0.6*W时,则判断为条状干扰帧;当至少有一列Mj>0.6*H时,则判断为带状干扰帧;当存在Ni>0.9*W或者Mj>0.9*H,记录最大值的位置max i或max j,每隔3帧对图像线条位置max i或max j进行一次比较,设立滚屏滚动阀值TN和TM,当|max i-max i'|>TN或|max j-max j'|>TM,则判断为滚屏帧,其中max i'与max i对应帧相隔3帧;

e)雪花干扰的检测过程:先对图像灰度化处理,设立像素差阀值Tη,如果帧间像素差分绝对值|fk(x,y)-fk+1(x,y)|>Tη,则记为雪花噪点,当噪点数大于图像面积的1/5时,可能存在雪花噪声,将图像分为16*16的小块,当每块都存在噪声时,则判断为雪花帧;

f)抖动的检测过程:先求得图像的梯度图,如果所求得的||fk(x,y)|-|fk+2(x,y)||>Tκ,则将(x,y)记为图像晃动轮廓点,统计当前图像的晃动轮廓点数n2以及图像中的边缘点数n1,如果|n2-n1|大于图像面积的1/10,则判断为抖动帧;

g)偏色的检测过程如下:RGB颜色结构不利于偏色的判断,会在一些特殊场景中误判,比如图像中绿色树叶占大比例,很容易把正常图像判断为偏绿,将RGB颜色空间转化到Lab空间进行检测,Lab色彩模型由三个要素组成,L表示亮度,a表示从洋红色至绿色的范围,b表示从黄色至蓝色的范围,先将图像RGB转换为Lab空间,求出图像平均色度D,图像色度中心距M,偏色因子K=D/M,根据偏色标准进行判断;

h)冻结检测过程如下:当连续一定数量帧的像素一模一样时,fk(x,y)=fk+1(x,y),判断为冻结;

3)机器学习:将判断为异常的视频,根据异常代码与数据库中存在的同类型误判的视频进行相似度比较,判断当前视频是否属于误判情况。

2.如权利要求1所述的一种基于机器学习的视频异常检测方法,其特征在于:所述异常检测方法还包括以下步骤:

算法优化,通过设定相互冲突的异常类型,对于相互冲突的异常类型不需要重复检测。

3.如权利要求1或2所述的一种基于机器学习的视频异常检测方法,其特征在于:步骤

3)中,相似度比较过程:提取的视频特征有颜色和纹理两类,引入视频镜头特征向量,向量的前32维为根据HSV颜色直方图统计得到的颜色信息分量,后三维为粗糙度、对比度、方向性三个分量,比较两视频镜头质心向量之间的距离计算视频之间的相似度。