欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020115669517
申请人: 北京百度网讯科技有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于图像识别模型的对象识别方法,包括:

获取多个候选类型的置信度阈值;

采用图像识别模型对采集图像进行识别,得到目标区域,以及得到各候选类型的置信度;其中,所述目标区域是所述采集图像中包含对象的区域,所述置信度用于指示所述对象属于对应候选类型的概率,提供多种相机的适配,所述采集图像是将一个或多个工业相机接入,对图像进行采集所得到的;在多个工业相机场景下,每个工业相机对应的图像识别模型相同或不同,用户能够通过用户交互界面进行相应相机的图像识别模型的选择;

根据所述多个候选类型的置信度阈值,从多个所述候选类型中,确定目标类型,其中,所述目标类型是所对应置信度大于所对应的置信度阈值的候选类型;

确定所述目标区域所包含的对象属于所述目标类型;

其中,所述方法还包括:响应于第二设置操作,设定尺寸范围,所述尺寸范围是所述对象映射至图像中的尺寸范围,所述第二设置操作包括用户执行的点击操作,或者是滑动操作,以用于在和用户交互的UI界面中,设定对象的尺寸范围;将所述目标区域中符合设定形状的最大局部区域,作为对象区域,所述设定形状是指待识别对象的设定形状;在所述对象区域的尺寸处于所述尺寸范围内的情况下,确定所述目标区域内展示的对象符合所述尺寸范围;

所述确定所述目标区域所包含的对象属于所述目标类型,包括:在所述目标区域内展示的对象符合所述尺寸范围的情况下,确定所述目标区域所包含的对象属于所述目标类型;

其中,所述采用图像识别模型对采集图像进行识别,包括:从至少一个图像传感器获取包含多帧采集图像的视频流;

将所述视频流转化为预定文件格式的视频文件;

采用预定接口将所述预定文件格式的视频文件输入所述图像识别模型进行识别,在用户交互界面中对多个识别结果进行展示。

2.根据权利要求1所述的对象识别方法,其中,所述获取多个候选类型的置信度阈值,包括:响应于第一设置操作,设定多个所述候选类型的所述置信度阈值;

或者,根据所述图像识别模型的训练样本集合中各所述候选类型的训练样本数量,确定各所述候选类型的所述置信度阈值。

3.根据权利要求1所述的对象识别方法,其中,所述方法,还包括:根据设定系数对所述目标区域的面积进行修正,以得到修正后的面积;

在所述修正后的面积处于所述尺寸范围内的情况下,确定所述目标区域内展示的对象符合所述尺寸范围。

4.根据权利要求1所述的对象识别方法,其中,所述方法,还包括:根据所述目标区域中横向和/或纵向的像素点个数,确定所述目标区域的尺寸;

在所述目标区域的尺寸处于所述尺寸范围内的情况下,确定所述目标区域内展示的对象符合所述尺寸范围。

5.根据权利要求1‑4任一项所述的对象识别方法,其中,所述采用图像识别模型对采集图像进行识别,包括:从图像传感器获取包含多帧采集图像的视频流;

将获取到的所述视频流转化为数组格式的数据;

将所述数组格式的数据输入至所述图像识别模型进行识别。

6.一种基于图像识别模型的对象识别装置,包括:

获取模块,用于获取多个候选类型的置信度阈值;

处理模块,用于采用图像识别模型对采集图像进行识别,得到目标区域,以及得到各候选类型的置信度;其中,所述目标区域是所述采集图像中包含对象的区域,所述置信度用于指示所述对象属于对应候选类型的概率,提供多种相机的适配,所述采集图像是将一个或多个工业相机接入,对图像进行采集所得到的;在多个工业相机场景下,每个工业相机对应的图像识别模型相同或不同,用户能够通过用户交互界面进行相应相机的图像识别模型的选择;

第一确定模块,用于根据所述多个候选类型的置信度阈值,从多个所述候选类型中,确定目标类型,其中,所述目标类型是所对应置信度大于所对应的置信度阈值的候选类型;

识别模块,用于确定所述目标区域所包含的对象属于所述目标类型;

其中,所述装置还包括:

设定模块,用于响应于第二设置操作,设定尺寸范围,所述尺寸范围是所述对象映射至图像中的尺寸范围,所述第二设置操作包括用户执行的点击操作,或者是滑动操作,以用于在和用户交互的UI界面中,设定对象的尺寸范围;

第二确定模块,用于将所述目标区域中符合设定形状的最大局部区域,作为对象区域,所述设定形状是指待识别对象的设定形状;在所述对象区域的尺寸处于所述尺寸范围内的情况下,确定所述目标区域内展示的对象符合所述尺寸范围;

所述识别模块,具体用于:

在所述目标区域内展示的对象符合所述尺寸范围的情况下,确定所述目标区域所包含的对象属于所述目标类型;

所述处理模块,具体用于:

从至少一个图像传感器获取包含多帧采集图像的视频流;

将所述视频流转化为预定文件格式的视频文件;

采用预定接口将所述预定文件格式的视频文件输入所述图像识别模型进行识别,在用户交互界面中对多个识别结果进行展示。

7.根据权利要求6所述的对象识别装置,其中,所述获取模块,具体用于:响应于第一设置操作,设定多个所述候选类型的所述置信度阈值;

或者,根据所述图像识别模型的训练样本集合中,各所述候选类型的训练样本数量,确定各所述候选类型的所述置信度阈值。

8.根据权利要求6所述的对象识别装置,其中,

所述第二确定模块,还用于根据设定系数对所述目标区域的面积进行修正,以得到修正后的面积;在所述修正后的面积处于所述尺寸范围内的情况下,确定所述目标区域内展示的对象符合所述尺寸范围。

9.根据权利要求6所述的对象识别装置,其中,

所述第二确定模块,还用于根据所述目标区域中横向和/或纵向的像素点个数,确定所述目标区域的尺寸;在所述目标区域的尺寸处于所述尺寸范围内的情况下,确定所述目标区域内展示的对象符合所述尺寸范围。

10.根据权利要求6‑9任一项所述的对象识别装置,其中,所述处理模块,具体用于:从图像传感器获取包含多帧采集图像的视频流;

将获取到的所述视频流转化为数组格式的数据;

将所述数组格式的数据输入至所述图像识别模型进行识别。

11.一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1‑5中任一项所述的方法。

12.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1‑5中任一项所述的方法。