欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2021108132672
申请人: 北京百度网讯科技有限公司
专利类型:发明专利
专利状态:授权未缴费
专利领域: 计算;推算;计数
更新日期:2024-06-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种图像识别模型的训练方法,所述方法包括:将标注图像输入第一图像识别模型,将真实图像输入第二图像识别模型,其中,所述第一图像识别模型和所述第二图像识别模型为待训练的相同图像识别模型;

基于所述第一图像识别模型中目标处理层的结果和所述第二图像识别模型中所述目标处理层的结果,生成所述第一图像识别模型的损失值;

基于所述损失值,训练所述第一图像识别模型,得到训练后的第一图像识别模型。

2.根据权利要求1所述的方法,其中,所述基于所述第一图像识别模型中目标处理层的结果和所述第二图像识别模型中所述目标处理层的结果,生成所述第一图像识别模型的损失值,包括:

将所述第一图像识别模型中所述目标处理层的结果和所述第二图像识别模型中所述目标处理层的结果,输入预设的跨域损失函数,得到第一损失值;

基于所述第一损失值,生成所述第一图像识别模型的损失值,其中,所述跨域损失函数是基于最大均值差异生成的。

3.根据权利要求1所述的方法,其中,所述训练包括多次训练过程;

每次训练过程包括以下步骤:

按照前一次训练过程得到的第一图像识别模型的权重,更新前一次训练过程所采用的第二图像识别模型的权重,得到本次训练过程将采用的第二图像识别模型。

4.根据权利要求1所述的方法,其中,所述目标处理层是中间处理层,在所述第一图像识别模型和所述第二图像识别模型两者的训练结构中包括所述目标处理层,所述目标处理层为全连接层。

5.根据权利要求2所述的方法,其中,所述基于所述第一损失值,生成所述第一图像识别模型的损失值,包括:

根据交叉熵损失函数和所述第一图像识别模型的输出,生成第二损失值;

根据洛瓦斯损失函数和所述第一图像识别模型的输出,生成第三损失值;

根据所述第一损失值、所述第二损失值和所述第三损失值,生成所述第一图像识别模型的损失值。

6.根据权利要求1‑5之一所述的方法,其中,图像识别模型的输出包括掩膜,图像识别模型用于识别图像中的目标对象,所述掩膜用于指示输入图像识别模型的图像中的所述目标对象的类别和位置。

7.根据权利要求6所述的方法,其中,所述标注图像的标注信息包括所述掩膜,所述掩膜包括图像的各个像素的掩膜,像素的掩膜包括预设的颜色信息,不同的颜色信息指示不同类别的交通标线。

8.根据权利要求1所述的方法,其中,图像识别模型包括编码器和解码器;

所述训练中的前向传播过程,包括:通过所述编码器,获取输入所述图像识别模型的图像的特征图,并对所述特征图进行金字塔池化;

根据金字塔池化结果,生成编码器的特征编码结果;

通过所述解码器,对所述特征编码结果和所述特征图进行特征融合;

根据所述特征融合结果,得到所输入图像的掩膜;

其中,图像识别模型包括目标卷积层,所述目标卷积层用于进行深度可分离卷积处理和膨胀卷积处理。

9.一种图像识别方法,其中,所述方法采用权利要求1‑8中任一项中训练后的图像识别模型,图像识别模型的输出包括掩膜,图像识别模型用于识别图像中的目标对象,所述目标对象为交通标线。

10.根据权利要求9所述的方法,其中,所述方法还包括:获取输出的掩膜指示的目标交通标线的定位信息;

在交通标线集合中,确定所述定位信息对应的交通标线参考图;

根据所述交通标线参考图,确定所述目标交通标线的缺失情况信息,其中,所述缺失情况信息指示交通标线是否存在缺失。

11.根据权利要求9所述的方法,其中,所述根据所述交通标线参考图,确定所述目标交通标线的缺失情况信息,包括:

确定所述目标交通标线与所述交通标线参考图之间的面积比值;

根据所述面积比值,确定所述目标交通标线是否存在缺失。

12.一种图像识别模型的训练装置,所述装置包括:输入单元,被配置成将标注图像输入第一图像识别模型,将真实图像输入第二图像识别模型,其中,所述第一图像识别模型和所述第二图像识别模型为待训练的相同图像识别模型;

生成单元,被配置成基于所述第一图像识别模型中目标处理层的结果和所述第二图像识别模型中所述目标处理层的结果,生成所述第一图像识别模型的损失值;

训练单元,被配置成基于所述损失值,训练所述第一图像识别模型,得到训练后的第一图像识别模型。

13.根据权利要求12所述的装置,其中,所述生成单元,进一步被配置成按照如下方式执行所述基于所述第一图像识别模型中目标处理层的结果和所述第二图像识别模型中所述目标处理层的结果,生成所述第一图像识别模型的损失值:所述基于所述第一图像识别模型中目标处理层的结果和所述第二图像识别模型中所述目标处理层的结果,生成所述第一图像识别模型的损失值,包括:将所述第一图像识别模型中所述目标处理层的结果和所述第二图像识别模型中所述目标处理层的结果,输入预设的跨域损失函数,得到第一损失值;

基于所述第一损失值,生成所述第一图像识别模型的损失值,其中,所述跨域损失函数是基于最大均值差异生成的。

14.根据权利要求12所述的装置,其中,所述训练包括多次训练过程;

每次训练过程包括以下步骤:

按照前一次训练过程得到的第一图像识别模型的权重,更新前一次训练过程所采用的第二图像识别模型的权重,得到本次训练过程将采用的第二图像识别模型。

15.根据权利要求12所述的装置,其中,所述目标处理层是中间处理层,在所述第一图像识别模型和所述第二图像识别模型两者的训练结构中包括所述目标处理层,所述目标处理层为全连接层。

16.根据权利要求13所述的装置,其中,所述生成单元,进一步被配置成按照如下方式执行所述基于所述第一损失值,生成所述第一图像识别模型的损失值:根据交叉熵损失函数和所述第一图像识别模型的输出,生成第二损失值;

根据洛瓦斯损失函数和所述第一图像识别模型的输出,生成第三损失值;

根据所述第一损失值、所述第二损失值和所述第三损失值,生成所述第一图像识别模型的损失值。

17.根据权利要求12‑16之一所述的装置,其中,图像识别模型的输出包括掩膜,图像识别模型用于识别图像中的目标对象,所述掩膜用于指示输入图像识别模型的图像中的所述目标对象的类别和位置。

18.根据权利要求17所述的装置,其中,所述标注图像的标注信息包括所述掩膜,所述掩膜包括图像的各个像素的掩膜,像素的掩膜包括预设的颜色信息,不同的颜色信息指示不同类别的交通标线。

19.根据权利要求12所述的装置,其中,图像识别模型包括编码器和解码器;

所述训练中的前向传播过程,包括:通过所述编码器,获取输入所述图像识别模型的图像的特征图,并对所述特征图进行金字塔池化;

根据金字塔池化结果,生成编码器的特征编码结果;

通过所述解码器,对所述特征编码结果和所述特征图进行特征融合;

根据所述特征融合结果,得到所输入图像的掩膜;

其中,图像识别模型包括目标卷积层,所述目标卷积层用于进行深度可分离卷积处理和膨胀卷积处理。

20.一种图像识别装置,其中,所述装置采用权利要求12‑19中任一项中训练后的图像识别模型,图像识别模型的输出包括掩膜,图像识别模型用于识别图像中的目标对象,所述目标对象为交通标线。

21.根据权利要求20所述的装置,其中,所述装置还包括:获取单元,被配置成获取输出的掩膜指示的目标交通标线的定位信息;

参考确定单元,被配置成在交通标线集合中,确定所述定位信息对应的交通标线参考图;

信息确定单元,被配置成根据所述交通标线参考图,确定所述目标交通标线的缺失情况信息,其中,所述缺失情况信息指示交通标线是否存在缺失。

22.根据权利要求20所述的装置,其中,所述信息确定单元,进一步被配置成按照如下方式执行所述根据所述交通标线参考图,确定所述目标交通标线的缺失情况信息:确定所述目标交通标线与所述交通标线参考图之间的面积比值;

根据所述面积比值,确定所述目标交通标线是否存在缺失。

23.一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1‑11中任一项所述的方法。

24.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1‑11中任一项所述的方法。

25.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1‑11中任一项所述的方法。