欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020103976641
申请人: 广东工业大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2025-03-19
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种序列号识别方法,其特征在于,包括:

采用光度立体重建法根据预置多个序列号图像进行三维形状信息重建,并通过第一预置神经网络进行训练处理,得到加权计算后的重建图像,所述第一预置神经网络包括第一预置损失函数,所述重建图像的重建过程包括:采用预置光度立体重建公式根据所述预置多个序列号图像进行三维形状信息重建,得到真实重建图像,所述预置光度立体重建公式为:其中yrs为所述真实重构图像,N为图像中物体表面单位法向量,divN为计算所述图像中物体表面单位法向量的散度;

将所述真实重建图像通过所述第一预置神经网络进行训练处理,得到初始重建图像;

利用预置加权公式根据所述初始重建图像和所述预置多个序列号图像进行加权计算,得到所述重建图像,所述预置加权公式为:Xdt=(1‑α)X+αYrs;

其中,α为融合因子,且满足0≤α≤1,Xdt为所述重建图像,X为所述多个序列号图像拼接的第一三维矩阵,所述Yrs为重复拼接所述初始重建图像得到的第二三维矩阵,所述第一三维矩阵与所述第二三维矩阵拼接的图像数量一致;

将所述重建图像通过第二预置神经网络进行边界框提取,得到候选文本框图和概率图,所述第二预置神经网络包括第二预置损失函数,所述候选文本框图包括多个候选文本框,所述概率图包括像素位于文本区域的概率值,一个所述概率值对应一个所述候选文本框;

获取所述概率图向量化、降序排列后的前k个所述概率值和对应的k个所述候选文本框;

通过非极大值抑制法在k个所述候选文本框中选择最大概率值对应的最佳文本框,以所述最佳文本框提取出的文本区域作为待识别文本图;

将所述待识别文本图输入第三预置神经网络进行序列号识别操作,得到识别结果,所述第三预置神经网络包括第三预置损失函数,总损失函数包括所述第一预置损失函数、所述第二预置损失函数和所述第三预置损失函数。

2.根据权利要求1所述的序列号识别方法,其特征在于,所述将所述重建图像通过第二预置神经网络进行边界框提取,得到候选文本框图和概率图,之前还包括:获取预置训练图像集,所述预置训练图像集包括训练概率图和训练候选文本框图;

用所述预置训练图像集训练预置提取神经网络,得到所述第二预置神经网络。

3.根据权利要求1所述的序列号识别方法,其特征在于,所述候选文本框图包括四个通道,每个通道对应所述候选文本框的一个顶点。

4.根据权利要求1所述的序列号识别方法,其特征在于,所述总损失函数为:Ltotal=λ1Lrs+λ2Ldt+λ3Lrg;

其中,Lrs、Ldt、Lrg分别为所述第一预置损失函数、所述第二预置损失函数和所述第三预置损失函数,λ1、λ2、λ3为权衡因子。

5.一种序列号识别装置,其特征在于,包括:

重建模块,用于采用光度立体重建法根据预置多个序列号图像进行三维形状信息重建,并通过第一预置神经网络进行训练处理,得到加权计算后的重建图像,所述第一预置神经网络包括第一预置损失函数,所述重建模块,包括:光度立体法子模块,用于采用预置光度立体重建公式根据所述预置多个序列号图像进行三维形状信息重建,得到真实重建图像,所述预置光度立体重建公式为:其中yrs为所述真实重构图像,N为图像中物体表面单位法向量,divN为计算所述图像中物体表面单位法向量的散度;

网络训练子模块,用于将所述真实重建图像通过所述第一预置神经网络进行训练处理,得到初始重建图像;

加权计算模子模块,用于利用预置加权公式根据所述初始重建图像和所述预置多个序列号图像进行加权计算,得到所述重建图像,所述预置加权公式为:Xdt=(1‑α)X+αYrs;

其中,α为融合因子,且满足0≤α≤1,Xdt为所述重建图像,X为所述多个序列号图像拼接的第一三维矩阵,所述Yrs为重复拼接所述初始重建图像得到的第二三维矩阵,所述第一三维矩阵与所述第二三维矩阵拼接的图像数量一致;

边框提取模块,用于将所述重建图像通过第二预置神经网络进行边界框提取,得到候选文本框图和概率图,所述第二预置神经网络包括第二预置损失函数,所述候选文本框图包括多个候选文本框,所述概率图包括像素位于文本区域的概率值,一个所述概率值对应一个所述候选文本框;

获取模块,用于获取所述概率图向量化、降序排列后的前k个所述概率值和对应的k个所述候选文本框;

选择模块,用于通过非极大值抑制法在k个所述候选文本框中选择最大概率值对应的最佳文本框,以所述最佳文本框提取出的文本区域作为待识别文本图;

识别模块,用于将所述待识别文本图输入第三预置神经网络进行序列号识别操作,得到识别结果,所述第三预置神经网络包括第三预置损失函数,总损失函数包括所述第一预置损失函数、所述第二预置损失函数和所述第三预置损失函数。

6.根据权利要求5所述的序列号识别装置,其特征在于,还包括:预训练模块,用于获取预置训练图像集,所述预置训练图像集包括训练概率图和训练候选文本框图;

用所述预置训练图像集训练预置提取神经网络,得到所述第二预置神经网络。

7.根据权利要求5所述的序列号识别装置,其特征在于,所述候选文本框图包括四个通道,每个通道对应所述候选文本框的一个顶点。

8.根据权利要求5所述的序列号识别装置,其特征在于,所述总损失函数为:Ltotal=λ1Lrs+λ2Ldt+λ3Lrg;

其中,Lrs、Ldt、Lrg分别为所述第一预置损失函数、所述第二预置损失函数和所述第三预置损失函数,λ1、λ2、λ3为权衡因子。