欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 202110499309X
申请人: 金陵科技学院
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种弯曲文字矫正方法,其特征在于,包括以下步骤,

获取包含成行文字的图片;

利用文字中线识别模型对所述图片进行识别,得到文字中线热点图;

将所述文字中线热点图还原为组成文字中线的点,具体为:遍历所述文字中线热点图中的点,对于每个热点,将其与周围热点进行比较,取热点值最大的热点;判断所述热点值最大的热点位于文字中线的概率是否大于预设的第一阈值,如是则保留该热点,否则丢弃,从而得到组成文字中线的点集;

对所述点集进行聚类,具体为合并距离小于第二阈值的所述点集,直到所述点集之间的距离大于所述第二阈值;

矫正文字,具体为:对每组点集用曲线拟合,沿所述曲线对图片进行切片,再对所述切片进行直线合并,得到沿直线排列的整行文字。

2.根据权利要求1所述的弯曲文字矫正方法,其特征在于,所述文字中线识别模型由以下步骤得到,S21、人工标记图片中每行文字的中线,并将该中线通过高斯变换转换成第一热点图;

S22、利用深度卷积网络对原始图片进行预测得到第二热点图;

S23、将所述第一热点图和所述第二热点图进行训练,直到损失函数收敛为止,得到所述文字中线识别模型;所述损失函数表示所述第一热点图的预测量和所述第二热点图预测量之间的误差。

3.根据权利要求2所述的弯曲文字矫正方法,其特征在于,S22中所述利用深度卷积网络对原始图片进行预测得到第二热点图具体为:所述原始图片经过深度卷积网络的卷积层提取特征值、池化层降低分辨率后,得到特征矩阵,再经过激活函数激活,将特征点的值归一化到0~1之间,即得到所述第二热点图。

4.根据权利要求2所述的弯曲文字矫正方法,其特征在于,所述损失函数为其中,l、w、h分别表示热点图的通道维度、宽和高,j、x、y表示热点图上点的坐标, 表示第二热点图的预测量, 表示第一热点图的预测量。

5.根据权利要求3所述的弯曲文字矫正方法,其特征在于,所述激活函数为其中,x表示第二热点图中某个热点的热点值。

6.根据权利要求1所述的弯曲文字矫正方法,其特征在于,所述切片的宽度为一个像素点。

7.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至6任一项中所述的方法。

8.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至6任一项中所述的方法。