欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020108715008
申请人: 深圳市米特半导体技术有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-05-30
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于手机摄像头拍摄多幅照片自动拼接的文档扫描方法,其特征在于:

利用手机对文档的一部分进行拍摄,并进行OCR文字识别,在拍摄图像中设置包含文字信息的特征块,并在不同图像中利用特征块重叠的方法进行拼接,直到扫描完成整个文档;

包括:

步骤1:在手机中设置扫描文档的语言,可以选择的语言包括简体中文、繁体中文、英语、日语、俄语、德语、法语、韩语;

步骤2:使手机摄像头对准待扫描的文档的一部分,且保证手机成像范围内的文字多于

4行4列,字数多于16个;手机执行自动对焦和亮度检测,自动对焦使得待扫描文档位于手机成像的焦平面上,并根据亮度检测结果调节闪光灯的亮度;手机对待扫描文档的一部分拍摄成像,获得基准图像,并显示在手机屏幕上;

步骤3:手机对基准图像进行OCR识别,获取基准图像中包含的文字,并根据文字的方向区分文字的行和列,建立以基准图像的中心点为原点的基准坐标系,所述基准坐标系的横轴平行于文字的行,并计算每个文字相对基准图像中心的坐标;

步骤4:在基准坐标系的每个象限中筛选出距离原点最远的满足2行2列4个文字,标记为基准图像对应象限的特征块;即第N象限的特征块标记为基准图像的第N象限特征块;特征块的特征信息包括文字本身和文字之间的位置矢量关系,即以每个特征块左下角的文字的中心为起点,到其他三个文字的中心的矢量的单位向量;

特征信息表示形式为(n,A,x,B,y,C,z,D),其中n表示第n个特征块,ABCD表示四个文字本身,x表示B的中心到达A中心的矢量的单位向量,y表示C的中心到达A中心的矢量的单位向量,z分别表示D的中心到达A中心的矢量的单位向量;

步骤5:使手机摄像头对准待扫描的文档的另一部分,且保证手机成像范围内的文字多于4行4列,字数多于16个,以及成像范围内至少覆盖基准图像的一个特征块;手机执行自动对焦和亮度检测,自动对焦使得待扫描文档位于手机成像的焦平面上,并根据亮度检测结果调节闪光灯的亮度;手机对待扫描文档的当前部分拍摄成像,获得拼入图像,并显示在手机屏幕上;

步骤6:手机对拼入图像进行OCR识别,获取拼入图像中包含的文字,并根据文字的方向区分文字的行和列,建立以拼入图像的中心点为原点的拼入坐标系,所述拼入坐标系的横轴平行于文字的行,并计算每个文字相对拼入图像中心的坐标;在拼入图像中扫描寻找基准图像的四个特征块;

寻找方式为首先寻找基准图像中四个特征块的左下角的文字,找到之后计算将其与附近的文字的关系能否满足基准图像的特征块的特征信息;

当找到基准图像的特征块后,根据基准图像中对应特征块的文字之间的距离关系,调整拼入图像的大小,使得拼入图像中的对应的特征块与基准图像的特征块能够完全重合;

步骤7:在拼入坐标系的每个象限中筛选出距离原点最远的满足2行2列4个文字,标记为拼入图像对应象限的特征块;特征块的特征信息包括文字本身和文字之间的位置矢量关系,即以每个特征块左下角的文字的中心为起点,到其他三个文字的中心的矢量的单位向量;特征信息表示形式为(n,A,x,B,y,C,z,D),其中n表示第n个特征块,n接续基准图像特征块顺序编码,ABCD表示四个文字本身,x表示B的中心到达A中心的矢量的单位向量,y表示C的中心到达A中心的矢量的单位向量,z分别表示D的中心到达A中心的矢量的单位向量;

步骤8:根据拼入图像中的对应的特征块与基准图像的特征块能够完全重合为基准,将基准图像和拼入图像进行拼接,获得第一拼接图像;将基准图像和拼入图像的共8个特征块标记为第一拼接图像的特征块;并使第一拼接图像代替基准图像;

步骤9:重复进行步骤5‑8,直到基准图像覆盖待扫描文档的全部范围,图像扫描完成。