买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种将文本及证照类图片智能摆正的方法、装置和设备_上海通办信息服务有限公司_202211005535.9 

申请/专利权人:上海通办信息服务有限公司

申请日:2022-08-19

公开(公告)日:2024-01-16

公开(公告)号:CN115457559B

主分类号:G06V30/146

分类号:G06V30/146;G06V30/148;G06F17/16

优先权:

专利状态码:有效-授权

法律状态:2024.01.16#授权;2022.12.27#实质审查的生效;2022.12.09#公开

摘要:本申请公开了一种将文本及证照类图片智能摆正的方法、装置和设备,所述方法包括:利用文本检测模型识别出原始图像的文本区域,并将文本区域转化为矩形文本框;按照第一预设规则重新排列每个矩形文本框的四个顶点的坐标顺序;按照第二预设规则找到一个代表性的矩形文本框,以其第一个点为中心计算出其长边逆时针旋转到与X轴平行所需的旋转角度A;在原始图像上将代表性的矩形文本框利用透视变换校正截取出一个矩形小图;判断截取出的矩形小图是0°还是180°,记作角度C;结合旋转角度A和角度C计算出原始图像的摆正角度K,K=A+C,并旋转摆正。本申请实现了文本及证照类图片的智能摆正,提高了政务服务过程中材料治理的图片质量。

主权项:1.一种将文本及证照类图片智能摆正的方法,其特征在于,包括:S1,利用文本检测模型识别出原始图像的文本区域,并将文本区域转化为矩形文本框;S2,按照第一预设规则重新排列每个矩形文本框的四个顶点的坐标顺序;S3,按照第二预设规则找到一个代表性的矩形文本框,以其第一个点为中心计算出该矩形文本框的长边逆时针旋转到与X轴平行所需要的旋转角度A;S4,在原始图像上将找到的代表性的矩形文本框利用透视变换,截取出一个矩形小图,对透视变换后矩形小图进行长宽判断,如果高度像素大于宽度像素,则将矩形小图逆时针旋转90°;S5,利用二分类图像方向判断器,判断步骤S4中得到的矩形小图是0°还是180°,记作角度C;S6,结合旋转角度A和角度C,计算出原始图像最终的摆正角度K,K=A+C,并旋转摆正;其中,步骤S2中,所述第一预设规则包括:当文本处于正向时,按读取习惯从上到下从左到右的顺序对每个矩形文本框的四个点重新排序;计算出四个点中纵坐标y最小的点,如果y最小的点有两个,那么横坐标x最小的那个点设定为第一个点,逆时针推导出剩下三个点的顺序;其中,步骤S3中,所述第二预设规则包括:S31,过滤掉图片中的两种矩形文本框:一种是单字文本框,另一种是与图片方向不一致的水印文本框,具体包括如下步骤:计算出所有矩形文本框长边的长度,即第一个点到第二个点的距离和第一个点到第四个点的距离,哪个距离长就以此作为该矩形文本框的长边长度,然后过滤掉所有长边长度小于均值的矩形文本框;计算出剩下的每个矩形文本框的长边与X轴的夹角a,并按照正负误差在2度以内的进行归类;S32,计算包含矩形文本框最多的类别的所有夹角a的均值,离均值最近的夹角a的矩形文本框就是要找的代表性的矩形文本框,如果是多个,再从这多个里面找出长边的长度离均值最近的矩形文本框。

全文数据:

权利要求:

百度查询: 上海通办信息服务有限公司 一种将文本及证照类图片智能摆正的方法、装置和设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。