首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种文字方向确定方法、装置、设备及存储介质_中国建设银行股份有限公司_202010170722.7 

申请/专利权人:中国建设银行股份有限公司

申请日:2020-03-12

公开(公告)日:2024-04-26

公开(公告)号:CN111353491B

主分类号:G06V30/146

分类号:G06V30/146;G06V10/82;G06N3/0464;G06N3/082

优先权:

专利状态码:有效-授权

法律状态:2024.04.26#授权;2022.09.27#专利申请权的转移;2020.07.24#实质审查的生效;2020.06.30#公开

摘要:本发明公开了一种文字方向确定方法、装置、设备及存储介质,包括:从待识别文字图像中提取多个单字图像;通过预训练的检测模型对多个单字图像进行方向识别;基于多个单字图像的方向识别结果确定待识别文字图像的正方向。本实施例通过单字图像的方向检测出整个文本图像的正方向,快速确定文字图像的方向,提高检测的准确度。

主权项:1.一种文字方向确定方法,其特征在于,包括:从待识别文字图像中提取多个单字图像;通过预训练的检测模型对多个所述单字图像进行方向识别;基于多个单字图像的方向识别结果确定待识别文字图像的正方向;其中,所述基于多个单字图像的方向识别结果确定待识别文字图像的正方向,包括:如果正方向的单字图像数量与所有单字图像数量的比例大于或等于预设值,则确定当前方向为待识别文字图像的正方向;如果正方向的单字图像数量与所有单字图像数量的比例小于预设值,则确定所述当前方向不是所述待识别文字图像的正方向,则获取旋转后的待识别文字图像,并返回重新执行从待识别文字图像中提取多个单字图像的操作,直到确定待识别文字图像的正方向;其中,所述当前方向为所述待识别文字图像对应的方向;其中,所述方法还包括:通过Hough变换去除所述待识别文字图像中的噪声干扰,并利用滴水算法对粘连字符进行字符切割,以得到所述待识别文字图像中各个文字的单字图像;其中,所述多个单字图像分布在所述待识别文字图像的不同部分;相应的,所述从待识别文字图像中提取多个单字图像,包括:将所述待识别文字图像平均划分为第一预设数量的图像区域,并在每个所述图像区域内选择第二预设数量的文字作为单字;其中,所述第一预设数量是根据所述待识别文字图像的尺寸来确定的,所述第二预设数量是根据每个所述图像区域内的文字总数来确定的;其中,所述从待识别文字图像中提取多个单字图像之前,还包括:获取各个方向的样本单字图像;将所述各个方向的样本单字图像输入卷积神经网络进行训练,得到预训练的检测模型;其中,将所述各个方向的样本单字图像输入卷积神经网络进行训练之前,还包括:对卷积神经网络进行裁剪;对卷积神经网络中的yolo层算法和anchor层算法进行优化;其中,对卷积神经网络进行裁剪,包括:删除卷积神经网络中的全连接层FClayer;其中,对卷积神经网络中的yolo层算法和anchor层算法进行优化,包括:将经过卷积层处理后的图片进行两次上采样及拼接处理;输出三种不同尺寸的特征图;其中,所述yolo层算法采用yolov3版本。

全文数据:

权利要求:

百度查询: 中国建设银行股份有限公司 一种文字方向确定方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。