买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种扫描文档图文信息提取与鉴别的方法_国家电网有限公司;国网湖北省电力有限公司信息通信公司_201911326611.4 

申请/专利权人:国家电网有限公司;国网湖北省电力有限公司信息通信公司

申请日:2019-12-20

公开(公告)日:2024-04-16

公开(公告)号:CN111401372B

主分类号:G06V30/148

分类号:G06V30/148;G06V30/146;G06V30/168

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2020.08.04#实质审查的生效;2020.07.10#公开

摘要:本发明涉及一种扫描文档图文信息提取与鉴别的方法,该方法包括以下步骤:1将扫描的文档图像进行预处理,并将预处理后图像进行版面分割,选出包括但不限于签名、印章;2将1提取的签名经过预处理,采用OTSU算法去除背景后,输入到Writer‑Dependent网络中提取其特征值,再输入至使用真实签名训练得到的SVM分类器中,得到该签名的真伪性;3将1提取的印章经过预处理后进行极坐标转化,使得印章内部的环形文字展开为横向排列文字,将展开后的文字输入到CPTN+CRNN网络中依次进行提取和识别,输出印章的文字内容;4判断该文档的有效性。本发明能够代替人工对文档进行分析与判断。

主权项:1.一种扫描文档图文信息提取与鉴别的方法,该方法包括以下步骤:步骤1),将扫描的文档图像进行去噪、平滑预处理,并将预处理后图像进行版面分割,选出包括但不限于签名、印章;步骤2),将步骤1)提取的签名经过预处理,预处理过程首先将图片缩放至,其中;再将图片行灰度转化,灰度图像转化过程为将预处理后图像的RGB三个通道中的最低值作为当前像素点的像素值: (1)其中,表示灰度图像中第i行第j列像素点的像素值,表示预处理后图像中第i行第j列R通道像素点的像素值,表示预处理后图像中第i行第j列G通道像素点的像素值,表示预处理后图像中第i行第j列B通道像素点的像素值,;使用OTSU算法去除背景:设置背景为白色,保留前景像素的灰度值,然后将每个像素进行反转,得到零值背景图像;将灰度等级T从0~255划分为16个等级,当T为某个值时,前景和背景的像素值方差g最大,这个T就为所求的灰度等级,其中, (2) 表示灰度图以T划分后前景像素点所占的比例; 表示灰度图以T划分后前景像素点的平均灰度值; 表示灰度图以T划分后背景像素点所占的比例; 表示灰度图以T划分后背景像素点的平均灰度值; 表示图像总的平均灰度,利用灰度等级T把灰度化之后的图片分成两个部分,当像素值,则该像素值为前景,当像素值,则该像素值为背景,像素反转原理为 (8)其中为图像的像素值,T为OTSU算法所求的灰度划分值;Writer-Dependent卷积网络的输入为的灰度签名图片,输出为2048维特征向量,然后特征向量输入至分类器SVM中得到最终的真伪分数C,当输出分数C大于8时认为其为伪造签名,当C小于或等于8时认为其为真实签名;步骤3),将步骤1)提取的印章经过预处理后进行极坐标转化,使得印章内部的环形文字展开为横向排列文字,将展开后的文字输入到CPTN+CRNN网络中依次进行提取和识别,输出印章的文字内容;步骤4),利用步骤2)至步骤3)得到的签名得分值与印章内容判断该文档的有效性。

全文数据:

权利要求:

百度查询: 国家电网有限公司;国网湖北省电力有限公司信息通信公司 一种扫描文档图文信息提取与鉴别的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。