买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于OCR的档案智能归档系统_江苏永山窍档案管理服务有限公司_202210790973.4 

申请/专利权人:江苏永山窍档案管理服务有限公司

申请日:2022-07-05

公开(公告)日:2024-05-10

公开(公告)号:CN115116068B

主分类号:G06V30/148

分类号:G06V30/148;G06F16/11;G06F16/14

优先权:

专利状态码:有效-授权

法律状态:2024.05.10#授权;2022.10.18#实质审查的生效;2022.09.27#公开

摘要:本发明提供了一种基于OCR的档案智能归档系统,包括规则库模块、档案目录模块、任务识别模块、预审模块、归档模块、检索模块;规则库模块是基于OCR功能对特定格式的电子化文件进行规则的设定;档案目录模块是对档案存储结构以及内容的定义;任务识别模块对接受到的一系列电子化档案进行识别;预审模块是基于规则库定义的内容与识别结果进行比对;归档模块是将预审结果通过的电子化信息进行复核确认;检索模块是对已经归档成功的档案进行检索,支持根据档案目录以及标签进行检索。本发明系统对电子化档案归档进行智能分类,并根据规则库支持自动预审,提高了工作的效率以及质量。

主权项:1.一种基于OCR的档案智能归档系统,其特征在于,包括规则库模块、档案目录模块、任务识别模块、预审模块、归档模块、检索模块;所述规则库模块用于,基于OCR功能对特定格式的电子化档案样本进行上传,并根据需要进行规则的设定,规则库包括电子化档案样本以及基于样本设定的相关规则;所述档案目录模块用于,对档案存储结构和内容进行定义,所述对档案存储结构进行定义是指创建一系列目录结构用于对档案的分类,所述对档案存储内容进行定义是指关联规则库,只有满足规则库的档案,才能够通过归档;所述任务识别模块用于,将所有需要进行电子化识别的档案加入任务队列,根据任务逐个识别每个档案,结合规则库中的规则进行识别,包括:对电子化档案进行二值化处理,并进行去噪,检查是否存在倾斜,存在倾斜情况进行矫正,然后对字符进行OCR字符识别,根据坐标对圈选区域内的文字进行识别,通过比对规则库中的样本,进行分类识别,最后将电子化档案和识别结果信息放入对应的档案目录中;所述预审模块用于,将任务识别模块得到的识别结果与规则库中的规则进行比对,通过比对结果决定预审是否通过;所属归档模块用于,将预审结果通过的电子化信息进行复核确认,将确认通过的档案进行最终归档;对预审未通过的电子化信息进行检查,如果发现预审结果出错的电子化信息,则优化规则库的规则;所述检索模块用于,对已经归档成功的档案进行检索,支持根据档案目录以及标签进行检索,并能够根据用户角色进行权限相关设定;所述规则包括:样本规则、区域识别规则、印章规则、签字规则;所述样本规则为一个或两个以上电子化样本,当对文件进行OCR规则识别与样本比对后,相似率达到阈值则满足样本规则,阈值能够根据档案整理需求实际情况进行设置;所述区域识别规则是根据两组以上的坐标区域的内容进行识别,至少需要包含3组坐标,才能够形成区域识别规则,坐标原点为文件左上角,坐标原点横坐标x和纵坐标y分别为:x=0、y=0,单位为像素,所有坐标基于原点进行计算,对区域内的信息进行识别提取;所述印章规则,用于判断设定的一个区域内是否存在印章;所述印章包括企业印章和个人印章,包括但不限于:合同章、财务章、法人章、公章;所述签字规则,用于判断设定的一个区域内是否存在签字;所述签字包括手写体签字、印刷体签字。

全文数据:

权利要求:

百度查询: 江苏永山窍档案管理服务有限公司 一种基于OCR的档案智能归档系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。