【发明公布】表单识别方法、表格提取方法及相关装置_北京市商汤科技开发有限公司_201980024344.7 

申请/专利权人:北京市商汤科技开发有限公司

申请日:2019-10-24

发明/设计人:詹明捷;刘学博;梁鼎

公开(公告)日:2020-11-24

代理机构:北京博思佳知识产权代理有限公司

公开(公告)号:CN111989692A

代理人:艾佳

主分类号:G06K9/34(20060101)

地址:100080 北京市海淀区北四环西路58号11层1101-1117室

分类号:G06K9/34(20060101);G06K9/46(20060101);G06K9/62(20060101);G06T7/11(20170101);G06K9/00(20060101);G06F40/186(20200101)

优先权:["20190930 CN 2019109441017"]

专利状态码:在审-公开

法律状态:2020.11.24#公开

摘要:一种表单识别方法、表格提取方法及相关装置。所述方法包括:对待识别表单图像进行表格线提取处理,得到所述待识别表单图像的表格线提取结果,所述表格线提取结果包括多个第一表格线和或多个第一表格线交点101;基于所述待识别表单图像的表格线提取结果和预设表单模板,对所述待识别表单图像进行矫正处理,其中,所述预设表单模板上具有预设的多个第二表格线和或预设的多个第二表格线交点102;对矫正处理后的所述待识别表单图像进行文本识别处理,得到表单识别结果103。

主权项:1.一种表单识别方法,其特征在于,所述方法包括:对待识别表单图像进行表格线提取处理,得到所述待识别表单图像的表格线提取结果,所述表格线提取结果包括多个第一表格线和或多个第一表格线交点;基于所述待识别表单图像的表格线提取结果和预设表单模板,对所述待识别表单图像进行矫正处理,其中,所述预设表单模板上具有预设的多个第二表格线和或预设的多个第二表格线交点;对矫正处理后的所述待识别表单图像进行文本识别处理,得到表单识别结果。

全文数据:

权利要求:

百度查询: 北京市商汤科技开发有限公司 表单识别方法、表格提取方法及相关装置