买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种卷烟物流收货票据的结构化信息提取方法_中国烟草总公司四川省公司;深圳爱莫科技有限公司_202211442689.4 

申请/专利权人:中国烟草总公司四川省公司;深圳爱莫科技有限公司

申请日:2022-11-18

公开(公告)日:2024-03-12

公开(公告)号:CN115497114B

主分类号:G06V30/414

分类号:G06V30/414;G06V30/418;G06V30/12

优先权:

专利状态码:有效-授权

法律状态:2024.03.12#授权;2023.01.03#实质审查的生效;2022.12.20#公开

摘要:本发明公开了一种卷烟物流收货票据的结构化信息提取方法,包括预标注步骤和识别步骤,其中,预标注步骤:设定票据的模板图片标准,挑选标准的模板图片,对模板图片标注key和value,其中,key为票据中固定不变的关键词,value为票据中可变的内容;识别步骤:确定待识别图片,匹配关联待识别图片的key与模板图片的key,设定待识别图片中除key以外的文本框为value候选框,根据key之间的对应关系对齐待识别图片与模板图片,错位纠正value候选框,根据模板图片value文本框中的内容提取结构化信息。本发明基于模板对齐和错位纠正的结构化信息提取,针对每种票据只需要标注一张模板图片,方法灵活且适用性高,同时还能解决印刷错位情况,识别准确率高。

主权项:1.一种卷烟物流收货票据的结构化信息提取方法,其特征在于,包括以下步骤:预标注步骤:设定票据的模板图片标准,挑选标准的模板图片,对模板图片标注key和value,其中,key为票据中固定不变的关键词,value为票据中可变的内容;识别步骤:确定待识别图片,匹配关联待识别图片的key与模板图片的key,设定待识别图片中除key以外的文本框为value候选框,根据key之间的对应关系对齐待识别图片与模板图片,错位纠正value候选框,根据模板图片value文本框中的内容提取结构化信息;预标注步骤中,标注key的步骤如下:对模板图片进行矩形框标注和文本内容标注,设定紧凑的矩形框为关键词区域;预标注步骤中,标注value的步骤如下:对模板图片中除标注key以外的需要识别的字段进行矩形框标注和字段名称标注;识别步骤中,错位纠正value候选框的步骤如下:将所有value候选框在以预设定的规律平移至少一次,计算每一次位移的value候选框与模板value框的对齐程度,选取对齐程度最高的一次位移作为最终的错位位移,并且将所有value候选框按此位移进行错位纠正,得到所述待识别图片的错位纠正的value框以及其内容。

全文数据:

权利要求:

百度查询: 中国烟草总公司四川省公司;深圳爱莫科技有限公司 一种卷烟物流收货票据的结构化信息提取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。