买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种对真实文档图像进行稠密点级标注的模型_上海合合信息科技股份有限公司;上海临冠数据科技有限公司;上海生腾数据科技有限公司;上海盈五蓄数据科技有限公司_202311752635.2 

申请/专利权人:上海合合信息科技股份有限公司;上海临冠数据科技有限公司;上海生腾数据科技有限公司;上海盈五蓄数据科技有限公司

申请日:2023-12-18

公开(公告)日:2024-03-19

公开(公告)号:CN117726661A

主分类号:G06T7/33

分类号:G06T7/33;G06T7/32;G06T3/18;G06V30/41;G06V30/19;G06V10/82;G06N3/0895

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.05#实质审查的生效;2024.03.19#公开

摘要:本发明公开了一种对真实文档图像进行稠密点级标注的模型。扰动图像合成模块用来根据平整文档图像Ia获得带扰动的合成文档图像Ia′。粗配准模块用来消除弯曲文档图像Ib0的大形变,获得初步矫正后的弱弯曲文档图像Ib1和粗配准的偏移场。多尺度特征提取模块用来对成对文档进行特征提取。小尺度精配准模块用来基于平整文档IA的小尺度特征图以及弯曲文档IB的小尺寸特征图对两者进行小尺度上的精细配准。大尺度精配准模块用来根据前面各模块获得的一系列中间结果对平整文档IA和弯曲文档IB进行大尺度上的精细配准。本发明改进了现有的DocAligner模型,实现了成对文档的半监督配准。

主权项:1.一种对真实文档图像进行稠密点级标注的模型,其特征是,包括扰动图像合成模块、粗配准模块、多尺度特征提取模块、小尺度精配准模块、大尺度精配准模块、光照去除模块、相似度损失函数计算模块、强监督损失计算模块;所述扰动图像合成模块用来对平整文档图像Ia添加计算机模拟的随机几何扰动、随机光照扰动、随机位移扰动中的一种或多种,获得带扰动的合成文档图像Ia′;所述粗配准模块用来消除弯曲文档图像Ib0的大形变,获得初步矫正后的弱弯曲文档图像Ib1和粗配准的偏移场;所述多尺度特征提取模块用来将带扰动的合成文档图像Ia′和弱弯曲文档图像Ib1组合为弯曲文档IB;将两幅平整文档图像Ia组合为平整文档IA;平整文档IA和弯曲文档IB构成了成对文档的输入;多尺度特征提取模块分别对成对文档进行特征提取,得到平整文档IA的小尺度特征图弯曲文档IB的小尺度特征图平整文档IA的大尺度特征图弯曲文档IB的大尺度特征图后续各模块同时对平整文档IA和弯曲文档IB进行单步半监督训练;所述小尺度精配准模块用来基于平整文档IA的小尺度特征图以及弯曲文档IB的小尺寸特征图对两者进行小尺度上的精细配准;所述大尺度精配准模块用来根据前面各模块获得的一系列中间结果对平整文档IA和弯曲文档IB进行大尺度上的精细配准;所述光照去除模块使用拉普拉斯卷积核对平整文档IA以及IB→A进行二阶梯度提取,获得二阶梯度图;IB→A表示使用“当弯曲文档IB被配准为平整文档IA时预测的大尺度偏移场Mlarge”对弯曲文档IB进行点映射采样后获得的结果;所述相似度损失函数计算模块用来利用平整文档IA的版面结构信息、IB→A的二阶梯度图和平整文档IA的二阶梯度图来构造相似度损失函数;所述版面结构信息是指平整文档图像Ia上的有内容的版面区域的位置信息;所述强监督损失计算模块用来对带扰动的合成文档图像Ia′以及相应的平整文档图像Ia计算损失。

全文数据:

权利要求:

百度查询: 上海合合信息科技股份有限公司;上海临冠数据科技有限公司;上海生腾数据科技有限公司;上海盈五蓄数据科技有限公司 一种对真实文档图像进行稠密点级标注的模型

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。