【发明公布】一种基于多模态信息融合的OCR错误检测方法_安徽大学;合肥大智慧财汇数据科技有限公司_202410139257.9

申请/专利权人：安徽大学;合肥大智慧财汇数据科技有限公司

申请日：2024-02-01

公开（公告）日：2024-04-30

公开（公告）号：CN117953524A

主分类号：G06V30/412

分类号：G06V30/412;G06V30/19;G06V30/18;G06V10/82;G06N3/0464;G06N3/0499;G06N3/084;G06N3/0985

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.05.17#实质审查的生效;2024.04.30#公开

摘要：本发明涉及一种基于多模态信息融合的OCR错误检测方法，包括：对表格图像进行预处理，得到单元格的图像和相应的ORC文本；进行标注，组成带有检测标签的错误检测训练数据集；构建基于多模态的单元格OCR错误检测模型；采用错误检测训练数据集对基于多模态的单元格OCR错误检测模型进行迭代训练；将待检测单元格图像及对应的OCR文本输入训练后的基于多模态的单元格OCR错误检测模型，输出检测结果。本发明通过基于字形卷积网络的文本处理模块与基于残差网络的图像处理模块，将这两部分特征进行维度融合，多模态融合过程结合了来自文本与图像的信息，实现信息补充，拓宽输入数据所包含信息的覆盖范围，提高基于多模态的单元格OCR错误检测模型的鲁棒性和准确性。

主权项：1.一种基于多模态信息融合的OCR错误检测方法，其特征在于：该方法包括下列顺序的步骤：1对表格图像进行预处理，所述预处理包括二值化、去噪和切割操作，得到单元格的图像和相应的ORC文本；2对每个单元格的图像和相应的OCR文本进行标注，标注后的数据组成带有检测标签的错误检测训练数据集；3构建基于多模态的单元格OCR错误检测模型，所述基于多模态的单元格OCR错误检测模型包括图像处理模块、文本处理模块和多模态信息融合分类模块；4采用错误检测训练数据集对基于多模态的单元格OCR错误检测模型进行迭代训练，得到训练后的基于多模态的单元格OCR错误检测模型；5将待检测单元格图像及对应的OCR文本输入训练后的基于多模态的单元格OCR错误检测模型，输出检测结果。

全文数据：

权利要求：

百度查询：安徽大学;合肥大智慧财汇数据科技有限公司一种基于多模态信息融合的OCR错误检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：矿井地质状况探测方法及装置_新疆哈巴河阿舍勒铜业股份有限公司_202410159828.5

下一篇：一种单体废旧电池的正负电极端壳剥离方法及装置_南京环务资源再生科技有限公司_201810729584.4

相关技术

矿井地质状况探测方法及装置_新疆哈巴河阿舍勒铜业股份有限公司_202410159828.5

一种单体废旧电池的正负电极端壳剥离方法及装置_南京环务资源再生科技有限公司_201810729584.4

一种基于道路裂缝长度与形态信息的像素级分割效果评价方法_长安大学_202410148466.X

导热微孔板_拜耳公司_202280067617.8

一种生物有机肥的干燥装置_史丹利化肥当阳有限公司_202410210400.9

激光切割机_河北睿高机器人科技有限公司_201710965426.4

一种无线电压表PCB板自动校准与测试方法_深圳市易检车服科技有限公司_202410198900.5

针对由一个DCI调度的多个PDSCH传输或PUSCH传输的波束确定_联想(北京)有限公司_202180101107.3

一种带自乳化润肤功效的卸妆凝露及其制备方法_杭州千玺颜美生物科技有限公司_202410196720.3

杆塔螺栓检测方法、装置、电子设备及可读存储介质_烟台国网中电电气有限公司_202410172895.0

流式检测成像数据对齐方法、流式分析系统及存储介质_中国科学院苏州生物医学工程技术研究所_202410189387.3

一种带有机械手的卡整理装置_石家庄优创科技股份有限公司_202410223060.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】一种基于多模态信息融合的OCR错误检测方法_安徽大学;合肥大智慧财汇数据科技有限公司_202410139257.9

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务