【发明授权】针对OCR图片的端到端含错文本分类识别仪_浙江大学_202011280156.1

导航：龙图腾网> 最新专利技术> 针对OCR图片的端到端含错文本分类识别仪_浙江大学_202011280156.1

申请/专利权人：浙江大学

申请日：2020-11-16

公开（公告）日：2023-05-23

公开（公告）号：CN112434686B

主分类号：G06V30/14

分类号：G06V30/14;G06V30/164;G06V30/19;G06N3/0442;G06N3/0464;G06N3/09

优先权：

专利状态码：有效-授权

法律状态：2023.05.23#授权;2021.03.19#实质审查的生效;2021.03.02#公开

摘要：本发明公开了针对OCR图片的端到端含错文本分类识别仪，用于对OCR图片中存在文字识别错误的信息实现端到端的纠错并分类，包括OCR信息提取模块、含错文本纠错模块、文本分类模块以及信息蒸馏模块。本发明为了克服已有的OCR图片识别文字和含错文本分类系统相互独立、需要多阶段分步识别纠错并推理类别的缺点，通过结合高效、高精度且可学习的信息蒸馏模块，以及可以充分利用大量历史数据、可拓展性强的文本纠错模块和文本分类模块，建立了针对OCR图片含错文本分类问题的兼具精度和效率的端到端分类系统，能够很好地利用OCR信息实现具有高鲁棒性高适应性高敏捷性的含错文本分类识别仪。

主权项：1.一种针对OCR图片的端到端含错文本分类识别仪，其特征在于：包括OCR信息提取模块、含错文本纠错模块、文本分类模块以及信息蒸馏模块；所述OCR信息提取模块、含错文本纠错模块、文本分类模块依次连接，所述信息蒸馏模块与文本分类模块相连接；所述的信息提取模块将OCR图片信息数据作为输入，输出文本信息，并通过含错文本纠错模块输出经过纠正的文本信息，后通过所述文本分类模块输出文本高维特征和分类概率分布，计算出当前分类结果的同时将文本高维特征和分类概率分布输入信息蒸馏模块；所述信息蒸馏模块通过输入的OCR图片与分类软标签向量进行训练，最终实现端到端的推理；所述含错文本纠错模块：输入由信息提取模块抽取的文字序列，基于错误检测、候选召回、候选排序三步实现文本纠错，具体如下：利用基于深度学习的序列标注模型，在错误检测时，充分利用大量的无监督预料所构建的预训练语言模型，再通过由错误句子到正确句子，即对齐语料，实现有监督学习该序列标注模型；在候选召回部分，利用对齐语料和对齐模型构建字级别、词级别、音级别的混淆字典，先利用字、音混淆字典初步召回候选，然后再利用词级别混淆字典和语言模型二次筛选候选，从而形成最终候选；而候选排序则是利用上下文DNN特征和人工提取的形音、词法、语义特征一起训练排序模型，最终输出纠错后的文字序列；所述信息蒸馏模块，输入为文本分类模块softmax层输出的的软分类结果以及含有文字的待分类图片；主体部分采用CNN模型：其输入为含有文字的待分类图片，标签为文本分类模块softmax层输出的的软分类结果，损失函数设计如下：软标签交叉熵算法：Loss＝output[i1,i2,...,ik,j]×output[i1,i2,...,ik,j]8每个样本对应类别j的软标签值：output[i1,i2,...,ik]＝-∑jlabel[i1,i2,...,ik,j]*loginput[i1,i2,...,ik,j]9其中参数k为类别数,j为当前类别，ik为对应类别所产生的损失，output为所有类别输出的列表，label为文本分类模块标签输出的标签列表，input为CNN模型softmax层输出的软标签列表；通过该损失函数实现对信息蒸馏模块的优化，其通过识别含文字图片，输出为含文字图片中文字对应的类别；所述信息蒸馏模块在推理阶段：输入为待分类的含文字图片，通过信息蒸馏模块中训练好的CNN模型后，即可输出对应含文字图片的分类类别。

全文数据：

权利要求：

百度查询：浙江大学针对OCR图片的端到端含错文本分类识别仪

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种可收集粉尘的切割机_安徽楚风建设有限公司_202321187487.X

下一篇：一种能自动清洗的鸡养殖笼_海南省农业科学院三亚研究院(海南省实验动物研究中心)_202420555494.9

相关技术

一种可收集粉尘的切割机_安徽楚风建设有限公司_202321187487.X

一种能自动清洗的鸡养殖笼_海南省农业科学院三亚研究院(海南省实验动物研究中心)_202420555494.9

一种打孔装置_广州市骏褀无纺布实业有限公司_202321762517.5

一种环保型水处理设备_南京云涧环境科技有限公司_202322651322.X

一种洗涤设备_重庆海尔洗衣机有限公司_202321535727.0

一种车载冰箱移动组件_一汽解放汽车有限公司_202322605238.4

一种不锈钢带输送机构_佛山市南海区东励森金属制品有限公司_202322463638.6

一种点火线圈密封结构_一汽解放汽车有限公司_202322812056.4

一种勺式高精度防堵塞药剂计量添加装置_浙江威尔博环保科技有限公司_202322743530.2

一种带防撞装置的压力机工作台_扬州蔚来机械装备制造有限责任公司_202322611255.9

一种便携式放线架_高炜精密电子(东莞)有限公司_202322772571.4

一种水泵节能增压装置_陕西海利智慧能源科技有限公司_202322218413.4

含相关技术

用于制备含硅和氮的膜的方法_弗萨姆材料美国有限责任公司_201980062463.1

含氟废水处理系统_苏伊士环境科技(北京)有限公司_202322533955.0

一种含风道结构的配电柜_苏州笑聪电气设备有限公司_202311175595.X

一种含钯滤液处理用络合釜_云南铂亚贵金属再生利用有限公司_202322373040.8

一种含调节膦的除草组合物_广西化工研究院有限公司_202210639969.8

一种含雾图像融合模型和方法_佛山科学技术学院_202410076413.1

用于含银薄膜的蚀刻组合物_三星显示有限公司_202111474948.7

一种含镉废水处理方法_北京纬纶华业环保科技股份有限公司_201810325362.6

一种含三嗪结构的化合物及其应用_江苏三月科技股份有限公司_202011101502.5

隔膜、其制备方法和含其的锂离子电池_中化高性能纤维材料有限公司_202311715966.9

错相关技术

一种防错旋转式料位计_安徽佳通乘用子午线轮胎有限公司_202322771692.7

一种总装线座椅靠背连接螺栓打紧力防错装置_麦格纳宏立汽车系统(河北)有限公司_202322388858.7

一种新型带束层鼓防错灯标装置_赛轮(沈阳)轮胎有限公司_202322401683.9

供冷系统、错峰供冷的控制方法和控制装置_青岛海尔空调电子有限公司_202211296192.6

一种铝合金锻造模具防错模结构_台州拓普汽车部件有限公司_202321742802.0

一种具有防错锁功能的低相噪混频锁相电路_成都世源频控技术股份有限公司_202311695619.4

包材防错控制方法和包材防错控制系统_青岛奥利普奇智智能工业技术有限公司_202311864468.0

一种电源模块错峰延时启动电路_上海空间电源研究所_202311679405.8

一种基于电力现货市场运行的错峰供热方法_华能莱芜发电有限公司_202311685770.X

一种校门口错峰交通控制装置_深圳榕亨实业集团有限公司_202322567131.5

端相关技术

自动端板对接及焊接装置_马鞍山市安工大智能装备技术研究院有限公司_202322470872.1

端部密封摩擦副构件_机械制造中心设计局股份公司_201980044040.7

一种模组端板挤压成型装置_东莞市杉达金属制品有限公司_202311594390.5

高速列车转向架舱端板除冰装置_中南大学_202322793160.3

一种SONOS栅端控制电压产生电路_上海华虹宏力半导体制造有限公司_202211032682.5

用于弹簧端部钩状部的成型装置_莱克福斯弹簧科技(常州)有限公司_202322290687.4

共享设备的处理方法及服务端_联想(北京)有限公司_202210744130.0

一种端板和电芯模组_浙江冠宇电源有限公司_202322545745.3

高热阻端板及燃料电池_佛山仙湖实验室_202322578589.0

客户端系统、运行方法、电子设备和存储介质_携程商旅信息服务(上海)有限公司_202010631533.5

龙图腾网&IPTOP

【发明授权】针对OCR图片的端到端含错文本分类识别仪_浙江大学_202011280156.1

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务