【发明公布】基于文本细节图作为端到端文本检测与识别的监督方法_重庆理工大学_202410266715.5

导航：龙图腾网> 最新专利技术> 基于文本细节图作为端到端文本检测与识别的监督方法_重庆理工大学_202410266715.5

申请/专利权人：重庆理工大学

申请日：2024-03-08

公开（公告）日：2024-05-17

公开（公告）号：CN118053150A

主分类号：G06V20/62

分类号：G06V20/62;G06V30/146;G06V30/18;G06V30/19;G06V10/82;G06N3/045;G06N3/0464;G06N3/09;G06N3/0985

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.06.04#实质审查的生效;2024.05.17#公开

摘要：本发明涉及一种基于文本细节图作为端到端文本检测与识别的监督方法，属于文本处理领域。该方法包括以下步骤：给定一个包含任意形状文本的输入图像，该输入图像经过两个独立的处理分支进行处理；设计文本注意力头TAH，设计特征金字塔增强融合模块FPEFM；FPEFM通过在不同尺寸上进行特征自增强，融合文本注意力头TAH模块提取到的文本图像局部特征和全局文本位置信息，融合文本注意力头TAH从不同尺寸的特征图中提取的特征；通过堆叠多个FPEFM，不断增强模型的特征表征能力和模型的深度；将特征图上采样到统一的尺寸，得到最终增强的特征图。

主权项：1.基于文本细节图作为端到端文本检测与识别的监督方法，其特征在于：该方法包括以下步骤：给定一个包含任意形状文本的输入图像，该输入图像经过两个独立的处理分支进行处理；第一个处理分支从输入图像中提取文本纹理和边界信息，生成一个文本细节图；第二个处理分支利用深度学习神经网络学习和推断不同情境下的文本位置和内容；在文本细节图作为新标签的监督下，提出端到端自然场景文本检测和识别模型DiZNet；在第二个处理分支中，深度学习分支处理期间，使用轻量级特征提取网络ResNet18作为DiZNet的骨干网络；骨干网络从输入图像中提取具有不同分辨率14、18、116、132的浅层特征图，分别对应于conv2、conv3、conv4和conv5层；使用1x1卷积处理所述浅层特征图，将通道数统一为128；设计文本注意力头TAH，设计特征金字塔增强融合模块FPEFM；FPEFM通过在不同尺寸上进行特征自增强，融合文本注意力头TAH模块提取到的文本图像局部特征和全局文本位置信息，融合文本注意力头TAH从不同尺寸的特征图中提取的特征；通过堆叠多个FPEFM，不断增强模型的特征表征能力和模型的深度；将特征图上采样到统一的尺寸，得到最终增强的特征图；增强的特征图预测三个组件：检测头负责预测文本位置；检测头预测文本核、文本区域和文本向量，通过像素聚合预测文本行；细节头利用文本细节图作为监督信号来预测文本纹理和边界；识别头通过整合文本细节图进行文本内容识别，得到识的结果；在模型推断阶段，无需使用文本细节真值图作为监督标签；相反，模型预测文本纹理和边界，然后将预测的文本细节图融合到检测头中以推理文本位置；预测的文本细节图融合到识别头中以识别文本内容。

全文数据：

权利要求：

百度查询：重庆理工大学基于文本细节图作为端到端文本检测与识别的监督方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：光伏组件遮挡物的识别方法、装置、电子设备及存储介质_中国华能集团清洁能源技术研究院有限公司_202410237669.6

下一篇：用于处理头发的装置_欧莱雅_202280072308.X

相关技术

光伏组件遮挡物的识别方法、装置、电子设备及存储介质_中国华能集团清洁能源技术研究院有限公司_202410237669.6

用于处理头发的装置_欧莱雅_202280072308.X

一种海上风电桩周柔性防冲刷结构_华能如东八仙角海上风力发电有限责任公司_202410501999.1

一种快速锻造液压机_江苏拢研机械有限公司_202410351730.X

一种苏丹鱼人工繁殖方法_广西壮族自治区水产科学研究院(广西壮族自治区渔业病害防治环境监测和质量检验中心、广西壮族自治区水生野生动物救护中心)_202410362039.1

近接超深基坑的文保建筑保护施工方法_中铁四局集团有限公司_202410318181.6

一种FRP筋扩大锚固端头的现场成型装置及成型方法_长安大学_202410409745.7

一种嵌入式载波数据管理终端_南京领强科技有限公司_202410416940.2

一种土壤修复用土壤修复剂喷洒装置_唐臣燕_202410301878.2

一种基于末端阻尼的绳网捕获装置_南京理工大学_202410454423.4

溅射靶_三井金属矿业株式会社_202380014136.5

一种五金金属板材加工用激光切割机_南通邦华机械有限公司_202410493716.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】基于文本细节图作为端到端文本检测与识别的监督方法_重庆理工大学_202410266715.5

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务