天津大学李素梅获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉天津大学申请的专利一种基于轮廓特征增强的任意形状场景文本检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119296094B 。
龙图腾网通过国家知识产权局官网在2025-05-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411519578.8,技术领域涉及:G06V20/62;该发明授权一种基于轮廓特征增强的任意形状场景文本检测方法是由李素梅;曹媛设计研发完成,并于2024-10-29向国家知识产权局提交的专利申请。
本一种基于轮廓特征增强的任意形状场景文本检测方法在说明书摘要公布了:本发明公开了一种基于轮廓特征增强的任意形状场景文本检测方法,属于计算机视觉技术领域;本发明提出了一种基于轮廓特征增强的任意形状场景文本检测方法,旨在解决文本检测中的边缘轮廓缺失和错检问题,从而精准定位场景图像中的文本实例。该方法首先将swintransformer和卷积神经网络结合,利用低级特征图中丰富的细节信息增强网络对文本区域的感知,对边缘轮廓的缺失进行补偿。此外,该方法还利用文本边缘的梯度信息增强来区分文本区域和类文本区域,从而避免错检的出现。此方法为自然场景文本检测的深度学习方法提供了研究方案,在一定程度上推动了图像理解等视觉任务的发展。
本发明授权一种基于轮廓特征增强的任意形状场景文本检测方法在权利要求书中公布了:1.一种基于轮廓特征增强的任意形状场景文本检测方法,其特征在于,所述方法通过基于轮廓特征增强的任意形状场景文本检测系统实现,所述系统由骨干网络、多尺度特征融合模块和输出模块组成,其中,所述多尺度融合模块包括特征补偿模块和正交文本注意力模块;所述方法包括下列步骤:S1、采用骨干网络提取金字塔特征,将各阶段的输出输入到多尺度特征融合模块;S2、采用自上而下的策略融合来自不同层级的特征,将最低层级的特征输入到特征补偿模块中,采用轻量的swintransformer和卷积神经网络结合以低计算复杂度增强模型对文本区域的感知,补偿文本边缘信息的缺失;S3、利用注意力模块对信息进行调整,以增强特征图信息在通道维度上的交互;S4、对新得到的多层金字塔特征进行自上而下的特征融合,然后通过3×3的卷积和不同比例的双线性插值法进行上采样,将多尺度特征图分辨率调整到相同的大小,将通道数调整为64;接着将多层级特征图沿着通道维度进行拼接,得到特征图F;S5、利用正交文本注意力模块的两个并行的分支分别学习融合特征的正交方向的注意力权重,再采用残差连接以避免细节信息的丢失;S6、基于S5操作获得一对正交边缘纹理特征映射,将其沿通道维度进行拼接,得到新的特征图FC,接着采用非线性激活模块以帮助梯度传播,得到特征F*;S7、对于经S6处理所得到的正交特征图,首先将其沿通道分为α倍通道和1-α倍通道两部分,然后通过激活模块进行处理产生注意力权重;使用核大小为1×1的卷积来压缩通道数以提高计算效率;最后,将注意力权重与输入特征映射相乘并进行残差连接,得到边缘信息增强的特征图;S8、将S7中所得的特征图输入到输出模块进行后处理,所述输出模块由两个结构相同的并行分支组成,每个分支由两个反卷积函数组成,用于预测文本概率图fP和阈值图fT,随后通过可微二值化函数得到二值映射,并由此得到预测的边界框。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人天津大学,其通讯地址为:300072 天津市南开区卫津路92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。