【发明授权】一种文本检测模型的训练方法、文本检测方法及装置_杭州恒生聚源信息技术有限公司;上海恒生聚源数据服务有限公司_202311735371.X

申请/专利权人：杭州恒生聚源信息技术有限公司;上海恒生聚源数据服务有限公司

申请日：2023-12-18

公开（公告）日：2024-03-22

公开（公告）号：CN117423116B

主分类号：G06V30/19

分类号：G06V30/19;G06V30/148;G06V30/18;G06V30/14;G06V10/766;G06V10/82;G06N3/0464;G06N3/045;G06N3/098

优先权：

专利状态码：有效-授权

法律状态：2024.03.22#授权;2024.02.06#实质审查的生效;2024.01.19#公开

摘要：本申请提出一种文本检测模型的训练方法、文本检测方法及装置，将文本检测模型的训练划分为了两个核心阶段：“预训练阶段”与“联合训练阶段”，其中利用“预训练阶段”对文档中边框的识别结果进行优化，避免文本框检测出现混淆与粘连等情况，进而将“预训练阶段”中的关键单元“文本区域预测分支网络”参与到“联合训练阶段”，从而在降低整体训练资源的同时，实现参数共享，提高“联合训练阶段”模型的收敛速度，使得本申请所示的文本检测模型具备更好的泛化能力。

主权项：1.一种文本检测模型的训练方法，其特征在于，所述方法应用模型训练系统，所述模型训练系统包括预训练模型和文本检测模型，所述文本检测模型包括：文本区域预测分支网络、第一特征处理网络、置信度加权网络以及第一预测网络，所述预训练模型包括：第二特征处理网络与第二预测网络；所述第二预测网络包括：待训练文本边框预测分支网络与待训练文本区域预测分支网络；所述方法，包括：将样本数据输入所述第二特征处理网络，获得所述样本数据对应的第二已还原特征图；将所述第二已还原特征图输入所述待训练文本边框预测分支网络，获得所述样本数据对应的文本边框预测特征图；将所述第二已还原特征图输入所述待训练文本区域预测分支网络，获得所述样本数据对应的文本区域预测特征图；根据所述文本边框预测特征图、所述文本区域预测特征图、边框区域掩膜信息以及所述文本区域掩膜信息，确定所述预测损失信息；所述边框区域掩膜信息由所述文本区域掩膜信息获得；所述预测损失信息表征当前预训练周期所述预训练模型的训练结果与真实值的差异；根据每个预训练周期对应的预测损失信息对所述预训练模型中各个网络的参数进行更新，直至第M个预训练周期对应的总预测特征图满足第二训练条件，且所述第M个预训练周期对应的预测损失信息满足收敛状态，则将所述第M个预训练周期对应的待训练文本区域预测分支网络作为所述文本区域预测分支网络；将样本数据输入所述文本区域预测分支网络获得待学习特征图；所述文本区域预测分支网络为通过表征所述样本数据的边框损失与文本区域损失的预测损失信息迭代训练获得的；将所述样本数据输入所述第一特征处理网络获得第一已还原特征图；通过所述置信度加权网络分别为所述待学习特征图与所述第一已还原特征图分配权重参数，进行置信度加权学习以获得已学习特征图；将所述已学习特征图输入所述第一预测网络获得待验证预测结果；根据文本区域掩膜信息、所述待验证预测结果、所述待学习特征图以及所述第一已还原特征图确定总熵损失信息；所述文本区域掩膜信息表征所述样本数据的真实值；所述总熵损失信息表征当前联合训练周期所述文本检测模型的预测结果与真实值的差异；根据每个联合训练周期对应的总交叉熵损失信息对所述文本检测模型中各个网络的参数进行更新，直至第N个联合训练周期对应的待验证预测结果满足第一训练条件，且所述第N个联合训练周期对应的总交叉熵损失信息满足收敛状态，则将所述第N个联合训练周期对应的文本检测模型作为成熟的文本检测模型。

全文数据：

权利要求：

百度查询：杭州恒生聚源信息技术有限公司;上海恒生聚源数据服务有限公司一种文本检测模型的训练方法、文本检测方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种滑套式HDMI数据线_深圳市海鑫达连接线有限公司_202322633970.2

下一篇：一种能自动清洗的鸡养殖笼_海南省农业科学院三亚研究院(海南省实验动物研究中心)_202420555494.9

相关技术

一种滑套式HDMI数据线_深圳市海鑫达连接线有限公司_202322633970.2

一种能自动清洗的鸡养殖笼_海南省农业科学院三亚研究院(海南省实验动物研究中心)_202420555494.9

一种砂浆稠度仪_宜昌市科信水电工程质量检测有限公司_202322336666.1

一种药材脱皮机_安徽亳药福泰药业有限公司_202322752517.3

一种弹力按摩鞋_温岭市成奇鞋业有限公司_202322137663.5

一种户外交流高压封闭式隔离开关_瑞芯科技(河北雄安)有限公司_202322554260.0

一种水泵节能增压装置_陕西海利智慧能源科技有限公司_202322218413.4

自动装盒设备_杭州永创智能设备股份有限公司_202322265646.X

一种机床零件用抛光装置_杭州盈动达精密机械有限公司_202322717477.9

用于电厂冷却塔内壁及淋水构架的修复涂层结构及冷却塔_北京易晟元环保工程有限公司_202321781851.5

磨豆压力咖啡机自动压粉机构_浙江比依电器股份有限公司_202322521989.8

无线遥控理疗床_泰安市迈迪医疗电子有限公司_202322303870.3

检测相关技术

阻抗检测方法、阻抗检测电路及阻抗检测设备_深圳市瀚强科技股份有限公司_202410026921.9

锅炉烟气检测装置及检测方法_广东信科检测有限公司_202210425377.6

用于检测洗涤设备进水异常的检测系统及检测方法_青岛海尔洗衣机有限公司_202211285180.3

一种线材视觉检测系统及检测方法_深圳市汇众智慧科技有限公司_202410076687.0

显示面板的检测系统及检测方法_苏州华星光电技术有限公司_202111547153.4

旋转故障检测装置和进出故障检测装置_英特尔NDTM美国有限公司_202322643977.2

火焰检测供电电路、火焰检测装置及点火设备_珠海格力电器股份有限公司_202311639715.7

建筑主体结构检测装置及检测方法_山东中程试验检测有限公司_202410108008.3

光检测设备及光检测设备的测试方法_深圳麦科田生物医疗技术股份有限公司_201910704569.9

新异检测器_爱思开海力士有限公司_202011622881.2

文本相关技术

基于深度学习的评论文本方面级情感分类方法及系统_上海哈蜂信息科技有限公司_202010776165.3

一种基于深度学习的文本生成图像学习方法_大连理工大学_202111183091.3

文本检测方法、装置、计算机设备和存储介质_腾讯科技(深圳)有限公司_202011020108.9

一种文本行图片的解码方法、装置和设备_北京有竹居网络技术有限公司_202110558943.6

基于宏微观特征的中文文本笔迹鉴别方法、装置及存储介质_大连海事大学_202011643169.0

文本意图识别方法、装置、设备和存储介质_平安科技(深圳)有限公司_202010033742.X

文本细粒度情感分类方法、系统、装置及存储介质_华南理工大学_202010560649.4

一种基于文本的实体识别方法及相关装置_广东工业大学_202010844442.X

一种相似文本内容的识别方法、装置及存储介质_广州腾讯科技有限公司_201810595368.5

基于注意力机制的幽默文本分类方法、装置、设备、介质_中国平安人寿保险股份有限公司_202111433978.3

方法相关技术

曝光方法、曝光装置、以及物品的制造方法_佳能株式会社_202311346914.9

定子及其制造方法_LG麦格纳电子动力总成有限公司_202110012057.3

通信方法及装置_华为技术有限公司_202211296381.3

通信方法及装置_华为技术有限公司_202010617172.9

模型剪枝方法、人脸识别模型训练方法及人脸识别方法_苏州元脑智能科技有限公司_202311803044.3

信息处理方法_丰田自动车株式会社_202311358127.6

通信方法及装置_华为技术有限公司_202311024020.8

蓄电设备的检查方法及制造方法_丰田自动车株式会社_202010574534.0

能力确定方法、上报方法、装置、设备及存储介质_北京小米移动软件有限公司_202280001087.7

冰箱及其控制方法_LG电子株式会社_202080061858.2

龙图腾网&IPTOP

【发明授权】一种文本检测模型的训练方法、文本检测方法及装置_杭州恒生聚源信息技术有限公司;上海恒生聚源数据服务有限公司_202311735371.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务