【发明公布】一种用于繁体中文印刷旧报纸的文本检测方法和系统_重庆邮电大学_202311669885.X

导航：龙图腾网> 最新专利技术> 一种用于繁体中文印刷旧报纸的文本检测方法和系统_重庆邮电大学_202311669885.X

申请/专利权人：重庆邮电大学

申请日：2023-12-07

公开（公告）日：2024-03-22

公开（公告）号：CN117746447A

主分类号：G06V30/41

分类号：G06V30/41;G06V30/416;G06V30/146;G06V30/19;G06V10/82;G06N3/0464;G06N3/0442;G06N3/084

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.09#实质审查的生效;2024.03.22#公开

摘要：本发明涉及一种用于繁体中文印刷旧报纸的文本检测方法和系统，包括：对原始繁体中文印刷旧报纸图像中感兴趣文本区域的位置进行标注；构建文本提取模型，包括：文本检测模型和文本识别模型；将具有标注信息的原始繁体中文印刷报纸图像数据集作为训练样本对文本检测模型进行训练；根据原始繁体中文印刷旧报纸图像中感兴趣文本区域的位置从原始繁体中文印刷旧报纸图像中裁剪出感兴趣文本区域图像构建第一训练集；利用text_renderer生成与感兴趣文本区域图像相同格式的图片构建第二训练集；根据第一训练集和第二训练集对文本识别模型进行训练；通过训练好的文本提取模型提取待识别繁体中文印刷旧报纸图像中感兴趣文本区域的文字。

主权项：1.一种用于繁体中文印刷旧报纸的文本检测方法，其特征在于，包括：S1：获取原始繁体中文印刷旧报纸图像数据集，使用PPOCRlabel对原始繁体中文印刷旧报纸图像中感兴趣文本区域的位置进行标注；S2：构建文本提取模型，所述文本提取模型包括：文本检测模型和文本识别模型；S3：将具有标注信息的原始繁体中文印刷旧报纸图像数据集作为训练样本对文本检测模型进行训练；S4：根据原始繁体中文印刷旧报纸图像中感兴趣文本区域的位置从原始繁体中文印刷旧报纸图像中裁剪出感兴趣文本区域图像构建第一训练集；S5：利用text_renderer生成与感兴趣文本区域图像相同格式的图片构建第二训练集；S6：根据第一训练集和第二训练集对文本识别模型进行训练；S7：通过训练好的文本提取模型提取待识别繁体中文印刷旧报纸图像中感兴趣文本区域的文字。

全文数据：

权利要求：

百度查询：重庆邮电大学一种用于繁体中文印刷旧报纸的文本检测方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种户外交流高压封闭式隔离开关_瑞芯科技(河北雄安)有限公司_202322554260.0

下一篇：一种便携式放线架_高炜精密电子(东莞)有限公司_202322772571.4

相关技术

一种户外交流高压封闭式隔离开关_瑞芯科技(河北雄安)有限公司_202322554260.0

一种便携式放线架_高炜精密电子(东莞)有限公司_202322772571.4

一种无缝钢管送料设备_宁波东进钢管有限公司_202322167126.5

自动装盒设备_杭州永创智能设备股份有限公司_202322265646.X

一种机柜_珠海冠宇动力电源有限公司_202322495779.6

一种对氟甲苯制备用精馏设备_湖北联昌新材料有限公司_202322580010.4

一种卷帘门帘片成型机_重庆久广门业有限公司_202322413811.1

一种梳式烟夹的胶头自动组装设备_广州阿尔法精密机械有限公司_202322475952.6

一种能自动清洗的鸡养殖笼_海南省农业科学院三亚研究院(海南省实验动物研究中心)_202420555494.9

一种不锈钢带输送机构_佛山市南海区东励森金属制品有限公司_202322463638.6

一种英语听力训练用耳机_大同师范高等专科学校_202322527447.1

一种饮料包装盒的快速消毒装置_赵唐玉玥_202322121652.8

龙图腾网&IPTOP

【发明公布】一种用于繁体中文印刷旧报纸的文本检测方法和系统_重庆邮电大学_202311669885.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务