买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】文档版面分析模型训练方法、应用方法、计算机装置及计算机可读存储介质_远光软件股份有限公司_202311350072.4 

申请/专利权人:远光软件股份有限公司

申请日:2023-10-17

公开(公告)日:2024-03-05

公开(公告)号:CN117649670A

主分类号:G06V30/19

分类号:G06V30/19;G06V30/41;G06V30/412;G06V30/413;G06V30/146;G06V10/82;G06N3/0464;G06N3/08

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.03.22#实质审查的生效;2024.03.05#公开

摘要:本发明提供一种文档版面分析模型训练方法、应用方法、计算机装置及计算机可读存储介质,文档版面分析模型训练方法包括:将样本文档按页转换成样本图像;使用标注工具对样本图像进行标注,得到样本数据和标注数据,样本数据包括进行标注后的多个样本图像;将滑动窗口的边长作为惩罚项设计YOLO卷积神经网络模型的损失函数;设置YOLO卷积神经网络模型使用滑动窗口检测,并设置检测框的预设值以及步长移动的预设值;将样本数据和标注数据输入YOLO卷积神经网络模型进行训练,保存最佳模型参数,得到目标检测模型。通过本发明的文档版面分析模型训练方法得到的目标检测模型可以实现对文档中各个版面信息的自动化提取,进而提高文档处理和分析的效率和准确性。

主权项:1.一种文档版面分析模型训练方法,其特征在于,包括以下步骤:将样本文档按页转换成样本图像;使用标注工具按照预设类别对所述样本图像进行标注,得到样本数据和标注数据,所述样本数据包括进行标注后的多个所述样本图像;将滑动窗口的边长作为惩罚项设计YOLO卷积神经网络模型的损失函数;设置所述YOLO卷积神经网络模型使用滑动窗口检测,并设置检测框的预设值以及步长移动的预设值;将所述样本数据和所述标注数据输入所述YOLO卷积神经网络模型进行训练,保存最佳模型参数,得到目标检测模型。

全文数据:

权利要求:

百度查询: 远光软件股份有限公司 文档版面分析模型训练方法、应用方法、计算机装置及计算机可读存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。