申请/专利权人:的卢技术有限公司
申请日:2021-08-24
公开(公告)日:2024-03-05
公开(公告)号:CN113743416B
主分类号:G06V30/148
分类号:G06V30/148;G06V30/146
优先权:
专利状态码:有效-授权
法律状态:2024.03.05#授权;2021.12.21#实质审查的生效;2021.12.03#公开
摘要:本发明公开了一种OCR领域针对无真实样本情形的数据增强方法,包括以下步骤:1在对训练数据进行标注的时候,从读取文字方向为正的左上角开始顺时针标注;2将高斯热图透视变换到标注框中;3将高斯热图的中心点作为标注框的特征中心点;4顺序计算特征中心点到标注框四个点在X、Y轴上的坐标差;5训练步骤4中的坐标差,得到检测模型。本发明在不影响性能的情况下,可一步到位的检测文字角度和方向;本发明能够端到端地检测任意角度的文字,可以提升整体OCR的检测性能。
主权项:1.一种OCR领域针对无真实样本情形的数据增强方法,其特征在于,包括以下步骤:(1)在对训练数据进行标注的时候,从读取文字方向为正的左上角开始顺时针标注;(2)将高斯热图透视变换到标注框中;(2.1)利用高斯函数生成一个高斯热图;(2.2)通过透视变换将步骤(2.1)中的高斯热图变换到步骤(1)标注的标注框中;(3)将高斯热图的中心点作为标注框的特征中心点;通过查找步骤(2.2)中高斯热图的最大值来得到标注框的特征中心点;(4)顺序计算特征中心点到标注框四个点在X、Y轴上的坐标差;(5)训练步骤(4)中的坐标差,得到检测模型。
全文数据:
权利要求:
百度查询: 的卢技术有限公司 一种OCR领域针对无真实样本情形的数据增强方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。