申请/专利权人:北京百度网讯科技有限公司
申请日:2020-07-24
公开(公告)日:2024-03-29
公开(公告)号:CN111860506B
主分类号:G06V20/62
分类号:G06V20/62;G06V30/148;G06V30/19
优先权:
专利状态码:有效-授权
法律状态:2024.03.29#授权;2020.11.17#实质审查的生效;2020.10.30#公开
摘要:本申请公开了一种识别文字的方法和装置,涉及人工智能技术领域、计算机视觉技术领域、知识图谱技术领域和自然语言处理技术领域。方法包括:获取输入图像的文字区域的以下图像:文字中心线图、文字方向偏移图、文字边界偏移图、文字字符分类图;从文字中心线图中提取字符中心的特征点的坐标;基于文字方向偏移图,排序字符中心的特征点的坐标,得到字符中心的特征点的坐标序列;根据字符中心的特征点的坐标序列和文字边界偏移图,确定文字区域的多边形包围框;根据字符中心的特征点的坐标序列和文字字符分类图,确定字符中心的特征点的分类结果。该方法可以对输入图像中任意方向的文字进行识别,提高了文字的识别效率和准确率。
主权项:1.一种识别文字的方法,方法包括:采用主干卷积网络获取输入图像的卷积特征图,采用多分支卷积网络从所述卷积特征图中分别提取所述输入图像的文字区域的以下图像:文字中心线图、文字方向偏移图、文字边界偏移图、文字字符分类图;从文字中心线图中提取字符中心的特征点的坐标;基于文字方向偏移图,排序所述字符中心的特征点的坐标,得到所述字符中心的特征点的坐标序列;根据所述字符中心的特征点的坐标序列和所述文字边界偏移图,确定所述文字区域的多边形包围框;根据所述字符中心的特征点的坐标序列和所述文字字符分类图,确定所述字符中心的特征点的分类结果。
全文数据:
权利要求:
百度查询: 北京百度网讯科技有限公司 识别文字的方法和装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。