买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】文本识别方法和电子设备_阿里巴巴(中国)有限公司_202210982026.5 

申请/专利权人:阿里巴巴(中国)有限公司

申请日:2022-08-16

公开(公告)日:2022-11-29

公开(公告)号:CN115063800B

主分类号:G06V30/10

分类号:G06V30/10;G06V30/18;G06V30/19;G06V20/40

优先权:

专利状态码:有效-授权

法律状态:2022.11.29#授权;2022.10.04#实质审查的生效;2022.09.16#公开

摘要:本发明公开了一种文本识别方法和电子设备。其中,该方法包括:获取待识别的视频,其中,待识别的视频中至少存在一帧图像包含有待识别的文本;对待识别的视频进行采样,得到目标图像,其中,目标图像为视频中包含了待识别的文本的图像;对目标图像的第一原始信息进行数据增强,得到目标图像的第一附加信息,其中,第一原始信息至少包括:目标图像的三原色信息,第一附加信息包括如下至少之一:目标图像的色相信息、饱和度信息、明度信息和边缘信息;基于第一原始信息和第一附加信息对目标图像进行文本识别,得到待识别的文本的目标识别结果。本申请提供的视频识别方案解决了相关技术中对视频中文本进行识别的准确度较低的技术问题。

主权项:1.一种文本识别方法,其特征在于,包括:获取待识别的视频,其中,所述待识别的视频中至少存在一帧图像包含有待识别的文本;对所述待识别的视频进行采样,得到目标图像,其中,所述目标图像为所述视频中包含了所述待识别的文本的图像;对所述目标图像的第一原始信息进行数据增强,得到所述目标图像的第一附加信息,其中,所述第一原始信息至少包括:所述目标图像的三原色信息,所述第一附加信息包括如下至少之一:所述目标图像的色相信息、饱和度信息、明度信息和边缘信息;基于所述第一原始信息和所述第一附加信息对所述目标图像进行文本识别,得到所述待识别的文本的目标识别结果;其中,基于所述第一原始信息和所述第一附加信息对所述目标图像进行文本识别,得到所述待识别的文本的目标识别结果,包括:利用文本识别模型基于第一原始信息和所述第一附加信息对所述目标图像进行文本识别,得到所述目标识别结果,其中,所述文本识别模型的损失函数是基于目标权重、训练文本和识别文本确定的,所述目标权重是基于所述训练文本的类别进行确定的;其中,所述方法还包括:确定训练样本中不同类别的训练文本的出现次数,并基于所述出现次数确定频次权重;确定训练样本中所述不同类别的训练文本的复杂程度,并基于所述复杂程度,确定复杂度权重;确定所述训练文本和所述识别文本的相似度,并基于所述相似度确定相似度权重;基于所述频次权重、所述复杂度权重和或所述相似度权重,确定所述目标权重。

全文数据:

权利要求:

百度查询: 阿里巴巴(中国)有限公司 文本识别方法和电子设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。