买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种高效的电力信号描述模型训练方法_南京太司德智能电气有限公司_202011638424.2 

申请/专利权人:南京太司德智能电气有限公司

申请日:2020-12-31

公开(公告)日:2024-04-30

公开(公告)号:CN113159086B

主分类号:G06V30/19

分类号:G06V30/19;G06V30/41

优先权:

专利状态码:有效-授权

法律状态:2024.04.30#授权;2021.08.10#实质审查的生效;2021.07.23#公开

摘要:本发明公开了一种高效的电力信号描述模型训练方法,该方法为:读取txt或excel文件;设置训练文字参数;生成文字图片的宽度及高度;判断图片宽度,重新计算图片高度;调用Qt的QImage类生成全白的图片;在全白的图片上绘制单个文字;记录的每个字符位置及矩形长宽数据;训练文字转换坐标系;并将每个转换文字的数据保存到一个后缀为.box的文本文件中;生成后缀为.tr的文本文件;读取人工标记文件夹内所有后缀为.tif、.box、.tr文件;执行tesseract的训练命令,生成后缀为.traineddata的文件;自动调用tesseract命令识别生成的图片,并将识别结果和录入的文字进行对比,提示识别错误文字、文字召回率和准确率。本发明简化了文字训练的步骤,能快速实现文字训练,快速生成所需的训练模型,提高了训练效率。

主权项:1.一种高效的电力信号描述模型训练方法,其特征在于:该方法包括以下步骤:1读取txt或excel文件;2设置训练文字的字体、大小和模型名称的参数;3按行读取选择的txt或excel文件,获取文字总行数,记为num_lines,以及这些行中字数最多的行的字数,记为max_length;4根据设置的字符间距gap、行间距linespacing、页面边距padding、图片最大宽度、单个文字宽度width和单个文字高度height,计算生成文字图片的宽度及高度;生成文字图片的宽度及高度计算公式如下:图片宽度width_image=padding*2+max_length*gap+width图片高度height_image=padding*2+num_lines*linespacing+height;5若计算的图片宽度大于设置的图片最大宽度,则以图片最长宽度作为待生成图片的宽度,根据字符间距gap、行间距linespacing和页面边距padding重新计算图片高度;6根据步骤5计算的图片大小,记为imgsize,调用Qt的QImage类生成全白的图片;7在全白的图片上按顺序绘制单个文字;绘制单个文字的方法包括如下步骤:a设置第一个文字位置,横坐标为startx,纵坐标为starty,位置初始值如下:startx=padding;starty=padding;b在以坐标startx,starty为起点、单个文字宽度width为矩形宽度和单个文字高度height为矩形高度的矩形内居中绘制第一个文字;c计算下一个文字的startx和starty,取值如下:startx=startx+width+gapstarty=padding若startx+页面边距图片宽度,则:starty=starty+已绘制的文字行数*height+linespacingstartx=padding记录并保存,每个字符的startx、starty、width和height,重复a-c步骤,直至完全绘制完图片;8根据步骤7中记录的每个字符位置及矩形长宽数据,分别以从上至下、从下至上、从左至右和从右至左四个方向扫描该矩形框内的图片的像素值;9将步骤8的文字最小外接矩形的坐标[x,y,end_x,endy]位置转换为tesseract训练的文字坐标系[t_x,t_y,t_end_x,t_endy],转换公式如下:t_x=xt_y=height_image–y-endy-yt_endx=x+width_imaget_endy=height_image–y;10将每个文字按步骤9进行坐标转换计算,并将每个文字的数据按以下格式写入并保存到一个后缀为.box的文本文件中,每个文字数据占一行:文字t_xt_yt_endxt_endy11根据设置参数,使用tesseract命令生成后缀为.tr的文本文件,命令如下:tesseractpower.font.exp0.GIFpower.font.exp0–psm6nobatchbox.train;12读取人工标记文件夹内所有后缀为.GIF、.box和.tr文件,同时检测文件夹中文件名为font_properties的文本文件是否存在,若不存在,则根据所有后缀为.GIF的图片文件名称,将名称第一个“.”和第二个“.”间的名称作为字体名称,过滤重复的字体名称,将每个字体作为一行,按以下格式写入文件名为font_properties的文本文件中,格式如下:font00000;13依次执行tesseract的unicharset_extractor、shapeclustering、mftraining和cntraing训练命令,生成后缀为.traineddata的文件,该文件即为文字模型文件;14完成训练后,训练工具自动调用tesseract命令识别步骤7生成的图片,并将识别结果和录入的文字进行对比,提示识别错误文字、文字召回率和准确率。

全文数据:

权利要求:

百度查询: 南京太司德智能电气有限公司 一种高效的电力信号描述模型训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。