买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于深度学习和计算机视觉的甲骨文字检测方法_吉林大学_202311753411.3 

申请/专利权人:吉林大学

申请日:2023-12-20

公开(公告)日:2024-03-26

公开(公告)号:CN117437647B

主分类号:G06V30/19

分类号:G06V30/19;G06N3/0455;G06N3/0464;G06N3/084;G06V10/82;G06V30/22

优先权:

专利状态码:有效-授权

法律状态:2024.03.26#授权;2024.02.09#实质审查的生效;2024.01.23#公开

摘要:本发明涉及人工智能与古文字方向交叉技术领域,特别是涉及基于深度学习和计算机视觉的甲骨文字检测方法,包括:获取待检测甲骨文拓片;将所述甲骨文拓片输入预设的检测模型中,获取所述甲骨文拓片上的甲骨文字区域预测结果,其中,所述检测模型基于训练集训练获得,所述训练集包括甲骨文拓片图像和甲骨文单字图像,所述检测模型采用轻量级神经网络构建。本发明充分利用已有甲骨文字体数据,借助深度学习算法,将甲骨文字的结构先验信息引入到检测模型中,使深度学习模型在优化的过程中学习并利用甲骨文字特有的形状特征,正确区分文字与非文字区域,提升甲骨文字检测结果的准确性。

主权项:1.基于深度学习和计算机视觉的甲骨文字检测方法,其特征在于,包括:获取待检测甲骨文拓片;将所述甲骨文拓片输入预设的检测模型中,获取所述甲骨文拓片上的甲骨文字区域预测结果,其中,所述检测模型基于训练集训练获得,所述训练集包括甲骨文拓片图像和甲骨文单字图像,所述检测模型采用轻量级神经网络构建;所述检测模型包括:骨干网络模块、类别预测模块、区域预测模块,所述骨干网络模块用于通过卷积运算提取输入图像的特征图;所述类别预测模块用于基于所述特征图进行类别预测,获取类别预测图;所述区域预测模块用于基于所述类别预测图和特征图融合后进行区域预测,输出区域预测图;所述骨干网络模块采用编码器-解码器骨干网络,所述类别预测模块采用若干残差结构组成的卷积网络,所述区域预测模块采用转置卷积网络、批量归一化层;基于所述训练集训练所述检测模型之前,还包括对所述训练集进行预处理,所述预处理包括:对所述甲骨文拓片图像上甲骨文字进行位置标注,标注的格式是矩形边界框的左下角顶点坐标和右上角顶点坐标;对所述甲骨文单字图像进行分类,相同的甲骨文单字被分为同一类别;在所述检测模型训练过程中,通过对所述类别预测图和区域预测图进行监督,使用梯度下降法更新模型参数;在所述检测模型训练过程中,还包括为甲骨文字提供类别伪标签,得到所述类别伪标签后,根据二维高斯分布生成用于监督类别信息的伪标签图,获取所述类别伪标签的过程包括:输入甲骨文单字图像到残差神经网络中,输出所述甲骨文单字图像的高维向量;将所述高维向量输入到类别预测器中,输出所述甲骨文单字图像属于各个类别的概率,选取最高概率的类别作为所述甲骨文单字图像的类别,获取所述类别伪标签;所述甲骨文字区域预测结果表示形式为甲骨文字的矩形包围框的参数,包括左下角的像素坐标和右上角的像素坐标。

全文数据:

权利要求:

百度查询: 吉林大学 基于深度学习和计算机视觉的甲骨文字检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。