申请/专利权人:东南大学
申请日:2022-07-05
公开(公告)日:2022-11-15
公开(公告)号:CN115346221A
主分类号:G06V30/164
分类号:G06V30/164;G06V30/19;G06V30/18;G06V10/82;G09B7/02;G09B19/02
优先权:
专利状态码:在审-实质审查的生效
法律状态:2022.12.02#实质审查的生效;2022.11.15#公开
摘要:本发明公开了一种基于深度学习的小学生数学算式识别及自动批改方法,首先对含算式图像进行预处理,滤除冗余的边框信息,其次利用基于数据增广训练的BTTR模型进行算式的识别,最后利用涵盖多种数学题目类型的批改模板对识别结果进行批改,完成多种题型的自动批改。本发明实现由数学算式输入到批改结果输出的过程,基于Transformer的序列模型能够解决识别时字符级噪音及长序列依赖的问题,结合数据增广的训练方式有效地提升模型的泛化能力,多样化的模板能够匹配不同类型的算式,最终实现一种功能强大的小学生数学作业自动识别与批改的方法。
主权项:1.基于深度学习的小学生数学算式识别及自动批改方法,其特征在于,包括如下步骤:S1,图像获取:确定用于训练的小学生数学作业算式图像;S2,图像预处理:采用数学算式边框滤除算法,滤除图像中与算式无关的冗余信息,所述冗余信息至少包括数学算式的边框及除数学字符或符号以外的信息;S3,算式序列获得:利用结合数据增广训练出的基于Transformer的序列模型进行算式的识别,所述步骤进一步包括:S31:给定样本,生成随机数,所述随机数若小于预设的概率值,对样本进行高斯模糊、增加高斯噪音、色彩抖动的操作;S32:基于Transformer的序列模型获取样本的特征图,并对图像进行位置编码后,将特征图按宽度和高度进行展平成一维向量,完成编码过程;S33:将编码后的特征向量进行解码,生成算式序列;S4,自动批改:针对步骤S3识别出的算式序列,构造多样化的模板,进行自动批改,所述模板至少包括简单等式、不等式、存在单位的算式、分数算式、脱式算式、一元一次方程、约等于算式、竖式算式和存在余数或无限循环小数算式。
全文数据:
权利要求:
百度查询: 东南大学 基于深度学习的小学生数学算式识别及自动批改方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。