申请/专利权人:华中师范大学
申请日:2023-12-13
公开(公告)日:2024-02-02
公开(公告)号:CN117496538A
主分类号:G06V30/226
分类号:G06V30/226;G06V30/18;G06V30/10;G06N3/0442;G06N3/0464;G06N3/08
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.02.23#实质审查的生效;2024.02.02#公开
摘要:本发明公开了一种题目提示的手写作答数学公式识别方法及系统。该方法包括步骤:从手写作答数学公式图像中提取视觉特征,从题目中提取题目文本特征;将所述视觉特征和所述题目文本特征输入题目可注意解码器,所述题目可注意解码器包括视觉特征注意模块、题目注意模块、门控循环单元和预测模块,其中视觉特征注意模块用于计算视觉上下文向量,题目注意模块用于计算题目上下文向量,门控循环单元用于建模隐藏状态,预测模块用于预测每一个解码符号。本发明可以提高手写作答数学公式识别的准确率。
主权项:1.一种题目提示的手写作答数学公式识别方法,其特征在于,包括步骤:获取手写作答数学公式图像,从所述手写作答数学公式图像中提取视觉特征,识别所述手写作答数学公式图像对应的题目,从所述题目中提取题目文本特征;将所述视觉特征和所述题目文本特征输入题目可注意解码器,所述题目可注意解码器用于逐步输出所述手写作答数学公式图像对应的解码符号,所述题目可注意解码器包括视觉特征注意模块、题目注意模块、门控循环单元和预测模块,所述视觉特征注意模块用于将上一步的隐藏状态作为查询向量来计算当前步的视觉特征注意力权重,并基于当前步的视觉特征注意力权重和所述视觉特征计算当前步的视觉信息上下文向量,所述题目注意模块用于将当前步的视觉信息上下文向量作为查询向量来计算当前步的题目文本注意力权重,并基于当前步的题目文本注意力权重和所述题目文本特征计算当前步的题目文本上下文向量,所述门控循环单元用于根据上一步输出的解码符号、当前步的视觉信息上下文向量和上一步的隐藏状态计算当前步的隐藏状态,所述预测模块用于根据当前步的题目文本上下文向量、当前步的视觉信息上下文向量、当前步的隐藏状态和上一步输出的解码符号计算输出当前步的解码符号。
全文数据:
权利要求:
百度查询: 华中师范大学 一种题目提示的手写作答数学公式识别方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。