买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于知识结构的相似试题识别方法_中国科学技术大学_202011125402.6 

申请/专利权人:中国科学技术大学

申请日:2020-10-20

公开(公告)日:2024-04-02

公开(公告)号:CN112231491B

主分类号:G06F16/36

分类号:G06F16/36;G06F40/30;G06N3/042;G06N3/0455;G06N3/0464;G06N3/082;G06N3/0442;G06F18/22

优先权:

专利状态码:有效-授权

法律状态:2024.04.02#授权;2021.02.02#实质审查的生效;2021.01.15#公开

摘要:本发明公开了一种基于知识结构的相似试题识别方法,综合了文本、图像及知识点与知识点结构多方位因素来进行试题对的相似度计算,可以提升相似试题识别的效果;此外,在建模过程中,通过综合考虑文本和图片特征来获取语义表示,再利用知识结构获得基于知识结构的语义表示,在改进模型效果的同时,还具有高度的可解释性。

主权项:1.一种基于知识结构的相似试题识别方法,其特征在于,包括:获取试题集合与待识别的试题,试题集合中每一试题与待识别的试题均包含相关的内容信息、知识点及知识点间关系构成的知识结构;构建基于知识结构的多模态模型,其包含内容表示层、结构融合层及相似度得分层;其中,内容表示层用于提取试题内容信息中的文本与图像之间的联合语义表示向量;结构融合层则结合联合语义表示以及试题的知识点及知识结构提取基于知识结构的语义表示向量;相似度得分层则利用试题集合中每一试题与待识别的试题的语义表示向量计算试题之间的相似度得分;所述内容表示层包括:图卷积网络、基于注意力机制的长短记忆模型;内容信息中的图像输入至图卷积网络,提取出固定长度的特征向量;将图像的特征向量处理为联合表示向量后与文本进行拼接,再输出至基于注意力机制的长短记忆模型,获得试题的联合语义表示向量HR;联合表示向量与文本进行拼接公式为: 其中,wt为文本中的第t个分词,一个分词对应一个时刻;为图像的联合表示向量,通过下述方式得到: 其中,I表示试题q中图片的总数,αj为第j个图像的注意力权重;ht-1表示第t-1时刻基于注意力机制的长短记忆模型的隐藏层状态;gj、gi分别表示第j个、第i个图像的特征向量;Wai表示待学习的参数,表示gj的转置;所述结构融合层包括:CKA模块与树卷积网络;其中:所述CKA模块中:先使用嵌入的方法将知识点向量进行降维,表示为:uc=kcWu;其中,是嵌入层的参数,dk是降维后知识点向量uc的元素数目,n为知识点向量kc的元素数目;然后,将试题中降维处理后的所有知识点向量构成的向量u以及联合语义表示向量输入至Scaled-dotproductattention,降维后的知识点向量u作为注意力机制中的Q值,联合语义表示向量作为注意力机制中的V值与K值,得到基于知识点注意力的语义表示向量 在所述树卷积网络中,先将基于知识点注意力的语义表示向量映射到知识结构对应的叶子结点上,其他叶子结点特征设置为0;在树卷积网络每层的计算过程中,第l层的第x个知识点聚集了其所有子结点的特征,使用下述的公式来获取知识点新的表示向量: 其中,Wl和bl是待学习的参数,表示知识点在树结构中对应的特征向量;当结点特征聚集到顶层树结点时,最终,得到一个综合表示向量rE、以及一个总体表示向量其中,综合表示rE是一个整体的基于知识结构语义的表示向量,总体表示是对知识结构中所有知识点基于知识结构语义表示向量的组合;ln表示树结构第l层结点的总数,L为树卷积网络层数。

全文数据:

权利要求:

百度查询: 中国科学技术大学 基于知识结构的相似试题识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。