买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种面向稀缺标注场景的认知诊断解耦方法_合肥工业大学_202311274452.4 

申请/专利权人:合肥工业大学

申请日:2023-09-28

公开(公告)日:2024-01-05

公开(公告)号:CN117350901A

主分类号:G06Q50/20

分类号:G06Q50/20;G06N5/022;G06N5/02;G06N5/04;G06N3/0455;G06N3/0895;G06F17/16;G06F17/18

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.01.23#实质审查的生效;2024.01.05#公开

摘要:本发明公开了一种面向稀缺标注场景的认知诊断解耦方法,包括:1.构造异构数据,包括学生交互矩阵X及习题与知识点的关系矩阵Q;2.利用交互矩阵X建模学生的熟练程度、习题难度和习题相关度;3.为解决习题知识点标注稀缺的问题,引入了两个新的策略:基于知识点分组的解耦策略和标注稀缺场景下的对齐策略,来解耦与知识点相关的因子,并将它们与实际的知识点标注进行对齐;4.建立解码器,基于学生、习题难度和习题相关度预测学生做题所得分数。本发明的解耦策略和对齐策略可以充分利用少量已标注习题的半监督作用,以应对习题知识点标注稀缺的认知诊断挑战,从而实现更加准确的认知诊断。

主权项:1.一种面向稀缺标注场景的认知诊断解耦方法,其特征在于,是按如下步骤进行:步骤1、获取学生的历史答题记录并构造异构数据:定义学生集合为U={u1,u2,...,ui,...,uN}、习题集合为V={v1,v2,...,vj,...,vM}、知识点集合为C={c1,c2,...,ck,...,cK};其中,ui表示第i个学生,vj表示第j个习题,ck表示第k个知识点,N表示学生的数量,M表示习题的数量,K表示知识点的数量,i=1,2,…,N,j=1,2,…,M,k=1,2,…,K;将习题与知识点的关系矩阵记为其中,Qjk=1或0表示第j个习题vj与第k个知识点ck相关或不相关;根据关系矩阵Q,将习题集V中有标注知识点的习题集合记为V1,并由习题集V中剩余未标注的习题构成未标注的习题集合V2;将学生对习题的答题记录的交互矩阵记为其中,Xij=-1,0或1分别表示第i个学生ui对第j个习题vj回答错误,未答或回答正确;将交互矩阵X拆解为三元组T,令T中的任意一个三元组ui,vj,yh表示第i个学生ui回答第j个习题vj所对应的答题标签yh;利用知识点集合C中的知识点之间的层级关系构造一个具有L层结构的知识树G,其中,知识树G的第l层结构中的叶子节点分组集合记为其中,表示叶子节点集合中属于第l层结构的第g个组的知识点,|Gl|表示第l层结构中的知识点组数,并且|Gl+1|≥|Gl|,l=1,2...,L,g=1,2,…,|Gl|;第1层结构中的叶子节点分组集合记为第L层结构中的叶子节点分组集合记为其中,表示叶子节点集合中属于第L层结构的第g个组的知识点;步骤2、用交互矩阵X和关系矩阵Q建模学生的熟练程度、习题难度和习题相关度:步骤2.1、建模学生的熟练程度:假设学生u在所有知识点上的熟练度的联合随机变量zu的先验分布pzu遵循多元标准高斯分布其中,0表示零向量,I表示单位矩阵;从交互矩阵X中获取学生u在所有习题上答题结果的联合随机变量xu,并输入到推理网络中,从而得到学生u在每个知识点上的熟练度联合分布均值μu和学生u在每个知识点上的熟练度联合分布方差σu;从而利用式1构建与学生u在每个知识点上的熟练程度近似后验分布 式1中,φu表示推理网络关于学生u的参数,表示高斯分布的概率密度函数;zu[k]表示学生u在第k个知识点上的熟练度的随机变量;μu[k]表示学生u在第k个知识点上的熟练度的均值,σu[k]表示学生u在第k个知识点上的熟练度的方差;步骤2.2、建模习题难度和习题相关度;步骤2.2.1、假设习题v在每个知识点上难度的联合随机变量的先验分布遵循多元标准高斯分布其中,0表示零向量,I表示单位矩阵;从交互矩阵X中获取每个学生对于习题v的答题结果的联合随机变量xv,并输入到推理网络中,得到习题v在每个知识点上的难度联合分布均值和习题v在每个知识点上的难度联合分布方差从而根据式2构建习题v在每个知识点上的难度的近似后验分布 式2中,表示推理网络中关于习题v的参数,表示高斯分布的概率密度函数;表示习题v在第k个知识点上的难度的随机变量,表示习题v在第k个知识点上的难度的均值,表示习题v在第k个知识点上的难度的方差;步骤2.2.2、假设习题v与每个知识点的相关度的联合随机变量的先验分布遵循多元伯努利分布Bernoulli1,pB,其中,pB是一个超参数;从交互矩阵X中获取每个学生在习题v上的答题结果的联合随机变量xv,并输入推理网络中,得到习题v与每个知识点的相关度联合分布均值从而利用式3构建习题v与每个知识点的相关度近似后验分布 式3中,表示推理网络关于习题v相关度的参数,Bernoulli表示多元伯努利分布概率密度函数,表示习题v与第k个知识点的相关度的随机变量,表示习题v与第k个知识点的相关度的均值;步骤3、建立解耦策略和对齐策略:步骤3.1、建立基于知识点分组的解耦策略:步骤3.1.1、建立联合随机变量zu的总相关性损失 式4中,β为超参数,DKL表示KL散度损失,qzu表示zu的聚合后验,且其中,表示第i个学生ui在每道题上的答题结果,表示给定的前提下,zu的后验分布,表示学生ui答题记录的先验分布;qzu[k]表示学生u在第k个知识点上熟练度的分布;利用知识树G对式4进行优化,从而利用式5建立第l层结构的总相关性损失 式5中,表示学生u在第l层结构的第g个组知识点上熟练度的分布;步骤3.1.2、利用式6建立联合随机变量zu的KL散度损失 式6中,pzu[k]表示随机变量zu[k]的先验分布,且遵循标准高斯分布;步骤3.1.3、按照步骤3.1.1和步骤3.1.2的过程建立的总相关性损失KL散度损失的总相关性损失KL散度损失步骤3.2、建立标注稀缺的场景下的对齐策略:步骤3.2.1、利用式7构建标注对齐损失 式7中,表示关系矩阵Q中已标注的第j1个习题所在列向量,表示与每个知识点的相关度联合分布均值;步骤3.2.2、利用式8构建未标注对齐损失用于将表征与真实的知识点进行对齐; 式8中,m为边界,λ1和λ2为2个超参数;表示与与每个知识点的相关度联合分布均值,表示对降序排序后的结果中前d1个相关度联合分布均值,表示对降序排序后的结果中第d1+1个到第d2个相关度联合分布均值;步骤4、利用式9来构建解码器的主损失 式9中,表示第i个学生ui在所有知识点上的熟练度,表示第j个习题vj在所有知识点上的难度,表示第j个习题vj与所有知识点的相关度,BCE·,·为二元交叉熵损失函数,和σ·分别为内积运算函数和sigmoid函数;步骤5、利用式10构建总目标函数 式9中,为待训练的参数集,α为标注习题对齐的超参数,βl为知识点树中第l层对应解耦项的权重,z表示zu,中任意的一个变量;步骤6、利用Adam优化器对于认知诊断模型进行训练,并最小化损失函数以更新模型参数集,直至收敛为止,从而获得在知识点标注稀缺的场景下,对于诊断学生认知状态相对准确的认知诊断模型。

全文数据:

权利要求:

百度查询: 合肥工业大学 一种面向稀缺标注场景的认知诊断解耦方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。