【发明授权】一种基于BERT神经网络和多任务学习的主观题自动评阅方法_桂林旅游学院_202210222404.X

导航：龙图腾网> 最新专利技术> 一种基于BERT神经网络和多任务学习的主观题自动评阅方法_桂林旅游学院_202210222404.X

申请/专利权人：桂林旅游学院

申请日：2022-03-07

公开（公告）日：2023-09-29

公开（公告）号：CN114579706B

主分类号：G06F16/33

分类号：G06F16/33;G06F16/35;G06F40/216;G06F40/30;G06F18/241;G06N3/045;G06N3/048;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2023.09.29#授权;2022.06.21#实质审查的生效;2022.06.03#公开

摘要：本发明公开了一种基于BERT神经网络和多任务学习的主观题自动评阅方法，涉及人工智能与智慧教育的交叉领域。首先，使用经过大规模语料预训练的BERT神经网络进行编码，有效解决主观题自动评阅任务中语料过小的问题，并联合训练一个具有学生答案代词消代与主观题自动评阅的多任务神经网络模型。其次，使用所训练的多任务神经网络模型，从题干中提取代词成分来替换学生答案中的代词，确保学生答案语义的完整性。然后，将消代后的学生答案与标准答案形成句子对，送入BERT神经网络进行分类，得到学生答案的评分等级。通过消除学生答案中的代词，以更有效的方法解决主观题自动评阅问题。

主权项：1.一种基于BERT神经网络和多任务学习的主观题自动评阅方法，包含学生答案消代和主观题自动评阅两种任务的学习，其特征在于包括以下步骤：S1.以题干作为知识源，使用共享的BERT神经网络和多头注意力进行编码，对学生答案的代词进行消代；S2.将标准答案和消代后的学生答案形成的句对，作为自动评阅学习任务的输入序列，使用共享的BERT神经网络进行编码和分类，得到学生答案的评分等级；S3.通过联合计算步骤S1和步骤S2的损失函数，联合训练一个具有学生答案代词消代与主观题自动评阅的多任务神经网络模型；S4.使用步骤S3训练成型的多任务神经网络模型，对任意的学生答案进行消代与评阅；所述共享的BERT神经网络是指步骤S1和步骤S2中共享参数的BERT神经网络；所述BERT神经网络是指GoogleAILanguage提出的BidirectionalEncoderRepresentationsfromTransformersBERT语言模型；所述步骤S1具体包括：S1.1以由等待消代的代词p、包含代词的学生答案S＝{s1,s2,…,sm1}与BERT编码符号所组成的句对1序列SP1作为代词语义提取的输入序列，将题干T＝{t1,t2,…,tn1}与BERT编码符号所组成的题干序列ST作为题干语义生成的输入序列，如下所示：SP1＝{[CLS],s1,s2,…,sm1,[SEP],p,[SEP]}1ST＝{[CLS],t1,t2,…,tn1,[SEP]}2其中，[CLS]是BERT分类符的编码，[SEP]是BERT结束符的编码，p∈S是学生答案S中等待消代的代词，n1是题干T的长度，m1是学生答案S的长度；S1.2将题干序列ST和句对1序列SP1分别送入共享的BERT神经网络进行编码，得到题干语义表示CST、句对1语义表示CSP1和代词语义向量vp，计算过程如下所示：其中，BERT·表示共享的BERT神经网络,hcls、hsep分别是编码[CLS]和[SEP]在BERT中对应的隐藏状态,分别是题干序列ST和学生答案S中的词在BERT中对应的隐藏状态，hp是代词p在BERT中对应的隐藏状态，d是共享的BERT神经网络的隐藏单元数，k1是题干序列ST的长度且有k1＝n1+2，k2是句对1序列SP1的长度且有k2＝m1+4；S1.3将代词语义向量vp连接到题干语义表示CST中的每一个隐藏状态，然后通过线性变换和多头注意力得到题干语义融合表示计算过程如下所示：其中，FTP是连接代词语义向量后的题干语义连接表示，fi是FTP中的第i个元素，是CST中的第i个元素，符号“；”表示连接运算，是一个权重矩阵，是一个偏置向量；是将FTP线性变换后的题干语义浓缩表示；表示输入的多头注意力MHAQ,K,V；S1.4使用题干语义融合表示进行代词成分位置抽取，得到代词成分在中的开始位置us和结束位置ue，进而使用题干序列ST得到代词成分E，计算过程如下所示：首先，计算中所有隐藏状态的开始位置和结束位置的概率：其中，为用于计算开始位置概率的权重向量，为用于计算结束位置概率的权重向量，为两个偏置参数，ls为中所有隐藏状态的开始位置的概率向量，le为中所有隐藏状态的结束位置的概率向量，softmax·为用于计算概率的归一化函数；其次，计算代词成分在中的开始位置us和结束位置ue：us＝argmax1＜i＜k1lsi12 其中，函数lsi表示ls中第i个元素，函数lej表示le中第j个元素，argmax1＜i＜k1lsi表示返回使得lsi为ls中最大值的i，表示返回使得lej为le中最大值的j；最后，按照us和ue在题干序列ST中的对应位置，从题干序列ST中提取代词成分E，如下所示： S1.5使用代词成分E替换学生答案S中的代词p，得到消代后的学生答案Sp，如下所示：其中，m2为消代后的学生答案Sp的长度；所述步骤S2具体包括：S2.1以标准答案A＝{a1,a2,…,an2}、消代后的学生答案Sp与BERT编码符号所组成的句对2序列SP2，作为主观题自动评阅学习任务的输入序列，如下所示：其中，n2是标准答案A的长度；S2.2将句对2序列SP2送入共享的BERT神经网络进行处理，得到句对2语义表示CSP2，如下所示：其中，是SP2中的词在共享的BERT神经网络中对应的隐藏状态集合,k3是句对2序列SP2的长度且有k2＝n2+m2+3；S2.3对句对2语义表示CSP2执行最大值池化操作，得到句对2分类向量Z，计算过程如下所示：其中，zj是Z的第j个元素，maxPoolingCSP2表示对执行按列求最大值的池化操作，计算过程如下：其中，Max·表示求最大值的函数，为CSP2的第i行第j列的元素；S2.4对句对2分类向量Z执行softmax的线性变换，进行评分等级的概率计算，并得出最终的评分等级，计算过程如下:o＝MZT+bo20 其中，是评分等级表示矩阵，ZT表示对Z进行转置，是一个偏置向量，dy是评分等级的个数，是表示所有评分等级置信分数的向量，y为一个评分等级，oy表示标注为评分等级y的样本的置信分数，oi表示样本在第i个评分等级上的置信分数，Py|Z表示给定句对2分类向量Z在评分等级y上的预测概率，Y是所有评分等级的集合，y*为最终评定的评分等级，表示返回使得Py|Z为最大值的评分等级，exp·表示以自然常数e为底的指数函数；所述步骤S3具体包括：S3.1分别使用交叉熵损失误差计算学生答案代词消代的损失函数和主观题自动评阅的损失函数，计算过程如下: 其中，Ω是学生答案代词消代与主观题自动评阅多任务的训练集，|Ω|表示训练集Ω的大小，分别表示Ω中第i个训练样本开始位置和结束位置的概率向量，是Ω中第i个训练样本的代词成分在题干中的真实开始位置，是Ω中第i个训练样本的代词成分在题干中的真实结束位置，分别是关于真实开始位置与真实结束位置的one-hot独热向量，是Ω中第i个训练样本的真实评分等级，Zi是Ω中第i个训练样本的句对2分类向量，Υ1是进行学生答案代词消代训练时使用的损失函数，Υ2是进行主观题自动评阅训练时使用的损失函数；S3.2使用如下的公式25计算联合训练学生答案代词消代与主观题自动评阅的联合损失函数其中，λ和β是两个权重参数；S3.3联合训练目标是最小化公式25计算的联合损失误差。

全文数据：

权利要求：

百度查询：桂林旅游学院一种基于BERT神经网络和多任务学习的主观题自动评阅方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：基于数据标签技术的FPGA外置大容量存储器多端口访问系统_中国科学院长春光学精密机械与物理研究所_202410254378.8

下一篇：一种基于时频资源的NB-IoT容量估算方法_江西省邮电规划设计院有限公司_202111393875.9

相关技术

基于数据标签技术的FPGA外置大容量存储器多端口访问系统_中国科学院长春光学精密机械与物理研究所_202410254378.8

一种基于时频资源的NB-IoT容量估算方法_江西省邮电规划设计院有限公司_202111393875.9

一种试飞参数测试系统量值特性退化关键因素分析方法_北京航空航天大学_202210628500.4

一种基于自组织多通道深度学习网络的河流浊度监测方法_北京工业大学_202110556918.4

透平叶片_中国联合重型燃气轮机技术有限公司_202410306638.1

一种全收集的动量成像谱仪_兰州大学_202210311210.7

基于分子筛的制冷机_五邑大学_202110582960.3

干气体和雾化连续循环钻井的循环切换装置以及切换方法_中国石油天然气集团有限公司_202110805034.8

一种用于跟踪飞机目标的平滑数字引导计算方法_中国卫星海上测控部_202410244042.3

一种气体钻井岩屑取样装置_中国石油天然气股份有限公司_202011254171.9

一种探测器温度控制系统及方法_明峰医疗系统股份有限公司_202111117920.8

界面显示方法、装置、终端及存储介质_武汉心络科技有限公司_202410264837.0

学习相关技术

多功能学习画板_深圳市纽莱特实业有限公司_202321922270.9

基于机器学习的定位_苹果公司_202280068566.0

基于快速学习与知识积累的元持续联邦学习系统及方法_山东省计算中心(国家超级计算济南中心)_202410296683.3

机器学习方法、装置、设备、联邦学习系统及存储介质_浪潮电子信息产业股份有限公司_202410230008.0

基于宽度学习的联邦学习策略优化方法和装置_浙江工业大学_202110220275.6

基于元路径的学习者学习情况预测方法、系统及电子设备_上海师范大学_202410058738.7

一种基于克隆学习的多智能体强化学习训练方法_华南理工大学_202410113506.7

学习装置、预测装置、预测系统、学习方法、预测方法以及预测程序_三菱电机株式会社_202180103229.6

一种基于学习意图感知的双重对比学习课程推荐方法_合肥工业大学_202410293493.6

一种基于迁移学习的强化学习安全控制方法_哈尔滨工业大学_202410350942.6

任务相关技术

用于GPU任务调度的连续分析任务_超威半导体公司_201880035453.4

任务卸载方法及装置_全球能源互联网研究院有限公司_202111205701.5

任务预测方法及其装置_维沃移动通信有限公司_202410244012.2

任务处理方法、自动问答方法以及法律任务处理方法_阿里巴巴(中国)有限公司_202410153944.6

一种GPU任务调度中间件和GPU任务调度方法及装置_中国科学技术大学_202410227600.5

一种可调谐多任务衍射神经网络实现方法及任务器件_电子科技大学_202410214673.0

多任务选择模型构建方法、多任务选择性维护方法及系统_南京航空航天大学_202110123843.0

一种面向多个离散任务地域的航天观测任务均衡安排方法_中国电子科技集团公司第五十四研究所_202410508630.3

任务调度方法、系统及设备_阿里巴巴集团控股有限公司_201911397074.2

任务监控方法、装置和计算设备_网易(杭州)网络有限公司_202311406786.2

主观题相关技术

人眼屈光度检测光学系统和主观验光仪_视力检(潍坊)健康科技有限公司_202410471498.3

一种基于声热复合环境的驻车空调主观烦恼度评估方法_武汉科技大学_202410212464.2

一种基于抽象语法树的动静态结合的编程题自动评分和反馈方法_西北大学_202410265619.9

一种基于熵权及主观经验赋权的协同作战效能评估方法_大连理工大学_202410461529.7

一种数学应用题求解方法、装置及计算机可读存储介质_江南大学_202410366151.2

搜题方法、题目框绘制方法和装置、设备及存储介质_百度在线网络技术(北京)有限公司_202110694942.4

一种扫描阅卷系统中中括号客观题样式判别及定位方法_天翼云科技有限公司_202311635220.7

诊断最近发展区的错题管理和变式题配置方法及系统_北京实证优师教育咨询有限公司_202410122400.3

一种提高数学应用题自动求解正确率的方法、数学应用题自动求解装置_华南师范大学_202410141592.2

用户接受物理挑战任务的主观意愿调整方法、装置和设备_中国科学院软件研究所_202410065745.X

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明授权】一种基于BERT神经网络和多任务学习的主观题自动评阅方法_桂林旅游学院_202210222404.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务