【发明授权】融合多头注意力机制的多任务学习情感分类方法_中国计量大学上虞高等研究院有限公司;中国计量大学_202111550577.6

申请/专利权人：中国计量大学上虞高等研究院有限公司;中国计量大学

申请日：2021-12-17

公开（公告）日：2024-04-26

公开（公告）号：CN114238577B

主分类号：G06F16/33

分类号：G06F16/33;G06F16/35;G06F40/30;G06F18/24;G06N3/0455;G06N3/0442;G06N3/0464;G06N3/048;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2024.04.26#授权;2022.04.12#实质审查的生效;2022.03.25#公开

摘要：本发明公开了一种融合多头注意力机制的多任务学习情感分类方法，该方法使用适用于重要特征提取的多头注意力机制和改善分类泛化性的多任务学习来提高情感分类性能。使用多头注意力机制对分批次输入的句子序列进行特征提取，得到每条语句的预分类标签。使用由长短期记忆网络联合逐点卷积神经网络构成的编码器对分批次输入的句子序列进行编码，将预分类标签作为辅助标签帮助构建多任务情感分类器。设计新的损失函数项加入到原有的损失函数中，经过多轮训练，动态地优化模型参数，即得到最优的情感分类模型，利用该模型可对评论文本进行情感分类。该方法在准确率、F1值评测指标上均优于采用传统多任务学习方法，适用于不同的下游任务和预测场景。

主权项：1.一种融合多头注意力机制的多任务学习情感分类方法，其特征在于：包括以下步骤：1收集整理来自多个领域的商品评论数据，每条评论文本都有对应的情感极性标签：0或1，0代表消极情绪，1代表积极情绪；对文本数据进行预处理；2将预处理后的每种领域的商品评论按照8:1:1的比例划分为训练集、验证集和测试集，正负样本分布均匀，随后进行文本初始化，从而得到词向量矩阵；3将词向量矩阵分批次输入多头注意力机制中进行特征提取，经过全连接层对特征提取后的结果进行线性变换操作，由SoftMax激活函数得到最终表示，从而构建文本分类器；取最终表示中的最大特征作为分类结果，得到每条语句的预分类标签；4使用由长短期记忆网络联合逐点卷积神经网络构成的编码器对分批次输入的词向量矩阵进行编码，将预分类标签作为辅助标签进行输入词向量矩阵类别的重分类，构建多任务情感分类器；所述的文本分类器和多任务情感分类器共同构成融合多头注意力机制的多任务学习情感分类模型；5设计新的损失函数项加入原有的融合多头注意力机制的多任务学习情感分类模型的损失函数中，经过多轮训练，动态地优化模型参数，即得到最优的融合多头注意力机制的多任务学习情感分类模型，利用该模型可对评论文本进行情感分类；步骤2中所述的文本初始化是指：将训练、验证、测试集中的文本转换为词向量，具体是采用Word2Vec模型对输入的文本数据进行特征映射，从而得到相应的词向量矩阵Rn*V，其中，n表示词向量维度，V表示全部向量化的词语数目；所述输入的文本数据表示为Sentence＝{X1,X2,…Xi…,Xm}，其中，m表示句子中包含的词语的个数；Xi＝{h1,h2,…,hn},i＝1,2,…,m，作为输入的文本数据中所包含的词语表示；步骤4中，所述的多任务情感分类器基于对抗多任务学习框架，包括多个私有编码器、共享编码器和任务判别器，其中，私有编码器用于存储任务相关的特性，共享编码器用于捕获任务共同的特性，任务判别器用于剔除共享特征中的私有特征；步骤5中所述的新的损失函数项用于监督文本分类器的预分类效果：其中，T表示文本分类器设置的标签种类数目，n表示文本分类器得到的预分类标签，表示预分类标签n和真实情绪标签的交叉熵损失函数。

全文数据：

权利要求：

百度查询：中国计量大学上虞高等研究院有限公司;中国计量大学融合多头注意力机制的多任务学习情感分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种可燃气体监测装置和方法_天信仪表集团有限公司_202111562761.2

下一篇：基于模糊控制的电力设备智能调控方法_太原理工大学_202410258512.1

相关技术

一种可燃气体监测装置和方法_天信仪表集团有限公司_202111562761.2

基于模糊控制的电力设备智能调控方法_太原理工大学_202410258512.1

燃料电池以及燃料电池的制造方法_丰田自动车株式会社_202110209899.8

一种基于水蓼的富磷生物炭及其制备方法与应用_四川农业大学_202211532429.6

帏中香风味纸张的制备方法_扬州市祥华新材料科技有限公司_202211345365.9

验证转化回传数据方法、装置、计算机设备和存储介质_上海数禾信息科技有限公司_202311042515.3

一种带角度弹性垫圈的热处理方法及热处理装置_贵州航天精工制造有限公司_202111464284.6

移动式组合盐水分离系统_大连盐化集团有限公司_202111204431.6

刷新注册的容错处理方法、装置、CSCF以及介质_中国电信股份有限公司_202010967419.X

一种外导体压接装置_江苏博之旺自动化设备有限公司_202111235070.1

一种直径与中继协作的信号空间分集传输方法_山东交通学院_202110011021.3

一种结构紧凑的测斜仪骨架_青岛智腾科技有限公司_201910663221.X

任务相关技术

加速的任务执行_苹果公司_202111177110.1

分布式任务调度方法、分布式任务调度系统及分布式任务处理系统_浙江大学_202410154031.6

任务调度方法及系统_上海御微半导体技术有限公司_202110236051.4

任务处理方法、装置、设备、存储介质_佳都科技集团股份有限公司_202311842750.9

任务流转方法及电子设备_荣耀终端有限公司_202211466503.9

一种多模态多任务训练系统及多模态多任务训练方法_镁佳(北京)科技有限公司_202311204931.9

基于强化学习和任务感知随机游走的深度学习任务调度方法和系统_北京大学_202211398671.9

任务调度方法和装置、存储介质、电子装置_平安科技(深圳)有限公司_202010138785.4

任务调度方法、装置、电子设备及存储介质_北京字跳网络技术有限公司_202211407194.8

适于实时任务切换的灵活逻辑单元_芯力能简易股份公司_201880088311.4

机制相关技术

计算优化机制_英特尔公司_202410197745.5

一种机制锚固件_安徽海螺集团有限责任公司_202322362650.8

碎石机制砂混凝土石粉含量检测装置_湖南常德南方新材料科技有限公司_202323021272.3

基于图注意机制的肽序列标签鉴定方法_湖南工商大学_202310866226.9

一种基于跟踪丢失触发机制的跌倒行为检测方法_南京工业大学_202410070428.7

一种基于网络演算的TSN帧抢占机制的时延分析方法_国网湖北省电力有限公司信息通信公司_202311831953.8

基于显式监督注意力机制的场景文本识别方法_西北工业大学宁波研究院_202111558960.6

一种机制砂混凝土及其制备方法与应用_中建西部建设湖南有限公司_202311827593.4

联合注意力机制与卷积神经网络的知识超图链接预测方法_武汉科技大学_202210475730.1

基于编解码和记忆机制的电力变压器负载控制方法及装置_天津大学_202111246475.5

学习相关技术

基于改进的核极限学习机和GAN的自适应学习方法_湘潭大学_201910043961.3

基于图对比学习的城市异构实体联合表征学习方法_北京航空航天大学_202311741013.X

机器学习模型运用管理系统以及机器学习模型运用管理方法_川崎重工业株式会社_202080017363.X

在线学习问答方法及相关装置_深圳青豆教育科技有限公司_202311797251.2

一种图文吊挂学习装置_西北大学现代学院_202323019165.7

基于强化学习和任务感知随机游走的深度学习任务调度方法和系统_北京大学_202211398671.9

一种基于强化学习和迁移学习的命名实体识别方法和装置_广东省人民医院_202410182078.3

食品污染预测装置、推理装置、机器学习装置、食品污染预测方法、推理方法及机器学习方法_东洋制罐集团控股株式会社_202280061922.6

以医疗数据为基础的深度学习模型的学习及推论方法、程序及装置_美迪科诶爱有限公司_202280063391.4

针对深度学习后门攻击防御的性能评估方法_南京理工大学_202410056834.8

龙图腾网&IPTOP

【发明授权】融合多头注意力机制的多任务学习情感分类方法_中国计量大学上虞高等研究院有限公司;中国计量大学_202111550577.6

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务