【发明授权】一种基于ALBERT-BiLSTM模型和SVM-NB分类的文本情绪识别方法_武汉科技大学_202210623982.4

导航：龙图腾网> 最新专利技术> 一种基于ALBERT-BiLSTM模型和SVM-NB分类的文本情绪识别方法_武汉科技大学_202210623982.4

申请/专利权人：武汉科技大学

申请日：2022-06-02

公开（公告）日：2024-04-16

公开（公告）号：CN114861632B

主分类号：G06F40/211

分类号：G06F40/211;G06F40/284;G06F40/289;G06F18/2411;G06N3/0442;G06N3/084

优先权：

专利状态码：有效-授权

法律状态：2024.04.16#授权;2022.08.23#实质审查的生效;2022.08.05#公开

摘要：一种基于ALBERT‑BiLSTM模型和SVM‑NB分类的文本情绪识别方法，步骤包括：对文本进行分词、去停用词、去除乱码等预处理，并打上相应的标签，然后使用ALBERT预训练模型进行训练，获取文本信息的动态特征表示，接着使用BiLSTM网络进行训练，获得词向量相关特征，最后利用SVM‑NB分类器先将情感极性分为积极和消极两种，进而将消极情绪细分为愤怒、低落、厌恶三种。本发明结合了ALBERT预训练语言模型与由双向LSTM叠加形成的循环神经网络BiLSTM以及SVM‑NB分类，采用句子向量进行预训练，而并非词向量，在训练模型时能够更好的结合上下文语句信息，能提高情绪识别的准确率，同时能够做到多种不同情感的识别，取得的效果较为明显。

主权项：1.一种基于ALBERT-BiLSTM模型和SVM-NB分类的文本情绪识别方法，其特征在于包括以下步骤：步骤1对文本进行分词、去停用词、去除乱码预处理，包括以下步骤：步骤1.1使用的是jieba库进行分词、去停用词、去除乱码操作，其中停用词指的是文档中一些十分常用但不会对文本含义造成影响的词汇；步骤1.2使用TF-IDF法，统计出重要单词在文本中出现的频率；单词wi的TF-IDF值计算公式：其中fwi表示单词wi在文本中出现的频率，Dn表示文本总数，fnwi表示有单词wi出现的文本数量，通过对所有文本中的每一个单词都进项上述的分析，得到每一个单词的TF-IDF值，即可得到各个单词在文本中的重要程度；步骤2基于ALBERT预训练语言模型对文本进行预处理，包括以下步骤：步骤2.1利用输入层将步骤1中得到的文本数据输入到模型的ALBERT层中，输入的文本数据E＝{E1,E2...En}其中Ei表示该条文本中的第i个词；步骤2.2对输入的文本数据进行序列化，将文本数据X中的词向量转化成其在字典中相应的编号，序列化后的文本数据X∈{X1,X2...Xn}其中Xi表示文本中第i个词序列化之后的标号；步骤3将步骤2中得到的数据输入到BiLSTM神经网络，包括以下步骤：步骤3.1BiLSTM神经网络ForwardLayer按正向顺序进行读取，输出的向量集合为其中为最后时刻前向隐层的特征向量；步骤3.2BiLSTM神经网络BackLayer按逆向顺序进行读取，输出的向量集合为其中为最后时刻后向隐层的特征向量；步骤3.3将和拼接起来以获取文本最终的特征向量Hn，即BiLSTM的输出为其中i为文本X的第i个词，且满足i≤n；步骤4将步骤3中得到的数据通过SVM-NB分类方法进行情绪分类，包括以下步骤：步骤4.1运用SVM分类，结合步骤3中得到的数据特征，将文本情绪分为积极和消极两类，同时为了方便对输入结果的理解，将SVM-NB层的SVM分类预测值λ大于情绪阈值α的情绪定义为积极情绪，λ小于情绪阈值α的情绪定义为消极情绪，取情绪阈值α＝0.5；步骤4.2将步骤4.1中得到的情绪特征带入到朴素贝叶斯分类公式进行朴素贝叶斯分类，式中X定义为“该情绪具有某特征”，Y定义为“该情绪属于某类”，将消极情绪细分为愤怒、厌恶以及悲伤，训练过程在于求解PX|Y，这个工作是通过进行文本数据的分析而来，具体为计算文本中某些特征的出现频率，如频数最大的一部分特征，所需数据在步骤1.1和步骤1.2中已经完成，朴素贝叶斯分类依赖于特征条件独立假设式中ck表示的是该类情绪所具有的样本个数，由于各个情绪式中分母相同，因此只需要比较分子大小由于一条文本内容可能会包含着多种情绪，因此，针对一种积极情绪和三种消极情绪共四种情绪的数据集分别进行训练得到四组测试集，将单个样例文本分别放入四种测试集中进行情绪预测得到fx情绪参数值μi，其中i＝0、1、2、3，分别对应高兴、愤怒、厌恶以及悲伤情绪，定义情绪阈值参数βi，其中i＝0、1、2、3；若得到的情绪参数值μi大于情绪阈值参数βi则认定该文本符合当前i所对应的情绪，若得到的情绪参数值μi小于情绪阈值参数βi则认定该文本不符合当前i所对应的情绪，取情绪参数阈值βi＝0.5；通过比较各项乘积关系的大小即可确定特征所属文本的具体情绪。

全文数据：

权利要求：

百度查询：武汉科技大学一种基于ALBERT-BiLSTM模型和SVM-NB分类的文本情绪识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：用于装配式面层支护设计的模拟设备及其模拟方法_中建八局广西建设有限公司_202311679130.8

下一篇：信道探测参考信号SRS的发送方法和电子设备_荣耀终端有限公司_202211349911.6

相关技术

用于装配式面层支护设计的模拟设备及其模拟方法_中建八局广西建设有限公司_202311679130.8

信道探测参考信号SRS的发送方法和电子设备_荣耀终端有限公司_202211349911.6

消防救援中多设备协同的交互控制系统_东莞理工学院_202310667377.1

一种管理消息分区的方法及装置_三六零数字安全科技集团有限公司_202211353371.9

低速时车辆档位控制的方法和装置_上海汽车集团股份有限公司_202211337164.4

一种短消息路由方法及相关设备_中国电信股份有限公司_202211350552.6

告警归因方法、装置、电子设备及存储介质_元保科创(北京)科技有限公司_202311533130.7

一种实时监控和校正发电机活塞偏移的装置和方法_中国科学院理化技术研究所_202211325716.X

一种便携式气管插管系统_中国人民解放军战略支援部队特色医学中心_202311457414.2

一种曲面抛光打磨装置中的双轴力控补偿机构_朝华力拓精密(深圳)有限公司_202410058832.2

一种司美格鲁肽口服固体药物组合物及其应用_齐鲁制药有限公司_202311407557.2

天线组件和电子设备_深圳市锐尔觅移动通信有限公司_202211347912.7

文本相关技术

文本分类模型的训练方法、文本正则化方法及装置_马上消费金融股份有限公司_202311485620.4

文本检测模型的训练方法、文本检测方法及相关设备_马上消费金融股份有限公司_202311072990.5

文本分类模型训练方法、文本分类方法及相应装置_马上消费金融股份有限公司_202311213593.5

文本分类模型的训练方法、文本分类方法及相关设备_马上消费金融股份有限公司_202311229312.5

文本处理方法及装置_马上消费金融股份有限公司_202311123192.0

文本修正方法及装置_中核武汉核电运行技术股份有限公司_202211292729.1

语音识别文本纠错方法及装置_青岛海尔电冰箱有限公司_202211290277.3

文本处理方法及装置_马上消费金融股份有限公司_202311257639.3

文本生成方法以及系统_阿里云计算有限公司_202410016455.6

文本重写方法以及电子设备、存储装置_科大讯飞股份有限公司_202011529540.0

分类相关技术

螺栓检测分类装置_中国建筑第八工程局有限公司_202322796253.1

宠物饲料分类储存桶_廖建新_201810208778.X

图像分类方法及装置_中国科学院自动化研究所_202311801526.5

对象分类模型的训练方法、对象分类方法及装置_马上消费金融股份有限公司_202311255275.5

文本分类模型的训练方法、文本分类方法及相关装置_马上消费金融股份有限公司_202310978155.1

文本分类模型的训练方法、分类方法、设备及存储介质_马上消费金融股份有限公司_202311438585.0

储集层分类模型训练方法、分类方法、系统、设备及介质_北京月新时代科技股份有限公司_202410164032.9

文本分类模型的训练方法、文本分类方法及相关设备_马上消费金融股份有限公司_202311229312.5

文本分类模型训练方法、文本分类方法及相应装置_马上消费金融股份有限公司_202311213593.5

一种工具分类存放架_绿苑景观规划设计(山东)有限公司_202322706719.4

SVM-NB相关技术

基于NB-IoT的低轨卫星物联网的资源调度方法_南京邮电大学_202410130896.9

一种实现自适应业务模型的NB-IoT物联网终端系统与方法_隆讯(徐州)智能科技有限公司_202110495337.4

一种低弹性模量的磁兼容Zr-Nb-Cu系生物医用合金及其制备方法和应用_重庆大学_202410133470.9

一种Nb-La-Ce微合金化700MPa级耐候集装厢用热轧带钢及其制备方法_东北大学_202311700492.0

梯度组织Ti-Nb合金薄膜及其制备方法_西安理工大学_202210043689.0

基于SVM和TSBE算法的有限虚体目标辨识方法及系统_北京交通大学_202311719962.8

基于DBO-SVM的SDN中LDoS攻击检测方法_湖南大学_202410143545.1

用于NB-IOT OTDOA定位的带宽相关PRS传输_高通股份有限公司_201980012159.6

一种用于污水处理的NB物联网远传水表_天津市金凤来仪科技有限公司_202322472841.X

基于OC-SVM和DNN的ZPW-2000R轨道电路故障诊断方法及装置_黑龙江瑞兴科技股份有限公司_202210621985.4

龙图腾网&IPTOP

【发明授权】一种基于ALBERT-BiLSTM模型和SVM-NB分类的文本情绪识别方法_武汉科技大学_202210623982.4

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务