买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于“单词-短语”注意力机制的情感分类方法和系统_梧州学院_202111202671.2 

申请/专利权人:梧州学院

申请日:2021-10-15

公开(公告)日:2024-04-12

公开(公告)号:CN113869065B

主分类号:G06F40/30

分类号:G06F40/30;G06F40/289;G06F16/35;G06N3/0442;G06N3/0464;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.04.12#授权;2022.01.21#实质审查的生效;2021.12.31#公开

摘要:本发明提供一种基于“单词‑短语”注意力机制的情感分类系统和方法,所述方法在TCN的基础上,提出的基于单词注意力机制的浅层特征提取模型和基于短语注意力机制的深层提取模型,能够有效挖掘单词、短语和整体评论所蕴含的辅助信息以及不同贡献程度,以更低的计算资源实现了更精准的情感分类性能。实验表明本文所提的SC‑WPAtt方法性能优于传统方法。

主权项:1.一种基于“单词-短语”注意力机制的情感分类系统,其特征在于:其包括文本数据预处理模型、基于单词注意力机制的浅层特征提取模型、基于短语注意力机制的深层特征提取模型和情感分类预测器;所述文本数据预处理模型用于实现对文本数据的预处理,将每一个单词映射为词向量;所述基于单词注意力机制的浅层特征提取模型包括构建Bi-GRU网络结构及构建单词注意力机制,提取单词不同的贡献程度,所述Bi-GRU网络结构用于得到文本的前向隐藏状态以及后向隐藏状态,使用串联的方式计算得到当前时刻总的状态,从而提取到细粒度的辅助信息以及核心词汇;所述基于短语注意力机制的深层特征提取模型,用于从深层次挖掘核心词汇形成的短语级词向量蕴含的辅助信息,以及获取短语之间的序贯特征,即评论文本对应的表达特征;所述情感分类预测器用于根据所述评论文本对应的表达特征预测其对应的情感分类;其中,Bi-GRU包含从句子sm的第1个单词wm1到最后1个单词wmN前向以及从句子sm的最后1个单词wmN到第1个单词wi1的后向并经过运算后得到前向隐藏状态以及后向隐藏状态如公式5和公式6所示: 将所述前向隐藏状态和所述后向隐藏状态使用串联的方式计算得到当前时刻总的状态在构建单词注意力机制、提取单词不同的贡献程度时,如公式7、公式8以及公式9所示:umn=tanhWωhmn+bω7 其中,umn为打分权重,αmn为选择hmn的注意力分布,表示hmn被选中的概率;所述基于短语注意力机制的深层特征提取模型采用时间卷积网络,具体用法为:已知是浅层特征模型提取到的第m个句子的浅层特征,其中M为文本C中短语数量的最大值,对于评论C则有输入序列与所述输入序列对应的输出序列为即TCN中输入序列和输出序列相同;此外,假设每一层对应的卷积核为f:0,…,k-1}→R,那么第r层膨胀卷积,如公式10所示: 其中,lr为膨胀因子,取值为k-1r-1,从而获取更大的感受野;所述公式10为一层时间卷积层,而时间卷积网络是由多个时间卷积层叠加构造而成的,使用残差的方式对层间进行连接,如公式11所示:Fs=ActivationFω+FFω11;其中,最后为了进一步挖掘评论C中不同短语的深层隐藏特征以及所蕴含的辅助信息,使用公式12、公式13以及公式14所示的注意力机制对进行分析: 其中,所述基于短语注意力机制的深层特征提取模型通过使用一维卷积来实现对序贯数据的处理,并通过使用因果卷积来实现一维卷积的方式延长了对时间序列的处理能力。

全文数据:

权利要求:

百度查询: 梧州学院 一种基于“单词-短语”注意力机制的情感分类方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。