买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于深度学习的评论文本方面级情感分类方法及系统_上海哈蜂信息科技有限公司_202010776165.3 

申请/专利权人:上海哈蜂信息科技有限公司

申请日:2020-08-05

公开(公告)日:2024-04-23

公开(公告)号:CN111858945B

主分类号:G06F16/35

分类号:G06F16/35;G06F40/30;G06N3/0464;G06N3/084;G06F18/22;G06F18/24

优先权:

专利状态码:有效-授权

法律状态:2024.04.23#授权;2020.11.17#实质审查的生效;2020.10.30#公开

摘要:本发明提供一种基于深度学习的评论文本方面级情感分类方法,先将评论文本进行预处理,包括分词和去除停用词,然后对方面词及对应的标签进行平衡处理,生成平衡样本,再将平衡样本与原始样本中的中文词语进行向量化,获得平衡样本中的词向量;输入到模型中进行评论结果的预测;所述模型是根据深度神经网络构建的深度学习模型,通过方面词的词向量与句子其他词语进行相似度计算,生成平衡样本的方面情感语义矩阵。本发明通过平衡处理和构建Attn‑Bi‑LCNN模型,能够有效输出情感语义矩阵,提高了模型的精准度与实际应用时的预测速度,从而使本发明的方法适用于文本的方面级细粒度情感分类。

主权项:1.一种基于深度学习的评论文本方面级情感分类方法,所述方法包括以下步骤:1将评论文本进行预处理,所述预处理包括分词和去除停用词,得到文本中的方面词及对应的标签;2对所述方面词及对应的标签进行平衡处理,获得评论文本的平衡标签,根据所述平衡标签生成平衡样本;3将平衡样本与原始样本中的中文词语进行向量化,获得平衡样本中的词向量;4将所述词向量输入到模型中进行评论结果的预测;所述的模型是根据深度神经网络构建的深度学习模型,通过方面词的词向量与句子其他词语进行相似度计算,生成平衡样本的方面情感语义矩阵;利用情感语义矩阵同时计算所述平衡样本内所有方面的情感倾向;所述模型根据训练文本的标签来计算模型损失,通过模型损失的反向传播优化神经网络中的权重;其中,针对情感分类问题,通过Attn-Bi-LCNN模型,利用方面词向量进行注意力机制计算,形成情感语义矩阵:所述Attn-Bi-LCNN模型包括Embedding层、Bi-LSTM层、CNN层、Attention层、隐藏层和输出层,其中:4.1Embedding层模型中的Embedding层用于将词语映射为词向量,训练文本通过Embedding层之后被转换为文本矩阵,矩阵的第i行即为句子中第i个词的词向量,其输出为S=RL×d,其中,文本矩阵大小为L×d,中L为矩阵行数,也是句子词语数,d为词语向量化维度;4.2Bi-LSTM层Bi-LSTM层用于提取句子中单词之间的顺序特征,并对句子表示进行记忆存储;当文本矩阵中的词语按照时间顺序输入到Bi-LSTM层中,会获取当前词的前向语义表示ht和反向语义表示h’t,并将所述前向语义表示ht和反向语义表示h’t拼凑得到当前词的完整语义表示[ht,h’t];文本向量矩阵经过Bi-LSTM层的输出为文本的高维语义表示,其输出为其中,Slstm代表文本高维语义表示矩阵,l代表句子长度,dlstm代表Bi-LSTM隐藏层维度大小,矩阵的每一行即为对应词的完整语义表示[ht,h't];4.3CNN层CNN层用于提取高维语义表示中的词与词之间的关系;其输出为其中,SCNN为卷积之后的句子向量,C代表卷积操作,dCNN代表SCNN维度大小;4.4Attention层注意力权重计算公式为A=softmaxVatanhWmDT,其中,A为注意力权重矩阵,矩阵的每一列即代表一个方面的注意力权重;DT代表卷积神经网络卷积核得出的语义向量所组成的矩阵,矩阵的每一行为diCNN,代表不同就不同卷积核卷积得到的特征向量;Wm代表DT的权重矩阵,Va为方面词词向量矩阵,矩阵的每一行代表训练数据的各个方面词向量化得到的词向量;通过Softmax激活函数对结果进行激活得到注意力权重矩阵A;得到不同方面的注意力权重之后,将权重矩阵A与卷积层得到的语义向量进行相乘,得到不同方面的情感语义矩阵,输出为S=A×D;4.5隐藏层隐藏层实现特征融合和降维;4.6输出层输出层激活函数为Softmax函数,其计算结果为模型预测结果,算公式为其中,分子ei代表向量中第i个元素的值;分母∑jej代表向量中所有元素的和;5所述模型的输出结果采用Softmax函数进行激活:其中ei为对应标签得分,Softmax函数将得分转换为0-1之内的概率值,概率值最大的类别即为模型预测类别。

全文数据:

权利要求:

百度查询: 上海哈蜂信息科技有限公司 基于深度学习的评论文本方面级情感分类方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。