买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于位置增强的细粒度情感分析方法_北京工业大学_202111000430.X 

申请/专利权人:北京工业大学

申请日:2021-08-30

公开(公告)日:2024-04-02

公开(公告)号:CN113705197B

主分类号:G06F40/211

分类号:G06F40/211;G06F40/289;G06F40/30;G06F18/214;G06N3/044;G06F16/33

优先权:

专利状态码:有效-授权

法律状态:2024.04.02#授权;2021.12.14#实质审查的生效;2021.11.26#公开

摘要:本发明提出了一种基于位置增强的细粒度情感分析方法,用于解决现有技术对文本进行细粒度情感分析导致的精度低的问题。首先将文本进行预处理,再通过细粒度情感分析模型进行情感分析。模型包括嵌入层、语义表征层、信息交互层和输出层。嵌入层将句子映射为上下文词嵌入和方面词嵌入,语义表征层通过位置强化注意力机制来增强模型的文本语义表征能力,信息交互层通过使用记忆网络增强方面词与其上下文的交互性,将基于方面的上下文语义增强表示作为与方面交互的外部记忆单元,使得外部存储记忆单元能够学习到复杂文本中的语义信息,最后输出层进行情感预测。本发明通过合理界定对方面进行情感表达的上下文范围,提高了细粒度情感分析准确度。

主权项:1.一种基于位置增强的细粒度情感分析方法,其特征在于包括以下步骤:步骤1文本预处理;步骤2词向量构建:将预处理后的文本数据中的每一个词映射到向量空间,得到每个词的词向量;步骤3利用细粒度情感分析模型对待分析文本进行方面级情感的细粒度情感预测,其中细粒度情感分析模型包括嵌入层、语义表征层、信息交互层和输出层,具体预测过程为:首先,嵌入层根据步骤2得到的词向量,将文本中的句子映射为上下文词嵌入和方面词嵌入表示;然后,语义表征层对上下文词嵌入使用自注意力机制,再通过方面词位置信息强化注意力机制来增强模型的文本语义表征能力;接下来,通过信息交互层增强方面词与其上下文的交互性;最后,输出层进行方面词的情感预测;步骤1所述文本预处理包括如下步骤:1大小写转换:将存在的所有大写字母转换为小写字母;2分词:采用通用的语言分词模块对文本数据进行分词;3去除停用词:去除文本数据中一些没有实际意义的词;4利用屏蔽机制对文本数据构造位置权重矩阵M,计算公式如下: 其中hmax表示为输入句子的最大长度,所述的屏蔽机制根据句子中方面词与上下文词的相对位置计算其位置权重,Mij表示以方面词wi为中心的词对的位置权重,i和j为词的位置索引,词对距离在hmax2内时,根据距离的大小赋予权重,否则将Mij设定为0;步骤2中所述词向量的获取方式为:对文本数据中的每一个词,若该词在预训练的词向量表中存在,则使用词向量表中的词向量作为该词的词向量,若该词在预训练词向量表中不存在,则使用正态分布随机初始化向量作为该词的词向量;所述细粒度情感分析模型每个层的具体步骤如下:嵌入层根据步骤2得到所有词的词向量,将文本中的句子映射为低维稠密向量形式的词嵌入表示,已经标记方面的句子看作由方面和方面的上下文构成,相应的词嵌入表示分为上下文词嵌入和方面词嵌入,如果一个方面由多个词构成,则将多个词的向量表示进行平均池化作为方面的向量表示;语义表征层用于提取文本的高度抽象表示,语义表征层的网络具体结构由K个Block通过串联组成,通过不断迭代计算,从而得到文本的更深层次的抽象特征H,其中每个Block在注意力机制中加入了位置权重,并使用残差连接、层归一化和前馈神经网络层处理;信息交互层使用记忆网络进行交互,用于增强抽象特征H与方面之间的联系,保证方面和其上下文具有交互性;记忆网络以语义表征层得到的抽象文本特征H=[h1,h2,…,hn]作为记忆单元,由L个计算层组成,第1个计算层以方面词嵌入vaspect作为初始输入,以记忆单元的加权组合r作为输出,其输出作为下一个计算层的输入,每层依次迭代计算,加权组合公式如下: 其中n为记忆容量大小,αi∈[0,1]是记忆单元hi的权重且∑i=1αi=1,权重αi通过前馈神经网络计算方面与上下文的语义相关性得到,计算如下所示:ωi=tanhWatt[hi;vaspect]+batt公式3 其中Watt∈R1×2n为参数向量,batt∈R1×1为偏置,αi为记忆单元hi的权值分配;输出层以信息交互层的结果为输入,利用softmax函数预测方面情感。

全文数据:

权利要求:

百度查询: 北京工业大学 一种基于位置增强的细粒度情感分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。