申请/专利权人:华南理工大学
申请日:2020-06-18
公开(公告)日:2024-04-23
公开(公告)号:CN111914085B
主分类号:G06F16/35
分类号:G06F16/35;G06F40/30;G06F18/2415
优先权:
专利状态码:有效-授权
法律状态:2024.04.23#授权;2020.11.27#实质审查的生效;2020.11.10#公开
摘要:本发明公开了一种文本细粒度情感分类方法、系统、装置及存储介质,其中方法包括以下步骤:获取目标文本和属性词,对目标文本和属性词进行预处理,获得序列对;将序列对输入XLNet模型进行学习,并输出属性相关的词向量语义序列和全局特征表示;采用胶囊网络对词向量语义序列进行学习,获得包含局部特征及空间层次关系的局部特征表示;将全局特征表示和局部特征表示进行合并,获得目标文本的最终语义表示,根据最终语义表示对情感类别进行预测。本发明通过充分结合XLNet学习大规模文本的语义知识方面的优势,以及胶囊网络在学习文本序列的局部信息和空间结构信息方面的优势,提高情感分类的准确率,可广泛应用于自然语言处理领域。
主权项:1.一种文本细粒度情感分类方法,其特征在于,包括以下步骤:获取目标文本和属性词,对所述目标文本和所述属性词进行预处理,获得序列对;将所述序列对输入XLNet模型进行学习,并输出属性相关的词向量语义序列和全局特征表示;采用胶囊网络对所述词向量语义序列进行学习,获得包含局部特征及空间层次关系的局部特征表示;将所述全局特征表示和所述局部特征表示进行合并,获得目标文本的最终语义表示,根据所述最终语义表示对情感类别进行预测;所述将所述序列对输入XLNet模型进行学习,并输出属性相关的词向量语义序列和全局特征表示,包括:将所述序列对输入XLNet模型后,分别通过XLNet对序列对中包含属性相关的上下文信息进行学习,获得并输出属性相关的词向量语义序列和全局特征表示;将包含语义信息的句子词向量表示转化为包含语义及上下文信息的表示;所述采用胶囊网络对所述词向量语义序列进行学习,获得包含局部特征及空间层次关系的局部特征表示,包括:采用胶囊网络对所述词向量语义序列进行学习;通过动态路由算法学习不同胶囊层之间的局部-整体间的层次结构关系,获得包含局部特征及空间层次关系的所述局部特征表示。
全文数据:
权利要求:
百度查询: 华南理工大学 文本细粒度情感分类方法、系统、装置及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。