买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】情感关键词的获取方法、装置、设备及存储介质_北京百度网讯科技有限公司_201811523511.6 

申请/专利权人:北京百度网讯科技有限公司

申请日:2018-12-13

公开(公告)日:2024-04-12

公开(公告)号:CN109783800B

主分类号:G06F40/30

分类号:G06F40/30;G06F40/284

优先权:

专利状态码:有效-授权

法律状态:2024.04.12#授权;2019.06.14#实质审查的生效;2019.05.21#公开

摘要:本申请实施例提供一种情感关键词的获取方法、装置、设备及存储介质,通过获取待处理的目标文本;基于预设的第一模型对所述目标文本进行处理,获得用于表达所述目标文本情感倾向的第一情感关键词,其中,所述第一模型是基于标注有情感倾向的语料训练获得的模型;基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,获得所述目标文本中影响所述目标文本情感倾向的第二情感关键词。本申请实施例提供的技术方案,能够在实现情感关键词提取的同时,降低模型训练过程中语料标注的工作量,提高情感关键词提取的灵活性和丰富性。

主权项:1.一种情感关键词的获取方法,其特征在于,包括:获取待处理的目标文本;基于预设的第一模型对所述目标文本进行处理,获得用于表达所述目标文本情感倾向的第一情感关键词,其中,所述第一模型是基于标注有情感倾向的语料训练获得的模型;基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,得到所述目标文本中的多个情感关键词的向量;根据所述多个情感关键词的向量确定所述目标文本中影响所述目标文本情感倾向的第二情感关键词;所述获取待处理的目标文本,包括:获取文本,并从所述文本中提取获得预设词性的词;从提取获得的所述预设词性的词中提取词频在预设范围内的词;基于提取获得的词频在预设范围内的词,生成目标文本。

全文数据:情感关键词的获取方法、装置、设备及存储介质技术领域本申请实施例涉及人工智能技术领域,尤其涉及一种情感关键词的获取方法、装置、设备及存储介质。背景技术现有的情感关键词获取一般都是通过预设的关键词识别模型进行获取。具体地,关键词识别模型一般都是通过预先对情感关键词进行标注的大量语料训练获得的。但是模型训练所需要的语料数量非常庞大,对大量语料进行标注往往较为耗费人力资源,此外,目前训练获得的关键词识别模型的识别范围仅为训练语料中标注的情感关键词,情感关键词的集合较为封闭,导致情感关键词提取的灵活性和丰富性较差。发明内容本申请实施例提供一种情感关键词的获取方法、装置、设备及存储介质,用以在实现情感关键词获取的同时,降低模型训练过程中语料标注的工作量。本申请实施例第一方面提供一种情感关键词的获取方法,包括:获取待处理的目标文本;基于预设的第一模型对所述目标文本进行处理,获得用于表达所述目标文本情感倾向的第一情感关键词,其中,所述第一模型是基于标注有情感倾向的语料训练获得的模型;基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,获得所述目标文本中影响所述目标文本情感倾向的第二情感关键词。本申请实施例第二方面提供一种情感关键词的获取装置,包括:获取模块,用于获取待处理的目标文本;情感倾向识别模块,用于基于预设的第一模型对所述目标文本进行处理,获得用于表达所述目标文本情感倾向的第一情感关键词,其中,所述第一模型是基于标注有情感倾向的语料训练获得的模型;情感关键词提取模块,用于基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,获得所述目标文本中影响所述目标文本情感倾向的第二情感关键词。本申请实施例第三方面提供一种计算机设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器执行如上述第一方面所述的方法。本申请实施例第四方面提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时执行如上述第一方面所述的方法。基于以上各方面,本申请实施例通过获取待处理的目标文本,基于预设的第一模型对目标文本进行处理,获得用于表达目标文本情感倾向的第一情感关键词,其中第一模型是基于标注有情感倾向的语料训练获得的模型,从而基于预设的第二模型对第一情感关键词进行该处理的反向处理,获得目标文本中影响目标文本情感倾向的第二情感关键词。由于在本申请实施例中第一模型的训练语料仅是标注有情感倾向的语料,而不是标注有文本中所有情感关键词的语料,因此,语料标注的工作量较低。另外,由于本申请实施例是在识别获得目标文本的情感倾向后,再通过反向处理的方法从目标文本中获取影响目标文本情感倾向的第二情感关键词的,因而,情感关键词的提取不会受到训练语料中情感关键词的局限,使得情感关键词的提取更加具有灵活性和丰富性,提高了情感关键词的提取效果。应当理解,上述发明内容部分中所描述的内容并非旨在限定本申请的实施例的关键或重要特征,亦非用于限制本申请的范围。本公申请的其它特征将通过以下的描述变得容易理解。附图说明图1是本申请实施例提供的一种应用场景的示意图;图2是本申请实施例提供的一种情感关键词的获取方法的流程图;图3是本申请实施例提供的一种步骤S13的执行方法流程图;图4是本申请实施例提供的一种步骤S13的执行方法流程图;图5是本申请实施例提供的一种步骤S13的执行方法流程图;图6是本申请实施例提供的一种情感关键词的获取装置的结构示意图;图7是本申请实施例提供的一种情感关键词的获取装置的结构示意图;图8是本申请实施例提供的一种情感关键词的获取装置的结构示意图;图9是本申请实施例提供的一种情感关键词的获取装置的结构示意图。具体实施方式下面将参照附图更详细地描述本申请的实施例。虽然附图中显示了本申请的某些实施例,然而应当理解的是,本申请可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本申请。应当理解的是,本申请的附图及实施例仅用于示例性作用,并非用于限制本申请的保护范围。本申请实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等如果存在是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。图1是本申请实施例提供的一种应用场景的示意图,图1所称的用户评论比如,用户发表的微博评论,新闻评论等是指用户针对某个事物或某件事情所发表的看法,该看法中包括用户的情感,比如悲观、乐观、愤怒,高兴等。通过对用户评论进行分析,可以得到用户对某个事物或某件事情的情感倾向,进而达到掌握舆论走向的目的。目前,现有的分析方法一般是通过预设的关键词识别模型从用户评论中提取出情感关键词,再基于提取出的情感关键词分析获得用户对事物或事情的情感。然而在现有技术中,关键词识别模型一般需要大量的训练语料训练获得,并且在训练操作前需要提前标注好训练语料中的情感关键词,这就导致语料标注工作的工作量非常庞大,且耗时。并且依照这种方式训练获得的模型一般也只能提取出训练语料中所包含的情感关键词,训练语料之外的情感关键词一般无法提取,使得情感关键词提取的灵活性和丰富性受到限制。针对现有技术存在的上述缺陷,本申请实施例提供一种情感关键词的获取方法,该方法通过标注有情感倾向的训练语料训练获得第一模型,使用第一模型对待处理的目标文本进行处理,获得用于表达目标文本情感倾向的第一情感关键词,再基于预先获得的第二模型对第一情感关键词进行反向处理得到目标文本中影响目标文本情感倾向的第二情感关键词。由于在训练第一模型时只需要对训练语料的情感倾向进行标注,而不需要对文本中的所有情感关键词进行标注,因而能够降低语料标注的工作量。并且由于本申请实施例是通过反向处理的方法来获取目标文本中影响情感倾向的第二情感关键词的,因而,情感关键词的提取不会受到模型训练语料中情感关键词的局限,从而提高了情感关键词提取的灵活性和丰富性。以下结合具体实施例对本申请技术方案进行详细的描述。图2是本申请实施例提供的一种情感关键词的获取方法的流程图,该方法可以由一种情感关键词的获取装置来执行。参见图2,该方法包括步骤S11-S13:S11、获取待处理的目标文本。本实施例所涉及的目标文本表达了用户的某种情感比如,乐观、悲观、高兴,积极等,这里为了理解方便,可将本实施例中的目标文本示例性的理解为包含用户情感的评论信息或文章。本实施例中的目标文本可以指用户发表的原始文本,也可以指原始文本经过预设处理后得到的文本。比如,在一种可能的设计中可基于如下方法中的一种或多种处理得到目标文本:a、特殊字符过滤处理:用于从原始文本中将标点符号、特殊符号和或数字滤除。b、切词处理:用于对原始文本或者经过特殊字符过滤处理的文本进行切词处理,得到不同词性的词比如、动词、名词、形容词、副词、副形词、明形词等。c、词性筛选处理:用于从原始文本或者经过切词处理后的文本中筛选出预设词性的词比如,动词、名词、形容词、副词、副形词、明形词等。d、词频筛选处理:用于从原始文本或者词性筛选处理后得到的文本中提取获得词频在预设范围内的词,比如,提取词频大于或等于2或者词频小于或等于文本行数的词等。其中,当上述四种方法从a到d结合使用时,目标文本的获取方法可示例性的概括为:获取文本,从文本中提取获得预设词性的词,基于提取获得的预设词性的词,生成目标文本。其中,“基于提取获得的预设词性的词,生成目标文本”可进一步的表述为从提取获得的预设词性的词中提取词频在预设范围内的词,基于提取获得的词频在预设范围内的词,生成目标文本。示例的,假设提取获得的预设词性的词为:词a、词b、词c、词d、词a、词b、词c,则过滤掉词频小于2的词——“词d”,基于“词a、词b、词c”生成目标文本为“词a词b词c”,当然这里仅为示例说明,而不是对本申请的唯一限定。S12、基于预设的第一模型对所述目标文本进行处理,获得用于表达所述目标文本情感倾向的第一情感关键词,其中,所述第一模型是基于标注有情感倾向的语料训练获得的模型。本实施例中的第一模型可示例性的理解为卷积神经网络模型,第一模型对目标文本执行的处理可示例性的理解为正向卷积处理。第一模型可通过标注有情感倾向的语料训练获得,其中,本实施例所称的情感倾向的类型可以根据需要进行划分,且可以有多种,每个情感倾向可用用户指定的情感关键词进行表示,比如,积极乐观的情感倾向可以用“积极”或“乐观”来表示,消极悲观的情感倾向可以用“消极”或者“悲观”等词来表示,当然这里仅为示例说明而不是对本申请的唯一限定。其中,本实施例使用标注有情感倾向的语料训练第一模型,相较于使用标注有所有情感关键词的语料训练关键词识别模型,能够明显降低语料标注的工作量。举例来说,语料“##情感关键词1##情感关键词2##情感关键词3”包含乐观的情感倾向,那么在现有技术的训练方法中需要分别对“情感关键词1”、“情感关键词2”、“情感关键词3”进行标注,而本实施例只需将该语料标注为“乐观”即可。由此可见,本实施例的标注工作量要远远小于现有技术的标注工作量。当然这里仅为示例说明而不是对本申请的唯一限定。S13、基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,获得所述目标文本中影响所述目标文本情感倾向的第二情感关键词。本实施例中的第二模型可示例性的理解为反卷积神经网络模型,相对于第一模型来说,第二模型所执行的处理为第一模型的反向处理,例如当第一模型执行正向卷积处理时,第二模型执行反向卷积处理,第二模型的网络层数与第一模型的网络层数相同,即在第一模型中经过几层网络的卷积处理,那么在第二模型中相应的也需要进行几层网络的反卷积处理。在本实施例中,第二模型被训练用于基于某种情感倾向的情感关键词,反向获得具有类似或相同情感倾向的其他情感关键词。举例来说,假设目标文本为“##没有问题##越来越好”,经过第一模型识别处理后得到目标文本的情感倾向为“乐观,”,那么第二模型对“乐观”进行反向卷积处理,得到目标文本中影响表达“乐观”情感倾向的第二情感关键词包括“没有问题”和或“越来越好”。这样即使在第一模型只能识别目标文本情感倾向的前提下,也能够通过第二模型从目标文本中提取获得用于表达用户情感的情感关键词,且情感关键词的提取不会局限于训练语料中的情感关键词,提高了情感关键词提取的灵活性和丰富性。当然这里仅为示例说明而不是对本发明的唯一限定。本实施例通过获取待处理的目标文本,基于预设的第一模型对目标文本进行处理,获得用于表达目标文本情感倾向的第一情感关键词,其中第一模型是基于标注有情感倾向的语料训练获得的模型,从而基于预设的第二模型对第一情感关键词进行反向处理,获得目标文本中影响目标文本情感倾向的第二情感关键词。由于在本申请实施例中第一模型的训练语料仅是标注有情感倾向的语料,而不是标注有文本中所有情感关键词的语料,因此,语料标注的工作量较低。另外,由于本实施例是在识别获得目标文本的情感倾向后,再通过反向处理的方法从目标文本中获取影响目标文本情感倾向的第二情感关键词的,因而,情感关键词的提取不会受到训练语料中情感关键词的局限,使得情感关键词的提取更加具有灵活性和丰富性,提高了情感关键词的提取效果。下面对上述实施例进行进一步的优化和扩展。图3是本申请实施例提供的一种步骤S13的执行方法流程图,如图3所示,在图2实施例的基础上,该方法包括步骤S21-S22:S21、基于预设的第二模型对所述第一情感关键词进行反向处理,得到所述目标文本中的多个情感关键词的向量。S22、将所述多个情感关键词中向量模值大于第一预设阈值的确定为所述目标文本中影响所述目标文本情感倾向的第二情感关键词。基于现有关键词提取以及情感分析理论可知,文本中情感关键词的向量模值越大,对文本所表达的情感倾向的影像响越大。因此,本实施例在基于第二模型反向处理获得目标文本中的多个情感关键词的向量后,通过判断各情感关键词的向量模值来确定目标文本中对情感倾向影响较大的第二情感关键词。示例的,假设基于第二模型得到的多个情感关键词的向量分别为a1、b1、c1、a2、b2、c2、a3、b3、c3,则计算向量a1、b1、c1、a2、b2、c2、a3、b3、c3的模值分别为|v1|、|v2|、|v3|,其中,|v1|和|v2|大于第一预设阈值,|v3|小于第一预设阈值,则确定向量a1、b1、c1和a2、b2、c2对应的情感关键词是影响目标文本情感倾向的主要关键词。或者,也可以通过将向量a1、b1、c1、a2、b2、c2、a3、b3、c3输入预设的高斯滤波器,通过高斯滤波器筛选获得向量模值大于第一预设阈值的情感关键词,也就是说,在本实施例的一种可能的实现方式中,可通过对第二模型处理获得的多个情感关键词的向量进行高斯滤波处理来得到向量模值大于第一预设阈值的情感关键词。其中,第一预设阈值可以根据需要进行设置,本实施例中不做限定,当然上述仅为示例说明而不是对本申请的唯一限定。本实施例在基于第二模型反向处理获得多个情感关键词的向量后,通过将各向量的模值与第一预设阈值进行比较,将向量模值大于第一预设阈值的情感关键词作为影响目标文本情感倾向的第二情感关键词,实现了对情感关键词的精准筛选,提高了情感关键词提取的准确性。图4是本申请实施例提供的一种步骤S13的执行方法流程图,如图4所示,在图2实施例的基础上,该方法包括步骤S31-S32:S31、基于预设的第二模型对所述第一情感关键词进行反向处理,得到所述目标文本中的多个情感关键词的向量,并计算所述目标文本的向量。S32、分别计算所述多个情感关键词中的每个情感关键词的向量模值与所述目标文本的向量模值之间的差值绝对值,将对应的差值绝对值大于第二预设阈值的情感关键词确定为所述目标文本中影响所述目标文本情感倾向的第二情感关键词。基于现有关键词提取以及情感分析理论可知,情感关键词的向量模值与文本的向量模值之间的差值绝对值越大,情感关键词对文本所表达的情感倾向的影响越大。因此,本实施例在基于第二模型反向处理获得目标文本中的多个情感关键词的向量后,通过计算所各情感关键词的向量模值与目标文本的向量模值之间的差值绝对值来确定对目标文本情感倾向影响较大的第二情感关键词。仍以上例为例,假设基于第二模型得到的多个情感关键词的向量分别为a1、b1、c1、a2、b2、c2、a3、b3、c3,则分别计算向量a1、b1、c1、a2、b2、c2、a3、b3、c3的模值|v1|、|v2|、|v3|以及目标文本的向量模值|v4|,其中,||v1|-|v4||、||v2|-|v4||大于第二预设阈值,||v3|-|v4||小于第二预设阈值,则确定向量a1、b1、c1和a2、b2、c2对应的情感关键词是影响目标文本情感倾向的主要关键词。其中,第二预设阈值可以根据需要进行设置,本实施例中不做限定,当然上述仅为示例说明而不是对本申请的唯一限定。本实施例在基于第二模型反向处理获得多个情感关键词的向量后,通过将各向量模值与目标文本的向量模值的差值绝对值与第二预设阈值进行比较,将向量模值与目标文本的向量模值的差值绝对值大于第二预设阈值的情感关键词作为影响目标文本情感倾向的第二情感关键词,实现了对情感关键词的精准筛选,提高了情感关键词提取的准确性。图5是本申请实施例提供的一种步骤S13的执行方法流程图,如图5所示,在图2实施例的基础上,该方法包括步骤S41-S42:S41、基于预设的第二模型对所述第一情感关键词进行反向处理,得到所述目标文本中的多个情感关键词的向量。S42、基于所述多个情感关键词在所述目标文本中的位置,计算所述多个情感关键词中相邻两个情感关键词之间的向量模值的差值绝对值,将对应差值绝对值大于第三预设阈值的两个情感关键词确定为所述目标文本中影响所述目标文本情感倾向的第二情感关键词。基于现有关键词提取以及情感分析理论可知,在文本中位置相邻的两个情感关键词,它们之间的向量模值的差值绝对值越大对文本所表达的情感倾向的影像响越大。因此,本实施例在基于第二模型反向处理获得目标文本中的多个情感关键词的向量后,通过计算上述差值绝对值来确定对目标文本情感倾向影响较大的第二情感关键词。仍以上例为例,假设基于第二模型得到的多个情感关键词的向量分别为a1、b1、c1、a2、b2、c2、a3、b3、c3,其中,在目标文本中a1、b1、c1和a2、b2、c2的位置相邻,a2、b2、c2和a3、b3、c3的位置相邻,分别计算向量a1、b1、c1、a2、b2、c2、a3、b3、c3的模值得到|v1|、|v2|、|v3|,其中,||v1|-|v2||大于第三预设阈值,||v2|-|v3||小于第三预设阈值,则确定向量a1、b1、c1和a2、b2、c2对应的情感关键词是影响目标文本情感倾向的主要关键词。其中,第三预设阈值可以根据需要进行设置,本实施例中不做限定,当然上述仅为示例说明而不是对本申请的唯一限定。本实施例在基于第二模型反向处理获得多个情感关键词的向量后,通过计算位置相邻的两个情感关键词的向量模值的差值绝对值,并将差值绝对值大于第三预设阈值的情感关键词作为影响目标文本情感倾向的第二情感关键词,实现了对情感关键词的精准筛选,提高了情感关键词提取的准确性。图6是本申请实施例提供的一种情感关键词的获取装置的结构示意图,如图6所示,装置50包括:获取模块51,用于获取待处理的目标文本。情感倾向识别模块52,用于基于预设的第一模型对所述目标文本进行正向处理,获得用于表达所述目标文本情感倾向的第一情感关键词,其中,所述第一模型是基于标注有情感倾向的语料训练获得的模型。情感关键词提取模块53,用于基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,获得所述目标文本中影响所述目标文本情感倾向的第二情感关键词。在一种可能的设计中,所述获取模块51,包括:提取子模块,用于获取文本,并从所述文本中提取获得预设词性的词。生成子模块,用于基于提取获得的所述预设词性的词,生成目标文本。在一种可能的设计中,所述生成子模块,具体用于:从提取获得的所述预设词性的词中提取词频在预设范围内的词;基于提取获得的词频在预设范围内的词,生成目标文本。本实施例提供的装置能够用于执行图2实施例的方法,其执行方式和有益效果类似,在这里不再赘述。图7是本申请实施例提供的一种情感关键词的获取装置的结构示意图,如图7所示,在图6实施例的基础上,情感关键词提取模块53,包括:第一处理子模块531,用于基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,得到所述目标文本中的多个情感关键词的向量。第一确定子模块532,用于将所述多个情感关键词中向量模值大于第一预设阈值的确定为所述目标文本中影响所述目标文本情感倾向的第二情感关键词。在一种可能的设计中,所述第一确定子模块532,具体用于:对所述多个情感关键词的向量进行高斯滤波处理,得到向量模值大于第一预设阈值的第二情感关键词。本实施例提供的装置能够用于执行图3实施例的方法,其执行方式和有益效果类似,在这里不再赘述。图8是本申请实施例提供的一种情感关键词的获取装置的结构示意图,如图8所示,在图6实施例的基础上,情感关键词提取模块53,包括:第一处理子模块531,用于基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,得到所述目标文本中的多个情感关键词的向量,并计算所述目标文本的向量;第二确定子模块533,用于分别计算所述多个情感关键词中的每个情感关键词的向量模值与所述目标文本的向量模值之间的差值绝对值,将对应的差值绝对值大于第二预设阈值的情感关键词确定为所述目标文本中影响所述目标文本情感倾向的第二情感关键词。本实施例提供的装置能够用于执行图4实施例的方法,其执行方式和有益效果类似,在这里不再赘述。图9是本申请实施例提供的一种情感关键词的获取装置的结构示意图,如图9所示,在图6实施例的基础上,情感关键词提取模块53,包括:第一处理子模块531,用于基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,得到所述目标文本中的多个情感关键词的向量.第三确定子模块534,用于基于所述多个情感关键词在所述目标文本中的位置,计算所述多个情感关键词中相邻两个情感关键词之间的向量模值的差值绝对值,将对应差值绝对值大于第三预设阈值的两个情感关键词确定为所述目标文本中影响所述目标文本情感倾向的第二情感关键词。本实施例提供的装置能够用于执行图5实施例的方法,其执行方式和有益效果类似,在这里不再赘述。本申请实施例还提供一种计算机设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任一实施例所述的方法。本申请实施例还提供在一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一实施例所述的方法。本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:场可编程门阵列FPGA、专用集成电路ASIC、专用标准产品ASSP、芯片上系统的系统SOC、负载可编程逻辑设备CPLD等等。用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和或框图中所规定的功能操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器RAM、只读存储器ROM、可擦除可编程只读存储器EPROM或快闪存储器、光纤、便捷式紧凑盘只读存储器CD-ROM、光学储存设备、磁储存设备、或上述内容的任何合适组合。此外,虽然采用特定次序描绘了各操作,但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行,或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地,在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。尽管已经采用特定于结构特征和或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

权利要求:1.一种情感关键词的获取方法,其特征在于,包括:获取待处理的目标文本;基于预设的第一模型对所述目标文本进行处理,获得用于表达所述目标文本情感倾向的第一情感关键词,其中,所述第一模型是基于标注有情感倾向的语料训练获得的模型;基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,获得所述目标文本中影响所述目标文本情感倾向的第二情感关键词。2.根据权利要求1所述的方法,其特征在于,所述基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,获得所述目标文本中影响所述目标文本情感倾向的第二情感关键词,包括:基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,得到所述目标文本中的多个情感关键词的向量;将所述多个情感关键词中向量模值大于第一预设阈值的确定为所述目标文本中影响所述目标文本情感倾向的第二情感关键词。3.根据权利要求2所述的方法,其特征在于,所述将所述多个情感关键词中向量模值大于第一预设阈值的确定为所述目标文本中影响所述目标文本情感倾向的第二情感关键词,包括:对所述多个情感关键词的向量进行高斯滤波处理,得到向量模值大于第一预设阈值的第二情感关键词。4.根据权利要求1所述的方法,其特征在于,所述基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,获得所述目标文本中影响所述目标文本情感倾向的第二情感关键词,包括:基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,得到所述目标文本中的多个情感关键词的向量,并计算所述目标文本的向量;分别计算所述多个情感关键词中的每个情感关键词的向量模值与所述目标文本的向量模值之间的差值绝对值,将对应的差值绝对值大于第二预设阈值的情感关键词确定为所述目标文本中影响所述目标文本情感倾向的第二情感关键词。5.根据权利要求1所述的方法,其特征在于,所述基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,获得所述目标文本中影响所述目标文本情感倾向的第二情感关键词,包括:基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,得到所述目标文本中的多个情感关键词的向量;基于所述多个情感关键词在所述目标文本中的位置,计算所述多个情感关键词中相邻两个情感关键词之间的向量模值的差值绝对值,将对应差值绝对值大于第三预设阈值的两个情感关键词确定为所述目标文本中影响所述目标文本情感倾向的第二情感关键词。6.根据权利要求1-5中任一项所述的方法,其特征在于,所述获取待处理的目标文本,包括:获取文本,并从所述文本中提取获得预设词性的词;基于提取获得的所述预设词性的词,生成目标文本。7.根据权利要求6所述的方法,其特征在于,所述基于提取获得的所述预设词性的词,生成目标文本,包括:从提取获得的所述预设词性的词中提取词频在预设范围内的词;基于提取获得的词频在预设范围内的词,生成目标文本。8.一种情感关键词的获取装置,其特征在于,包括:获取模块,用于获取待处理的目标文本;情感倾向识别模块,用于基于预设的第一模型对所述目标文本进行处理,获得用于表达所述目标文本情感倾向的第一情感关键词,其中,所述第一模型是基于标注有情感倾向的语料训练获得的模型;情感关键词提取模块,用于基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,获得所述目标文本中影响所述目标文本情感倾向的第二情感关键词。9.根据权利要求8所述的装置,其特征在于,所述情感关键词提取模块,包括:第一处理子模块,用于基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,得到所述目标文本中的多个情感关键词的向量;第一确定子模块,用于将所述多个情感关键词中向量模值大于第一预设阈值的确定为所述目标文本中影响所述目标文本情感倾向的第二情感关键词。10.根据权利要求9所述的装置,其特征在于,所述第一确定子模块,具体用于:对所述多个情感关键词的向量进行高斯滤波处理,得到向量模值大于第一预设阈值的第二情感关键词。11.根据权利要求8所述的装置,其特征在于,所述情感关键词提取模块,包括:第一处理子模块,用于基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,得到所述目标文本中的多个情感关键词的向量,并计算所述目标文本的向量;第二确定子模块,用于分别计算所述多个情感关键词中的每个情感关键词的向量模值与所述目标文本的向量模值之间的差值绝对值,将对应的差值绝对值大于第二预设阈值的情感关键词确定为所述目标文本中影响所述目标文本情感倾向的第二情感关键词。12.根据权利要求8所述的装置,其特征在于,所述情感关键词提取模块,包括:第一处理子模块,用于基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,得到所述目标文本中的多个情感关键词的向量;第三确定子模块,用于基于所述多个情感关键词在所述目标文本中的位置,计算所述多个情感关键词中相邻两个情感关键词之间的向量模值的差值绝对值,将对应差值绝对值大于第三预设阈值的两个情感关键词确定为所述目标文本中影响所述目标文本情感倾向的第二情感关键词。13.根据权利要求8-12中任一项所述的装置,其特征在于,所述获取模块,包括:提取子模块,用于获取文本,并从所述文本中提取获得预设词性的词;生成子模块,用于基于提取获得的所述预设词性的词,生成目标文本。14.根据权利要求13所述的装置,其特征在于,所述生成子模块,具体用于:从提取获得的所述预设词性的词中提取词频在预设范围内的词;基于提取获得的词频在预设范围内的词,生成目标文本。15.一种计算机设备,其特征在于,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实执行如权利要求1-7中任一项所述的方法。16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时执行如权利要求1-7中任一项所述的方法。

百度查询: 北京百度网讯科技有限公司 情感关键词的获取方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。