买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】文本的情感分析方法、装置、存储介质及设备_腾讯科技(深圳)有限公司_201910678838.9 

申请/专利权人:腾讯科技(深圳)有限公司

申请日:2019-07-25

公开(公告)日:2022-11-29

公开(公告)号:CN110377915B

主分类号:G06F40/211

分类号:G06F40/211;G06F40/284

优先权:

专利状态码:有效-授权

法律状态:2022.11.29#授权;2019.11.19#实质审查的生效;2019.10.25#公开

摘要:本申请实施例公开了一种文本的情感分析方法、装置、存储介质及设备,属于计算机技术领域。所述方法包括:获取待分析的文本和所述文本中的目标词,所述目标词表示所述文本中的目标对象;根据所述文本的第一特征向量生成第一向量集合,所述第一向量集合中的每个第一向量是从所述第一特征向量中提取到的;根据所述目标词的第二特征向量生成第二向量集合,所述第二向量集合中的每个第二向量是从所述第二特征向量中提取到的;对所述第一向量集合和所述第二向量集合进行集成学习,得到所述目标词的情感极性。本申请实施例可以提高目标词的情感极性的准确性。

主权项:1.一种文本的情感分析方法,其特征在于,所述方法包括:获取待分析的文本和所述文本中的目标词,所述目标词表示所述文本中的目标对象;其中,通过模型对所述文本进行情感分析,所述模型包括第一词嵌入层、卷积层、第一随机选择层、第二词嵌入层、第二随机选择层、多头随机选择分类器和归一化层;通过所述第一词嵌入层和所述卷积层,获取所述文本对应的第一特征向量;通过所述第二词嵌入层获取所述目标词对应的第二特征向量;通过所述第一随机选择层,根据所述文本对应的第一特征向量生成第一向量集合,所述第一向量集合中的每个第一向量是从所述第一特征向量中提取到的;通过所述第二随机选择层,根据所述目标词对应的第二特征向量生成第二向量集合,所述第二向量集合中的每个第二向量是从所述第二特征向量中提取到的;通过所述多头随机选择分类器和所述归一化层,对所述第一向量集合和所述第二向量集合进行集成学习,得到所述目标词的情感极性。

全文数据:文本的情感分析方法、装置、存储介质及设备技术领域本申请实施例涉及计算机技术领域,特别涉及一种文本的情感分析方法、装置、存储介质及设备。背景技术文本的情感分析是指分析文本中不同目标词的情感极性。其中,目标词表示文本中的目标对象。情感极性表示情感倾向性,可以包括积极情感、消极情感、中立情感等等。比如,文本是“Goodfoodbutdreadfulserviceatthatrestaurant”,则可以得到目标词“food”的情感极性是积极情感,目标词“service”的情感极性是消极情感。相关技术中,可以将文本和该文本中的目标词输入机器学习模型,机器学习模型可以对文本依次进行词嵌入处理和卷积处理,得到卷积结果;对目标词进行词嵌入处理,得到词向量;利用门控单元GTRU对卷积结果和词向量进行结合,对门控单元的输出结果依次进行池化处理和归一化处理,得到该目标词的情感极性。门控单元采用近线性方式对卷积结果和词向量进行结合,使得特征提取较为简单,忽略了目标词和语义信息之间的关联,且输出结果主要由语义信息决定,忽略了目标词对情感极性的影响,从而导致目标词的情感极性不准确。发明内容本申请实施例提供了一种文本的情感分析方法、装置、存储介质及设备,用于解决通过门控单元来结合卷积结果和词向量时,使得目标词的情感极性不准确的问题。所述技术方案如下:一方面,提供了一种文本的情感分析方法,所述方法包括:获取待分析的文本和所述文本中的目标词,所述目标词表示所述文本中的目标对象;根据所述文本的第一特征向量生成第一向量集合,所述第一向量集合中的每个第一向量是从所述第一特征向量中提取到的;根据所述目标词的第二特征向量生成第二向量集合,所述第二向量集合中的每个第二向量是从所述第二特征向量中提取到的;对所述第一向量集合和所述第二向量集合进行集成学习,得到所述目标词的情感极性。一方面,提供了一种文本的情感分析装置,所述装置包括:获取模块,用于获取待分析的文本和所述文本中的目标词,所述目标词表示所述文本中的目标对象;第一生成模块,用于根据所述获取模块得到的所述文本的第一特征向量生成第一向量集合,所述第一向量集合中的每个第一向量是从所述第一特征向量中提取到的;第二生成模块,用于根据所述获取模块得到的所述目标词的第二特征向量生成第二向量集合,所述第二向量集合中的每个第二向量是从所述第二特征向量中提取到的;集成学习模块,用于对所述第一向量集合和所述第二向量集合进行集成学习,得到所述目标词的情感极性。一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上所述的文本的情感分析方法。一方面,提供了一种文本的情感分析设备,所述文本的情感分析设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如上所述的文本的情感分析方法。本申请实施例提供的技术方案的有益效果至少包括:由于第一向量集合中的每个第一向量是从文本的第一特征向量中提取到的,第二向量集合中的每个第二向量是从目标词的第二特征向量中提取到的,所以,第一向量可以代表语义信息,第二向量可以代表目标词,而集成学习可以对每个第一向量和每个第二向量进行结合,使得到的情感极性能够综合考虑目标词和语义信息之间的关联以及目标词对情感极性的影响,从而提高目标词的情感极性的准确性。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据部分示例性实施例示出的一种文本的情感分析系统的结构示意图;图2是本申请一个实施例提供的文本的情感分析方法的方法流程图;图3是本申请另一实施例提供的文本的情感分析方法的方法流程图;图4是本申请另一实施例提供的模型的结构示意图;图5是本申请一个实施例提供的文本的情感分析装置的结构框图;图6是本申请再一实施例提供的文本的情感分析装置的结构框图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。下面对本申请涉及的名词进行解释。目标词:目标词表示文本中的目标对象,该目标对象是能够赋予情感的客体。比如,文本是一条对餐厅的服务、口味、价位做出评价的评论,则目标词可以包括服务、口味和价位。又比如,文本是一条对汽车的动力和油耗做出评价的评论,则目标词可以包括动力和油耗。情感极性:情感极性可以包括积极情感positive、消极情感negative、中立情感neutral、冲突情感conflict中的至少一种。其中,积极情感可以理解为褒义情感,比如“流畅”、“开心”等。消极情感可以理解为贬义情感,比如“不流畅”、“失望”等。中立情感可以理解为不褒不贬的客观情感,比如“流畅度一般”等。冲突情感也可以称为矛盾情感。深度学习:深度学习是指基于对数据进行表征学习的机器学习方法。深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。近年来,特定目标情感分析作为更深层次的情感分析任务,已成为自然语言处理领域的研究热点之一。和普通情感分析不同,特定目标情感分析需要针对文本中不同的目标对象来分析其情感极性,这不仅依赖于文本的上下文信息,同时也要考虑文本中不同目标对象的情感信息。例如文本是“Goodfoodbutdreadfulserviceatthatrestaurant”,目标词“food”的情感极性是积极情感,而目标词“service”的情感极性是消极情感,所以,在同一个文本中不同的目标词可能会对应相反的情感极性。在过去的研究中,传统的机器学习方法在普通情感分析任务中取得了令人瞩目的成功,但其需要依赖复杂的人工规则和特征工程,而且同一文本中的不同目标词往往被预测为具有相同的情感极性,从而影响情感分析的准确性。因此,深度学习方法被越来越多地应用到自然语言处理领域。集成学习:集成学习是指使用多个学习器进行学习,并使用某种规则把各个学习结果进行整合,从而获得比单个学习器更好的学习效果的一种机器学习方法。下面对本申请的应用场景进行介绍。本申请应用于对文本中的目标词的情感极性进行分析的应用场景中。其中,文本可以是用户发表的评价,该评价可以针对任何物品或对象,本实施例不作限定。下面对用户经常发表的几种评价进行说明。1、当文本是针对餐厅、游乐场、电影院、车站、医院等公共场所的评价时,可以根据情感分析对公共场所提供的服务、设施等各方面进行评估,以供其他用户进行参考。2、当文本是针对产品的评价时,可以根据情感分析对产品的各个功能的好评度进行评估,从而便于开发人员选择关键的功能进行优化。3、当文本是针对影视作品、文学作品的评价时,可以根据情感分析对作品的情节、影射内容等各方面进行评估,以便其他用户理解作品。值得注意的是,本申请实施例可以实现在终端中,也可以实现在服务器中,还可以由终端和服务器共同实现,如图1所示,终端11用于生成文本,并将该文本发送至服务器12,服务器12对该文本进行情感分析后,将情感极性发送至终端11进行展示。可选地,终端11与服务器12之间通过通信网络进行连接,该通信网络可以是有线网络也可以是无线网络,本申请实施例对此不加以限定。示意性的,服务器12中存储有用于情感分析的模型,用户在终端11中输入文本“Goodfoodbutdreadfulserviceatthatrestaurant”后,终端11将该文本发送至服务器12,由服务器12对该文本通过模型进行情感分析后得到各个目标词的情感极性,并将各个目标词的情感极性发送至终端11进行展示。相关技术中,在得到文本的卷积结果和目标词的词向量后,可以通过门控单元对卷积结果和词向量进行结合。由于门控单元是GTRU,且GTRU包括Tanh函数和Relu函数,而Tanh函数和Relu函数都是近线性函数,所以,门控单元采用近线性方式对卷积结果和词向量进行结合,这就使得特征提取较为简单,从而忽略了目标词和语义信息之间的关联,且输出结果主要由语义信息决定,忽略了目标词对情感极性的影响,从而导致目标词的情感极性不准确。本申请实施例采用集成学习加深度学习的方式对文本进行情感分析,通过深度学习得到文本对应的第一向量集合和目标词对应的第二向量集合,再通过集成学习对每个第一向量和每个第二向量进行结合,使得到的情感极性能够综合考虑目标词和语义信息之间的关联以及目标词对情感极性的影响,从而提高目标词的情感极性的准确性。请参考图2,其示出了本申请一个实施例提供的文本的情感分析方法的方法流程图,该文本的情感分析方法可以应用于图1所示的终端或服务器中。该文本的情感分析方法,包括:步骤201,获取待分析的文本和文本中的目标词,该目标词表示文本中的目标对象。当需要对一个语句进行情感分析时,可以将该语句作为待分析的文本;当需要对多个语句进行情感分析时,可以将每个语句作为待分析的文本。待分析的文本中的目标词是从文本中提取到的。其中,目标词可以是将文本输入目标词提取模型中,通过目标词提取模型得到的;也可以是人为从文本中提取得到的,本实施例不作限定。需要说明的是,一个文本中可能会包括至少一个目标词。当文本中包括一个目标词时,可以执行步骤201-204来得到该目标词的情感极性;当文本中包括至少两个目标词时,可以先选择一个目标词,执行步骤201-204来得到该目标词的情感极性,再选择下一个目标词,执行步骤201-204来得到下一个目标词的情感极性,依此类推,直至得到最后一个目标词的情感极性后停止循环。步骤202,根据文本的第一特征向量生成第一向量集合,该第一向量集合中的每个第一向量是从第一特征向量中提取到的。本实施例中,可以利用深度学习方法对文本进行特征提取,得到第一特征向量,再从该第一特征向量中提取第一向量,将所有的第一向量组成第一向量集合。其中,第一向量的维数小于第一特征向量的维数。步骤203,根据目标词的第二特征向量生成第二向量集合,该第二向量集合中的每个第二向量是从第二特征向量中提取到的。本实施例中,可以采用深度学习方法对目标词进行特征提取,得到第二特征向量,再从该第二特征向量中提取第二向量,将所有的第二向量组成第二向量集合。其中,第二向量的维数小于第二特征向量的维数。需要说明的是,本实施例不限定步骤202和203的先后执行顺序。即,可以先执行步骤202,再执行步骤203;也可以先执行步骤203,再执行步骤202;还可以同时执行步骤202和203。步骤204,对第一向量集合和第二向量集合进行集成学习,得到目标词的情感极性。本实施例中预设有多个用于集成学习的处理单元,在得到第一向量集合和第二向量集合后,可以分别将第一向量集合中的每个第一向量和第二向量集合中的每个第二向量输入每个处理单元中,按照预设规则对每个处理单元的处理结果进行再次处理,得到目标词的情感极性。比如,文本是“Goodfoodbutdreadfulserviceatthatrestaurant”,且该文本中包含目标词“food”和“service”,则可以先针对该文本和“food”执行步骤202-204,得到“food”的情感极性是积极情感;再针对该文本和“service”执行步骤202-204,得到“service”的情感极性是消极情感。综上所述,本申请实施例提供的文本的情感分析方法,由于第一向量集合中的每个第一向量是从文本的第一特征向量中提取到的,第二向量集合中的每个第二向量是从目标词的第二特征向量中提取到的,所以,第一向量可以代表语义信息,第二向量可以代表目标词,而集成学习可以对每个第一向量和每个第二向量进行结合,使得到的情感极性能够综合考虑目标词和语义信息之间的关联以及目标词对情感极性的影响,从而提高目标词的情感极性的准确性。请参考图3,其示出了本申请另一实施例提供的文本的情感分析方法的方法流程图,该文本的情感分析方法可以应用于图1所示的终端或服务器中。该文本的情感分析方法,包括:步骤301,获取待分析的文本和文本中的目标词,该目标词表示文本中的目标对象。当需要对一个语句进行情感分析时,可以将该语句作为待分析的文本;当需要对多个语句进行情感分析时,可以将每个语句作为待分析的文本。待分析的文本中的目标词是从文本中提取到的。其中,目标词可以是将文本输入目标词提取模型中,通过目标词提取模型得到的;也可以是人为从文本中提取得到的,本实施例不作限定。需要说明的是,一个文本中可能会包括至少一个目标词。当文本中包括一个目标词时,可以执行步骤302-309来得到该目标词的情感极性;当文本中包括至少两个目标词时,可以先选择一个目标词,执行步骤302-309来得到该目标词的情感极性,再选择下一个目标词,执行步骤302-309来得到下一个目标词的情感极性,依此类推,直至得到最后一个目标词的情感极性后停止循环。本实施例中,可以采用深度学习方法分别对文本和目标词进行处理,其中,可以通过步骤302-304实现对文本的处理,通过步骤305-306实现对目标词的处理,详见下文中的描述。本实施例不限定步骤302-304和305-306的先后执行顺序。即,可以先执行步骤302-304,再执行步骤305-306;也可以先执行步骤305-306,再执行步骤302-304;还可以同时执行步骤302-304和305-306。步骤302,依次对文本进行词嵌入处理和卷积处理,得到卷积结果。本实施例中可以采用卷积神经网络ConvolutionalNeuralNetworks,CNN对文本进行深度学习。在一个可选的实施例中,卷积神经网络包括词嵌入层和卷积层,则可以将文本s先输入词嵌入层,通过词嵌入层对文本a进行词嵌入处理,得到文本a中各个词汇的词向量Ws;再将词向量Ws输入卷积层,通过卷积层对词向量Ws进行卷积处理,得到卷积结果Vs。步骤303,将卷积结果中的每个矩阵转换成向量,将所有的向量相连,得到第一特征向量。由于卷积结果中包含的是矩阵,所以,还可以将每个矩阵转换成向量后相连,得到第一特征向量。其中,将矩阵转换成向量的转换方式有很多种。比如,可以将矩阵中不同行的元素连成一行,得到一个行数为1的向量;或者,可以将矩阵中不同列的元素连成一列,得到一个列数为1的向量。为了便于理解,下面以将矩阵转换成一个行数为1的向量进行举例说明。假设第一矩阵为第二矩阵为则对第一矩阵进行转换得到的向量为[1234],对第二矩阵进行转换得到的向量为[5678],第一特征向量为[12345678]。步骤304,若第一特征向量的维度为n,则从第一特征向量中随机选择m个q维的第一向量,将m个第一向量组成第一向量集合,q<n。其中,n为正整数,m为正整数,且q为小于n的正整数。本实施例中,还可以设置随机选择层,通过随机选择层从第一特征向量所包含的n个元素中任意选择q个元素,将该q个元素组成一个第一向量。其中,所选的q个元素的位置可以相邻,也可以不相邻,本实施例不作限定。在一个可选的实施例中,q可以为n的一半,即,q=n2。比如,第一特征向量为[12345678],q为4,则得到的第一向量可以是[1234]、[3456]、[2468]、[1568]等等。在得到m个第一向量后,可以将该m个第一向量组成第一向量集合Rs。步骤305,对目标词进行词嵌入处理,得到第二特征向量。本实施例中,可以将目标词a输入词嵌入层,通过词嵌入层对目标词a进行词嵌入处理,得到目标词a的词向量Wa。需要说明的是,第二特征向量与第一特征向量的维数相等。步骤306,若第二特征向量的维度为n,从第二特征向量中随机选择m个q维的第二向量,将m个第二向量组成第二向量集合。本实施例中,可以从第二特征向量所包含的n个元素中任意选择q个元素,将该q个元素组成一个第二向量。其中,所选的q个元素的位置可以相邻,也可以不相邻,本实施例不作限定。在得到m个第二向量后,可以将该m个第二向量组成第二向量集合Ra。步骤307,若第一向量集合包括p个第一向量且第二向量集合包括p个第二向量,则将第一向量集合中的第i个第一向量和第二向量集合中的第j个第二向量输入k个处理单元中,从k个处理单元输出的k个处理结果中选择一个目标处理结果。其中,p为正整数,i和j均小于等于p,k为大于等于2的正整数。本实施例中,还可以设置多头随机选择分类器Multi-head-bagging-classifier,该多头随机选择分类器可以包括k个处理单元,每个处理单元可以用任意网络结构实现,本实施例不作限定。当将第i个第一向量和第j个第二向量分别输入k个处理单元中时,每个处理单元会输出一个处理结果,可以从得到的k个处理结果中选择一个处理结果作为目标处理结果。在一个可选的实施例中,从k个处理单元输出的k个处理结果中选择一个目标处理结果,包括:统计k个处理单元输出的k个处理结果中同种处理结果的数量;将数量最多的一种处理结果作为目标处理结果。假设k为5,且这5个处理单元输出的处理结果分别为:处理结果1、处理结果2、处理结果2、处理结果2、处理结果2,则可以统计得到处理结果1的数量为1,处理结果2的数量为4,将处理结果2作为目标处理结果。步骤308,将i更新为i+1,j更新为j+1,继续执行将第一向量集合中的第i个第一向量和第二向量集合中的第j个第二向量输入k个处理单元中的步骤,直至得到第p个第一向量和第p个第二向量对应的目标处理结果后停止。假设p为3,则第一向量集合包括3个第一向量,第二向量集合包括3个第二向量,可以通过k个处理单元对第一个第一向量和第一个第二向量进行处理,得到第一个目标处理结果;通过k个处理单元对第一个第一向量和第二个第二向量进行处理,得到第二个目标处理结果;通过k个处理单元对第一个第一向量和第三个第二向量进行处理,得到第三个目标处理结果;通过k个处理单元对第二个第一向量和第二个第二向量进行处理,得到第四个目标处理结果;依此类推,直至通过k个处理单元对第三个第一向量和第三个第二向量进行处理,得到第九个目标处理结果后停止循环。在停止循环后,可以将所有的目标处理结果作为多头随机选择分类器的输出。通常,多头随机选择分类器的输出可以表示为H。步骤309,对所有的目标处理结果进行归一化处理,得到目标词的情感极性。本实施例中,还可以设置归一化层,通过归一化层对所有的目标处理结果进行归一化处理,得到目标词对应于每种情感极性的概率。最后将概率最大的情感极性作为目标词的情感极性。这里所说的归一化层可以是softmax层,则步骤309可以表示为Y=softmaxH,其中,H表示多头随机选择分类器的输出,Y表示目标词的情感极性。比如,文本是“Goodfoodbutdreadfulserviceatthatrestaurant”,且该文本中包含目标词“food”和“service”,则可以先针对该文本和“food”执行步骤202-204,得到“food”的情感极性是积极情感;再针对该文本和“service”执行步骤202-204,得到“service”的情感极性是消极情感。综上所述,本申请实施例提供的文本的情感分析方法,由于第一向量集合中的每个第一向量是从文本的第一特征向量中提取到的,第二向量集合中的每个第二向量是从目标词的第二特征向量中提取到的,所以,第一向量可以代表语义信息,第二向量可以代表目标词,而集成学习可以对每个第一向量和每个第二向量进行结合,使得到的情感极性能够综合考虑目标词和语义信息之间的关联以及目标词对情感极性的影响,从而提高目标词的情感极性的准确性。由于卷积神经网络支持并行运算,所以,可以提高对文本的情感分析的效率。上述方法可以通过一个用于进行文本的情感分析的模型实现,请参考图4所示的模型的结构图,该模型包括第一词嵌入层WordEmbedding、卷积层Convolution、第一随机选择层RandomSelector、第二词嵌入层AspectEmbedding、第二随机选择层RandomSelector、多头随机选择分类器Multi-head-bagging-classifier和归一化层Softmax。在使用模型进行情感分析时,可以将文本输入第一词嵌入层,第一词嵌入层向卷积层输出文本的词向量,卷积层向第一随机选择层输出第一特征向量,第一随机选择层向多头随机选择分类器输出第一向量集合;将目标词输入第二词嵌入层,第二词嵌入层向第二随机选择层输出目标词的第二特征向量,第二随机选择层向多头随机选择分类器输出第二向量集合;多头随机选择分类器向归一化层输出所有的目标处理结果;归一化层向外输出目标词的情感极性。其中,图4中的Baseencoder即为多头随机选择分类器中的处理单元。上述模型使用的AutoEncoder结构可以利用CNN替代传统的LSTMLongshort-termmemory,长短期记忆,从而在提升了可并行性和训练速度的前提下,还保证了语义信息和目标信息之间交互的复杂性,保证了模型结构有捕捉到两者之间复杂关系的能力,在拆解、重构的过程中充分融合语义信息和目标信息。在使用模型之前,还需要对模型进行训练。在使用SGDstochasticgradientdescent,随机梯度下降优化器训练模型时,可以将学习率Learning_rate设置为1e-3,将L2设置为1e-3,将迭代次数Epoch设置为10。需要说明的是,学习率是与数据集相关的,这里所例举的学习率是基于Restaurant数据集的学习率,请参考表一所示的Restaurant数据集。表一表二示出了各种模型在Restaurant数据集上的实验结果。表二中将本实施例中的模型称为MHB-CNN,通过对比可以发现,本实施例中的模型的情感分析的效果最好。表二请参考图5,其示出了本申请一个实施例提供的文本的情感分析装置的结构框图,该文本的情感分析装置可以应用于图1所示的终端或服务器中。该文本的情感分析装置,包括:获取模块510,用于获取待分析的文本和文本中的目标词,该目标词表示文本中的目标对象;第一生成模块520,用于根据获取模块510得到的文本的第一特征向量生成第一向量集合,该第一向量集合中的每个第一向量是从第一特征向量中提取到的;第二生成模块530,用于根据获取模块510得到的目标词的第二特征向量生成第二向量集合,该第二向量集合中的每个第二向量是从第二特征向量中提取到的;集成学习模块540,用于对第一向量集合和第二向量集合进行集成学习,得到目标词的情感极性。在一个可选的实施例中,若第一向量集合包括p个第一向量且第二向量集合包括p个第二向量,p为正整数,则集成学习模块540,还用于:将第一向量集合中的第i个第一向量和第二向量集合中的第j个第二向量输入k个处理单元中,从k个处理单元输出的k个处理结果中选择一个目标处理结果,i和j均小于等于p,k为大于等于2的正整数;将i更新为i+1,j更新为j+1,继续执行将第一向量集合中的第i个第一向量和第二向量集合中的第j个第二向量输入k个处理单元中的步骤,直至得到第p个第一向量和第p个第二向量对应的目标处理结果后停止;对所有的目标处理结果进行归一化处理,得到目标词的情感极性。在一个可选的实施例中,集成学习模块540,还用于:统计k个处理单元输出的k个处理结果中同种处理结果的数量;将数量最多的一种处理结果作为目标处理结果。在一个可选的实施例中,若第一特征向量的维度为n,n为正整数,则第一生成模块520,还用于:从第一特征向量中随机选择m个q维的第一向量,m为正整数,且q为小于n的正整数;将m个第一向量组成第一向量集合。在一个可选的实施例中,若第二特征向量的维度为n,则第二生成模块530,还用于:从第二特征向量中随机选择m个q维的第二向量;将m个第二向量组成第二向量集合。在一个可选的实施例中,第一生成模块520,还用于:在根据文本的第一特征向量生成第一向量集合之前,依次对文本进行词嵌入处理和卷积处理,得到卷积结果;将卷积结果中的每个矩阵转换成向量;将所有的向量相连,得到第一特征向量。在一个可选的实施例中,第二生成模块530,还用于:在根据目标词的第二特征向量生成第二向量集合之前,对目标词进行词嵌入处理,得到第二特征向量。综上所述,本申请实施例提供的文本的情感分析装置,由于第一向量集合中的每个第一向量是从文本的第一特征向量中提取到的,第二向量集合中的每个第二向量是从目标词的第二特征向量中提取到的,所以,第一向量可以代表语义信息,第二向量可以代表目标词,而集成学习可以对每个第一向量和每个第二向量进行结合,使得到的情感极性能够综合考虑目标词和语义信息之间的关联以及目标词对情感极性的影响,从而提高目标词的情感极性的准确性。由于卷积神经网络支持并行运算,所以,可以提高对文本的情感分析的效率。本申请还提供了一种服务器,该服务器包括处理器和存储器,存储器中存储有至少一条指令,至少一条指令由处理器加载并执行以实现上述各个方法实施例提供的文本的情感分析方法。需要说明的是,该服务器可以是如下图6所提供的服务器。请参考图6,其示出了本申请一个示例性实施例提供的服务器的结构示意图。具体来讲:所述服务器600包括中央处理单元CPU601、包括随机存取存储器RAM602和只读存储器ROM603的系统存储器604,以及连接系统存储器604和中央处理单元601的系统总线605。所述服务器600还包括帮助计算机内的各个器件之间传输信息的基本输入输出系统IO系统606,和用于存储操作系统613、应用程序614和其他程序模块615的大容量存储设备607。所述基本输入输出系统606包括有用于显示信息的显示器608和用于用户输入信息的诸如鼠标、键盘之类的输入设备609。其中所述显示器608和输入设备609都通过连接到系统总线605的输入输出控制器610连接到中央处理单元601。所述基本输入输出系统606还可以包括输入输出控制器610以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器610还提供输出到显示屏、打印机或其他类型的输出设备。所述大容量存储设备607通过连接到系统总线605的大容量存储控制器未示出连接到中央处理单元601。所述大容量存储设备607及其相关联的计算机可读存储介质为服务器600提供非易失性存储。也就是说,所述大容量存储设备607可以包括诸如硬盘或者CD-ROI驱动器之类的计算机可读存储介质未示出。不失一般性,所述计算机可读存储介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术,CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的系统存储器604和大容量存储设备607可以统称为存储器。存储器存储有一个或多个程序,一个或多个程序被配置成由一个或多个中央处理单元601执行,一个或多个程序包含用于实现上述语句编码或语句解码方法的指令,中央处理单元601执行该一个或多个程序实现上述各个方法实施例提供的文本的情感分析方法。根据本发明的各种实施例,所述服务器600还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器600可以通过连接在所述系统总线605上的网络接口单元611连接到网络612,或者说,也可以使用网络接口单元611来连接到其他类型的网络或远程计算机系统未示出。所述存储器还包括一个或者一个以上的程序,所述一个或者一个以上程序存储于存储器中,所述一个或者一个以上程序包含用于进行本发明实施例提供的文本的情感分析方法中由服务器所执行的步骤。本申请实施例还提供一种计算机可读存储介质,该存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器610加载并执行以实现如上所述的文本的情感分析方法。本申请还提供了一种计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行上述各个方法实施例提供的文本的情感分析方法。本申请一个实施例提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上所述的文本的情感分析方法。本申请一个实施例提供了一种文本的情感分析设备,所述文本的情感分析设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如上所述的文本的情感分析方法。需要说明的是:上述实施例提供的文本的情感分析装置在进行文本的情感分析时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将文本的情感分析装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的文本的情感分析装置与文本的情感分析方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。以上所述并不用以限制本申请实施例,凡在本申请实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请实施例的保护范围之内。

权利要求:1.一种文本的情感分析方法,其特征在于,所述方法包括:获取待分析的文本和所述文本中的目标词,所述目标词表示所述文本中的目标对象;根据所述文本的第一特征向量生成第一向量集合,所述第一向量集合中的每个第一向量是从所述第一特征向量中提取到的;根据所述目标词的第二特征向量生成第二向量集合,所述第二向量集合中的每个第二向量是从所述第二特征向量中提取到的;对所述第一向量集合和所述第二向量集合进行集成学习,得到所述目标词的情感极性。2.根据权利要求1所述的方法,其特征在于,若所述第一向量集合包括p个第一向量且所述第二向量集合包括p个第二向量,p为正整数,则所述对所述第一向量集合和所述第二向量集合进行集成学习,得到所述目标词的情感极性,包括:将所述第一向量集合中的第i个第一向量和所述第二向量集合中的第j个第二向量输入k个处理单元中,从所述k个处理单元输出的k个处理结果中选择一个目标处理结果,i和j均小于等于p,k为大于等于2的正整数;将i更新为i+1,j更新为j+1,继续执行所述将所述第一向量集合中的第i个第一向量和所述第二向量集合中的第j个第二向量输入k个处理单元中的步骤,直至得到第p个第一向量和第p个第二向量对应的目标处理结果后停止;对所有的目标处理结果进行归一化处理,得到所述目标词的情感极性。3.根据权利要求2所述的方法,其特征在于,所述从所述k个处理单元输出的k个处理结果中选择一个目标处理结果,包括:统计所述k个处理单元输出的k个处理结果中同种处理结果的数量;将数量最多的一种处理结果作为所述目标处理结果。4.根据权利要求2或3所述的方法,其特征在于,若所述第一特征向量的维度为n,n为正整数,则所述根据所述文本的第一特征向量生成第一向量集合,包括:从所述第一特征向量中随机选择m个q维的第一向量,m为正整数,且q为小于n的正整数;将m个第一向量组成所述第一向量集合。5.根据权利要求4所述的方法,其特征在于,若所述第二特征向量的维度为n,则所述根据所述目标词的第二特征向量生成第二向量集合,包括:从所述第二特征向量中随机选择m个q维的第二向量;将m个第二向量组成所述第二向量集合。6.根据权利要求1所述的方法,其特征在于,在所述根据所述文本的第一特征向量生成第一向量集合之前,所述方法还包括:依次对所述文本进行词嵌入处理和卷积处理,得到卷积结果;将所述卷积结果中的每个矩阵转换成向量;将所有的向量相连,得到所述第一特征向量。7.根据权利要求1所述的方法,其特征在于,在所述根据所述目标词的第二特征向量生成第二向量集合之前,所述方法还包括:对所述目标词进行词嵌入处理,得到所述第二特征向量。8.一种文本的情感分析装置,其特征在于,所述装置包括:获取模块,用于获取待分析的文本和所述文本中的目标词,所述目标词表示所述文本中的目标对象;第一生成模块,用于根据所述获取模块得到的所述文本的第一特征向量生成第一向量集合,所述第一向量集合中的每个第一向量是从所述第一特征向量中提取到的;第二生成模块,用于根据所述获取模块得到的所述目标词的第二特征向量生成第二向量集合,所述第二向量集合中的每个第二向量是从所述第二特征向量中提取到的;集成学习模块,用于对所述第一向量集合和所述第二向量集合进行集成学习,得到所述目标词的情感极性。9.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至7任一所述的文本的情感分析方法。10.一种文本的情感分析设备,其特征在于,所述文本的情感分析设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如权利要求1至7任一所述的文本的情感分析方法。

百度查询: 腾讯科技(深圳)有限公司 文本的情感分析方法、装置、存储介质及设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。