买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于相似度词序矩阵的电力客服工单情感量化分析方法_国网浙江省电力有限公司;国网浙江省电力有限公司营销服务中心;浙江华云信息科技有限公司_201811247198.8 

申请/专利权人:国网浙江省电力有限公司;国网浙江省电力有限公司营销服务中心;浙江华云信息科技有限公司

申请日:2018-10-24

公开(公告)日:2023-07-25

公开(公告)号:CN109670167B

主分类号:G06F40/30

分类号:G06F40/30;G06F40/289;G06F16/35;G06N3/048;G06N3/084;G06Q30/015;G06Q50/06

优先权:

专利状态码:有效-授权

法律状态:2023.07.25#授权;2019.11.15#实质审查的生效;2019.04.23#公开

摘要:本发明公开了一种基于Word2Vec的电力客服工单情感量化分析方法,涉及一种电力客服工单分析方法。传统的情感分析方法不能有效甄别情感强度。本发明结合电力客服工单文本特征,对历史电力客服工单和不满意工单进行分类梳理、数据清洗,再基于百度词库梳理形成初始化多元情感词库,采用逆向最大匹配算法进行工单文本分词,基于Word2Vec神经网络构建融合客户诉求语义的积极词、消极词、否定词、程度副词、以及词序的词向量,通过历史客服工单进行机器学习训练生成融合诉求情感的学习模型,基于模型中的词性亲疏关系来拓展词性语料库,采用相似度词序矩阵量化算法进行情感量化计算,完成客服工单情感量化分析,有效区分情感强弱差异,确定紧急程度。

主权项:1.基于相似度词序矩阵的电力客服工单情感量化分析方法,其特征在于:包括基于Word2Vec相似度情感词拓展联想步骤、多元情感语料库构建步骤、相似度词序矩阵情感量化算法步骤;Word2Vec相似度情感词拓展联想步骤:用于初始化多元分类词库,分类词库分为积极词、消极词、中性词、否定词、程度副词,通过Word2Vec相似度矩阵实现相近情感词拓展关联,同时这些词融合客户诉求语义的词性倾向和词序强弱关系;通过对工单诉求进行Word2Vec深度学习形成积极词、消极词、中性词、否定词、程度副词之间的空间关联关系;多元情感语料库构建步骤:用于基于词向量空间距离亲疏关系,丰富拓展初始化多元分类词库,构建融合客户诉求情感倾向的多元情感语料库;在对电力客服业务工单和不满意工单进行文本特征分词过程中,基于百度词库与电力专有词库,采用逆向最大匹配算法,形成初步多元情感语料库梳理,涉及积极词、消极词、中性词、否定词、程度副词五类词性分类;通过Word2Vec构建词向量,经过机器学习训练形成以初步情感语料库为中心的倾向性词空间距离关系,从而进一步提炼拓展多元情感语料库;相似度词序矩阵情感量化算法步骤:用于根据情感语料库提炼成果,基于Word2Vec神经网络的构建词向量极性空间关系,计算单一工单诉求相似度情感量化得分;完成客服工单情感量化分析,确定紧急程度;其中情感量化计算公式为: AN-P=WordsNearestLnegative,Lpositive,10000AP-N=WordsNearestLpositive,Lnegative,10000 式中:Smolecule表示所有词情感量化分子累计求和,T表示单一诉求所有词总量,SEQ表示单一工单诉求相似度情感量化得分,words[i]表示经过分词的工单诉求数组中第i个词,AN-P基于消极词到积极词关联最近词语有序集合,AP-N基于积极词到消极词关联最近词语有序集合,Ldegree表示程度副词集合,Lnay表示否定词集合,Lpositive表示积极词集合,Lnegative表示消极词集合,Lneutral表示中性词集合,表示第i词在AP-N有序集合中的排列位置,表示第i词在AN-P有序集合中的排列位置,WordsNearest则为Word2vec空间关联关系方法,δlow、δneutral、δinterval分别表示情感量化消极系数下限、情感量化中性系数下限、情感量化中性区间。

全文数据:一种基于Word2Vec的电力客服工单情感量化分析方法技术领域本发明涉及一种电力客服工单分析方法,尤其涉及一种基于Word2Vec的电力客服工单情感量化分析方法。背景技术随着社会经济的发展,电力体制改革的不断深化,供电企业只有坚持以客户为中心,提升客户满意度,才能取得市场化竞争优势。而95598作为客户交流与沟通的重要渠道窗口,通过对客服工单中隐含的客户特征、情感信息进行深度挖掘,实现量化客户诉求情感分析,有利于快速了解客户的关注焦点,有利于根据客户情感倾向性识别潜在的投诉客户,有利于支撑工单紧急度优先处理与分析,有利于根据反馈信息判别某项业务的实施效果,这些对电力企业和客户都将具有十分重要的意义。传统方式下,针对工单诉求情感分析,需要设立多名诉求分析专职对客户诉求工单进行人工分析和处理,耗费大量人力成本。情感分析主要是面向非结构化文本的自然语言处理,通过对文本中隐藏的情感信息进行分析,挖掘人对于事物或者事件所持有的观点和态度。目前,普遍情感分析侧重于情感极性分类,简单表示为情感是正向的还是负向的;而情感强度体现则需要量化情感手段实现。传统情感分析过程主要分为三部分:特征工程、特征选择和机器学习算法应用。它偏向于使用工程特征或者极性转移规则来提高准确率。而对文本的情感量化分析计算在国内外研究并不多,多数研究侧重于情感倾向性分类。传统的情感分析方法基于词袋bag-of-word特征和词频统计,同时多数研究侧重于情感倾向性分类,这种方法存在以下三方面缺陷:1缺失词的上下文顺序和语义理解;2忽略词的语义间差异;3侧重于情感倾向性分类无法体现情感强弱差异。总之不能有效甄别情感强度。发明内容本发明要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进,提供一种基于Word2Vec的电力客服工单情感量化分析方法,以达到有效甄别情感强度的目的。为此,本发明采取以下技术方案。一种基于Word2Vec的电力客服工单情感量化分析方法,结合电力客服工单文本特征,对历史电力客服工单和不满意工单进行分类梳理、数据清洗,再基于百度词库梳理形成初始化多元情感词库,采用逆向最大匹配算法进行工单文本分词,基于Word2Vec神经网络构建融合客户诉求语义的积极词、消极词、否定词、程度副词、以及词序的词向量,通过历史客服工单进行机器学习训练生成融合诉求情感的学习模型,基于模型中的词性亲疏关系来拓展词性语料库,采用相似度词序矩阵量化算法进行情感量化计算,完成客服工单情感量化分析,确定紧急程度;其中情感量化计算公式为:AN-P=WordsNearestLnegative,Lpositive,10000AP-N=WordsNearestLpositive,Lnegative,10000式中:Smolecule表示所有词情感量化分子累计求和,T表示单一诉求所有词总量,SEQ表示单一工单诉求相似度情感量化得分,words[i]表示经过分词的工单诉求数组中第i个词,AN-P基于消极词到积极词关联最近词语有序集合,AP-N基于积极词到消极词关联最近词语有序集合,Ldegree表示程度副词集合,Lnay表示否定词集合,Lpositive表示积极词集合,Lnegative表示消极词集合,Lneutral表示中性词集合,表示第i词在AP-N有序集合中的排列位置,表示第i词在AN-P有序集合中的排列位置,WordsNearest则为Word2vec空间关联关系方法,δlow、δneutral、δinterval分别表示情感量化消极系数下限、情感量化中性系数下限、情感量化中性区间。本技术方案基于Word2Vec神经网络对历史客户工单进行深度学习,通过学习模型中词向量空间距离表征相近语义和词的亲疏关系,同时通过Word2Vec建模后的同一极性亲疏关系来构建词序,通过词序来表示同一情感倾向的强弱关系。通过上述技术手段在情感量化计算中融合词的上下文顺序、语义理解和词间的情感强弱差异,根据历史工单诉求与语义相近理解、同一词性的两个词情感强弱差异来影响情感量化计算结果。在无监督模式下丰富拓展有限的情感语料库,简化大量人力情感语料梳理工作,基于有限的情感语料库拓展丰富缺失的情感语料。基于有限的情感语料,融合电力业务专有词库,基于Word2Vec神经网络对历史工单深度学习形成积极词、消极词、中性词、否定词、程度副词之间的空间关联关系,即以有限情感语料库为中心的倾向性词空间亲疏关系,从而进一步提炼拓展多元词性语料库。本技术方案能对各个工单诉求有效区分情感强弱差异,实现情感量化分析评价而非投诉倾向性分类,以决定业务处理的紧急程度。加入情感在线计算与分析介入,可以全方位地为客户考虑,理解客户情绪,通过对客户情感的预判,为在适当时机介入差异化情感安抚和疏导,减少客户在线咨询时间,提升客户满意度。作为优选技术手段:δlow、δneutral、δinterval分别为0.2、0.5、0.1。作为优选技术手段:电力客服工单情感量化分析方法包括基于Word2Vec相似度情感词拓展联想,用于初始化多元分类词库,分类词库分为积极词、消极词、中性词、否定词、程度副词,通过Word2Vec相似度矩阵实现相近情感词拓展关联,同时这些词融合客户诉求语义的词性倾向和词序强弱关系;通过对工单诉求进行Word2Vec深度学习形成积极词、消极词、中性词、否定词、程度副词之间的空间关联关系。作为优选技术手段:电力客服工单情感量化分析方法包括多元情感语料库构建,用于基于词向量空间距离亲疏关系,丰富拓展初始化情感分类词,构建融合客户诉求情感倾向的多源情感语料库;在对电力客服业务工单和不满意工单进行文本特征分词过程中,基于百度词库与电力专有词库,采用逆向最大匹配算法,形成初步语料库梳理,涉及积极词、消极词、中性词、否定词、程度副词五类词性分类;通过Word2Vec构建词向量,经过机器学习训练形成以初步情感语料库为中心的倾向性词空间距离关系,从而进一步提炼拓展多元词性语料库。作为优选技术手段:多元情感语料库构建包括以下步骤:a结合电力客服工单文本特征,对历史电力客服工单和不满意工单进行分类梳理、数据清洗,基于百度词库梳理形成词料;b初始化语料梳理,语料分为积极词、消极词、中性词、否定词、程度副词;c初始化语料词库;d输入一段时序的工单诉求信息;e通过Word2Vec神经网络工单分词深度学习,获得学习模型;f通过Word2Vec亲疏关联关系分离词性;g更新多元语料库。作为优选技术手段:步骤e,包括以下子步骤:e01定义学习模型参数,参数包括正则参数、迭代次数、学习速率、最小词频、窗口大小;e02创建Word2Vec学习模型;e03输入一段时序的工单诉求信息;e04对诉求文本分词;e05判断是否小于学习迭代次数,若小于迭代次数,则进入步骤e06,若大于迭代次数,则进入步骤e08;e06实时同步记录学习进度,包括当前学习次数、学习时间间隔;e07Word2Vec网络随机梯度下降分组学习,包括偏向与权重学习更新;回至步骤e05;e08完成学习任务将学习模型回写数据库。作为优选技术手段:在步骤e01中,迭代次数为100;学习速率为0.001。作为优选技术手段:在情感量化计算后,进行数据的归一化处理,通过归一化处理最终得到工单情感量化结果。有益效果:一、本技术方案以Word2Vec和相似度词序矩阵实现情感极性亲疏空间量化关系,打破传统的基于词袋特征和词频统计的情感分析方法,技术融合历史工单的上下文顺序、语义理解、语义间的差异等关键因素,实现情感倾向性分类到情感量化评价转变,支持在线实时情感运算分析,提升日常客户情感预判与风险预警能力;从客户情感角度实现对工单紧急程度划分,区分工单的紧急程度;从投诉风险角度实现工单每日情感异动预警,管控客户情感投诉风险;可以应用在日常电子坐席服务过程中,嵌入情感在线计算与分析,实时理解客户情绪,通过对客户情感的预判,在适当时机介入差异化情感安抚和疏导,减少客户在线咨询时间,提升客户满意度。二、本技术方案可实现组件式封装,扩展性较好,适应性强,同时对模型训练过程进行统一监控,所有建模参数功能实现可以通过前台页面配置完成,减少开发人员压力,提升需求响应及时性;三、基于Word2Vec和相似度词序矩阵的情感量化分析技术,融合电力客服专有词库和特有业务应用,可进行需求个性化定制,功能具有模型训练全过程可视化监控、情感计算线上实时运算、区域业务情感差异分析的特点。附图说明图1是本发明的总流程图。图2是本发明的客户诉求专有词向量空间距离关系图。图3是本发明的多元情感语料库构建流程图。图4是本发明的情感嵌入式智能在线电子座席处理流程图。图5是本发明的服务申请欠费复电登记业务情感量化趋势图。图6是本发明的情感量化分析机器学习训练过程监控功能图。图7是本发明的工单情感量化分析功能图。具体实施方式以下结合说明书附图对本发明的技术方案做进一步的详细说明。如图1所示,本技术方案基于Word2Vec深度学习技术实现,结合电力客服工单文本特征,对历史电力客服工单和不满意工单进行分类梳理、数据清洗,再基于百度词库梳理形成初始化多元情感词库,采用逆向最大匹配算法进行工单文本分词,基于Word2Vec神经网络构建融合客户诉求语义的积极词、消极词、否定词、程度副词、以及词序的词向量,通过历史客服工单进行机器学习训练生成融合诉求情感的学习模型,基于模型中的词性亲疏关系来拓展词性语料库,最后研发相似度词序矩阵量化算法完成客服工单情感量化分析;其中相似度词序矩阵情感量化算法为:根据上述情感语料库提炼成果,基于Word2Vec神经网络的构建词向量极性空间关系,通过自主研发的相似度矩阵情感量化算法,实现各个诉求工单的客户感知情感量化计算。具体算法如下:AN-P=WordsNearestLnegative,Lpositive,10000AP-N=WordsNearestLpositive,Lnegative,10000式中:Smolecule表示所有词情感量化分子累计求和,T表示单一诉求所有词总量,SEQ表示单一工单诉求相似度情感量化得分,words[i]表示经过分词的工单诉求数组中第i个词,AN-P基于消极词到积极词关联最近词语有序集合,AP-N基于积极词到消极词关联最近词语有序集合,Ldegree表示程度副词集合,Lnay表示否定词集合,Lpositive表示积极词集合,Lnegative表示消极词集合,Lneutral表示中性词集合,表示第i词在AP-N有序集合中的排列位置,表示第i词在AN-P有序集合中的排列位置,WordsNearest则为Word2vec空间关联关系方法,δlow、δneutral、δinterval分别表示情感量化消极系数下限、情感量化中性系数下限、情感量化中性区间,默认设置分别0.2、0.5、0.1。总体设计思路如图1所示。其包括步骤:一、工单分词聚类;将词分为积极词、消极词、中性词、否定词、程度副词;二、多元语料库提炼;三、深度学习建模;四、模型学习训练;采用Word2Vec神经网络,动量系数为0.9,学习速率为0.1,激活函数Relu,随机梯度下降算法,100轮迭代学习;五、情感量化计算,采用相似度矩阵情感量化算法,基于Word2Vec词向量相似度量化、情感倾向性量化计算、归一化处理。本技术方案通过基于Word2Vec相似度情感词拓展联想、多元情感语料库构建、相似度词序矩阵情感量化算法实现三个关键环节完成的一种基于Word2Vec和相似度词序矩阵的电力客服工单情感量化分析方法,有效支撑工单紧急程度甄别与投诉情感风险分析。1基于Word2Vec相似度情感词拓展联想:该过程实现初始化多元分类词库积极词、消极词、中性词、否定词、程度副词,通过Word2Vec相似度矩阵实现相近情感词拓展关联,同时这些词融合客户诉求语义的词性倾向和词序强弱关系。Word2Vec是一个用于处理文本的双层神经网络。它的输入是文本语料,输出则是一组向量:该语料中词语的特征向量。Word2Vec实现在向量空间内将词的向量按相似性进行分组,以分布式的数值形式来表示词的上下文等特征。如给出足够的数据、用法和上下文,Word2Vec就能根据过去经验对词的意义进行高度准确的预测。这样的预测结果可以用于建立一个词与其他词之间的联系。Word2Vec衡量词的余弦相似性,无相似性表示为90度角,而相似度为1的完全相似则表示为0度角,即完全重合。通过对近两年的工单诉求进行Word2Vec深度学习形成积极词、消极词、中性词、否定词、程度副词之间的空间关联关系,如图2所示。2多元情感语料库构建:该过程实现基于上述词向量空间距离亲疏关系,丰富拓展初始化情感分类词,构建融合客户诉求情感倾向的多元情感语料库。在对电力客服业务工单和不满意工单进行文本特征分词过程中,基于百度词库与电力专有词库,采用逆向最大匹配算法,形成初步语料库梳理,主要涉及积极词、消极词、中性词、否定词、程度副词五类词性分类。为了实现优化拓展丰富情感语料库,通过Word2Vec构建词向量,经过机器学习训练形成以初步情感语料库为中心的倾向性词空间距离关系,从而进一步提炼拓展多元词性语料库,词性语料库词典见表1所示,Word2Vec神经网络模型训练参数如表2所示,具体实现过程见图3所示。表1多元情感语料库词典实例表2Word2Vec模型训练参数为在情感量化计算中融合词的上下文顺序、语义理解和词间的情感强弱差异,即如何根据历史工单诉求与语义相近理解、同一词性的两个词情感强弱差异来影响情感量化计算结果。本技术方案基于Word2Vec神经网络对历史客户工单进行深度学习,通过学习模型中词向量空间距离表征相近语义和词的亲疏关系,如图2所示,同时通过Word2Vec建模后的同一极性亲疏关系来构建词序,通过词序来表示同一情感倾向的强弱关系。为在无监督模式下丰富拓展有限的情感语料库,即如何简化大量人力情感语料梳理工作,基于有限的情感语料库拓展丰富缺失的情感语料。需要基于有限的情感语料,融合电力业务专有词库;本技术方案基于Word2Vec神经网络对历史工单深度学习形成积极词、消极词、中性词、否定词、程度副词之间的空间关联关系,即以有限情感语料库为中心的倾向性词空间亲疏关系,从而进一步提炼拓展多元词性语料库。为实现对各个工单诉求有效区分情感强弱差异,即如何实现情感量化分析评价而非投诉倾向性分类。从客户情感诉求角度来说,情感强弱程度在一定程度上决定业务处理的紧急程度,情感极性越偏向消极则容易引发投诉,因此情感量化计算极为重要。本技术方案通过根据上述情感语料库提炼成果,基于Word2Vec神经网络的构建词向量极性空间关系,通过自主研发的相似度矩阵情感量化算法,实现各个诉求工单的客户感知情感量化计算,具体见上述相似度词序矩阵情感量化算法实现。基于Word2Vec和相似度词序矩阵的电力客服工单情感量化分析除了有效支撑工单紧急程度甄别与投诉情感风险分析外,还可用于日常电子座席服务中,如图4所示,在各网省公司的日常电子座席服务中,加入情感在线计算与分析介入,可以全方位地为客户考虑,理解客户情绪,通过对客户情感的预判,为在适当时机介入差异化情感安抚和疏导,减少客户在线咨询时间,提升客户满意度。本发明通过对工单受理内容进行分词,结合相似度矩阵情感量化算法,实现对逐一分词情感量化分解,具体实例如表1所示,通过归一化处理最终得到工单情感量化结果,同时各业务类型工单的情感量化得分差异明显,可以从客户情感角度实现对工单紧急程度划分,通过对工单客户诉求的情感分析,能够区分工单的紧急程度。同一业务情感得分越低,工单的紧急程度越高,理论上需要优先予以处理。表3工单受理内容情感量化实例如图5所示,从7日、14日线可以看出服务申请欠费复电登记业务客户情感4月份总体趋于平衡,其中图中表现突出的是4月25日快速下降,降幅为11.16%,通过针对性分析4月25日欠费复电登记工单,相比之前同类型工单发现,存在两张工单明确标注中高潜在投诉倾向,同时在客户诉求意愿上表达进一步投诉倾向。因此,通过工单每日情感异动差异有利于构建基于客户情感的投诉风险预警与管控。以上可知,本技术方案在实际应用中具有以下几点优点:一是以Word2Vec和相似度词序矩阵实现情感极性亲疏空间量化关系,打破传统的基于词袋特征和词频统计的情感分析方法,技术融合历史工单的上下文顺序、语义理解、语义间的差异等关键因素,实现情感倾向性分类到情感量化评价转变,支持在线实时情感运算分析,提升日常客户情感预判与风险预警能力;二是可以主流开源的DL4j深度学习技术突破口,所有功能实现组件式封装,扩展性较好,适应性强,同时对模型训练过程进行统一监控,所有建模参数功能实现可以通过前台页面配置完成,减少开发人员压力,提升需求响应及时性,其中模型训练监控页面如图6情感量化分析机器学习训练过程监控功能图;三是它作为基于Word2Vec和相似度词序矩阵的情感量化分析技术,融合电力客服专有词库和特有业务应用,并进行需求个性化定制,功能具有模型训练全过程可视化监控、情感计算线上实时运算、区域业务情感差异分析等特点,具体功能界面见图7工单情感量化分析功能图;而这一关键技术在实际应用主要表现为以下三方面:1从客户情感角度实现对工单紧急程度划分,区分工单的紧急程度;2从投诉风险角度实现工单每日情感异动预警,管控客户情感投诉风险。3可以应用在日常电子坐席服务过程中,嵌入情感在线计算与分析,实时理解客户情绪,通过对客户情感的预判,在适当时机介入差异化情感安抚和疏导,减少客户在线咨询时间,提升客户满意度。以上图1、2所示的一种基于Word2Vec的电力客服工单情感量化分析方法是本发明的具体实施例,已经体现出本发明实质性特点和进步,可根据实际的使用需要,在本发明的启示下,对其进行形状、结构等方面的等同修改,均在本方案的保护范围之列。

权利要求:1.一种基于Word2Vec的电力客服工单情感量化分析方法,其特征在于:结合电力客服工单文本特征,对历史电力客服工单和不满意工单进行分类梳理、数据清洗,再基于百度词库梳理形成初始化多元情感词库,采用逆向最大匹配算法进行工单文本分词,基于Word2Vec神经网络构建融合客户诉求语义的积极词、消极词、否定词、程度副词、以及词序的词向量,通过对历史客服工单进行机器学习训练生成融合诉求情感的学习模型,基于模型中的词性亲疏关系来拓展丰富词性语料库,采用相似度词序矩阵量化算法进行情感量化计算,完成客服工单情感量化分析,确定紧急程度;其中情感量化计算公式为:AN-P=WordsNearestLnegative,Lpositive,10000AP-N=WordsNearestLpositive,Lnegative,10000式中:Smolecule表示所有词情感量化分子累计求和,T表示单一诉求所有词总量,SEQ表示单一工单诉求相似度情感量化得分,words[i]表示经过分词的工单诉求数组中第i个词,AN-P基于消极词到积极词关联最近词语有序集合,AP-N基于积极词到消极词关联最近词语有序集合,Ldegree表示程度副词集合,Lnay表示否定词集合,Lpositive表示积极词集合,Lnegative表示消极词集合,Lneutral表示中性词集合,表示第i词在AP-N有序集合中的排列位置,表示第i词在AN-P有序集合中的排列位置,WordsNearest则为Word2vec空间关联关系方法,δlow、δneutral、δinterval分别表示情感量化消极系数下限、情感量化中性系数下限、情感量化中性区间。2.根据权利要求1所述的一种基于Word2Vec的电力客服工单情感量化分析方法,其特征在于:δlow、δneutral、δinterval分别为0.2、0.5、0.1。3.根据权利要求2所述的一种基于Word2Vec的电力客服工单情感量化分析方法,其特征在于:电力客服工单情感量化分析方法包括基于Word2Vec相似度情感词拓展联想,用于初始化多元分类词库,分类词库分为积极词、消极词、中性词、否定词、程度副词,通过Word2Vec相似度矩阵实现相近情感词拓展关联,同时这些词融合客户诉求语义的词性倾向和词序强弱关系;通过对工单诉求进行Word2Vec深度学习形成积极词、消极词、中性词、否定词、程度副词之间的空间关联关系。4.根据权利要求3所述的一种基于Word2Vec的电力客服工单情感量化分析方法,其特征在于:电力客服工单情感量化分析方法包括多元情感语料库构建,用于基于词向量空间距离亲疏关系,丰富拓展初始化情感分类词,构建融合客户诉求情感倾向的多元情感语料库;在对电力客服业务工单和不满意工单进行文本特征分词过程中,基于百度词库与电力专有词库,采用逆向最大匹配算法,形成初步语料库梳理,涉及积极词、消极词、中性词、否定词、程度副词五类词性分类;通过Word2Vec构建词向量,经过机器学习训练形成以初步情感语料库为中心的倾向性词空间距离关系,从而进一步提炼拓展多元词性语料库。5.根据权利要求4所述的一种基于Word2Vec的电力客服工单情感量化分析方法,其特征在于:多元情感语料库构建包括以下步骤:a结合电力客服工单文本特征,对历史电力客服工单和不满意工单进行分类梳理、数据清洗,基于百度词库梳理形成词料;b初始化语料梳理,语料分为积极词、消极词、中性词、否定词、程度副词;c初始化语料词库;d输入一段时序的工单诉求信息;e通过Word2Vec神经网络工单分词深度学习,获得学习模型;f通过Word2Vec亲疏关联关系分离词性;g更新多元语料库。6.根据权利要求5所述的一种基于Word2Vec的电力客服工单情感量化分析方法,其特征在于:步骤e,包括以下子步骤:e01定义学习模型参数,参数包括正则参数、迭代次数、学习速率、最小词频、窗口大小;e02创建Word2Vec学习模型;e03输入一段时序的工单诉求信息;e04对诉求文本分词;e05判断是否小于学习迭代次数,若小于迭代次数,则进入步骤e06,若大于迭代次数,则进入步骤e08;e06实时同步记录学习进度,包括当前学习次数、学习时间间隔;e07Word2Vec网络随机梯度下降分组学习,包括偏向与权重学习更新;回至步骤e05;e08完成学习任务将学习模型回写数据库。7.根据权利要求6所述的一种基于Word2Vec的电力客服工单情感量化分析方法,其特征在于:在步骤e01中,迭代次数为100;学习速率为0.001。8.根据权利要求1所述的一种基于Word2Vec的电力客服工单情感量化分析方法,其特征在于:在情感量化计算后,进行数据的归一化处理,通过归一化处理最终得到工单情感量化结果。

百度查询: 国网浙江省电力有限公司;国网浙江省电力有限公司营销服务中心;浙江华云信息科技有限公司 基于相似度词序矩阵的电力客服工单情感量化分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。