买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于时序分析用户会话情感趋势的表情符号推荐方法_西北大学_201710976797.2 

申请/专利权人:西北大学

申请日:2017-10-19

公开(公告)日:2021-04-13

公开(公告)号:CN107729320B

主分类号:G06F40/30(20200101)

分类号:G06F40/30(20200101);G06F40/289(20200101);G06F16/36(20190101);G06F17/18(20060101);H04L29/08(20060101)

优先权:

专利状态码:有效-授权

法律状态:2021.04.13#授权;2018.03.20#实质审查的生效;2018.02.23#公开

摘要:一种基于时序分析用户会话情感趋势的表情符号推荐方法,通过发掘用户聊天记录来分析对话的情感值,以此构建表情符号在情感矩阵中的映射关系;利用情感字典分析对话历史记录计算情感关键词;通过情感关键词以及计算规则计算会话的21维情感向量;通过时间序列(ARMAARIMA)模型对用户当前对话情感向量的发展进行单步预测,并将预测结果从映射关系中通过最近邻算法(KNN)选取最接近用户情感趋势的表情组并生成推荐列表。根据本发明所提供的技术方案,用户在使用聊天工具时,能够及时准确的向用户推荐出符合当前用户情感与会话语境的表情符号,从而极大地方便了用户选择表情符号的复杂操作,提高了推荐覆盖率,也增强了用户体验。

主权项:1.一种基于时序分析用户会话情感趋势的表情符号推荐方法,其特征在于,包括以下步骤:1发掘用户聊天记录来预处理并分析对话的情感值,以此构建表情符号在情感矩阵中的映射关系;2利用情感字典分析对话历史记录计算情感关键词;情感字典分为情感词典、语气词情感字典、标点符号情感字典;在用情感字典进行词语匹配计算情感值的时候使用正向最大匹配法,具体将包含相同词语的不同长度的词语划分在用户字典上,以由长至短的方式排列,以便优先匹配最直接可寻的短语、词语;3通过情感关键词以及计算规则计算会话的21维情感向量;4通过时间序列模型对用户当前对话情感向量的发展进行单步预测,并将预测结果从映射关系中通过最近邻算法选取用户情感趋势的表情组并生成推荐列表。

全文数据:一种基于时序分析用户会话情感趋势的表情符号推荐方法技术领域[0001]本发明涉及智能推荐技术领域,具体涉及一种基于时序分析用户会话情感趋势的表情符号推荐方法。背景技术[0002]表情符号是现在人们日常上网聊天除了语言文字以外最重要的一种表达自身情感的方式和互动沟通方式,不同的表情符号承载着不同丰富的含义。英国语言词典的代表《牛津词典》在2015年末发布的年度词汇首次使用了一个emoji表情符号:FacewithTearsofJ〇y,官方解释为‘喜极而泣的笑脸’。由此可见,表情符号作为一种迎合21世纪快速、集中视觉需求背景下的产物,是极具代表性的。这种象形文字图像,例如emoji表情符号,可以补充平淡语言中的情感空白,可以为文字注入优美的语调,让交流方式变得丰富多彩,因此它超越了语言的限制,成为脱离语言而能够独立存在的个体,在网络中发挥着举足轻重的作用。[0003]随着表情数量的持续增加,用户使用表情符号遇到了“选择困难症”。自大数据获得广泛关注至今,推荐系统作为一个能够缓解信息过载的有效方式,得到了广泛的认可和深层次的发展与应用。当可以使用的表情符号多到用户无从选择时,当用户为了快速回复而苦苦寻觅那个适合的表情符号时,当表情符号已经不再吸引用户时,表情符号推荐的需求便得以体现。[0004]表情符号推荐的应用不仅能够解决推广问题,帮助制作表情符号的创作者们收获更大经济效益,让更多的作品能够被用户接受,同时,也更贴合用户的使用习惯,让聊天过程变得更轻松,快捷,方便,也能使聊天更加个性化。[0005]表情符号的推荐目前主要以基于用户使用频率作为推荐依据,通过统计用户日常使用量,将使用最频繁的表情符号置入推荐列表里,然而这样的方式不仅未体现出任何推荐功能,还限制了自身表情符号的推广;在中文输入法中,多是通过用户输入的不完全拼音来预测用户将要输入的词语所对应的表情,或者根据表情符号对应的汉语标签进行匹配推荐,但是,从严格意义上说,这些都不属于推荐算法,只能说是历史记录的重现或者通过标签的表达。[0006]成熟的推荐系统的最终目的是将那些很少进入用户视野的用户可能会感兴趣的产品推荐给用户,从而不仅满足了用户的猎奇心理,也使得潜在利益最大化,在表情符号的使用方面,大部分表情符号使用传统的基于使用频率的方法得到最终的推荐,无法适应用户的不同使用需求。因此,本发明充分考虑用户日常操作体验和其产生的需求,提出一种新的表情符号推荐方法:利用情感字典分析对话历史记录计算情感关键词,分析用户使用每一个表情符号时的前后情感变化计算表情符号一情感值映射字典,通过分析时间信息,利用自回归积分滑动平均模型计算下一个时间段的情感值,最后从表情符号情感字典中查询计算推荐表情符号。发明内容[0007]为了克服上述现有技术的不足,本发明的目的是提供一种基于时序分析用户会话情感趋势的表情符号推荐方法,为用户使用聊天工具时及时准确地推荐一款表情符号,弥补语言上的晦涩,表达出更丰富的情感,该推荐方法主要挖掘用户对话记录中存在的潜在情感价值,目的是抽取出其所包含情感内容的信息单元,将信息内容转化为计算机可识别的结构化数据,同时将基本情感划分为:“好爱,敬)、恶,喜乐),怒,哀,惧,欲”等七类,并对其进行量化,以此建立表情符号-情感指数矩阵。利用情感字典分析用户对话历史记录计算情感关键词,从而分析用户使用每一个表情符号时的前后情感变化,通过情感变化更加精准地计算用户聊天过程中需要的表情符号。再建立一个合适的时间序列模型,利用时间序列模型预测用户当前对话的情感趋势,从表情符号-情感矩阵关系中选取最接近用户情感趋势的表情组并生成用户推荐列表。同时,本发明提供了所构建情感字典的示例,主要涉及扩展情感字典、语气词辅助情感字典和标点符号辅助情感字典。[0008]为实现上述目的,本发明采用的技术方法是:[0009]—种基于时序分析用户会话情感趋势的表情符号推荐方法,包括以下步骤:[0010]1发掘用户聊天记录来预处理并分析对话的情感值,以此构建表情符号在情感矩阵中的映射关系;[0011]2利用情感字典分析对话历史记录计算情感关键词;分为情感字典、语气词情感字典、标点符号情感字典;在用情感字典的时候考虑使用正向最大匹配法,将包含相同词语的不同长度的词语划分在用户字典上,以由长至短的方式排列,以便优先匹配最直接可寻的短语、词语;[0012]3通过情感关键词以及计算规则计算会话的21维情感向量;[0013]4通过时间序列模型对用户当前对话情感向量的发展进行单步预测,并将预测结果从映射关系中通过最近邻算法选取最接近用户情感趋势的表情组并生成推荐列表。[0014]所述的步骤1中获取用户聊天记录,分析对话的情感值,包括:挖掘用户聊天记录信息,分为文字信息、语音信息;使用用户已有的聊天记录等信息通过过滤、分词、去停用词操作,并和情感字典匹配建立属于个人独特的情感字典,用于标注表情符号的情感值。[0015]所述的步骤1构建表情符号在情感矩阵中的映射关系,包括通过计算其用户的情感值,得到一个表情-情感指数计算矩阵;统计每一个表情和其所能够表达的情感值的二维关系。所述的对表情符号-情感值矩阵的计算,包括表情符号-情感值映射关系主要用于描述每一个用户发送的表情符号在情感值上的表现形式;由于并不是每句话都包含可计算的情感,因此情感值计算过程中,应当抽取表情出现在前k条带有情感的话语,确保用于分词的用户字典和用于计算情感值的情感字典拥有相同的词条,以便最大化词典匹配效果。[0016]所述的步骤2中用户会话记录计算其情感值,包括:将情感按照Ekman划分方法,确定情感的划分准则,扩展出21小类;通过情感划分,建立一个参照标准,量化其具体词语的实际情感表达;利用情感字典分析对话历史记录计算情感关键词,包括建立相应的情感字典;针对用户历史会话记录,对其进行分词、提取处理,同时也要对语气词、标点符号建立辅助情感语气词表、情感标点符号表;[0017]所述的步骤3中通过情感关键词以及计算规则计算会话的21维情感向量,包括抽取用户会话记录的前η条带有感情的话语,进行分词、过滤等预处理;将处理后的语句在情感字典中进行查找匹配,计算其情感倾向的总期望,以此得到对应表情的21维情感向量。[0018]所述的步骤1对聊天记录信息的预处理,将对话情感数据按时间先后次序排列,构成一条随机时间序列,公式为:[0019]{Emotiom},i=ti,t2,t3,…,tn[0020]将会话记录中重复出现的语句进行数据去重,对不完整信息进行曲线拟合+重采样处理。[0021]所述的步骤4中通过时间序列模型对用户当前对话情感向量的发展进行单步预测,包括提取会话历史记录,即通过时间维度的历史数据计算其变化规律,并将该规律拓展至未来,从而对未来该事物的变化做出预测;建立时间序列分析模型,AR模型、MA模型和二者的结合ARM,其中ARMp,q—般公式为:[0022]Yt=3〇+3iYt—i+32Yt-2+L+0PYt-ρ+εt+αιεt-i+L+aqet—q[0023]式中,p,q为模型的自回归阶数和移动平均阶数;α,β为自回归系数和滑动平均系数;为误差项;Yt为平稳、正态且零均值的时间序列;设差分算子为对于非平稳序列{Xt}进行d阶差分运算得到的新序列汉%}是一个平稳序列,若假设该序列适合ARMAρ,q模型,根据模型代数化方法,自回归系数多项式方程公式为:[0025]其滑动平均系数多项式公式为:[0026]Θ⑻=I-Q1B-Q2B2——0qBq[0027]若数据不平稳,经过差分处理后,则使用AR頂Ap,d,q模型进行计算,其公式变换为:[0029]这里的d是实际进行平稳化处理中差分的次数,但不超过2次,ARMAp,q的模型参数的估计方法采用最小二乘估计方式,使残差平方和达到最小的那组参数值,设参数集合为:[0030]δ=Ci1,a〗,Lap,P1,β2,Uqτ,则令:[0032]达到最小,$为原参数集合的最小二乘估计,其中,白噪声的方差《的最小二乘估计为:[0034]验证数据的平稳性,构建时间序列分析流程模型,数据通过平稳性检测后,对于平稳序列,直接拟合ARMAp,q模型,对于非平稳序列,则经过差分运算后再次通过平稳性检验,最后拟合ARIMAp,d,q模型。[0035]所述的步骤4中选取最接近用户情感趋势的表情组并生成表情符号推荐列表,包括通过用户历史会话记录,利用情感趋势分析用户对于每一种表情符号的理解和使用习惯;结合表情符号-情感映射表,为用户推荐下一个符合其情感走向的表情符号。[0036]所述的步骤2中构建情感字典,包括情感词汇本体中使用了三元组表示一个词汇,info表示词汇的本体信息,包括编号、解释、对应英文翻译、词性、录入者信息;relation表示词汇与词汇直接的关系,包括同义关系、反义关系等;emotion表示词汇的情感信息,其表示为:[0037]Lexicoru=info,relation,emotion[0038]每一个词的emotion信息包括词性种类、词义数量、情感分类、强度、极性、子情感分类、子强度、子极性等;[0039]所述的构建语气词情感字典,包括情感强度由弱到强划为7个等级,正负面倾向按照0中性、1褒义、2贬义、3同时具备褒贬两性划分,针对出现在对话系统中的语气词做出相应的计算优化;[0040]所述的语气词情感辅助表的构建依照常用动名词情感字典的构建规则,每一个语气词考虑自身、前面出现的字词、后面出现的字词三种情况;[0041]所述的构建标点符号情感字典,包括标点符号语气情感辅助表构建依照查询中文相关文献、字典等方式获取其使用方法即表达效果,再根据效果人工构建其在情感值上的影响方式。[0042]本发明的有益效果是:[0043]为用户使用聊天工具时及时准确地推荐一款表情符号,弥补语言上的晦涩,表达出更丰富的情感,该推荐方法主要挖掘用户对话记录中存在的潜在情感价值,目的是抽取出其所包含情感内容的信息单元,将信息内容转化为计算机可识别的结构化数据,同时将基本情感划分为:“好爱,敬)、恶,喜乐),怒,哀,惧,欲”等七类,并对其进行量化,以此建立表情符号-情感指数矩阵。利用情感字典分析用户对话历史记录计算情感关键词,从而分析用户使用每一个表情符号时的前后情感变化,通过情感变化更加精准地计算用户聊天过程中需要的表情符号。再建立一个合适的时间序列模型,利用时间序列模型预测用户当前对话的情感趋势,从表情符号-情感矩阵关系中选取最接近用户情感趋势的表情组并生成用户推荐列表。同时,本发明提供了所构建情感字典的示例,主要涉及扩展情感字典、语气词辅助情感字典和标点符号辅助情感字典。以帮助用户在会话情景下,更好地选取适合当前语境的表情符号,从而为用户带来更精准的表情符号推荐。附图说明[0044]图1为本发明的表情符号推荐方法的总体框架图。[0045]图2为本发明的表情符号推荐方法的整体流程图。[0046]图3为本发明的值矩阵流程图。[0047]图4为本发明的表情符号推荐方法的时间序列分析流程图。具体实施方式[0048]以下结合附图对本发明进一步叙述,但本发明不局限于以下实施例。[0049]本发明提供了一种表情符号推荐方法的总体框架,如图1所示,该框架具体包括以下环节:[0050]SI1,发掘用户聊天记录,分析其对话的情感值;[0051]S12,构建表情符号-情感值矩阵的映射关系,构建情感字典;[0052]Sl3,利用情感字典分析对话历史记录计算情感关键词;[0053]S14,根据情感关键词计算会话的21维情感矩阵;[0054]S15,利用时间序列模型对用户当前对话的情感进行单步预测;[0055]S16,根据单步预测结果,在表情符号-情感值矩阵中根据最近邻生成推荐列表。[0056]根据本发明所提供的技术方案,用户在使用聊天工具时,能够及时准确的向用户推荐出符合当前用户情感与会话语境的表情符号,从而极大地方便了用户选择表情符号的复杂操作,增强了用户体验。[0057]图2为本发明所提供的表情符号推荐方法的整体流程图,该方法主要包括如下步骤:[0058]初始化表情符号-情感值矩阵,获取用户聊天数据,并对数据进行过滤、清洗;[0059]根据抽取规则,选取表情符号出现的前k行数据;[0060]将选取的前k条数据进行预处理,包括过滤、分词和去停用词的操作;[0061]构建情感字典对分词结果进行匹配,情感字典包括扩展情感字典、语气词辅助情感字典和标点符号辅助情感字典;[0062]计算21维情感值向量,并通过时间序列建模进行预处理;[0063]利用时间序列模型来预测下一步情感走势;[0064]通过查询表情符号-情感值矩阵做出相应的推荐结果,同时判断推荐结果成功与否,如若失败,即更新表情符号-情感值矩阵。[0065]在构建情感字典之前须对情感作以划分,如表1示例,通过划分情感,能够有效地建立一个参照的标准,同时对具体词语的实际情感表达做出相应的量化,也使得每一个表情符号与相应的情感值成一一映射的关系,而且也方便之后建立表情符号-情感值矩阵。[0066]表1情感划分示例[0068]情感字典的构建,除了增加原有词典中未出现的新词,还针对语气词、标点符号建立了两张辅助情感语气词表、情感标点符号表,用于辅助原有词典匹配计算结果,使其更加准确,具体介绍如下:[0069]1常规动词、名词[0070]情感词汇本体中使用了三元组表示一个词汇,info表示词汇的本体信息,包括编号、解释、对应英文翻译、词性、录入者信息;relation表示词汇与词汇直接的关系,包括同义关系、反义关系等;emotion表示词汇的情感信息,这里我们主要关注和使用这一块内容。[0071]Lexicoru=info,relation,emotion[0072]每一个词的emotion信息包括词性种类、词义数量、情感分类、强度、极性、子情感分类、子强度、子极性等。在原有27466条情感词的基础上,新增的扩充词汇的信息录入采用以下步骤:[0073]对于每一个新增词汇[0074]1.如果该词汇在原有情感词库中出现,则不作处理;[0075]2.如果该词汇没有在情感词库中出现,则:[0076]a.在info中查找该词的同义词,对于每一个同义词,在原有情感词库中进行查找,若找到该词,则将其情感划分计入新增词汇;[0077]b.若同义词在情感词库里也没有,则在情感词库中寻找其英文翻译对应的中文解释,并将其情感划分计入该新增词汇;[0078]3.情感强度计算采用计算其与标准词汇的互信息来初步确定情感强度,对不合理的计算结果需进行人工调整。[0079]⑵语气词辅助情感字典[0080]根据相关资料简单构建一个由常见语气词组成的语气词辅助情感表,见表2示例,其中,情感信息按照{情感符号I情感强度I褒贬倾向}格式化表现,情感强度由弱到强划为7个等级,正负面倾向按照0中性、1褒义、2贬义、3同时具备褒贬两性划分,针对出现在对话系统中的语气词做出相应的计算优化。[0081]表2语气词辅助情感表构建示例[0084]3标点符号辅助情感字典[0085]标点符号情感辅助表构建依照查询中文相关文献、字典等方式获取其使用方法及表达效果,再根据效果人工构建其在情感值上的影响方式,同时构建一个计算规则,在进行情感值计算的过程中考虑并加入这套规则,以期优化计算结果。下面列举了几个常用的标点符号复用以表情感的方法,构建了一个简单的标点符号情感字典,如下表3示例。[0086]表3标点符号语气情感辅助表示例[0089]图3为本发明所提供的表情符号推荐方法的更新表情符号-情感值矩阵流程图,主要用于描述每一个用户发送的表情符号在情感值上的表现形式,其计算步骤可以简单描述为:[0090]表情符号-情感值矩阵计算过程:[0091]预处理:[0092]将语料按照表情符号使用情况划分:对于每一个表情符号,选择发送该表情的前k条记录作为用于计算该表情符号情感值的一个实例。[0093]计算步骤:[0094]对于每一个表情符号:[0095]1.对每一个实例的每一行进行分词处理;[0096]2.对每次分词结果在情感字典中进行匹配,若找到,则将结果计入该实例的这条语句的21维情感向量中;[0097]3.根据语气词匹配规则和标点符号匹配规则查找语气词和标点符号使用情况,并将结果记入该句话的情感向量中;[0098]4.将实例中的每一维向量,累计求和,得到这一个实例的21维和向量;[0099]5.计算该表情的全部实例向量的均值,得到该表情符号的表情符号-情感值矩阵。[0100]图4为本发明所提供的表情符号推荐方法的时间序列分析流程图,时间序列分析法的基本思想是:通过事物变化历史行为来预测未来。即通过时间维度的历史数据计算其变化规律,并将该规律拓展至未来,从而对未来该事物的变化做出预测。时间序列分析的三种主要模型为:AR模型(Autoregressive、MA模型(MovingAverage和二者的结合ARMA,其中的ARMp,q—般公式为:[0101]Yt=Po+PiYt-i+P2Yt-2+L+PpYt-p+et+aiet-i+L+aqet-q[0102]式中,p,q为模型的自回归阶数和移动平均阶数;α,β为自回归系数和滑动平均系数;et为误差项;Yt为平稳、正态且零均值的时间序列。设差分算子为_:!-1,.对于非平稳序列{Xt}进行d阶差分运算得到的新序列仅是一个平稳序列,若假设该序列适合ARMAp,q模型,根据模型代数化方法,自回归系数多项式方程公式为:[0103]~i·''-'-[0104]其滑动平均系数多项式公式为:[0105]Θ⑻=I-Q1B-Q2B2——0qBq[0106]若数据不平稳,经过差分处理后,则使用AR頂Ap,d,q模型进行计算,其公式变换为:[0108]其中d就是实际进行平稳化处理中差分的次数,但一般不超过2次。[0109]ARMAp,q的模型参数的估计方法采用最小二乘估计方式,S卩:使残差平方和达到最小的那组参数值,设参数集合为:[0110]δ=⑻冲儿τ,则令;[0112]达到最小为原参数集合的最小二乘估计,其中,白噪声的方差禮的最小二乘估计为:[0114]由于数据的平稳性需要验证,因此,构建如附图4所示的时间序列分析流程模型,数据通过平稳性检测后,对于平稳序列,直接拟合ARMAp,q模型;对于非平稳序列,则经过差分运算后再次通过平稳性检验,最后拟合ARIMp,d,q模型。[0115]以上所述方法能在一定程度上改善基于频率的推荐效果,更为重要的是,本发明所提供的技术方法融合了用户情感趋势,利用时间序列分析用户下一步的情感变化,以此更为精准地生成用户表情符号推荐列表。除此之外,本说明书中的技术方法均采用递进式描述,所提到的各个模块的实施方案之间存在密切的关联,同时在权利要求书中所提到的关键技术方法,在本说明书中都有详细介绍。

权利要求:1.一种基于时序分析用户会话情感趋势的表情符号推荐方法,其特征在于,包括以下步骤:1发掘用户聊天记录来预处理并分析对话的情感值,以此构建表情符号在情感矩阵中的映射关系;2利用情感字典分析对话历史记录计算情感关键词;分为情感字典、语气词情感字典、标点符号情感字典;在用情感字典的时候考虑使用正向最大匹配法,将包含相同词语的不同长度的词语划分在用户字典上,以由长至短的方式排列,以便优先匹配最直接可寻的短语、词语;3通过情感关键词以及计算规则计算会话的21维情感向量;4通过时间序列模型对用户当前对话情感向量的发展进行单步预测,并将预测结果从映射关系中通过最近邻算法选取最接近用户情感趋势的表情组并生成推荐列表。2.根据权利要求1所述的一种基于时序分析用户会话情感趋势的表情符号推荐方法,其特征在于,所述的步骤1中获取用户聊天记录,分析对话的情感值,包括:挖掘用户聊天记录信息,分为文字信息、语音信息;使用用户已有的聊天记录等信息通过过滤、分词、去停用词操作,并和情感字典匹配建立属于个人独特的情感字典,用于标注表情符号的情感值。3.根据权利要求1所述的一种基于时序分析用户会话情感趋势的表情符号推荐方法,其特征在于,所述的步骤1构建表情符号在情感矩阵中的映射关系,包括通过计算其用户的情感值,得到一个表情-情感指数计算矩阵;统计每一个表情和其所能够表达的情感值的二维关系,所述的对表情符号-情感值矩阵的计算,包括表情符号-情感值映射关系主要用于描述每一个用户发送的表情符号在情感值上的表现形式;由于并不是每句话都包含可计算的情感,因此情感值计算过程中,应当抽取表情出现在前k条带有情感的话语,确保用于分词的用户字典和用于计算情感值的情感字典拥有相同的词条,以便最大化词典匹配效果。4.根据权利要求1所述的一种基于时序分析用户会话情感趋势的表情符号推荐方法,其特征在于,所述的步骤2中用户会话记录计算其情感值,包括:将情感按照Ekman划分方法,确定情感的划分准则,扩展出21小类;通过情感划分,建立一个参照标准,量化其具体词语的实际情感表达;利用情感字典分析对话历史记录计算情感关键词,包括建立相应的情感字典;针对用户历史会话记录,对其进行分词、提取处理,同时也要对语气词、标点符号建立辅助情感语气词表、情感标点符号表。5.根据权利要求1所述的一种基于时序分析用户会话情感趋势的表情符号推荐方法,其特征在于,所述的步骤3中通过情感关键词以及计算规则计算会话的21维情感向量,包括抽取用户会话记录的前η条带有感情的话语,进行分词、过滤等预处理;将处理后的语句在情感字典中进行查找匹配,计算其情感倾向的总期望,以此得到对应表情的21维情感向量。6.根据权利要求1所述的一种基于时序分析用户会话情感趋势的表情符号推荐方法,其特征在于,所述的步骤1对聊天记录信息的预处理,将对话情感数据按时间先后次序排列,构成一条随机时间序列,公式为:{ΕίΤΙΟΐΐοΠί}?ΐ—ΐΐ,Ϊ2,Ϊ3,’··,ΐη,将会话记录中重复出现的语句进行数据去重,对不完整信息进行曲线拟合+重采样处理。7.根据权利要求1所述的一种基于时序分析用户会话情感趋势的表情符号推荐方法,其特征在于,所述的步骤4中通过时间序列模型对用户当前对话情感向量的发展进行单步预测,包括提取会话历史记录,即通过时间维度的历史数据计算其变化规律,并将该规律拓展至未来,从而对未来该事物的变化做出预测;建立时间序列分析模型,AR模型、MA模型和二者的结合ARM,其中ARMp,q—般公式为:式中,P,q为模型的自回归阶数和移动平均阶数;α,β为自回归系数和滑动平均系数;ε*为误差项;Yt为平稳、正态且零均值的时间序列;设差分算子为—»,对于非平稳序列{Xt}进行d阶差分运算得到的新序列饮%:1是一个平稳序列,若假设该序列适合ARMAp,q模型,根据模型代数化方法,自回归系数多项式方程公式为:其滑动平均系数多项式公式为:若数据不平稳,经过差分处理后,则使用ARIMAp,d,q模型进行计算,其公式变换为:这里的d是实际进行平稳化处理中差分的次数,但不超过2次,ARMAp,q的模型参数的估计方法采用最小二乘估计方式,使残差平方和达到最小的那组参数值,设参数集合为:、则令:达到最小,为原参数集合的最小二乘估计,其中,白噪声的方差的最小二乘估计为:验证数据的平稳性,构建时间序列分析流程模型,数据通过平稳性检测后,对于平稳序列,直接拟合ARMp,q模型,对于非平稳序列,则经过差分运算后再次通过平稳性检验,最后拟合ARIMAp,d,q模型。8.根据权利要求1所述的一种基于时序分析用户会话情感趋势的表情符号推荐方法,其特征在于,所述的步骤4中选取最接近用户情感趋势的表情组并生成表情符号推荐列表,包括通过用户历史会话记录,利用情感趋势分析用户对于每一种表情符号的理解和使用习惯;结合表情符号-情感映射表,为用户推荐下一个符合其情感走向的表情符号。9.根据权利要求1所述的一种基于时序分析用户会话情感趋势的表情符号推荐方法,其特征在于,所述的步骤2中构建情感字典,包括情感词汇本体中使用了三元组表示一个词汇,info表示词汇的本体信息,包括编号、解释、对应英文翻译、词性、录入者信息;relation表示词汇与词汇直接的关系,包括同义关系、反义关系等;emotion表示词汇的情感信息,其表示为:Lexicom=info,relation,emotion每一个词的emotion信息包括词性种类、词义数量、情感分类、强度、极性、子情感分类、子强度、子极性等;所述的构建语气词情感字典,包括情感强度由弱到强划为7个等级,正负面倾向按照0中性、1褒义、2贬义、3同时具备褒贬两性划分,针对出现在对话系统中的语气词做出相应的计算优化;所述的语气词情感辅助表的构建依照常用动名词情感字典的构建规则,每一个语气词考虑自身、前面出现的字词、后面出现的字词三种情况;所述的构建标点符号情感字典,包括标点符号语气情感辅助表构建依照查询中文相关文献、字典等方式获取其使用方法即表达效果,再根据效果人工构建其在情感值上的影响方式。

百度查询: 西北大学 一种基于时序分析用户会话情感趋势的表情符号推荐方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。