买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于大数据的多渠道矛盾事件分析方法_南京视察者智能科技有限公司_202311789219.X 

申请/专利权人:南京视察者智能科技有限公司

申请日:2023-12-25

公开(公告)日:2024-03-15

公开(公告)号:CN117708704A

主分类号:G06F18/2415

分类号:G06F18/2415;G06N3/0442;G06F18/213;G06F18/214

优先权:

专利状态码:在审-公开

法律状态:2024.03.15#公开

摘要:本发明公开了一种基于大数据的多渠道矛盾事件分析方法,该方法包括如下步骤:采集矛盾事件数据和矛盾诉求人数据,提取事件特征标签和诉求人基础特征;得到矛盾诉求人关于某一事件的矛盾诉求路径和每个路径点的时间特征;基于矛盾诉求路径数据,矛盾诉求人特征数据,构建多渠道矛盾归因模型;划分数据集,训练多渠道矛盾归因模型,得到最终模型;根据训练得到的模型预测下个矛盾路径节点的状态并根据attention层的权重做出归因分析。本发明相比于普通的归因分析,该方法将自然语言处理技术运用到归因分析中,并将事件信息和时间信息和用户属性信息融入到双塔模型中,减少了模型的预测偏差,自动化程度高,能够减轻工作人员的工作压力,提高工作效率。

主权项:1.一种基于大数据的多渠道矛盾事件分析方法,其特征在于,包括如下步骤:步骤1,采集事件数据,进行事件特征标签提取,得到特征标签zt,对事件的诉求方式特征进行编号;步骤2,采集诉求人数据,对所述诉求人进行基础特征提取,包括姓名、年龄、性别、所属区域、事件类别;步骤3,以诉求人为主体,将关于某一事件的所有诉求记录按时间正序排序后,根据步骤1中所述的诉求方式编号,得到按编号排序的诉求路径;步骤4,根据步骤3得到的诉求路径,得到每个诉求记录点到最后诉求记录的时间并将上述连续的时间值进行离散化,得到时间特征kt;步骤5,构建多渠道矛盾事件归因模型,将步骤3中得到的诉求路径的最后一个路径点作为该诉求路径最终演化结果标签y,将除去最后一个路径点的矛盾诉求路径作为模型的输入并将其记为P,P=[x1,x2,…,xT],其中xt,t∈[1,T]为每个路径点编号的独热编码;将每个路径点xt,及其对应的特征标签zt、时间特征kt做embedding处理,令xt,zt,kt的embedding矩阵为W1,W2,W3,得到embedding后的向量为Xt=W1xt,Zt=W2zt,Kt=W3kt,并将它们进行拼接操作后得到向量dt=concatenationnXt,Zt,Kt将dt输入到循环神经网络中,得到每个路径点t的隐状态 将得到的每个路径点的隐状态输入到attention层中得到向量S,具体公式如下:vt=tanhWht+b S=Σtatht其中W,b,u都是可学习的参数;根据步骤2采集的诉求人数据,将其年龄、性别、所属区域、矛盾事件类别进行独热编码后得到独热编码向量gender,age,area,category,输入到embedding层后得到其向量表示,具体公式如下:Gender=W4*genderAge=W4*ageArea=W4*areaCategory=W4*category其中W4为可学习的embedding矩阵;将上述向量进行拼接后得到矛盾诉求人的特征向量表示q=concatenationGender,Age,Area,Category将向量q输入到神经网络中得到最终的输出向量Q;最后,将向量S和向量Q拼接后得到最终某诉求人关于某事件的诉求路径的向量表示G=concatenationS,Q将向量G输入到全连接层中,并选择输出值最大的类别作为最终的输出类别;步骤6,将数据集以8∶2:的比例划分为训练集、测试集,将训练集分为k份,每次使用k份中的一份作为验证集,其他作为训练集,通过k次训练得到k个模型,并利用测试集选择k个模型中效果最优的模型的超参数,最后利用所有数据和上述得到的模型最优超参数训练模型得到最终模型;步骤7,将矛盾诉求路径输入到模型中,得到下个矛盾节点的预测类别及概率,提取attention层中的权重信息at,根据权重的分配做出该矛盾诉求路径演变的归因分析。

全文数据:

权利要求:

百度查询: 南京视察者智能科技有限公司 一种基于大数据的多渠道矛盾事件分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。