买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】社交媒体网络事件传播关键时间预测方法、系统、介质_西安电子科技大学;西安电子科技大学广州研究院_202011150003.5 

申请/专利权人:西安电子科技大学;西安电子科技大学广州研究院

申请日:2020-10-23

公开(公告)日:2024-04-16

公开(公告)号:CN112418269B

主分类号:G06F18/214

分类号:G06F18/214;G06F18/23213;G06F16/43;G06Q10/04;G06Q50/00

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2021.03.16#实质审查的生效;2021.02.26#公开

摘要:本发明属于在线信息传播预测技术领域,公开了一种社交媒体网络事件传播关键时间预测方法、系统、介质,根据社交媒体网络事件在线信息的不同时间序列特征,进行类别划分;采用霍尔特线性趋势法对波动性过强的流行度时间序列进行平滑处理;识别预处理后的社交媒体网络事件传播的关键节点发生的时间区间;针对经过预处理后的时间序列数据进行时间窗口划分,基于在线信息数据提取时序、波动及文本情感特征;构建预测模型训练样本,根据训练样本和未来时间窗口数量,采用XGBoost算法训练预测模型;采用训练完成的模型预测社交媒体网络事件传播过程的关键节点发生的时间。本发明能有效预测社交媒体网络事件传播过程的关键节点发生时间。

主权项:1.一种社交媒体网络事件传播关键时间预测方法,其特征在于,所述社交媒体网络事件传播关键时间预测方法包括:根据社交媒体网络事件在线信息的不同时间序列特征,采用K-SCK-SpectralCentroid聚类算法进行类别划分;采用霍尔特线性趋势法对波动性过强的流行度时间序列进行平滑处理;识别预处理后的社交媒体网络事件传播的关键节点发生的时间区间;针对经过预处理后的时间序列数据进行时间窗口划分,基于在线信息数据提取时序、波动及文本情感特征;构建预测模型训练样本,根据训练样本和未来时间窗口数量,采用XGBoost算法训练预测模型;采用训练完成的模型预测社交媒体网络事件传播过程的爆发、顶峰、衰退关键节点发生的时间;所述关键节点发生的时间区间根据{pi1,pi2,...,piNi}识别,{pi1,pi2,...,piNi}为网络事件i在Ni个时间区间内的流行度演化时间序列;若存在Tip,满足Tip∈{1,2,3,...,Ni},并且piTip为时间序列{pi1,pi2,...,piNi}中的最大元素,则称“顶峰”节点发生在时间第Tip个区间;若存在Tib,满足Tib∈{2,3,4,...,Tip},并且[piTib-piTib-1]为{pi2-pi1,pi3-pi2,...,piTip-piTip-1}中的最大值,则称“爆发”节点发生在第Tib个时间区间;若存在Tif,满足Tif∈{Tip,Tip+1,...,Ni-1},此时流行度序列呈现下降趋势,并且[piTif-piTif+1]为{piTip+1-piTip+2,piTip+2-piTip+3,...,piNi-1-piNi}中的最大值,则称“衰退”节点发生在第Tif个时间区间;根据定义得到K个流行度时间序列爆发、顶峰和衰退节点发生的时间区间;所述构建预测模型训练样本,根据训练样本和未来时间窗口数量,采用XGBoost算法训练预测模型包括:1设定未来时间窗口数量M,M≥1;2将预测关键节点发生在未来的哪个时间窗口这一问题转化为关键节点是否会发生在未来第1,2,3,...,M个时间窗口,每个时间窗口的预测模型需要构建的样本,包括正样本与负样本;3记f为预测关键节点是否会发生的窗口数,1≤f≤M;4对于时间序列s,起始时间表示为关键节点发生的时间点表示为将时间区间等分为N+f个时间窗口,划分结果表示为关键节点发生在第N+f个时间窗口,如果预测时间点在第N个时间窗口,那么关键节点就会发生在预测时间点未来的第f个时间窗口;5重复步骤4,利用聚类得到的K个流行度时间序列构建正样本;6随机选择预测时间点为将时间区间等分为N+l+f个时间窗口,划分结果表示为l为随机选择的绝对值大于0的整数,l可以为正也可以为负,但要保证N+l+f大于0,当l为正整数时,关键节点发生的时间在第N+f个时间窗口之后;当l为负整数时,关键节点发生的时间在第N+f个时间窗口之前;7重复步骤6,利用聚类得到的K个流行度时间序列构建负样本;8根据样本训练模型,模型训练过程的关键参数为:决策树数量、决策树最大深度、学习率、叶节点最小权重、决策树权重改变最大步长,根据关键参数、构建的样本及提取的时序特征、波动特征、文本情感特征,训练出用于预测关键节点时间的XGBoost模型,训练过程采用网格搜索的方式确定模型最佳参数;9重复步骤4至8,为M个未来窗口训练相应的XGBoost关键节点预测模型;10重复步骤1至9,训练出用于预测爆发、顶点、衰退出现时间的XGBoost模型。

全文数据:

权利要求:

百度查询: 西安电子科技大学;西安电子科技大学广州研究院 社交媒体网络事件传播关键时间预测方法、系统、介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。