买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于GAT-Seq2seq模型的时空双注意力地铁客流短时预测方法_东南大学_202111278744.6 

申请/专利权人:东南大学

申请日:2021-10-31

公开(公告)日:2024-04-19

公开(公告)号:CN113962472B

主分类号:G06N3/0455

分类号:G06N3/0455;G06N3/0464;G06N3/049;G06F18/25;G06N3/042;G06Q50/40;G06Q50/26

优先权:

专利状态码:有效-授权

法律状态:2024.04.19#授权;2022.02.15#实质审查的生效;2022.01.21#公开

摘要:本发明公开了一种基于GAT‑Seq2seq模型的时空双注意力地铁客流短时预测方法,该方法包括以下步骤:获取地铁客流数据;数据预处理以及数据集划分;依据站点地理位置及运行线路生成图结构网络;构建基于多头注意力的GAT模型,输入训练集中的特征向量,结合站点图结构计算站点的空间关联性;将GAT输出的特征向量传入基于时序注意力的Seq2seq模型,提取客流的时间相关性,利用训练集计算均方误差,调整GAT中图结构的边权重矩阵和Seq2seq模型中的循环神经网络参数;使用测试集进行预测并评估模型。本发明利用时空双注意力机制解决了现有预测模型仅从短时间维度寻找特征,导致预测结果精度低的问题。

主权项:1.一种基于GAT-Seq2seq模型的时空双注意力地铁客流短时预测方法,其特征在于,所述方法包括如下步骤:步骤1,采集地铁客流相关数据,包括:地铁站点基本信息、地铁站点历史客流数据、历史气象数据和节假日数据;步骤2,对采集的地铁客流相关数据进行预处理后,将所述地铁站点历史客流数据和所述历史气象数据按时间先后排序生成时序化数据,将一天划分为若干时段,统计不同时段内的地铁进站客流量、降雨量、降雪量和温度数据,对上述统计得到的数据进行归一化后得到数据集,将所述数据集按照3:1:1的比例划分为训练集、验证集和测试集;步骤3,将所有地铁站点作为图结构的顶点,通过地铁运行线路及设置的距离阈值判断任意两个顶点之间是否存在边,生成地铁站点图结构G,顶点之间的边权重采用Xavier方法进行初始化,并服从均匀分布;步骤4,构建图注意力卷积神经网络模型GAT,使用步骤2中的训练集构建特征矩阵将所述特征矩阵作为所述网络模型GAT的输入,计算步骤3所述图结构G中各顶点之间的注意力系数,再加权求和得到考虑邻域站点影响后的特征矩阵具体过程如下:步骤41,图注意力卷积神经网络模型GAT的输入是一个四维特征矩阵其中,D为训练集数据的时间总跨度,T为一天中的时段个数,N为地铁站点个数,F为特征向量维数,则特征矩阵为: 其中,表示在第d天的第t个时段下,编号为n的地铁站点的F个影响客流变化的特征向量,d∈[1,D],t∈[1,T],n∈[1,N],D=1096,T=24,N=83,F=16;步骤42,对于图结构的顶点si,计算顶点si与邻居顶点sj之间的相关系数用于评估si与sj之间的相关性,计算公式如下: 其中,sj表示与si存在边的邻居顶点,表示与si存在边的邻居顶点集合,W表示边上权重值矩阵,||操作表示横向拼接操作,a·表示将高维特征映射到一个实数的变换函数,分别表示在第d天的第t个时段下,编号为i、j的地铁站点的F个影响客流变化的特征向量;步骤43,将相关系数归一化得到注意力系数具体计算公式如下: 其中,LeakyReLU·为归一化激活函数,sk表示与si存在边的邻居顶点;步骤44,根据注意力系数将特征向量加权求和得到新的特征向量具体计算公式如下: 其中,σ·为计算函数;步骤45,考虑M组不同的边上权重值矩阵W和a·函数来生成不同的再将横向拼接,最后求得平均值,具体计算公式如下: 其中,表示使用第m组权重W和a·函数计算得到的注意力系数,Wm表示第m组边上权重值矩阵;步骤46,对时间总跨度D内的每个时段的特征向量都进行步骤42-45得到新的特征向量将新的特征向量按步骤41中的结构拼接生成GAT的输出矩阵步骤5,构建基于时间注意力的时序到时序模型Seq2seq,将步骤4得到的特征矩阵输入所述时序到时序模型Seq2seq,经过编码层与解码层处理后,计算地铁进站客流量预测值与实际值之间的均方根误差,根据均方根误差和训练集对所述时序到时序模型Seq2seq中循环神经网络单元的超参数进行调整,并利用验证集对超参数进一步优化,从而得到训练好的GAT-Seq2seq模型;具体过程如下:步骤51,构建编码器,编码器采用循环神经网络单元,将步骤4得到的特征矩阵的每一天的数据都平铺展开,记作X,X={x1,x2,x3,…,xT},共有D个X向量,将循环神经网络单元记为p,t时刻的隐藏层状态变量ht只和t-1时刻的隐藏层状态变量ht-1与t时刻的输入xt有关,公式表达如下:ht=pxt,ht-1构建D个并行编码器,即D天中对每一天都构建包含T个时段的编码器,用于生成统一的上下文向量c,则上下文向量c由编码器所有的隐藏层状态变量变换得到: 其中,q·为变换函数;步骤52,考虑注意力机制构建解码器,解码器采用循环神经网络单元,记为g;解码器在t′时刻的隐藏层状态变量st′只与t′-1时刻的隐藏层状态变量st′-1、t′时刻的上下文向量ct′、t′-1时刻的输出变量yt′-1有关,公式表达如下:st′=gyt′-1,ct′,st′-1将解码器在t′时刻的上下文向量ct′分为两部分计算,前半部分只考虑最后一天的24个时段的时序信息,后半部分考虑之前所有日期下相同预测时段的信息,具体计算公式如下: 其中,表示编码器中第D天t时刻的隐藏层状态变量,表示编码器中第d天t′时刻的隐藏层状态变量,表示解码器中t′时刻的状态与编码器中第D天t时刻状态的时间注意力系数,表示解码器中t′时刻的状态与编码器中第d天t′时刻状态的时间注意力系数,时间注意力系数计算公式如下: 其中,表示解码器t′时刻的状态与编码器第D天t时刻状态的相关系数;表示解码器t′时刻的状态与编码器第d天t′时刻状态的相关系数;通过上述公式计算得到解码器中t′时刻对应的所有上下文向量ct′,用于计算预测数据yt′:yt′=σyt′-1,ct′,st′;步骤53,使用均方根误差RMSE作为模型的损失函数,根据训练集使用AdamSGD优化器对GAT-Seq2seq模型中的相关参数进行调整,并通过验证集进行超参数优化,从而得到训练好的GAT-Seq2seq模型;步骤6,将测试集输入所述训练好的GAT-Seq2seq模型,预测未来各个时段下地铁站点的客流量,并根据预测结果对所述训练好的GAT-Seq2seq模型进行评估。

全文数据:

权利要求:

百度查询: 东南大学 一种基于GAT-Seq2seq模型的时空双注意力地铁客流短时预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。