【发明授权】一种基于GAT-Seq2seq模型的时空双注意力地铁客流短时预测方法_东南大学_202111278744.6

导航：龙图腾网> 最新专利技术> 一种基于GAT-Seq2seq模型的时空双注意力地铁客流短时预测方法_东南大学_202111278744.6

申请/专利权人：东南大学

申请日：2021-10-31

公开（公告）日：2024-04-19

公开（公告）号：CN113962472B

主分类号：G06N3/0455

分类号：G06N3/0455;G06N3/0464;G06N3/049;G06F18/25;G06N3/042;G06Q50/40;G06Q50/26

优先权：

专利状态码：有效-授权

法律状态：2024.04.19#授权;2022.02.15#实质审查的生效;2022.01.21#公开

摘要：本发明公开了一种基于GAT‑Seq2seq模型的时空双注意力地铁客流短时预测方法，该方法包括以下步骤：获取地铁客流数据；数据预处理以及数据集划分；依据站点地理位置及运行线路生成图结构网络；构建基于多头注意力的GAT模型，输入训练集中的特征向量，结合站点图结构计算站点的空间关联性；将GAT输出的特征向量传入基于时序注意力的Seq2seq模型，提取客流的时间相关性，利用训练集计算均方误差，调整GAT中图结构的边权重矩阵和Seq2seq模型中的循环神经网络参数；使用测试集进行预测并评估模型。本发明利用时空双注意力机制解决了现有预测模型仅从短时间维度寻找特征，导致预测结果精度低的问题。

主权项：1.一种基于GAT-Seq2seq模型的时空双注意力地铁客流短时预测方法，其特征在于，所述方法包括如下步骤：步骤1，采集地铁客流相关数据，包括：地铁站点基本信息、地铁站点历史客流数据、历史气象数据和节假日数据；步骤2，对采集的地铁客流相关数据进行预处理后，将所述地铁站点历史客流数据和所述历史气象数据按时间先后排序生成时序化数据，将一天划分为若干时段，统计不同时段内的地铁进站客流量、降雨量、降雪量和温度数据，对上述统计得到的数据进行归一化后得到数据集，将所述数据集按照3:1:1的比例划分为训练集、验证集和测试集；步骤3，将所有地铁站点作为图结构的顶点，通过地铁运行线路及设置的距离阈值判断任意两个顶点之间是否存在边，生成地铁站点图结构G，顶点之间的边权重采用Xavier方法进行初始化，并服从均匀分布；步骤4，构建图注意力卷积神经网络模型GAT，使用步骤2中的训练集构建特征矩阵将所述特征矩阵作为所述网络模型GAT的输入，计算步骤3所述图结构G中各顶点之间的注意力系数，再加权求和得到考虑邻域站点影响后的特征矩阵具体过程如下：步骤41，图注意力卷积神经网络模型GAT的输入是一个四维特征矩阵其中，D为训练集数据的时间总跨度，T为一天中的时段个数，N为地铁站点个数，F为特征向量维数，则特征矩阵为：其中，表示在第d天的第t个时段下，编号为n的地铁站点的F个影响客流变化的特征向量，d∈[1,D]，t∈[1,T]，n∈[1,N]，D＝1096，T＝24，N＝83，F＝16；步骤42，对于图结构的顶点si，计算顶点si与邻居顶点sj之间的相关系数用于评估si与sj之间的相关性，计算公式如下：其中，sj表示与si存在边的邻居顶点，表示与si存在边的邻居顶点集合，W表示边上权重值矩阵，||操作表示横向拼接操作，a·表示将高维特征映射到一个实数的变换函数，分别表示在第d天的第t个时段下，编号为i、j的地铁站点的F个影响客流变化的特征向量；步骤43，将相关系数归一化得到注意力系数具体计算公式如下：其中，LeakyReLU·为归一化激活函数，sk表示与si存在边的邻居顶点；步骤44，根据注意力系数将特征向量加权求和得到新的特征向量具体计算公式如下：其中，σ·为计算函数；步骤45，考虑M组不同的边上权重值矩阵W和a·函数来生成不同的再将横向拼接，最后求得平均值，具体计算公式如下：其中，表示使用第m组权重W和a·函数计算得到的注意力系数，Wm表示第m组边上权重值矩阵；步骤46，对时间总跨度D内的每个时段的特征向量都进行步骤42-45得到新的特征向量将新的特征向量按步骤41中的结构拼接生成GAT的输出矩阵步骤5，构建基于时间注意力的时序到时序模型Seq2seq，将步骤4得到的特征矩阵输入所述时序到时序模型Seq2seq，经过编码层与解码层处理后，计算地铁进站客流量预测值与实际值之间的均方根误差，根据均方根误差和训练集对所述时序到时序模型Seq2seq中循环神经网络单元的超参数进行调整，并利用验证集对超参数进一步优化，从而得到训练好的GAT-Seq2seq模型；具体过程如下：步骤51，构建编码器，编码器采用循环神经网络单元，将步骤4得到的特征矩阵的每一天的数据都平铺展开，记作X，X＝{x1,x2,x3,…,xT}，共有D个X向量，将循环神经网络单元记为p，t时刻的隐藏层状态变量ht只和t-1时刻的隐藏层状态变量ht-1与t时刻的输入xt有关，公式表达如下：ht＝pxt,ht-1构建D个并行编码器，即D天中对每一天都构建包含T个时段的编码器，用于生成统一的上下文向量c，则上下文向量c由编码器所有的隐藏层状态变量变换得到：其中，q·为变换函数；步骤52，考虑注意力机制构建解码器，解码器采用循环神经网络单元，记为g；解码器在t′时刻的隐藏层状态变量st′只与t′-1时刻的隐藏层状态变量st′-1、t′时刻的上下文向量ct′、t′-1时刻的输出变量yt′-1有关，公式表达如下：st′＝gyt′-1,ct′,st′-1将解码器在t′时刻的上下文向量ct′分为两部分计算，前半部分只考虑最后一天的24个时段的时序信息，后半部分考虑之前所有日期下相同预测时段的信息，具体计算公式如下：其中，表示编码器中第D天t时刻的隐藏层状态变量，表示编码器中第d天t′时刻的隐藏层状态变量，表示解码器中t′时刻的状态与编码器中第D天t时刻状态的时间注意力系数，表示解码器中t′时刻的状态与编码器中第d天t′时刻状态的时间注意力系数，时间注意力系数计算公式如下：其中，表示解码器t′时刻的状态与编码器第D天t时刻状态的相关系数；表示解码器t′时刻的状态与编码器第d天t′时刻状态的相关系数；通过上述公式计算得到解码器中t′时刻对应的所有上下文向量ct′，用于计算预测数据yt′：yt′＝σyt′-1,ct′,st′；步骤53，使用均方根误差RMSE作为模型的损失函数，根据训练集使用AdamSGD优化器对GAT-Seq2seq模型中的相关参数进行调整，并通过验证集进行超参数优化，从而得到训练好的GAT-Seq2seq模型；步骤6，将测试集输入所述训练好的GAT-Seq2seq模型，预测未来各个时段下地铁站点的客流量，并根据预测结果对所述训练好的GAT-Seq2seq模型进行评估。

全文数据：

权利要求：

百度查询：东南大学一种基于GAT-Seq2seq模型的时空双注意力地铁客流短时预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：运样系统防出错方法、样本运样系统和样本分析仪_中元汇吉生物技术股份有限公司_202211445049.9

下一篇：一种多极断路器_上海正泰智能科技有限公司_202211450942.0

相关技术

运样系统防出错方法、样本运样系统和样本分析仪_中元汇吉生物技术股份有限公司_202211445049.9

一种多极断路器_上海正泰智能科技有限公司_202211450942.0

聚羟基烷酸酯的制造方法及其利用_株式会社钟化_202080065317.7

一种气相催化制备七氟异丁腈的方法_浙江省化工研究院有限公司_202211444469.5

一种电动黄油枪接头_永康市富宇汽保工具有限公司_202210924080.4

一种制备质谱及使用方法_中国科学院大连化学物理研究所_202211443750.7

一种尿液分析仪显微镜图像拼接方法_深圳迈瑞生物医疗电子股份有限公司_201811321489.7

加热器_浙江三花汽车零部件有限公司_202211445973.7

处理液喷洒方法及装置_沈阳芯源微电子设备股份有限公司_202211446236.9

一种基于深度学习的滴度值的处理方法及系统_中国医学科学院皮肤病医院(中国医学科学院皮肤病研究所)_202311372626.0

一种带磁场反射装置的高效无辐射电磁炉_山东富帅无辐射技术股份有限公司_202211451225.X

具有颜色校正部件的有机发光二极管显示器_3M创新有限公司_202080028470.2

注意力相关技术

基于注意力深层网络的局部放电信号故障智能检测方法_武汉纺织大学_202211444033.6

一种多尺度通道注意力网络的图像纹理合成方法及系统_云南大学_202111049838.6

一种基于坐标注意力的交通标志识别方法及系统_上海应用技术大学_202210275320.2

力感测装置_佩拉泰克控股有限公司_202180055895.7

算力选择方法、装置及系统_华为技术有限公司_202211454610.X

低压缩力导电性垫片_卓英社有限公司_202311517601.5

一种组合式低齿槽力永磁直线电机及其实现方法_河南理工大学_201910292760.7

受体亲和力偏好性的定点偶联聚乙二醇化白介素-2突变体及其用途_南京诺艾新生物技术有限公司_202311005600.2

一株高亲和力蜱传脑炎病毒单克隆抗体及在蜱传脑炎病毒高灵敏检测中的应用_中国人民解放军军事科学院军事医学研究院_202211444540.X

基于超像素自注意力机制的高光谱遥感图像分类方法_南京信息工程大学_202410454317.6

地铁相关技术

地铁管道施工辅助提升装置_北京瑞拓电子技术发展有限公司_202322776525.1

地铁牵引电机滤尘网罩_北京新兴日祥科技发展有限公司_202322339485.4

一种地铁轨道结构_辽宁省交通规划设计院有限责任公司_202322706483.4

一种地铁行车安全监测装置_李昕甜_202322347909.1

一种多功能的地铁信号警示设备_赵英涛_202322944689.0

一种地铁屏蔽门支撑装置_陶少波_202322485540.0

一种地铁矿山法隧道施工用钢构件转运车_中煤第三建设(集团)有限责任公司_202322413439.4

地铁站顶板的盾口挡墙的悬挂式脚手架_浙江省二建建设集团有限公司_202322787679.0

基于LSM的地铁接触网短路阻抗、短路模拟测试方法及系统_中铁一局集团电务工程有限公司_202310646143.9

一种基于电驱动的地铁轨道车_中铁四局集团有限公司_202410195711.2

时空相关技术

一种基于时空推演法的电力负荷特性指标测算方法_国网江西省电力有限公司经济技术研究院_202010806550.8

基于气烟囱热效应的水合物时空分布确定方法和系统_广州海洋地质调查局三亚南海地质研究所_202410295380.X

一种基于时空感知混合图的交通流量预测方法_香港科技大学(广州)_202311594614.2

一种多时空特征融合增强的网络流量分类模型及其方法_新疆大学_202410265000.8

一种基于时空相关性挖掘的风电功率预测方法_安徽大学_202410195166.7

一种基于扩散模型的风机时空数据异常检测方法_河北工业大学_202410355915.8

一种空气污染时空预测方法及相关设备_中南大学_202410158343.4

基于三维GIS平台的元宇宙时空编码方法_厦门精图信息技术有限公司_202210131118.2

基于时空图神经网络的资质认证方法及装置_上海淇毓信息科技有限公司_202311845805.1

一种基于时空特征的突发公共卫生事件虚假异常信息检测方法_南京审计大学_202310903122.0

龙图腾网&IPTOP

【发明授权】一种基于GAT-Seq2seq模型的时空双注意力地铁客流短时预测方法_东南大学_202111278744.6

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务