买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于深度多任务学习的城市AQI预测与空间细粒度AQI等级估计方法_浙江鸿程计算机系统有限公司_201810852241.7 

申请/专利权人:浙江鸿程计算机系统有限公司

申请日:2018-07-30

公开(公告)日:2018-12-21

公开(公告)号:CN109063908A

主分类号:G06Q10/04(2012.01)I

分类号:G06Q10/04(2012.01)I;G06Q50/26(2012.01)I;G01W1/00(2006.01)I;G01N33/00(2006.01)I

优先权:

专利状态码:有效-授权

法律状态:2020.10.27#授权;2019.01.15#实质审查的生效;2018.12.21#公开

摘要:本发明涉及一种基于深度多任务学习的城市AQI预测与空间细粒度AQI等级估计方法,本发明对于AQI预测,利用深度神经网络得到与之相关的多种城市大数据的表示,基于这些表示对有监测站区域的AQI进行预测。对于空间细粒度AQI等级估计,利用深度神经网络得到与之相关的多种城市大数据的表示,基于这些表示对无监测站区域的AQI等级进行估计。通过共享数据表示,对模型参数进行协同训练。本发明结合深度学习和多任务学习对有空气质量监测站的区域进行AQI预测,对无空气质量监测站的区域进行AQI等级估计,在普适计算、环保等领域具有广阔的应用前景。

主权项:1.一种基于深度多任务学习的城市AQI预测与空间细粒度AQI等级估计方法,其特征在于,包括预处理阶段、AQI预测阶段、空间细粒度AQI等级估计阶段、协同训练阶段,具体如下:1预处理阶段:1.1将城市地理空间划分成互不相交的网格区域,得到网格区域集合D={di,1≤i≤|D|},以及每个网格区域di的POI分布数据与路网分布数据;1.2以城市中心为中心点对地理空间进行划分,得到全局影响区域GR;1.3根据所有网格区域的POI分布数据以及路网分布数据构建三张二分图:网格区域‑网格区域图Gdd、网格区域‑POI类别图Gdp以及网格区域‑路段类别图Gdr;2AQI预测阶段:2.1假设当前时刻为t,输入一条AQI预测样本其中表示有监测站网格区域dfi过去S个时刻的短期时序数据、过去L个时刻的长期时序数据以及未来Z个时刻的天气预报序列,表示全局影响区域GR过去Q个时刻的时序数据;2.2利用深度神经网络,将网格区域di嵌入到一个维空间,得到其低维向量表示2.3利用CNN对dfi的低维向量表示进行处理,得到dfi的非时序信息表示2.4利用RNN对dfi的短期时序数据进行处理,得到短期气象信息、短期空气质量信息、短期交通信息以及短期企业自测信息的表示以及2.5利用LSTM RNN对dfi的长期时序数据以及天气预报序列进行处理,得到长期气象信息、长期空气质量信息、长期交通信息、长期企业自测信息以及天气预报信息的表示以及2.6利用RNN对全局影响区域GR的时序数据进行处理,得到全局影响区域的时序信息表示Grt;2.7将上述所有信息表示输入一个LSTM RNN,得到用于AQI预测的信息表示序列2.8将输入一个全连接层,全连接层的输出用Relu函数进行处理,得到dfi未来Z个时刻的AQI序列3空间细粒度AQI等级估计阶段:3.1假设当前时刻为t,输入一条空间细粒度AQI等级估计样本其中表示无监测站网格区域dei过去S个时刻的短期时序数据以及过去L个时刻的长期时序数据,分别表示有监测站网格区域集合中每个网格区域的时序数据;3.2利用深度神经网络,将网格区域dei、df1、df2、…、df|NF|嵌入到一个维空间,得到低维向量表示3.3利用CNN对网格区域dei、df1、df2、…、df|NF|的低维向量表示进行处理,得到网格区域的非时序信息表示3.4利用RNN对网格区域dei的短期时序数据进行处理,得到短期气象信息、短期交通信息以及短期企业自测信息的表示以及3.5利用LSTM RNN对网格区域dei的长期时序数据进行处理,得到长期气象信息、长期交通信息以及长期企业自测信息的表示以及3.6利用RNN对网格区域df1、df2、…、df|NF|的短期时序数据进行处理,得到每个网格区域的短期气象信息、短期空气质量信息、短期交通信息以及短期企业自测信息的表示3.7利用LSTM RNN对网格区域df1、df2、…、df|NF|的长期时序数据进行处理,得到每个网格区域的长期气象信息、长期空气质量信息、长期交通信息以及长期企业自测信息的表示3.8将上述所有时序信息表示与非时序信息表示进行拼接,得到用于空间细粒度AQI等级估计的信息表示3.9将输入softmax分类器,得到dei的AQI等级概率分布;3.10将概率分布中最大值对应的级别作为得到的dei在当前t时刻的AQI等级,即4协同训练阶段:4.1定义图嵌入目标函数LG;4.2获取带标签的AQI预测训练集FD,定义AQI预测目标函数LFD;4.3获取带标签的空间细粒度AQI等级估计训练集ED,定义空间细粒度AQI等级估计目标函数LED;4.4通过共享网格区域的信息表示,对上述模型参数进行协同训练,模型最终目标函数为LG+LFD+LED。

全文数据:一种基于深度多任务学习的城市AQI预测与空间细粒度AQI等级估计方法技术领域本发明涉及一种城市AQI预测与空间细粒度AQI等级估计方法,尤其涉及一种基于深度多任务学习的城市AQI预测与空间细粒度AQI等级估计方法。背景技术随着工业发展、人口膨胀,各类有害物质被排放到空气中,造成大气污染。很多城市建立了空气质量监测站对空气质量进行实时监控。对于某个地点,如果在其一定范围内没有设立空气质量监测站,则无法获得该地点的空气质量,且空气质量监测站无法对未来的空气质量进行预测。因此,有必要对无监测站区域的空气质量进行估计并对有监测站区域未来的空气质量进行预测,为人们提供在空间和时间上全面的空气质量信息,对于人们出行安排和政府部门环保决策具有重大意义。现有空气质量估计方法利用与空气质量相关的城市大数据例如气象、路网以及POI等,建立两个区域之间空气质量的关系,从而利用有监测站区域的空气质量来估计无监测站区域的空气质量。现有空气质量预测方法利用与空气质量相关的城市大数据,建立空气质量与相关特征之间的关系,从而对有监测站区域未来的空气质量进行预测。然而,现有空气质量建模方法对与空气质量相关的城市大数据考虑不充分,例如,没有考虑企业自测的污染废气排放等信息。其次,现有工作使用传统的特征工程提取特征,得到的特征往往不完备,且需要长时间的设计与验证。同时,由于监测站数量有限,所以训练样本缺乏,进而导致模型往往不能取得好的泛化性能。发明内容本发明为克服上述的不足之处,目的在于提供一种基于深度多任务学习的城市AQI预测与空间细粒度AQI等级估计方法,本发明主要包括预处理、AQI预测、空间细粒度AQI等级估计和协同训练;在预处理阶段,将城市空间划分成互不相交的网格区域,以城市中心为中心点,划分全局影响区域,结合所有网格区域的POI分布以及路网分布等数据构建二分图。在AQI预测阶段,利用深度神经网络得到有监测站网格区域的信息表示,包括时序信息表示与非时序信息表示,同时利用深度神经网络得到全局影响区域的时序信息表示,基于这些表示对有监测站网格区域的AQI进行预测。在空间细粒度AQI等级估计阶段,利用深度神经网络得到无监测站网格区域的信息表示,包括时序信息表示与非时序信息表示,基于这些表示对无监测站网格区域的AQI等级进行估计。在协同训练阶段,通过在图嵌入、AQI预测以及空间细粒度AQI等级估计间共享网格区域的信息表示,对模型参数进行协同训练。本发明解决了现有空气质量建模方法对与空气质量相关的城市大数据考虑不充分、传统特征工程的固有局限性以及训练样本缺乏导致的模型泛化性能弱的问题。本发明是通过以下技术方案达到上述目的:一种基于深度多任务学习的城市AQI预测与空间细粒度AQI等级估计方法,包括预处理阶段、AQI预测阶段、空间细粒度AQI等级估计阶段、协同训练阶段,具体如下:1预处理阶段:1.1将城市地理空间划分成互不相交的网格区域,得到网格区域集合D={di,1≤i≤|D|},以及每个网格区域di的POI分布数据与路网分布数据;1.2以城市中心为中心点对地理空间进行划分,得到全局影响区域GR;1.3根据所有网格区域的POI分布数据以及路网分布数据构建三张二分图:网格区域-网格区域图Gdd、网格区域-POI类别图Gdp以及网格区域-路段类别图Gdr;2AQI预测阶段:2.1假设当前时刻为t,输入一条AQI预测样本其中表示有监测站网格区域dfi过去S个时刻的短期时序数据、过去L个时刻的长期时序数据以及未来Z个时刻的天气预报序列,XtGR表示全局影响区域GR过去Q个时刻的时序数据;2.2利用深度神经网络,将网格区域di嵌入到一个维空间,得到其低维向量表示2.3利用CNN对dfi的低维向量表示进行处理,得到dfi的非时序信息表示2.4利用RNN对dfi的短期时序数据进行处理,得到短期气象信息、短期空气质量信息、短期交通信息以及短期企业自测信息的表示以及2.5利用LSTMRNN对dfi的长期时序数据以及天气预报序列进行处理,得到长期气象信息、长期空气质量信息、长期交通信息、长期企业自测信息以及天气预报信息的表示以及2.6利用RNN对全局影响区域GR的时序数据进行处理,得到全局影响区域的时序信息表示Grt;2.7将上述所有信息表示输入一个LSTMRNN,得到用于AQI预测的信息表示序列2.8将输入一个全连接层,全连接层的输出用Relu函数进行处理,得到dfi未来Z个时刻的AQI序列3空间细粒度AQI等级估计阶段:3.1假设当前时刻为t,输入一条空间细粒度AQI等级估计样本其中表示无监测站网格区域dei过去S个时刻的短期时序数据以及过去L个时刻的长期时序数据,分别表示有监测站网格区域集合NF={df1,df2,...,df|NF|}中每个网格区域的时序数据;3.2利用深度神经网络,将网格区域dei、df1、df2、…、df|NF|嵌入到一个维空间,得到低维向量表示3.3利用CNN对网格区域dei、df1、df2、…、df|NF|的低维向量表示进行处理,得到网格区域的非时序信息表示3.4利用RNN对网格区域dei的短期时序数据进行处理,得到短期气象信息、短期交通信息以及短期企业自测信息的表示以及3.5利用LSTMRNN对网格区域dei的长期时序数据进行处理,得到长期气象信息、长期交通信息以及长期企业自测信息的表示以及3.6利用RNN对网格区域df1、df2、…、df|NF|的短期时序数据进行处理,得到每个网格区域的短期气象信息、短期空气质量信息、短期交通信息以及短期企业自测信息的表示3.7利用LSTMRNN对网格区域df1、df2、…、df|NF|的长期时序数据进行处理,得到每个网格区域的长期气象信息、长期空气质量信息、长期交通信息以及长期企业自测信息的表示3.8将上述所有时序信息表示与非时序信息表示进行拼接,得到用于空间细粒度AQI等级估计的信息表示3.9将输入softmax分类器,得到dei的AQI等级概率分布;3.10将概率分布中最大值对应的级别作为得到的dei在当前t时刻的AQI等级,即4协同训练阶段:4.1定义图嵌入目标函数LG;4.2获取带标签的AQI预测训练集FD,定义AQI预测目标函数LFD;4.3获取带标签的空间细粒度AQI等级估计训练集ED,定义空间细粒度AQI等级估计目标函数LED;4.4通过共享网格区域的信息表示,对上述模型参数进行协同训练,模型最终目标函数为LG+LFD+LED。作为优选,所述的CNN结构为卷积层-池化层-卷积层-池化层,其中第一个卷积层由6个一维卷积核构成,感受野为3;第一个池化层的池化区域长度为2;第二个卷积层由12个一维卷积核构成,感受野为3;第二个池化层的池化区域长度为2;a卷积层:以数据δ为输入,对其进行核卷积,输出数据的局部特征关系:其中m表示层数,表示在m+1层的第j个特征图,η为卷积核,b为偏置量,σ为激活函数;b池化层:用最大池化操作对数据进行下采样:其中为在层的第i个神经单元的数值,ξ表示池化区域大小。作为优选,所述的RNN网络由RNN单元组成,每个RNN单元包括一个隐状态单元hj,对于一个典型的单层RNN网络,一个RNN单元的输入为当前时刻的输入数据xj,前一时刻单元的隐状态hj-1,在每个时间步隐状态都会更新;给定输入,一个RNN的输出根据下式进行计算:hj=tanhWhhj-1+Wxxj3其中Wh与Wx为权重矩阵。作为优选,所述的LSTMRNN网络由LSTMRNN单元组成,每个单元包括一个记忆单元cj,可以被读取、写入和重置;LSTMRNN通过三种门来控制信息的输入、输出以及记忆的更新:输入门ij、输出门oj以及遗忘门fj;对于一个典型的单层LSTMRNN网络,一个LSTMRNN单元的输入为当前时刻的输入数据xj,前一时刻单元的隐状态hj-1与记忆状态cj-1,在每个时间步隐状态都会更新;给定输入,一个LSTMRNN的输出可以根据下式进行计算:ij=tanhWixj+Uihj-1+bi4fj=tanhWfxj+Ufhj-1+bf5oj=tanhWoxj+Uohj-1+bo6hj=ojotanhcj9其中,cj和hj是LSTMRNN单元的输出,可以传递给下个时间步迭代的进行上述操作;操作符o代表点乘运算,Wi,Ui,Wf,Uf,Wo,Uo,Wc,Uc代表权重矩阵,bi,bf,bo,bc代表偏差向量。作为优选,所述在步骤2.8中,表示dfi在t+n时刻的AQI预测值,其计算公式如下:其中Wd为权重矩阵。作为优选,所述步骤3.9具体为:利用softmax分类器将映射为不同AQI等级l∈{1,2,..,K}的概率分布;softmax函数的计算公式如下:其中exp表示以自然常数为底的指数函数,Wl表示softmax权重矩阵的第l列向量,K为AQI等级数。作为优选,所述步骤4.1定义图嵌入目标函数LG的方法为:给定一张二分图G=V,E,其中V表示顶点的集合,E表示边的集合,需要最小化下述目标函数:其中,wij是顶点vi与vj之间边的权重,由顶点vi生成顶点vj的概率pvj|vi定义如下:其中,μi和μj分别是顶点vi和vj的嵌入表示,通过最小化公式12可以得到每个顶点vi的嵌入表示对于图Gdd、Gdp和Gdr,其相应的目标函数以及目标函数的总和如下所示:LG=LGdd+LGdp+LGdr17。作为优选,所述步骤4.2的具体方法为:带有AQI标签的AQI预测训练样本其中表示dfi在未来Z个时刻的真实AQI值;AQI预测训练集FD={fs1,fs2,...,fs|FD|};AQI预测在训练样本fs上的目标函数为:其中为dfi在t+n时刻AQI的预测值;AQI预测在训练集FD上的目标函数为:LFD=∑fs∈FDLfs19。作为优选,所述步骤4.3的具体方法为:带有AQI等级标签的空间细粒度AQI等级估计训练样本其中表示dei在t时刻的真实AQI等级;空间细粒度AQI等级估计训练样本集ED={es1,es2,...,es|ED|};空间细粒度AQI等级估计在训练样本es上的目标函数为:其中Wj为权重矩阵;空间细粒度AQI等级估计在训练集ED上的目标函数为:LED=∑es∈ED-Les21。作为优选,所述步骤4.4的模型最终目标函数如下:L=LG+LFD+LED=LG+∑fs∈FDLfs+∑es∈ED-Les22。本发明的有益效果在于:1本发明提出协同建模城市AQI预测与空间细粒度AQI等级估计的方法。利用AQI预测与空间细粒度AQI等级估计间的相关性,实现AQI预测模型与空间细粒度AQI等级估计模型泛化能力的提升;2本发明提出基于深度神经网络的时序信息表示构建方法。利用RNN得到气象、空气质量、交通以及企业自测等时序信息的短期表示与长期表示,为空气质量建模提供充分有效的时序信息表示;3本发明提出基于深度神经网络的非时序信息表示构建方法。利用深度神经网络将由所有网格区域、POI分布以及路网分布等非时序数据组成的信息网络图中的每个顶点嵌入到一个低维向量中,利用CNN对网格区域的低维向量进行处理,得到网格区域的非时序信息表示,为空气质量建模提供充分有效的非时序信息表示。附图说明图1是本发明的方法框架图;图2是本发明实施例的网格区域与网格影响区域示意图;图3是本发明实施例的全局影响区域与全局影响子区域示意图;图4是本发明的网格区域、POI类别以及路段类别组成的二分图;图5是本发明的网格区域非时序信息表示构建CNN网络结构图;图6是本发明的网格区域短期时序信息表示构建RNN网络结构图;图7是本发明的网格区域长期时序信息表示构建LSTMRNN网络结构图;图8是本发明的全局影响区域时序信息表示构建RNN网络结构图;图9是本发明的AQI预测LSTMRNN网络结构图。具体实施方式下面结合具体实施例对本发明进行进一步描述,但本发明的保护范围并不仅限于此:实施例:如图1所示,一种基于深度多任务学习的城市AQI预测与空间细粒度AQI等级估计方法,包括预处理、AQI预测、空间细粒度AQI等级估计和协同训练四个阶段,具体如下:I预处理阶段:步骤1:将城市地理空间划分成互不相交的网格区域,得到网格区域集合D={di,1≤i≤|D|},以及每个网格区域di的POI分布数据与路网分布数据。将城市地理空间划分成互不相交的网格区域,D={di,1≤i≤|D|}表示网格区域的集合,每个网格区域及其周围相邻的8个网格区域称作其网格影响区域。如图2所示,阴影部分表示一个网格区域,实线方框包含部分表示其网格影响区域。本发明假设同一个网格区域内的空气质量是一致的,将网格区域作为AQI预测与空间细粒度AQI等级估计的基本单元。为便于描述,将有监测站的网格区域记做dfi,将无监测站的网格区域记做dei。di的POI分布数据包括其网格影响区域内每类POI的数量,路网分布数据包括其网格影响区域内每类路段的总长度。步骤2:以城市中心为中心点对地理空间进行划分,得到全局影响区域GR。以城市中心O为中心点,用三个直径不同的圆以及四条线段将地理空间划分成互不相交的区域,如图3所示。其中,最大的圆包含的空间称作全局影响区域GR,由线段与圆弧组成的互不相交的子区域称作全局影响子区域,GR是全局影响子区域的集合,即GR={g1,g2,…,g|GR|},gi表示一个全局影响子区域。步骤3:根据所有网格区域的POI分布数据以及路网分布数据构建三张二分图:网格区域-网格区域图Gdd、网格区域-POI类别图Gdp以及网格区域-路段类别图Gdr。网格区域-网格区域图Gdd=D∪D,εdd表示网格区域间的物理距离关系,如图4中的a所示。其中D为网格区域的集合,εdd表示网格区域间的边集,每一对网格区域di和网格区域dj之间都有一条边eij,边权wij定义为di和dj之间的物理距离。网格区域-POI类别图Gdp=D∪P,εdp,表示网格影响区域内POI的分布,如图4中的b所示。其中,D表示网格区域的集合,P表示POI类别的集合,εdp表示网格区域和POI类别的边集。如果网格区域di的网格影响区域内有类别为pj的POI,则网格区域di和POI类别pj之间存在一条边eij,边权wij定义为di的网格影响区域内包含的类别为pj的POI数量。网格区域-路段类别图Gdr=D∪RD,εdr,表示网格影响区域内路段的分布,如图4中的c所示。其中,D表示网格区域的集合,RD表示路段类别的集合,εdr表示网格区域和路段类别的边集。如果网格区域di的网格影响区域内有类别为rj的路段,则网格区域di和路段类别rj之间存在一条边eij,边权wij定义为di的网格影响区域内包含的类别为rj的路段总长度。IIAQI预测阶段:步骤1:假设当前时刻为t,输入一条AQI预测样本其中表示有监测站网格区域dfi过去S个时刻的短期时序数据、过去L个时刻的长期时序数据以及未来Z个时刻的天气预报序列,表示全局影响区域GR过去Q个时刻的时序数据。dfi过去S个时刻的短期时序数据包括短期气象序列短期空气质量序列短期交通序列以及短期企业自测序列过去L个时刻的长期时序数据包括长期气象序列长期空气质量序列长期交通序列以及长期企业自测序列令表示df未来Z个时刻的天气预报序列。其中与分别表示全局影响子区域gi过去Q个时刻的气象序列与空气质量序列。步骤2:利用深度神经网络,将网格区域di嵌入到一个维空间,得到其低维向量表示步骤3:利用CNN对dfi的低维向量表示进行处理,得到dfi的非时序信息表示将网格区域dfi的低维向量表示输入到CNN,通过一系列卷积和池化操作,获得与空气质量建模相关的dfi的非时序信息表示本发明构建的CNN结构为卷积层-池化层-卷积层-池化层,如图5所示,其中第一个卷积层由6个一维卷积核构成,感受野为3。第一个池化层的池化区域长度为2。第二个卷积层由12个一维卷积核构成,感受野为3。第二个池化层的池化区域长度为2。a卷积层:以数据δ为输入,对其进行核卷积,输出数据的局部特征关系:其中m表示层数,表示在m+1层的第j个特征图,η为卷积核,b为偏置量,σ为激活函数。b池化层:用最大池化操作对数据进行下采样:其中为在m+1层的第i个神经单元的数值,ξ表示池化区域大小。步骤4:利用RNN对dfi的短期时序数据进行处理,得到短期气象信息、短期空气质量信息、短期交通信息以及短期企业自测信息的表示以及本发明利用RNN处理dfi的短期时序数据。RNN网络由RNN单元组成,每个RNN单元包括一个隐状态单元hj,对于一个典型的单层RNN网络,一个RNN单元的输入为当前时刻的输入数据xj,前一时刻单元的隐状态hj-1,在每个时间步隐状态都会更新。给定输入,一个RNN的输出根据下式进行计算:hj=tanhWhhj-1+Wxxj3其中Wh与Wx为权重矩阵。本发明用来处理网格区域短期时序数据的RNN网络结构如图6所示,由两层RNN节点组成。当网络的输入分别为以及时,相应的输出分别为以及步骤5:利用LSTMLongShort-TermMemoryRNN对dfi的长期时序数据以及天气预报序列进行处理,得到长期气象信息、长期空气质量信息、长期交通信息、长期企业自测信息以及天气预报信息的表示以及本发明利用LSTMRNN处理dfi的长期时序数据以及天气预报序列。LSTMRNN网络由LSTMRNN单元组成,每个单元包括一个记忆单元cj,可以被读取、写入和重置。LSTMRNN通过三种门来控制信息的输入、输出以及记忆的更新:输入门ij、输出门oj以及遗忘门fj。对于一个典型的单层LSTMRNN网络,一个LSTMRNN单元的输入为当前时刻的输入数据xj,前一时刻单元的隐状态hj-1与记忆状态cj-1,在每个时间步隐状态都会更新。给定输入,一个LSTMRNN的输出可以根据下式进行计算。ji=tanhWixj+Uihj-1+bi4fj=tanhWfxj+Ufhj-1+bf5oj=tanhWoxj+Uohj-1+bo6hj=ojotanhcj9其中,cj和hj是LSTMRNN单元的输出,可以传递给下个时间步迭代的进行上述操作。操作符o代表点乘运算,Wi,Ui,Wf,Uf,Wo,Uo,Wc,Uc代表权重矩阵,bi,bf,bo,bc代表偏差向量。本发明用来处理网格区域长期时序数据的LSTMRNN网络结构如图7所示,由两层LSTMRNN结点组成。当网络的输入分别为以及时,相应的输出分别为以及步骤6:利用RNN对全局影响区域GR的时序数据进行处理,得到全局影响区域的时序信息表示Grt。本发明利用RNN处理全局影响区域的时序数据,如图8所示,采用的RNN网络由一层RNN结点组成,当输入为Grt中的每个序列时,相应的输出的集合为其中步骤7:将上述所有信息表示输入一个LSTMRNN,得到用于AQI预测的信息表示序列将上述所有信息表示进行拼接后输入如图9所示的由一层LSTMRNN结点组成的LSTMRNN,其输出为步骤8:将输入一个全连接层,全连接层的输出用Relu函数进行处理,得到dfi未来Z个时刻的AQI序列表示dfi在t+n时刻的AQI预测值,其计算公式如下:其中Wd为权重矩阵。III空间细粒度AQI等级估计阶段:步骤1:假设当前时刻为t,输入一条空间细粒度AQI等级估计样本其中表示无监测站网格区域dei过去S个时刻的短期时序数据以及过去L个时刻的长期时序数据,分别表示有监测站网格区域集合NF={df1,df2,...,df|NF|}中每个网格区域的时序数据。dei的短期时序数据包括短期气象序列、短期交通序列与短期企业自测序列,长期时序数据包括长期气象序列、长期交通序列与长期企业自测序列。NF中每个网格区域的时序数据包括过去S个时刻的短期气象序列、短期空气质量序列、短期交通序列、短期企业自测序列,过去L个时刻的长期气象序列、长期空气质量序列、长期交通序列、长期企业自测序列。步骤2:利用深度神经网络,将网格区域dei、df1、df2、…、df|NF|嵌入到一个维空间,得到低维向量表示步骤3:利用CNN对网格区域dei、df1、df2、…、df|NF|的低维向量表示进行处理,得到网格区域的非时序信息表示将网格区域dei、df1、df2、…、df|NF|的低维向量表示输入到如图5所示的结构为卷积层-池化层-卷积层-池化层的CNN,通过一系列卷积和池化操作,获得与空气质量建模相关的网格区域非时序信息表示步骤4:利用RNN对网格区域dei的短期时序数据进行处理,得到短期气象信息、短期交通信息以及短期企业自测信息的表示以及本发明利用如图6所示的由两层RNN结点组成的RNN处理dei的短期气象序列、短期交通序列以及短期企业自测序列,相应的输出为以及步骤5:利用LSTMRNN对网格区域dei的长期时序数据进行处理,得到长期气象信息、长期交通信息以及长期企业自测信息的表示以及本发明利用如图7所示的由两层LSTMRNN结点组成的LSTMRNN处理dei的长期气象序列、长期交通序列以及长期企业自测序列,相应的输出为以及步骤6:利用RNN对网格区域df1、df2、…、df|NF|的短期时序数据进行处理,得到每个网格区域的短期气象信息、短期空气质量信息、短期交通信息以及短期企业自测信息的表示本发明利用如图6所示的由两层RNN结点组成的RNN处理df1、df2、…、df|NF|的短期气象序列、短期空气质量序列、短期交通序列以及短期企业自测序列,相应的输出为步骤7:利用LSTMRNN对网格区域df1、df2、…、df|NF|的长期时序数据进行处理,得到每个网格区域的长期气象信息、长期空气质量信息、长期交通信息以及长期企业自测信息的表示本发明利用如图7所示的由两层LSTMRNN结点组成的LSTMRNN处理df1、df2、…、df|NF|的长期气象序列、长期空气质量序列、长期交通序列以及长期企业自测序列,相应的输出为步骤8:将上述所有时序信息表示与非时序信息表示进行拼接,得到用于空间细粒度AQI等级估计的信息表示步骤9:将输入softmax分类器,得到dei的AQI等级概率分布。利用softmax分类器将映射为不同AQI等级l∈{1,2,..,K}的概率分布。softmax函数的计算公式如下:其中exp表示以自然常数为底的指数函数,Wl表示softmax权重矩阵的第l列向量。K为AQI等级数。步骤10:将概率分布中最大值对应的级别作为得到的dei在当前t时刻的AQI等级,即IV协同训练阶段:应用上述模型前,需要对模型参数进行训练。步骤1:定义图嵌入目标函数LG。给定一张二分图G=V,E,其中V表示顶点的集合,E表示边的集合,需要最小化下述目标函数:其中,wij是顶点vi与vj之间边的权重,由顶点vi生成顶点vj的概率pvj|vi定义如下:其中,μi和μj分别是顶点vi和vj的嵌入表示,通过最小化公式12,可以得到每个顶点vi的嵌入表示对于图Gdd、Gdp和Gdr,其相应的目标函数以及目标函数的总和如下所示:LG=LGdd+LGdp+LGdr17步骤2:获取带标签的AQI预测训练集FD,定义AQI预测目标函数LFD。带有AQI标签的AQI预测训练样本其中表示dfi在未来Z个时刻的真实AQI值。AQI预测训练集FD={fs1,fs2,...,fs|FD|}。AQI预测在训练样本fs上的目标函数为:其中为dfi在t+n时刻AQI的预测值。AQI预测在训练集FD上的目标函数为:步骤3:获取带标签的空间细粒度AQI等级估计训练集ED,定义空间细粒度AQI等级估计目标函数LED。带有AQI等级标签的空间细粒度AQI等级估计训练样本其中表示dei在t时刻的真实AQI等级。空间细粒度AQI等级估计训练样本集ED={es1,es2,...,es|ED|}。空间细粒度AQI等级估计在训练样本es上的目标函数为:其中Wj为权重矩阵。空间细粒度AQI等级估计在训练集ED上的目标函数为:LED=∑es∈ED-Les21步骤4:通过共享网格区域的信息表示,对上述模型参数进行训练,模型最终目标函数为LG+LFD+LED。为实现协同建模,图嵌入、AQI预测以及空间细粒度AQI等级估计共享网格区域的信息表示,模型最终目标函数如下:L=LG+LFD+LED=LG+∑fs∈FDLfs+∑es∈ED-Les22以上的所述乃是本发明的具体实施例及所运用的技术原理,若依本发明的构想所作的改变,其所产生的功能作用仍未超出说明书及附图所涵盖的精神时,仍应属本发明的保护范围。

权利要求:1.一种基于深度多任务学习的城市AQI预测与空间细粒度AQI等级估计方法,其特征在于,包括预处理阶段、AQI预测阶段、空间细粒度AQI等级估计阶段、协同训练阶段,具体如下:1预处理阶段:1.1将城市地理空间划分成互不相交的网格区域,得到网格区域集合D={di,1≤i≤|D|},以及每个网格区域di的POI分布数据与路网分布数据;1.2以城市中心为中心点对地理空间进行划分,得到全局影响区域GR;1.3根据所有网格区域的POI分布数据以及路网分布数据构建三张二分图:网格区域-网格区域图Gdd、网格区域-POI类别图Gdp以及网格区域-路段类别图Gdr;2AQI预测阶段:2.1假设当前时刻为t,输入一条AQI预测样本其中表示有监测站网格区域dfi过去S个时刻的短期时序数据、过去L个时刻的长期时序数据以及未来Z个时刻的天气预报序列,表示全局影响区域GR过去Q个时刻的时序数据;2.2利用深度神经网络,将网格区域di嵌入到一个维空间,得到其低维向量表示2.3利用CNN对dfi的低维向量表示进行处理,得到dfi的非时序信息表示2.4利用RNN对dfi的短期时序数据进行处理,得到短期气象信息、短期空气质量信息、短期交通信息以及短期企业自测信息的表示以及2.5利用LSTMRNN对dfi的长期时序数据以及天气预报序列进行处理,得到长期气象信息、长期空气质量信息、长期交通信息、长期企业自测信息以及天气预报信息的表示以及2.6利用RNN对全局影响区域GR的时序数据进行处理,得到全局影响区域的时序信息表示Grt;2.7将上述所有信息表示输入一个LSTMRNN,得到用于AQI预测的信息表示序列2.8将输入一个全连接层,全连接层的输出用Relu函数进行处理,得到dfi未来Z个时刻的AQI序列3空间细粒度AQI等级估计阶段:3.1假设当前时刻为t,输入一条空间细粒度AQI等级估计样本其中表示无监测站网格区域dei过去S个时刻的短期时序数据以及过去L个时刻的长期时序数据,分别表示有监测站网格区域集合中每个网格区域的时序数据;3.2利用深度神经网络,将网格区域dei、df1、df2、…、df|NF|嵌入到一个维空间,得到低维向量表示3.3利用CNN对网格区域dei、df1、df2、…、df|NF|的低维向量表示进行处理,得到网格区域的非时序信息表示3.4利用RNN对网格区域dei的短期时序数据进行处理,得到短期气象信息、短期交通信息以及短期企业自测信息的表示以及3.5利用LSTMRNN对网格区域dei的长期时序数据进行处理,得到长期气象信息、长期交通信息以及长期企业自测信息的表示以及3.6利用RNN对网格区域df1、df2、…、df|NF|的短期时序数据进行处理,得到每个网格区域的短期气象信息、短期空气质量信息、短期交通信息以及短期企业自测信息的表示3.7利用LSTMRNN对网格区域df1、df2、…、df|NF|的长期时序数据进行处理,得到每个网格区域的长期气象信息、长期空气质量信息、长期交通信息以及长期企业自测信息的表示3.8将上述所有时序信息表示与非时序信息表示进行拼接,得到用于空间细粒度AQI等级估计的信息表示3.9将输入softmax分类器,得到dei的AQI等级概率分布;3.10将概率分布中最大值对应的级别作为得到的dei在当前t时刻的AQI等级,即4协同训练阶段:4.1定义图嵌入目标函数LG;4.2获取带标签的AQI预测训练集FD,定义AQI预测目标函数LFD;4.3获取带标签的空间细粒度AQI等级估计训练集ED,定义空间细粒度AQI等级估计目标函数LED;4.4通过共享网格区域的信息表示,对上述模型参数进行协同训练,模型最终目标函数为LG+LFD+LED。2.根据权利要求1所述的一种基于深度多任务学习的城市AQI预测与空间细粒度AQI等级估计方法,其特征在于:所述的CNN结构为卷积层-池化层-卷积层-池化层,其中第一个卷积层由6个一维卷积核构成,感受野为3;第一个池化层的池化区域长度为2;第二个卷积层由12个一维卷积核构成,感受野为3;第二个池化层的池化区域长度为2;a卷积层:以数据δ为输入,对其进行核卷积,输出数据的局部特征关系:其中m表示层数,表示在m+1层的第j个特征图,η为卷积核,b为偏置量,σ为激活函数;b池化层:用最大池化操作对数据进行下采样:其中为在m+1层的第i个神经单元的数值,ξ表示池化区域大小。3.根据权利要求1所述的一种基于深度多任务学习的城市AQI预测与空间细粒度AQI等级估计方法,其特征在于:所述的RNN网络由RNN单元组成,每个RNN单元包括一个隐状态单元hj,对于一个典型的单层RNN网络,一个RNN单元的输入为当前时刻的输入数据xj,前一时刻单元的隐状态hj-1,在每个时间步隐状态都会更新;给定输入,一个RNN的输出根据下式进行计算:hj=tanhWhhj-1+Wxxj3其中Wh与Wx为权重矩阵。4.根据权利要求1所述的一种基于深度多任务学习的城市AQI预测与空间细粒度AQI等级估计方法,其特征在于:所述的LSTMRNN网络由LSTMRNN单元组成,每个单元包括一个记忆单元cj,可以被读取、写入和重置;LSTMRNN通过三种门来控制信息的输入、输出以及记忆的更新:输入门ij、输出门oj以及遗忘门fj;对于一个典型的单层LSTMRNN网络,一个LSTMRNN单元的输入为当前时刻的输入数据xj,前一时刻单元的隐状态hj-1与记忆状态cj-1,在每个时间步隐状态都会更新;给定输入,一个LSTMRNN的输出可以根据下式进行计算:其中,cj和hj是LSTMRNN单元的输出,可以传递给下个时间步迭代的进行上述操作;操作符代表点乘运算,Wi,Ui,Wf,Uf,Wo,Uo,Wc,Uc代表权重矩阵,bi,bf,bo,bc代表偏差向量。5.根据权利要求1所述的一种基于深度多任务学习的城市AQI预测与空间细粒度AQI等级估计方法,其特征在于:所述在步骤2.8中,表示dfi在t+n时刻的AQI预测值,其计算公式如下:其中Wd为权重矩阵。6.根据权利要求1所述的一种基于深度多任务学习的城市AQI预测与空间细粒度AQI等级估计方法,其特征在于:所述步骤3.9具体为:利用softmax分类器将映射为不同AQI等级l∈{1,2,..,K}的概率分布;softmax函数的计算公式如下:其中exp表示以自然常数为底的指数函数,Wl表示softmax权重矩阵的第l列向量,K为AQI等级数。7.根据权利要求1所述的一种基于深度多任务学习的城市AQI预测与空间细粒度AQI等级估计方法,其特征在于:所述步骤4.1定义图嵌入目标函数LG的方法为:给定一张二分图G=V,E,其中V表示顶点的集合,E表示边的集合,需要最小化下述目标函数:其中,wij是顶点vi与vj之间边的权重,由顶点vi生成顶点vj的概率pvj|vi定义如下:其中,μi和μj分别是顶点vi和vj的嵌入表示,通过最小化公式12可以得到每个顶点vi的嵌入表示对于图Gdd、Gdp和Gdr,其相应的目标函数以及目标函数的总和如下所示:LG=LGdd+LGdp+LGdr17。8.根据权利要求1所述的一种基于深度多任务学习的城市AQI预测与空间细粒度AQI等级估计方法,其特征在于:所述步骤4.2的具体方法为:带有AQI标签的AQI预测训练样本其中表示dfi在未来Z个时刻的真实AQI值;AQI预测训练集FD={fs1,fs2,...,fs|FD|};AQI预测在训练样本fs上的目标函数为:其中为dfi在t+n时刻AQI的预测值;AQI预测在训练集FD上的目标函数为:LFD=∑fs∈FDLfs19。9.根据权利要求1所述的一种基于深度多任务学习的城市AQI预测与空间细粒度AQI等级估计方法,其特征在于:所述步骤4.3的具体方法为:带有AQI等级标签的空间细粒度AQI等级估计训练样本其中表示dei在t时刻的真实AQI等级;空间细粒度AQI等级估计训练样本集ED={es1,es2,...,es|ED|};空间细粒度AQI等级估计在训练样本es上的目标函数为:其中Wj为权重矩阵;空间细粒度AQI等级估计在训练集ED上的目标函数为:LED=∑es∈ED-Les21。10.根据权利要求1所述的一种基于深度多任务学习的城市AQI预测与空间细粒度AQI等级估计方法,其特征在于:所述步骤4.4的模型最终目标函数如下:L=LG+LFD+LED=LG+∑fs∈FDLfs+∑es∈ED-Les22。

百度查询: 浙江鸿程计算机系统有限公司 一种基于深度多任务学习的城市AQI预测与空间细粒度AQI等级估计方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。