买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于ILSTM的内涝水深预测与多因子时序分析方法_南京师范大学_202311627361.4 

申请/专利权人:南京师范大学

申请日:2023-11-30

公开(公告)日:2024-03-29

公开(公告)号:CN117332702B

主分类号:G06F30/27

分类号:G06F30/27;G06N3/0442;G06N3/084;G06F113/08;G06F119/12

优先权:

专利状态码:有效-授权

法律状态:2024.03.29#授权;2024.01.19#实质审查的生效;2024.01.02#公开

摘要:本发明提出了一种基于ILSTM(InterpretableLongShortTermMemory)的内涝水深预测与多因子时序分析方法,具体如下:改进传统LSTM的隐藏层更新方式以及引入注意力机制得到本研究所采用的神经网络ILSTM;获得研究区影响水深的可能因子数据以及实时监测内涝水深数据,对数据进行数据预处理,包括卡尔曼滤波法进行异常数据处理、数据标准化,划分数据集为训练集、验证集以及测试集。采用训练集进行模型训练并采用验证集进行超参数自动搜索调优算法给出具有区域特点的一组超参数,设定超参数后得到模型。测试集输入模型得到水深结果以及多因子时序贡献,采用均方根误差、拟合优度评估最终预测结果的准确性。模型捕获多因子的时序状态并且在模拟精度以及物理解释性上均有说服力。

主权项:1.一种基于ILSTM的内涝水深预测与多因子时序分析方法,其特征在于,包括以下步骤:S1:获取目标地区的水文气象数据作为样本数据以及对数据进行预处理;S2:构建由混合注意力机制融合的多层多参数内涝水深预测模型ILSTM;S3:对步骤S1所得的样本数据进行标准化操作,划分样本数据为训练集、验证集和测试集;S4:将步骤S3所得的训练集和验证集输入S2构建的内涝水深预测模型中,设置模型参数进行训练评估并使用超参数自动搜索和优化;S5:确定最优模型,利用测试集实现内涝水深预测;S6:在步骤S4的预测过程中捕获不同输入因子的时序变化动态,生成各因子时序贡献曲线;其中,步骤S2中ILSTM结构设计包括以下步骤:S21:ILSTM的层设计;S22:生成时序多因子贡献度;S23:混合注意机制设置,其中,步骤S21中ILSTM层设计包括以下步骤:S211:ILSTM包括输入层、改进的隐藏层以及输出层,计算公式如下: ct=ft☉ct-1+it☉jtht=ot☉tanhct其中:it表示输入门,ft表示遗忘门,ot表示输出门,ct表示记忆单元,xt表示输入项,σ运算符号表示按矩阵行求和,b表示偏置项,ht表示时间步长为t的隐藏状态矩阵,U表示输入到隐藏层的转换权重矩阵,W表示隐藏层之间的转换权重矩阵,ft表示隐藏层状态更新;其中,步骤S22中ILSTM生成时序多因子贡献度,包括以下步骤:S221构建多变量输入序列XT=[X1,…XT]以及目标序列yT=[y1,…yT]其中Xi以及yi均为列向量;S222:叠加输入序列和目标序列得到和yt都是多维向量;S223:通过学习非线性映射来预测目标序列的下一个值yT+1=FXT,FXT给出变量以及时间重要性度量,其中,步骤S23中ILSTM混合注意机制设计,包括以下步骤:S231:特征输入和序列编码,将输入的多变量转换成固定维度的向量表示,然后输入到LSTM网络进行序列编码,S232:注意力计算,上一步对输入的多变量时间序列进行循环遍历,每一时间步更新隐藏层状态,每个时间步,注意力机制计算每个变量特征对目标变量的影响权重,得到每个变量的时间状态贡献序列,S233:权重融合,计算得到的注意力权重与相应的多变量特征向量相乘,将加权特征向量进行求和,得到最后的加权表示,用于输入后续的全连接层用于目标变量的预测;其中,步骤S1中样本数据包括降雨数据、DEM数据、路网密度、空气湿度、温度、土地利用类型以及目标变量水深,进行标准化包括以下步骤:S11:将获取的数据进行预处理操作;S12:将数据按照时间组合,形成自变量-目标变量数据集[feature1,feature2,feature3……featurei,target],其中,步骤S11对数据进行预处理操作包括以下步骤:S111:数据预处理的数据主要包括降雨以及观测站所获得的水深数据,首先对获得的气象观测资料以及实测水深资料进行时间以及空间尺度比对;S112:根据气象站的地理位置,采用泰森多边形算法进行区域划分,得到各个观测站的降雨时间序列;S113:对不定长的降雨事件数据采用序列填充、序列截断方法,使每个降雨序列具有相同的长度,以适应模型输入的要求;S114:各个观测点所获得的水深数据由于传感器的工作时间以及采样率不均匀,对数据进行重采样使得与降雨量时间尺度以及序列长度上保持一致,对新增加的重采样空白区间进行数据插值,采用线性插值法、最近邻插值法、双线性插值以及双三次插值;S115:设定异常数据矫正规则;其中,步骤S3对样本数据进行标准化包括以下步骤:S31:建立水文数据集合W和降雨数据集合R,分别存储区域易涝点检测的内涝水文数据和区域所有雨量站采集的各个降雨事件数据,并根据时空信息将水文数据与降雨数据进行匹配;S32:对数据进行归一化处理,将所有数据范围缩小在0-1之间,最值归一化通过下式计算: 上式中,X是原始的序列数据,X*是归一化后的序列数据,Xmax表示内涝时序数据集中某个特征因子的序列最大值,Xmmin表示内涝时序数据集中某个特征因子的序列最小值;S33:将多要素内涝时序数据重构为有监督数据,假设当前时间为t,输入前三个时间步即t-3,t-2,t-1时刻的各要素历史观测值,预测未来两个时间步即t,t+1时刻的水深值;S34:通过序列填充的方法使每个序列具有相同的长度以满足模型输入的要求,其中序列填充方法为,默认填充值为0.0,在序列开始或结束部分进行填充,并转化为有监督数据;S35:设定异常数据判定规则,使用卡尔曼滤波法检查每一行数据记录,自动校正异常数据,并将校正后的数据作为模型输入数据;S36:将标准化后的数据划分成训练集train,验证集valid和测试集test;其中,步骤S4中模型训练以及超参数自动优化计算包括以下步骤:S41:初始化模型超参数;S42:使用自适应矩估计Adam优化算法优化学习率,更新学习率通过下式计算:mt=β1mt-1+1-β1gt, 上式中,gt表示梯度,mt表示梯度gt的一阶矩,vt表示梯度gt的二阶矩,表示mt、vt的偏置矫正,ε=10-8,η的默认值为0.001,β1和β2为平滑参数,分别选取0.9和0.99,表示t时刻的βi取值,θt表示t时刻的参数矩阵;S43:使用丢弃法处理过拟合现象,即在训练多层网络模型时,梯度前向传播和反向传播的过程中随机隐藏神经元,暂不参与此次训练;S44:训练模型并计算损失函数;S45:使用超参数自动搜索优化方法更新模型所采用超参数,使用相关模型评价指标评估每次模型训练所采用超参数的优劣;其中,步骤S45超参数自动搜索优化以及评估包括以下步骤:S451:输入融合多元水文气象数据的城市暴雨内涝时序数据集;S452:以可枚举的列表形式设置超参数如:批大小、隐藏层数、各个隐藏层的节点数、学习率、丢弃比例和迭代次数的取值范围,并且未合理衡量数据驱动的城市暴雨内涝水深预测模型的表现和性能引入相关评价指标;S453:构建基于多变量数据的可解释性ILSTM,由输入层、改进的隐藏层以及输出层组成;S454:超参数设置初始值,将训练集数据带入模型开展模型的学习训练;S455:使用本轮选定的各个样例超参数来设置预测模型结构,并且利用验证集数据自适应地调整模型参数;S456:在本轮选定的各个超参数下,使用测试机数据对模型表现的好坏进行衡量评估;S457:判断所有的超参数是否遍历结束,如果结束,则打印出各个参数的具体结果;其中,步骤S5确定最优模型并利用测试集实现内涝水深预测包括以下步骤:S51:根据超参数自动搜索算法返回的参数值设置最优模型;S52:利用测试集实现内涝水深预测;S53:对比模型给出的水深预测与真实水深值,进行模型精度评估;其中,步骤S53模型得出的水深预测以及真实水深之间的精度评估包括以下步骤:S531:设定模型中S457所选定的各个超参数,引入均方误差MSE、均方根误差RMSE、平均绝对误差MAE和拟合优度R2_score,使用测试集数据对模型所采用超参数的优劣即预测结果的准确性进行评估,具体计算公式如下: 其中,m代表样本中数据个数,yi代表模型预测水深值,表示真实观测值,表示真实观测平均值;其中,步骤S6不同输入自变量因子的时序贡献计算以及曲线生成包括以下步骤:S61:数据输入后,ILSTM在LSTM的基础上做出改进,变量N的隐藏状态矩阵为:输入到隐藏状态的转换隐藏层状态更新为: 其中:Wj表示过渡权重,表示向量沿轴计算,和用于捕获隐藏状态上一步的更新以及新的输入,使用jt替换标准LSTM的隐藏状态更新,bj表示偏置项,S62:变量混合注意追踪;S63:变量时序贡献曲线生成;其中,所述的S62混合注意机制追踪过程包括以下步骤:S621:对每个变量对应的隐藏状态进行时间关注,得到每个变量的隐藏状态集,S622:利用每个变量隐藏状态集推导出变量注意力。

全文数据:

权利要求:

百度查询: 南京师范大学 基于ILSTM的内涝水深预测与多因子时序分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。