买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于回归注意力生成对抗网络数据增强的回归建模方法_浙江大学_202010994598.6 

申请/专利权人:浙江大学

申请日:2020-09-21

公开(公告)日:2024-04-12

公开(公告)号:CN112199637B

主分类号:G06F17/18

分类号:G06F17/18;G06N3/0475;G06N3/091;G06N3/045

优先权:

专利状态码:有效-授权

法律状态:2024.04.12#授权;2021.01.26#实质审查的生效;2021.01.08#公开

摘要:本发明公开了一种基于回归注意力生成对抗网络数据增强的回归建模方法,回归注意力生成对抗网络在生成器和判别器都加入注意力机制;生成器中的注意力模块1利用生成器输出生成数据的自变量和因变量构建了回归损失;同时,真实数据也对注意力模块1进行了微调;判别器中的注意力模块2利用真实数据和生成数据回归损失的差值来构建新的损失;它通过最小化这个损失来提取包含最大回归信息的特征,并且这个特征包含了最大化的真实数据和生成数据之间的回归差异信息,有利于判别器对回归信息的考量。本发明基于回归注意力生成对抗网络利用生成的数据对原始数据进行增强,再利用数据驱动方法进行回归建模,有效得提升了回归模型的性能和预测精度。

主权项:1.一种基于回归注意力生成对抗网络数据增强的回归建模方法,其特征在于,包括以下步骤:1收集原始数据,在去除离群值和数据归一化后得到自变量xi和yi,i=1~M;2可以将xi和yi拼接重构,得到新的数据集D=[X,Y]={[x1,y1],[x2,y2],…,[xM,yM]},M∈Z;3用D无监督地训练一个RA-GAN,并直至其收敛;4用训练好的RA-GAN生成虚拟的数据D′=[X′,Y′]={[x′1,y′1],[x′2,y′2],…,[x′N,y′N]},N∈Z;5可以将生成数据加入到真实数据集D中,进行数据增强,得到增强数据集;6将增强数据集D的数据分割成自变量{X,X′}和因变量{Y,Y′},用于训练回归模型;7将测试数据的自变量输入到训练好的回归模型中,得到预测的因变量;所述回归注意力生成对抗网络引入了两个注意力模块,分别是生成器中的注意力模块1和判别器中的注意力模块2;生成器是一个多层感知机,输入层输入的是随机噪声z,输出层输出生成数据D′;生成数据被分割成自变量x′j和因变量yj′,j∈[1,2,…,N];注意力模块1是一个多层感知机连接在生成器,输入是生成数据的自变量x′j,输出层是预测值为了使尽可能得与yj′相等,生成器的损失函数增加了新的损失项LA1,更新如下: 其中,D·是指判别器的输出,x~Pg指样本x来自生成器,β是注意力模块1的回归系数;判别器也是一个多层感知机,用于判别输入的是真实数据还是生成数据;注意力模块2设置在判别器网络的前端,也是一个多层感知机;输入的数据D或D’被分割成自变量和因变量,自变量被输入注意力模块2,经网络映射之后输出或注意力模块2的损失函数为: 其中,γ是注意力模块2的回归系数;之后,将或与对应输入的自变量xi或x′j进行拼接,输入到之后的判别器中;带有注意力模块2的判别器的损失函数为: 其中,D·是指判别器的输出,x~Pr指样本x来自真实数据;λ代表梯度惩罚因子,表示数据来自真实数据和生成数据之间的样本空间,是判别器梯度的二范数。

全文数据:

权利要求:

百度查询: 浙江大学 基于回归注意力生成对抗网络数据增强的回归建模方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。