买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于深度卷积生成对抗网络的铝电解火眼图像修补方法_中南大学_202010012947.X 

申请/专利权人:中南大学

申请日:2020-01-07

公开(公告)日:2024-04-16

公开(公告)号:CN111192221B

主分类号:G06T5/77

分类号:G06T5/77;G06N3/045;G06N3/0464;G06N3/0475;G06N3/094

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2020.06.16#实质审查的生效;2020.05.22#公开

摘要:本发明公开了一种基于Wasserstein深度卷积生成对抗网络的铝电解火眼图像修补方法。在实际铝电解过程中,电解过程中会有大量碳渣脱落,还有火焰的干扰,使得大量火眼图像无法识别,大大降低了图像识别的准确率。本发明公开一种DCGAN与WGAN方法结合的图像修补方法,其中包括两部分:首先是对图像做个简单的预处理,取以火眼为中心,边长为400像素的正方形的火眼图像,这样可以防止其余图像的干扰特征。其次,对于本发明模型,综合DCGAN和WGAN的特点,使用其相结合的模型—Wasserstein深度卷积生成对抗网络W‑DCGAN模型。利用卷积网络特征提取能力加上使用Wasserstein函数辅以训练,最后使用RMSProp优化算法优化损失函数,之后将训练好的W‑DCGAN中的生成器模型部分抽取出来,用于图像修补的新网络结构。

主权项:1.一种基于Wasserstein深度卷积生成对抗网络的铝电解火眼图像修补方法,其特征在于,所述方法包括:步骤1,对图像进行预处理:提取以火眼中心为中心,边长为400像素的正方形的火眼图像;步骤2,使用Wasserstein距离定义为生成器的loss;所述步骤2进一步包括:Wasserstein距离,定义如下: 其中,ΠPr,Pg是Pr和Pg组合起来的所有可能的联合分布的集合,ΠPr,Pg中每一个分布的边缘分布都是Pr和Pg,对于每一个可能的联合分布γ而言,从中采样x,y~γ得到一个真实样本x和一个生成样本y,并算出这对样本的距离||x-y||,计算该联合分布γ下样本对距离的期望值Ex,y~γ[||x-y||];在所有可能的联合分布中能够对这个期望值取到的下界定义为Wasserstein距离,然后,把Wasserstein函数定义为生成器的loss,但是Wasserstein距离定义中的没法直接求解,转化为如下形式: 其中,在一个连续函数f上面额外施加了一个限制,要求存在一个常数K≥0使得定义域内的任意两个元素x1和x2都满足:|fx1-fx2|≤K|x1-x2|,此时函数f的Lipschitz常数为K,要求函数f的Lipschitz常数||f||L不超过K的条件下,对所有可能满足条件的f取到的上界,然后再除以K;此时下式可以近似变为: 而f可以用一个带参数ω的神经网络来表示,同时满足下式中||fω||L≤K这个限制,再构造一个含参数ω、最后一层不是非线性激活层的判别器网络fω,在限制ω不超过某个范围的条件下,使得: 此时L就会近似真实分布与生成分布之间的Wasserstein距离,其数值越小,表示真实分布与生成分布的Wasserstein距离越小,模型训练得越好;步骤3,优化算法改为RMSProp优化算法;步骤4,根据提取W-DCGAN生成模型进行图像修补;所述步骤4进一步包括:使用W-DCGAN在Chars74K公共数据集上进行训练,实验收敛后提取本方法的生成模型,再将火眼图像当做训练集微调生成模型的参数。

全文数据:

权利要求:

百度查询: 中南大学 基于深度卷积生成对抗网络的铝电解火眼图像修补方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。