买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种面向内容的白盒图像增强方法_重庆米弘科技有限公司_202210693531.8 

申请/专利权人:重庆米弘科技有限公司

申请日:2022-06-17

公开(公告)日:2024-04-02

公开(公告)号:CN115018729B

主分类号:G06T5/77

分类号:G06T5/77;G06T7/11;G06T5/20;G06T7/194;G06N3/045;G06N3/0475;G06N3/094;G06N3/092

优先权:

专利状态码:有效-授权

法律状态:2024.04.02#授权;2022.09.23#实质审查的生效;2022.09.06#公开

摘要:本发明涉及一种面向内容的白盒图像增强方法,包括如下步骤:选用若干张人物图片分别组成原图数据集和目标图数据集;使用人像分割算法对原图中的图片进行处理,然后在进行图像数据预处理;构建白盒图像增强模型并进行初始化,白盒图像增强模型包括生成器网络、判别器网络和Critic网络;使用图像数据经过所述生成器网络、判别器网络和Critic网络的处理,得到对图像增强图片的修图结果;将图像数据作为输入对白盒图像增强模型进行训练最终得到训练好的白盒图像增强模型。使用本发明方法可以提高目前修图技术对于图像增强后图片的修图质量,而且使中间过程可视化,提高修图算法的可解释性,同时当对结果不满意时也可进行改变。

主权项:1.一种面向内容的白盒图像增强方法,其特征在于:包括如下步骤:S100:选用N张人物图片作为原图数据集,选用M张修饰后的人物图片作为目标图数据集;S200:使用DeeplabV3+模型对原图数据集中的所有图片进行人像分割处理,并使用Center-crop技术对人像分割处理后的图片进行数据预处理,使图片大小都统一放缩到64x64分辨率;S300:构建白盒图像增强模型并进行初始化,白盒图像增强模型包括生成器网络、判别器网络和评估网络;S310:选择W种滤波器,滤波器包括在生成器网络中;S320:令i=1;S330:从原图数据集中任选一张原图输入到生成器网络中,输出W种滤波器的概率策略π1和相对应的W种滤波器参数策略π2;其中,π1对应的网络参数为θ1,π2对应的网络参数为θ2,生成器网络对应的参数为θ,且θ=θ1,θ2;从原图数据集中选择第i张原图,并使用π1和π2同时作用在第i张原图上,得到第i张原图对应的假图;S340:从目标图数据集中选择第j张目标图输入到判别器网络中得到输出值Rj;将原图数据集中的第i张原图输入到判别器网络中得到输出值Fi;将第i张原图对应的假图输入到判别器网络中得到输出值Fo;将第i张原图输入到评估网络中得到输出值Vo,将第i张原图对应的假图输入到评估网络得到输出值Vn,S350:计算生成器网络生成的动作建议分布熵Ge,计算表达式如下:Ge=-π1*logπ1#1S360:定义强化学习的目标函数Jπθ,表达式如下: 利用Jπθ、Fo、Ge、Vo和Vn计算生成器网络策略梯度使得Jπθ最大化,生成器网络策略梯计算公式表示如下: 其中,和表示网络所需学习参数的微分,表示状态s0之后折扣奖励的总和,s0为输入图片,S0为数据集,表示期望值,Jπθ表示策略πθ可能导致的状态动作序列的预期回报的期望,ρπ为状态分布,Q为动作价值函数,a1~π1s表示在s状态下从策略π1选取的a1动作,a2=π2s,a1表示在s状态下选择a1动作时策略π2的动作;S370:利用Jπθ和SSIM损失函数计算生成器网络的总损失函数G_LOSS用于更新生成器网络的参数,表达式如下: 其中,SSIM和表达式如下: 其中,x,y表示第i张图片上的像素点坐标,μx和μy代表x,y的平均值,σx和σy分别代表x,y的标准差,σxy代表x,y的协方差,c1,c2,c3为常数,N表示图片数量,P代表图片数据集,p表示属于P中的任一张图片;S370:通过Rj和Fi计算判别器网络梯度用来更新判别器参数,计算表达式如下: 其中,aw表示学习率,w为需要更新的判别器参数,表示更新参数的微分,S380:通过Vo和Vn计算TD误差来更新Critic网络参数,计算表达式如下: δ=rs,a+γVps,a-Vs#12rs,a=1-Ge#13Vps,a=Vn#14Vs=Vo#15其中,δ为TD误差,Lv表示通过TD误差计算的损失,rs,a表示s状态下采取动作a的所有奖励,γ表示折扣因子,Vps,a表示在状态s下采取动作a之后使得s状态迁移到下一个状态此时的状态价值,Vs表示s状态下的状态价值;S400:令i=i+1;S410:当总损失函数G_LOSS和TD误差两者都不再变化时停止训练,此时得到训练好的白盒图像增强模型,然后进行下一步,否则返回S320;S500:将待处理的图像增强图片输入到训练好的白盒图像增强模型中,得到对图像增强图片的修图结果。

全文数据:

权利要求:

百度查询: 重庆米弘科技有限公司 一种面向内容的白盒图像增强方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。