买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于图像多属性建模的美学评估方法_华东师范大学_202311164950.3 

申请/专利权人:华东师范大学

申请日:2023-09-11

公开(公告)日:2024-01-19

公开(公告)号:CN117422962A

主分类号:G06V10/80

分类号:G06V10/80;G06V10/82;G06V10/774;G06N3/0464;G06N3/08

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.02.06#实质审查的生效;2024.01.19#公开

摘要:本发明公开了一种基于图像多属性建模的美学评估方法,其特点是该方法具体包括:将图像美学属性分为图像绝对属性和图像相对属性、利用卷积神经网络提取常规美学特征、利用相应的数据集上预训练完成的图像绝对属性提取器学习图像中对应的绝对属性、利用通道注意力机制自适应调整图像绝对属性特征的权重、利用特征选择机制从多个图像绝对属性角度交互特征并得到总图像绝对属性特征、利用双线性融合机制融合总图像绝对属性特征和常规美学特征,得到最终美学预测、提出相对关系损失函数建模图像相对属性,进一步提升模型效果。本发明与现有技术相比,更好地利用了图像绝对属性并额外建模了图像相对属性,方法简便,效果好,具有良好的应用前景。

主权项:1.一种基于非线性无激活网络的生成对抗网络图像去模糊方法,其特征在于,该方法包括如下步骤:步骤1:获取图像训练数据集数据集分为模糊图数据集blur,清晰图数据集sharp,这两个数据集是配对的,即每个模糊图像都有一个对应的清晰图像;步骤2:对数据集进行预处理先预加载数据集,然后对每一对图像进行尺寸调整保持图像的宽高比,确保图像的最小边至少与设置的参数大小一样大,默认为256x256;经过图像尺寸调整后进行归一化和转置,并将其从高*宽*通道格式转置为通道*高*宽格式;然后对数据进行增强即旋转、裁剪及翻转;最后截取随机10%的数据集作为验证集,其余皆为训练集;步骤3:初始化生成器G和判别器D的损失函数生成器损失LG包括感知损失Lperceptual、像素级损失Lpixel和对抗损失Ladversarial;判别器损失LD采用RaGAN-LS损失函数;步骤4:构建生成器G和判别器D的网络模型,迭代优化生成器G和判别器D的参数,直到所有网络的损失收敛生成器G的网络模型为NAFNet,NAFNet结构由数个非线性块NAFBlock组成,非线性块NAFBlock的神经网络组件有深度可分离卷积层、通道注意力层、简单门控层和前馈网络层;判别器D采用双尺度判别器,双尺度判别器由局部判别器PatchGAN和全局判别器FullGAN组成;PatchGAN专注于图像的局部区域;PatchGAN有一个接收字段,使其能够专注于图像的细节和纹理;PatchGAN的目标是判断每个局部区域是否来自真实图像或生成图像;FullGAN评估整个图像,捕获图像的全局结构和上下文信息,使得生成的图像在整体上与真实图像相似;双尺度判别器中的网络层组件有深度可分离卷积层、层归一化层和GELU激活层;将步骤2的训练集中的blur图像作为输入图像,sharp图像作为目标图像,使用生成器G生成输出图像,将输出图像及目标图像一起传入判别器计算判别器损失LD并更新判别器权重;清除生成器的梯度;计算生成器损失LG=像素级损失Lpixel+感知损失Lperceptual+对抗损失Ladversarial,反向传播生成器的梯度并更新生成器的权重;生成器G和判别器D会交替更新;生成器G尝试生成越来越真实的图像,而判别器D则努力区分真实图像和生成图像;这种相互对抗的关系持续推动两者向前,直至达到一种平衡,即生成器生成的图像非常逼真,以至于判别器很难区分生成图像和真实图像;在模型训练过程中,采用Adam优化器作为模型优化方法,动态调整每个参数的学习率;通过对抗训练的模型优化方法不断优化生成器损失LG和判别器损失LD,直到损失收敛;步骤5:当模型训练完成后,保存训练后的模型的权重和结构,将预处理后的图像数据输入到已训练完成的网络模型中,经过数据前向传播计算,然后将网络模型输出的去模糊图像数据进行输出格式转换后处理,最终返回去模糊后的清晰图像。

全文数据:

权利要求:

百度查询: 华东师范大学 一种基于图像多属性建模的美学评估方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。