【发明授权】基于改进自监督特征学习的摄影图像美学风格分类方法_杭州电子科技大学_202111393879.7

申请/专利权人：杭州电子科技大学

申请日：2021-11-23

公开（公告）日：2024-04-05

公开（公告）号：CN114140645B

主分类号：G06V10/764

分类号：G06V10/764;G06V10/774;G06N3/0895;G06N3/0442

优先权：

专利状态码：有效-授权

法律状态：2024.04.05#授权;2022.03.22#实质审查的生效;2022.03.04#公开

摘要：本发明公开了一种基于改进自监督特征学习的摄影图像美学风格分类方法，首先对AVA美学数据集进行预处理；然后建立改进自监督特征学习神经网络，用二分类的AVA美学数据集对改进自监督特征学习神经网络进行预训练；再提取出预训练完成的改进自监督特征学习神经网络的特征提取网络部分，并连接一个SoftMax分类器，建立分类网络模型；最后采用LSTM神经网络结构输出具体的数据增强策略，得到分类精度最佳的摄影图像美学分类模型。本发明采用改进自监督特征学习模型进行预训练，学习到更好的美学特征，从数据集中寻找最佳数据增强策略，得到最佳的摄影图像美学分类模型。

主权项：1.一种基于改进自监督特征学习的摄影图像美学风格分类方法，其特征在于，步骤如下：步骤1：对AVA美学数据集进行预处理；步骤2：建立改进自监督特征学习神经网络；构建由特征提取网络、投影网络、改进自监督对比学习损失函数构成的神经网络模型；步骤3：用二分类的AVA美学数据集对改进自监督特征学习神经网络进行预训练；步骤4：提取出步骤3中预训练完成的改进自监督特征学习神经网络的特征提取网络部分，并连接一个SoftMax分类器，建立分类网络模型；步骤5：摄影图像美学分类数据集是一个标注摄影属性的数据集，一共有14个摄影属性，采用LSTM神经网络结构输出具体的数据增强策略，并应用于摄影图像美学分类数据集的训练集部分，再训练步骤4中的分类网络模型，以该模型在摄影图像美学分类数据集的验证集中达到的分类精度作为奖励信号更新LSTM神经网络的参数，直到搜索到最佳的数据增强策略，同时得到分类精度最佳的摄影图像美学分类模型；步骤2具体方法如下：所述的改进自监督特征学习神经网络由特征提取网络、投影网络、改进自监督对比学习损失函数构成；具体过程如下：2-1.建立特征提取网络；针对每个输入样本x，将ResNet50作为特征提取网络得到表征向量进行归一化到超球面；2-2.建立投影网络；获得表征向量r后，通过投影网络获得向量投影网络为一个多层感知器网络，包括一个2048维度的隐层和一个DP＝128的输出层；将向量z再次归一化到超球面；2-3.建立改进的自监督对比学习损失函数；对于给定容量为N的随机采样的数据标签对{xk,yk}k＝1…N进行数据增强，获得数据容量为2N的数据标签对用于训练，其中和是xk经过两次不同的数据增强生成的，且标签在同一批次训练数据中，任意选取索引的数据作为基准数据，则ji是与索引i的数据来源于同一个源数据样本进行数据增强得到的另一个数据索引，Ai表示其余数据的集合；自监督对比学习损失函数公式如下：其中，符号·表示内积运算，表示温度系数zi表示数据经过特征提取网络Enc与投影网络Proj得到的特征向量，表示该特征向量的维度；则zji与za表示索引为ji与索引为a∈Ai的数据经过特征提取网络与投影网络得到的特征向量；在对比学习中，公式1不能覆盖到一种情况，即由于数据有标签的存在，属于同一类别的不止一个数据样本；为了应对这种情况，对公式1进行改进，得到改进的自监督对比学习损失函数如下：其中，表示所有与索引i的数据样本属于同一标签的正样本索引集合，|Pi|表示这个集合中的数据样本个数。

全文数据：

权利要求：

百度查询：杭州电子科技大学基于改进自监督特征学习的摄影图像美学风格分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种醋酸钠生产用搅拌装置_安徽海逸生物科技有限公司_202322412726.3

下一篇：一种注塑机新型泵罩门板_恩格尔注塑机械(常州)有限公司_202322227242.1

相关技术

一种醋酸钠生产用搅拌装置_安徽海逸生物科技有限公司_202322412726.3

一种注塑机新型泵罩门板_恩格尔注塑机械(常州)有限公司_202322227242.1

一种LED线性地埋灯_上海科铃纳光电科技有限公司_202322244017.9

一种醋酸酐含量检测装置_山东嘉驰新材料股份有限公司_202322220520.0

一种水泥砼搅拌机用振动下料装置_巢湖市恒峰建设工程有限公司_202322581391.8

一种文旦柚栽培用的施肥装置_莆田冠腾科技有限公司_202322446584.2

一种冷渣机料渣前置破碎防卡料机构_青岛奥利斯电力设备有限公司_202322163598.3

一种超低能耗制备电解液及硫酸氧钒晶体的系统_广东中科天钒储能科技有限公司_202322441183.8

一种现调机用消毒装置_中粮可口可乐饮料(山西)有限公司_202322565837.8

电池包和用电装置_蔚来电池科技(安徽)有限公司_202322200695.5

键合劈刀_有研(广东)新材料技术研究院_202322391831.3

一种计算机机箱外壳_深圳市丰翼高精密五金有限公司_202322585533.8

摄影相关技术

摄影装置、传送系统及方法、记录介质和计算机装置_株式会社理光_202011208121.7

一种相机倾斜摄影测量系统安装装置_江苏普达迪泰科技有限公司_202410158666.3

计算机断层摄影设备和医学成像系统_西门子医疗有限公司_202321643818.6

一种适用于摄影的大功率手电筒_惠州市拉图影视器材有限公司_202311459885.7

一种快装快拆背包肩带摄影设备_深圳市新侠实业有限公司_202321611781.9

摄影装置、摄影灯及其摄影灯调光装置_中山大山摄影器材有限公司_202322732830.0

红外摄影装置和红外摄影方法_杭州美盛红外光电技术有限公司_201310198376.3

摄影控制装置、摄影控制方法及摄影控制程序_富士胶片株式会社_202280059090.4

X射线摄影装置_株式会社岛津制作所_201880096359.X

X射线摄影装置_株式会社岛津制作所_201910720790.3

图像相关技术

前置图像信号处理装置及图像信息传输方法_OPPO广东移动通信有限公司_202110421250.2

基于图像处理的图像优化方法及相关装置_北京酷豹科技有限公司_202010622203.X

图像处理方法、图像处理模型和训练方法_北京百度网讯科技有限公司_202310251906.X

医用图像处理装置以及医用图像处理方法_富士胶片医疗健康株式会社_202010503352.4

图像形成装置_佳能株式会社_202311344855.1

图像处理方法和装置_京东方科技集团股份有限公司_201910569605.5

神经网络的训练方法、图像处理方法、图像处理装置_京东方科技集团股份有限公司_201910262329.8

基于由旋转成像器捕获的图像的全景图像构建_泰立戴恩菲力尔商业系统公司_201980047034.7

图像处理方法、图像处理装置、存储介质与电子设备_OPPO广东移动通信有限公司_201911373483.9

图像分类方法、图像分类模型的训练方法及装置_腾讯科技(深圳)有限公司_202210102561.7

美学相关技术

一种智能化的无创牙齿美学及牙齿美白处理系统及方法_斯妙(上海)科技有限公司_202410055521.0

用于牙科美学修复的颜色和形态比对装置_成都金典牙科技术开发有限公司_202111667265.3

一种基于结构约束的多风格图像美学质量增强的方法_杭州电子科技大学_202011609567.0

基于改进自监督特征学习的摄影图像美学风格分类方法_杭州电子科技大学_202111393879.7

一种具有美学效果的环保聚丙烯组合物_万华化学集团股份有限公司_202311685393.X

一种基于风环境评价的城市天际线美学量化因子范围的提取方法_浙大城市学院_202010795948.6

全程数字化弹性美学稳定性牙列咬合板及其设计制作方法_上海交通大学医学院附属第九人民医院_202311248197.6

一种基于Transformer的多模态美学质量评价方法_杭州电子科技大学_202310175150.5

前牙美学诊断导板_天津医科大学口腔医院_201910609994.X

一种面向内容美学质量提升的材料神经风格迁移方法_南京栢拓视觉科技有限公司_202211182280.3

龙图腾网&IPTOP

【发明授权】基于改进自监督特征学习的摄影图像美学风格分类方法_杭州电子科技大学_202111393879.7

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务