【发明授权】一种基于隐藏信息学习的图像美学描述生成方法_杭州电子科技大学_202011609603.3

导航：龙图腾网> 最新专利技术> 一种基于隐藏信息学习的图像美学描述生成方法_杭州电子科技大学_202011609603.3

申请/专利权人：杭州电子科技大学

申请日：2020-12-30

公开（公告）日：2024-02-13

公开（公告）号：CN112598662B

主分类号：G06T7/00

分类号：G06T7/00;G06V10/774;G06V10/82;G06N3/094;G06V10/40;G06F40/30

优先权：

专利状态码：有效-授权

法律状态：2024.02.13#授权;2021.04.23#实质审查的生效;2021.04.02#公开

摘要：本发明公开了一种基于隐藏信息学习的图像美学描述生成的方法。本发明步骤如下：1模型预处理。采用目标检测网络Encv和Transformer网络Enct分别从图像和文本评论中提取多尺度特征表达；2基于对抗学习的跨模态一致性特征提取。利用对抗学习思想，构建特征模态判别器；3多因素控制的美学评论生成。以美学因素标记作为辅助信息，利用美学因素编码器Encf提取美学因素标记对应的语义特征，并将该语义特征输入到评论解码器中，生成文本评论；4基于多任务约束判别网络，实现多尺度图像特征和多尺度文本特征的有效性和生成的文本评论的合理性；5基于隐藏信息学习的对抗损失。本发明生成文本与输入图像的美学质量相匹配，从而提升模型的鲁棒性和精确性。

主权项：1.一种基于隐藏信息学习的图像美学描述生成的方法，其特征在于包括如下步骤：步骤1模型预处理模型采用预训练好的目标检测网络Encv和Transformer网络Enct为基准，目标检测网络Encv用于从输入图像中提取多尺度图像特征，Transformer网络Enct用于从真实文本评论中提取多尺度文本特征；步骤2基于对抗学习的跨模态一致性特征提取利用对抗学习思想，构建特征模态判别器，将步骤1提取的多尺度图像特征和多尺度文本特征输入特征模态判别器；使得特征模态判别器输出的多尺度图像特征和多尺度文本特征尽可能相似；步骤3生成多因素控制的美学文本评论以美学因素标记作为辅助信息，利用美学因素编码器Encf提取美学因素标记对应的语义特征，并将该语义特征输入到评论解码器中，生成文本评论；步骤4基于多任务约束判别网络，实现多尺度图像特征和多尺度文本特征的有效性和生成的文本评论的合理性；该多任务约束判别网络采用文本质量预测损失和美学因素预测损失；基于文本质量预测和美学因素预测以多任务学习形式，对文本质量预测损失和美学因素预测损失进行加权求和，用于指导模型的训练；步骤5基于隐藏信息学习的对抗损失基于隐藏信息学习的思想，依据真实文本评论与美学质量之间的相关性强弱，在对抗损失函数中引入可学习的松弛因子，指导模型的训练；步骤5所述的基于隐藏信息学习的对抗损失，具体实现如下：基于隐藏信息学习的思想，依据真实文本评论与美学质量之间的相关性强弱，在损失函数中引入可学习的松弛因子指导模型的训练；具体而言，在判别网络中引入两组参数w和w*，对抗损失拟采用HingeLoss形式，需要求解以下问题： s.t. 其中，w和w*为网络权重参数，b和b*为网络偏置量，γ和C为权重系数，yi为xi样本所对应的标签，xi∈Rd为Transformer判别网络提取的特征，为预训练好的美学质量评价模型提取的特征，为两层全连接层，输出为文本特征引入的松弛因子；当文本噪声比较大时，基于文本预测质量误差较大，对应的松弛因子也需要较大，即生成的文本评论不需要与真实文本评论过于相近；当文本噪声较小时，松弛因子也较小，生成文本评论也应逼近真实文本评论；其中w和w*为网络权重参数，能够利用改进的SMO算法进行求解，与整个网络一起进行迭代优化；在测试阶段，只需要将测试图像及拟生成的美学因素标记输入到训练好的模型中，就能得到对应的美学描述。

全文数据：

权利要求：

百度查询：杭州电子科技大学一种基于隐藏信息学习的图像美学描述生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种高效散热电源_广州市力为电子有限公司_202322175013.X

下一篇：一种高精度智能浊度检测装置_江苏奥坤仪表科技有限公司_202322546638.2

相关技术

一种高效散热电源_广州市力为电子有限公司_202322175013.X

一种高精度智能浊度检测装置_江苏奥坤仪表科技有限公司_202322546638.2

一种接触器触头机构_杭州玛实迪电器科技有限公司_202322179096.X

电池包和用电装置_蔚来电池科技(安徽)有限公司_202322200695.5

一种用于汽车保险杠加工的旋转喷漆装置_重庆渝湘智成汽车配件有限公司_202322547178.5

一种现调机用消毒装置_中粮可口可乐饮料(山西)有限公司_202322565837.8

一种膏贴剂生产用传输装置_河南上恒医药科技有限公司_202322307134.5

一种超低能耗制备电解液及硫酸氧钒晶体的系统_广东中科天钒储能科技有限公司_202322441183.8

电池壳清洗用旋转框架安装槽的限位结构_无锡金杨丸伊电子有限公司_202322328357.X

一种玉米种植用病虫害防治装置_黄金双_202322446508.1

一种用于土地规划用测量装置_西安市城市发展资源信息有限公司_202322290527.X

一种火车集卡装卸装置_杭州奥拓机电股份有限公司_202322190678.8

美学相关技术

一种智能化的无创牙齿美学及牙齿美白处理系统及方法_斯妙(上海)科技有限公司_202410055521.0

用于牙科美学修复的颜色和形态比对装置_成都金典牙科技术开发有限公司_202111667265.3

一种基于结构约束的多风格图像美学质量增强的方法_杭州电子科技大学_202011609567.0

基于改进自监督特征学习的摄影图像美学风格分类方法_杭州电子科技大学_202111393879.7

一种具有美学效果的环保聚丙烯组合物_万华化学集团股份有限公司_202311685393.X

一种基于风环境评价的城市天际线美学量化因子范围的提取方法_浙大城市学院_202010795948.6

全程数字化弹性美学稳定性牙列咬合板及其设计制作方法_上海交通大学医学院附属第九人民医院_202311248197.6

一种基于Transformer的多模态美学质量评价方法_杭州电子科技大学_202310175150.5

前牙美学诊断导板_天津医科大学口腔医院_201910609994.X

一种面向内容美学质量提升的材料神经风格迁移方法_南京栢拓视觉科技有限公司_202211182280.3

图像相关技术

前置图像信号处理装置及图像信息传输方法_OPPO广东移动通信有限公司_202110421250.2

图像处理方法、图像处理模型和训练方法_北京百度网讯科技有限公司_202310251906.X

医用图像处理装置以及医用图像处理方法_富士胶片医疗健康株式会社_202010503352.4

基于图像处理的图像优化方法及相关装置_北京酷豹科技有限公司_202010622203.X

图像形成装置_佳能株式会社_202311344855.1

图像处理方法和装置_京东方科技集团股份有限公司_201910569605.5

神经网络的训练方法、图像处理方法、图像处理装置_京东方科技集团股份有限公司_201910262329.8

粘合片、层叠片、柔性图像显示装置构件和柔性图像显示装置_三菱化学株式会社_202080080700.X

一种多模态信息指导的医学图像分割系统及图像处理方法_山东大学_202111524363.1

基于由旋转成像器捕获的图像的全景图像构建_泰立戴恩菲力尔商业系统公司_201980047034.7

学习相关技术

具有降低的查找表学习速率的查找表学习方法及驱动电路_知微电子有限公司_202311208529.8

自学习照明群控系统及方法_非凡士智能科技(苏州)有限公司_202410150310.5

联邦学习方法、装置、设备及存储介质_杭州趣链科技有限公司_202011633747.2

一种学习用具和控制方法_张立华_201910399450.5

用于机器学习辅助预编码的设备和方法_矿业电信学校联盟_202080048329.9

利用模型增强的自监督学习_硕动力公司_202280060208.5

基于同态加密强化学习的电器负荷需求响应方法_河海大学_202210897543.2

用于工业机器人减速机故障学习方法_重庆工业职业技术学院_202310128261.0

一种分布式学习索引模型的构建方法及应用_华中科技大学_202111095824.8

基于深度学习的LED光源识别方法、装置、设备及介质_湖北经济学院_202410088953.1

龙图腾网&IPTOP

【发明授权】一种基于隐藏信息学习的图像美学描述生成方法_杭州电子科技大学_202011609603.3

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务