【发明公布】融合交互注意力机制的任意风格迁移方法和装置_成都信息工程大学_202410397562.8

导航：龙图腾网> 最新专利技术> 融合交互注意力机制的任意风格迁移方法和装置_成都信息工程大学_202410397562.8

申请/专利权人：成都信息工程大学

申请日：2024-04-03

公开（公告）日：2024-05-17

公开（公告）号：CN118052706A

主分类号：G06T3/04

分类号：G06T3/04;G06V10/80;G06V10/774;G06V10/82;G06V10/764

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.06.04#实质审查的生效;2024.05.17#公开

摘要：发明提出融合交互注意力机制的任意风格迁移方法和装置，构建的迁移网络主要包括：基于Transformer编码器和可逆神经网络的联合特征编码模块、融合通道和空间的交互注意力的风格转换模块和空间感知插值模块，首先利用联合特征编码器中的Transformer编码器提取内容图像和风格图像的全局特征，利用可逆神经网络提取内容图像和风格图像的细节特征，然后将内容图像和风格图像的全局和细节的特征分别送进通道和空间的交互注意力中进行融合，得到全局风格化的特征和细节风格化特征；最后，使用空间感知插值模块进行自适应插值融合。本发明方法捕捉序列数据中的长距离依赖关系和局部模式，具有较强的泛化能力，融合空间和通道细节信息，更好地维持了图像原本的结构。

主权项：1.基于交互注意力机制的任意风格迁移方法，其特征在于，所述风格迁移方法利用联合特征编码器中的Transformer编码器提取内容图像和风格图像的全局特征，利用可逆神经网络提取内容图像和风格图像的细节特征，将内容图像和风格图像的全局和细节的特征分别送进通道和空间的交互注意力中进行融合，得到全局风格化特征和细节风格化特征，再使用空间感知插值模块进行自适应插值融合，最后解码得到风格化图像，具体包括：步骤1：准备数据集，包括MS-COCO数据集作为内容图像和WiKiArt数据集作为风格图像；步骤2：对数据集分别进行预处理，先将其缩放到512X512的大小，然后再随机裁剪为256X256的大小；步骤3：构建并初始化风格迁移网络，所述风格迁移网络包括联合特征编码器、风格转换模块、空间感知插值模块、解码器和判别器，其中，所述风格迁移网络的联合特征编码器由两个并行的独立分类主干网络构成，所述独立分类主干网络包括一个Transformer编码器和一个可逆神经网络，所述Transformer编码器所在的分支作为全局分支，所述可逆神经网络所在的分支作为细节分支；风格转换模块包括两个结构相同的第一分支和第二分支，第一分支用于全局的风格和内容特征的融合，第二分支用于细节的风格和内容特征融合，第一分支和第二分支均包括通道空间注意力模块和空间通道注意力模块；空间感知插值模块用于融合风格化的全局特征和风格化的细节特征；解码器将融合特征解码为风格化图像，判别器用于判别生成的风格化图像和风格图像的真假；步骤4：将步骤2处理后的训练数据输入步骤3构建完成的风格迁移网络中，对网络进行训练，具体包括：步骤41：将所述训练集中的内容图像IC和风格图像IS分别传入联合特征编码器中提取特征信息，所述内容图像IC经过联合特征编码器中的Transformer编码器和可逆神经网络后分别得到全局内容特征TC和细节内容特征DC，所述风格图像IS经过联合特征编码器中的Transformer编码器和可逆神经网络后分别得到全局风格特征TS和细节风格特征DS；步骤42：将步骤41提取的特征图输入到所述风格转换模块，具体的，将所述全局内容特征TC和所述全局风格特征TS送入风格转换模块的第一分支，得到全局风格化特征TCS，将细节内容特征DC和细节风格特征DS送入风格转换模块的第二分支，得到细节风格化特征DCS；步骤43：将所述全局风格化特征TCS和细节风格化特征DCS输入空间感知插值模块进行融合得到融合特征FCS；步骤44：使用解码器对所述融合特征FCS进行解码，得到风格化图像ICS；步骤5：计算风格迁移网络的总损失，至少包括矩阵匹配损失、感知损失、颜色一致性损失和对抗损失，具体为：步骤51：使用预训练好的VGG网络提取1层到5层特征，使用1层到5层的特征计算得到矩阵匹配损失和感知损失，使用3层到5层的特征计算得到自相似损失和rEMD损失；步骤52：计算风格化图像ICS与风格图像IS的颜色一致性损失；步骤53：将风格化图像ICS与风格图像IS输入判别器中，判断是否为风格图像，以此来计算对抗损失；步骤6：步骤4和步骤5依次经过设定的总训练次数，每次训练固定的次数后保存模型权重，然后将测试集传入训练完成的图像迁移网络进行测试，计算出所述风格迁移网络的当前测试指标是否最高，若是，则结束训练，若否则调整模型损失的权重参数，重新训练。

全文数据：

权利要求：

百度查询：成都信息工程大学融合交互注意力机制的任意风格迁移方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：基于热重分析测量沥青路面自修复胶囊囊芯含量的方法_武汉理工大学_202410331310.5

下一篇：一种加热机构及硅胶粘接机_苏州港阳科技有限公司_202410283250.4

相关技术

基于热重分析测量沥青路面自修复胶囊囊芯含量的方法_武汉理工大学_202410331310.5

一种加热机构及硅胶粘接机_苏州港阳科技有限公司_202410283250.4

一种建设工程施工噪声数据异常监测方法及系统_天津大学_202410148926.9

一种二维材料的介孔包覆壳层构筑方法_同济大学_202410220352.1

一种玉米种植用施肥装置及施肥方法_安庆师范大学_202410337560.X

一种类风湿性关节炎的评价方法及其应用_成都华西海圻医药科技有限公司_202311808485.2

一种可持续心电血氧血压监测的便携设备_河北汇丰医药有限公司_202410133584.3

多体制兼容调制发射装置_中国科学院上海光学精密机械研究所_202410054196.6

训练数据的生成方法、装置、电子设备和存储介质_OPPO广东移动通信有限公司_202211499299.0

一种高精密零件加工中的多工位夹具及一次成型方法_深圳市正泰隆科技有限公司_202410243263.9

一种输气站场突发事件应急处置仿真系统、方法及介质_国家石油天然气管网集团有限公司_202410135094.7

一种高度可调的船舶高度检测系统_大连海事大学_202410262681.2

任意相关技术

一种任意非理想波形的电流源信号发生方法及装置_和光精电(重庆)科技有限公司_202311222433.7

一种任意取向条件下图像几何扭曲自定标方法_暨南大学_202410244558.8

探针、探针组和鉴定溶液中的任意DNA序列的方法_株式会社日立制作所_202011450693.6

任意角度隐形连接结构及其所使用的隐形连接组件_潍坊齐人智造五金有限公司_202323198974.9

一种基于二维任意阵子空间的超短基线定位水下声源方法_东南大学_202110111140.6

一种可以任意拼接的霓虹灯_广州市光酷电子有限公司_202322715284.X

基于动态隐式图像函数的任意尺度图像表示方法及系统_中山大学·深圳_202211590183.8

任意波形发生器输出信号电压摆幅的自校准电路及方法_中电科思仪科技股份有限公司_202111514069.2

一种可任意位置固定的磁吸船用风机_江苏精彩风机制造有限公司_202410338206.9

一种断电任意自锁的机载三轴稳定伺服平台_河北汉光重工有限责任公司_202010763868.2

机制相关技术

一种机制砂质量分析装置_易清智觉工业科技(苏州)有限公司_202323199960.9

基于稀疏注意力机制的水体分割方法_石河子大学_202410478465.1

曳引机制动器异物卡阻模拟装置_天津市特种设备监督检验技术研究院(天津市特种设备事故应急调查处理中心)_202322979866.9

媒体通信系统及具有信号同步机制的媒体通信装置及方法_瑞昱半导体股份有限公司_202211555474.3

基于多尺度特征融合和注意力机制的渐进图像恢复方法_重庆理工大学_202410326462.6

一种太阳能发电机制冷机构_合肥新汇低温科技有限公司_202322502320.4

一种基于注意力机制的多模态特征融合方法及系统_汕头大学医学院_202410566700.0

一种面向工程机械施工检测的低功耗视频监控机制_国家石油天然气管网集团有限公司西气东输分公司_202110804359.4

一种基于辅助检修机制的配电网线路故障检修方法_国网浙江省电力有限公司永康市供电公司_202410129076.8

一种立式辊磨机以及机制砂生产系统_天津水泥工业设计研究院有限公司_202410192746.0

风格相关技术

一种传统风格建筑翼角_中国建筑西北设计研究院有限公司_202323097517.0

一种图片风格转换方法及设备_上海卓悠网络科技有限公司_202311831872.8

用于传统风格大跨度建筑的钢筋混凝土悬挂桁架结构_中国建筑西北设计研究院有限公司_202323097577.2

一种基于学习偏好测评的多风格学习教程生成系统_徐州医科大学_202410316016.7

基于循环对抗网络的变压器红外图像风格迁移方法及系统_内蒙古电力(集团)有限责任公司阿拉善供电分公司_202410279401.9

一种图像风格迁移模型建模方法、装置、终端及介质_广东工业大学_202410298126.5

基于对比隐变量和风格前缀的混合对话方法_复旦大学_202211563725.2

基于驾驶风格识别的局部路径规划方法及装置_燕山大学_202410098902.7

一种用于传统风格建筑的上翻式钢筋混凝土桁架结构_中国建筑西北设计研究院有限公司_202323093644.3

一种基于递归图和卷积神经网络的驾驶风格识别模型、换道决策模型及决策方法_江苏大学_202111432080.4

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】融合交互注意力机制的任意风格迁移方法和装置_成都信息工程大学_202410397562.8

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务