买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于自注意力机制的图像编辑方法及装置_天津大学_202210715523.9 

申请/专利权人:天津大学

申请日:2022-06-23

公开(公告)日:2024-04-02

公开(公告)号:CN115082295B

主分类号:G06T3/04

分类号:G06T3/04;G06T15/20;G06T9/00;G06N3/0464;G06N3/044;G06N3/048

优先权:

专利状态码:有效-授权

法律状态:2024.04.02#授权;2022.10.11#实质审查的生效;2022.09.20#公开

摘要:本发明公开了一种基于自注意力机制的时尚图像编辑方法及装置,方法包括:利用循环卷积神经网络提取图像编辑信息的特征,对不同层级的粗糙的图像编辑结果进行渲染细化,生成不同层级的细化的图像编辑结果并预测目标图像对应的掩膜;通过编码器分别提取细化的图像编辑结果和图像编辑信息的特征,再分别从细化的图像编辑结果和图像编辑信息的特征中遍历选取通道图像块和空间图像块以计算当前层级的注意力权重矩阵;将注意力权重矩阵和上一层级得到的图像编辑信息的特征点乘生成当前层级的图像编辑信息的特征,再通过卷积神经网络对图像编辑信息的特征进行解码,直至生成最终的时尚编辑图像。装置包括:处理器和存储器。本发明提高了生成图像的质量和准确性。

主权项:1.一种基于自注意力机制的图像编辑方法,其特征在于,所述方法包括:针对原始图像和图像编辑信息,利用卷积神经网络提取两者的特征信息并生成多层级的特征信息对;通过估计特征信息对之间的变换及映射关系生成多层级的外观流变换矩阵,并使用外观流变换矩阵对不同尺寸的原始图像进行转换或弯曲,生成一系列不同尺寸且粗糙的图像编辑结果;利用循环卷积神经网络提取图像编辑信息的特征,对不同层级的粗糙的图像编辑结果进行渲染细化,生成不同层级的细化的图像编辑结果并预测目标图像对应的掩膜;通过编码器分别提取细化的图像编辑结果和图像编辑信息的特征,再分别从细化的图像编辑结果和图像编辑信息的特征中遍历选取通道图像块和空间图像块以计算当前层级的注意力权重矩阵;将注意力权重矩阵和上一层级得到的图像编辑信息的特征点乘生成当前层级的图像编辑信息的特征,再通过卷积神经网络对图像编辑信息的特征进行解码,直至生成最终的编辑图像;其中,所述原始图像和图像编辑信息为:对于虚拟试衣任务,原始图像是一张人物图像,图像编辑信息是一张待换服装图片;对于姿势引导的人物图像编辑任务,原始图像是一张人物图像,图像编辑信息是目标人体姿势;对于人脸编辑任务,原始图像是一张人脸图像,图像编辑信息是经由用户编辑的语义分割图;对于时装编辑任务,原始图像是一张人物图像,图像编辑信息是经由用户编辑的草图;所述卷积神经网络为:使用基于ResNet架构,构建两个多尺度特征提取网络,每个特征提取网络分别从原始图像和图像编辑信息中提取特征,每个特征提取网络包含一次降采样操作和两个残差网络,每次降采样操作包含一层卷积、一次数据归一化处理和一个激活函数,每个残差网络包含两层卷积、两次数据归一化处理和两个激活函数;两个多尺度特征提取网络分别生成通道数为256的三个不同尺寸下的特征矩阵,组成多层级的特征信息对为{{c1,p1},{c2,p2},{c3,p3}},ci,pi∈RH×W×C,其中ci表示由原始图像中提取的第i层的特征信息,pi表示由图像编辑信息中提取的第i层的特征信息,H,W,C分别代表视图特征的高,宽,通道数,R为实数集;所述外观流变换矩阵包括:坐标变换矩阵及像素偏差矩阵,所述坐标变换矩阵对原始图像中的像素进行重新排列,用于弯曲和变换原始图像;所述像素偏差矩阵对坐标变换后的像素进行补偿,用于生成原始图像中没有的编辑信息;所述注意力权重矩阵为:通过编码器提取细化的图像编辑结果和图像编辑信息的特征,并分别遍历二者对应的图像块,对某个坐标x,y对应的核向量为:kx,y=Mfsx,y,ftx,y其中,fs和ft分别表示细化的图像编辑结果和图像编辑信息的特征,而fsx,y和ftx,y表示坐标x,y处的细化的图像编辑结果和图像编辑信息的特征向量;M表示全连接层,采用softmax层作为激活函数,输出一个一维向量表示当前坐标下的图像块中各个点的重要程度,即核向量,将所有坐标的核向量进行拼接得到目前注意力权重矩阵;将注意力权重矩阵和上一层级得到的图像编辑信息的特征进行点乘和平均池化,生成当前层级的图像编辑信息的特征用于后续解码。

全文数据:

权利要求:

百度查询: 天津大学 一种基于自注意力机制的图像编辑方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。