买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于高斯混合变分自编码器的图像生成方法_武汉纺织大学_202311054065.X 

申请/专利权人:武汉纺织大学

申请日:2023-08-21

公开(公告)日:2024-03-22

公开(公告)号:CN117036862B

主分类号:G06V10/774

分类号:G06V10/774;G06V10/82;G06N3/047;G06N3/048;G06N3/0455;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.03.22#授权;2023.11.28#实质审查的生效;2023.11.10#公开

摘要:本发明公开了一种基于高斯混合变分自编码器的图像生成方法。实现步骤包括:数据集划分与数据预处理;构造以高斯混合变分自编码器为基础的生成模型,在损失函数中引入全相关项的解耦机制和费雪尔正则;训练生成模型;根据上游任务实现图像生成或聚类。本发明采用了更合理的建模方式,对隐空间覆盖更全面,使得重构更加精确,对隐空间的特征解耦使得生成图像在观感上更具多样性,且兼顾人类视角下的特征变化,在生成和先验之间的追求平衡,对分类的样本间距加以约束,内存复杂性低,网络结构简单,在性能和指标上都取得了不错的表现,可应用于高维图像生成任务。

主权项:1.一种基于高斯混合变分自编码器的图像生成方法,其特征在于,包括如下步骤:步骤1,图像数据集准备:根据生成任务采集所需的图像数据,并对所有图像赋予标签;步骤2,构造以高斯混合变分自编码器为基础的生成模型,所述生成模型包括编码器和解码器,编码器Enc包括线性层、二维卷积层、归一化层和LeakyReLU激活函数,输出隐变量x和对应的均值μ、方差σ,即:Ency={x,μ,σ},通过重参数化x=μ+σ⊙∈⊙w,w表示权重系数,∈是添加的辅助噪声变量,⊙表示哈达玛积矩阵按位乘法;将其作为解码器Dec的输入,解码器的输出层将输出原始样本y的重构样本即:解码器与编码器结构对称,同样由线性层、二维卷积层、归一化层和LeakyReLU激活函数组成,输入与输出图像大小对齐、通道数一致;步骤3,构建生成模型的损失函数并进行训练,利用训练好的生成模型实现图像生成;所述损失函数包括两个部分,第一部分为优化变分自编码器对数似然函数的近似证据下界第二部分为Fisher判别式作为对训练过程约束的Freg正则化项;损失函数的具体计算方式如下:编码器和解码器分别用概率函数qx,w,z|y和py,x,w,z近似计算,y表示观测到的真实值,x表示中间过程产生的隐向量,z表示单个子高斯分布,w表示子分布的权重系数;假设先验的分布函数服从混合高斯模型,证据下界定义为对数似然函数的期望: 为了约束隐空间中的分布及分量,引入Fisher正则化项Freg作为优化网络的总损失函数,即: 其中,解码器模型的联合概率分布可以分解为若干边缘概率和条件概率的乘积,即py,x,w,z=pwpzpx|w,zpy|x其中y的分布与x,w,z的分布有依赖关系,假设先验z服从高斯分布时,令w服从标准正态分布,则pw,pz可以求出,且x在w和z的条件下生成,服从混合高斯分布,y在x的条件下生成,假设为高斯分布或伯努利分布;pw和pz为边缘概率,px|w,z和py|x为条件概率;在编码阶段,w和z在y的条件下生成,x在w和z的条件下生成,其联合概率密度表示为以下乘积形式:qx,w,z|y=qx|yqw|yqz|x,w其中,qx|y、qw|y和qz|x,w均为条件概率;在实现中,p*相关的概率都相当于是真实概率,g*相关的概率都是神经网络计算得到的概率;损失函数的第一项经由贝叶斯公式、因式分解运算后,分解为以下四项: 其中w表示子分布的权重系数,当w先验项服从高斯分布时,w-prior计算为KL散度;当w先验项服从均匀分布时,w-prior计算为信息熵;条件先验项约束每个子分布之间的距离,重构项可视生成任务采用交叉熵损失函数或均方误差进行计算;第一项为w先验项w-prior,计算假设值与真实值的KL散度,和第二项z先验z-prior共同约束隐变量所服从的高斯混合模型,使其内部的每个子分布与标准高斯分布越接近越好;条件先验项conditionalprior约束每个子分布之间的距离;重构项reconstructionterm表示生成数据与观测值之间的差距;对第二项z先验项的KL散度计算拆分成以下形式,引出全相关项A,其含义表示隐空间中每个子分布的独立隐变量越分散越好,自然地引入了解耦机制,具体计算方法为: 其中B旨在最小化每个子高斯分布zk生成的推断函数与先验之间的距离,由于zk表示一组变量而非单个变量,所以继续递归地分解,即当zk包含子变量zk,d时,该项可以进一步在形式上相似地分解为: 其中k为子分布个数,d为单个子分布中变量维数,则表示为:

全文数据:

权利要求:

百度查询: 武汉纺织大学 基于高斯混合变分自编码器的图像生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。