买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种苗族服饰图像语义分割方法_桂林电子科技大学_202111371509.3 

申请/专利权人:桂林电子科技大学

申请日:2021-11-18

公开(公告)日:2024-03-19

公开(公告)号:CN114037833B

主分类号:G06V10/26

分类号:G06V10/26;G06N3/0464;G06N3/0455;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.03.19#授权;2022.03.01#实质审查的生效;2022.02.11#公开

摘要:本发明公开了一种苗族服饰图像语义分割方法,其特征在于,包括如下步骤:1)数据增强;2)编码;3)解码;4)辅助分支结构;5)实现语义分割。这种方法能提取到少数民族服饰的大尺度高级语义信息,而且提取的特征包含更多低级纹理的重要细节、迁移和融合少数民族服饰之间自相似性与跨尺度相似性的特征,能提高苗族服饰图像语义分割的准确度。

主权项:1.一种苗族服饰图像语义分割方法,其特征在于,包括如下步骤:1数据增强:采用Mosaic数据增强的方法,将苗族服饰四张图像合成一张图像、提取四张图像特征信息,所述数据增强是指对图片裁剪、翻转、旋转、缩放、扭曲几何变换及像素扰动、添加噪声、光照调节、对比度调节、样本加和或插值、分割补丁;2编码:采用基于多尺度渐进式注意力学习金字塔网络模型MutilPPL将输入的服饰图片经过卷积的3次下采样操作,每次下采样操作将特征图的长和宽缩小2倍、通道数扩大2倍,然后将卷积输出的特征图逐层传入不同尺度的特征层进行特征融合;3解码:将MutilPPL模型中的编码器和解码器的特征层进行密集跨级连接,使MutilPPL模型提取服饰多尺度特征信息,再采用金字塔结构融合特征局部与全局信息,最后在解码器中进行3次转置卷积逐步恢复高分辨率图像,得到语义分割结果,MutilPPL模型中的解码器结构与编码器结构对称,解码器每次采用转置卷积操作,将特征图尺寸扩大2倍、通道数缩小2倍;4辅助分支结构:辅助分支结构由Conv-Classes模块、渐进式注意力学习金字塔结构PPL模块、Softmax分类器3个部分组成,定义编码器中的Layer6、Layer7、Layer8作为辅助分支结构的输入,其中,Conv-Classes模块设有转置卷积和1×1卷积,且在每个1×1卷积后面都加上实例化归一化InstanceNormalization,简称IN和ACON激活函数,将Layer6、Layer7、Layer8输入到Conv-Classes模块中得到不同类别的置信系数,然后将不同置信系数的通道进行连接并进行1×1卷积操作,并将它们的特征信息交叉输入到两个PPL模块中,每个PPL模块的输出都进行一次1×1卷积操作,最后将PPL模块聚合的多层特征输入到Softmax分类器实现最终的输出,具体是:Layer6和Layer7对应浅和中层网络,而Layer8对应深层网络,首先,解码器根据不同层次的深度的卷积层Layer6、Layer7、Layer8划分不同的阶段,获得不同语义的特征信息,每个阶段通过转置卷积得到相同大小的特征图,并经过卷积,得到不同阶段的不同类别置信系数;然后,将不同置信系数的通道进行连接,同时将它们的特征信息交叉输入到渐进式注意力学习金字塔结构PPL,使网络能够合理利用不同阶段学习的特征,专注有效特征提取,丢弃冗余特征;最后,将渐进式注意力学习金字塔结构聚合的多层特征输入到Softmax分类器实现最终的输出,辅助分支结构在解码过程中分别提取三次转置卷积的输出特征,利用1×1卷积层将特征通道减少为7,并将卷积的结果进行融合;5实现语义分割:采用Softmax激活函数对特征图进行分类,实现语义分割。

全文数据:

权利要求:

百度查询: 桂林电子科技大学 一种苗族服饰图像语义分割方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。