首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】轻量化多尺度UNet网络的图像分割方法_河北翔拓航空科技有限公司;石家庄铁道大学_202311270975.1 

申请/专利权人:河北翔拓航空科技有限公司;石家庄铁道大学

申请日:2023-09-28

公开(公告)日:2024-04-30

公开(公告)号:CN117351202B

主分类号:G06V10/26

分类号:G06V10/26;G06V10/764;G06V10/44;G06V10/52;G06V10/82;G06N3/0464

优先权:

专利状态码:有效-授权

法律状态:2024.04.30#授权;2024.01.23#实质审查的生效;2024.01.05#公开

摘要:本发明公开了一种轻量化多尺度UNet网络的图像分割方法,涉及图像处理方法技术领域。所述方法包括如下步骤:数据预处理,对数据集进行数据增强和划分;构建多尺度的轻量化UNet图像分割网络,所述轻量化UNet图像分割网络包括采用变尺度结构的编码器和解码器两部分;将解码器网络输出的网络特征进行处理,输出每个像素对应的概率,并结合均方误差损失函数MSE,对图像分割网络进行训练;对所述图像分割网络输出的单像素概率进行后处理,生成分割图像。所述方法具有更少的参数,同时具有更高的检测精度,能够精准的完成图像的分割。

主权项:1.一种轻量化多尺度UNet网络的图像分割方法,其特征在于包括如下步骤:S1:数据预处理,对数据集进行数据增强和划分;S2:构建多尺度的轻量化UNet图像分割网络,所述轻量化UNet图像分割网络包括采用变尺度结构的编码器和解码器两部分,两部分之间通过两个3×3的卷积连接,使用基于Ghost空洞卷积的GLBM模块作为网络的基本特征提取模块,并在网络中添加EMA注意力机制进一步提升分割目标的关注度;S3:将解码器网络输出的网络特征进行处理,输出每个像素对应的概率,并结合均方误差损失函数MSE,对图像分割网络进行训练;S4:对所述图像分割网络输出的单像素概率进行后处理,生成分割图像;所述步骤S2构建轻量化UNet图像分割网络包括如下步骤:S21:构建Ghost空洞卷积;所述步骤S21中Ghost空洞卷积:使用Ghost空洞卷积提取图像特征,Ghost空洞卷积在提取图像特征时采用两阶段过程,第一阶段使用空洞卷积提取特征,这一阶段的计算过程如下: 其中,为卷积输入的特征图,f′∈RC×k×k×m×d为空洞卷积运算,Y′∈RH‘×W’×m为得到的本征特征图;第二阶段使用两个3×3的普通卷积对第一阶段提取的特征进行线性变换,该阶段的计算过程如下: 其中,yi′表示Y′中的第i个本征特征图,Φi,j表示生成第i个Ghost特征图yij的第j个线性运算;最后将两阶段的结果进行拼接最后输出,其过程如下: 其中,Y∈RH‘×W‘×2m为Ghost空洞卷积最后生成的特征图;Ghost空洞卷积与标准卷积核大小的对应关系如下:k'=d×k-1+1Ghost空洞卷积感受野的计算公式如下:F=2d-1×k-1+k其中:k表示输入的卷积核尺寸;d:表示膨胀系数;k’表示膨胀后等效的卷积核尺寸;S22:构建Ghost空洞卷积块,所述Ghost空洞卷积块包括Ghost空洞卷积、批量归一化层和ReLu激活函数;S23:构建基于Ghost空洞卷积块的多尺度特征提取模块GLBM模块;所述步骤S23中构建多尺度特征提取模块GLBM包括如下步骤:由分支参数n来控制分支数量和分支的感受野,来改变模块提取的特征尺度;GLBM模块由并行的Ghost空洞卷积块和1×1的卷积组成;第一个分支的Ghost空洞卷积的膨胀率为1,第二个分支的Ghost空洞卷积的膨胀率为3,第三个分支的Ghost空洞卷积的膨胀率为5,以此类推,第n个分支的Ghost空洞卷积的膨胀率为2n-1;Ghost空洞卷积块提取不同尺度的特征,将不同尺度的特征拼接之后送入1×1的卷积,实现跨通道的层的融合;上述过程可描述为: 上述公式中I表示输入的图像;Fn表示经过膨胀率为n的空洞卷积提取到的特征;·表示膨胀率为r的,卷积核大小为k的空洞卷积操作;σ·表示ReLu激活函数;Cat·表示特征拼接操作;BN·表示归一化操作;f1×1·表示一个卷积核大小为1的卷积操作;Fo表示模块输出的特征;S24:构建基于多尺度的轻量化UNet网络的轻量化UNet图像分割网络;构建所述图像分割网络包括如下步骤:构建基于变尺度结构的编码器网络和解码器网络:网络每层提取的特征尺度应与网络该层输入的特征图相适应,也就是当特征图经过最大池化层或转置卷积之后,特征图大小减小或增大,网络每层提取尺度相应减小或增大;所述编码器网络依次包括多层结构,每层结构包括多尺度特征提取GLBM模块、EMA模块和最大池化层;第一层为分支数量为4的GLBM模块、EMA模块和最大池化层;第二层为分支数量为3的GLBM模块、EMA模块和最大池化层;第三层为分支数量为2的GLBM模块、EMA模块和最大池化层;第四层为分支数量为1的GLBM模块、EMA模块和最大池化层;所述解码器网络为多层结构,第一次层为分支数量为1的GLBM模块、EMA模块和转置卷积;第二次层为分支数量为2的GLBM模块、EMA模块和转置卷积;第三次层为分支数量为3的GLBM模块、EMA模块和转置卷积;第四次层为分支数量为4的GLBM模块、EMA模块和转置卷积;解码器网络每一层将编码器网络每一层的输出特征图进行拼接之后进行多尺度特征提取,使得浅层特征和深层特征可以充分融合;其中,所述的解码器网络的第四层输入特征与编码器网络的第一层输出特征拼接;解码器网络的第三层输入特征与编码器网络的第二层输出特征拼接;解码器网络的第二层输入特征与编码器网络的第二层输出特征拼接;解码器网络的第一层输入特征与编码器网络的第四层输出特征拼接;输入进每一层解码器网络的特征图,首先经过GLBM模块,再通过一个EMA注意力模块,之后将特征图送入解码器网络和下一层解码器网络;使用期望最大化注意力机制EMA对GLBM模块提取的特征进行进一步处理,以增强网络对于关键信息的关注度;期望最大化注意力机制EMA由ΑE、ΑM、ΑR三部分组成,其中ΑE、ΑM对应期望最大化EM算法的E步和M步;对输入的特征图X∈RN×C,基初始值为μ∈RN×C,ΑE为估计隐变量Z∈RN×K;第k1个基对第n1个像素的权责计算方法为: 上式中核函数在ΑM步更新μ的值,第k1个基μ更新算法如下: 交替执行ΑE、ΑM步;将近似收敛的μ和Z来重新估计输入特征图,获得估计后的特征图X′∈RN×C,方法如下:X′=Zμ。

全文数据:

权利要求:

百度查询: 河北翔拓航空科技有限公司;石家庄铁道大学 轻量化多尺度UNet网络的图像分割方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。