买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种边界引导上下文聚合的交通场景语义分割方法_中南大学_202210464104.2 

申请/专利权人:中南大学

申请日:2022-04-29

公开(公告)日:2024-04-16

公开(公告)号:CN114782949B

主分类号:G06V20/70

分类号:G06V20/70;G06V10/20;G06V10/44;G06V10/82;G06N3/0464;G06N3/082

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2022.08.09#实质审查的生效;2022.07.22#公开

摘要:本发明公开了一种边界引导上下文聚合的交通场景语义分割方法,其实施方案为:1获取数据集与分割标签;2数据处理;3构建分割模型;4构建损失函数;5训练分割模型;6交通场景图像分割。本发明构建的具有边界细化模块的交通场景分割模型,在去除低层次的轮廓纹理信息的同时保留了高级的语义边界信息,能够有效检测对象的边界,并沿着目标边界聚合上下文信息,增强同类像素的一致性,从而有效利用边界信息对交通场景图像进行语义分割。本发明方法能够捕获边界区域像素与对象内部像素之间的依赖关系,有效提高分割准确性和鲁棒性。

主权项:1.一种边界引导上下文聚合的交通场景语义分割方法,其特征在于包括以下步骤:1获取数据集与分割标签:获取交通场景公开数据集与对应的分割标签;2数据处理,具体包括以下步骤:2-a对步骤1获取的数据集中的图像与对应的分割标签同步水平翻转;2-b将步骤2-a获得的图像及对应的分割标签都缩放至m1×m2像素大小,其中m1和m2分别为缩放后图像的宽和高,m1、m2都为正整数;2-c将步骤2-b缩放得到的图像及对应的分割标签进行归一化操作,组成处理后的样本数据集;3构建分割模型,具体包括以下步骤:3-a构建语义分割模块,该模块一共包括五组下采样层和一个空洞空间卷积池化金字塔模块,即ASPP模块;输入图像依次经过这五组下采样层,分别得到特征图F1、F2、F3、F4和F5,F5经过ASPP模块后,得到特征图Ff;第一组下采样层由一个残差卷积块与一个池化层组成,第二、三、四、五组下采样层都由一个残差卷积块组成;3-b构建边界细化模块,将步骤3-a得到的特征图F2、F3、F4和F5分别经过一个卷积核大小为1×1的卷积层后得到相应的特征图F2′、F3′、F4′和F5′;利用边缘检测算子对输入图像进行边缘检测得到特征图B1,将B1经过一个卷积核大小为1×1的卷积层后得到特征图B11,B11与F2′共同输入到第一个注意力门控模块AG1,得到特征图B2;将B11经过一个卷积核大小为1×1的卷积层后得到特征图B12,B12与F3′共同输入到第二个注意力门控模块AG2后得到特征图B3;将B12经过一个卷积核大小为1×1的卷积层后得到特征图B13,B13与F4′共同输入到第三个注意力门控模块AG3后得到特征图B4;将B13经过一个卷积核大小为1×1的卷积层后得到特征图B14,B14与F5′共同输入到第四个注意力门控模块AG4后得到特征图B5;最后将特征图B2、B3、B4和B5拼接后得到特征图Bs,Bs经过一个卷积核大小为1×1的卷积层降维后得到特征图Bf;3-c将步骤3-a得到的特征图Ff与步骤3-b得到的特征图Bf共同输入到上下文聚合模块,即CAM模块,得到特征图Fp,Fp经过一个卷积核大小为3×3的卷积层后得到特征图F′p,将F′p上采样至原始图像大小,得到交通场景语义分割结果;将步骤3-b得到的特征图Bf经过一个卷积核大小为3×3的卷积层后得到特征图Bp,将Bp上采样至原始图像大小,得到交通场景边界的二值分割结果;4构建损失函数:构建以下联合损失函数:L=λ1Lbody+λ2Lboun+λ3Laux 其中,Lbody表示语义分割的交叉熵损失,Lboun表示边界分割的二项式交叉熵损失,Laux表示辅助的交叉熵损失,表示像素i为第k类标签的真值,yi∈[0,1]表示像素i为边界的真值,λ1,λ2,λ3为超参数,其中λ1∈0,1],λ2∈0,1],λ3∈0,20],I代表输入图像,k取正整数且k∈[1,K],K为分割结果的类别数,取正整数且K∈[2,160],表示像素i为第k类的预测结果,pi∈0,1表示像素i为边界的预测结果,log为自然对数;5训练分割模型:利用步骤2得到的样本数据集训练步骤3构建完成的分割模型,根据步骤4构建的损失函数得到损失值,并使用随机梯度下降法更新模型内的参数,直至损失值不再下降,得到训练好的分割模型;6交通场景图像分割:获取待分割的交通场景图像,按照步骤2对它们进行数据处理后,输入步骤5得到的训练好的分割模型中,得到最终分割结果。

全文数据:

权利要求:

百度查询: 中南大学 一种边界引导上下文聚合的交通场景语义分割方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。