买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于视差与平面拟合的双分支室外非结构化地形分割网络_大连理工大学_201810577133.3 

申请/专利权人:大连理工大学

申请日:2018-06-01

公开(公告)日:2021-05-07

公开(公告)号:CN108921852B

主分类号:G06T7/10(20170101)

分类号:G06T7/10(20170101);G06K9/00(20060101)

优先权:

专利状态码:有效-授权

法律状态:2021.05.07#授权;2018.12.25#实质审查的生效;2018.11.30#公开

摘要:本发明属于计算机视觉技术领域,提供了一种基于视差与平面拟合的双分支室外非结构化地形分割网络。该方法首先进行地面拟合以及地面偏差的计算,并选择具有几何特性的视差图和地平面偏差图代替彩色图像作为网络输入。该方法设计的网络体系结构由两个子网络组成:地形分割主网络及稳定性和适应性增强模块,两个模块相辅相成,显示了良好的地形分割效果,具有很好的鲁棒性和环境适应性。

主权项:1.一种基于视差与平面拟合的双分支室外非结构化地形分割网络的构建方法,其特征在于,以视差图与基于视差图拟合做差得到的地平面偏差图为输入,通过包含分割模块和增强模块的双分支深度网络模型对室外非结构化地形进行预测,产生地形分割结果;以视差图与地平面偏差图作为网络输入,网络结构采用双分支双输入结构:以带有噪声的视差图作为分割模块的输入,通过卷积池化操作平滑视差图中的空洞和噪声信息;以基于视差图拟合做差得到的地平面偏差图作为增强模块的输入,引入平面几何特征并自适应地生成参考特征图,提升分割准确率;双分支深度网络模型的输入均未使用对场景变化敏感的RGB彩色图像;所述的包含分割模块和增强模块的双分支深度网络模型,基于deeplab模型16层的结构,分割模块每次池化操作之前,采用1*1卷积核进行降维到原本维度的12;增强模块引入地平面的平面几何特征,针对1、12、14、18的不同尺度层,自适应地生成参考特征图,该参考特征图为网络的中间结果,连接到分割模块的对应的1、12、14、18的尺度层,参考特征图的维度为对应分割模块的12。

全文数据:基于视差与平面拟合的双分支室外非结构化地形分割网络技术领域[0001]本发明属于计算机视觉技术领域,具体涉及一种以视差图与拟合的地平面偏差图为输入的面向非结构化室外环境地形分割的双分支深度网络。背景技术[0002]目前,非结构化室外环境下的自主机器人导航仍然是一个开放且具有挑战性的问题。地形分割是机器人导航的核心任务之一,是机器人识别可穿越区域和避免障碍物的关键。与城市道路不同,非结构化室外环境下的地形复杂,具有多种地形类型和障碍物的组合特征。在图Ia中,光照条件产生阴影和过饱和的现象,此外,障碍物树木、干草与带落叶的污垢路面有很高的视觉相似性,这给地形分割带来了很大的挑战。[0003]在人类生物视觉系统中,立体视差在场景感知中起着重要的作用,它可以被机器视觉系统用于自主机器人导航,因此许多道路分割算法是基于立体视差信息的。Zhu等人“Stereovisionbasedtraversableregiondetectionformobilerobotsusinguv-disparity,’’inControlConferenceCCC,201332ndChinese.IEEE,2013,pp.5785-5790.提出了一种室内和城市道路的可穿越区域检测算法,该算法引入了u-v视差,(u,v表示图像中的像素坐标,但是在特征提取和立体匹配过程中的不准确估计往往会得到带有空洞和噪声视差图(见图Ib影响算法性能。因此,在应用视差图时,必须考虑全局信息和局部信息来平滑空洞和削弱噪声。[0004]随着深度学习技术的飞速发展,全卷积网络(“Fullyconvolutionalnetworksforsemanticsegmentation,”inProceedingsoftheIEEEConferenceonComputerVisionandPatternRecognition,2015,pp.3431-3440.推动了语义分割的发展。许多优秀的研究基于全卷积网络,并进一步的改进网络结构,从而提高了公开的标准数据集的准确性,如Cityscapes和KITTIRoad。他们在常见且规整的城市道路或高速公路上表现优异,但是在非结构化的自然场景中,由于光照、天气、路况等变化,会导致模型失效。这是因为在特定数据集上训练的网络不够灵活,无法适应变化的以及未曾出现过的路况。Shashank等人(“DeepCNNwithcolorlinesmodelforunmarkedroadsegmentation,’’inIEEEInternationalConferenceonImageProcessingICIP2017,Beijing,2017.通过条件随机场将深度卷积神经网络与色线模型先验进行结合以适应不同的光照条件,但是当道路的颜色接近周围的环境时,它就失效了。在机器人导航的实际应用中,场景会随着时间而变化,为此,有必要研究一种自适应的且鲁棒的地形分割算法。[0005]Procopio等人(“Learningterrainsegmentationwithclassifierensemblesforautonomousrobotnavigationinunstructuredenvironments,’’JournalofFieldRobotics,vol.26,no.2,pp.145-175,2009.通过地面拟合获得图像标签,通过计算预测的地面视差与观察到的视差之间的差异,阈值直接用于确定图像中的像素是否属于地面。在图Ic中可见,地平面偏差图存在一定的噪声和不连续性,因此直接阈值分割的结果不能完全适用。[0006]本发明受到以上算法的启发,针对项目需求,提出一种以视差图与拟合的地平面偏差图为输入的面向非结构化室外环境地形分割的双分支深度网络。发明内容[0007]本发明的目的是解决非结构化室外环境地形分割在光照、天气、路况等变化情况下的不足之处。在以视差图与拟合的地平面偏差图为输入的面向非结构化室外环境地形分割的双分支深度网络中,处理目标是视差图像,处理目的是分割出可穿越区域和障碍物区域。[0008]本发明的技术方案:[0009]—种基于视差与平面拟合的双分支室外非结构化地形分割网络,步骤如下:[0010]1进行非结构化室外环境下的地面拟合以及地面偏差的计算[0011]通过立体摄像机采集数据,标定的立体摄像机系统具有基线长度L和焦距f·,建立立体摄像机坐标系,其X,Y,Z轴分别与图像轴X,y,摄像机光轴对齐;[0012]贝IJ图像深度Zdepth与视差δ的关系表示为:[0013][0014]任意平面P在立体摄像机坐标系中表示为:[0015]AX+BY+CZ+D=0[0016]其中,A,B,C,D表示平面参数;[0017]根据立体视觉中的透视投影原理以及相似变换原理,计算出双目立体摄像机坐标系下的平面在视差空间中的初始估计:[0018]δ=αιι+βν+y[0019]其中,u,V是像素坐标,α,β,γ是平面参数;[0020]根据上述原理,对输入的一张非结构化室外环境的视差图像,通过像素坐标u,v和视差值心进行拟合,得到平面参数α,β,γ;[0021]计算出立体摄像机坐标系下的地面在视差空间中的估计:[0022]δρ=αιι+βν+γ[0023]然后通过拟合得到的平面参数α,β,γ计算预测的地面视差δρ与输入的非结构化室外环境的视差S。的差异,逐像素对应作差得地平面偏差图Idev:[0024]Idev=δ〇-δρ[0025]进一步地,选择初始输入的视差图和通过上述过程拟合做差得到的地平面偏差图代替彩色图像作为网络输入,将其平面几何特性应用于网络;[0026]因为在本发明中通过对室外环境的自然数据进行直方图统计分析和比较,可以注意到,对于彩色图像,当场景保持不变时,它们在纹理和颜色上有一些相似之处,但当场景发生变化时,它们将有显著的不同。然而,在变化的条件下,视差图和地平面偏差图的分布更加稳定和相似,且具有平面几何特性。[0027]2针对视差图与拟合的地平面偏差图为输入,设计双分支深度网络模型自适应的提取特征,考虑全局信息和局部信息来平滑空洞和削弱噪声,进行地形分割,具体的设计方法如下:[0028]深度网络模型由两个模块组成:分割模块和增强模块;如图2所示,这两个模块相辅相成,显示了良好的地形分割效果。[0029]分割模块:以初始输入的视差图作为输入,基于Deeplab模型(“Deeplab:Semanticimagesegmentationwithdeepconvolutionalnets,atrousconvolution,andfullyconnectedcrfs,’’IEEETransactionsonPatternAnalysisandMachineIntelligence,2017.,16层结构,每次池化操作之前,采用1*1卷积核进行降维,步长为I,填充为〇;[0030]增强模块:以拟合做差得到的地平面偏差图作为输入;以1、12、14、18的尺度层、3*3的卷积核提取特征,来自适应地生成参考特征图,该特征参考图为网络的中间结果,然后将该参考特征图连接到分割模块的对应的1、12、14、18的尺度层,参考特征图的维度为对应分割模块的12;[0031]输入层:以初始输入的视差图像和拟合做差得到的地面偏差图像作为输入,图像大小为640*480;[0032]卷积层:3*3的卷积核提取特征,步长为1,填充为1;[0033]1*1卷积核进行降维,步长为1,填充为0;[0034]池化层:采用最大池化的方式,3*3的卷积核,步长为2;[0035]扩张卷积层:[0036][0037]其中,u,V表示像素坐标,F表示卷积特征,W表示滤波器权重,r表示采样率,H是输出特征,i,j为循环变量;[0038]融合层:将增强模块生成的参考特征图映射连接到分割模块的相应层;[0039]将经过四种不同采样率的扩张卷积操作后产生的特征图连接起来;[0040]损失层:最小化softmax损失函数;[0041]基于公共平台Caffe进行深度网络模型训练;[0042]学习率Ir采用了“poly”学习率策略:[0043]Ir=Irbasel-itermax_iterpower[0044]其中,Ir表示当前学习率,iter表示当前迭代次数,基本学习率Irbase设置为0·001,指数power设置为0·9,最大迭代次数max_iter设置为10000;[0045]最后,应用训练好的模型对新的数据进行预测,产生地形分割结果。[0046]本发明的有益效果是:模型采用了带多采样率滤波器的卷积特征层,有效地考虑了局部和全局上下文信息,平滑了视差映射中的空洞信息;利用了由视差图计算出的地平面偏差图的平面几何特性,提高了算法的适应性,在定性和定量两方面均具有较好的地形分割性能。附图说明[0047]图1是非结构化场景示意图,(a是非结构化场景地形实拍图;(b是对应的视差图;(C是计算得到的地平面偏差图。[0048]图2是本发明的设计原理图,本发明基于视差图,通过平面拟合与偏差计算,得到地平面偏差图,作为双分支网络的输入,通过分割模块和增强模块的处理,得到输出结果。具体实施方式[0049]以下结合附图和技术方案,进一步说明本发明的具体实施方式。[0050]本发明基于Matlab进行地面拟合以及地面偏差的计算,然后基于Caffe框架搭建网络模型。[0051]Step1:数据准备,如图Ib所示的视差图和对应的可行区域与障碍区域标注。[0052]Step2:输入的一张视差图像,根据已知的像素坐标x,y和视差值δ进行地平面拟合δ=αχ+βγ+γ,得到平面参数α,β,γ。[0053]Step3:估计出上述参数α,β,γ后,用该参数进一步地计算出相机坐标系下的地平面在视差空间中的估计:[0054]δρ=αχ+βγ+γ[0055]其中,x,y是图像坐标系中的像素坐标,α,β,γ是第二步估计的平面参数。[0056]Step4:通过计算预测的地面视差δρ与初始的输入视差δ。的差值,得到地面偏差图Idev:[0057]Idev=δ〇-δρ[0058]Step5:搭建深度网络结构,层次结构如图2所示。分割模块基于deeplab模型16层的结构,每次池化操作之前,采用1*1卷积核进行降维到原本维度的12步长为1,填充为〇,增强模块自适应的生成参考特征图并与对应尺度的分割层连接。[0059]输入层:以视差图像和地面偏差图像作为输入,图像大小为640*480。[0000]卷积层:3*3的卷积核提取特征,步长为1,填充为1。[0061]1*1卷积核进行降维,步长为1,填充为0。[0062]池化层:采用最大池化的方式,3*3的卷积核,步长为2。[0063]扩张卷积层:[0064][0065]其中,X,y表示像素坐标,F表示卷积特征,W表示滤波器权重,r表示采样率,H是输出特征。本设计中应用四种不同采样率2,4,6,8的扩张卷积。[0066]融合层:将增强模块生成的参考特征映射连接到分割模块的相应层。将经过四种不同采样率2,4,6,8的扩张卷积操作后产生的特征图连接起来。[0067]损失层:最小化softmax损失函数。[0068]Step6:基于公共平台Caffe进行网络训练。[0069]学习率Ir采用了“poly”学习率策略:[0070]Ir=Irbasel-itermax_iterpower[0071]其中,Ir表示当前学习率,iter表示当前迭代次数,基本学习率Irbase设置为0·001,指数power设置为0·9,最大迭代次数max_iter设置为10000。[0072]Step7:应用训练好的模型进行前向传播产生地形分割结果。

权利要求:1.一种基于视差与平面拟合的双分支室外非结构化地形分割网络,其特征在于,以视差图与基于视差图拟合做差得到的地平面偏差图为输入,通过包含分割模块和增强模块的双分支深度网络模型对室外非结构化地形进行预测,产生地形分割结果;以视差图与地平面偏差图作为网络输入,网络结构采用双分支双输入结构:以带有噪声的视差图作为分割模块的输入,通过卷积池化操作平滑视差图中的空洞和噪声信息;以基于视差图拟合做差得到的地平面偏差图作为增强模块的输入,引入平面几何特征并自适应地生成参考特征图,提升分割准确率;双分支深度网络模型的输入均未使用对场景变化敏感的RGB彩色图像;所述的包含分割模块和增强模块的双分支深度网络模型,基于deeplab模型16层的结构,分割模块每次池化操作之前,采用1*1卷积核进行降维到原本维度的12;增强模块引入地平面的平面几何特征,针对1、12、14、18的不同尺度层,自适应地生成参考特征图,该参考特征图为网络的中间结果,连接到分割模块的对应的1、12、14、18的尺度层,参考特征图的维度为对应分割模块的12。

百度查询: 大连理工大学 基于视差与平面拟合的双分支室外非结构化地形分割网络

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。