申请/专利权人:北京百度网讯科技有限公司;百度(美国)有限责任公司
申请日:2020-12-25
公开(公告)日:2024-04-02
公开(公告)号:CN112541482B
主分类号:G06V20/56
分类号:G06V20/56;G06V10/44;G06V10/774;G06N20/20
优先权:
专利状态码:有效-授权
法律状态:2024.04.02#授权;2021.04.09#实质审查的生效;2021.03.23#公开
摘要:本申请公开了深度信息补全模型训练方法、装置、设备以及存储介质,涉及计算机视觉、深度学习、自动驾驶等人工智能技术领域。该方法的一具体实施方式包括:获取训练数据,其中,训练数据包括第一稀疏深度图像、对应的第一彩色图像和对应的第一稠密深度图像;将第一稀疏深度图像和第一彩色图像作为输入,将第一稠密深度图像作为输出,训练得到深度信息补全模型,其中,在训练过程中,先融合第一稀疏深度图像和第一彩色图像进行特征提取,再进行特征增强。该实施方式在训练过程中,以稀疏深度图像和对应的彩色图像作为输入,先融合稀疏深度图像和彩色图像进行特征提取,再进行特征增强,能够训练出用于有效获取稠密深度图像的模型。
主权项:1.一种深度信息补全模型训练方法,包括:获取训练数据,其中,所述训练数据包括第一稀疏深度图像、对应的第一彩色图像和对应的第一稠密深度图像;将所述第一稀疏深度图像和所述第一彩色图像作为输入,将所述第一稠密深度图像作为输出,训练得到深度信息补全模型,其中,在训练过程中,先融合所述第一稀疏深度图像和所述第一彩色图像进行特征提取,再进行特征增强,所述深度信息补全模型包括K个基本训练单元,K为正整数,所述基本训练单元包括编码模块、特征增强模块和解码模块,所述编码模块包括多个卷积层,用于融合输入深度图像和所述第一彩色图像进行特征提取,所述输入深度图像和所述第一彩色图像融合后输入到所述编码模块,融合方式是通道融合,所述特征增强模块用于对所述编码模块提取的特征进行特征增强,所述解码模型包括与所述编码模块数量相同的卷积层,是所述编码模块的逆向操作;特征增强模块用于通道级特征增强和像素级特征增强,以及通道级特征和像素级特征融合;其中,所述特征增强模块的通道级特征增强步骤包括:对于特征Fc×w×h,通过卷积和矩阵变维操作,得到特征Qcc×h*w和特征Hch*w×c,其中,c是通道数,w是宽、h是高;将所述特征Qcc×h*w和所述特征Hch*w×c进行矩阵乘法操作,得到矩阵Mcc×c;对所述矩阵Mcc×c进行回归操作,得到权重Mcʹc×c;对所述特征Fc×w×h进行卷积操作,得到特征Fcʹc×w×h;通过所述权重Mcʹc×c和所述特征Fcʹc×w×h进行矩阵乘法操作,得到增强特征Fhc×w×h;对所述增强特征Fhc×w×h与所述特征Fcʹc×w×h进行像素级加法,得到通道级增强特征Fcc×w×h。
全文数据:
权利要求:
百度查询: 北京百度网讯科技有限公司;百度(美国)有限责任公司 深度信息补全模型训练方法、装置、设备以及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。