申请/专利权人:中国科学院自动化研究所
申请日:2024-04-08
公开(公告)日:2024-05-10
公开(公告)号:CN118015283A
主分类号:G06V10/26
分类号:G06V10/26;G06V10/52;G06V10/80;G06V10/82;G06N3/0455;G06N3/0464;G06N3/048;G06N3/08
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.05.28#实质审查的生效;2024.05.10#公开
摘要:本发明涉及图像分割技术领域,提供一种图像分割方法、装置、设备和存储介质,包括:获取配对的RGB图像和红外图像;将RGB图像和红外图像输入至基于卷积多模态适配器的视觉变换器网络中,得到融合更新后的至少两个不同尺度的目标特征对;将各尺度的目标特征对输入至基于交叉注意力的解码器网络中,得到目标图像分割结果。本发明使用基于卷积多模态适配器的视觉变换器网络提升特征提取能力,使用基于交叉注意力的变换器解码器块构造基于交叉注意力的解码器网络,提升了在建模长距离依赖,进一步提高了模型的表达能力。
主权项:1.一种图像分割方法,其特征在于,所述方法包括:获取配对的RGB图像和红外图像;将所述RGB图像和所述红外图像输入至基于卷积多模态适配器的视觉变换器网络中,得到融合更新后的至少两个不同尺度的目标特征对;其中,各尺度的所述目标特征对中包括所述RGB图像对应的第一特征与所述红外图像对应的第二特征,且所述第一特征与所述第二特征的尺度相同;将各尺度的所述目标特征对输入至基于交叉注意力的解码器网络中,得到目标图像分割结果;其中,所述基于卷积多模态适配器的视觉变换器网络在提取所述RGB图像的特征与所述红外图像的特征的过程中,根据所述RGB图像的特征与所述红外图像的特征融合更新所述RGB图像的第一中间特征与所述红外图像的第二中间特征,以根据更新后的第一中间特征得到所述第一特征与根据更新后的第二中间特征得到所述第二特征;其中,所述基于交叉注意力的解码器网络在对所述第一特征与所述第二特征的解码过程中,对所述第一特征与所述第二特征进行自适应融合,得到多模态特征;基于所述交叉注意力得到所述多模态特征对应的掩码图;通过级联方式融合至少两个所述掩码图,得到所述目标图像分割结果。
全文数据:
权利要求:
百度查询: 中国科学院自动化研究所 图像分割方法、装置、设备和存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。