【发明公布】一种基于多模态图像融合的微光夜视场景理解方法_中国矿业大学_202410031296.7

导航：龙图腾网> 最新专利技术> 一种基于多模态图像融合的微光夜视场景理解方法_中国矿业大学_202410031296.7

申请/专利权人：中国矿业大学

申请日：2024-01-09

公开（公告）日：2024-04-09

公开（公告）号：CN117853856A

主分类号：G06V10/80

分类号：G06V10/80;G06V10/774;G06N3/0464;G06V10/82;G06N3/045;G06V10/44;G06V10/42

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.26#实质审查的生效;2024.04.09#公开

摘要：本发明公开了一种基于多模态图像融合的微光夜视场景理解方法，属于人工智能技术，根据层级多模态特征信息的特点，构建不同特征校准和特征聚合模块以增强多模态特征信息的联合表示学习；构建跨模态全局特征描述模块以减少模态间的信息差异，实现多模态特征信息的校准；构建多模态交错稀疏自注意力模块来保证浅层网络层中多模态空间特征信息的聚合；构建对称金字塔池化交叉注意力模块与多模态跨通道通信模块用于聚合深层特征的空间层信息和通道层信息。本发明能够充分利用多模态特征信息互补优势，避免单一模态信息导致微光夜视场景理解能力不足，能够在夜间城市道路自动驾驶和地下空间暗弱无人导航系统中应用。

主权项：1.一种基于多模态图像融合的微光夜视场景理解方法，其特征在于，步骤如下：步骤1、对MFNet数据集中1569幅图像进行归一化处理，将像素大小统一为H×W，H表示长度，W表示宽度；将统一尺寸后的图像按照784393的比例划分为训练数据集和测试数据集，对训练数据集进行数据增强构成网络训练数据集；转入步骤2；步骤2、构建多模态高效融合网络：所述多模态高效融合网络包括：可见光编码网络、热图像编码网络、跨模态全局特征描述模块、浅层多模态特征聚合模块、深层多模态特征聚合模块、解码网络；其中，可见光编码网络、热图像编码网络均由在ImageNet数据集上预训练的Transformer网络构成，作为提取特征的编码网络；跨模态全局特征描述模块用于校准多模态特征信息；浅层多模态特征聚合模块用于聚合浅层多模态特征信息；深层多模态特征聚合模块用于聚合深层多模态特征信息；解码网络由ALL-MLP模块构成，用于接收编码网络特征信息并对不同尺度的特征图进行特征重建；转入步骤3；步骤3、利用网络训练数据集对多模态高效融合网络进行训练，得到训练好的多模态高效融合网络模型：S31、将可见光编码网络特征提取划分为四个阶段，对应每个阶段提取相应的四个不同尺度的可见光特征，分别为H4×W4、H8×W8、H16×W16、H32×W32，将其中前三个阶段对应的特征为浅层可见光特征，第四个阶段的特征为深层可见光特征；相应地，将热图像编码网络特征提取划分为四个阶段，对应每个阶段提取相应的四个不同尺度的热图像特征，分别为H4×W4、H8×W8、H16×W16、H32×W32，将其中前三个阶段对应的特征为浅层热图像特征，第四个阶段的特征为深层热图像特征；转入S32；S32、将前三个阶段不同尺度的浅层可见光特征和浅层热图像特征并行输入到跨模态全局特征描述模块，从跨模态全局特征描述模块的局部多头关系聚合器得到浅层可见光局部描述特征和浅层热图像局部描述特征，从跨模态全局特征描述模块的输出层得到浅层可见光校准特征和浅层热图像校准特征；并将前三个阶段得到的浅层可见光校准特征和浅层热图像校准特征分别与相应阶段相同尺度的浅层可见光特征和浅层热图像特征进行相加，并传输到特征提取网络的下一个阶段进行下一个尺度特征信息的提取；将第四个阶段得到的深层可见光特征与深层热图像特征输入到跨模态全局特征描述模块，从跨模态全局特征描述模块的局部多头关系聚合器得到深层可见光局部描述特征和深层热图像局部描述特征，从跨模态全局特征描述模块输出层得到深层校准可见光图像特征和深层校准热图像特征；转入S33；S33、将S32中的前三个阶段得到的浅层可见光局部描述特征和浅层热图像局部描述特征，分别并行输入到浅层特征聚合模块提取到前三个阶段不同尺度的浅层聚合特征，将前三个阶段的不同尺度的浅层聚合特征通过跳跃连接的方式传输到解码网络，并对不同尺度的特征信息进行上采样，得到像素大小为H4×W4的浅层解码特征，转入S34；S34、将S32中第四个阶段得到的深层可见光局部描述特征和深层热图像局部描述特征，并行输入到深层特征聚合模块得到深层聚合特征，将深层聚合特征和S32中的深层校准可见光图像特征和深层校准热图像特征进行相加，并输入到解码网络进行上采样得到像素尺度大小为H4×W4的深层解码特征，转入S35；S35、将S33、S34中输出的浅层解码特征和深层解码特征进行拼接并经过一个多层感知网络进行通道降维操作，计算得到的输出特征与标签间的交叉熵损失，并以此对此网络的网络参数进行更新，最终获得训练好的网络，转入步骤4；步骤4、将测试数据集输入到训练好的多模态高效融合网络模型，输出测试集中每个样本对应的预测结果，测试训练好的多模态高效融合网络模型的准确率。

全文数据：

权利要求：

百度查询：中国矿业大学一种基于多模态图像融合的微光夜视场景理解方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种组合式高低压配电柜_靖江市靖开电力电器有限公司_202322564432.2

下一篇：一种LED线性地埋灯_上海科铃纳光电科技有限公司_202322244017.9

相关技术

一种组合式高低压配电柜_靖江市靖开电力电器有限公司_202322564432.2

一种LED线性地埋灯_上海科铃纳光电科技有限公司_202322244017.9

一种旋转式防撞护栏和波形梁护栏的过渡连接结构_浙江飞虹交通设施有限公司_202322419695.4

一种用于土地规划用测量装置_西安市城市发展资源信息有限公司_202322290527.X

整形压块及焊接装置_宁德时代新能源科技股份有限公司_202321970130.9

一种吸尘器高密封过滤网_苏州佳奇克电子有限公司_202322293337.3

一种液压锁密闭性测试装置_靖江市长源液压机械有限公司_202322518953.4

一种用于汽车保险杠加工的旋转喷漆装置_重庆渝湘智成汽车配件有限公司_202322547178.5

一种农牧业通电线卷绕装置_山东恒通智能新材料有限公司_202322431480.4

一种印刷电路板加工用压膜装置_南通欧贝达电子科技有限公司_202322176231.5

一种具有服药求助警报功能的药丸储存项链_杨洁_202322091839.8

一种天然气管道不停输开孔装置_盐城新奥燃气有限公司_202322202238.X

微光相关技术

一种基底分离式微光机电超材料焦平面阵列结构_长春博信光电子有限公司_202311735523.6

一种基于多模态图像融合的微光夜视场景理解方法_中国矿业大学_202410031296.7

一种集成于手机的便携式显微光谱成像设备_苏州芯之光科技有限公司_202310727722.6

基于单双邻域边缘检测的瓷绝缘子微光红外融合感知方法_国网江西省电力有限公司电力科学研究院_202410256796.0

一种微光全玻鱼眼镜头及电子设备_长春通视光电技术股份有限公司_202321056347.9

视觉背景装置，荧光显微光学系统，扫描分析系统_北京临近空间飞行器系统工程研究所_201910817726.7

微光镜头和微光相机_武汉联一合立技术有限公司_202311827587.9

微光像增强器的封装方法_深圳市荣者光电科技发展有限公司_201810939896.8

一种基于神经辐射场的可微光源建模方法及装置_清华大学_202311828039.8

在线多波段光感应解耦的微光学部件成型过程监控方法_华南理工大学_202311574701.1

融合相关技术

一种塑料件高温融合设备_河源艺昇精密科技有限公司_202322688573.5

抗体融合蛋白及其制备和应用_北京诺诚健华医药科技有限公司_202211293426.1

一种含雾图像融合模型和方法_佛山科学技术学院_202410076413.1

一种多特征融合的行人跟踪方法_杭州锐颖科技有限公司_202311346658.3

一种基于多路口多传感器的航迹融合方法及系统_超级视线科技有限公司_202111569137.5

一种致癌性融合激酶抑制剂的晶型及其应用_南京再明医药有限公司_202080058668.5

轨道几何参数与车辆动力学融合影响分析方法及系统_南京地铁运营咨询科技发展有限公司_202410172454.0

一种基于运动约束的融合定位方法及装置_北京斯年智驾科技有限公司_202211198340.0

一种全领域产品节点体系动态融合与生长方法_杭州量知数据科技有限公司_202111166990.2

一种岩溶古河道多信息融合体的识别方法及装置_中国石油化工股份有限公司_202211295813.9

夜视相关技术

一种基于红外热成像技术的高清夜视系统_广州昶视电子科技股份有限公司_202311242316.7

一种模块化单兵热成像夜视仪的模块连接结构_小雨信通(北京)科技有限公司_202321840353.3

夜视仪_深圳市龙之源科技股份有限公司_202311766584.9

一种双目夜视仪_高迪数码(青岛)有限公司_202322256411.4

一种夜视巡逻照明装置_池州学院_202322390412.8

一种可快速装配的夜视仪_晋宁天闻光电仪器制造有限公司_202322202355.6

一种恒压充电式夜视浮漂_临沂市兰山区智能渔具商行_202322436756.8

车载夜视相机图像增强方法、系统及存储介质_深圳森云智能科技有限公司_202410177002.1

一种安全辅助的远红外技术车载夜视仪_深圳市腾奥电子科技有限公司_202322258118.1

一种便携式夜视仪检测设备_中国航空工业集团公司沈阳飞机设计研究所_202322587014.5

龙图腾网&IPTOP

【发明公布】一种基于多模态图像融合的微光夜视场景理解方法_中国矿业大学_202410031296.7

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务