【发明授权】面向无人机视频数据的弱监督显著性目标检测方法及系统_山东大学;中国电子科技集团公司第五十四研究所_202310989860.1

申请/专利权人：山东大学;中国电子科技集团公司第五十四研究所

申请日：2023-08-07

公开（公告）日：2024-04-02

公开（公告）号：CN117173394B

主分类号：G06V10/25

分类号：G06V10/25;G06V10/52;G06V10/62;G06V10/80;G06V10/44;G06V10/82;G06V20/17;G06N3/0455

优先权：

专利状态码：有效-授权

法律状态：2024.04.02#授权;2023.12.22#实质审查的生效;2023.12.05#公开

摘要：本发明提出了面向无人机视频数据的弱监督显著性目标检测方法及系统，分别对视频的RGB图像和光流图进行浅层特征和深层特征的提取，浅层特征包括物体的边缘和纹理等特征信息，深层特征包括丰富的显著性语义内容，将不同模态的浅层特征进行模态对齐和校准，能够更加关注每个模态的显著性信息；不同模态的深层特征进行跨模态融合，充分融合了深层特征的显著性语义信息，然后基于跨模态浅层增强特征和跨模态深层交互特征进行融合得到检测结果，能够很好地抑制视频中复杂背景信息，提高了视频显著性目标检测的准确性，而且应用在弱监督中可达到部分全监督检测效果。

主权项：1.面向无人机视频数据的弱监督显著性目标检测方法，其特征在于，包括：获取视频片段的RGB图像、光流图像；分别对所述RGB图像、光流图像进行多尺度的特征提取，得到RGB图像的浅层特征和深层特征，光流图像的浅层特征和深层特征；采用跨模态特征增强模块，将所述RGB图像和所述光流图像不同模态的浅层特征进行模态对齐，基于通道注意力机制对不同模态的浅层特征进行通道维度校准，将不同模态浅层特征对齐后特征和通道维度校准后特征进行融合，得到跨模态浅层增强特征；具体的，采用跨模态特征增强模块，将所述RGB图像和所述光流图像不同模态的浅层特征进行模态对齐，并基于通道注意力机制对不同模态的浅层特征进行通道维度校准，将不同模态浅层特征对齐后特征和通道维度校准后特征进行融合，得到目标跨模态浅层增强特征，具体为：对所述RGB图像的浅层特征和所述光流图像的浅层特征基于公共部分计算空间权重图；具体的，其中，表示逐像素相乘，Max·代表通道维度上的全局最大池化操作，该操作将多通道特征映射为单通道特征，σ为Sigmoid激活函数，为7×7卷积层；将所计算的空间权重图分别与所述RGB图像浅层特征、所述光流图像浅层特征进行融合对齐，分别得到对齐特征；具体的，对齐过程：得到两个模态空间对齐后的特征，通道维度的注意力被用于对各自模态特征内拥有更多显著性内容的通道特征进行增强：其中，GMP表示全局最大池化，为1×1卷积层；将对齐特征基于通道注意力机制进行校准，得到校准特征；具体的，通道注意力得到的通道维度加权特征加权各自对应的两个模态特征中，以实现在通道维度对显著性信息的校准：其中，⊙代表通道维度带有广播策略相乘；将不同模态的对齐特征与对应的校准特征进行融合，得到不同模态的跨模态浅层增强特征；具体的，门控装置以经过特征增强后的两个模态特征为输入，将特征级联后，利用多层感知器产生门控信号，让网络学习选择两个模态的权重，过程如下所述：其中，GAP表示全局平均池化，MLP表示多层感知机，Cat表示在特征维度的级联操作；随后，得到两个模态各自权重Ga和Gm，这两个权重用于控制两个模态特征的重要性；与经过对齐和校准后的对应模态特征加权得到最终跨模态特征增强模块的输出：[Ga,Gm]＝ρf′g 其中，表示带有广播策略的相乘，fCFE为当前特征尺度对应的跨模态特征增强模块的输出；还包括边缘检测增强，具体的，利用全监督的交叉熵损失函数作为边缘检测增强的边缘检测监督；包括：将RGB图像的不同尺度的浅层特征、所述光流图像不同尺度的浅层特征分别通过一维卷积进行特征降维；将降维后的RGB图像的不同尺度的浅层特征、光流图像不同尺度的浅层特征分别上采样到同一尺度；将上采样后的RGB图像的浅层特征、光流图像的浅层特征基于不同模态进行级联；将级联后的结果基于通道注意力机制得到边缘增强的RGB图像的浅层特征、光流图像的浅层特征；具体的，交叉熵损失函数其中，J为涂鸦标签前景标注区域，g指真值，s代表预测显著图；同时，边缘检测增强模块需要边缘损失函数学习边界结构信息，使用全监督的交叉熵损失函数作为边缘信息监督：其中，GTe表示对应的边缘真值图；引入提出的门控结构感知损失函数实现期望预测的显著性图在显著区域内具有一致性，在显著性目标边缘存在明显边界的目的，针对模型的显著性检测结果图，得到损失函数：其中，GTs为弱监督涂鸦标签，grey表示当前模型训练输入的RGB图像对应的灰度图，λ为超参数用于平衡多个损失函数；最后，加上使用的InfoNCE损失函数整个模型的总损失函数如下：采用深度感知交互模块，将所述RGB图像和所述光流图像不同模态的深层特征基于多头注意力机制实现跨模态融合，得到跨模态深层交互特征；具体的，采用深度感知交互模块，将所述RGB图像和所述光流图像不同模态的深层特征基于多头注意力机制进行跨模态融合，得到跨模态深层交互特征，具体包括：将所述RGB图像和所述光流图像不同模态的深层特征经过映射，得到对应的查询变量、关键变量和值变量；根据所得到的不同模态的查询变量、关键变量和值变量，基于跨模态注意力机制，得到RGB图像运动模态增强特征和光流图像纹理增强特征；具体的，对于跨模态的感知交互，两个模态的特征经过映射得到对应的查询变量q，关键变量k和值变量v；首先在多头跨模态注意力的注意力模块中对两个模态的查询变量进行交换，进行跨模态的显著性特征学习，通过以下两个公式表示：其中，attan对应RGB图像模态特征被运动模态特征增强，attma对应运动模态特征被RGB图像模态特征增强，MCA为跨模态注意力机制，d为缩放因子；将RGB图像运动模态增强特征、光流图像纹理增强特征分别经过线性映射，然后基于多头自注意力进行单模态特征的学习，得到跨模态深层交互特征；利用长时跨帧对比模块基于连续帧之间背景和前景的相似度以及不同帧之间背景和前景的差异性，对跨模态浅层增强特征和跨模态深层交互特征进行融合，得到显著性目标检测结果；具体的，利用长时跨帧对比模块基于连续帧之间背景和前景的相似度以及不同帧之间背景和前景的差异性，对不同模态的跨模态浅层增强特征和跨模态深层交互特征进行融合，具体为：通过卷积操作获得融合特征的前景特征的激活图；根据所述激活图和融合特征通过矩阵乘法进行前景和背景的解耦，得到前景表达向量和背景表达向量；所述前景表达向量和背景表达向量通过对比学习的损失函数拉近前景和前景的距离，拉远前景和背景的距离。

全文数据：

权利要求：

百度查询：山东大学;中国电子科技集团公司第五十四研究所面向无人机视频数据的弱监督显著性目标检测方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：CNC加工用快速换线治具_东莞华清光学科技有限公司_202322418777.7

下一篇：夹具_新疆蓝晶新材料科技有限公司_202322100063.1

相关技术

CNC加工用快速换线治具_东莞华清光学科技有限公司_202322418777.7

夹具_新疆蓝晶新材料科技有限公司_202322100063.1

一种用于土地规划用测量装置_西安市城市发展资源信息有限公司_202322290527.X

高温堆直流调试防干扰回路_华能山东石岛湾核电有限公司_202322501565.5

一种接触器触头机构_杭州玛实迪电器科技有限公司_202322179096.X

一种用于汽车保险杠加工的旋转喷漆装置_重庆渝湘智成汽车配件有限公司_202322547178.5

一种防堵污水管道_浩卓泵业(杭州)有限公司_202322092893.4

一种高效散热电源_广州市力为电子有限公司_202322175013.X

一种吸尘器高密封过滤网_苏州佳奇克电子有限公司_202322293337.3

一种基于区块链技术的危险废物监管装置_上海博优环境科技发展有限公司_202322288382.X

一种双卧轴连续式混凝土搅拌装置_广安金都混凝土有限公司_202322291527.1

一种旋转式防撞护栏和波形梁护栏的过渡连接结构_浙江飞虹交通设施有限公司_202322419695.4

弱相关技术

基于相位偏置量子弱测量的绝对弱磁场测量设备及方法_中国地质大学(武汉)_202210814619.0

地震数据自适应弱反射信号补偿方法、系统、设备及介质_山东科技大学_202410288054.6

弱耦合二十模式少模光纤及其实现方法_上海交通大学_202010320708.0

基于对抗攻击的深度学习模型弱标签漏洞挖掘方法及系统_上海交通大学_202410108773.5

一种用于检测弱表达RhD变异型的SNP标记_青岛市中心血站(青岛市输血医学研究所)_202410064379.6

一种基于弱监督和辅助任务的图像归一化方法_上海市精神卫生中心(上海市心理咨询培训中心)_202011239255.5

一种中频弱振荡磁场辅助双孢蘑菇保鲜的方法_上海市农业科学院_202010871328.6

一种脉冲弱磁场联合冷藏延长草菇室温贮藏期的方法_上海市农业科学院_202010870255.9

一种中华蜜蜂养殖中的弱群越冬方法_巫应强_202410238273.3

一种基于目标检测与弱磁检测的管道缺陷识别定位方法_中磁数智(北京)科技有限公司_202311547966.2

显著性相关技术

呼吸性粉尘连续测量装置_淮南润成科技股份有限公司_201910155318.X

超吸收性水凝胶_厦门君德医药科技有限公司_202280002509.2

容器镜像的扩展的完整性监视_西门子股份公司_202180049970.9

一种耐用性消防水泵_瑞迪巴夫科技(南京)有限公司_202322148103.X

多型腔壳体密封性检测工装_浙江三进科技有限公司_202322466065.2

一次性使用内窥镜给药管_江苏真由美生物科技有限公司_202322098291.X

一种防尘稳固性温控器_南京绍笛电子有限公司_202322403880.4

屏幕外对象存在的选择性指示_拳头游戏公司_202180062320.8

持久性存储装置及其操作方法_三星电子株式会社_202311283654.5

深度神经网络的正确性保持优化_通用汽车环球科技运作有限责任公司_201910504097.2

监督相关技术

一种执法监督管理巡查设备_武汉铂亚晨科技有限公司_202322808118.4

基于主题信息增强的弱监督方面类别检测方法_昆明理工大学_202210652339.4

一种基于对偶学习和辅助信息的无监督气象降尺度方法_成都信息工程大学_202410189155.8

基于文字辅助的半监督3D医学图像分割方法_中国海洋大学_202410096489.0

基于无监督迁移学习的泵类机械设备轴承故障诊断方法_中国人民解放军92578部队_202111182225.X

一种面向铁轨图像的半监督异物检测方法_东南大学_202110785139.1

一种基于图卷积网络和无监督域自适应的航空发动机剩余使用寿命预测方法_大连理工大学_202111362020.X

一种基于监督沉浸式智能监督学习系统用可调节环境式墙体_赛文(北京)教育科技有限公司_202322143259.9

基于远程监督关系抽取的肝癌信息标注系统_杭州电子科技大学_202311787038.3

对话式大语言模型监督训练评价系统_南京大经中医药信息技术有限公司_202410121885.4

龙图腾网&IPTOP

【发明授权】面向无人机视频数据的弱监督显著性目标检测方法及系统_山东大学;中国电子科技集团公司第五十四研究所_202310989860.1

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务