【发明公布】基于注意力机制的多模态数据融合三维目标检测方法_西安电子科技大学_202210816612.2

导航：龙图腾网> 最新专利技术> 基于注意力机制的多模态数据融合三维目标检测方法_西安电子科技大学_202210816612.2

申请/专利权人：西安电子科技大学

申请日：2022-07-12

公开（公告）日：2022-09-20

公开（公告）号：CN115082674A

主分类号：G06V10/25

分类号：G06V10/25;G06N3/04;G06N3/08;G06V10/44;G06V10/774;G06V10/80;G06V10/82

优先权：

专利状态码：在审-实质审查的生效

法律状态：2022.10.11#实质审查的生效;2022.09.20#公开

摘要：本发明提出了一种基于注意力机制的多模态数据融合三维目标检测方法，实现步骤为：建立训练和测试样本集并对数据进行预处理；构建基于注意力机制的多模态数据融合三维目标检测网络；定义基于注意力机制的多模态数据融合三维目标检测网络的损失函数；对网络模型进行迭代训练；获取三维目标的检测结果。本发明利用特征学习网络，初步提取出一些候选区域，然后将候选区域中的点云数据、点的位置特征以及对应的图像信息进行了融合，充分利用了点云的规则化空间位置信息、点特征的精细化空间结构信息和图像的语义信息，减小了误差累积，进而提高了局部空间出现多个目标时的检测精度。

主权项：1.一种基于注意力机制的多模态数据融合三维目标检测方法，其特征在于，包括如下步骤：1获取训练样本集E1和测试样本集E2：从公开数据集中获取T幅维度为W×H的已标注RGB图像、每幅RGB图像所对应场景中维度为N×K的已标注点云数据和两者的标定数据，并对每个点云数据进行预处理，然后将预处理后的T1个点云数据及其对应的RGB图像组成训练样本集E1，将剩余的T2个预处理后的点云数据及其对应的RGB图像组成测试样本集E2，其中，T≥5000，T1＞T2，T1+T2＝T；2基于注意力机制的多模态数据融合三维目标检测网络：2a构建基于注意力机制的多模态数据融合三维目标检测网络D的结构：构建包括顺次连接的点云特征学习模块、多模态数据融合模块、基于Transformer的特征提取模块的三维目标检测网络D，其中，点云特征学习模块，包括顺次连接的三维稀疏卷积网络和区域回归网络；基于Transformer的特征提取模块，包括顺次连接的编码器和解码器；2b定义三维目标检测网络D的损失函数L：定义包含置信度损失Lconf和三维目标损失Lrpn的三维目标检测网络D的损失函数L：L＝Lconf+Lrpn；3对三维目标检测网络D进行迭代训练：3a初始化迭代次数为r，最大迭代次数为R，当前三维目标检测网络模型为Dr的权值参数为θr，并令r＝1，Dr＝D；3b从训练样本集E1中无放回的选取训练样本作为网络模型Dr的输入进行前向传播，实现步骤为：3b1将训练样本集E1作为三维目标检测网络Dr的输入，点云特征学习模块中的三维稀疏卷积网络对每个训练样本进行三维特征学习，点云特征学习模块中的区域回归网络对三维稀疏卷积网络输出的三维特征进行区域生成，得到共包含T1个点云数据的S个候选区域且每个候选区域至少包含一个点云数据，其中S≥1000，和分别表示每个候选区域的中心点坐标值，lrpn、wrpn和hrpn分别表示每个候选区域的长、宽和高，θrpn表示每个候选区域的旋转角度值；3b2多模态数据融合模块对每个候选区域RPN内所有点云数据中的点与其对应的RGB图像信息，进行多模态数据拼接，得到N个融合后的点云数据P＝{pi,Δpic,Δpij,fi},i＝1,2,…,n,其中pi表示候选区域中的i个点，Δpic表示候选区域中的每个点到候选区域中心点的距离、Δpij表示候选区域中的每个点到八个角点的距离，fi表示候选区域内的每个点经过标定矩阵的转换所找到的对应图像像素中的RGB三通道值；3b3基于Transformer的特征提取模块中编码器对T1个融合后的点云数据P进行特征提取，得到P的点云特征；解码器对P的点云特征进行通道加权解码，得到T1个点云数据中的预测三维目标框xpre＝{xpre,ypre,zpre,lpre,wpre,hpre}、以及三维目标框对应的角度值θpre、分类概率y、置信度概率c和方向概率dir；3c采用三维目标检测网络D的损失函数L，并根据置信度概率c计算置信度损失值Lconf，根据预测的三维目标值xpre、预测的角度值θpre、预测的分类概率y和预测的方向概率dir计算三维目标损失值Lrpn，然后采用随机梯度下降法，通过计算三维目标检测网络D的Lconf与Lrpn的和对权值参数θr的偏导数，对θr进行更新，得到本次迭代的三维目标检测网络模型Dr；3d判断r＝R是否成立，若是，得到训练好的基于注意力机制的多模态数据融合三维目标检测网络模型D*，否则令r＝r+1，Dr＝D，并执行步骤3b；4获取三维目标的检测结果：将测试样本集E2作为训练好的基于注意力机制的多模态数据融合三维目标检测网络模型D*的输入进行前向传播，得到每个测试样本的三维目标检测结果，包括每个测试样本中的预测三维目标框xpre、以及三维目标框对应的角度值θpre和目标类别。

全文数据：

权利要求：

百度查询：西安电子科技大学基于注意力机制的多模态数据融合三维目标检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种饮料包装盒的快速消毒装置_赵唐玉玥_202322121652.8

下一篇：一种药材脱皮机_安徽亳药福泰药业有限公司_202322752517.3

相关技术

一种饮料包装盒的快速消毒装置_赵唐玉玥_202322121652.8

一种药材脱皮机_安徽亳药福泰药业有限公司_202322752517.3

一种纸箱生产用贴标机_浙江华信科技发展有限公司_202322178698.3

一种可调节车挡_自贡市城市规划设计研究院有限责任公司_202322421392.6

涨紧机构及包含该机构的内模组件_江苏江扬建材机械有限公司_202322625490.1

一种网格化终端旋转装置_北京国旺盛源智能终端科技有限公司_202322619930.2

一种新型带束层鼓防错灯标装置_赛轮(沈阳)轮胎有限公司_202322401683.9

一种纺织纱线缠绕架_江苏金銮纺织科技股份有限公司_202322120043.0

再生废液处理系统_山东荣信集团有限公司_202322260404.1

一种精密小磨床用物料固定装置_昆山法尔霆机电科技有限公司_202322612017.X

一种园林绿化便携铲_马丽丽_202322375183.2

一种能自动清洗的鸡养殖笼_海南省农业科学院三亚研究院(海南省实验动物研究中心)_202420555494.9

数据相关技术

多接入数据连接上的数据分组引导_联想(新加坡)私人有限公司_201880092121.X

管理IOT网络中的数据和数据使用_勤达睿公司_202080032483.7

数据存储方法及装置_恒生电子股份有限公司_202311433168.7

数据标注方法及装置_深圳市优必选科技股份有限公司_202010604308.2

数据存储方法、数据读取方法、电子设备和存储介质_北京壁仞科技开发有限公司_202410218124.0

产品全生命周期评价的数据收集方法及数据收集系统_北京中创绿发科技有限责任公司_202110549695.9

融合试题数据和解答数据的多知识点标注方法和系统_华中师范大学_202011282980.0

一种数据关系捕获及大数据关系树构建方法_中通服创立信息科技有限责任公司_202111142241.6

高并发性数据迁移方法及数据安全存储装置_北京中领启天信息科技有限公司_202311552020.5

一种基于大数据的农业数据分析管理系统及方法_上海华维可控农业科技集团股份有限公司_202310584420.8

融合相关技术

一种塑料件高温融合设备_河源艺昇精密科技有限公司_202322688573.5

抗体融合蛋白及其制备和应用_北京诺诚健华医药科技有限公司_202211293426.1

一种含雾图像融合模型和方法_佛山科学技术学院_202410076413.1

一种多特征融合的行人跟踪方法_杭州锐颖科技有限公司_202311346658.3

一种基于多路口多传感器的航迹融合方法及系统_超级视线科技有限公司_202111569137.5

一种致癌性融合激酶抑制剂的晶型及其应用_南京再明医药有限公司_202080058668.5

轨道几何参数与车辆动力学融合影响分析方法及系统_南京地铁运营咨询科技发展有限公司_202410172454.0

一种基于运动约束的融合定位方法及装置_北京斯年智驾科技有限公司_202211198340.0

一种全领域产品节点体系动态融合与生长方法_杭州量知数据科技有限公司_202111166990.2

一种基于Transformer的特征融合的调制识别方法_中国人民解放军军事科学院系统工程研究院_202210933070.7

态相关技术

用于溶解电站水汽中痕量胶态铁的混合催化剂_浙江西热利华智能传感技术有限公司_202210361398.6

一种F-T合成浆态床反应器的移热装置_内蒙古伊泰煤基新材料研究院有限公司_201810012901.0

一种基于薄膜铌酸锂的启钥式单孤子态光学微梳产生方法_浙江大学_202111216818.3

分子态内燃机供油装置_单县亿利新材料有限公司_202322128908.8

一种热态清渣装置_常熟市龙腾特种钢有限公司_202322135119.7

一种恒态过程吸附装置_匠成科学仪器(上海)有限公司_202321838237.8

使用自动CCZ量子态的表面编码计算_谷歌有限责任公司_202080026132.5

一种流态固化土运输半挂车_芜湖中集瑞江汽车有限公司_202410186333.1

一种基于拓扑谷边界态的高效电磁波导_电子科技大学_202310261802.7

一种表征高维量子纯态的方法_南京大学_202311381501.4

龙图腾网&IPTOP

【发明公布】基于注意力机制的多模态数据融合三维目标检测方法_西安电子科技大学_202210816612.2

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务