【发明授权】一种基于特征融合的目标检测方法_中国人民解放军国防科技大学_202010751441.0

导航：龙图腾网> 最新专利技术> 一种基于特征融合的目标检测方法_中国人民解放军国防科技大学_202010751441.0

申请/专利权人：中国人民解放军国防科技大学

申请日：2020-07-30

公开（公告）日：2021-04-27

公开（公告）号：CN111860683B

主分类号：G06K9/62(20060101)

分类号：G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101)

优先权：

专利状态码：有效-授权

法律状态：2021.04.27#授权;2020.11.17#实质审查的生效;2020.10.30#公开

摘要：本发明公开了一种基于特征融合的目标检测方法，目的是解决目前检测方法小尺寸目标检测精度低的缺点。技术方案是构建由特征提取模块、间接特征融合模块、直接特征融合模块、2个变形模块、检测模块构成的目标检测系统；采用训练后的目标检测系统对图像进行特征提取、间接特征融合、直接特征融合，检测识别目标的位置和类别。其中间接特征融合模块将高层和低层特征图拼接成一个特征图，然后对拼接好的特征图计算不同像素间的依赖关系，将依赖关系在不同特征图间共享，实现了高层特征和低层特征之间的信息传递；直接特征融合模块将高层特征图信息逐层向低层特征图传递，使小尺寸目标的低层特征中的语义和位置信息增强，提升了小目标检测精度。

主权项：1.一种基于特征融合的目标检测方法，其特征在于包括以下步骤：第一步：构建目标检测系统，目标检测系统由特征提取模块、间接特征融合模块、直接特征融合模块、第一变形模块、第二变形模块、检测模块组成；特征提取模块为一个卷积神经网络，与第一变形模块相连；特征提取模块接收图像I，对图像I进行特征提取，得到多尺度特征图集合FI，将FI发送给第一变形模块；第一变形模块是对FI进行插值和下采样操作的模块，与特征提取模块、间接特征融合模块相连；对FI中的特征图进行下采样或插值操作，统一特征图的尺寸，得到A1I，将A1I发送给间接特征融合模块；间接特征融合模块与第一变形模块、直接特征融合模块相连，间接特征融合模块由第一通道变换模块、特征拼接模块、6个注意力模块组成；间接特征融合模块从第一变形模块接收A1I，将A1I中高层特征图的像素间的依赖关系和低层特征图像素间的依赖关系进行融合，运用融合的像素间的依赖关系，通过加权计算得到经过间接特征融合的特征图h1,h2,h3,h4,h5,h6，将h1,h2,h3,h4,h5,h6发送给直接特征融合模块；第一通道变换模块包含6个1×1卷积神经网络，与第一变形模块、特征拼接模块、直接特征融合模块相连，从第一变形模块接收A1I，分别对A1I中的每个特征图进行1×1卷积神经操作，将A1I中6个特征图的通道数统一为256，得到A2I＝{a21，a22，a23，a24，a25，a26}，将A2I输出给特征拼接模块、直接特征融合模块；A2I中的特征图尺寸都为256×10×10；特征拼接模块与第一通道变换模块、6个注意力模块相连，从第一通道变换模块接收A2I，对A2I中的6个特征图进行特征拼接操作，将A2I中的6个特征图拼接成第一特征图I1,将I1发送给6个注意力模块，I1的尺寸为1536×10×10；第i个注意力模块与特征拼接模块、直接特征融合模块相连，对I1提取像素间的依赖关系，根据依赖关系加权计算得到经过间接特征融合的特征图hi，将hi发送给直接特征融合模块；第i个注意力模块由查询模块、键模块、值模块、依赖关系模块、归一化模块、像素赋权模块、特征相加模块组成；1≤i≤6；查询模块与特征拼接模块、依赖关系模块相连，从特征拼接模块接收I1，对I1进行1×1卷积操作，得到第二特征图I2”,I2”的尺寸为192×10×10；对I2”进行维度合并操作，将第二维度和第三维度合并，得到第二合并后特征图I2’，I2’的尺寸为192×100；对I2’进行转置操作，得到第二转置后特征图I2，I2的尺寸为100×192，将I2发送给依赖关系模块；键模块与特征拼接模块、依赖关系模块相连，从特征拼接模块接收I1，对I1进行1×1卷积操作，得到第三特征图I3’，I3’的尺寸为192×10×10；对I3’进行维度合并操作，将第二维度和第三维度合并，得到第三合并后特征图I3，I3的尺寸为192×100，将I3发送给依赖关系模块；依赖关系模块与查询模块、键模块、归一化模块相连，从查询模块接收I2、从键模块接收I3，对I2、I3进行向量乘法操作，得到I2、I3不同像素间的依赖关系图I4，I4的尺寸为100×100，将I4发送给归一化模块；归一化模块与依赖关系模块和像素赋权模块相连，从依赖关系模块接收I4，对I4的每一行进行归一化操作，得到归一化后的像素间依赖关系图I5，I5的尺寸为100×100，将I5发送给像素赋权模块；值模块与特征拼接模块、像素赋权模块相连，从特征拼接模块接收I1，对I1进行1×1卷积操作，得到第六特征图I6”，I6”的尺寸为1536×10×10，对I6”进行维度合并操作，将第二维度和第三维度合并，得到第六合并后特征图I6’，I6’的尺寸为1536×100；对I6’进行转置操作，得到第六转置后特征图I6，I6的尺寸为100×1536，将I6发送给像素赋权模块；像素赋权模块与值模块、归一化模块、特征相加模块相连，从值模块接收I6、从归一化模块接收I5，对I5、I6执行矩阵乘法操作以对像素赋权，得到像素赋权后特征图I7”,I7”的尺寸为100×1536；对I7”进行转置操作，得到I7’，I7’的尺寸为1536×100；对I7’的第二维度进行维度拆分操作，得到维度拆分后的特征图I7，I7的尺寸为1536×10×10，将I7发送给特征相加模块；特征相加模块与特征拼接模块、像素赋权模块、直接特征融合模块相连，从特征拼接模块接收I1、从像素赋权模块接收I7，对I1、I7进行像素级别加法操作以利于梯度回传和优化，得到经过特征相加后的特征图hi，hi的尺寸为1536×10×10，将hi发送给直接特征融合模块；直接特征融合模块与间接特征融合模块、第二变形模块相连，从间接特征融合模块中的第一通道变换模块接收A2I、从间接特征融合模块中的6个注意力模块接收h1,h2,h3,h4,h5,h6,对h1,h2,h3,h4,h5,h6变换通道数后，进行直接特征融合，得到经过直接特征融合后的特征图集合JI，将JI发送给第二变形模块；直接特征融合模块由第二通道变换模块、侧向连接模块组成；第二通道变换模块包含6个1×1卷积神经网络，与间接特征融合模块、侧向连接模块相连，从间接特征融合模块的6个注意力模块中的特征相加模块接收h1,h2,h3,h4,h5,h6，分别对h1,h2,h3,h4,h5,h6进行1×1卷积神经操作，将h1,h2,h3,h4,h5,h6的通道数变换为256，得到特征图集合A8I，将A8I发送给侧向连接模块；侧向连接模块是进行像素级别加法操作的模块，与第二通道变换模块、第二变形模块、间接特征融合模块的第一通道变换模块相连，从第二通道变换模块接收A8I、从第一通道变换模块接收A2I，对A8I和A2I进行侧向连接操作即直接特征融合，得到JI＝{j1,j2,j3,j4,j5,j6}，j1,j2,j3,j4,j5,j6尺寸均为256×10×10，将JI发送给第二变形模块；第二变形模块与直接特征融合模块、检测模块相连；从直接特征融合模块接收JI，对JI中的特征图进行插值或下采样操作，得到DI，DI中包含d1,d2,d3,d4,d5,d6这6个特征图；将DI发送给检测模块；检测模块与第二变形模块相连，由分类网络、定位网络和非极大值抑制模块组成；定位网络与第二变形模块、非极大值抑制模块相连，定位网络从第二变形模块接收DI，对DI中的每一个特征图进行卷积操作，向非极大值抑制模块输出预测目标的坐标值即预测框坐标值；分类网络与第二变形模块、非极大值抑制模块相连，分类网络从第二变形模块接收DI，对DI中的每一个特征图进行卷积操作，向非极大值抑制模块输出预测目标的类别即目标属于某类的概率值；非极大值抑制模块与分类网络和定位网络相连，采用非极大值抑制方法将重复预测的目标的坐标值和类别去除，获得目标最佳的预测框坐标值和预测类别；第二步：准备目标检测系统的训练数据集，方法为：选择PASCALVOC2007、PASCALVOC2012的训练集、验证集中的所有图片作为训练数据集，训练数据集图片中共包含E种目标类别，E为正整数；对于训练数据集中的第d张图片，1≤d≤16551，PASCALVOC2007、PASCALVOC2012中给出了第d张图片所包含的目标的类别以及位置向量gd＝{gd1,gd2,...,gdz,...,gdZ}，dZ表示第d张图片中包含的目标数量，其中为包含四个值的一维向量，为第d张图片的第z个目标区域矩形框的左上角的坐标值，为第d张图片的第z个目标区域矩形框的右下角的坐标值，四个坐标值均为标量，中的四个值表示出第d张图片的第z个目标区域矩形的目标区域；第三步，采用第二步构建的训练数据集训练目标检测系统中的各个模块，方法是：3.1对特征提取模块的网络参数Φ1、间接特征融合模块的网络参数Φ2、直接特征融合模块的网络参数Φ3、检测模块的网络参数Φ4进行初始化；3.2将训练数据集中的图片依次输入到目标检测系统中，对目标检测系统进行训练，拟合得到目标检测系统的网络参数；第四步：利用目标检测系统进行目标检测，方法是：4.1从相机或文件获得需要检测的图像I；4.2将训练得到的目标检测系统的网络参数载入到目标检测系统中；4.3特征提取模块对被检测图像I进行特征提取，得到多尺度特征图集合FI，将FI发送给第一变形模块；FI中包含6张图，尺寸分别为512×38×38，1024×19×19，512×10×10，256×5×5，256×3×3，256×1×1；尺寸为512×38×38，1024×19×19，512×10×10的为低层特征图；尺寸为256×5×5，256×3×3，256×1×1的为高层特征图；4.4第一变形模块从特征提取模块接收FI，对FI中的特征图进行下采样或插值操作，统一特征图的尺寸，得到A1I，将A1I发送给间接特征融合模块；A1I包含的特征图尺寸为512×10×10，1024×10×10，512×10×10，256×10×10，256×10×10，256×10×10；4.5间接特征融合模块从第一变形模块接收A1I，将A1I中高层特征图即尺寸为256×10×10，256×10×10，256×10×10的特征图像素间的依赖关系和低层特征图即尺寸为512×10×10，1024×10×10，512×10×10的特征图像素间的依赖关系进行融合，运用融合的像素间的依赖关系，通过加权计算得到经过间接特征融合的特征图h1,h2,h3,h4,h5,h6，将h1,h2,h3,h4,h5,h6发送给直接特征融合模块；具体方法为：4.5.1第一通道变换模块从第一变形模块接收A1I，对A1I中的特征图分别采用1×1卷积神经网络进行通道变换操作，得到A2I＝{a21，a22，a23，a24，a25，a26}，a21，a22，a23，a24，a25，a26均为尺寸为256×10×10的特征图，将A2I发送给特征拼接模块、直接特征融合模块；4.5.2特征拼接模块从第一通道变换模块接收A2I，对A2I进行特征拼接操作，将6个特征图拼接成第一特征图I1，I1的尺寸为1536×10×10；将I1发送给6个注意力模块；4.5.36个注意力模块同时从特征拼接模块接收I1，并行地运用矩阵乘法操作对I1提取不同像素间的依赖关系；将所有特征图的信息都考虑在内，实现不同特征图间的间接信息融合；运用融合后的像素间的依赖关系，通过像素赋权模块和特征相加模块得到特征图h1,h2,h3,h4,h5,h6，将h1,h2,h3,h4,h5,h6发送给直接特征融合模块；4.6直接特征融合模块从间接特征融合模块中的第一通道变换模块接收A2I、从间接特征融合模块中的6个注意力模块接收h1,h2,h3,h4,h5,h6，将h1,h2,h3,h4,h5,h6统一通道数后，进行直接特征融合，得到经过直接特征融合后的特征集合JI＝{j1，j2，j3，j4，j5，j6}，j1，j2，j3，j4，j5，j6的尺寸为256×10×10，将JI发送给第二变形模块，具体方法为：4.6.1第二通道变换模块从间接特征融合模块的6个注意力模块接收h1,h2,h3,h4,h5,h6，分别对h1,h2,h3,h4,h5,h6进行1×1卷积神经操作，将h1,h2,h3,h4,h5,h6的通道数变换为256，以减小后续计算量，得到特征图集合A8I，将A8I发送给侧向连接模块；A8I中的特征图尺寸都为256×10×10；4.6.2侧向连接模块从第二通道变换模块接收A8I、从第一通道变换模块接收A2I，对A8I和A2I进行侧向连接操作，即从A8I最高层特征图h6开始，对h6特征图与h5特征图进行相加并除2，得到h65，再将h65与h4进行相加并除2，得到h54，以此类推，直到获得h21，将h6，h65，h54，h43，h32，h21放入到集合JI’中，将JI’与A2I执行像素加法操作，得到JI＝{j1,j2,j3,j4,j5,j6}，j1,j2,j3,j4,j5,j6尺寸均为256×10×10，将JI发送给第二变形模块；4.7第二变形模块从直接特征融合模块接收JI，对j1，j2，j3分别进行下采样操作，得到d1，d2，d3，尺寸分别为256×1×1，256×3×3，256×5×5；对j5，j6分别进行插值操作，得到d5，d6，尺寸分别为256×19×19，256×38×38；将d1，d2，d3，j4，d5，d6放到集合DI中，将DI发送给检测模块；4.8检测模块从直接特征融合模块接收DI，利用分类网络获得预测目标的概率集合CI＝{c1,c2,c3,…,ce,…,cE}，E为训练数据集图片中共包含的目标类别数；ce＝{ce1,ce2,ce3,…,cep,…,ceP}，表示预测目标属于第e类的概率集合，cep表示属于第e类的预测目标中第ep个目标属于第e类的概率；利用定位网络获得预测目标的坐标值集合LI＝{l1,l2,l3,…,le,…,lE}，le＝{le1,le2,le3,…,lep,…,leP},表示预测目标属于第e个类别的坐标向量集合，是坐标系中预测目标框左上角横坐标，是预测目标框左上角纵坐标，是预测目标框右下角横坐标，是预测目标框右下角纵坐标；le和ce中相同序号的元素对应相同的预测目标，然后利用非极大值抑制模块对LI和CI进行筛选，获得最终的目标检测结果，具体方法为：4.8.1分类网络接收DI，生成预测目标的类别概率CI＝{c1,c2,c3,…,ce,…,cE}；4.8.2定位网络接收DI，生成预测目标的坐标值集合LI＝{l1,l2,l3,…,le,…,lE}；4.8.3利用非极大值抑制模块对LI和CI进行筛选：4.8.3.1初始化e＝1；4.8.3.2将ce中的概率值按照降序排列；4.8.3.3将le中坐标值按照ce的排序结果重新排列，保证属于同一个预测目标的类别概率和坐标值的元素序号相同；4.8.3.4初始化p＝1；4.8.3.5计算lep+1预测目标框与lep预测目标框的交并比；若交并比小于阈值t，则删除lep+1目标框对应的预测目标，转4.8.3.6；若交并比大于t，则保留lep+1对应的预测目标，转4.8.3.6；4.8.3.6若p＜P，则令p＝p+1，转4.8.3.5；若p＝P，转4.8.3.7；4.8.3.7若e＜E，则令e＝e+1，转4.8.3.2；若e＝E，转4.8.3.8；4.8.3.8收集CI中被保留的类别概率，收集LI中被保留的坐标值，作为目标检测系统最终的预测结果。

全文数据：

权利要求：

百度查询：中国人民解放军国防科技大学一种基于特征融合的目标检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：全流程数字化低温端面密封试验数据测量系统和方法_北京航天动力研究所_202311808623.7

下一篇：一种智能密集型母线槽插接箱_纳图(镇江)母线有限公司_202311829316.7

相关技术

全流程数字化低温端面密封试验数据测量系统和方法_北京航天动力研究所_202311808623.7

一种智能密集型母线槽插接箱_纳图(镇江)母线有限公司_202311829316.7

一种用于航天器热控系统的自动化压胶装置_吉天星舟(长春)航天科技有限公司_202311569593.9

一种轴配流数字化摆线液压马达_山东瑞诺液压机械有限公司_202311771655.4

一种微服务调度方法、装置、计算机设备及存储介质_中国科学院深圳先进技术研究院_202311739306.4

一种使用虚拟私有网络的云平台安全接入方法_天翼云科技有限公司_202311710330.5

一种用于测量斜视合并屈光不正患者的三棱镜装置及方法_深圳爱尔眼科医院_202311604419.3

一种智慧考场监控系统及方法_中核国电漳州能源有限公司_202311791602.9

一种基于车载的无人机电力巡检管控系统和方法_国电投河南工程运维有限公司_202311765863.3

一种六轴双交点的剪刀门铰链_广东佐尔汽车部件制造有限公司_202311646298.9

一种基于表示学习的红外小目标检测方法及装置_杭州越达图谱科技有限公司_202310615484.X

一种用于制作千斤顶圆头平键冲压机构_宁国市龙飞耐磨材料有限公司_202311686630.4

检测相关技术

检测装置和检测方法_京东方科技集团股份有限公司_201911201283.5

检测装置以及检测方法_湖北科峰智能传动股份有限公司_202311015750.1

检测装置及用于电芯检测的检测方法_同方威视技术股份有限公司_202310695780.5

电流检测装置、电流检测程序和电流检测方法_株式会社电装_202280054741.0

光检测设备和光检测装备_索尼半导体解决方案公司_202280056743.3

扩增检测装置及扩增检测方法_圣湘生物科技股份有限公司_202110907448.1

气体检测系统及其检测方法_杭州谱育科技发展有限公司_202110657835.4

异常检测装置及异常检测方法_日本制纸株式会社_201980055357.0

检测设备_歌尔科技有限公司_202111018147.X

检测设备_中国特种设备检测研究院_202322552490.3

特征相关技术

从数据集提取特征_ASML荷兰有限公司_202080018832.X

深层特征和浅层LBP特征融合的乳腺肿瘤超声图像处理装置_燕山大学_202111045957.4

基于特征权重感知与二阶特征选择的商品推荐方法及系统_重庆大学_202410042669.0

一种基于层次结构特征和序列特征的代码补全方法_广东工业大学_202311340389.X

基于特征变换的遥感图像特征提取模型预训练方法及装置_耕宇牧星(北京)空间科技有限公司_202410157863.3

人脸特征点检测方法及装置_浙江宇视科技有限公司_201810909381.3

照片图像转小特征压缩传输方法_浙江久婵物联科技有限公司_202311848597.0

具有定位特征的墨粉盒_利盟国际有限公司_202080040815.6

病毒特征的提取方法、系统、存储介质和终端_深信服科技股份有限公司_202010674327.2

特征投影方法、装置、设备、存储介质及汽车_重庆长安汽车股份有限公司_202410004491.0

方法相关技术

蚀刻方法_东京毅力科创株式会社_201910054586.2

加密方法_沃尔夫冈·弗拉托_202280053620.4

工艺方法_北京北方华创微电子装备有限公司_202211212212.7

清洗方法_富泰华工业(深圳)有限公司_202410069555.5

密钥生成方法、签名的生成方法、签名的验证方法和装置_中国建设银行股份有限公司_202410002859.X

测量参数集的确定方法及装置、验证方法及故障诊断方法_中国核电工程有限公司_202110244931.6

样本流场数据生成方法、模型训练方法、流场重建方法_北京百度网讯科技有限公司_202311755670.X

基于深度学习方法和传统方法结合的火灾检测方法_东北林业大学_202410009061.8

身份识别模型训练方法、测试方法、识别方法及装置_北京中科虹霸科技有限公司_202010883587.0

会话建立方法、中继设备的选择方法和注册方法及设备_华为技术有限公司_202410063202.4

龙图腾网&IPTOP

【发明授权】一种基于特征融合的目标检测方法_中国人民解放军国防科技大学_202010751441.0

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务