买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于深度可分离卷积残差块和改进NMS的多尺度目标检测方法_湖北工业大学_202010512200.0 

申请/专利权人:湖北工业大学

申请日:2020-06-08

公开(公告)日:2023-08-22

公开(公告)号:CN111783794B

主分类号:G06V10/40

分类号:G06V10/40;G06V10/52;G06V10/774;G06V10/82;G06N3/0464;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2023.08.22#授权;2020.11.03#实质审查的生效;2020.10.16#公开

摘要:本发明公开了一种基于深度可分离卷积残差块和改进NMS的多尺度目标检测方法,结合深度可分离卷积神经网络特征提取的能力、SSDSingleShotDetection模型多尺度检测算法对不同大小目标的适应能力以及改进NMS改进非极大值抑制NonMaximumSuppression,NMS对遮挡物体的高检测性能来解决现有检测方法速度过慢、精度不高的问题。

主权项:1.一种基于深度可分离卷积残差块和改进NMS的多尺度目标检测方法,其特征在于,包括如下步骤:步骤1,获取若干图片,作为原始图像数据,对原始图像数据中的检测目标进行边框和类别的标注;步骤2,对于步骤1中的原始图像数据进行数据增强操作,将新生成的图片与步骤1中采集到的图片一起作为训练图片;步骤3,利用特征提取网络提取训练图片的特征图,将步骤2中的训练图片分批进行特征提取;其中特征提取网络包含依次连接的卷积层、深度可分离残差块1、深度可分离残差块2、深度可分离残差块3、深度可分离残差块4、深度可分离残差块5、深度可分离残差块6,所述深度可分离残差块1—6均由深度卷积、点卷积和残差网络组成,具体处理过程为:输入特征图,依次进行1×1点卷积、3×3深度卷积、1×1点卷积得到第一特征图,然后将输入特征图与第一特征图进行跳跃连接获得最终的输出特征图;步骤4,将步骤3得到的特征图送入多尺度检测网络中,在不同大小的特征图上生成不同尺度、不同宽高比的预测框来拟合图片中的待测目标;步骤5,对步骤4生成的预测框,采用非极大值抑制NMS进行多余预测框剔除,得到待测目标的唯一标识框;步骤6,重复步骤3~5对由特征提取网络、多尺度检测网络以及NMS组成的整个模型进行迭代训练;步骤7,当所有的训练图片均已通过整个模型,输出此时的检测准确率;步骤8,对比每次输出的准确率,如果准确率持续上升,则继续训练;如果准确率保持不变或有下降趋势,则停止训练,并保存最终输出的整个模型;步骤2中采用水平镜像、随机裁剪、随机亮度和对比度增强的数据增强操作来产生更多训练图片;其中水平镜像表示将图片的左右部分以图像垂直中轴线为中心进行镜像对换;随机裁剪表示将原图像裁剪成多张包含待检测目标的不同大小图片;随机亮度是调节图像亮度以削弱光照不均匀所带来的影响,图片亮度Li通过颜色空间R、G、B的均值来表示,Li越大代表亮度越高,其变换过程的表达式如下: 其中,bri代表变换后的亮度,k为亮度变化系数,通过设置不同的k值完成对Li的调节,k小于1表示亮度减弱,k大于1表示亮度增强,因此将各颜色通道的值同比例增减即可改变图像的亮度;步骤4中先对NMS进行改进,然后利用改进的NMS进行多余预测框剔除,具体实现方式如下:首先将得到的预测框的置信度从高到低排序,令B为步骤4生成的预测框集合,S为每个预测框对应的置信度分数,选出当前最高置信度和其对应的预测框,然后遍历其余的预测框,将遍历到的预测框置信度使用以下公式进行重置,重置公式如下: 其中,si'为重置之后的预测框置信度,预测框置信度得分si,M为当前得分最高的预测框,bi为遍历到的预测框,D为所有M的集合,IoUM,bi的计算过程为: 其中,AM代表得分最高的预测框的面积,Abi代表遍历到的预测框的面积,∩代表取交集操作,∪代表取并集操作;当重置后的得分si大于阈值Nt时,将此时遍历到的预测框从集合B中删除,同时将其置信度分数也从S集合中删除,直到所有的预测框均被扫描过时结束。

全文数据:

权利要求:

百度查询: 湖北工业大学 一种基于深度可分离卷积残差块和改进NMS的多尺度目标检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术