首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】YOLO和分块-融合策略结合的稠密人脸检测方法_深圳市富浩鹏电子有限公司_202011566195.8 

申请/专利权人:深圳市富浩鹏电子有限公司

申请日:2020-12-25

公开(公告)日:2024-05-17

公开(公告)号:CN112541483B

主分类号:G06V40/16

分类号:G06V40/16;G06V10/25;G06V10/774;G06V10/80;G06V10/762;G06V10/82;G06N3/0464;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.05.17#授权;2024.05.07#专利申请权的转移;2024.02.20#专利申请权的转移;2021.04.09#实质审查的生效;2021.03.23#公开

摘要:YOLO和分块‑融合策略结合的稠密人脸检测方法,包括以下步骤:对人脸训练数据集进行数据增广,扩充密集场景下的人脸样本;构建YOLOv3和分块‑融合策略相结合的YOLOv3网络模型,在检测阶段,将原图进行分块,并将分块得到的子图和原图一同输入到YOLOv3网络模型中分别进行检测;对NMS算法进行改进,解决大尺度人脸融合问题的同时提高小人脸检测的精度。本发明通过多次NMS在解决人脸融合问题的同时,利用不同分块重叠率下的检测提高小人脸的召回提高最终检测精度。

主权项:1.一种YOLO和分块-融合策略结合的稠密人脸检测方法,其特征在于包括以下步骤:步骤1:对人脸训练数据集进行数据增广,扩充密集场景下的人脸样本;步骤2:构建YOLOv3和分块-融合策略相结合的YOLOv3网络模型,在检测阶段,将原图进行分块,并将分块得到的子图和原图一同输入到YOLOv3网络模型中分别进行检测;YOLOv3网络模型分为模型训练和目标检测两个阶段,具体如下:模型训练:在模型训练阶段使用YOLOv3网络模型进行训练,训练时使用步骤1中数据增广后的人脸数据集,其中;YOLOv3网络训练损失函数如公式3.1~3.6所示: YOLOv3损失函数包含边界框中心点坐标损失Losscenter,如公式3.2;边界框宽高损失Losswh,如公式3.3;目标置信度损失Lossscore,如公式3.4、公式3.5;目标类别损失Lossclass,如公式3.6;式中,各变量的含义如下:其中SxS为网络划分图片的网格数,B为每个网格预测的边界框数目,为网格i中第j个边界框的预测;其中各公式中变量的含义分别为:公式3.2λcoord为动态参数,为中心点坐标的真值,Cxyi为中心点坐标预测值;公式3.3中,和表示该目标宽度和高度的真实值,wi和hi分别表示该目标高度和宽度的预测值;公式3.4和公式3.5分别为包含目标时的置信度损失和不含目标时的置信度损失,其中λnoobj为不含目标时网络的误差系数,和Ci分别代表检测目标的置信度真值和置信度预测值;式3.6中和为检测目标概率的真值和目标概率的预测值;目标检测:在目标检测阶段,利用模型训练阶段得到的权重文件进行检测,检测时首先将输入图片执行带边缘重叠的分块,得到分块与原图共5张图片,之后将分块图片与输入图片一同输入到YOLOv3网络中,在YOLOv3网络中分别对5张图片进行预测;其中,YOLOv3网络对每张图片进行预测的具体过程如下:首先输入图片经过YOLOv3网络的特征提取网络darknet53,darknet53网络包含53个卷积层,通过darknet53卷积之后,得到输入图片132尺寸的特征图;以416*416*3尺寸的输入图片为例,通过darknet53网络卷积后,将得到13*13*255尺寸的特征图,在13*13*255特征图的基础上通过上采样以及与浅层特征融合又分别得到26*26*255、52*52*25尺寸的特征图,这3个尺度下的特征图分别用于对大尺度、中尺度、小尺度目标进行预测;YOLOv3通过在这3个尺度下的特征图上分别预测得到大、中、小3个尺度下的目标,其中YOLOv3网络模型在特征图上的目标检测原理为,YOLOv3网络对特征图上的每个像素对应的网格,都会给出3个anchor进行预测,找到大小最合适的anchor,其中anchor由训练前通过对数据集进行聚类得到,之后网络输出的4个偏移量,即可得到预测框;YOLOv3对每个预测边界框,给出4个值,tx、ty、tw、th,这4个值和预测边界框bx、by、bw、bh的映射关系如公式4.1~4.4所示;bx=δtx+cx4.1by=δty+cy4.2 其中,tx、ty分别表示中心点偏移的量,tw、th则表示为预测边界框的相对anchor的缩放量,其中pw、ph分别表示anchor的宽和高;δtx、δty用于表示某个目标的中心点相对负责检测这个目标的网格的偏移量,其中Cx,Cy表示中心点坐标所在的网格;当YOLOv3网络完成了原图加分块图片一共5张图片的预测之后,将其中4张分块图片的预测结果映射到原始图片上,最终使用NMS算法去除冗余预测结果之后得到最终的检测结果;步骤3:对NMS算法进行改进,解决大尺度人脸融合问题的同时提高小人脸检测的精度。

全文数据:

权利要求:

百度查询: 深圳市富浩鹏电子有限公司 YOLO和分块-融合策略结合的稠密人脸检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。