买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于数据增强的深度哈希行人重识别方法_中山大学_201910927206.1 

申请/专利权人:中山大学

申请日:2019-09-27

公开(公告)日:2024-04-09

公开(公告)号:CN110852152B

主分类号:G06V40/10

分类号:G06V40/10;G06V20/52;G06V10/762;G06V10/82;G06N3/0464;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.04.09#授权;2020.03.24#实质审查的生效;2020.02.28#公开

摘要:本发明提供一种基于数据增强的深度哈希行人重识别方法,首先利用K‑means聚类方法对原始数据集图片进行聚类,然后分别将得到的n组聚类图片通过深度卷积生成对抗网络生成n组无标签行人图片进行数据增强,这样每组生成的图片特征上有更多地相似性。然后将原始数据集图片和生成图片一起放入深度哈希卷积神经网络中训练,用三元组损失分别拉近原始图片和生成图片中相同类行人的距离和拉开不同类行人的距离,对于生成图片,本发明还提出用均值标签平滑损失,让增强的这部分数据达到比较好的正则化效果,最后测试时将提取到的实数值特征映射为01向量,通过计算两个01向量之间的汉明距离判定行人图片的命中率,提高检索速率。

主权项:1.一种基于数据增强的深度哈希行人重识别方法,其特征在于,包括以下步骤:S1:对原始数据集图片进行K-means聚类,建立深度卷积生成对抗网络分别对n组聚类图片生成n组无标签行人图片;具体过程是:S11:对k类原始数据集图片,放入在ImageNet上预训练好的Resnet50网络中,先随机选取n个中心点即n张图片,遍历所有提取到的图片特征,通过计算其他图片特征到中心点特征的欧式距离将每个图片特征划分到最近的中心点中,计算每个聚类的平均值,并作为新的中心点,一共迭代40-60次将原始数据集图片聚类为n个类;其中,Imagenet是一个包含2万多个类别,有1400多万幅张图片的数据集,是目前深度学习图像领域算法性能检验的“标准”数据集,用于预训练Resnet50网络,直接用Imagenet数据集预训练好的Resnet50网络作为基网络,Resnet50是深度卷积神经网络,哈希指的是在实验最后将实数值特征映射到了哈希维度的特征,即01特征;S12:建立一个生成器网络G和一个判别器网络D;S13:在G、D中,除G网络的输出层和D网络的输入层,其他层均使用批量规范化帮助模型收敛,损失函数为VD,G=Ex~Pdatax[lnDx]+Ez~Pzz[ln1-DGz],其中Ex~Pdatax表示在训练数据x中取得真实样本,Ez~Pzz表示从已知的噪声分布中提取的样本,x表示真实图片,z表示输入G网络的噪声,Gz表示G网络生成的图片,Dx表示D网络判断真实图片为真实的概率,DGz表示D网络判断G生成的图片为真实的概率;S14:使用梯度下降法,在每个epoch的每batchsize张图片训练中,对D网络参数更新一次后,固定D网络,对G网络参数更新两次,以避免D网络的loss为0,即对D和G交替做优化训练,在30个epoch之后停止训练;S15:该深度卷积生成对抗网络先对整个原始数据集进行训练,在整个数据集训练得到的模型基础上再分别用每组聚类得到的图片进行训练,训练得到n个模型,再用生成器网络G对应生成n组图片,得到n组用于数据增强的图片;S2:建立深度哈希卷积神经网络,建立三元组损失和均值标签平滑损失函数;S3:将原始图片和生成图片一起送入网络中训练,并在测试集上进行测试。

全文数据:

权利要求:

百度查询: 中山大学 一种基于数据增强的深度哈希行人重识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。