买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于特征对比损失的年龄估计方法_电子科技大学_202210731136.4 

申请/专利权人:电子科技大学

申请日:2022-06-24

公开(公告)日:2024-04-23

公开(公告)号:CN115063862B

主分类号:G06V40/16

分类号:G06V40/16;G06V10/82;G06N3/0464;G06N3/048;G06N3/084

优先权:

专利状态码:有效-授权

法律状态:2024.04.23#授权;2022.10.04#实质审查的生效;2022.09.16#公开

摘要:该发明公开了一种基于特征对比损失的年龄估计方法,属于计算机视觉领域。该方法首先选择注意力机制作为特征提取网络的基本结构,并使用了基于注意力机制的偏移窗口变换网络作为特征提取网络的主要结构,用于从面部图像中提取鲁棒的年龄特征;然后设计了用于计算特征之间相对距离的距离估计网络,通过基于特征的对比损失引导特征空间保留标签空间的序约束关系,使得尾部特征能够利用头部特征的信息,进而提升尾部数据的预测准确度,从而解决年龄估计中的长尾分布问题。

主权项:1.一种基于特征对比损失的年龄估计方法,该方法包括:步骤1:对数据集进行预处理;首先获取用于年龄估计的图像数据集,然后把图像进行人脸对齐,并且归一化到[-1,1];然后随机分为训练集和测试集;训练集中的图像进行随机裁切,并且进行随机的镜像翻转,测试集的图像仅进行中心裁切,同样裁切的大小与训练集中图像裁切大小一致;步骤2:构建特征提取网络;1构建区域嵌入单元;首先对图像进行子区域划分,把步骤1得到的图像划分为多个a×a的的子区域,然后使用a×a的的卷积核,以步长a的方式对划分的各子区域图像进行卷积,并使用层归一化进行归一化;2构建窗口划分;在子区域的基础上,分别采用划分方式一和划分方式二进行两种形式的窗口划分,其中划分方式一的划分方法为:选择相邻的b×b个子区域做为一个窗口,划分整个图像;划分方式二是在划分方式一的基础上把窗口向右向下各平移半个窗口大小,并把左上方的窗口进行循环移位;3构建多层感知机模块;多层感知机模块由两个全连接层构成,其中第一层全连接层后使用GELU函数进行激活,而第二层全连接层不使用激活函数;4构建偏移窗口模块;偏移窗口模块由两个连续的多头注意力模块构成,其中一个在划分方式一的基础上计算多头注意力,记作W-MSA;另一个在划分方式二上计算多头注意力,记作SW-MSA;5构建子区域合并模块;子区域合并模块为下采样模块,把相邻的a×a个子区域合并成一个子区域,同时把特征的通道维度扩大a倍;6构建特征提取网络;首先把输入图像输入区域嵌入单元获取特征;接着通过多个偏移窗口模块进行特征变换和提取,然后连接子区域合并模块对特征进行降维;然后重复堆叠偏移窗口模块和子区域合并模块构建偏移窗口变换网络;最后对输出特征进行展开和线性变换;步骤3:构建距离估计网络;距离估计网络由3层全连接层构成,并且前两层全连接层输出后使用ReLU进行激活,最后一层全连接层不进行激活;步骤4:构建预测头;预测头由2层全连接层构成,第一层全连接层输出后使用softmax进行激活,第二层全连接层不进行激活;步骤5:确定损失函数;1构建特征对比损失;首先从步骤1的训练集中构建图像和标签样本对{x1,y1,…xn,yn…,xN,yN},xn表示图像,yn表示标签,N表示总数,然后把样本对中的图像输入到特征提取网络获得对应的特征f1,…,fN,把距离估计网络记作DE,则特征对比损失如下所示: 2构建预测损失;把预测头记作G,则预测损失Lpred由下式计算: 其中,Gfi表示特征fi的预测结果;3构建总损失函数;总损失函数由特征对比损失和预测损失加权求和构成,权重系数为λ,其形式如下: 步骤6:训练网络参数;利用步骤5构建的总损失函数进行网络训练,同时更新特征提取网络、距离估计网络和预测头的参数;步骤7:测试阶段,选择步骤6中训练好的特征提取网络和预测头,对于给定的给图片,先输入特征提取网络提取特征,然后把特征输入预测头获得预测年龄。

全文数据:

权利要求:

百度查询: 电子科技大学 一种基于特征对比损失的年龄估计方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。