买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于羊脸的轻量级羊身份识别模型构建方法及识别模型_湖北工业大学_202310930795.5 

申请/专利权人:湖北工业大学

申请日:2023-07-25

公开(公告)日:2024-03-12

公开(公告)号:CN116978099B

主分类号:G06V40/16

分类号:G06V40/16;G06V10/75;G06V10/74;G06V10/82;G06N3/0464;G06N3/048;G06N3/082

优先权:

专利状态码:有效-授权

法律状态:2024.03.12#授权;2023.11.17#实质审查的生效;2023.10.31#公开

摘要:本发明属于生物识别技术领域,涉及一种基于羊脸的轻量级羊身份识别模型构建方法及识别模型,该构建方法包括:1)获取羊脸视频数据;2)根据步骤1)获取得到的羊脸视频数据建立羊身份识别数据集;3)基于羊身份识别数据集构建羊身份识别模型。本发明提供了一种可对羊身份进行自动识别以及在识别准确率略优的条件下模型参数量减少近一半的基于羊脸的轻量级羊身份识别模型构建方法及识别模型。

主权项:1.一种基于羊脸的轻量级羊身份识别模型构建方法,其特征在于:所述基于羊脸的轻量级羊身份识别模型构建方法包括以下步骤:1获取羊脸视频数据;2根据步骤1获取得到的羊脸视频数据建立羊身份识别数据集;3基于羊身份识别数据集构建羊身份识别模型,具体是:3.1构建融合注意力机制瓶颈结构CBAMBneck,所述融合注意力机制瓶颈结构CBAMBneck包括CBAMBneck_S1以及CBAMBneck_S2;其中:所述CBAMBneck_S1的构建方式是:假设某CBAMBneck_S1结构的输入特征图为F′i,该特征图先后经过该CBAMBneck_S1结构中相应的特征扩展层、深度可分离卷积层、特征压缩层和CBAM注意力层处理后,得到的特征图为F′iP,则经过shortcut连接后,输出特征图F′i的计算过程为:F′i_s1=F′i+F′iP所述特征图F′i_s1即为某输入特征图F′经过某CBAMBneck_S1模块后输出的特征图;所述CBAMBneck_S2构建方式是:a获取特征图为Fi;b将特征图为Fi经过特征扩展层后得到特征图FiE;c将特征图FiE经过深度可分离卷积层后得到特征图FiD;d将特征图FiD经过特征压缩层后得到特征图FiP;e将特征图FiP经过CBAM注意力层后得到特征图F″i_s2,所述特征图F″i_s2即为特征图Fi经过某CBAMBneck_S2模块处理后所得到的新特征图;所述CBAMBneck_S2构建的具体实现方式是:a获取特征图为Fi;b使特征图为Fi进入到特征扩展层,进行如下运算:FiE=HardswishBNf1×1Fi式中:所述Fi为输入特征图;所述f1×1是1×1卷积运算,卷积核数量是c×t,c表示输入特征图的通道数,t为通道扩展因子;所述BN是特征图标准归一化操作;所述FiE是特征图为Fi经过特征扩展层后得到的特征图;所述Hardswish是激活函数Hardswish,所述Hardswish函数的计算公式为: 其中,x代表激活函数Hardswish的输入值,即特征图的像素值;c将特征图FiE进入到深度可分离卷积层,进行如下运算:FiD=ReLUBNf3×3FiE式中:所述f3×3表示3×3可分离卷积运算,卷积核数量为c×t;所述ReLU为激活函数ReLU6;所述FiD是特征图FiE经过深度可分离卷积层后得到的特征图;d将经过深度可分离卷积层后得到的特征图FiD接着输入到特征压缩层,进行如下运算:FiP=LinearBNf′1×1FiD式中:所述f′1×1为1×1卷积运算,卷积核数量为c',c'为输出特征图的通道数;所述BN表示特征图标准归一化操作;所述Linear为线性激活函数Linear;所述FiP是特征图FiD经过特征压缩层处理后的特征图;e将特征图FiP接着输入到CBAM注意力层进一步进行处理,具体步骤如下:e.1将特征图FiP经过通道注意力增强,获取经过通道注意力增强后的特征图FiC,具体是:假设输入到CBAM注意力层的特征图FiP的尺寸为Hip×Wip×Cip,对每个通道所对应的Hip×Wip空间特征分别进行平均池化和最大池化运算,得到两个尺寸均为1×1×Cip的特征向量CiA以及特征向量CiM;特征向量CiA以及特征向量CiM经过多层感知机计算,得到相应的特征向量CiA'以及特征向量CiM';特征向量CiA'以及特征向量CiM'进行逐元素相加,得到尺寸为1×1×Cip的通道特征向量;通道特征向量再进行Sigmoid运算,得到通道注意力映射MiC,表达式如下:Mic=σMLPAvgPoolFiP+MLPMaxPoolFiP其中:所述FiP为输入特征图;所述AvgPool以及MaxPool分别表示通道上特征图的平均池化操作和最大池化操作;所述MLP为多层感知机前向计算函数;所述σ为Sigmoid函数;所述特征图FiP与通道注意力映射Mic按元素相乘,得到经过通道注意力增强后的特征图FiC,计算过程如下: 式中:所述表示逐元素相乘操作;e.2将经过通道注意力增强后的特征图FiC经过空间注意力增强获得空间注意力映射MiS,具体是:将步骤e.1获得的特征图FiC进一步进行空间注意力增强,假设特征图FiC的尺寸为Hic×Wic×Cic,对每个1×1空间所对应的所有通道特征分别进行平均池化和最大池化运算,得到两个尺寸均为Hic×Wic×1的特征向量SiA以及特征向量SiM;将特征向量SiA以及特征向量SiM拼接起来生成一个尺寸为Hic×Wic×2的特征向量SiAM;特征向量SiAM进行一个7×7卷积运算,得到尺寸为Hic×Wic×1的空间特征向量;空间特征向量再进行Sigmoid运算,得到最终的空间注意力映射MiS,表达式如下:Mis=σf7×7fcAvgPoolFiC,MaxPoolFiC其中:所述fc为特征图通道拼接操作;所述AvgPool以及MaxPool分别表示通道上特征图的平均池化操作和最大池化操作;所述f7×7为7×7卷积运算;所述σ为Sigmoid函数;e.3将步骤e.1获取得到的特征图FiC以及步骤e.2获取得到的空间注意力映射MiS相乘得到特征图F″i_s2,所述特征图F″i_s2即为特征图Fi经过某CBAMBneck_S2模块处理后所得到的新特征图,具体是:将步骤e.1获取得到的特征图FiC与步骤e.2获取得到的空间注意力映射Mis按元素相乘得到特征图F″i_s2,计算过程如下: 式中:所述表示逐元素相乘操作;所述特征图F″i_s2即为特征图Fi经过某CBAMBneck_S2模块处理后所得到的新特征图;3.2基于步骤3.1构建得到的融合注意力机制瓶颈结构CBAMBneck构建轻量级羊身份识别模型;所述轻量级羊身份识别模型包括1个3×3卷积层、14个融合注意力机制瓶颈结构CBAMBneck,2个1×1卷积层和1个池化层,具体是:假设某羊脸图像为Ish,大小为224×224×3,输入到3×3卷积层,进行如下运算:F0=f′3×3Ish其中:所述Ish为输入图像;所述f′3×3为该3×3卷积层的卷积操作,卷积核大小为3×3,卷积核数量为32,步长为2;所述F0表示输出的特征图;所述特征图F0大小为112×112×32,依次输入到14个融合注意力机制瓶颈结构CBAMBneck进行特征提取和融合操作,最终输出特征图,以符号F14表示,特征图F14的大小为7×7×320;将特征图F14再次进行1×1卷积操作,卷积核大小为1×1,卷积核数量为1280,完成特征图通道方向上的融合,输出特征图F15,特征图F15的大小为7×7×1280;将特征图F15输入到池化层中进行全局平均池化操作,输出特征图F16,特征图F16的大小为1×1×1280;对特征图F16进行1×1卷积操作,卷积核数量为动物类别数;最后使用Softmax函数将卷积操作输出的每个元素的范围变换到0~1之间,作为羊身份类别的概率,概率最大值所对应的类别即为羊身份标识。

全文数据:

权利要求:

百度查询: 湖北工业大学 基于羊脸的轻量级羊身份识别模型构建方法及识别模型

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。