买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于AM-Softmax损失的蝴蝶图像细粒度识别方法_北京工业大学_202110092924.9 

申请/专利权人:北京工业大学

申请日:2021-01-25

公开(公告)日:2024-03-29

公开(公告)号:CN112800927B

主分类号:G06V40/10

分类号:G06V40/10;G06V10/774;G06V10/80;G06V10/82;G06N3/0464

优先权:

专利状态码:有效-授权

法律状态:2024.03.29#授权;2021.06.01#实质审查的生效;2021.05.14#公开

摘要:本发明公开了一种用于基于AM‑Softmax损失的蝴蝶图像细粒度识别方法,属于计算机视觉领域;具体步骤包括:首先选择使用网络收集以及标注的334类蝴蝶数据集作为实验数据集,并进行预处理操作;然后,建立双线性模型;其次,使用AM‑Softmax作为损失函数,选择优化方法,设置合适的学习率以及迭代次数等超参数,训练双线性网络,训练完成后保存模型;最后,对测试集图像进行测试,输出分类准确率。本说明在计算机视觉、细粒度识别领域具有一定的研究意义和价值。

主权项:1.一种基于AM-Softmax损失的蝴蝶图像细粒度识别方法,其特征在于:包括以下步骤:步骤1:预处理蝴蝶图像细粒度识别数据集,构建的334类共N幅蝴蝶图像的数据集D上面进行验证,将每一种类的数据集以8:2的比例划分为训练和测试图像,最终得到训练集Dt和测试集Ds,整个蝴蝶图像数据集表示为D={Ii,yi},1≤i≤N,其中Ii表示蝴蝶图像,yi表示类别标签;步骤2:构建基础网络,选择VGG-16的前13层作为基础网络,该基础网络由5个卷积块组成,其中前两个卷积块包含两个卷积层和一个池化层,后三个卷积块包含三个卷积层和一个池化层,其中每个卷积核大小都是3×3,采用最大池化的方式;基础网络的输入为彩色图像Ii∈Rh×w×3,其中h和w分别表示图像的高度和宽度,3表示图像的通道个数,网络的输出为多通道的特征;步骤3:构建双线性网络模型,此网络包含A和B两个并行的分支,其中A分支用于提取细粒度特征,B分支用于定位区域,这两个分支都使用步骤2中的基础网络:步骤4:建立网络的损失函数,使用AM-Softmax作为损失函数,表示为: 其中,f代表输出层的输入,是最后一个全连接层权值矩阵W的第yp列,yp代表第p个样本真实标签的序号,m通常是一个大于1的整数,s为缩放因子;步骤5:网络训练:设置迭代次数、学习率超参数,使用随机梯度下降算法对网络参数进行迭代更新,保存最终的模型;步骤6:网络测试:加载保存的模型,将测试集Ds输入网络中,获得最终的分类准确率;步骤3包括以下步骤:步骤3.1:对于第p幅训练图像Ip∈Rh×w×3,1≤ρ≤Nt,双线性网络首先分别使用A和B两个分支提取特征,得到两个维度相同的特征和步骤3.2:将特征和分别拉伸成一个向量,表示为: 其中,vector·表示向量化操作;步骤3.3:使用外积操作对和进行特征融合,表示为: 其中,bip表示第p幅图像Ip融合后的特征;步骤3.4:将bip拉伸为向量,得到第p幅图像Ip的双线性特征:Bip=vectorbip其中,vector·表示向量化操作;步骤3.5:将获取到的双线性特征做如下标准化计算: 其中,zp表示第p幅图像Ip归一化后的双线性特征;步骤3.6:使用softmax分类器对归一化后的双线性特征zp进行分类,得到输出结果op∈R1×C,表示为: 其中C代表图像类别的个数。

全文数据:

权利要求:

百度查询: 北京工业大学 一种基于AM-Softmax损失的蝴蝶图像细粒度识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。