买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种融合多教师知识蒸馏的Yolov7柚子计数方法_江西农业大学;江西省科学院应用物理研究所_202311789356.3 

申请/专利权人:江西农业大学;江西省科学院应用物理研究所

申请日:2023-12-25

公开(公告)日:2024-03-19

公开(公告)号:CN117496509B

主分类号:G06V20/68

分类号:G06V20/68;G06V10/82;G06N3/045;G06N3/0464;G06N3/082

优先权:

专利状态码:有效-授权

法律状态:2024.03.19#授权;2024.02.23#实质审查的生效;2024.02.02#公开

摘要:本发明公开了一种融合多教师知识蒸馏的Yolov7柚子计数方法,通过对YOLOv7‑Tiny‑Large网络模型静态剪枝,得到轻量化的YOLOv7‑Tiny‑Pruning网络模型,作为学生模型;对YOLOv7‑Tiny网络模型的主干网络中添加AIFI模块并修改损失函数,作为教师模型Ⅰ;对YOLOv7‑Tiny网络模型的颈网络中添加SEAM注意力机制,修改损失函数,作为教师模型Ⅱ;使用两个教师模型的知识转学生模型,生成总蒸馏损失函数;再用总蒸馏损失函数对学生模型进行蒸馏训练。本发明通过多教师知识蒸馏的方式来恢复因剪枝而损失的精确度,同时提高模型鲁棒性和精确度。

主权项:1.一种融合多教师知识蒸馏的Yolov7柚子计数方法,其特征在于,包括以下步骤:步骤一:通过对YOLOv7-Tiny-Large网络模型静态剪枝,通过剪枝、训练和微调减去冗余的参数和通道数,得到轻量化的YOLOv7-Tiny-Pruning网络模型,作为学生模型;步骤二:对学生模型使用柚子照片数据集进行训练,生成知识软目标,再由知识软目标生成软标签,用于多教师知识蒸馏训练;步骤三:在YOLOv7-Tiny网络模型的主干网络中添加AIFI模块,YOLOv7-Tiny网络模型的损失函数改为Wasserstein,得到YOLOv7-Tiny-AIFI-Wasserstein网络模型,并作为教师模型Ⅰ;所述教师模型Ⅰ由主干网络、颈网络、预测输出构成,主干网络依次由第一卷积模块、第二卷积模块、第一C5模块、第一最大池化模块、第二C5模块、第二最大池化模块、第三C5模块、第三最大池化模块、第四C5模块、AIFI模块组成;颈网络包括SPPCSPC模块、第三卷积模块、第四卷积模块、第五卷积模块、第五C5模块、第六卷积模块、第六C5模块、第七卷积模块、第七C5模块、第八卷积模块、第八C5模块;第三C5模块输出的特征经第四卷积模块卷积,AIFI模块输出的特征进入SPPCSPC模块处理,SPPCSPC模块输出的特征经上采样后与第四卷积模块输出的特征融合,然后依次经过第五C5模块、第六卷积模块处理,第二C5模块输出的特征经第三卷积模块卷积,第六卷积模块输出的特征经上采样后与第三卷积模块输出的特征融合,然后进入第五C5模块处理,第五C5模块输出的特征经第七卷积模块卷积后与第五C5模块输出的特征融合,然后进入第七C5模块,第七C5模块输出的特征经第八卷积模块卷积后与SPPCSPC模块输出的特征融合,最后进入第八C5模块处理;选择第六C5模块、第七C5模块和第八C5模块的输出作为预测输出;步骤四:在YOLOv7-Tiny网络模型的颈网络中添加SEAM注意力机制,YOLOv7-Tiny网络模型的损失函数改为SlideLoss损失函数,得到YOLOv7-Tiny-SEAM-SlideLoss网络模型,并作为教师模型Ⅱ;所述教师模型Ⅱ由主干网络、颈网络、预测输出构成,主干网络依次由第一卷积模块、第二卷积模块、第一C5模块、第一最大池化模块、第二C5模块、第二最大池化模块、第三C5模块、第三最大池化模块、第四C5模块组成;颈网络包括SPPCSPC模块、第三卷积模块、第四卷积模块、第五卷积模块、第五C5模块、第六卷积模块、第六C5模块、第七卷积模块、第七C5模块、第八卷积模块、第八C5模块;第三C5模块输出的特征经第四卷积模块卷积,第四C5模块输出的特征直接进入SPPCSPC模块处理,SPPCSPC模块输出的特征经上采样后与第四卷积模块输出的特征融合,然后依次经过第五C5模块、第六卷积模块处理,第二C5模块输出的特征经第三卷积模块卷积,第六卷积模块输出的特征经上采样后与第三卷积模块输出的特征融合,然后进入第五C5模块处理,第五C5模块输出的特征经第七卷积模块卷积后与第五C5模块输出的特征融合,然后进入第七C5模块,第七C5模块输出的特征经第八卷积模块卷积后与SPPCSPC模块输出的特征融合,最后进入第八C5模块处理;选择第六C5模块、第七C5模块和第八C5模块的输出分别经过SEAM注意力机制处理后,作为预测输出;步骤五:使用教师模型Ⅰ的知识转学生模型,首先,教师模型Ⅰ对柚子照片数据集进行训练,生成教师模型Ⅰ的知识软目标,再由教师模型Ⅰ的知识软目标生成教师模型Ⅰ的软标签,最后通过教师模型Ⅰ的软标签与学生模型的软标签生成蒸馏损失函数Ⅰ;步骤六:使用教师模型Ⅱ的知识转学生模型,首先,教师模型Ⅱ对柚子照片数据集进行训练,生成教师模型Ⅱ的知识软目标,再由教师模型Ⅱ的知识软目标生成教师模型Ⅱ的软标签,最后通过教师模型Ⅱ的软标签与学生模型的软标签生成蒸馏损失函数Ⅱ;步骤七:结合蒸馏损失函数Ⅰ与蒸馏损失函数Ⅱ,生成总蒸馏损失函数;再用总蒸馏损失函数对学生模型进行蒸馏训练,蒸馏训练后的学生模型对所输入的柚子照片生成知识软目标,再由知识软目标生成软标签,并计算学生模型损失,最终得到硬目标,使用硬目标对柚子图像进行预测,得到识别框,对识别框计数,即为柚子数量。

全文数据:

权利要求:

百度查询: 江西农业大学;江西省科学院应用物理研究所 一种融合多教师知识蒸馏的Yolov7柚子计数方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。