买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于FPGA和量化蒸馏的图像分类异构硬件加速方法_重庆邮电大学_202311528315.9 

申请/专利权人:重庆邮电大学

申请日:2023-11-16

公开(公告)日:2024-04-26

公开(公告)号:CN117935025A

主分类号:G06V10/94

分类号:G06V10/94;G06N3/0464;G06N3/0495;G06N3/045;G06N3/096;G06V10/764;G06V10/82;G06N3/082

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.05.14#实质审查的生效;2024.04.26#公开

摘要:本发明请求保护一种基于FPGA和量化蒸馏的图像分类异构硬件加速方法,属于故障诊断领域,所述方法包括量化、知识蒸馏算法部分和硬件加速部分,整体以深度神经网络作为基础框架,通过量化蒸馏压缩模型,结合FPGA异构加速技术,通过HLS编译,软硬件协同开发IP核和堆栈开发实现算法嵌入式移植,教师网络选择GHOSTNETV2网络,通过通道剪枝和量化实现优化型轻量网络;学生网络基于深度可分离卷积,winograd加速算法和量化技术实现了轻量网络;最后引入离线蒸馏模式实现硬件友好型网络;硬件部分选择HLS实现C\RTL联合编译IP核,VITISAI堆栈开发部署到XILINX公司的MPSOC架构板卡ZYNQ。本发明不仅提高了目标分类设备的便携利用程度和效率,同时降低了成本。

主权项:1.一种基于FPGA和量化蒸馏的图像分类异构硬件加速方法,其特征在于,包括以下步骤:步骤1,获取图像数据集样本,采集所需分类图像特征信息,制作目标训练集和测试集;步骤2,对骨干网络GHOSTNETV2网络模型进行改进,包括增加注意力分支模块,增强扩展的特征;网络压缩,减少冗余的1x1卷积层,减少堆叠的倒残差模块;量化减少参数量和计算量,得到教师网络;步骤3,利用步骤S1中获取的数据集对步骤2中改进后的教师网络模型结构进行训练,迭代得到轻量型教师网络模型;步骤4,构建基于DSC深度可分离卷积的特征分类学生网络;步骤5,训练学生网络模型及输出,对步骤4中得到的学生网络模型进行微调优化;步骤6,利用步骤S1中获取的训练样本对步骤5中构建的轻量型学生网络模型结构进行训练,迭代得到轻量型网络模型;步骤7,对步骤6得到的轻量型网络模型进行误差分析和优化;步骤8,将步骤3得到的教师网络模型与步骤7得到LSYNET1网络模型进行知识蒸馏;步骤9,由步骤8中得到的网络模型编译实现IP核;步骤10,将步骤9编译好的模型部署到边缘设备,输入权重,与主机连接搭建异构平台;步骤11,故障诊断,利用步骤10部署到边缘设备上的网络模型对步骤1中的图像数据集进行分类识别,实现异构平台上的硬件加速。

全文数据:

权利要求:

百度查询: 重庆邮电大学 一种基于FPGA和量化蒸馏的图像分类异构硬件加速方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。