申请/专利权人:浪潮通信信息系统有限公司
申请日:2023-11-24
公开(公告)日:2024-03-05
公开(公告)号:CN117648952A
主分类号:G06N3/0464
分类号:G06N3/0464;G06N3/0495;G06N3/082;G06N3/048;G06N3/10;G06F8/60;G06V10/82;G06V20/52
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.03.22#实质审查的生效;2024.03.05#公开
摘要:本发明公开一种基于向量差值计算的模型边缘端部署优化方法及系统,涉及模型部署技术领域。针对校园场景中的摄像头多、需要部署的算法多、部署的边缘服务器算力弱的问题,采用方案:对YOLOv5模型进行量化转换,将32位浮点数转换为低位宽的整数;执行量化后的模型,从中获取量化后推理数据和原框架模型的矩阵数据;对量化后数据进行向量差值计算,找出精度误差超出设定阈值的算子,针对找出的算子,进行模型优化;再次量化优化后的模型;至再次量化后的模型带来的误差在设定范围内,将此模型部署到边缘设备。本发明可以满足校园安防系统的实际需求,确保模型的高效部署和高精度识别。
主权项:1.一种基于向量差值计算的模型边缘端部署优化方法,其特征在于,包括如下步骤:S1、对YOLOv5模型进行量化转换,将32位浮点数转换为低位宽的整数;S2、执行量化后的模型,从中获取量化后推理数据,同时获取原框架模型的矩阵数据;S3、对量化后推理数据和矩阵数据进行向量差值计算;S4、根据向量差值计算结果,找出精度误差超出设定阈值的算子;S5、针对误差超出设定阈值的算子,进一步进行模型优化;S6、调整量化方式,对优化后的模型进行再次量化;S7、再次量化后的模型带来的误差超出设定范围,返回执行步骤S5;再次量化后的模型带来的误差在设定范围内,将该再次量化后的模型部署到边缘设备。
全文数据:
权利要求:
百度查询: 浪潮通信信息系统有限公司 一种基于向量差值计算的模型边缘端部署优化方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。