买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于渐进式量化和Hessian信息的神经网络混合量化方法_南强智视(厦门)科技有限公司_202010915248.6 

申请/专利权人:南强智视(厦门)科技有限公司

申请日:2020-09-03

公开(公告)日:2023-05-12

公开(公告)号:CN112183742B

主分类号:G06N3/08

分类号:G06N3/08;G06N3/02

优先权:

专利状态码:有效-授权

法律状态:2023.05.12#授权;2021.06.08#实质审查的生效;2021.01.05#公开

摘要:本发明公开一种基于渐进式量化和Hessian信息的神经网络混合量化方法,步骤是:给定图像‑标签对集合,划分样本集和校准集;定义神经网络每层可选的量化精度范围;随机选择量化层做降bit量化,重复采样n次,得到n个基础的混合精度模型;以校准集中的图像‑标签对作为输入,对所有候选的混合精度神经网络模型进行一次前向过程;利用Adam二阶Momentum信息计算Hessian近似值;再计算性能评价指标,将n个指标排序,选择最小值对应混合精度策略作为当前步次下性能最好的混合精度超参组合,计算模型的计算成本,再对当前的混合精度网络模型做训练;迭代至满足结束条件。此方法能够极大地减少每一步次中的可优化的混合精度搜索空间,同时提高量化模型的性能评估效率。

主权项:1.一种基于渐进式量化和Hessian信息的神经网络混合量化方法,其特征在于包括如下步骤:步骤1,给定标好的图像-标签对集合,划分为训练样本集、测试样本集和验证样本集,并从训练样本集中随机采样一部分作为校准集;定义神经网络每层可选的量化精度范围,并给定训练收敛的浮点网络和需要的计算成本约束;步骤2,随机选择量化层进行采样,对所有选中的量化层做降bit量化,重复采样n次,从而得到n个基础的混合精度模型;步骤3,以校准集中的图像-标签对作为输入,对步骤2采样得到的所有的候选的混合精度神经网络模型进行一次前向过程;利用Adam二阶Momentum信息计算Hessian近似值基于此近似值,计算 其中,表示校准集数据,表示整个神经网络模型参数,wi表示原始给定的训练好的浮点模型中第i层的可训练权重,相应的当前步次中混合bit模型对应网络层的可训练参数为步骤4,对所有的样本模型对应的性能指标做排序,选择值最小的对应混合精度策略作为当前步次下性能最好的混合精度超参组合;步骤5,基于当前步次下性能最好的混合精度超参组合,计算模型的计算成本,再利用步骤1中的训练样本集对当前的混合精度网络模型做训练;步骤6,判断是否满足结束条件,若符合则以当前的混合精度网络模型作为最终的神经网络模型;否则以步骤5训练后的模型为初始化,重复步骤2到步骤5,直至满足结束条件。

全文数据:

权利要求:

百度查询: 南强智视(厦门)科技有限公司 基于渐进式量化和Hessian信息的神经网络混合量化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。