买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种分通道量化权重的方法_合肥君正科技有限公司_202010497921.9 

申请/专利权人:合肥君正科技有限公司

申请日:2020-06-04

公开(公告)日:2024-04-02

公开(公告)号:CN113762499B

主分类号:G06N3/082

分类号:G06N3/082;G06N3/0464;G06N3/048;G06F17/18

优先权:

专利状态码:有效-授权

法律状态:2024.04.02#授权;2021.12.24#实质审查的生效;2021.12.07#公开

摘要:本发明提供一种分通道量化权重的方法,所述方法是根据模型的输出通道数来量化权重,当卷积神经网络的权重是4维[height,width,input_channel,output_channel]时,根据output_channel分别统计其他3个维度数据的极值,然后再量化为低比特,根据每个通道的分布特性来量化数据。本申请旨在克服现有技术中存在的缺陷,解决现有低比特模型量化时低比特数据利用不充分,集中在少量几个数值,降低了模型的精度的问题。

主权项:1.一种分通道量化权重的方法,其特征在于,所述分通道量化权重的方法适用于图像识别应用、增强学习、语义分析应用中部署的深度神经网络,所述方法是根据模型的输出通道数来量化权重,当卷积神经网络的权重是4维[height,width,input_channel,output_channel]时,根据output_channeI分别统计其他3个维度数据的极值,然后再量化为低比特,根据每个通道的分布特性来量化数据;所述方法具体包括以下步骤:S1,卷积神经网络训练:用全精度算法训练模型,得到一个用于目标分类的网络,即获得模型推理过程中的相关参数,所述相关参数包括,卷积的权重,BiasAdd算子的偏置,BatchNormal算子的gamma,beta,均值和方差;S2,微调量化后的模型:S2.1,对于从S1得到的模型按照公式1要求对权重进行量化,公式1:其中,为Wf中某一个通道的数据,为Wq中某一个通道的数据,即对Wf数据中的每一个通道数据分别进行公式1的操作得到Wq,Wf为全精度数据,Wq为量化后的数据,maxw为全精度数据Wf的最大值,b为量化后的位宽,c代表输出通道中的某个通道;S2.2,对于量化后的值需要再除以2b-1即其中,Wq为S2.1中对Wf量化得到的数据,W为模型微调阶段送到卷积的权重的数据,便于模型微调的时候能有效的收敛;S3,featuremap的量化:在微调阶段将激活函数设置为relu6,由relu6激活函数的特性可知,该激活函数输出结果的数值范围在0到6之间,所以此时featuremap的最大值为6,然后再按照公式1对数据进行量化。

全文数据:

权利要求:

百度查询: 合肥君正科技有限公司 一种分通道量化权重的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。