申请/专利权人:北京君正集成电路股份有限公司
申请日:2022-07-25
公开(公告)日:2024-02-02
公开(公告)号:CN117492839A
主分类号:G06F9/38
分类号:G06F9/38;G06F17/15
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.02.23#实质审查的生效;2024.02.02#公开
摘要:本发明提供一种基于simd的低比特量化处理方法,包括:S1,将输入数据sum转化为64比特整型数据,将mul转化为64比特整型数据,max_precision=15;S2,sum与mul相乘得到的结果向右移位max_precision‑left_shift;得到结果res1,res1为32比特整型数据,如公式所示:res1=sum×mul>>max_precision‑left_shift;S3,将res1向右移位right_shift,得res2;S4,对res1的公式优化处理;S5,对res2进行剪裁clip处理,得到结果res3;S6,根据要求输出是有符号还是无符号,利用res3和bitw进行数据转化得到最终结果。实现量化的simd优化,以及速度的提升。
主权项:1.一种基于simd的低比特量化处理方法,其特征在于,所述方法中量化处理需要的数据输入参数,预处理数据sum,固定移位值max_precision,模型参数相乘数据mul,模型参数左移数据left_shift,模型参数右移数据right_shift,输出特征图比特位数bitw,所述方法包括以下步骤:S1,卷积计算结果数据作为量化处理的输入数据sum,将输入数据sum转化为64比特整型数据,将mul转化为64比特整型数据,max_precision=15;S2,sum与mul相乘得到的结果向右移位max_precision-left_shift;得到结果res1,res1为32比特整型数据,如公式所示:res1=sum×mul>>max_precision-left_shift;S3,将res1向右移位right_shift,结果为res2,如公式所示:res2=res1right_shift;S4,res1对应的公式进行优化处理,如公式1所示:res2=[sum×mul<<left_shift+16]>>max_precision+161;将mul数据向左移16位,设为mul32,即mul32=mul<<left_shift+162将max_precision+16,设为max_precision31,即max_prcision31=max_precision+16,有max_precision31=313其中max_precision31是向左移位的位数,这里是31位;由于存在一条simd指令sumv=ingenic_mulq_hsumv,mulv;能够实现两个存放32位数据的寄存器相乘后再移位31位的操作,所以这里在向这个31位移位方向处理;由2和3有res2=[sum×mul32max_precision31]4S5,对res2进行剪裁clip处理,大于255的为255,小于0的为0,中间结果不变,得到结果res3;S6,根据要求输出是有符号还是无符号,利用res3和bitw进行数据转化得到最终结果。
全文数据:
权利要求:
百度查询: 北京君正集成电路股份有限公司 一种基于simd的低比特量化处理方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。