【发明授权】基于SIMD技术的卷积神经网络加速装置及方法_北京计算机技术及应用研究所_202011015325.9

申请/专利权人：北京计算机技术及应用研究所

申请日：2020-09-24

公开（公告）日：2024-02-27

公开（公告）号：CN112418417B

主分类号：G06N3/063

分类号：G06N3/063;G06N3/0464;G06F9/38;G06F13/28;G06N3/048

优先权：

专利状态码：有效-授权

法律状态：2024.02.27#授权;2021.03.16#实质审查的生效;2021.02.26#公开

摘要：本发明涉及一种基于SIMD技术的卷积神经网络加速装置及方法，属于嵌入式卷积神经网络加速硬件技术领域。本发明针对当前神经网络应用中的突出矛盾，提出一种基于SIMD技术的神经网络推理加速装置。本发明首先设计一个运算流程，以满足神经网络算法中的全部算子功能，然后面向该计算流程，进行硬件功能单元设计，以软件定义硬件的方式实现系统设计，同时提供较高的性能功耗比和综合运算能力。

主权项：1.一种基于SIMD技术的卷积神经网络加速装置，其特征在于，包括卷积阵列、可编程向量处理单元、数据缓冲区、权重缓冲区、任务分发单元、卷积控制器以及外部存储器；其中，所述卷积阵列负责根据卷积控制器的硬件微操作指令，实现卷积运算加速，同时兼顾批量规范化BN和ReLU激活功能；可编程向量处理单元用于通过编程，处理当前神经网络算法中的多种操作；卷积控制器是所述卷积阵列的控制机构，负责将一个完整的图像卷积运算，自动分解为硬件微操作指令，从而控制卷积阵列实现卷积运算加速；数据缓冲区用于存储神经网络特征图、卷积阵列的卷积结果和可编程向量处理单元的运算结果参数；权重缓冲区用于存储卷积权重和其他参数；任务分发单元用于从外部存储器中读取神经网络算法的可执行代码，并根据当前算子类型调用卷积控制器或可编程向量处理单元实现运算；若当前算子为卷积，则任务分发模块将该可执行代码中的卷积的相关信息发送给卷积控制器，使得卷积阵列根据卷积控制器的硬件微操作指令，实现卷积运算加速；卷积的相关信息包括神经网络特征图大小、滤波器大小、通道数、神经网络特征图和卷积权重的内存地址；若当前算子为pooling计算，任务分发单元将pooling任务的可执行代码传送至可编程向量处理单元进行处理；若当前算子为eltwise计算，则任务分发单元将eltwise任务的可执行代码传送至可编程向量处理单元进行处理；外部存储器用于神经网络算法的可执行代码；所述卷积阵列包括若干个SIMD乘累加器、若干个横向求和单元、一个BN单元、一个ReLU单元、一个数据广播单元，若为3x3卷积运算，卷积阵列具体用于根据卷积控制器的硬件微操作指令，首先通过异步DMA将外部存储器中的神经网络特征图和卷积权重分别加载到数据缓冲区和权重缓冲区；然后从数据缓冲区，按照直接卷积方式，读取m个通道的神经网络特征图，神经网络特征图经过数据广播单元，复制成n份，同时从权重缓冲区读取相应的权重数据，进行乘累加运算，每9次乘累加即完成一个二维3*3卷积，若设该卷积阵列输入M个通道，输出N个通道，则Mm*9次乘累加结果在横向求和单元进行横向求和，合并为一个通道的输出，再经过BN单元和ReLU单元，完成一个点位置的三维卷积，卷积结果写回数据缓冲区，再经由异步DMA写回外部存储器，卷积阵列同时输出n个通道的三维卷积结果，卷积计算过程重复N次，则完成一个点位置的全部N个通道卷积计算，对特征图的全部位置执行卷积计算流程，完成一个卷积层的计算。

全文数据：

权利要求：

百度查询：北京计算机技术及应用研究所基于SIMD技术的卷积神经网络加速装置及方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种炮孔自动填塞机_新疆天河爆破工程有限公司_202410337157.7

下一篇：基于扩散模型的双阶段无人机遥感图像识别方法_中国人民解放军国防科技大学_202410331538.4

相关技术

一种炮孔自动填塞机_新疆天河爆破工程有限公司_202410337157.7

基于扩散模型的双阶段无人机遥感图像识别方法_中国人民解放军国防科技大学_202410331538.4

一种矿井提升机防止跑车的控制方法与装置_洛阳九亿重工集团有限公司_202410421104.3

一种化合物及其制备方法和在卷烟中的应用_湖北中烟工业有限责任公司_202410162764.4

一种非均匀大气波导修正折射率的测算方法及系统_南京信息工程大学_202410123152.4

一种基于视觉和图像处理的叉车AGV控制系统_中建材智能自动化研究院有限公司_202410146298.0

一种吊具点测方法、装置、系统和存储介质_一汽丰田汽车有限公司_202410173152.5

用于制造一次性杯状件的机器_MS2责任有限公司_202280065197.X

锂电池管理单元及管理方法_深圳市车电网络有限公司_202410101072.9

一种靶向性介孔聚多巴胺纳米颗粒及其制备方法和应用_中国药科大学_202410163612.6

无机人造石脱模剂及其制备方法和无机人造石的制备方法_深圳市润丰新材料科技有限公司_202410151462.7

一种热升华水性油墨及其制备方法_广东睿智环保科技股份有限公司_202410410854.0

网络相关技术

网络设备安装_极进网络公司_202410166218.8

多网络探测_苹果公司_201911369411.7

一种网络机箱_佛山市顺德区四方板业科技有限公司_201810009492.9

一种网络处理器、网络数据处理装置和芯片_深圳云豹智能有限公司_202410410574.X

网络集群系统、报文传输方法及网络设备_华为技术有限公司_202211399997.3

变电站网络设备接入认证方法及其系统、芯片、网络设备_深圳市国电科技通信有限公司_202210416687.1

基于双网络边缘计算的卫星网络计算卸载优化方法_哈尔滨工业大学_202410115108.9

多重网络攻击下的非线性网络自适应模糊控制系统_东北石油大学_202410159525.3

具备网络资产测绘功能的终端网络准入控制系统_淮安市第三人民医院_202410241517.3

基于二值神经网络的快速目标检测网络、训练及应用方法_西北工业大学_202410091902.4

神经相关技术

熵约束神经视频表示_迪士尼企业公司_202311488466.6

一种基于脉冲神经网络的神经系统信号处理方法_南京宁麒智能计算芯片研究院有限公司_202410141665.8

神经电极组件及其制备方法_武汉衷华脑机融合科技发展有限公司_202311821418.4

术中神经影像识别系统_广州汉思医疗科技有限公司_202410285364.2

一种脊髓神经刺激装置_安徽医科大学第二附属医院_202321959830.8

一种诱导神经再生的新型双层神经引导导管及其制备方法_信阳师范学院_202410188230.9

神经网络控制器和神经网络控制器的学习方法_三菱电机株式会社_202180101415.6

用于治疗神经病变的基因疗法及其应用_科辉智药(深圳)新药研究中心有限公司_202311039041.7

视频编解码的神经网络方法和装置_联发科技股份有限公司_201980022949.2

一种神经护理用引导装置_湖南省药品审核查验中心_202322054033.1

加速相关技术

一种光纤加速度计探头及加速度传感系统_中国石油大学(北京)_202322427339.7

一种基于HDFS批量删除文件加速方法_西安烽火软件科技有限公司_202410270614.5

一种电子加速器_上海福照人间技术有限公司_202410299047.6

一种医用直线加速器治疗头_玛西普医学科技发展(深圳)有限公司_201910149003.4

硬件加速器及其调度方法_苏州元脑智能科技有限公司_202410219345.X

排泥反馈装置及机械加速澄清池_北京安菱水务科技有限公司_202322762964.7

一种空间MOSFET加速退化试验评估方法_上海空间电源研究所_202410143127.2

一种房建施工加速干燥装置_宙宏建设集团有限公司_202322818142.6

一种加速器辅助安装结构_北京华清加高能电子科技有限公司_202322129361.3

一种服务器加速卡_深圳英博达智能科技有限公司_202410170492.2

龙图腾网&IPTOP

【发明授权】基于SIMD技术的卷积神经网络加速装置及方法_北京计算机技术及应用研究所_202011015325.9

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务