【发明授权】一种抗辐射低延迟神经网络推理加速芯片_华中师范大学_202311798002.5

导航：龙图腾网> 最新专利技术> 一种抗辐射低延迟神经网络推理加速芯片_华中师范大学_202311798002.5

申请/专利权人：华中师范大学

申请日：2023-12-26

公开（公告）日：2024-03-19

公开（公告）号：CN117474061B

主分类号：G06N3/063

分类号：G06N3/063;G06N3/0464;G06N3/048

优先权：

专利状态码：有效-授权

法律状态：2024.03.19#授权;2024.02.20#实质审查的生效;2024.01.30#公开

摘要：本发明提供了一种抗辐射低延迟神经网络推理加速芯片，涉及对撞机技术领域，包括以下步骤：在探测器前端部署神经网络推理加速芯片，采用流式架构，将每级流水线对应于每个主要的神经网络层，平衡有限的片上内存资源和对大尺寸输入的支持，并构建层并行、通道并行和卷积核并行；本发明提出了在探测器前端部署抗辐射、低延迟、高效的卷积神经网络推理加速芯片，来提高未来探测器硬件的智能化水平，并为此提出了基于细粒度的流式架构、细粒度的存储管理、灵活的压缩和量化，以及抗辐射数字芯片设计技术，在实现抗辐射、低延迟推理的同时，实现高吞吐量和低片上内存消耗，使下一代新型智能探测器可以在前端实施基于神经网络算法的实时分析触发。

主权项：1.一种抗辐射低延迟神经网络推理加速芯片，其特征在于，所述神经网络推理加速芯片设置在探测器前端，具体包括：若干依次连接的流式架构单元：用于实现不同的神经网络层的计算；以及外部存储单元：用于存储整个神经网络的权重；以及分别对辐射的总剂量效应TID和单粒子效应SEE采取措施的抗辐射模块，包括：TID缓解子模块：采用先进节点的CMOS工艺，避免使用小尺寸标准单元，预留更大的时序裕度；SEE缓解子模块：使用两种不同的TMR实现：简单TMR模块，具有三重寄存器和多数表决器，以及完全的TMR模块，模块内的所有组合逻辑都是三重的，由三个多数表决器使用，并形成三重寄存器的输入，来自寄存器输出的反馈可实现自动更正，状态会定时刷新的控制路径，以及周期性到达芯片的输入数据不需要自动更正功能，而一旦配置或加载后，长时间不会刷新的关键数据则使用自动更正功能来确保由于单粒子翻转而导致的寄存器错误不会随时间累积；每个流式架构单元包括：整形缓存：用于存储输入特征图切片或者前级神经网络层输出的特征图切片；神经网络子单元：用于实现计算引擎阵列，能够完成卷积层或全连接层的并行计算，卷积层和全连接层使用相同的循环结构，使用并行计算策略；权重缓存：与外部存储单元连接，用于从外部存储器中抽取计算当前特征图切片所需的权重；并行计算时，并行性来自于6个维度，具体包括：批并行性同时将多帧图像分组为批，以重用每一层中的权重，并最小化外部内存访问；层并行性通过在结束N层的执行之前启动N+1层以流水线方式执行，并对主要的层实施并行化，其余的层合并到主要层，减少流水线的级数来降低延迟，实现参数化的RTL设计；卷积层4个级别循环计算的展开提供另外4个并发源，全连接计算的循环展开提供另外4个并发源，卷积核循环Loop-4、输入通道循环Loop-3、沿输入宽、高维度扫描操作的循环Loop-2和卷积核窗口内乘法累加操作的循环Loop-1，并行展开卷积层外两层的计算循环，即卷积核循环Loop-4和输入通道循环Loop-3，外两层计算循环的展开仅需缓存输入特征图的切片就可以启动流水线开始卷积运算；卷积核并行是从权重中一次取多个卷积核，与特征图进行并行计算；输入通道并行是从输入特征图中一次取多个数据通道，与卷积核进行并行计算；卷积层外两层即卷积核循环Loop-4和输入通道循环Loop-3的并行展开，为此定义两个参数，卷积核并行度因子KPF和通道并行度因子CPF，分别表示在流水线级内处理的卷积核的数量和输入通道的数量，使计算引擎阵列实现二维并行方案，并调整每个流水线阶段的资源开销，其中，计算引擎阵列由多个计算引擎构成，每个计算引擎用于处理有CPF个通道的输入特征图，计算引擎阵列中计算引擎的数目由KPF决定，将计算引擎以硬件为中心、自下而上，构建参数化RTL级IP，基于IP构建神经网络层，判断不同CPF和KPF对推理延迟、吞吐量、硬件开销的影响。

全文数据：

权利要求：

百度查询：华中师范大学一种抗辐射低延迟神经网络推理加速芯片

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：无功补偿柜柜体_广东澳江电气有限公司_202322547060.2

下一篇：4G/5G+北斗+Lora机车远程控制装置_宁夏宁东铁路有限公司_202322827126.3

相关技术

无功补偿柜柜体_广东澳江电气有限公司_202322547060.2

4G/5G+北斗+Lora机车远程控制装置_宁夏宁东铁路有限公司_202322827126.3

一种饮料包装盒的快速消毒装置_赵唐玉玥_202322121652.8

一种药材脱皮机_安徽亳药福泰药业有限公司_202322752517.3

一种带防撞装置的压力机工作台_扬州蔚来机械装备制造有限责任公司_202322611255.9

一种梳式烟夹的胶头自动组装设备_广州阿尔法精密机械有限公司_202322475952.6

一种打孔装置_广州市骏褀无纺布实业有限公司_202321762517.5

一种可调节车挡_自贡市城市规划设计研究院有限责任公司_202322421392.6

一种散热户外路灯灯头_中山市澳斯朗电控科技有限公司_202322819842.7

自动装盒设备_杭州永创智能设备股份有限公司_202322265646.X

一种新型加湿器_莆田市必捷电子有限公司_202322599727.3

一种便携式放线架_高炜精密电子(东莞)有限公司_202322772571.4

网络相关技术

用于标识通信网络中的网络节点的方法和通信网络_罗伯特·博世有限公司_201910574227.X

网络设备的升级_瑞典爱立信有限公司_201780096272.8

在区块链网络中验证交易的方法以及构成该网络的节点_比特飞翔区块链株式会社_201980026000.X

一种移动通信网络辅助广播网络的收发方法及其装置_上海交通大学_202210665237.6

基于多通道图卷积网络的社交网络节点分类方法与系统_扬州大学_202210353954.5

网络恢复方法、装置、设备及存储介质_北京华耀科技有限公司_202210476307.3

管理IOT网络中的数据和数据使用_勤达睿公司_202080032483.7

一种能带隙网络滤波器_南京志杰通信技术有限公司_202322522246.2

抵抗5G网络切片的侧信道攻击_微软技术许可有限责任公司_202280059705.3

一种网络数据存储服务器_南昌交通学院_202322497073.3

神经相关技术

一种基于神经网络的数据处理方法及设备_华为技术有限公司_202211277119.4

去模糊卷积神经网络训练方法、装置、设备及存储介质_清华大学_202111342163.4

一种基于模糊神经网络的自动射孔系统_电子科技大学_202310120220.7

基于多策略原型生成的低资源神经机器翻译方法_昆明理工大学_202210293213.2

一种多神经网络任务处理方法及装置_清华大学_202210741395.5

一种基于知识增强神经网络模型的讽刺检测方法及系统_广东外语外贸大学_202311374400.4

基于图神经网络的汉越跨语言观点对象识别分析方法_昆明理工大学_202210532418.1

一种基于正念冥想的神经反馈干预系统及方法_兰州大学_202111187018.3

基于多尺度卷积神经网络的恶意软件检测方法_玉溪师范学院_202010231067.1

基于TS模糊神经网络的MSWI炉膛温度预测方法_北京工业大学_201911252439.2

延迟相关技术

确定时间延迟的装置和方法_摩托罗拉移动有限责任公司_201780091639.7

用于低延迟波束选择的方法和装置_三星电子株式会社_202080055650.X

一种内窥镜视频信号延迟时间测试系统及方法_极限人工智能有限公司_202310244358.8

固井用延迟成胶堵漏凝胶及其制备方法和应用_中国石油大学(华东)_202410173321.5

用于减少集成电路上的延迟的方法_英特尔公司_201710941717.X

一种超标量延迟优化的方法_许秀权_202310518512.6

一种机床延迟式自动夹持装置_山东辰榜数控装备有限公司_202410139890.8

一种可调电延迟线_珠海天启技术有限公司_202322458804.3

一种数字延迟锁定环_无锡中微爱芯电子有限公司_201611004111.5

用于地理空间农作物产量映射的延迟管理_迪尔公司_202010931985.5

龙图腾网&IPTOP

【发明授权】一种抗辐射低延迟神经网络推理加速芯片_华中师范大学_202311798002.5

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务