【发明授权】降低神经网络推理所需内存占用量的重计算方法和系统_之江实验室_202311278523.8

导航：龙图腾网> 最新专利技术> 降低神经网络推理所需内存占用量的重计算方法和系统_之江实验室_202311278523.8

申请/专利权人：之江实验室

申请日：2023-10-07

公开（公告）日：2024-03-12

公开（公告）号：CN117009093B

主分类号：G06F9/50

分类号：G06F9/50;G06N5/04;G06N3/063

优先权：

专利状态码：有效-授权

法律状态：2024.03.12#授权;2023.11.24#实质审查的生效;2023.11.07#公开

摘要：降低神经网络推理所需内存占用量的重计算方法和系统，包括：通过神经网络模型的计算图构建有向无环图；基于有向无环图，获得重计算对集合；对重计算对集合进行幂集操作。根据幂集中的每一个元素,对图进行附加属性得到对应的图；基于图,进行涉及重计算策略的调度算法；在全部的调度结果中，选择内存占用量最低的调度。在边缘设备智能性的需求逐渐加重的背景下，边缘设备的运行内存十分宝贵的场景下，本发明以增加额外计算代价的方式获得神经网络推理时更小的内存占用量，对边缘智能的普适性有着贡献。

主权项：1.降低神经网络推理所需内存占用量的重计算方法，包括以下步骤：（1）通过神经网络模型的计算图构建有向无环图；（2）基于有向无环图，获得重计算对集合；所述的获得重计算对集合包括以下子步骤：（2.1）获得图中所有分支算子构成的集合，当一个算子的输出张量被大于1个算子使用时被叫做分支算子；（2.2）定义单链为图中的一条线性节点构成的结构，除最后一个节点外其余的节点的入度和出度都为1；（2.3）对于该集合中的每个分支算子，寻找所有满足第一个节点的输入张量的内存占用量小于分支算子的输出张量内存占用量的单链；设的输出张量为,单链的第一个节点的输入张量为,获得重计算对为,重计算路径为；由所有获得的重计算对和相应的单链构成重计算表；（3）对重计算对集合进行幂集操作，根据幂集中的每一个元素,对图附加属性得到对应的图；所述的根据幂集中的每一个元素,对图附加属性得到图，通过以下子步骤来实现的：（3.1）对图中每个张量，设置属性为以该张量为输入的算子个数；（3.2）对中的每一对重计算,设置的属性为真，设置的属性为真；对中所有算子的输入张量的值增加以为输入张量的算子数-1；（3.3）对于，除去第一个算子，其余算子的输入张量的属性设置为真；（3.4）基于上述步骤，得到元素对应的图；（4）基于图进行涉及重计算策略的调度算法，在全部的调度结果中，选择内存占用量最低的调度，具体包括以下子步骤：（4.1）对于一个,初始为[],为的输入张量，为,为预设最大值，为图当前属性的编码，状态表；所提的编码操作为：将此时刻在中的张量编号，和每个张量的属性记录下来，构成一个元组；编码的结果,称为一个状态，作为状态表的键；（4.2）获得中的所有项，清空状态表；（4.3）对于所有项中的每一项,对该的键进行解码；所提的解码操作为：由编码操作产生的元组，还原得到该状态下和每个张量的属性；（4.4）基于还原后的值和获得下一步执行算子的备选集合；此处的获得方法：除去在内存中的张量，剩余算子中入度为0的算子；同时该算子的输出张量不应与在中的张量相同，且输出张量的属性不为0；（4.5）如果集合为空，则说明该状态已经完成一次推理，此时进行判断若小于,更新；（4.6）若集合不为空，则说明该状态输出一次推理的中间过程；对于集合中的每一个算子：，的输出张量；（4.7）对的输入张量进行判断是否可以释放：对的每一个输入张量的属性-1，如果的所有属性都不为真且属性为0、或的属性为真、或属性为真、或的属性为真且属性为0，则可释放该的内存占用；，并从移除；对新的属性进行编码，得到；（4.8）判断是否在中，若在则判断与的值，若小于即更新该项；若不在中，则在中添加该状态；恢复子步骤（4.3）中解码的状态，重复子步骤4.6至子步骤（4.8）直至每一个都执行完毕；（4.9）如果为空，得到的为最小的内存占用量，为涉及重计算的相应的最优调度；若不为空，则重复子步骤4.2至子步骤4.9的过程；（4.10）在每个的调度结果中，选择值最小对应的作为该模型的推理时的调度。

全文数据：

权利要求：

百度查询：之江实验室降低神经网络推理所需内存占用量的重计算方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种环保型水处理设备_南京云涧环境科技有限公司_202322651322.X

下一篇：一种纺织纱线缠绕架_江苏金銮纺织科技股份有限公司_202322120043.0

相关技术

一种环保型水处理设备_南京云涧环境科技有限公司_202322651322.X

一种纺织纱线缠绕架_江苏金銮纺织科技股份有限公司_202322120043.0

一种洗涤设备_重庆海尔洗衣机有限公司_202321535727.0

配备可拆固定式导纸嘴的打印装置_长城信息股份有限公司_202322616485.4

一种精密小磨床用物料固定装置_昆山法尔霆机电科技有限公司_202322612017.X

一种新型带束层鼓防错灯标装置_赛轮(沈阳)轮胎有限公司_202322401683.9

一种特殊持力层道路施工结构_中建六局土木工程有限公司_202023112178.5

一种园林绿化便携铲_马丽丽_202322375183.2

一种无缝钢管送料设备_宁波东进钢管有限公司_202322167126.5

电子设备_深圳市嘉晋实业有限公司_202322601396.2

再生废液处理系统_山东荣信集团有限公司_202322260404.1

一种英语听力训练用耳机_大同师范高等专科学校_202322527447.1

所需相关技术

光子计数激光雷达识别信号所需的累计次数的估计方法_中国海洋大学_202311328436.9

考虑城市职能区的电动汽车所需充电量预测方法和装置_国电南瑞南京控制系统有限公司_202011093997.1

用于数据收发控制所需时间同步的同步系统_神云科技股份有限公司_202211408987.1

喷涂设备和相关的具有所需喷涂剂的量的仿真的操作方法_杜尔系统股份公司_202380013257.8

索-悬链线拱联合结构所需索的最小截面面积确定方法_广西北投交通养护科技集团有限公司_202311748153.X

用于在置于患者体内之前确定在插入部位与目标定位之间延伸所需的导管长度的系统_巴德阿克塞斯系统股份有限公司_202311239753.3

一种用于生产CA199蛋白的细胞复苏时所需要的恒温水浴锅_南京珀尔泰生物技术有限公司_202322264099.3

用于确定执行代码段所需的资源的方法、设备和程序产品_伊姆西IP控股有限责任公司_201910323600.4

一种同步测量牙齿拥挤度及整平Spee曲线所需间隙的方法_上海隐齐齿科科技有限公司_202210686778.7

制动钳所需液量测试方法及系统_中国第一汽车股份有限公司_202111383700.X

量相关技术

冷量自利用半导体致冷除湿机_香河汇文节能科技有限公司_202322666428.7

贴片电阻绝缘耐压量测实验装置_丽智电子(南通)有限公司_202322162053.0

一种亚麻播种的播种量调节装置_浙江省园林植物与花卉研究所(浙江省萧山棉麻研究所)_202322362161.2

一种低掺量厂拌热再生拌合楼_贵州省公路建设养护集团有限公司_202322517746.7

一种低开挖量且施工快速的拦蓄坝施工方法_北京城建道桥建设集团有限公司_202311150943.8

量测数据压缩采集方法及系统、电子设备、存储介质_国网湖南省电力有限公司_202310440393.7

多区块链间轻量通讯协定装置及方法_香港应用科技研究院有限公司_202080004568.4

运用在车床上用于测量工件轮廓的量测系统_林彦均_202322105374.7

一种供液量自动调节的气雾生成装置_深圳市康唯普科技有限公司_202311752975.5

一种估算乘用车颗粒捕捉器累碳量的系统及方法_神龙汽车有限公司_202210247875.6

占用相关技术

基于GPU占用资源特点的动态匹配方法、系统和设备_和美(深圳)信息技术股份有限公司_202011443445.9

用于自动和辅助停车的基于占用的停车对齐_通用汽车环球科技运作有限责任公司_202310540605.9

一种基于CMOS兼容并降低片内面积占用的光电耦合器_中山大学_202410064535.9

一种避免过多占用网络资源的TCP扫描方法_徐正_202311757124.X

免许可频谱中的随机接入和PUCCH的增强的信道占用共享机制_瑞典爱立信有限公司_201980081547.X

降低对外网资源占用的方法、装置、电子设备和存储介质_奇安信网神信息技术(北京)股份有限公司_202011545176.7

一种检测垫子、用于确定电容的系统、用于确定座椅的电容或占用状态的方法、用于检测座椅上乘员的躯干的一部分的旋转的方法_佛吉亚汽车座椅公司_202311319373.0

土地征占用分析方法、装置、电子设备和存储介质_安徽省大数据中心_202410142258.9

一种仪器仪表占用带宽的校准系统及方法_中国信息通信研究院_202210623459.1

基于射频识别的占用检查方法及系统_通号城市轨道交通技术有限公司_202210039388.0

龙图腾网&IPTOP

【发明授权】降低神经网络推理所需内存占用量的重计算方法和系统_之江实验室_202311278523.8

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务