【发明授权】一种动态调整Batch-size的神经网络分布式训练方法_四川大学_202010561810.X

导航：龙图腾网> 最新专利技术> 一种动态调整Batch-size的神经网络分布式训练方法_四川大学_202010561810.X

申请/专利权人：四川大学

申请日：2020-06-18

公开（公告）日：2022-07-01

公开（公告）号：CN111507474B

主分类号：G06N3/08

分类号：G06N3/08;G06N3/063;G06N3/04;G06K9/62

优先权：

专利状态码：有效-授权

法律状态：2022.07.01#授权;2020.09.01#实质审查的生效;2020.08.07#公开

摘要：本发明公开了一种动态调整Batch‑size的神经网络分布式训练方法，涉及计算机神经网络分布式训练技术领域，该方法从处理训练数据集的角度出发，对于分布式集群中的每一计算节点，根据其计算力，动态调整Batch‑size和子数据集的划分。从而实现分布式训练集群的负载均衡处理。动态调整Batch‑size的分布式神经网络训练方法不仅可以充分利用各个计算节点的计算能力，还能保证各个计算节点完成本地数据集训练的时间大致相同，从而减少集群的同步开销，提高神经网络分布式训练效率，减少神经网络训练时间。

主权项：1.一种动态调整Batch-size的神经网络分布式训练方法，其特征在于，包括以下步骤：S1、各计算节点获取参数初始化后的神经网络；S2、对于每一计算节点，根据其计算力，动态调整Batch-size，根据集群训练集样本和调整后的Batch-size，划分得到子数据样本集；S3、对于每一计算节点，将其本地的子数据样本集划分为若干个训练批次样本集；S4、对于每一计算节点，获取其一未使用过的训练批次样本集对本地神经网络进行训练，得到本地神经网络训练好的梯度；S5、收集所有计算节点本地神经网络训练好的梯度；S6、根据所有训练好的梯度和当前的神经网络参数，计算出新神经网络参数；S7、将新神经网络参数分发至各计算节点，若所有计算节点的训练批次样本集均使用过，则当前epoch的神经网络分布式训练结束，跳转至步骤S8，否则跳转至步骤S4；S8、若当前的epoch次数等于epochsize，则神经网络分布式训练结束，否则跳转至骤S2；所述步骤S2中，若当前epoch是第一个训练周期，则设定各计算节点的计算力相同，各计算节点的Batch-size和子数据样本集均采用均分的方式得到，若当前epoch不是第一个训练周期，则按照如下方法划分得到子数据样本集，具体为：S21、评估计算节点的计算力；S22、根据计算力的强弱，动态调整计算节点的Batch-size；S23、对调整后的Batch-size取整；S24、根据集群训练集样本以及取整后的Batch-size，动态划分得到子数据样本集；所述步骤S21具体包括：设计算节点i上一个epoch的训练时间为子数据样本集的样本数量为根据公式得到计算节点i当前的计算力；其中，i表示计算节点的编号，j表示epoch次数，1＜j≤epochsize，表示计算节点i当前的计算力；所述步骤S22具体包括：设整个分布式训练中集群保持不变的Batch-size为B；对于计算节点i，设其Batch-size为占B的比例为其下一次迭代的训练时间为T，则有将公式2代入公式1中，得到将T代入公式2中，则有：根据公式计算得到计算节点i的Batch-size；所述步骤S23具体包括：设取整后的Batchsize为则有为满足公式4，对向下取整，则有实际计算出来的Batch-size和B差距表达为：为了满足公式5，对Batch-size的集合Bj+1取小数位数值进行降序排序：表示Bj+1的小数部分；从中选出前m个数的序号：id1,id2…idm,m≤k，将小数位的值大于0.5的向上取整，得到取整后的Batch-size集合：所述步骤S24具体包括：对所有计算节点的Batch-size进行归一化后，根据公式计算各计算节点的数据样本划分比例设集群训练集样本数量为D，则各计算节点的子数据样本数量为：根据该数量从集群训练集样本中划分得到各计算节点的子数据样本集；各计算节点从集群中的调度节点获取神经网络，且通过调度节点为各计算节点划分子数据样本集，以及通过调度节点向各计算节点分发新神经网络参数。

全文数据：

权利要求：

百度查询：四川大学一种动态调整Batch-size的神经网络分布式训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：消除褶皱的主动抚平联动印花结构及一种针织面料印花机_广东七彩飞霞针织实业有限公司_202410422843.4

下一篇：用于超高吞吐量增材制造的系统、方法及材料_沃尔特·沃伊特_202410278997.0

相关技术

消除褶皱的主动抚平联动印花结构及一种针织面料印花机_广东七彩飞霞针织实业有限公司_202410422843.4

用于超高吞吐量增材制造的系统、方法及材料_沃尔特·沃伊特_202410278997.0

一种肌酐检测试剂盒及方法_北京利德曼生化股份有限公司_202410244571.3

一种二维材料负载单原子层贵金属催化剂的制备方法_南京工业大学_202410293812.3

一种海洋潮汐高利用率的发电机构_东明县国土空间规划服务中心_202410218271.8

一种互层结构的膨胀土地基膨胀变形计算方法_西南交通大学_202410416436.2

数据回传方法、装置、设备及介质_深圳华锐分布式技术股份有限公司_202410426468.0

一种有序充电控制方法、系统、设备及程序产品_中科聚(北京)能源科技有限公司_202410250137.6

一种AMT离合器分离正时控制方法_中国重汽集团济南动力有限公司_202410244327.7

便于检修的计算机硬件固定框_西安途畅网络科技有限公司_202211403907.3

基于AI视觉技术的急诊主动分诊方法及系统_深圳鼎文昇科技有限公司_202410231853.X

一种打磨姿态可调节的打磨装置_广东启新模具有限公司_202410424286.X

Batch-size相关技术

一种NVME设备的IO size调优方法及相关设备_成都芯忆联信息技术有限公司_202311777168.9

基于CURE聚类的Batch-Lasso短期光伏功率预测方法_南京工程学院_202311561053.6

一种基于Mini-batch梯度下降法的3D寄生参数的优化方法_青岛展诚科技有限公司_202311322560.4

一种用于执行batch normalization运算的装置和方法_中科寒武纪科技股份有限公司_202010617696.8

一种基于spring batch框架的异步解析代发文件的方法及系统_中国农业银行股份有限公司四川省分行_202311419157.3

基于Spring Batch的地理实体编码方法及系统_浪潮软件科技有限公司_202311316298.2

基于Batch-OT的隐私集合求交方法、系统、电子设备及介质_拓尔思天行网安信息技术有限责任公司_202210659188.5

基于Batch-OT的数据传输方法、装置、设备、介质和产品_拓尔思天行网安信息技术有限责任公司_202210535843.6

一种基于Mini-batch梯度下降法的3D寄生参数的优化方法_青岛展诚科技有限公司_202311322560.4

一种用于Size3型ICU测试的转接工具_中船海洋动力技术服务有限公司_202122991298.5

神经相关技术

主动神经探测系统_复旦大学附属华山医院_202410268962.9

一种基于脉冲神经网络的神经系统信号处理方法_南京宁麒智能计算芯片研究院有限公司_202410141665.8

神经电极组件及其制备方法_武汉衷华脑机融合科技发展有限公司_202311821418.4

术中神经影像识别系统_广州汉思医疗科技有限公司_202410285364.2

一种脊髓神经刺激装置_安徽医科大学第二附属医院_202321959830.8

一种诱导神经再生的新型双层神经引导导管及其制备方法_信阳师范学院_202410188230.9

神经网络控制器和神经网络控制器的学习方法_三菱电机株式会社_202180101415.6

生成对抗神经网络辅助的视频重建_辉达公司_202110178888.8

用于治疗神经病变的基因疗法及其应用_科辉智药(深圳)新药研究中心有限公司_202311039041.7

一种神经护理用引导装置_湖南省药品审核查验中心_202322054033.1

网络相关技术

网络设备安装_极进网络公司_202410166218.8

多网络探测_苹果公司_201911369411.7

一种网络机箱_佛山市顺德区四方板业科技有限公司_201810009492.9

多重网络攻击下的非线性网络自适应模糊控制系统_东北石油大学_202410159525.3

具备网络资产测绘功能的终端网络准入控制系统_淮安市第三人民医院_202410241517.3

基于双网络边缘计算的卫星网络计算卸载优化方法_哈尔滨工业大学_202410115108.9

基于二值神经网络的快速目标检测网络、训练及应用方法_西北工业大学_202410091902.4

基于网络地图的新一代网络管理系统及方法_清华大学_202410315387.3

通讯网络及在通讯网络中验证服务请求的方法_纬创资通股份有限公司_202310243720.X

变电站网络设备接入认证方法及其系统、芯片、网络设备_深圳市国电科技通信有限公司_202210416687.1

龙图腾网&IPTOP

【发明授权】一种动态调整Batch-size的神经网络分布式训练方法_四川大学_202010561810.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务