【发明授权】预测深度学习缩放_百度(美国)有限责任公司_201910654453.9

导航：龙图腾网> 最新专利技术> 预测深度学习缩放_百度(美国)有限责任公司_201910654453.9

申请/专利权人：百度(美国)有限责任公司

申请日：2019-07-19

公开（公告）日：2024-04-05

公开（公告）号：CN111260021B

主分类号：G06N3/0495

分类号：G06N3/0495;G06N3/0442;G06N3/0464;G06N3/0455;G06N3/084;G06N3/0985;G06V10/764;G06V10/82;G06F40/58;G10L25/30

优先权：["20181130 US 16/206,910"]

专利状态码：有效-授权

法律状态：2024.04.05#授权;2020.07.03#实质审查的生效;2020.06.09#公开

摘要：随着深度学习应用领域增长，更深入地理解训练集大小、计算规模和模型准确度改善之间的关系是非常有益的。本文呈现了随着训练集增长的误差和模型大小增长的大规模经验研究。本文介绍了用于这种测量的方法的实施方式以及用于预测诸如计算相关度量等其它度量的实施方式。本文示出了幂律可以用于表示深层模型关系，诸如误差和训练数据大小。还示出了模型大小随数据大小亚线性地缩放。这些缩放关系对深度学习研究、实践和系统具有重要影响。它们可以帮助模型调试、设置准确度目标和决定数据集增长。它们还可以引导计算系统设计并且强调持续计算缩放的重要性。

主权项：1.一种用于生成学习曲线以帮助预测深度学习模型的度量的计算机实施方法，所述方法包括：将数据集划分成一组分片，使得分片大小跨越多个数量级，其中所述数据集包括应用于神经机器翻译、语言建模、图像分类和语音识别中的至少之一的数据；在来自所述一组分片的每个分片上训练一组模型候选者，其中所述一组模型候选者内的模型在架构、超参数或两者方面不同；使用验证集来从所训练的一组模型候选者当中识别用于每个分片的最佳模型，其中每个最佳模型针对该分片具有对应验证准确度，所述最佳模型具有分片大小；使用针对所述分片选择的所述最佳模型的所述对应验证准确度和分片大小拟合幂律学习曲线模型；以及使用所拟合的幂律学习曲线来预测与深度学习模型相关联的度量。

全文数据：

权利要求：

百度查询：百度(美国)有限责任公司预测深度学习缩放

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种打印机线路板加工用吸附输送轨道_威海光大光电有限公司_202322481598.8

下一篇：一种LED线性地埋灯_上海科铃纳光电科技有限公司_202322244017.9

相关技术

一种打印机线路板加工用吸附输送轨道_威海光大光电有限公司_202322481598.8

一种LED线性地埋灯_上海科铃纳光电科技有限公司_202322244017.9

一种组合式高低压配电柜_靖江市靖开电力电器有限公司_202322564432.2

一种具备快接功能的汽车线束_天津博尔特科技有限公司_202322504460.5

一种钻井液生产粉尘收集装置_新乡市隆驰化学有限责任公司_202322388957.5

一种籽晶自动熔接结构_四川永祥光伏科技有限公司_202322431204.8

一种玉米种植用病虫害防治装置_黄金双_202322446508.1

电池壳清洗用旋转框架安装槽的限位结构_无锡金杨丸伊电子有限公司_202322328357.X

一种大米加工砂辊碾米机_湖北九龙湖米业有限公司_202322482168.8

一种轴承游隙检测装置_无锡凌拓智能装备有限公司_202322468779.7

整形压块及焊接装置_宁德时代新能源科技股份有限公司_202321970130.9

一种文旦柚栽培用的施肥装置_莆田冠腾科技有限公司_202322446584.2

龙图腾网&IPTOP

【发明授权】预测深度学习缩放_百度(美国)有限责任公司_201910654453.9

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务