申请/专利权人:北京华捷艾米科技有限公司
申请日:2019-09-03
公开(公告)日:2019-11-29
公开(公告)号:CN110516817A
主分类号:G06N20/00(20190101)
分类号:G06N20/00(20190101);G06F9/50(20060101)
优先权:
专利状态码:失效-发明专利申请公布后的驳回
法律状态:2023.03.24#发明专利申请公布后的驳回;2019.12.24#实质审查的生效;2019.11.29#公开
摘要:本申请提出一种模型训练数据加载方法及装置,该方法包括:获取训练数据集;循环执行以下处理,直到到达预设的循环次数:从所述训练数据集中读取设定数量的数据文件,得到数据文件列表;其中,所述设定数量为当前内存资源所能加载的最大的文件数量;将所述数据文件列表所对应的文件加载到内存;调用预设的训练接口函数从所述内存中读取数据文件进行模型训练。上述处理过程可以最大化每次加载数据文件的数据量,从而减少数据加载次数,因此可以最大化CPU的数据读取效率,同时减少CPU与GPU的数据读取交互次数,从而可以使GPU更稳定地执行模型训练,提高模型训练效率。
主权项:1.一种模型训练数据加载方法,其特征在于,包括:获取训练数据集;循环执行以下处理,直到到达预设的循环次数:从所述训练数据集中读取设定数量的数据文件,得到数据文件列表;其中,所述设定数量为CPU当前的内存资源所能加载的最大的文件数量;将所述数据文件列表所对应的文件加载到内存;调用预设的训练接口函数从所述内存中读取数据文件进行模型训练。
全文数据:
权利要求:
百度查询: 北京华捷艾米科技有限公司 一种模型训练数据加载方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。