买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种多神经网络任务处理方法及装置_清华大学_202210741395.5 

申请/专利权人:清华大学

申请日:2022-06-27

公开(公告)日:2024-04-23

公开(公告)号:CN115098262B

主分类号:G06F9/50

分类号:G06F9/50;G06N3/045;G06N3/063

优先权:

专利状态码:有效-授权

法律状态:2024.04.23#授权;2022.10.14#实质审查的生效;2022.09.23#公开

摘要:本公开涉及一种多神经网络任务处理方法及装置,所述方法包括获取计算图集;针对任意一个计算图,将所述计算图包括的多个顶点划分为多个顶点块,所述多个顶点块之间存在先后执行顺序,任意一个顶点块中的顶点不基于执行顺序在本顶点块之后的顶点块中的顶点的执行结果,任意一个顶点块能够由众核芯片中的一个计算核执行;在满足第一预设条件的情况下,将第一计算图中的第一顶点块与第二计算图中的第二顶点块映射到所述众核芯片的同一个计算核中;基于各个计算图中每个顶点块与所述众核芯片的多个计算核之间的映射关系,生成所述众核芯片的配置文件。本公开实施例可提升硬件资源利用率以及提高执行任务的效率。

主权项:1.一种多神经网络任务的处理方法,其特征在于,所述方法包括:获取计算图集,所述计算图集中包括多个计算图,每个计算图代表一个神经网络计算任务,每个计算图包括多个顶点,每个顶点对应一个或多个原语;针对任意一个计算图,将所述计算图包括的多个顶点划分为多个顶点块,所述多个顶点块之间存在先后执行顺序,任意一个顶点块中的顶点不基于执行顺序在本顶点块之后的顶点块中的顶点的执行结果,任意一个顶点块能够由众核芯片中的一个计算核执行;在满足第一预设条件的情况下,将第一计算图中的第一顶点块与第二计算图中的第二顶点块映射到所述众核芯片的同一个计算核中,所述第一计算图表示所述多个计算图中的任意一个计算图,所述第二计算图表示所述多个计算图中除所述第一计算图以外的任意一个计算图;基于各个计算图中每个顶点块与所述众核芯片的多个计算核之间的映射关系,生成所述众核芯片的配置文件,所述配置文件用于指示所述众核芯片中各计算核执行的原语以及执行原语的顺序;所述将所述计算图包括的多个顶点划分为多个顶点块,包括:将所述计算图包括的多个顶点中处于一个循环上的顶点划分至一个顶点块中;基于所述计算图中顶点的执行顺序,遍历所述计算图包括的多个顶点中未被划分至顶点块的顶点;针对当前遍历到的目标顶点:在存在与所述目标顶点连接的第三顶点块且所述目标顶点的计算量与所述第三顶点块的计算量之和小于或者等于第一阈值的情况下,将所述目标顶点划分至所述第三顶点块中;在不存在与所述目标顶点连接的第三顶点块或者存在所述与所述目标顶点连接的第三顶点块但目标顶点的计算量与所述第三顶点块的计算量之和大于所述第一阈值的情况下,创建第四顶点块,并将所述目标顶点划分至所述第四顶点块中;根据所述众核芯片中一个计算核的内存,确定所述第一阈值;所述满足第一预设条件包括:第一运行时间小于第二运行时间,所述第一运行时间表示在所述第一顶点块与所述第二顶点块共享计算核的情况下所述众核芯片完成所述多神经网络任务的时间,所述第二运行时间表示在所述第一顶点块与所述第二顶点块映射到不同计算核的情况下所述众核芯片完成所述多神经网络任务的时间;或者,所述第一运行时间小于所述第二运行时间,且在将所述第一顶点块与所述第二顶点块映射到所述众核芯片的同一个计算核后,优化计时器未达到优化时间阈值,其中,所述优化计时器以第一次判断是否满足第一预设条件的时刻为起始时刻;从所述计算图集中随机选取第一计算图和第二计算图;将当前时刻所述众核芯片完成所述多神经网络任务的时间,确定为所述第二运行时间;在所述第一计算图中的第一顶点块与所述第二计算图中的第二顶点块能够共享一个计算核资源,且所述第一顶点块对应的部分原语与所述第二顶点块对应的部分原语之间不存在数据依赖,则调整所述第一顶点块与所述第二顶点块对应的原语参数和原语顺序;将调整后所述众核芯片完成所述多神经网络任务的时间,确定为所述第一运行时间。

全文数据:

权利要求:

百度查询: 清华大学 一种多神经网络任务处理方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。