买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种申威众核处理器从核簇加速并行方法、设备及介质_山东省计算中心(国家超级计算济南中心);齐鲁工业大学(山东省科学院)_202311829650.2 

申请/专利权人:山东省计算中心(国家超级计算济南中心);齐鲁工业大学(山东省科学院)

申请日:2023-12-28

公开(公告)日:2024-03-26

公开(公告)号:CN117472448B

主分类号:G06F9/38

分类号:G06F9/38;G06F15/163

优先权:

专利状态码:有效-授权

法律状态:2024.03.26#授权;2024.02.20#实质审查的生效;2024.01.30#公开

摘要:本发明涉及一种申威众核处理器从核簇加速并行方法、设备及介质,属于电子信息技术领域;包括:应用程序优化阶段:对应用程序进行优化;输入导入阶段:将各从核所需的输入条件从主存储器传入LDM连续共享空间;计算与RMA传输阶段:计算从核即刻开始执行计算任务;从核将计算结果传输到主存储器时,由汇总从核将计算结果读取到本地LDM;汇总与整理阶段:汇总从核读取完计算从核此时的计算结果后进行整理;DMA传输阶段:将计算结果传输至主存储器中;重复执行上述阶段直到当前迭代次数达到预先设定的迭代总次数。本发明提供了适合处理以上情况的多种优化方法,拥有明显的加速效果,减少了使用难度,提高了用户体验。

主权项:1.一种申威众核处理器从核簇加速并行方法,其特征在于,包括:应用程序优化阶段:根据应用程序在从核上的任务设计,选择优化方法对应用程序进行优化;输入导入阶段:将各从核所需的输入条件从主存储器传入LDM连续共享空间;计算与RMA传输阶段:在接收到输入条件之后,计算从核即刻开始执行计算任务;待应用程序迭代若干次,从核需要将此时的计算结果传输到主存储器时,由汇总从核将计算结果读取到本地LDM;汇总与整理阶段:汇总从核读取完计算从核此时的计算结果后,进行数据分类和数据存储;DMA传输阶段:由各汇总从核整理完计算结果后,再将计算结果传输至主存储器中合适的位置;合适的位置是指在主存储器上为存储计算结果而开辟的地址空间;重复执行上述输入导入阶段、计算与RMA传输阶段、汇总与整理阶段及DMA传输阶段,直到当前迭代次数达到预先设定的迭代总次数;根据应用程序在从核上的任务设计,选择优化方法对应用程序进行优化;包括:假设应用程序以N个从核为单位来进行数据交换与共享从而协作完成某一种工作或实现某一项功能;当1≤N≤3时,选择单簇模式来对应用程序进行优化;单簇模式是指基于从核簇的连续共享机制,以单簇为单位,根据应用程序的特点对应用程序在从核上重新合理分配;当4≤N≤7时,选择双簇模式来对应用程序进行优化;双簇模式是指基于从核簇的连续共享机制,以双簇为单位,根据应用程序的特点对应用程序在从核上重新合理分配;当8≤N≤15时,选择四簇模式来对应用程序进行优化;四簇模式是指基于从核簇的连续共享机制,以四簇为单位,根据应用程序的特点对应用程序在从核上重新合理分配;当16≤N≤64时,选择全阵列簇模式来对应用程序进行优化;全阵列簇模式是指基于从核簇的连续共享机制,以全体从核簇为单位,根据应用程序的特点对应用程序在从核上重新合理分配。

全文数据:

权利要求:

百度查询: 山东省计算中心(国家超级计算济南中心);齐鲁工业大学(山东省科学院) 一种申威众核处理器从核簇加速并行方法、设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。