【发明授权】一种数据流指令映射方法_北京中科睿芯智能计算产业研究院有限公司_201711406694.9

导航：龙图腾网> 最新专利技术> 一种数据流指令映射方法_北京中科睿芯智能计算产业研究院有限公司_201711406694.9

申请/专利权人：北京中科睿芯智能计算产业研究院有限公司

申请日：2017-12-22

公开（公告）日：2021-04-13

公开（公告）号：CN108287729B

主分类号：G06F9/38(20060101)

分类号：G06F9/38(20060101)

优先权：

专利状态码：有效-授权

法律状态：2021.04.13#授权;2018.08.21#实质审查的生效;2018.07.17#公开

摘要：本发明公开了一种数据流指令映射方法，其包括数据流图遍历子步骤和指令映射子步骤，数据流图遍历子步骤用于对数据流图中的每一节点进行遍历，指令映射子步骤用于将多个数据流指令分别映射至位于一片上网络的计算单元阵列上。本发明提供的数据流指令映射方法优化了现有的数据流指令映射方法，能够根据片上网络的拓扑结构情况和路由算法的特点，尽量使运行时的多地址共享数据路由包里的多个地址对应的PE处理单元位置在一条直线上，以降低因路由包的拆分造成片上网络拥堵情况，提高了数据流程序执行效率。

主权项：1.一种数据流指令映射方法，其特征在于，包括数据流图遍历子步骤和指令映射子步骤，数据流图遍历子步骤用于对数据流图中的每一节点进行遍历，指令映射子步骤用于将多个数据流指令分别映射至位于一片上网络的计算单元阵列上，其中：数据流图遍历子步骤：S1：采用自顶向下、由外向内的原则对数据流图中的所有节点进行编号，同时设置一队列区和一缓冲区，其中，队列区用于记录需要遍历的节点，缓冲区用于记录节点的遍历状态；S2：从数据流图中的顶点0开始，基于图宽度优先遍历的原则将顶点0的下游节点1～n的编号插入所述队列区并将其状态标记为“就绪”，当队列区的节点遍历过之后则将对应的节点编号从队列区中删除；S3：将所述队列区中的节点编号依次读入所述缓冲区并全部标记为“未遍历”状态；S4：依次对缓冲区中的节点进行遍历，将遍历过的节点标记为“已遍历”，其中，如果欲遍历的节点的上游节点存在未遍历的情况，则将该欲遍历的节点标记为“等待”状态，接着对该欲遍历的节点的后续节点进行遍历，直至遍历到一“全遍历节点”，“全遍历节点”指的是其所有上游节点均处于“已遍历”状态的节点，则暂停遍历，执行步骤S5；S5：将步骤S4中标记为“等待”状态的节点依序遍历一遍，如果处于“等待”状态的节点的所有上游节点都遍历过，则其状态修改为“就绪”；S6：遍历完所有“等待”状态的节点之后，将“全遍历节点”从所述缓冲区删除，如果此时队列区不为空则返回步骤S4，否则结束遍历过程；指令映射子步骤：S1′：按照数据流图遍历节点的顺序依序对数据流图中节点存储的指令进行映射；S2′：对于位于同一个数据流指令的下游的至少两个下游指令，在对该至少两个下游指令进行映射之前，统计计算单元阵列的当前映射状态、该至少两个下游指令的上游指令的映射位置以及该至少两个下游指令的总数目并据此将该至少两个下游指令均衡的映射至最近的计算单元上；S3′：对于位于同一个数据流指令的下游的至少两个下游指令，优先将该至少两个下游指令映射在位于同一条直线上的计算单元上；S4′：对于位于至少两个上流指令的下游的数据流指令，优先将该数据流指令映射至距离该至少两个上流指令映射位置最近的计算单元上。

全文数据：一种数据流指令映射方法技术领域[0001]本发明涉及数据流体系结构处理器优化领域，特别涉及一种利用处理器内部片上网络特点的数据流指令映射方法。背景技术[0002]随着计算机体系结构的发展，领域专用的计算机体系结构成为主要发展趋势.在面向特定应用时，专用型结构利用应用特征对结构进行相应的优化，从而更好地发挥出硬件的计算性能。在高性能计算领域，数据流计算是领域专用计算结构的一个重要分支，数据流计算表现出了较好的性能和适用性。[0003]在数据流计算模式中，程序是以数据流图来表示的。数据流计算中一个关键的问题是如何将数据流图映射到多个执行单元上。数据流指令映射需要兼顾通信延迟和并发性。在发掘程序的并行性的同时，尽量缩短指令之间的通信延迟，从而提高数据流程序的执行效率。例如在TRIPS中，程序块被分配到4X4的执行单元阵列上，每个执行单元上最多可以放置8条指令，单个程序块最大为128条指令。执行单元、缓存和寄存器堆之间通过二维网格Mesh进行通信。当一个程序块完成计算后，调度单元将下一个程序块映射到执行单元阵列上。[0004]在最新的数据流众核结构中，大量运算的操作数需要通过片上网络传递，造成片上网络上传输消息量巨大，严重影响了数据流众核片上处理器核接收消息的延迟，并且数据流众核处理器核的性能很依赖接收操作数带宽。基于以上情况出现了将传统的单地址单数据包格式改成多地址共享数据包格式，新的路由包相比于传统的数据包可以大量减少片上网络上传输消息量，从而减少片上网络传输延迟，提高数据流众核处理器核的运算吞吐量。[0005]对于现有的数据流众核结构指令映射方法，主要考虑通信延迟，互相依赖的指令应该尽量映射到较近的执行单元或同一个执行单元上;考虑并发性，互相独立的指令应该尽量映射到不同的执行单元。但是这种指令映射方法与片上网络采用的多地址共享数据路由包结构产冲突，因为多地址共享数据路由包结构在长距离传输才起到很好的作用，而以上指令映射方法采用就近原则，造成路由包过早拆分多个路由包，造成片上网络路由包数量快速增加，使片上网络产生拥堵。发明内容[0006]对于数据流程序而言，节点产生的数据会被多个其他节点使用，因此，当前的数据流结构处理器片上网络路由包大多采用多地址共享数据路由包。多地址共享数据路由包在片上网络传输时存在拆分操作，如果拆分时机不合适，将导致片上网络中产生大量路由包，造成片上网络产生拥堵，从而影响数据流程序执行效率。本发明针对上述现状提供一种数据流指令映射方法，用以提高数据流程序的执行效率和降低片上网络拥堵状况。[0007]为达到上述目的，本发明提供了一种数据流指令映射方法，其包括数据流图遍历子步骤和指令映射子步骤，数据流图遍历子步骤用于对数据流图中的每一节点进行遍历，指令映射子步骤用于将多个数据流指令分别映射至位于一片上网络的计算单元阵列上，其中：[0008]数据流图遍历子步骤：[0009]S1:采用自顶向下、由外向内的原则对数据流图中的所有节点进行编号，同时设置一队列区和一缓冲区，其中，队列区用于记录需要遍历的节点，缓冲区用于记录节点的遍历状态；[0010]S2:从数据流图中的顶点0开始，基于图宽度优先遍历的原则将顶点0的下游节点1〜n的编号插入所述队列区并将其状态标记为“就绪”，当队列区的节点遍历过之后则将对应的节点编号从队列区中删除；[0011]S3:将所述队列区中的节点编号依次读入所述缓冲区并全部标记为“未遍历”状态；[0012]S4:依次对缓冲区中的节点进行遍历，将遍历过的节点标记为“已遍历”，其中，如果欲遍历的节点的上游节点存在未遍历的情况，则将该欲遍历的节点标记为“等待”状态，接着对该欲遍历的节点的后续节点进行遍历，直至遍历到一“全遍历节点”，“全遍历节点”指的是其所有上游节点均处于“已遍历”状态的节点，则暂停遍历，执行步骤S5;[0013]S5:将步骤S4中标记为“等待”状态的节点依序遍历一遍，如果处于“等待”状态的节点的所有上游节点都遍历过，则其状态修改为“就绪”；[00M]S6:遍历完所有“等待”状态的节点之后，将“全遍历节点”从所述缓冲区删除，如果此时队列区不为空则返回步骤S4,否则结束遍历过程;。[0015]指令映射子步骤：[0016]S1:按照数据流图遍历节点的顺序依序对数据流图中节点存储的指令进行映射；[0017]S2:对于位于同一个数据流指令的下游的至少两个下游指令，在对该至少两个下游指令进行映射之前，统计计算单元阵列的当前映射状态、该至少一两个下游指令的上游指令的映射位置以及该至少两个下游指令的总数目并据此将该至少一个下游指令均衡的映射至最近的计算单元上；[0018]S3':对于位于同一个数据流指令的下游的至少两个下游指令，优先将该至少两个下游指令映射在位于同一条直线上的计算单元上；[0019]sf:对于位于至少两个上流指令的下游的数据流指令，优先将该数据流指令映射至距离该至少两个上流指令映射位置最近的计算单元上。[0020]在本发明的一实施例中，对于位于同一个数据流指令的下游的至少两个下游指令，在对该至少两个下游指令进行映射之前，记录该至少两个下游指令中每一指令的遍历状态，当该至少两个下游指令中每一指令均为“已遍历”状态时，则将该至少两个下游指令同时进行映射。[0021]在本发明的一实施例中，计算单元阵列构成一Mesh网格。[0022]本发明提供的数据流指令映射方法优化了现有的数据流指令映射方法，能够根据片上网络的拓扑结构情况和路由算法的特点，尽量使运行时的多地址共享数据路由包里的多个地址对应的PE处理单元位置在一条直线上，以降低因路由包的拆分造成片上网络拥堵情况，提高了数据流程序执行效率。附图说明[0023]为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。[0024]图1为数据流图遍历过程当前遍历到指令1;[0025]图2为数据流图遍历过程当前遍历到指令2;[0026]图3为数据流图遍历过程当前遍历到指令3;[0027]图4为数据流图遍历过程当前遍历到指令4;[0028]图5为数据流图遍历过程当前遍历到指令7;[0029]图6为数据流图遍历过程当前遍历到指令9;[0030]图7为数据流图遍历过程当前首次遍历到指令17;[0031]图8为数据流图遍历过程当前遍历到指令1〇;[0032]图9为数据流图遍历过程当前遍历到指令11;[0033]图10为数据流图遍历过程当前遍历到指令12;[0034]图11为数据流图遍历过程当前遍历到指令16;[0035]图12为数据流图遍历过程当前第二次遍历到指令17;[0036]图13为数据流图遍历过程遍历结束）；[0037]图14为数据流图中的指令映射至计算单元阵列的初始状态示意图；[0038]图15为数据流图中节点的指令与计算单元中的映射位置对应图。具体实施方式[0039]下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。[0040]本发明中的数据流图整体遍历采用了类似图广度优先遍历算法的思想，特殊的是，遍历一个节点的前提是必须该节点的源操作数产生节点必须遍历过，否则该节点遍历暂停，此时接着遍历其他节点，直到暂停遍历的节点的遍历条件满足，则解除该节点的暂停状态并对其进行遍历。本发明在遍历一节点的同时还考虑该节点的所有子节点的状态，并综合考虑子节点的状态而进行遍历。[0041]对于一条数据流指令存在多个下游指令的情况，由于这些下游指令具有共享上游指令执行结果的特性，本发明将多个下游指令同时进行映射，也就是一次性映射多条指令，这些同时映射的指令具有共同的上游指令。[0042]本发明于映射时重点考虑了“均衡”这一指标，具体指的是映射时根据片上网络拓扑结构和路由算法，将数据流图中的所有指令均衡的映射到计算单元阵列上，避免某些计算单元上指令过多和某些计算单元上指令过少的情况。[0043]除了均衡之外，本发明中的映射重点还在于使运行时的多地址共享数据路由包里的多个地址对应的PE处理单元位置在一条直线上。由于片上网络采用多地址共享数据路由包，因此一条数据流指令执行完会产生一个多地址共享数据路由包，产生的路由包里多个地址其实就是该数据流指令的所有下游指令映射到PE阵列的位置，该路由包发送给这些存储这些下游指令的计算单元上，为了优化该路由包拆分时机，防止因为路由包拆分使片上网络路由包数量激增而造成片上网络拥堵，则多地址共享数据路由包最好的拆分时机是在该路由包抵到与路由包地址相匹配的位置，也就是此路由包传输到与其中一个地址目的地处才拆分，类比工厂流水线卸货，一个包裹有多个物品，每个物品有对应目的地，最好的是该包裹一直在一条流水线上运输，且包裹有物品到达了目的地则把对应物品卸货，而不是把包裹里多个物品转到多个流水线上，然后这些物品各自到目的地卸货，这样会需要许多流水线通道，这些流水线通道也就是类似片上网络通道，一个多地址共享路由包拆分占用多个片上网络网络通道，肯定会增加片上网络压力，从而容易造成片上网络拥堵，间接影响数据流程序执行效率。[0044]本发明提供的数据流指令映射方法包括数据流图遍历子步骤和指令映射子步骤，数据流图遍历子步骤用于对数据流图中的每一节点进行遍历，指令映射子步骤用于将多个数据流指令分别映射至位于一片上网络的计算单元阵列上，其中：[0045]数据流图遍历子步骤：[0046]S1:采用自顶向下、由外向内的原则对数据流图中的所有节点进行编号，同时设置一队列区和一缓冲区，其中，队列区用于记录需要遍历的节点，缓冲区用于记录节点的遍历状态；[0047]S2:从数据流图中的顶点0开始，基于图宽度优先遍历的原则将顶点〇的下游节点i〜n的编号插入所述队列区并将其状态标记为“就绪”，当队列区的节点遍历过之后则将对应的节点编号从队列区中删除；[0048]S3:将所述队列区中的节点编号依次读入所述缓冲区并全部标记为“未遍历”状态；[0049]S4:依次对缓冲区中的节点进行遍历，将遍历过的节点标记为“己遍历”，其中，如果欲遍历的节点的上游节点存在未遍历的情况，则将该欲遍历的节点标记为“等待”状态，接着对该欲遍历的节点的后续节点进行遍历，直至遍历到一“全遍历节点”，“全遍历节点”指的是其所有上游节点均处于“己遍历”状态的节点，则暂停遍历，执行步骤S5;[0050]S5:将步骤S4中标记为“等待”状态的节点依序遍历一遍，如果处于“等待”状态的节点的所有上游节点都遍历过，则其状态修改为“就绪”；[0051]se:遍历完所有“等待”状态的节点之后，将“全遍历节点”从所述缓冲区删除，如果此时队列区不为空则返回步骤S4,否则结束遍历过程；。[0052]指令映射子步骤：[0053]S1:按照数据流图遍历节点的顺序依序对数据流图中节点存储的指令进行映射；[0054]S〗:对于位于同一个数据流指令的下游的至少两个下游指令，在对该至少两个下游指令进行映射之前，统计计算单元阵列的当前映射状态、该至少一两个下游指令的上游指令的映射位置以及该至少两个下游指令的总数目并据此将该至少一个下游指令均衡的映射至最近的计算单元上；[0055]SY:对于位于同一个数据流指令的下游的至少两个下游指令，优先将该至少两个下游指令映射在位于同一条直线上的计算单元上；[0056]S4、对于位于至少两个上流指令的下游的数据流指令，优先将该数据流指令映射至距离该至少两个上流指令映射位置最近的计算单元上。[0057]在本发明的一实施例中，对于位于同一个数据流指令的下游的至少两个下游指令，在对该至少两个下游指令进行映射之前，记录该至少两个下游指令中每一指令的遍历状态，当该至少两个下游指令中每一指令均为“已遍历”状态时，则将该至少两个下游指令同时进行映射。[0058]以下介绍本发明的一具体实施例：[0059]本实例中的计算单元阵列构成一Mesh网格，片上网络路由算法为X-Y路由，也就是先X轴路由，再Y轴路由，同时片上网络传输路由包为多地址共享数据路由包结构。[0060]数据流图遍历子步骤：[0061]步骤101:数据流图遍历起始状态如图1所示，该遍历过程有两个区域，一个为队列区，这个类似图广度优先遍历优先队列，用于记录接下需要遍历的节点，另一个为缓存区，该缓存是用于记录捆绑指令是否可以映射，“捆绑指令”指的是“位于同一个数据流指令的下游的至少两个下游指令”。该图中，起始遍历为数据流图节点1，因此队列区只存有节点1信息，且该状态为就绪状态，同时缓存区增加并初始化节点1遍历状态，该状态用于决定节点1何时可以映射；[0062]步骤102:遍历完数据流图节点1后状态如图2所示，队列区删除节点1，同时将节点1的下游节点2和3添加到队列区，并将状态初始化就绪状态，由于节点2和3的上游节点相同，则在缓存区增加并初始化节点2和3的遍历状态，同时将这两个节点组合，只有节点2和3都遍历过，才可以将节点2和3的指令同时进行映射，并且此时节点1的指令准备映射到计算单元阵列上；[0063]步骤103:遍历完数据流图节点2后状态如图3所示，队列区删除节点2,同时将节点2的下游节点4添加到队列区，并将状态初始化就绪状态，接着在缓存区增加和初始化节点4的遍历状态，此时没有指令可映射；[0064]步骤104:遍历完数据流图节点3后状态如图4所示，队列区删除节点3,同时将节点3的下游节点5添加到队列区，并将状态初始化就绪状态，接着在缓存区增加和初始化节点5的遍历状态，此时节点2和3都已遍历，则节点2和3的指令可以同时映射到计算单元阵列上；[0065]步骤105:跳过遍历节点4、5过程，遍历完数据流图节点6后状态如图5所示，队列区删除节点6,同时将节点6的下游节点7、8和9添加到队列区，并将状态初始化就绪状态，接着在缓存区增加和初始化节点7、8和9的遍历状态，跟步骤102类似，组合这三个节点，当这三个节点都遍历过，则将这些节点指令同时映射到计算单元阵列，此时节点6的指令可以准备映射；[0066]步骤106:跳过遍历节点7过程，遍历完数据流图节点8后状态如图6所示，遍历完数据流图节点9后状态如图7所示，描述与以上步骤类似。首次遍历过数据流图节点17后状态如图8所示，这个状态相比以上状态存在特殊情况，当遍历节点17时，发现节点17的上游节点16未遍历，则将队列区节点17的状态设置等待，此时缓存区节点7、8和9的指令可以映射到计算单元阵列，接下遍历则跳到节点10;[0067]步骤107:遍历完数据流图节点10后状态如图9所示，此时队列区节点17还处于等待状态，因为节点16还未遍历，跳过遍历节点17,其他操作与以上步骤类似。遍历完数据流图节点11后状态如图10所示，操作跟上面操作类似，节点17的所有状态保持不变，跳过遍历节点17;[0068]步骤108:跳过遍历节点12、13和14过程，遍历完数据流图节点15后状态如图11所示，此时队列区节点17状态还是为等待，其他操作与上述步骤类似。遍历完数据流图节点16后状态如图12所示，此时将队列区中节点16删除，因为节点17的所有上游节点都遍历过，则将节点17状态从等待修改为就绪，其他操作跟上述步骤类似；[0069]步骤109:再次遍历过节点17的状态如图13所示，队列区删除节点17,此时队列清空，数据流图遍历结束，同时缓存区节点17的指令准备映射到计算单元阵列上。[0070]以上介绍完数据流图遍历过程，接下介绍指令是如何映射到1¾阵列上，图14为数据流图中的指令映射至计算单元阵列的初始状态示意图，图15为数据流图中节点的指令与计算单元中的映射位置对应图，也即最终映射结果，请参照图14、图15来理解以下指令映射子步骤。[0071]指令映射子步骤：[0072]步骤201:节点1的指令先准备映射，则将节点1的指令映射到PE0上；[0073]步骤202:节点2和3的指令映射，分别将节点2和3的指令映射到PE1和2上，这样节点1的指令执行完发送的多地址共享数据路由包的传输路径为一条直线，该路由包传输到PE1位置时，拆分路由包，一部分通过片上网络Router连接PE1的专用通道送往PE1接收，另一部分路由包接着传输给PE2,此时片上网络公共传输通道始终只有一个路由包，不会因为拆分路由包，造成片上网络公共传输通道路由包数量增加；[0074]步骤203:节点4的指令映射，由于PE1和其连接的PE0和2都分配了指令，而PE5没有分配指令，为了PE阵列均衡映射和就近原则，则将节点4的指令映射到PE5上。节点5的指令映射与节点4的指令映射类似，由于片上网络采用X-Y路由，因此将节点5的指令映射到PE3，而非映射到PE6;[0075]步骤204:节点6的指令映射，由于节点6的上游为节点4和5,所以需要把节点的指令映射到储存节点4的指令PE5和储存节点5的指令PE3之间，这样可以减少节点6的指令等待源操作数时间，因此将节点6的指令映射到PE6上；[0076]步骤205:节点7、8和9的指令映射，因为路由包是X-Y路由和采取均衡映射策略，则将节点7、8和9的指令分别映射到PE7、PE11和PE15,这些指令在PE阵列上连成一条线；[0077]步骤206:节点10和11的指令映射类似上述步骤，因此将节点1〇和11的指令分别映射到PE10和PE9上，同样节点12和13的指令分别映射到PE14和PE13上；[0078]步骤207:节点14的指令映射，由于节点14上游有节点10和11，并且这两个节点的指令映射相邻，所以把节点14的指令映射到PE8，既满足了均衡映射，并且节点14的指令等待源操作数的时间也较短。同样节点15的指令映射到PE12上，节点ie的指令映射到PE4上；[0079]步骤208:最后节点17的指令映射，节点17的上游有节点7和16,并且节点7和16的指令映射位置有一定距离，因此需要将节点17的指令映射到节点7和16的指令映射位置中间区域，此时PE5和6都己分配一条指令，不需考虑均衡因素，则将节点17的指令映射到PE6上，数据流图所有指令映射结束，如图15所示为数据流图中节点的指令与计算单元中的映射位置对应图，也即最终映射结果，其满足负载均衡，同时也使路由包拆分更高效，降低了片上网络拥堵的可能。[0080]本发明提供的数据流指令映射方法优化了现有的数据流指令映射方法，能够根据片上网络的拓扑结构情况和路由算法的特点，尽量使运行时的多地址共享数据路由包里的多个地址对应的PE处理单元位置在一条直线上，以降低因路由包的拆分造成片上网络拥堵情况，提高了数据流程序执行效率。[0081]本领域普通技术人员可以理解：附图只是一个实施例的示意图，附图中的模块或流程并不一定是实施本发明所必须的。[0082]本领域普通技术人员可以理解:实施例中的装置中的模块可以按照实施例描述分布于实施例的装置中，也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块，也可以进一步拆分成多个子模块。[0083]最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换;f这些修改或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。

权利要求：1.一种数据流指令映射方法，其特征在于，包括数据流图遍历子步骤和指令映射子步骤，数据流图遍历子步骤用于对数据流图中的每一节点进行遍历，指令映射子步骤用于将多个数据流指令分别映射至位于一片上网络的计算单元阵列上，其中：数据流图遍历子步骤：S1:采用自顶向下、由外向内的原则对数据流图中的所有节点进行编号，同时设置一队列区和一缓冲区，其中，队列区用于记录需要遍历的节点，缓冲区用于记录节点的遍历状态；S2:从数据流图中的顶点0开始，基于图宽度优先遍历的原则将顶点〇的下游节点iwn的编号插入所述队列区并将其状态标记为“就绪”，当队列区的节点遍历过之后则将对应的节点编号从队列区中删除；S3:将所述队列区中的节点编号依次读入所述缓冲区并全部标记为“未遍历”状态；S4:依次对缓冲区中的节点进行遍历，将遍历过的节点标记为“已遍历”，其中，如果欲遍历的节点的上游节点存在未遍历的情况，则将该欲遍历的节点标记为“等待”状态，接着对该欲遍历的节点的后续节点进行遍历，直至遍历到一“全遍历节点”，“全遍历节点”指的是其所有上游节点均处于“已遍历”状态的节点，则暂停遍历，执行步骤S5;S5:将步骤S4中标记为“等待”状态的节点依序遍历一遍，如果处于“等待”状态的节点的所有上游节点都遍历过，则其状态修改为“就绪”；S6:遍历完所有“等待”状态的节点之后，将“全遍历节点”从所述缓冲区删除，如果此时队列区不为空则返回步骤S4,否则结束遍历过程；。指令映射子步骤：S1:按照数据流图遍历节点的顺序依序对数据流图中节点存储的指令进行映射；52、对于位于同一个数据流指令的下游的至少两个下游指令，在对该至少两个下游指令进行映射之前，统计计算单元阵列的当前映射状态、该至少一两个下游指令的上游指令的映射位置以及该至少两个下游指令的总数目并据此将该至少一个下游指令均衡的映射至最近的计算单元上；53、对于位于同一个数据流指令的下游的至少两个下游指令，优先将该至少两个下游指令映射在位于同一条直线上的计算单元上；S47:对于位于至少两个上流指令的下游的数据流指令，优先将该数据流指令映射至距离该至少两个上流指令映射位置最近的计算单元上。2.根据权利要求1所述的数据流指令映射方法，其特征在于，对于位于同一个数据流指令的下游的至少两个下游指令，在对该至少两个下游指令进行映射之前，记录该至少两个下游指令中每一指令的遍历状态，当该至少两个下游指令中每一指令均为“己遍历，，状态时，则将该至少两个下游指令同时进行映射。3.根据权利要求1所述的数据流指令映射方法，其特征在于，计算单元阵列构成一Mesh网格。

百度查询：北京中科睿芯智能计算产业研究院有限公司一种数据流指令映射方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种板壳式机械甲板一体化结构设计方法_中海石油(中国)有限公司_202410068810.4

下一篇：电解电容器及其温度保护电路、空调控制器及空调器_邯郸美的制冷设备有限公司_202211162130.6

相关技术

一种板壳式机械甲板一体化结构设计方法_中海石油(中国)有限公司_202410068810.4

电解电容器及其温度保护电路、空调控制器及空调器_邯郸美的制冷设备有限公司_202211162130.6

基于神经网络架构搜索的巡检影像无锚框目标检测方法_国网山东省电力公司青岛供电公司_202410060355.3

一种范围可调的煤炭工程运输用喷淋降尘装置及其使用方法_内蒙古上海庙矿业有限责任公司_202311870762.2

一次粒子有序排列的四氧化三钴及其制备方法和应用_厦门厦钨新能源材料股份有限公司_202311873287.4

一种防拉花的面料数控裁剪机_杭州弥高服饰有限公司_202410053154.0

一种用于输送线的自动取样装置_河南黄河新材料科技有限公司_202410231803.1

高通量卫星指向测量方法及业务波束标校系统_中国空间技术研究院_202410002384.4

标签融合方法、装置、电子设备以及存储介质_北京沃东天骏信息技术有限公司_202211175842.1

一种国土空间规划用地理信息勘测采集设备_武汉永业赛博能规划勘测有限公司_202410226338.2

一种连续管注气工艺管柱及其操作方法_中国石油天然气股份有限公司_202211165652.1

测试方法、装置及存储介质_抖音视界有限公司_202211180544.1

指令相关技术

指令处理方法、装置、终端设备及存储介质_深圳市元征科技股份有限公司_201911157579.1

一种基于物模型的指令下发方法、系统、设备及介质_山东浪潮新基建科技有限公司_202311580052.6

参数信息的调整及调节指令的发送方法和装置_苏州元脑智能科技有限公司_202311734884.9

配电远动指令安全监测方法、系统、设备和存储介质_国网山东省电力公司电力科学研究院_202311697334.4

一种基于语音指令的智能系统操作方法及系统_广东铭太信息科技有限公司_202410094525.X

用于资源受限制装置的数据读写方法、装置及指令集_武汉天喻信息产业股份有限公司_202111018810.6

基于指令集控制的DDR训练系统、训练方法及介质_上海安路信息科技股份有限公司_202311863153.4

有限位数的最大码距遥控指令码生成系统及方法_上海交通大学_202311139887.8

一种优先一次调频功能闭锁AGC指令的控制方法_中国大唐集团科学技术研究院有限公司西北电力试验研究院_202010004755.4

用于智能处理器的指令执行方法、装置及电子设备_中国科学院计算技术研究所_202010688860.4

映射相关技术

基于自助映射的数据处理方法和系统_浙江百应科技有限公司_202311708562.7

基于数组映射内存地址的PLC程序编译方法及装置_北京东土科技股份有限公司_202311867664.3

基于潜在空间特征提取和映射的被动非视域成像方法_中国科学技术大学_202011596477.2

基于CycleGAN的多映射电磁反演方法及系统_数据空间研究院_202311841903.8

一种基于地址映射的多通道视频数据转换方法_中国科学院长春光学精密机械与物理研究所_202311841259.4

一种基于画面映射的显示修正方法及装置_新奥新智科技有限公司_202311864365.4

一种模拟版图的数模引脚映射到数字版图的方法_珠海一微半导体股份有限公司_202011531882.6

一种基于中介相机坐标映射的联合标定方法及装置_吉林大学_202311839965.5

一种基于视频映射的显示修正方法及装置_新奥新智科技有限公司_202311864349.5

一种支持跨盘地址重映射的固态盘阵列系统_华中科技大学_202311792171.8

方法相关技术

测试方法_上海诺倬力机电科技有限公司_202311551671.2

掺杂方法_英飞凌科技股份有限公司_201811094253.4

目标对象识别方法、对象识别模型训练方法、目标对象处理方法以及信息处理方法_阿里巴巴达摩院(杭州)科技有限公司_202410217003.4

读写模型的构建方法、读写测试方法及读写时延测试方法_超聚变数字技术有限公司_202311599121.8

图像解码方法、图像编码方法、存储介质和发送方法_LG电子株式会社_202410118369.6

图像解码方法、图像编码方法、存储介质和发送方法_LG电子株式会社_202410183651.2

超声装置，其形成方法及其控制方法_南洋理工大学_201780021301.4

图像编码/解码方法和发送数据的方法_LG电子株式会社_202410003026.5

一种蜜罐搭建方法以及应用方法_杭州默安科技有限公司_202111264222.0

输送物流线及方法、托盘物流控制方法_宁德时代新能源科技股份有限公司_202410233414.2

龙图腾网&IPTOP

【发明授权】一种数据流指令映射方法_北京中科睿芯智能计算产业研究院有限公司_201711406694.9

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务