1.一种用于消除存储访问拥塞的同构计算任务分组方法,其特征在于,包括如下步骤:
1)设置并行执行的同构计算任务数n1=处理器核最多能够支持的硬件线程数;设置预期并行收益pb_exp=1;
2)设置n2=2×n1;然后分别以n1个同构计算任务和n2个同构计算任务并行执行应用,记录并行执行的同构计算任务数为n1时的运行时间为T1,并行执行的同构计算任务数为n2时的运行时间为T2;
3)利用并行执行的同构计算任务数为n1时的运行时间T1以及并行执行的同构计算任务数为n2时的运行时间T2得到实际并行收益为pb_real,且pb_real=T1/T2,若pb_real>2,则将n2的值赋值给n1,返回步骤2);否则转入步骤4);
4)若pb_real≥pb_exp-Δ,则将n2的值赋值给n1,将pb_real的值赋值给pb_exp,返回步骤2);否则,将n1作为一个分组中最多能够包括的同构计算任务数,其中,Δ=表示可容忍的实际并行收益低于预期并行收益的最大幅度;
5)利用一个分组中最多能够包括的同构计算任务数对所有等待执行的同构计算任务进行分组,每间隔Τs时间,顺序的将一个分组内的同构计算任务映射到对应的处理器核上开始执行任务;其中,Ts是所有同构计算任务访存区域的平均执行时间。
2.根据权利要求1用于消除存储访问拥塞的同构计算任务分组方法,其特征在TM
于:所述的步骤4)中,对于Intel Phi 众核处理器以及Phoenix++运行时系统,Ts为
0ms≤Ts≤100ms;对于由计算密集型同构计算任务组成的分组,Ts=100ms;对于由其它类型的同构计算任务组成的分组,Ts<100ms。
3.根据权利要求1用于消除存储访问拥塞的同构计算任务分组方法,其特征在于:所述的步骤4)中,Δ=0.1。