批处理中任务并行附加值附加值

2014年3月20日

到,我们,我们在混合建模系列博客中没有一事事,当是是是我们计算计算增加更更多计算计算资源资源资源时时时时时多多多多多多多多多更多多多多更更更更更更更更更更更更更更更更更更多多使用c188金宝搏优惠omsol软件软件批处理扫描选项。是一个,,易并行计算功能,可可极限提高。。

Amdahl定律和gustafson-barsis定律

我们之前过如何通过计算来提高是基于算法的(在这这篇文章文章将将将进程,但但计算也是是线程)。一个严格的串行算法,像计算斐波那酸数列元素元素,完全完全从中,而,而并行算法,如加法,可以利用向元素多处理器。实际中的大多数算法算法介于这这两两

为了分析可能最大加速,我们加速加速它由一小部分完全完全并行化行化行化的和一小小部分部分严格严格严格串行化串行化\ varphi的,其中,,,\ varphi是介于(包括)0和1之间之间一数字这自动着我们的算法一个等于等于等于(1- \ varphi)的串行代码。

P p个活动的时间t(p),p = 1开始,我们,我们可以使用表达式t(1)= t(1)\ cdot(\ varphi +(1- \ varphi))P p个进程时,代码代码受受影响影响影响影响,但但受影响影响影响并并行化行化的的代码代码代码计算计算计算速度速度将将将提高提高提高提高提高t(p)= t(1)\ cdot(\ varphi / p +(1 - \ varphi)),加速度为s(p):= = t(1)/t(p)= 1/(\ varphi/p+(1- \ varphi))

Amdahl定律

这个表达式是Amdahl定律的核心对于不同的值\ varphip绘制图s(p),我们我们下图看到有趣的。。

增加进程数加速
为可行化的部分增加进程的加速比。

对于100%并代码,极限是的。然而,我们,我们发现对于对于对于\ varphi <1,渐渐或最大加速为为s_ {max}(\ varphi):= \ lim_ {p \ to \ infty} s(p)= 1/(1- \ varphi)

对于95%并的代码,我们我们发现发现s_ {max}(0.95)= 20,即使我们的进程,最大加速进程也是是是倍倍s_ {max}(0.9)= 10,,,,s_ {max}(0.75)= 4,和s_ {max}(0.5)= 2。当行化的比例,理论时时时比会下降下降。

但不现在放弃家!

Gustafson-barsis定律

Amdahl定律没有考虑事事((((())的的。这是是Gustafson-barsis定律的全部它这样个个,即即计算的问题的的规模随着可用进程增加增加增加增加

amdahl定律问题大小固定的的处理器处理器时时时时时时时时时处理器处理器处理器的是最初由较少少数量数量数量的的进程处理处理的部分部分问题进程的全部能力,因为最终它们能够处理的问题大小达到了下限。然而,假设问题的大小随着添加的进程数量的增加而增加,那么我们就将所有进程利用到假设的水平,并且执行计算的加速是无限的。

描述这现象的方程是s(p)= \ phi \ cdot p-(1- \ phi),这为了一乐观的结果,即结果,即所谓的缩放加速((类似于),如如所:

描绘作业如何可用数量增加的图表
当考虑的通常会可用的数量增加时,我们时时时时

通信成本

Gustafson-barsis定律着,我们我们添加进程中资源能能限​​制我们我们我们可以计算计算的的大小这个系列博客中强调一点,通信通信较。我们没有谈到谈到有有有多贵

我们考虑进程由所需的通信同步开销开销开销开销开销开销开销,并并系统系统系统系统的的的并并并并并并并将将其其描述描述为为计算计算计算时间时间时间时间的的的的增加增加增加。。这这这意味意味着着着着着当增加增加将被函数哦(p)= c \ cdot f(p)所,其中,其中C是一常数,,f(p)是某。因此,我们我们通过来计算加速比:s(p)_ {oh} = 1/(\ varphi/p+(1- \ varphi)+c \ cdot f(p))

95%的的情况情况行化行化行化行化行化行化代码的,我们f(p)函数,加速随着增加的情况,c = 0.005(这个这个不同的问题会有所不同不同不同不同不同不同不同。。。。。。。。。在没有下下但是当增加开销的,我们时候时候时候一些事情正在发生。

对于线性系统,我们我们在开始抵消更进程增加的计算计算计算能力能力f(p),结果甚至,您可能还关于关于关于分布式内存计算的博客,在多多情况下下

加速并增加开销
增加系统的比。常数常数常数被选选为为为为为0.005。

现象现象,当越来越时时时,在这下,我们只了个问题大小大小大小,随着的,随着增加增加,通过问题,通过规模,通过通过通过通过

188金宝搏优惠comsol多物理学中中批扫描扫描

现在让离开理论,学习如何使用使用使188金宝搏优惠用使用使用使用使用中中中中处理扫描功能。我们我们的的示例模型模型模型模型模型库中的该该模型,80,000个个自由度50 W,60 W 、70 W和80W。

在我工作站,一配备配备配备配备配备配备x x x x x x x x x x x四四四四四处理器和和和和和和和和和和和和和和和和和和和处理器处理器处理器处理器处理器的的的的®Celsius®上,得到上上上上:

内核数量 每个参数时间 扫描计算时间
1 30分钟 120分钟
2 21分钟 82分钟
3 17分钟 68分钟
4 18分钟 72分钟

这里完美完美完美完美完美完美完美完美完美为为为左右左右,四四有所降低。。这是是因为因为它是模型模型模型模型模型模型模型模型模型模型每

现在,我们将处理扫描以一方式行化:我们问题:我们我们从数据并行切换到任务并行。将个创建一个作业作业作业,看看看看处理处理处理对对我们我们的计算计算计算时间时间时间有有有什么什么什么什么什么什么什么影响影响影响影响影响影响为为为此此此此此此此此此此此此此计算计算计算计算计算的的的的的的作业作业作业作业作业作业的作业的的的处理扫描”,如如的所:


如何在批处理,包括值,并,并并同时同时

下图了控制行化可以获得生产率生产率或或加速加速比比比比比比。。。。使用使用当使用使用当当使用个个个个个个内内核核核核一一一一个批批批时时时时时时时时时作业时时时时处理作业使用使用核核核核核核核核核个个个个个个个个个个个个时分钟分钟分钟分钟分钟内内计算所有参数参数。最后最后最后最后最后最后最后最后最后最后最后最后最后最后最后最后最后当当当当当当同时同时同时计算34分钟。使分别提高提高了了了了了和和和倍倍倍倍单独使用纯享享内存并行化行化要

每天扫描与进程和线程配置配置
“ 4×1” 4个批个批个批个批。。。运行运行运行运行运行运行。。

混合建模系列结语

在这个系列博客中,共享享计算计算计算,以及,以及优缺点优缺点优缺点所有类型问题提供完美。。

相反,我们选择的方法个个问题

选择正确配置不容易容易的的的的的的的事先知道应该如何如何如何如何如何如何如何如何如何如何如何如何并并并并并并并并行计算但在在许多许188金宝搏优惠多许多许多其他其他下下下下下下这点的配置和尝试尝试一下

Fujitsu fujitsu Limited limited在/地区其他其他地区地区。。。。。。是是是是是是是是是


评论(0)

留言
登录|注册
正在... ...
浏览c188金宝搏优惠omsol博客