混合并行计算速度升高了物理模拟

2014年1月23日

二十年前,TOP500列表由装备高达一千个处理单元的矢量加工超级计算机主导。后来,这些机器被用于大规模平行计算的集群代替,这很快主导了列表,并产生了分布式计算。第一个集群使用每个计算节点的专用单核处理器,但很快,将额外的处理器放在需要共享内存的节点上。这些共享内存并行机的能力将海洋改变为多核处理器,需要在各种计算应用中强大和足够的算法。今天查看TOP500列表,我们可以观察到大多数集群由具有多个套接字的大量计算节点组成,每个插座中每个多核处理器最多八个核心。用于共享存储器计算机并行计算的技术与在具有分布式存储器的集群上计算时使用的技术。这需要混合(杂交种)用于有效并行计算的方法。

共享和分布式内存

并行计算基本上由两种不同的古典设置组成:共享内存分布式内存。即使目标最终是相同的,这两种方法之间存在许多结构差异 - 通过利用并行硬件来执行更快和更大的计算。(提示:来自的教程劳伦斯利弗莫尔国家实验室提供了对并行计算的详细介绍。的)

每个方法的名称表达了两者之间的基本差异。在共享内存的情况下,并行运行的整个程序的分布式部分都共享相同的内存空间。这提供了在核心和处理器之间的数据时提供速度。然而,共享存储器计算的主要缺点是共享存储器节点上的计算资源是有限的。在问题大小增加时,无法添加其他资源,或者应使用更多的核心来减少每个核心的计算数。共享内存计算没有规模好。

在分布式存储器计算中,存储器未被共享,而是在若干并行进程之间分发。这些过程必须通过发送“消息”明确地互相通信。因此,通过利用数据局部地点和改进的算法来消耗额外的时间,并且应最小化通信量。分布式存储器计算的大优点是,当可用时,它通常可以易于衡量额外的资源(节点,以及因此,也是如此)。

通常,我们应该在我们有很多核心的计算机时使用共享内存,并且当我们有一个由几个计算节点组成的群集时,我们的分布式内存。

混合平行计算

在查看处理器市场的开发方式时,我们可以看到通过增加时钟频率的处理器不再获得性能的明确趋势,但相当配备越来越多的核心。第一个x86双核处理器是2004年由AMD发布。2013年后一半,英特尔发布了一个有12个核心的处理器,如果我们要相信谣言,英特尔的骑士降落技术都可以实现72核心

共享内存和分布式内存计算的图

这也意味着具有单核计算节点的群集是过时的稀有性。Top500列表中的大多数集群都有计算节点,每个插座配备了八个核心。类似的设置适用于小型和中型计算群集。这些广泛的配置使得我们不可避免地利用用于Intranode计算的共享内存机制和同时为节省间计算的分布式存储机制。特此目的是最大化可扩展性,最小化通过开销的昂贵的消息,并利用所谓的统一方法中共享内存的功率混合平行计算。混合方法中的共享和分布式存储器机制的组合提供了一种适应各种计算平台的多功能手段。选择合并两种并行化方式的正确方法将加速计算,增加可伸缩性,并允许有效利用硬件。

混合并行计算图

188金宝搏优惠COMSOL软件和混合并行化

默认情况下,当您在多核平行工作站或PC上启动COMSO188金宝搏优惠L®软件时,所有可用的核心都用于通过共享内存方法并行化计算。在工作站或群集上工作时,您可以控制如何控制并行化的应用。您可以选择是否要在分布式内存模式下运行它,以共享内存模式,也可以在混合模式下运行它。您可以在COMSOL参考手册中找到如何执行此操作的详细描述。188金宝搏优惠

188金宝搏优惠COMSOLMultibyhysics®及其附加产品适用于计算耦合物理。选择最佳并行配置的方式非常取决于底层物理,模型中的耦合水平,问题大小和求解器的选择。为您提供的细粒度控件使得可以找到最佳并行配置188金宝搏优惠COMSOL软件为了你的问题。


评论(0)

发表评论
118bet网址多少
加载...
探索comsol188金宝搏优惠博客