利用COMSOL®批次扫描利用硬件并行性188金宝搏优惠

2020年6月2日

COMSOLMultibySics®软件的核心功能之一是运行批量扫描的能188金宝搏优惠力,其中同一模型的多个变体并行解决,但在同一计算机上完全单独的作业。随着高核心计数CPU的无处理,以及支持多个CPU的计算机,您可以使用此实现重大的加速批量扫描功能。让我们了解如何!

快速介绍批量扫描

由于任何遵循计算机硬件的人都知道,每一代处理器技术都会带来显着的改进。很长一段时间,时钟速度超过年增加,但是这种趋势已经停滞不前现在,制造商正在培训越来越多的核心进入每个CPU。

默认情况188金宝搏优惠下,COMSOL®软件将使用所有可用的核心来解决每个模型,但这并不一定是有益的。许多COM188金宝搏优惠SOL多体型号仅限部分是平行化的,甚至完全连环因此,具有更多专用于单个模型的节点可能不会在其自身中导致加速,特别是如果模型在其存储器要求方面相对较小。

实际上是说,这意味着较新的多核CPU不一定比旧的CPU更快地运行单个,相对较小的COMSOL多体学床,但它们将能够同时运行更多的作业。188金宝搏优惠这在我们解决了相同模型的多个变体的情况下,这使我们提供了一个显着的净改善,例如当扫过几何尺寸,不同的操作条件或操作频率时。这批量扫描功能对于此类案例意味着。

在我们到达使用之前批量扫描界面,有一些重要的事情要了解它的操作。第一的,批量扫描可以启动多个完全独立的COMSOL Multiphysics进程或作业。188金宝搏优惠这些工作不了解其他工作正在做的事情。如果一个案例发生故障,它不会影响其他任何内容,但我们也无法通过案例之间传递结果。

其次,每个作业将文件写入包含该作业结果的磁盘,并且可选地,所有这些结果都可以将所有这些结果组合回原始文件。

第三,在运行这些作业时,该软件将自动划分可用计算核心之间的并行作业。

最后,批量扫描是COMSOL Multiphysics的核心功能的一部分。188金宝搏优惠它意味着在单个计算机上运行(尽管具有多个CPU的可能性,但它可用任何许可证类型都提供。这是补充的集群扫描功能(仅适用于浮动网络许可证),它提供类似的功能,但可以另外可以在群集的不同计算节点上除以作业。

批量扫描的设置

能够使用批量扫描功能,必须首先启用批量和群集选项内部显示更多选项模型构建器的对话框。此对话框显示在下面的屏幕截图中。

COMSOL Multiphysics中的188金宝搏优惠模型构建器与“显示更多选项”对话框打开。
显示更多选项模型构建器中的对话框。

启用此后,您将能够添加一个批量扫描特征到学习分支。此功能将始终存在于此之上学习,并且可以被认为是作为一个用于缠绕在它之下存在的所有其他研究步骤的循环学习分支。

批处理扫描功能的“设置”窗口,相关设置突出显示。
相关批量扫描功能设置。

用户界面批量扫描如上所示,有相关的功能突出显示。首先,在顶部,我们指定要扫描的参数的名称以及该参数的不同值的数量。接下来,启用同步解决方案选项将所有结果组装回单个文件。如果未启用此,则批次扫描将只是编写一组不同的文件;一个用于扫描中的每个参数。(这可能实际上是一个有吸引力的选择,因为您可以快速获得非常大的文件,因此如果您想要考虑它可能值得考虑保存每个文件中的数据。)最后一个键设置位于窗口的底部:同时作业的数量,它确定了许多作业并行运行。

另外,请记住批量扫描可以缠绕任何其他类型的扫描:参数功能材料辅助的, 或者频率扫描,所以你可以使用一个单一的批量扫描为任意组合解决的工作。

那么,我们实际上应该并行运行多少工作?这是我们将看的下一个问题。

COMSOLMULTIPHYSICS®IFSILoit多少批次188金宝搏优惠并行性?

您可能已经被猜测的答案,如您所知,是硬件和模型依赖。

就模型类型而言,理想情况批量扫描是一种模型,在内存要求方面很小,但需要相对较长的时间来解决。这种模型的一个很好的例子是激光加热硅晶片示例。该模型解决了在旋转晶片上移动的激光热源的温度演变。它只有约2000度的自由度,但需要大约需要一分钟的墙钟时间来解决典型的台式计算机。我们可以在此模型中扫描许多不同的参数,因此让我们了解这个模型的性能如何在典型的现代台式计算机上使用作业并行性。

我们将出现的结果是在英特尔®Xeon®W-2145 8核处理器上生成32 GB RAM,典型的中频计算机,如COMSOL所示188金宝搏优惠硬件建议。在此硬件上,测试案例模型需要大约一分钟才能解决。如果我们在模型的16个变体进行参数扫描,则解决方案时间与正在解决的不同案例的数量线性上升。如果我们也使用批量扫描,我们可以在此硬件上并行调查运行2,4,8,甚至16个作业,每个批次扫描作业包含连续参数扫描,如下屏幕截图所示。

在COMSOL Multiphysics中执行嵌套批处理扫描的设置的屏幕截图。188金宝搏优惠
屏幕截图显示嵌套扫描。在这个例子中,外面的批量扫描扫过n = 0,4,8,12,而内部扫描结果在所有情况下解决了16例。

以下结果在解决16例和相对加速所需的时间内提出。

参数扫 批量扫描+参数扫描
16个顺序案例 2平行就业机会
(每份8个顺序案例)
4个工作
(4例/工作)
8个工作
(2例/工作)
16个工作
(1案/工作)
时间(秒) 1010. 620. 416. 305. 267.
加速 1 1.6倍 2.4倍 3.3x. 3.8x.

从此数据观察,当我们同时运行更多的作业时,我们得到更多的加速。最有趣的是,我们可以看到我们可以在8个核心机器上并行解决16个工作,仍然观察加速度。换句话说,该CPU的每个核心实际上可以一次处理两个COMSOL®作业,至少在解决该特定模型时。188金宝搏优惠在本机上启用超线程,虽然不加速解决方案本身,但文件打开和关闭以及其他操作系统进程受益于启用超线程。现在,并行运行这么多案例确实减慢了解决每个案例所需的时间,但所有16例均少的时间较少。

讨论我们试图在内存方面并行运行更多的工作时,它也很有意思。此模型每批作业需要大约1 GB的内存,并且此处的测试计算机具有32 GB RAM,因此16个并行情况下没有问题。但是,如果我们上达32个并行案例,我们可以超过可用的公羊,这将导致无论核心数量如何,都会导致放缓。当然,在具有更多RAM的计算机上,更多核心和多个CPU,我们可以获得更加相对的加速。此外,COMSOL Mul188金宝搏优惠tiphysics不限制可以在单个计算机上寻址的核心或CPU的数量。

现在,这些数据看起来相当不错,如果你总是得到结果,你几乎肯定会想到这一点。不幸的是,答案是:并不总是如此。我们解决的模型越大,我们将看到的加速就越少。对于非常大的型号,如果您并行运行作业,将会总体放缓。但是,对于许多型号,特别是大多数2D型号和较小的3D模型,您可以在使用时合理地期待类似的改进批量扫描在多核,多CPU计算机上。所以批量扫描功能可以强烈激励投资这种硬件。另外,还有很多其他权力批量扫描讨论的功能以前的博客文章。请记住,这是COMSOL Multiphysics提供所有许可证类型的核心功能!188金宝搏优惠

英特尔和Xeon是英特尔公司或其子公司的商标。


评论(0)

发表评论
118bet网址多少
loading ...
探索Comsol188金宝搏优惠博客