基于MPI的不可压缩NS方程并行计算方法的研究

格式：pdf
大小：199.06 KB
文档页数：3

下载文档原格式

CFD并行计算技术的研究进展

２００７年第２６卷增刊化ｌ：进展ＣＨＥＭｌＣＡＬＩＮＤＵＳＴＲＹＡＮＤＥＮＧＩＮＥＥＲｆＮＧＰＲＯＧＲＥＳＳ。

ｌ５‘ＣＦＤ并行计算技术的研究进展吴明一１．王红星２．秦玉波２，李鑫钢１，一，徐世民１’２（１天津人学化Ｔ学院，天津３０００７２：２天津人学精馏技术国家丁程研究中心，灭津３０００７２）摘要：综述了并行计算技术在计算流体动力学（ＣＦＤ）中的研究及应用进展，介绍了ＣＦＤ并行化的关键技术研究近况，包括网格处理技术、并行化算法技术以及并行计算平台的研究进展．最后讨论了ＣＦＤ并行技术的发展方向。

关键词：ｃＦＤ；并行计算ＲｅｓｅａｒｃｈｐｒｏｇｒｅｓｓｏｆＣＦＤｐａｒａＩｌｅｌｃｏｍｐｕｔｉｎｇＷＵＭｉｎｇｙｉ＼．ｗＡＮＧＨｏｎ晷ｘｉｎ营．ＱＩＮＹｔｔｂ孑。

ＬＩｘｉｎｇａ’ｔ毒。

，ｘＵＳｈｉｍｉ矗３（。

ＳｃｈｏｏｌｏｆＣｈｅｍｉｃａＩＥｎｇｉｎｅｅｒｉｎｇａｎｄＴ色ｃｈｎｏｌｏｇｙ，ＴｉａｎＩｊｉｎＵｎｉｖｅｒｓ时，Ｔｉａｎｊｉｎ３０００７２，Ｃｈｉｎａ：２ＮａｔｉｏｎａｌＥｎｇｉｎｅｅｒｉｎｇＲｅｓｅａｒｃｈＣｅｎｔｅｒｆｏｒＤｉＳｔｉｌｌａｔｉｏｎＴｅｃｈｎｏｌｏｇｙ・Ｔｉ州ｉｎＵｎｉＶｅｒｓｉｔｙ，Ｔｉ柚ｊｉｎ３０００７２，Ｃｈｉｎａ）Ａｂｓｎ翟ｃｔ：Ｒｅｓｅａｒｃｈａ１１ｄ印ｐｌｉｃａｔｉｏｎｏｆＣＦＤｏｎｐａｒａｌｌｅｌｃｃＨｎ口ｐｕｔｅｒＳａｒｅｒｅＶｉｅｗｅｄ，ａｎｄｔｈｅｋｅｙｔｅｃｈｎ０１０９ｙ，ｓｕｃｈａｓ伊ｉｄｍａｎａｇｅｍｅｎｔ，ｐａｒａｌｌｅｌｐｒｏｃｅｓｓｉｎｇｍｅｔｈｏｄ粕ｄｐａｒａｌｌｅＩｃｏｍｐｕｔｉｎｇｐｌａｔｆｏｍａｒｅｉｎｔｒｏｄｕｃｅｄ．ＴｈｅｄｅｖｅＩｏｐｍｅｎｔｏｆＣＦＤｐａｒａｌｌｅｌｃｏｍｐｕｔｉｎｇｉｓａＩｓｏｄｉｓｃｕＳｓｅｄ．Ｋｅｙｗｏｒｄｓ：ＣＦＤ：ｐ啪ｌｌｅｌｃｏｍｐｕｔｉｎｇ计算流体力学（ＣＦＤ，Ｃｏｍｐｕｔａｔｉｏｎａｌｆｌｕｉｄｄｙｎａｍｉｃｓ）是指利用数值方法通过计算机求解描述流体运动的数学方程，揭示流体运动的物理规律，研究定常流体运动的空间物理特征和非定常流体运动的时一空物理特征的学科。

MPI并行计算性能的研究

４．１．３二维快速傅里叶变换（ＦＦＴ）的并行计算二维傅里叶变换，就是进行两次一维ＦＦＴ计算，即首先进行行变换，然后再对行变换的结果进行列变换．并行实现快速傅里叶变换算法的思路就是把行变换和列变换的计算任务分配到各个节点并行完成．并行傅里叶变换的过程为：各节点进行行变换一各节点把行变换的结果发送给根进程一根进程对行变换结果进行转置运算一根进程把转置结果发送到所有计算节点一各计算节点再进行行变换一各节点把变换结果发送到根进程一根进程进行转置一得到最后结果．
ＬＩＪｉｕ—Ｋａｉｌ¨。ＺＨＵＪｕｎｌ，ＮＩＮＧＪｉａｏ－Ｘｉａｎｌ
（１．ＣｏｌｌｅｇｅｏｆＰｈｙｓｉｃｓＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏｇｙ，ＳｉｃｈｕａｎＵｎｉｖｅｒｓｉｔｙ，Ｃｈｅｎｇｄｕ６１００６４。Ｃｈｉｎａ；２．ＩｎｓｔｉｔｕｔｅｏｆＡｔｏｍａｎｄＭｏｌｅｃｕｌａｒＰｈｙｓｉｃｓ，ＳｉｃｈｕａｎＵｎｉｖｅｒｓｉｔｙ，Ｃｈｅｎｇｄｕ６１００６５，Ｃｈｉｎａ）
该算法并行计算的计算量大而通信量很小，各节点具有很少的相关性是相对独立的．此类问题具有理想的并行性，编程容易实现，加速比也接近理想值，并行效率接近于１．测试结果如图３所示．
丑删Ｒ口
ｌ
３５７９１１３
１５１７１９
节点数量（台）
图３Ｍａｎｄｅｌｂｒｏｔ并行计算Ｆｉｇ．３ＰａｒａｌｌｅｌｃｍｐｕｔｉｎｇｏｆＭａｎｄｅｌｂｒｏｔ
Ｃ．式中Ｚ蚪，是复数Ｚ＝口＋ｂ／（其中ｉ＝Ｆ１）
的第忌＋１次迭代，乙是第忌次迭代，Ｃ是确定该点在复数平面中位置的复数值．Ｚ的初值为０．迭代将一直进行下去，直至Ｚ的幅值大于１００（这表明Ｚ最终将变为无穷大）或是迭代次数已达到某种任意规定的限度．记录每个点的迭代次数．

基于MPI的二维泊松方程差分并行实现与测试

ＹＵＡＮＹｅ．ＹＡＮＧｎ－ｕＤｏｇｈａ
（ｃｄｍｆｕｄｍｎａａｄＩｔｒｉｉｌａｙＳｉｎｅ，ｒｉＩｓｔｔＡａｅｙｏｎａｅｔｎｅｄｓｐｉｒｃｃｓＨａｎｎｔｕｅＦｌｎｃｎｅｂｉｏｅｈｏｏｙＨａｂ５００，ｈｎ）ｆｃｎｌｇ，ｒｉ１０８ＣｉａＴｎ
中图分类号：Ｐ１Ｔ３９文献标识码：Ａ文章编号：６２— ９６２１）６— ８４— ３１７０４【０１００５０
Ａｉｐｌａａｌｌｉｐｌｍｅａｉｎｏｗｏ－ｉｎｉｎａｓｍｅｐｒｌｅｍｅｎｔｔｏｆｔｄｍｅｓｏｌｐｏｓｏｑｕｔｏａｅｔｏｉｅｅｅｉｓｎｅａｉｎｎｄｔｓｆｄｆｒｎｃ
ｌｌｅｃｅｃｅｆｉｎｙｉ
随着高速网络和多核处理器技术的发展，群集系统获得了很好的性能．由于性价比高和可扩展性好的特点，群正逐渐成为主流的并行平台．Ｉ集ＭＰ
（ｅｓｇａｓｇＩｔａｅ消息传递是一种典型的ＭｓａｅＰｓｉｎｅｃ）ｎｆｒ
较常用的方法有有限差分法、有限元法和有限体积
法．用差分方法解Ｐｉｏｏｓｎ方程，的结果就是方程ｓ解的准确解函数在节点上的近似解，种方法主要是这集中在依赖于时间的问题．其他两种方法相比，与有限差分法简单，易并行．此我们用有限差分方因法求解Ｐｉｏ程．文抛开复杂的理论问题，ｏｓｎ方ｓ本在

大气数值模式中的谱元素方法及其并行计算

大气数值模式中的谱元素方法及其并行计算张理论1 宋君强1 李晓梅2（1.国防科学技术大学计算机学院长沙 410073）（2.指挥技术学院电子工程系北京怀柔 100416）zll0434@摘要结合并行计算的研究应用现状，分析了谱模式并行计算中存在的问题，提出了解决问题的对策－谱元素方法。

分析谱元素方法的概念和计算特点，给出谱元素并行计算的优势所在。

针对两维浅水波模拟进行谱元素离散，给出了并行计算结果。

研究表明是谱元素法是一种很有并行潜力的有效模式计算方法。

关键词大气数值模式，谱变换方法，谱元素方法，并行计算1引言大气科学尤其数值模式的发展进步紧紧依赖于并行计算，这一点已经成为大气科学和并行计算两个领域的共识。

在考评一个已有的数值模式或者发展新的数值模式时，应该也必须考虑到其并行计算性能。

为此，对于并行计算和数值模式的现状特别是二者间的适应程度进行分析研究，是一项很有必要的工作。

本文论述了并行计算与谱数值模式的研究与应用现状，分析了其中存在的问题，给出了一种基于非重叠区域分解的谱元素方法，分析了其计算特点及在数值模式中的典型应用。

文章安排如下：第二节论述了当前并行计算的主要技术特点；第三节分析了谱模式的特点，指出了其在并行计算中存在的问题；第四节给出了基于非重叠区域分解的谱元素方法，结合浅水波方程，给出谱元素方法的一个应用实例；第五节为数值实验，指出了谱元素方法的优越性。

最后一节为结论。

2并行计算技术并行计算汇集了从硬件到数学方法等众多学科的精华，以实现高计算性能为目的。

并行计算的进展在并行软件和并行计算机两个方法均呈现不平衡性[1]，总的看来：软件落后于硬件，数据传输速度落后于数据处理能力。

在硬件方面，微处理器增长遵循Moore定律，存储器技术的改进速度仅不及处理器增长速度的百分之一。

并行通信系统的两个重要技术指标，即传输带宽和启动时延的改进速度相差近十倍，启动时延长期居高不下，它是并行系统设计的技术难点，更是应用软件设计中所要关注的焦点之一。

高超声速流动CFD并行计算研究

万方数据万方数据否则网格将发牛错误。

图２网格拓展及数据交换方式３．４边界条件（１）远场边界条件。

根据当地边界法向速度的正负判断来流是人流还是出流，对于入流边界，所有流动参数均由自由来流确定；对于出流边界，所有流动参数均由内场外插得到。

（２）壁面边界条件。

对于粘性流动，不可穿透的壁面边界应满足无滑移条件：‰＝０，‰一０，‰＝０壁面压力可通过法向动量方程的简化形式计算为：ａ，ｔ，一０ａ竹壁面气体温度由等温壁或绝热壁条件决定，即：Ｌ一∞钉毗（等温壁）或Ｉ嚣Ｌ＝ｏ（绝热壁）（３）对称边界条件。

对称边界条件要求对称面两侧的速度切向分量相等，法向分量相反，其他值相等即可。

（４）对接边界条件。

对于对接边界，可根据网格拓扑关系，寻找对应点的流场点，将相邻区的网格内点上的单元物理量通过消息传递赋给当前区的边界外点（即网格延拓得到的虚拟网格）。

这样，通过边界点的传递，在整个迭代过程中保证了分区之间的消息传递。

４算例计算结果与分析这里采用文献Ｅ９３中给出的圆柱体表面压力系数的结果进行算法的验证。

圆柱体半径为０．０３８ｍ，其高超声速来流条件为：地＝１６．３４，Ｌ一５２Ｋ，如一８２．９５Ｐａ，Ｔ，ｏ＝２９４．４Ｋ。

初始计算网格为三维单分区网格，网格节点总数目为３０１×１０１×１１，用到的边界条件有远场条件、壁面条件和对称面条件，如图３所示。

图３初始网格及边界条件设定针对单区域的初始网格，沿ｉ方向分别进行２分区、４分区的蕈新划分，并分别在数量不同的Ｐｃ机上进行流场数值计算，得到的计算结果如图４～图７所示。

首先考察计算所得流场是否准确。

由图４～图６中的１０８图４１分区网格及压力计算等值线图图５２分区网格及压力计算等值线图图６４分区网格及压力计算等值线图图７不同分区的Ｃｐ计算结果对比压力等值线图可以看出，不同分区得到的流场形式几乎完全一致，在分区交界面上的等值线无间断，保证了物理龟的连续；而通过图７中压力系数的对比，可见不同分区计算值能够很好地吻合，充分验证了边界数据处理方法的合理性和正确性。

基于 MPI + OpenMP 混合编程的水声探测系统效能并行计算方法

ＦａｎＰｅｉｑｉｎＤａＬｉａｎｇｌｏｎｇＬｉＹｕｙａｎｇＺｈｏｕＹａｎｘｉａ
（ＮａｖｙＳｕｂｍａｒｉｎｅＡｃａｄｅｍｙ，Ｑｉｎｇｄａｏ２６６０７１，Ｓｈａｎｄｏｎｇ，Ｃｈｉｎａ）
特点，可以将上述两种编程模型相结合，实现ＭＰＩ＋ＯｐｅｎＭＰ的
０引言
水声探测系统探测效能反映的是水声探测装备、海洋环境、
混合编程模型。
混合编程模型可以充分利用两种编程模式的优点：ＭＰＩ可以解决多处理器间的粗粒度通信，而ＯｐｅｎＭＰ提供轻量级线程，
时效性的要求。
关键词
中图分类号
声纳探测效能机群并行计算
ＴＰ３１１文献标识码ＡＤＯＩ：１０．３９６９／ｊ．ｉｓｓｎ．１０００－３８６ｘ．２０１３．１２．０３０
ＰＡＲＡＬＬＥＬＣｏＭＰＵＴＩＮＧＴＥＣＨＮｏＬｏＧＹＦｏＲＥＦＦＩＣＩＥＮＣＹｏＦＵＮＤＥＲＷＡＴＥＲＡＣｏＵＳＴＩＣＤＥＴＥＣＴＩｏＮＳＹＳＴＥＭＢＡＳＥＤｏＮＨＹＢＲＩＤＭＰＩ＋ＯＰＥＮＭＰＰＲｏＧＲＡＭＭＩＮＧ
ｋｉｎｄｏｆｅｉｃｆｉｅｎｃｙｃｏｍｐｕｔａｔｉｏｎｍｏｄｅｌ，ａｎｄｓｔｕｄｙｔｈｅｐａｒｌｌａｅｌｃｏｍｐｕｔｉｎｇｍｅｔｈｏｄｆｏｒｕｎｄｅｒｗａｔｅｒａｃｏｕｓｔｉｃｄｅｔｅｃｔｉｏｎｓｙｓｔｅｍｅｆｆｉｃｉｅｎｃｙｗｈｉｃｈｉｓｂａｓｅｄｏｎｈｙｂｒｉｄＭＰＩ＋ＰｏｅｎＭＰｐｒｏｇｒａｍｍｉｎｇｉｎｃｏｍｂｉｎａｔｉｏｎｗｉｔｈｔｈｅｈｉｇｈｐｅｒｆｏｒｍａｎｃｅｃｏｍｐｕｔｉｎｇｐｌａｔｆｏｒｍ．Ｃｏｍｐｕｔａｔｉｏｎｒｅｓｕｌｔｓｈｏｗｓｔｈａｔｔｈｅｐａｒｌｌａｅｌｉｓｅｄｐｒｏｒａｇｍｃａｎｂｅｔｔｅｒｍｅｅｔｔｈｅｒｅｑｕｉｒｅｍｅｎｔｉｎｒｅａｌ — ｔｉｍｅｐｒｏｐｅｔｒｙｂｙｔｈｅｃｏｍｐｕｔａｔｉｏｎｏｆｕｎｄｅｗａｒｔｅｒａｃｏｕｓｔｉｃｄｅｔｅｃｉｔｏｎｓｙｓｔｅｍｅｉｃｆｉｅｎｃｙ．ＫｅｙｗｏｒｄｓＳｏｎａｒＤｅｔｅｃｔｉｏｎｅｆｆｉｃｉｅｎｃｙＣｌｕｓｔｅｒＰａｒＭｌｅｌｃｏｍｐｕｔｉｎｇ

非结构动网格分区并行计算方法

非结构动网格分区并行计算方法程兴华;刘巍;张理论【摘要】针对包含运动边界的非定常流动问题,基于弹簧近似法设计了一套非结构动网格分区并行计算流程,引入了METIS软件进行非结构网格二次剖分,研究了对接边界通信类型及其处理方法,基于消息传递并行编程模式实现了非结构动网格求解器的并行化.测试结果表明:该求解器具有较高的并行效率,网格变形模块对非结构动网格并行计算性能具有重要影响.%For parallel simulation of the unsteady flow field with moving boundary, a domain-decomposed computation procedure was designed based on the spring analogy method, and the METIS software was introduced to repartition the original grids.With the research of 1-to-1 interface communication styles and realization, the unstructured dynamic mesh solver was parallelized based on the message passing interface.The test shows that the solver has high parallel efficiency, and the module of mesh deforming has significant effect on the parallel performance.【期刊名称】《国防科技大学学报》【年(卷),期】2017(039)001【总页数】5页(P81-85)【关键词】非结构网格;动网格;区域分解;并行计算【作者】程兴华;刘巍;张理论【作者单位】国防科技大学海洋科学与工程研究院, 湖南长沙 410073;国防科技大学海洋科学与工程研究院, 湖南长沙 410073;国防科技大学海洋科学与工程研究院, 湖南长沙 410073【正文语种】中文【中图分类】O35动网格技术是解决多体分离、流固耦合、可变形飞行器、机翼气动弹性振动和生物仿生流等包含运动边界的非定常流动问题的关键技术[1-3]。

基于MPI与OpenMP混合并行计算技术的研究

基于MPI与OpenMP混合并行计算技术的研究李苏平，刘羽，刘彦宇（桂林理工大学信息科学与工程学院，广西桂林541004）摘要：针对多核机群系统的硬件体系结构特点，提出了节点间MPI消息传递、节点内部OpenMP共享存储的混合并行编程技术。

该编程模型结合了两者的优点，更为有效地利用了多核机群的硬件资源。

建立了单层混合并行的Jacobi求对称矩阵特征值算法。

实验结果表明，与纯MPI算法相比，混合并行算法能够取得更好的加速比。

关键词：混合编程模型；多核机群；MPI; OpenMPTP312：A：1672-7800(2010)03-0050-031 MPI与OpenMP混合模型MPI( Message Passing Interface)是消息传递并行编程模型的代表和事实标准，可以轻松地支持分布存储和共享存储拓扑结构；OpenMP是为共享存储环境编写并行程序而设计的一个应用编程接口，是当前支持共享存储并行编程的工业标准。

在SMP机群系统中，混合编程模型已经有一些成功的应用，对于多核PC机群的混合编程模型研究才开始起步。

在多核PC 机群中，结合MPI与OpenMP技术，充分利用这两种编程模型的优点，在付出较小的开发代价基础上，尽可能获得较高的性能。

按照在MPI进程间消息传递方式和时机，即消息何时由哪个或哪些线程在MPI进程间传递进行分类，混合模型可以分为以下两种：(1)单层混合模型(Hybrid master- only)。

MPI调用发生在应用程序多线程并行区域之外，MPI实现进程间的通信由主线程执行。

该混合模型编程易于实现，即在基于MPI模型程序的关键计算部分加上OpenMP循环命令#pramgma omp par-allel- -即可。

(2)多层混合模型(Hybrid multiple)。

MPI调用可以发生在应用程序多线程并行区域内，进程间通信的可由程序任何区域内的任何一个或一些线程完成。

在该模型中，当某些线程进行通信时，其它的非通信线程同时进行计算，实现了通信与计算的并行执行，优化了进程间的通信阻塞问题。

基于MPI的二维泊松方程差分并行实现与测试

基于MPI的二维泊松方程差分并行实现与测试苑野;杨东华【摘要】消息传递是一种广泛应用于集群环境下的并行编程模型.针对简单二维Poisson方程的第一边值问题的典型差分格式,在MPI并行环境下,使用五点差分离散和雅可比迭代法实现了此类方程的并行求解.实际测试表明此类方程在一定问题规模下,其并行算法具有很好的加速比和并行效率.%Message-passing is a widely used cluster environment for parallel programming model. With a simple two-dimensional poisson equation for the first boundary value problem of the typical difference scheme, this paper used five-point difference discretization and the implementation of the Jacobi iterative method for solving such equations in MPI parallel environment. Actual tests showed that such equations in a certain scale of the problem, the parallel algorithm of it had good speedup and parallel efficiency.【期刊名称】《哈尔滨商业大学学报（自然科学版）》【年(卷),期】2011(027)006【总页数】4页(P854-856,861)【关键词】Poisson方程;消息传递接口;有限差分;加速比;并行效率【作者】苑野;杨东华【作者单位】哈尔滨工业大学基础与交叉科学研究院,哈尔滨 150080;哈尔滨工业大学基础与交叉科学研究院,哈尔滨 150080【正文语种】中文【中图分类】TP319随着高速网络和多核处理器技术的发展，集群系统获得了很好的性能.由于性价比高和可扩展性好的特点，集群正逐渐成为主流的并行平台.MPI(Message Passing Interface)消息传递是一种典型的并行编程模型.由于集群是一种典型的分布式存储系统，因此MPI消息传递系统已经成为目前集群上最重要的并行编程环境之一. 在科学计算中经常要数值求解各类偏微分方程.Poisson方程广泛应用于电学、磁学、力学、热学等多个领域，因此解决Poisson方程的计算问题成为了高性能计算领域中的一个最基本问题.目前比较常用的方法有有限差分法、有限元法和有限体积法.用差分方法解Poisson方程，解的结果就是方程的准确解函数在节点上的近似解，这种方法主要是集中在依赖于时间的问题.与其他两种方法相比，有限差分法简单，易并行.因此我们用有限差分方法求解Poisson方程.本文抛开复杂的理论问题，在高性能集群环境下，针对矩形区域上二维Poisson方程边值问题的五点差分格式，使用雅可比迭代法和MPI消息传递接口模型对一类简单的Poisson 方程给出了其差分方程组的并行实现解法，并定量的对该类解法的并行化性能进行了测试.1 MPI技术消息传递是一种广泛应用的并行编程模型.MPI(Message Passing Interface)是1994年5月发布的一种消息传递接口，它定义了用C和Fortran编写消息传递应用程序所用到的核心库例程的语法和语义，具有很多特点.首先，MPI提供了一个易移植的编程接口和一个可靠的通信接口，允许避免内存到内存的拷贝，允许通信重叠，具有良好的通讯性能;其次，它可以在异构系统中透明使用，即能在不同体系结构的处理器上运行;再者，MPI提供的接口与现存消息传递系统接口(如PVM、NX等)相差不大，却提供了更大的灵活性，能在更多的平台上运行;最后，MPI是一个标准，它没有规定底层必须如何实现，故给实现该标准的厂家带来了更大的灵活性，使MPI可扩展性更好.1.1 最基本的MPIMPI是个复杂的系统，它包含128个函数(1994年标准)，1997年修订的标准MPI-2已经超过200个，目前常用的大约有30个，然后使用其中的6个最基本的函数就能编写一个完整的MPI程序，6个函数如下.MPI_INT MPI 初始化MPI_FINALIZE结束MPI计算MPI_COMM_SIZE确定进程数MPI_COMM_RANK确定当前进程标识MPI_SEND发一条消息MPI_RECV 接受一条消息1.2 组通讯MPI提供了强大的组通讯功能，可以满足进程间的组通信.组通信一般实现3个功能:通讯、同步和计算.通讯功能主要完成组内数据的传输，分为3种，即一对多通讯，多对一通讯和多对多通讯;而同步功能实现组内所有进程在特定的地点在执行进度上取得一致;计算的功能比较复杂，要对给定数据完成一定的操作.组内通信函数主要包括5类:同步(Barrier)、广播(Bcast)、收集(Gather)、散发(Scatter)和规约(Reduce).1.3 通信体通信体是由一个进程组和进程活动环境(上下文)组成.其中进程组就是一组有限和有序进程的组合;进程活动环境是系统指定的超级标记，它能安全地将相互冲突的通信区分开.通信体提供了MPI中独立的安全的消息传递，不同的通信库使用独立的通信体，保证了在同一通信体的通信操作互不干扰.2 Poisson方程简介2.1 Poisson方程的定义Poisson方程是数学中的一种偏微分方程，即为其中:Δ代表的是拉普拉斯算子，而f和Δ可以是在流形上的实数或复数值的方程.当流形属于欧氏空间，而拉普拉斯算子通常表示为▽2，因此Poisson方程通常写成在二维直角坐标系统中，Poisson方程可以写成2.2 二维Poisson方程的差分离散考虑区域Ω=(0，a)×(0，b)上的Poisson方程的第一边值问题将Ω沿着x，y轴方向均剖分为m，n等分，沿x方向上的步长记为，沿y方向上的步长记为，剖分节点记为(x，y)(i=1，…，m-1，j=ii 1，…，n-1).用μij表示μ 在节点(xi，yi)的差分近似解，则离散后的差分方程为其边界为令)，整理后可得其中对于格式(3)～(7)，可以使用各种迭代法求解，常用的有逐次超松弛迭代法、共轭梯度法、预条件共轭梯度法、交替方法及多重网格方法等，其中雅可比迭代法以其简单实用和易于并行实现一直受到人们的重视.格式(3)～(8)的雅可比迭代格式为其中:3 实例数据测试与结果分析下面研究一类简单的Poisson方程，当此时Poisson方程的解析式为我们用区域分解法，在每个子区域用五点差分离散及雅可比迭代法并行求解此类方程.本文的硬件测试环境是16个节点的惠普高性能集群，采用千兆以太网互联，每个节点有2颗Intel Xeon 2.66G处理器，16G内存，72G SAS磁盘，NFS共享文件系统，软件环境是Red hat Enterprise Linux 4.6操作系统，内核版本为2.69-67，采用的C编译器为Intel C++12.0，MPI的版本为Intel MPI 4.0.表1为所测试问题的规模及其串行计算的执行时间.一般情况下，问题的串行计算执行时间比其并行计算的单机执行时间短，这主要是因为并行计算的单机时间中包含了并行化所带来的开销.表1 题规模及串行程序执行时间问题规模顺序执行时间400×400 3.0000e+00 800×800 4.9000e+01 1600×1600 2.0000e+02表2为所测试问题的规模及多处理机程序执行时间.对并行算法的性能测试主要是通过加速比和并行效率.我们以问题的多处理机执行时间与单处理机系统执行时间的比值作为多机加速比，把并行算法的加速比与CPU个数之间的比值定义为并行效率.图1为不同问题规模下的多机并行加速比.图2为不同问题规模下的并行效率. 表2 不同问题规模下多处理机程序执行时间问题规模并行执行时间4 node 9 node 16 node 400×400 2.5862e+00 3.0134e+00 3.2024e+00 800×8007.5078e+00 4.9370e+00 4.7353e+00 160×1600 5.2700e+01 1.8333e+01 9.2666e+00由图1可知，当矩阵为400阶时，问题的规模较小，随着节点数目的增多，加速比持续下降，且在节点数node=4时，获得最大加速比为1.16;当矩阵为800阶时，问题规模比较大时，其加速比均大于1，且几乎成线性增长;当矩阵为1 600阶时，问题规模较大，其加速比随节点的增加，表现为先逐渐变大，然后迅速减小.当node=9时，获得最大加速比为2.9655，且node=16时的加速比大于node=4时的加速比，但由图2可知其并行效率下降了61.6%，可以预测，当节点数继续增加时，其加速比和并行效率将会持续降低.由图2可知，当问题规模比较小时，矩阵规模小于800阶，随着节点数的增加，并行效率逐渐降低，但问题规模越大其并行效率也越高.4 结语通过上述实验数据可知，此类Poisson方程的并行效率和加速比很难得到非常理想的值，主要原因在于:问题规模的大小，如果问题规模较小(如:矩阵为400阶或800阶)，并行计算的任务量较小，几个处理器就足够了，若处理器太多，则难以实现最佳负载平衡同时处理器也得不到充分利用.反之，如果问题规模较大(如:矩阵为1 600阶)，则需要更多的处理器.但随着处理器个数的增加，并行算法的加速比在峰值后呈现下降趋势，并行效率也在下降.参考文献:[1]陈国良.并行计算—结构·算法·编程(修订版)[M].北京:高等教育出版社，2003.[2]王同科，谷同祥.Poisson方程差分格式的SOR方法中最优松弛因子的回归分析方法[J].工程数学学报，2005，22(3):474-480.[3]陆金莆，关治.偏微分方程的数值解法[M].北京:清华大学出版社，2004.[4]章隆兵，吴少刚，蔡飞，等.PC机群上共享存储与消息传递的比较[J].软件学报，2004，15(6):842-849.[5]胡明昌，史岗，胡伟武，等.PC机群上JIAJIA与MPI的比较[J].软件学报，2003(7):1187-1194.[6]张武生，薛巍，李建江，等.MPI并行程序设计实例教程[M].北京:清华大学出版社，2009.[7]都志辉.高性能计算并行编程技术-MPI并行程序设计[M].北京:清华大学出版社，2001.。

基于MPI的不可压缩N-S方程并行计算方法的研究

Ｅｍａｌｌｉｇ－ｉ：ｉｎｎ
＿
ｔ＠ｏａｌｏｊｈｔｉｍｕｍ．ｔ
ＵＮｉｇ，ｎＬＵＯＪ．ｈｎ．ｓａｃｏｐｒｌｌｏｕｉｇｌｏｉｈｏｉｃｍｐｅｓｂｅｉｓｅｇＲｅｅｒｈｎａａｌｃｍｐｔａｇｒｔｍｅｎｆｎｏｒｓｉｌＮ－ｅｕｔｎａｅＯｌＰＩＳｑａｏｂｓｄｉｉＭ．
李宁罗纪生１．，２
Ｌｉｇ，ＵＯＪ－ｈｎＩＮｎＬｉｓｅｇ・
１津大学力学系．津３０７．天天００２２南开大学天津大学刘徽应用数学中心，津３０７．天００２１ｅａｔｎｏｃａｉ，ｉｊｎｖｒｉ，ｉｊ００２Ｃｉａ．ｐｒｔｆＭｅｈｎｃＴａｉＵｉｓｙＴａｉ３０７，ｈｎＤｍｅｓｎｎｅｔｎｎ
ＭＰ不是一个独立的自包含系统。是建立在本地并行程Ｉ而
ａｃｒｔｄｒｌｂｅ，ａｈｒｎｔｅｃｌｕａｉｇｔｎｒｕｌｎｓｗｅａａｔｌｏｌｒｅｓａｅｓｉｎｉｃｃｍｐｔｇｃｕａｅａｅｉｌｉｃｎｓｏｔｈａｃｌｔｉｎａｔｅｎｍｅｅｏｍｏｓｙａｄｉｌｄｐａｅｔａｇ — ｃｃｅｔｏｕｉ．ｌｂｌｉｆｎ
维）
ＣｍｕｅｎｉｅｉｇａｄＡｐｉｔｎｏｐｔＥｇｎｒｎｐｌａｉｓ计算机工程与应用ｒｅｎｃｏ

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

图ｌ超松弛迭代示意图
５实例验证根据提出的方法，笔者针对不可压缩流体力学具体问题，
采用Ｆｏｒｔｒａｎ９０语言，分别编写了串行、并行程序，在曙光ＴＣｌ７００集群服务器下计算，系统为Ｌｉｎｕｘ。该算例所模拟的问题为：对于不可压缩流体．在平板边界层中，入Ｅｌ处加入一个三维波的扰动源．该扰动源在入口处随时间而有规律的变化，之后三维波向下游传播，其幅值随空间而增长。
参考文献：
［１】ＡｓｓａｆＩ，ＣｈｅｎＭ，ＫａｔｚｂｅｒｇＪ．Ｓｔｅｅｌｐｒｏｄｕｃｔｉｏｎｓｃｈｅｄｕｌｅｇｅｎｅｒａｔｉｏｎ［Ｊ］．ＩｎｔｅｒｎａｔｉｏｎａｌＪｏｕｒｎａｌｏｆＰｒｏｄｕｃｔｉｏｎＲｅｓｅａｒｃｈ，１９９７，３５（２）：４６７＿４７７．
２本文问题描述不可压缩直接数值模拟的基本方程是Ｎａｖｉｅｒ—Ｓｔｏｋｅｓ方
程、连续性方程，对方程进行适当的无量纲化后，其形式：
詈ｍ田）牡坷ｐ＋去叻
（１）
Ｖ·Ｈ＝０
ｆ２）
其中Ｕ是速度，Ｐ为压力，Ｒｅ是Ｒｅｙｎｏｌｄｓ数，Ｖ是Ｈａｍｉｌｔｏｎ算子，Ｖ２是Ｌａｐｌａｃｅ算子。
在ｚ方向采用Ｆｏｕｒｉｅｒ谱展开。因此ｚ方向为周期性边界
图２、图３为同一结果的两张图，所不同的是图２为＇，＝０．７６，ｚ＝１处的串行、并行扰动空间演化情况（ＤＮＳ—Ｂ表示并行的结果．ＤＮＳ—Ｃ表示串行的结果）．而图３为ｙ＝０．７６处串行、并行整体扰动空间演化情况。从两张图可以看出，并行计算的结
（上接３页）为了简化问题，本文将板坯排序问题转化为约束满足问题处理，利用问题的约束条件过滤变量的值域，收缩搜索空问，降低计算复杂性。应用基于域和费用值的动态变量选择和值选择启发式算法以及改进的节点互换算法确定整板顺序。仿真实验证明，约束满足＋基于改进的节点互换算法具有理想的计算时间和优化效果。（收稿日期：２００６年１１月）
基金项目：国家自然科学基金（ｔｈｅＮａｔｉｏｎａｌＮａｔｕｒａｌＳｃｉｅｎｃｅＦｏｕｎｄａｔｉｏｎｏｆＣｈｉｎａｕｎｄｅｒＧｒａｎｔＮｏ．１０２３２０２０）。作者简介：李宁（１９７８一），男，博士研究生，主要研究方向为流体力学、并行计算；罗纪生（１９５４一），男，教授，博士生导师，主要研究方向为流体力学。
程的第一个数据补充为０，将第ｍ个进程的最后一个数据也补
充为０，形式如下：
０
ａｏ
ｏｏ
ｂ１０１
０１
Ａ＝
和
ｂ，１６ｋ１ｃｐｌｂ。％ｃ。
ｂｏａｏ
ｏｏ
Ａ＝
ｂｌｏｌ
ｂｐｌａｎ＿１ｃｐｌｂ。％０
下面介绍具体的计算方法。步骤１将矩阵分成ｍ部分。任取其中一个部分，表示如下：
６『，（ｍ）
Ａ＝
ห้องสมุดไป่ตู้
：
●
ＭＰＩ不是一个独立的自包含系统，而是建立在本地并行程序设计环境之上．其进程管理和Ｉ／Ｏ均由本地并行程序设计环境提供。ＭＰＩ实现主要包括ＭＰＩＣＨ、ＬＡＭ、ＣＨＩＭＰ几种。ＭＰＩ子集由６个基本函数组成：ＭＰＩ初始化、ＭＰＩ结束、获取进程的编号、获取制定通信域的进程数、消息发送和消息接受。ＭＰｌ支持以下四种通信模式：标准通信模式、缓冲通信模式、同步通信模式、就绪通信模式。
６”三
１ｃ’ｙ
１ｃ■
６哆’
１ｃ？
肌ａｉ…：髻，ｃ，；…：霉。
ｎ
口
最后．进行向上消元的计算。
６，，，≯’
Ｃ
６，，，，
（
Ａ＝
：
●
６，，，：
６”二ｍ’
Ｃ舢。椭，；∥。㈣。
其中：６『『，三：６”：圳■ｃ７三，ｃｔｔ。（ｍ）＝－－Ｃｔ■ｃ’：；６”譬６『，：…圳乞
．ｃ’■ｃ，’譬ｍ）一ｃｕ。（ｍ。’．ｃ７一（ｉ－ｏ，…，ｎ一２）。
万方数据
李宁．罗纪生：基于ＭＰＩ的不可压缩Ｎ－Ｓ方程并行计算方法的研究
２００７，４３（９）
９
条件。ｘ，ｙ方向采用紧致差分格式。因此，本文在ｘ，ｙ方向采用并行计算。时间的离散方法和空间的离散方法的详细情况见文献［２１。
针对非线性项、粘性项、散度和梯度，都需要求解三对角矩阵。设所要求解的三对角方程组为：Ａ·ｘ＝ｆ，其中，Ａ为三对角矩阵，并且是非奇异的。那么，如何并行求解三对角矩阵呢？
经过向上、向下消元之后，方程变为：
６ｆ『，≯’
菇
６，，，：莉
戈
：
●
６…三
石
６■
舢。椭．；＾、＾。膏㈤。：“㈨。眩＂㈠坛一
当每个进程单向点数超过３０个的时候，６０’一ｏ，ｃ咿’一ｏ（证明
ｂｏａｏＣｏ
．·
ｂ１Ⅱｌ。ｌ
（３）
ｂ，１％一ｌ
－．，．—，【矗五；厶
步骤２首先，进行向下消元的计算（上标ｍ表示第ｍ个进程）。
１１３０２００３００４００５００
图２串行、并行计算结果比较图（ｙ＝０．７６。ｚ＝ｌ处
４并行局部超松弛迭代的基本原理针对上面提到的问题．本文采用了一种局部超松弛迭代的
方法，即每个时间步计算的开始．将各个进程边界上的数据传递给相邻的进程（注意角点的数据），然后进行超松弛迭代，也就是说，除去边界上的点，其余的点都采用超松弛迭代法，从实际数值计算的结果来看，只是迭代的次数相对增加一些．对计算结果没有影响。值得注意的一点，为了配合方程的边界条件，对迭代的方向本文也进行了研究，结论为：从戈＇，平面中心开始，向四个角点迭代，收到的效果较好。超松弛迭代示意图如图１所示。
那么，如何在并行中采用超松弛迭代法呢？
６”∥ １ｃ，：ｍ）
…
３并行求解三对角矩阵的基本原理
假设采用ｍ个进程，第１个进程和第ｍ个进程的形式分别为：
Ⅱ０
ｃｏ
ｒ
ｂ１ｔｔｌＡ＝
●●●
们¨ 加乩
和
Ｃ卜ｌ：
ａｎ
Ｃ“
ｂｏａｏ
ｂｌ孙ｍ “
●
Ａ＝：
¨ ％一１ｃＪ卜ｌ
＿：
ｂ。％
为了取得形式上的一致，以便计算起来通用方便，将第１个进
（ｍ＋１）
ｘ。弓，一ｃ。’ｏｏ
相应各个进程的戈≯’、＊，都可以求解出来。
步骤４代回到式（４）中，因为由第ｍ和第ｍ一１个进程，求
出了戈≯’，由第ｍ和第ｍ＋１个进程求出了＊∥，因此可得：
ｚ∥乏…一６…：…．戈∥－ｃ∥ｔ算≯（湖，…，叫）
（７）
求出了各个进程每个点的值。
Ｏ．００ｌＯＯ．０（）０５
０
ｏ
是甲．Ｄｏ２移ｏ，Ｇｏ２。ｏ，。ｒ
’１
松弛迭代法求解嘲，可得：
露１＝（１叫碗＋∞ Ａ…ｐ。＋ｌ印：，。）＋Ｂ（ｐｐ沪＋ｌ，＋ｐｐⅢ。）芬。２（Ａ＋曰）＋６
。：霉撕乩…∽。ｏｏｌ
其中：Ａ＝１／Ａｘ２，Ｂ＝Ｉ／Ａｙ，山为松弛因子，ｂ为系数，为已知项。
其次，各行都除以该行的主对角元素，使主对角线的值为１。
步骤３将ｃ’，’传递给下一个进程，将６…≯’传递给上一个
进程，任取一个组合为例，可得如下二元一次方程组：
ｂ，。ＨＢ雌，］
㈤
万方数据
１０
２００７，４３（９）
ＣｏｍｐｕｔｅｒＥ，画船ｅｒ机ｇａｎｄＡｐｐｌｉｃａｔｉｏｎｓ计算机工程与应用
。。，∥’≯…·ｂ…∥
‰５ｉ了碡万
（６）
（ｍ）』ｍ）
，（ｍ）
Ａｂｓｔｒａｃｔ：ＦｏｒｔｈｅｐｒｅｓｅｎｔＣＦＤ，ｗｈｅｎｗｅｔｒｙｔｏｓｏｌｖｅｌａｒｇｅ—ｓｃａｌｅｓｃｉｅｎｃｅｃｏｍｐｕｔｉｎｇｐｒｏｂｌｅｍｓ，ｓｕｃｈａｓｔｈｅＮ—Ｓｅｑｕａｉｏｎ，ｗｅｈａｖｅｔｏｃａｌｃｕｌａｔｅａｌｏｔｏｆｔｈｉｎｇｓａｎｄｉｔｔａｋｅｓａｌｏｔｏｆｔｉｍｅｔｏｇｅｔａｌｌｔｈｅｃａｌｃｕｌａｔｉｏｎｓｄｏｎｅ．Ｔｏｓｏｌｖｅｔｈｅｐｒｏｂｌｅｍ，ａｐａｒａｌｌｅｌｃｏｍｐｕｔｉｎｇａｌｇｏｒｉｔｈｍｃａｌｌｅｄＭＰＩ，ｗｈｉｃｈｉｎｃｌｕｄｅｓｔｈｅｓｏｌｕｔｉｏｎｏｆｔｒｉｄｉａｇｏｎａｌｍａｔｒｉｘａｎｄＳＯＲ，ｉｓｐｒｏｐｏｓｅｄ．Ｔｈｉｓｍｅｔｈｏｄｈａｓｂｅｅｎｐｒｏｖｅｄｔｏｂｅａｃｃｕｒａｔｅａｎｄｒｅｌｉａｂｌｅ，ｉｔｃａｎｓｈｏｒｔｅｎｔｈｅｃａｌｃｕｌａｔｉｎｇｔｉｍｅｅｎｏｒｍｏｕｓｌｙａｎｄｉｓｗｅｌｌａｄａｐｔａｂｌｅｔｏｌａｒｇｅ—ｓｃａｌｅｓｃｉｅｎｔｉｆｉｃｃｏｍｐｕｔｉｎｇ．Ｋｅｙｗｏｒｄｓ：ＣＦＤ：Ｎ—Ｓｅｑｕａｔｉｏｎ；ＭＰＩ；ｐａｒａｌｌｅｌｃｏｍｐｕｔｉｎｇ
文章编号：１００２—８３３１（２００７）０９—０００８—０３文献标识码：Ａ中图分类号：０２４６
近几十年，随着计算机运行速度的快速提高，计算流体力学得到了蓬勃的发展，而这也促进了航空、航天技术的发展。显然，数值计算已经成为与理论分析和实验研究并列的研究流体流动问题的方法。然而，由于流体流动的复杂性，使得流场数值计算的工作量非常巨大，特别是采用空间模式，以至于利用目前运算速度最快的计算机仍然无法仔细模拟大多数工程流场。因此，计算流体力学工作者们一直在寻求更好的算法来大规模地提高计算速度。并行计算就是在这种背景下应运而生的。
另外。针对压力函数Ｐ，其满足的方程为Ｈｅｌｍｈｏｈｚ方程：
６，∥ ｏ怖ｏ
耐ｏ％
６７ｙ
ｍ
∥ 、莹，
Ｃ
Ａ２：
６’三６，：ｍ）
Ⅱ ＜ｎ耐ｏ
｝ⅡＣ刚。哪
ｍ
●吒
采用蠢黧篡…酗Ｈｅｌｍｈｏｈｚ掘一超…∥≤。，Ｇ，：ｍ，栽。，６，：。刊乞，每∥＝８：。一采用五阶中心差分格式离散上面的
２一。¨可，。－２８－一方程，并采用超
基于Ｌｉｎｕｘ环境下的ＭＰＩ并行计算，以其准确、可靠、高效的优点，备受计算流体力学工作者的青睐。本文所要阐述的问题即是采用ＭＰＩ并行求解Ｎ—Ｓ方程。

基于MPI的不可压缩NS方程并行计算方法的研究

合集下载

CFD并行计算技术的研究进展

MPI并行计算性能的研究

基于MPI的二维泊松方程差分并行实现与测试

大气数值模式中的谱元素方法及其并行计算

高超声速流动CFD并行计算研究

基于 MPI + OpenMP 混合编程的水声探测系统效能并行计算方法

非结构动网格分区并行计算方法

基于MPI与OpenMP混合并行计算技术的研究

基于MPI的二维泊松方程差分并行实现与测试

基于MPI的不可压缩N-S方程并行计算方法的研究

文档推荐

最新文档