当前位置:文档之家› 面向大规模并行计算的LBM-FVM耦合模拟关键技术研究

面向大规模并行计算的LBM-FVM耦合模拟关键技术研究

目录

摘要 (i)

ABSTRACT (v)

第一章绪论 (1)

1.1研究背景 (3)

1.1.1高性能计算的迅猛发展 (3)

1.1.2粘弹流模拟面临的挑战 (6)

1.2相关工作 (8)

1.2.1粘弹流的数学模型 (8)

1.2.2粘弹流的数值求解 (11)

1.2.3CFD模拟框架设计开发 (13)

1.3研究内容 (15)

1.3.1LBM-FVM耦合模拟数值方法设计 (16)

1.3.2LBM-FVM耦合模拟模拟框架设计 (16)

1.3.3LBM-FVM耦合模拟框架并行优化 (17)

1.3.4耦合模拟求解器设计及验证 (17)

1.4主要创新 (17)

1.5论文组织 (19)

第二章LBM-FVM耦合模拟数值方法 (21)

2.1研究动机 (21)

2.2耦合模拟数值方法整体架构设计 (23)

2.2.1LBM-FVM耦合模拟核心思想 (23)

2.2.2NS方程的LBM模型构造 (24)

2.2.3本构方程的FVM求解过程 (28)

2.3物理参数单位系统及转换机制 (30)

2.3.1方程无量纲化及重要无量纲数 (31)

2.3.2方程离散化及LBGK模型松弛时间 (32)

2.4LBM边界条件及空间耦合机制 (33)

2.4.12D湿边界条件与插值映射 (34)

2.4.22D反弹格式与非插值映射 (36)

2.4.33D曲面边界的处理 (36)

2.5耦合模拟时间步进机制 (38)

2.6耦合模拟详细数值算法 (38)

2.7本章小结 (40)

第三章LBM-FVM耦合模拟框架设计 (41)

3.1技术基础及设计思路 (41)

3.2耦合模拟框架整体架构设计 (43)

3.3网格及场格式设计 (45)

3.3.1FVM网格描述及场结构 (45)

3.3.2LBM网格描述及场结构 (47)

3.4数据求解模块设计 (48)

3.4.1FVM求解模块接口设计 (48)

3.4.2LBM求解模块接口设计 (49)

3.5SPMD并行模式设计 (51)

3.6耦合模块设计 (54)

3.6.1单位转换模块设计 (54)

3.6.2空间耦合模块设计 (55)

3.6.3时间耦合方式设计 (58)

3.7基本IO系统及错误恢复机制设计 (59)

3.8本章小结 (61)

第四章耦合模拟自适应稀疏块图划分技术 (63)

4.1面向单一数值算法的并行划分方法 (63)

4.2耦合并行划分问题描述 (64)

4.3面向耦合模拟的自适应稀疏块图划分算法 (67)

4.3.1耦合模拟并行划分问题的图建模 (67)

4.3.2ASBMetis图划分算法 (69)

4.3.3划分结果评价指标 (71)

4.3.4ASBMetis的实现架构 (72)

4.4实验验证 (74)

4.5本章小结 (76)

第五章耦合模拟多级混合并行优化技术 (79)

5.1研究现状及动机 (79)

5.2并行通信架构及对可扩展性影响 (81)

5.3耦合模拟的MPI与OpenMP混合并行技术 (83)

5.3.1LBM模块和耦合模块的混合并行实现 (85)

5.3.2FVM模块的混合并行实现 (86)

5.4实验验证 (89)

5.5本章小结 (93)

第六章LBM-FVM耦合模拟实验验证 (95)

6.1ILFVE机制验证 (96)

6.1.1有效性验证 (96)

6.1.2模拟效率 (106)

6.2IBLF-dts机制验证 (106)

6.2.1有效性验证 (107)

6.2.2模拟效率 (112)

第七章结束语 (117)

7.1研究工作总结 (117)

7.2课题研究展望 (119)

致谢 (121)

参考文献 (123)

作者在学期间取得的学术成果 (135)

国防科学技术大学研究生院博士学位论文

表目录

表2.1无量纲化过程中的特征参数选择(P系统) (31)

表2.2离散化过程中的离散物理量δ?的选择(D系统) (33)

表3.1FVM模块中对PDE各项的描述形式及相关说明 (49)

表3.2常见碰撞函数类型定义 (50)

表3.3单位转换模块几类基本调用接口 (55)

表3.4空间转换模块接口 (58)

表3.5耦合模块函数调用接口 (59)

表5.1性能探针对耦合求解器各关键执行部分的命名及含义 (90)

表5.2性能探针对Oldroyd-B模型方程离散的命名 (91)

表6.1Mesh information (103)

表6.2Mesh4Oldroyd-B流体数值模拟结果 (105)

图目录

图1.11993年6月至2015年6月TOP500高性能计算平台性能发展趋势 (4)

图1.22005年11月至2015年6月TOP10高性能计算平台的系统平均核数

与最大核数 (5)

图2.1典型的二位DnQm网格:D2Q5(左)和D2Q9(右)。其中矢量箭

头表示离散速度方向c i,c0=(0,0)是静止速度 (25)

图2.2有限体积法中空间离散的相关参数 (28)

图2.3P,D,和LBM系统之间的参数转换过程 (30)

图2.42D湿边界条件下FVM和LBM网格映射关系。其中实心圆点表示FVM控制体积中心,而交叉表示LBM网格点 (35)

图2.5LBM和FVM网格之间的空间插值关系。其中VOL和PT分别表示FVM体网格和LBM的点网格,r是网格节点之间的距离矢量,小标为0的

参数为插值的目标点,其他的插值使用的源点 (35)

图2.6LBM反弹边界条件下FVM和LBM网格映射关系,其中实心圆点

表示FVM控制体积中心,而交叉表示LBM网格点,L是网格尺寸 (36)

图2.7采用Guo插值外推格式下的FVM和LBM网格映射关系,虚线框为

模拟区域的一部分。其中实心圆点表示Lattice和FVM体中心重合的点,矩

形表示FVM的网格单元(cell) (37)

图2.8LBM与FVM异时间步长耦合机制 (39)

图3.1OpenFOAM框架基本模块构成 (42)

图3.2LBM-FVM耦合模框架总体架构设计及重要模块构成 (44)

图3.3基于LBM-FVM耦合模框架实现的粘弹流模拟流程 (45)

图3.4FVM体网格数据结构描述 (46)

图3.5LBM块状结构笛卡尔网格描述 (47)

图3.6基于SPMD的耦合并行模拟架构 (52)

图3.72D平直边界下LBM网格点和FVM网格点的空间映射索引关系构建57图3.83D曲面边界下LBM网格点和FVM网格点的空间映射索引关系构建59图3.9耦合模拟框架的分层IO架构 (60)

图4.1FVM算法和LBM算法的块拓扑关系,其中实线箭头表示LBM块

间通信,虚线箭头表示FVM块间通信,L envp表示块之间的覆盖宽度 (66)

图4.2自适应稀疏块图划分算法(ASBMetis)的基本思想 (68)

图4.3ASBMetis算法迭代收敛性 (74)

图4.4ASBMetis算法与其他划分算法在不同并行度下负载不均衡度比较 (75)

图4.5ASBMetis算法与其他划分算法在不同并行度下总通信量比较 (76)

图4.6ASBMetis算法与其他划分算法在不同并行度下最大进程通信量比较.77图5.1LBM与隐式FVM耦合模拟的基本流程 (79)

图5.2FVM方法和LBM-FVM耦合模拟方法可扩展性测试。耦合模拟的FVM求解部分采取隐式机制进行空间离散 (83)

图5.3LBM-FVM耦合模拟框架多级混合并行框架设计 (83)

图5.4LBM块覆盖区(block overlap)操作的计算/通信隐藏 (86)

图5.5LBM-隐式FVM模拟中各步骤所占时间比例,其中FVM采用隐式

离散,线性代数求解器为PBiCG,N t=10 (91)

图5.6耦合求解器中FVM模拟各部分线程级并行可扩展性 (92)

图5.7Oldroyd-B模型FVM离散各部分所占时间比例 (92)

图5.8耦合求解器中耦合操作各部分线程级并行可扩展性 (93)

图5.9耦合求解器中LBM模拟各部分线程级并行可扩展性 (93)

图5.10耦合求解器中整体线程级并行可扩展性 (94)

图6.1二维Poiseuille流benchmark的几何外形。其中a x为驱动流体的外

力,u0为x方向的最大稳定中心速度 (96)

图6.2N=100,β=0.1,Re=1,Wi=1时,Odroyd-B模型Poiseuille流直管

中心线上瞬时解与解析解的比较情况 (98)

图6.3N=100,β=0.1,Re=1,Wi=0.1/1时,稳态速度u x沿y轴分布情况98图6.4N=100,β=0.1,Re=1,Wi=0.1/1时,稳态粘弹应力分量τxx(左)

和τxx(右)沿y轴分布情况 (99)

图6.5Wi=1.0,Re=1.0,β=0.2情况下,u x,τxx,τxy的L2误差与网格分

辨率N的关系 (99)

图6.6β=0.1,Re=10,Wi=1时,FVM PISO机制与ILFVE机制u x瞬时

解在x=h0/4(左列)与y=h0/2(右列)位置,t=0(上)、t=λ/2(中)

与t=λ(下)时刻的比较情况 (101)

图6.7N=100,Re=10时,Taylor-Green涡的动能和弹性势能随时间变化

情况。粘性流体的动力粘度设置为溶液动力粘度,粘弹流体中β=0.1,Wi= 10 (102)

图6.8Wi=1/10Re=10β=0.1N=20/100时,采用线性PTT模型情况下,Taylor-Green涡的动能和弹性势能随时间变化情况 (102)

图6.94:1收缩流的几何外形 (103)

图6.10β=1/9,Re=1,Wi=1,t=λ时刻,管道中心线上(?16h2

16h2),FVM PISO机制与ILFVE机制的瞬时速度u x(左)与法向应力差

τyy?τxx(右)比较 (104)

图6.11β=1/9,Oldroyd-B模型流体中,Wi数对角涡结构影响 (105)

图6.12β=1/9,Oldroyd-B模型流体中,Couette校正值变化情况 (106)

图6.13同样模拟配置下FVM PISO算法与ILFVE机制模拟时间比较 (107)

图6.14Re=1,Wi=0.5/1,N t=50/100时,直管中心线上IBLF-dts机制速

度瞬时解与解析解比较。 (108)

图6.15Re=1,Wi=0.5/1,N t=50/100时,直管壁面上IBLF-dts机制粘弹

应力分量τxx、τxy瞬时解与解析解比较 (108)

图6.16Wi=0.5/1,N t=50/100时,y轴方向上IBLF-dts机制稳态速度数值

解与解析解比较 (109)

图6.17Wi=0.5/1,N t=50/100时,y轴方向上IBLF-dts机制稳态粘弹应力

分量τxx、τxy数值解与解析解比较 (109)

图6.18Wi=0.1时,IBLF-dts机制数值误差与空间分辨率的关系。 (110)

图6.19Wi=0/0.5/1,N t=50/100时,Taylor-Green涡的动能随时间变化情

况,所有用例中剪切粘度配置相同 (110)

图6.20Re=1,Wi=0.5/1,N t=50/100时,IBLF-dts机制与FVM PISO机制

得到的Taylor-Green涡动能和弹性势能演化情况 (111)

图6.21Wi=0.1/1,N t=10/100时,IBLF-dts机制得到的顶盖驱动流流线分布 (112)

图6.22Wi=0.1/1,N t=10/100时,IBLF-dts机制得到的顶盖驱动流粘弹应

力分量τxx与τxy等值线分布 (113)

图6.23不同benchark及空间分辨率下,ILFVE机制不同步骤模拟时间比较..114图6.24不同benchark中IBLF-dts机制模拟时间与ILFVE机制模拟时间比

较。试验配置相同,模拟时间使用ILFVE机制模拟时间进行归一化 (114)

图6.25N t=1/10/50/100,不同benchark中IBLF-dts的模拟时间与FVM PISO机制比较。试验配置相同,模拟时间使用ILFVE机制模拟时间进行归

一化 (115)

相关主题
文本预览
相关文档 最新文档