曙光高性能集群系统使用及管理-201408
- 格式:pptx
- 大小:4.71 MB
- 文档页数:50
云南大学高性能计算中心曙光集群系统使用指南1、使用SSH客户端软件用在高性能计算中心申请的用户名和密码登录到集群系统(Windows系统可使用SSHSecureShellClient-3.2.9软件包,下载地址/structure/download Linux系统可直接使用ssh命令登录)。
登录成功后你所在的节点是登录节点,系统会有一些通知信息显示,操作提示符是[username@node34 ~]$。
这个节点是作用户帐号管理,不要在上面运行程序。
2、编译与调试程序请用rsh转到相关作业区节点。
本集群系统共有32个计算节点(每个节点有4个CPU 8G 内存),分为4个作业区。
小作业区small包含4个节点(node1..node4),中型作业区medium包含8个节点(node5..node13),专用作业区long包含8个节点(node13..node20),大作业区large包含12个节点(node21..node32)。
每一个作业区的第一个节点该作业区的服务节点,small为node1,medium为node5,long为node13,large为node21。
例如从登录节点转到一号节点:[hbli@node34 ~]$rsh node1Last login: Mon Aug 28 15:33:16 from node34[hbli@node1 ~]$3、编译链接、运行用户程序串行程序可使用GCC或PGI编译器,并行程序可使用mpicc, mpiCC, mpif77,mpif90进行编译。
以下是一个c使用mpi的例子:/* hello.c *//* MPI sample c program *//* compile "with mpicc -o hello hello" *//* run with "mpirun -np 8 hello" *//* or submit with pbs script "qsub hello.pbs" *//* you can use "qstat" to dislay your job statusa */#include <stdio.h>#include "mpi.h"int main( argc, argv )int argc;char **argv;{int rank, size;MPI_Init( &argc, &argv );MPI_Comm_size( MPI_COMM_WORLD, &size );MPI_Comm_rank( MPI_COMM_WORLD, &rank );printf( "Hello world from process %d of %d\n", rank, size );MPI_Finalize();return 0;}可以用如下命令对上面的程序进行编译:$ [hbli@node1 sample]mpicc –o hello hello.c生成可运行的文件hello,用ls –l 命令可以看到生成的可执行文件:$ [hbli@node1 sample]ls –l-rwxrwxr-x 1 hbli hbli 507375 Oct 10 10:39 hello-rw-r--r-- 1 hbli hbli 532 Jun 20 08:01 hello.c这样就可运行hello 这个程序了。
曙光航空航天高性能计算方案摘要CFD-FASTRAN软件是由CFDRC公司与美国NASA联合开发的专门用于航空航天领域空气动力学计算的CFD软件,该软件可广泛应用于飞行器的亚、跨、超和高超音速的气动力学计算和一些特殊气体动力学问题如直升机旋翼、导弹发射、座舱弹射、投弹、机动和气动弹性等。
本文针对航空航天高性能计算提出了一套完整的集群解决方案,并在此平台上对FASTRAN并行性能进行了详细的测试。
测试结果表明,FASTRAN软件可以方便的部署和运行于曙光集群系统,并能够获得令人满意的加速比。
关键字CFD,FASTRAN,并行,航空航天1.FASTRAN介绍CFD-FASTRAN是CFDRC公司与美国NASA联合开发的专门用于航空航天领域空气动力学计算的CFD软件,在当前所有为航空航天设计的计算流体力学软件中位于前列,被广泛应用于飞行器的亚、跨、超和高超音速的气动力学计算和一些特殊气体动力学问题如直升机旋翼、导弹发射、座舱弹射、投弹、机动和气动弹性等。
CFD-FASTRAN 具有挑战性的功能是将基于密度的可压缩欧拉方程和N-S方程同多体运动力学、有限反应率化学和非平衡传热学耦合起来,解决一系列极为复杂的航空航天问题。
CFD-FASTRAN具有强大的技术优势,它体现在:@多年同美国国家航空和宇宙航行局(NASA),美国能源部(DOE),美国国家科学基金会(NSF)等机构的合作,使CFD-FASTRAN不断得到完善和发展。
@CFD-FASTRAN专门针对航空航天设计,可以计算包括超高速流动,移动体,气动热化学和气弹等复杂艰辛的课题。
@CFD-FASTRAN充分考虑了行业的需要,开发出航空航天工程师所需要的前处理、后处理程序。
正是基于上述原因,使得FASTRAN在全球拥有巨大的用户数量并获得了广泛的认可。
在美国军方,CFD-FASTRAN软件一直用于先进战斗机的设计,其中著名的应用案例包括F-16战斗机翼身气动弹性分析、Martin Baker MK16座椅弹射设计、F/A18杰达姆投弹模拟设计以及X34机高超音速激波模拟设计等,如下图所示。
1. 登录和文件传输登录方式为ssh,与telnet功能类似,推荐的登录工具为putty或者Secure Shell (/html/download/ser/20070917/35112.html,绿色版无需安装)在地址栏输入本集群的登录地址(node1对应的局域网IP),点击“打开”,就会出现登录窗口,输入用户名、密码即可。
文件传输为sftp,与传统ftp类似,但其协议更安全可靠,推荐工具为filezilla。
(https:///p/filezilla/download?filename=FileZilla_3.3.2_win32.zip,绿色版无需安装)输入登录地址222.222.21.29,输入用户名和密码,端口填22(本软件支持ftp,端口为21),点击快速连接,即可使用,操作办法与常用ftp工具类似。
2. 图形窗口支持Linux推荐使用vnc。
vnc可以将用户的操作状态保持在服务器端,即使断开连接也不会影响到正在进行的操作、计算等。
登录到linux服务器中,在命令行运行vncserver。
第一次运行时需要输入VNC登陆用的密码:根据提示输入新的vnc密码。
此密码与用户登录密码无关,将在登录vnc时需要。
此处提示的node1:2即为vnc成功打开的端口。
运行vncclient,输入登录服务器地址和端口号,点确定,输入前面设置的密码,即进入了图形窗口。
注意:1、在第一次启动了vncserver之后,vnc的连接一直可用,全部图形窗口保持在Linux 服务器上。
因此,只在每次服务器重新启动后运行一次vncserver即可,由于用户较多,请勿启动多个。
2、如果需要使用node2的图形界面,可执行ssh -X node2。
3. 作业提交3.1. Fluent3.1.1. 图形方式运行首先通过VNC登陆到图形界面,如果没有Terminal的话在桌面点击左键选择Xterm,输入以下命令即可运行:此处myhosts为用户指定的host文件,内容如下所示:node1node1node1node1node2node2node2node2-t8即指定8个核心参与计算,分别为node1上的4个核心和node2上的4个核心。
高性能集群系统并行环境配置手册前提:1.在本文中,举例集群中的控制节点的名字为:mu01,计算节点的名字为:cu01、cu02……2.实施之前,需要把selinux关掉,把kerberos的rsh屏蔽掉,方法:关闭selinux:cd /etc/selinuxvi config 改为:SELINUX=disabled屏蔽rshcd /usr/kerberos/binmv rsh rsh.original以上操作需要在所有机器上执行,完成以上操作后需要把机器重起一下。
一、配置rsh开启root用户对所有节点的rsh权限1、编辑/etc/hosts,加入所有(包括本机的)节点的ip地址和对应的计算机名;此文件在一台机器上编辑完毕可以拷贝到别的节点上使用;注意127.0.0.1这一行不要动,否则会影响到nis的正常使用。
例如:192.168.0.100 mu01192.168.0.1 cu01192.168.0.2 cu022、编辑/root/.rhosts和/etc/hosts.equiv,加入所有节点的计算机名例如:mu01cu01cu023、开启rsh服务:setup→system services→[*]rsh[*]rlogin[*]rexec去掉sendmail(影响OS启动速度,并非必需)。
4、编辑/etc/securetty,加入rsh,rexec,rlogin(在文件后面添加就可以)5、重起服务service xinetd restartrsh的配置需要在所有节点上进行。
二、ssh的配置方法1、在mu01上以root登录,然后运行ssh-keygen –t dsa,目的是简单的在/root下创建目录.ssh,当提示输入passphase时打入两次回车。
这将生成/root/.ssh/id_dsa和/root/.ssh/id_dsa.pub2、在cu01上以root登录,运行ssh-keygen –t dsa,然后在mu01上运行scp/root/.ssh/ id_dsa.pub cu01:/root/.ssh/authorized_keys2,在cu01的/root/.ssh/目录下运行cat id_dsa.pub 〉〉authorized_keys2,再运行scp authorized_keys2 cu02:/root/.ssh/3、在cu02的/root/.ssh/目录下运行cat id_dsa.pub 〉〉authorized_keys2,再运行scp authorized_keys2 cu03:/root/.ssh/4、重复以上步骤在后面结点上,在最后的计算节点上将生成一个完整的authorized_keys2文件,然后把authorized_keys2文件用scp命令拷贝到其余所有节点的/root/.ssh/目录下,ssh配置完成。
曙光服务器典型配置曙光服务器是一种高性能、稳定可靠的服务器,广泛应用于各个行业领域。
在进行服务器配置的过程中,合理选择和搭配不同的硬件和软件是非常重要的。
本文将介绍曙光服务器的典型配置,包括硬件和软件方面的内容。
一、硬件配置1. 处理器曙光服务器采用Intel Xeon系列处理器,这是一款专为服务器设计的高性能处理器。
其拥有强大的计算能力和多核心技术,能够满足大规模计算和数据处理的需求。
处理器的选择应根据服务器用途和预算来决定,不同型号的处理器有着不同的性能和价格。
2. 内存内存是服务器性能的关键因素之一。
曙光服务器通常配备大容量的内存,以确保服务器能够高效地处理大量的数据和请求。
一般来说,服务器内存的容量应该根据实际需求来选择,同时考虑到扩展性和可靠性。
3. 存储曙光服务器常采用固态硬盘(SSD)作为主要存储介质,以提供更高的读写速度和更好的稳定性。
此外,还可以配置多个硬盘进行数据冗余备份,以保证数据的安全性。
存储容量的大小应根据实际需求来确定,同时要考虑到性能和可靠性。
4. 网卡曙光服务器通常配备高速网卡,以提供快速的网络连接和高效的数据传输。
网卡的选择应根据服务器应用场景和网络需求来确定,例如千兆以太网、万兆以太网等。
5. 电源供应曙光服务器应配备稳定可靠的电源供应系统,以提供持续稳定的电力支持。
同时,应考虑到能源效率和电力管理等方面的要求,以提高服务器的整体性能。
二、软件配置1. 操作系统曙光服务器可以选择不同的操作系统,如Windows Server、Linux 等。
操作系统的选择应根据实际需求和个人偏好来确定,其中Linux是一种常用的选择,具有高度的稳定性和安全性。
2. 数据库管理系统曙光服务器的配置还需要考虑数据库管理系统(DBMS),如MySQL、Oracle等。
DBMS负责管理和存储大量的数据,并提供对数据的高效访问和查询功能。
根据具体需求选择适合的DBMS版本和配置参数,以提升数据库性能和可靠性。
1. 登录和文件传输登录方式为ssh, 与telnet功能类似, 推荐的登录工具为putty或者Secure Shell( , 绿色版无需安装)在地址栏输入本集群的登录地址(node1对应的局域网IP), 点击”打开”, 就会出现登录窗口, 输入用户名、密码即可。
文件传输为sftp, 与传统ftp类似, 但其协议更安全可靠, 推荐工具为filezilla。
( , 绿色版无需安装)输入登录地址222.222.21.29, 输入用户名和密码, 端口填22( 本软件支持ftp, 端口为21) , 点击快速连接, 即可使用, 操作办法与常见ftp工具类似。
2. 图形窗口支持Linux推荐使用vnc。
vnc能够将用户的操作状态保持在服务器端, 即使断开连接也不会影响到正在进行的操作、计算等。
登录到linux服务器中, 在命令行运行vncserver。
第一次运行时需要输入VNC登陆用的密码:根据提示输入新的vnc密码。
此密码与用户登录密码无关, 将在登录vnc时需要。
此处提示的node1:2即为vnc成功打开的端口。
运行vncclient, 输入登录服务器地址和端口号, 点确定, 输入前面设置的密码, 即进入了图形窗口。
注意:1、在第一次启动了vncserver之后, vnc的连接一直可用, 全部图形窗口保持在Linux服务器上。
因此, 只在每次服务器重新启动后运行一次vncserver即可, 由于用户较多, 请勿启动多个。
2、如果需要使用node2的图形界面, 可执行ssh -X node2。
3. 作业提交3.1. Fluent3.1.1. 图形方式运行首先经过VNC登陆到图形界面, 如果没有Terminal的话在桌面点击左键选择Xterm, 输入以下命令即可运行:此处myhosts为用户指定的host文件, 内容如下所示:node1node1node1node1node2node2node2node2-t8即指定8个核心参与计算, 分别为node1上的4个核心和node2上的4个核心。
高性能计算集群的使用方法及性能调优高性能计算集群是一种用于处理大规模计算任务的分布式计算环境。
它能够利用多台计算机的计算资源来达到高性能计算的目的。
对于需要进行大规模数据处理、复杂模拟与计算的任务,如天气预测、基因序列分析等,使用高性能计算集群可以显著提升计算效率。
本文将介绍高性能计算集群的使用方法以及性能调优的一些技巧,帮助用户充分利用集群资源,提高计算效率。
一、高性能计算集群的使用方法1.选择合适的集群:在选择使用高性能计算集群之前,需要根据自己的任务需求和预算来选择合适的集群。
可以考虑集群的硬件配置、网络带宽、存储容量等因素,以及集群提供的服务支持。
2.提交任务:在使用高性能计算集群之前,需要准备好需要计算的任务。
一般来说,任务会被拆分为多个小的计算单元,每个计算单元可以在集群中的不同节点上运行。
可以使用集群提供的作业调度系统来提交任务。
3.编写任务脚本:在提交任务之前,需要编写一个任务脚本。
这个脚本可以用来描述任务的运行环境、所需资源以及运行的流程。
脚本可以使用编程语言或者脚本语言编写,提供了一个自动化的方式来管理和运行任务。
4.调试和优化:在提交任务之后,可以通过监控任务的运行状态来进行调试和优化。
可以根据任务的运行日志来分析任务的瓶颈,找出性能瓶颈并进行优化。
5.结果分析:在任务完成之后,需要对结果进行分析。
可以使用数据分析工具来处理和可视化结果,以便更好地理解和解释结果。
二、高性能计算集群的性能调优1.任务并行化:高性能计算集群通常有多个计算节点,可以将任务拆分为多个子任务,并将这些子任务分配到不同的计算节点上并行运行。
通过合理划分任务,可以充分利用集群的计算资源,提高计算效率。
2.数据分区与通信优化:针对需要处理大规模数据的任务,在划分任务的同时,还需要考虑数据的分布和通信的开销。
可以将数据分布在集群的不同节点上,以减少数据传输的开销。
同时,可以选择合适的通信模式和算法来减少通信的延迟和带宽占用。
高性能计算集群(PC Cluster)用户指南大气科学系应越第二版2008-12目录-认识cluster-使用cluster-linux常用命令-软件-文件传输第一章:认识cluster1.什么是cluster系统cluster一般由一台主机(master)和多台节点机(node)构成,是一种松散耦合的计算节点集合。
为用户提供网络服务或应用程序的单一客户视图,同时提供接近容错机的故障恢复能力。
通常cluster的每台机器通过相应的硬件及软件互连,每个群集节点都是运行其自己进程的独立服务器。
这些进程可以彼此通信,对网络客户机来说就像是形成了一个单一系统,协同起来向用户提供应用程序、系统资源和数据。
cluster概念的提出在70年代主要是为了进行一些大运算量的科学计算。
随着网络的发展,之后的cluster系统还被用作网络服务器,发挥其故障恢复和均衡负载的能力。
使用PC机构建cluster的好处在于开发成本低,而且由于每台节点机都是普通的PC机,在某一台机器发生故障的时候,可以方便的进行维护,而不影响整个系统的运行。
大气科学系的cluster系统,由16台64位的PC机组成。
其中一台主机(master),15台节点机(node01∼node15)。
这16台机器每台有两个4核的CPU,也就是说每个节点上可以同时提供8个CPU。
操作系统使用的是CentOS的Linux发行版。
图1为大气科学系cluster目前的结构。
其中console 和c0101∼c0107是大气系早期的cluster系统,节点安装的是RedHat的Linux发行版,precluster曾经作为门户机,目前已经更新为CentOS的操作系统。
登录master的IP地址为162.105.245.3,这个地址由于物理大楼的IP变动比较频繁,所以可能会时不时改变,而precluster的IP地址162.105.245.238则比较稳定。
这两个地址目前都可以从校外访问。
曙光集群系统(Pluto)简明用户手册(第2版)1.系统介绍曙光集群系统(命名为Pluto)共有172个计算节点(140个刀片节点,16个MIC节点,16个GPU节点),5个登录节点。
集群系统所有登录节点和计算节点的操作系统均为64位Redhat7.2。
系统采用Intel Omni-Path高速计算网络,曙光Parastor200全局并行存储系统。
全系统峰值性能为211.2Tflop/s。
计算节点的硬件配置如下:●所有刀片计算节点、MIC计算节点、GPU计算节点均配置2颗Intel E5-2680 v3处理器,每个处理器12核,每节点共24核;64 GB DDR4 ECC 2133MHz内存。
●每台MIC计算节点配置1块Intel Xeon Phi 5110P加速卡(1.011TFlops)。
●每台GPU计算节点配置1块NVIDIA TESLA K80 GPGPU加速卡(2.911TFlops)。
2.系统登录及文件传输2.1.系统登录首先使用Xshell、SecureCRT等软件登录到前端机(IP:218.249.35.43)。
登陆进前端机后,再用命令ssh 帐号@pluto登录到新曙光(pluto)系统。
2.2.文件拷贝用scp命令在前端机与新曙光(pluto)之间完成文件拷贝,新老曙光系统间的文件拷贝同样用scp命令。
3.程序编译运行环境集群系统部署的编译器既包含Linux操作系统自带的GNU c/c++/fortran(版本4.8.5)编译器,也提供了Intel/MPI多个版本的c/c++/fortran的编译器,以及支持NVIDIA GPU 程序编译的CUDA toolkit。
此外,集群系统还部署了Mvapich2/OpenMPI/IntelMPI等多个版本的MPI 库,可以支持OpenMP和MPI两种并行方式。
3.1.环境变量设置方法用户可以采用下面的方法来快速设置环境变量:方法一、运行脚本文件加载环境变量。