曙光高性能集群系统使用及管理-201408
- 格式:pptx
- 大小:4.71 MB
- 文档页数:50
云南大学高性能计算中心曙光集群系统使用指南1、使用SSH客户端软件用在高性能计算中心申请的用户名和密码登录到集群系统(Windows系统可使用SSHSecureShellClient-3.2.9软件包,下载地址/structure/download Linux系统可直接使用ssh命令登录)。
登录成功后你所在的节点是登录节点,系统会有一些通知信息显示,操作提示符是[username@node34 ~]$。
这个节点是作用户帐号管理,不要在上面运行程序。
2、编译与调试程序请用rsh转到相关作业区节点。
本集群系统共有32个计算节点(每个节点有4个CPU 8G 内存),分为4个作业区。
小作业区small包含4个节点(node1..node4),中型作业区medium包含8个节点(node5..node13),专用作业区long包含8个节点(node13..node20),大作业区large包含12个节点(node21..node32)。
每一个作业区的第一个节点该作业区的服务节点,small为node1,medium为node5,long为node13,large为node21。
例如从登录节点转到一号节点:[hbli@node34 ~]$rsh node1Last login: Mon Aug 28 15:33:16 from node34[hbli@node1 ~]$3、编译链接、运行用户程序串行程序可使用GCC或PGI编译器,并行程序可使用mpicc, mpiCC, mpif77,mpif90进行编译。
以下是一个c使用mpi的例子:/* hello.c *//* MPI sample c program *//* compile "with mpicc -o hello hello" *//* run with "mpirun -np 8 hello" *//* or submit with pbs script "qsub hello.pbs" *//* you can use "qstat" to dislay your job statusa */#include <stdio.h>#include "mpi.h"int main( argc, argv )int argc;char **argv;{int rank, size;MPI_Init( &argc, &argv );MPI_Comm_size( MPI_COMM_WORLD, &size );MPI_Comm_rank( MPI_COMM_WORLD, &rank );printf( "Hello world from process %d of %d\n", rank, size );MPI_Finalize();return 0;}可以用如下命令对上面的程序进行编译:$ [hbli@node1 sample]mpicc –o hello hello.c生成可运行的文件hello,用ls –l 命令可以看到生成的可执行文件:$ [hbli@node1 sample]ls –l-rwxrwxr-x 1 hbli hbli 507375 Oct 10 10:39 hello-rw-r--r-- 1 hbli hbli 532 Jun 20 08:01 hello.c这样就可运行hello 这个程序了。
曙光航空航天高性能计算方案摘要CFD-FASTRAN软件是由CFDRC公司与美国NASA联合开发的专门用于航空航天领域空气动力学计算的CFD软件,该软件可广泛应用于飞行器的亚、跨、超和高超音速的气动力学计算和一些特殊气体动力学问题如直升机旋翼、导弹发射、座舱弹射、投弹、机动和气动弹性等。
本文针对航空航天高性能计算提出了一套完整的集群解决方案,并在此平台上对FASTRAN并行性能进行了详细的测试。
测试结果表明,FASTRAN软件可以方便的部署和运行于曙光集群系统,并能够获得令人满意的加速比。
关键字CFD,FASTRAN,并行,航空航天1.FASTRAN介绍CFD-FASTRAN是CFDRC公司与美国NASA联合开发的专门用于航空航天领域空气动力学计算的CFD软件,在当前所有为航空航天设计的计算流体力学软件中位于前列,被广泛应用于飞行器的亚、跨、超和高超音速的气动力学计算和一些特殊气体动力学问题如直升机旋翼、导弹发射、座舱弹射、投弹、机动和气动弹性等。
CFD-FASTRAN 具有挑战性的功能是将基于密度的可压缩欧拉方程和N-S方程同多体运动力学、有限反应率化学和非平衡传热学耦合起来,解决一系列极为复杂的航空航天问题。
CFD-FASTRAN具有强大的技术优势,它体现在:@多年同美国国家航空和宇宙航行局(NASA),美国能源部(DOE),美国国家科学基金会(NSF)等机构的合作,使CFD-FASTRAN不断得到完善和发展。
@CFD-FASTRAN专门针对航空航天设计,可以计算包括超高速流动,移动体,气动热化学和气弹等复杂艰辛的课题。
@CFD-FASTRAN充分考虑了行业的需要,开发出航空航天工程师所需要的前处理、后处理程序。
正是基于上述原因,使得FASTRAN在全球拥有巨大的用户数量并获得了广泛的认可。
在美国军方,CFD-FASTRAN软件一直用于先进战斗机的设计,其中著名的应用案例包括F-16战斗机翼身气动弹性分析、Martin Baker MK16座椅弹射设计、F/A18杰达姆投弹模拟设计以及X34机高超音速激波模拟设计等,如下图所示。
1. 登录和文件传输登录方式为ssh,与telnet功能类似,推荐的登录工具为putty或者Secure Shell (/html/download/ser/20070917/35112.html,绿色版无需安装)在地址栏输入本集群的登录地址(node1对应的局域网IP),点击“打开”,就会出现登录窗口,输入用户名、密码即可。
文件传输为sftp,与传统ftp类似,但其协议更安全可靠,推荐工具为filezilla。
(https:///p/filezilla/download?filename=FileZilla_3.3.2_win32.zip,绿色版无需安装)输入登录地址222.222.21.29,输入用户名和密码,端口填22(本软件支持ftp,端口为21),点击快速连接,即可使用,操作办法与常用ftp工具类似。
2. 图形窗口支持Linux推荐使用vnc。
vnc可以将用户的操作状态保持在服务器端,即使断开连接也不会影响到正在进行的操作、计算等。
登录到linux服务器中,在命令行运行vncserver。
第一次运行时需要输入VNC登陆用的密码:根据提示输入新的vnc密码。
此密码与用户登录密码无关,将在登录vnc时需要。
此处提示的node1:2即为vnc成功打开的端口。
运行vncclient,输入登录服务器地址和端口号,点确定,输入前面设置的密码,即进入了图形窗口。
注意:1、在第一次启动了vncserver之后,vnc的连接一直可用,全部图形窗口保持在Linux 服务器上。
因此,只在每次服务器重新启动后运行一次vncserver即可,由于用户较多,请勿启动多个。
2、如果需要使用node2的图形界面,可执行ssh -X node2。
3. 作业提交3.1. Fluent3.1.1. 图形方式运行首先通过VNC登陆到图形界面,如果没有Terminal的话在桌面点击左键选择Xterm,输入以下命令即可运行:此处myhosts为用户指定的host文件,内容如下所示:node1node1node1node1node2node2node2node2-t8即指定8个核心参与计算,分别为node1上的4个核心和node2上的4个核心。
高性能集群系统并行环境配置手册前提:1.在本文中,举例集群中的控制节点的名字为:mu01,计算节点的名字为:cu01、cu02……2.实施之前,需要把selinux关掉,把kerberos的rsh屏蔽掉,方法:关闭selinux:cd /etc/selinuxvi config 改为:SELINUX=disabled屏蔽rshcd /usr/kerberos/binmv rsh rsh.original以上操作需要在所有机器上执行,完成以上操作后需要把机器重起一下。
一、配置rsh开启root用户对所有节点的rsh权限1、编辑/etc/hosts,加入所有(包括本机的)节点的ip地址和对应的计算机名;此文件在一台机器上编辑完毕可以拷贝到别的节点上使用;注意127.0.0.1这一行不要动,否则会影响到nis的正常使用。
例如:192.168.0.100 mu01192.168.0.1 cu01192.168.0.2 cu022、编辑/root/.rhosts和/etc/hosts.equiv,加入所有节点的计算机名例如:mu01cu01cu023、开启rsh服务:setup→system services→[*]rsh[*]rlogin[*]rexec去掉sendmail(影响OS启动速度,并非必需)。
4、编辑/etc/securetty,加入rsh,rexec,rlogin(在文件后面添加就可以)5、重起服务service xinetd restartrsh的配置需要在所有节点上进行。
二、ssh的配置方法1、在mu01上以root登录,然后运行ssh-keygen –t dsa,目的是简单的在/root下创建目录.ssh,当提示输入passphase时打入两次回车。
这将生成/root/.ssh/id_dsa和/root/.ssh/id_dsa.pub2、在cu01上以root登录,运行ssh-keygen –t dsa,然后在mu01上运行scp/root/.ssh/ id_dsa.pub cu01:/root/.ssh/authorized_keys2,在cu01的/root/.ssh/目录下运行cat id_dsa.pub 〉〉authorized_keys2,再运行scp authorized_keys2 cu02:/root/.ssh/3、在cu02的/root/.ssh/目录下运行cat id_dsa.pub 〉〉authorized_keys2,再运行scp authorized_keys2 cu03:/root/.ssh/4、重复以上步骤在后面结点上,在最后的计算节点上将生成一个完整的authorized_keys2文件,然后把authorized_keys2文件用scp命令拷贝到其余所有节点的/root/.ssh/目录下,ssh配置完成。
曙光服务器典型配置曙光服务器是一种高性能、稳定可靠的服务器,广泛应用于各个行业领域。
在进行服务器配置的过程中,合理选择和搭配不同的硬件和软件是非常重要的。
本文将介绍曙光服务器的典型配置,包括硬件和软件方面的内容。
一、硬件配置1. 处理器曙光服务器采用Intel Xeon系列处理器,这是一款专为服务器设计的高性能处理器。
其拥有强大的计算能力和多核心技术,能够满足大规模计算和数据处理的需求。
处理器的选择应根据服务器用途和预算来决定,不同型号的处理器有着不同的性能和价格。
2. 内存内存是服务器性能的关键因素之一。
曙光服务器通常配备大容量的内存,以确保服务器能够高效地处理大量的数据和请求。
一般来说,服务器内存的容量应该根据实际需求来选择,同时考虑到扩展性和可靠性。
3. 存储曙光服务器常采用固态硬盘(SSD)作为主要存储介质,以提供更高的读写速度和更好的稳定性。
此外,还可以配置多个硬盘进行数据冗余备份,以保证数据的安全性。
存储容量的大小应根据实际需求来确定,同时要考虑到性能和可靠性。
4. 网卡曙光服务器通常配备高速网卡,以提供快速的网络连接和高效的数据传输。
网卡的选择应根据服务器应用场景和网络需求来确定,例如千兆以太网、万兆以太网等。
5. 电源供应曙光服务器应配备稳定可靠的电源供应系统,以提供持续稳定的电力支持。
同时,应考虑到能源效率和电力管理等方面的要求,以提高服务器的整体性能。
二、软件配置1. 操作系统曙光服务器可以选择不同的操作系统,如Windows Server、Linux 等。
操作系统的选择应根据实际需求和个人偏好来确定,其中Linux是一种常用的选择,具有高度的稳定性和安全性。
2. 数据库管理系统曙光服务器的配置还需要考虑数据库管理系统(DBMS),如MySQL、Oracle等。
DBMS负责管理和存储大量的数据,并提供对数据的高效访问和查询功能。
根据具体需求选择适合的DBMS版本和配置参数,以提升数据库性能和可靠性。
1. 登录和文件传输登录方式为ssh, 与telnet功能类似, 推荐的登录工具为putty或者Secure Shell( , 绿色版无需安装)在地址栏输入本集群的登录地址(node1对应的局域网IP), 点击”打开”, 就会出现登录窗口, 输入用户名、密码即可。
文件传输为sftp, 与传统ftp类似, 但其协议更安全可靠, 推荐工具为filezilla。
( , 绿色版无需安装)输入登录地址222.222.21.29, 输入用户名和密码, 端口填22( 本软件支持ftp, 端口为21) , 点击快速连接, 即可使用, 操作办法与常见ftp工具类似。
2. 图形窗口支持Linux推荐使用vnc。
vnc能够将用户的操作状态保持在服务器端, 即使断开连接也不会影响到正在进行的操作、计算等。
登录到linux服务器中, 在命令行运行vncserver。
第一次运行时需要输入VNC登陆用的密码:根据提示输入新的vnc密码。
此密码与用户登录密码无关, 将在登录vnc时需要。
此处提示的node1:2即为vnc成功打开的端口。
运行vncclient, 输入登录服务器地址和端口号, 点确定, 输入前面设置的密码, 即进入了图形窗口。
注意:1、在第一次启动了vncserver之后, vnc的连接一直可用, 全部图形窗口保持在Linux服务器上。
因此, 只在每次服务器重新启动后运行一次vncserver即可, 由于用户较多, 请勿启动多个。
2、如果需要使用node2的图形界面, 可执行ssh -X node2。
3. 作业提交3.1. Fluent3.1.1. 图形方式运行首先经过VNC登陆到图形界面, 如果没有Terminal的话在桌面点击左键选择Xterm, 输入以下命令即可运行:此处myhosts为用户指定的host文件, 内容如下所示:node1node1node1node1node2node2node2node2-t8即指定8个核心参与计算, 分别为node1上的4个核心和node2上的4个核心。