当前位置:文档之家› 服务器常见问题技术手册

服务器常见问题技术手册

服务器常见问题技术手册
服务器常见问题技术手册

DELL服务器常见问题技术手册

曙光Gridview服务器管理系统单机版v2.0安装维护手册

曙光Gridview服务器管理系统单机版v2.0 安装维护手册

Gridview1.1 安装维护手册 目录 GRIDVIEW2.0单机版 ............................................................................................. 错误!未定义书签。安装维护手册.. (1) 1、系统安装 (1) 1-1、安装条件 (1) 1-2、G RIDVIEW2.0单机版安装 (1) 1-2--1、安装步骤 (1) 1-2--2、目录结构 (5) 1-2--3、异常处理 (5) 1-3、安装后的验证 (5) 2、系统卸载 (7) 3、系统维护 (8) 3-1、配置文件 (8) 3-1--1、log配置文件 (8) 3-2、运行状态检查 (9) 3-2--1、信息采集服务状态检查 (9) 3-2--2、Tomcat服务运行状态检查 (9) 3-3、系统日志 (9) 3-3--1、采集系统日志 (10)

Gridview1.1 安装维护手册 1、系统安装 1-1、安装条件 本软件支持的硬件设备如下: 本软件支持的操作系统 1-2、Gridview2.0单机版安装 1-2--1、安装步骤 Linux步骤如下: 1.解压缩程序tar包tar xvf gridview_server.tar,进入解压缩之后的gridview_server目录2.进入后,gridview_server.tar.gz及安装脚本install_gridview_server.sh 3.执行脚本sh install_gridview_server.sh,等待脚本执行完成,则完成安装 Windows部署如下: 1.双击Window上的安装文件GridView.exe,出现如下安装界面

十大X86服务器常见故障——硬件篇

十大X86服务器常见故障——硬件篇 ?摘要:由于X86服务器和台式机有着很多相似之处,从前期部署→中期维护→后期管理都有着异曲同工之妙。用得多了,遇到的故障自然不少,以下故障不知大家是否遇到过…… ?标签:X86服务器常见故障 说起X86平台的CPU,我们可能会如数家珍的报出N多种,Inter的至强5600、至强7500,AMD强劲的12核心x86处理器--“Magny-Cours”(马尼库尔)等等。在它的基础上,辅以带ECC、ChipKill、热插拔技术的内存;防止数据异常丢失的RAID硬盘;提供不中断电力供应的冗余电源等等共同构建出一个完整的X86服务器。 由于X86服务器和台式机有着很多相似之处,从前期部署→中期维护→后期管理都有着异曲同工之妙。因此,X86应该算是我们广为熟知的架构了。用得多了,遇到的故障自然不少,以下故障不知大家是否遇到过…… 硬件故障篇 Top10 网卡 服务器网卡 故障回放:近几日,内网用户通过代理服务器进行连接时不太稳定,ping的速度有时低于1ms,有时高达500多ms,数值相差之大也说明了网络时好时坏。起先判断是蠕虫病毒作祟,但经过详细筛查,确定非病毒引发的故障;再对网线进行测试,衰减、串扰、回波损耗等各项技术指标都在正常指标之内,最后更换网卡故障才得以解决。 解决方案:我们知道一款优秀的网卡除了拥有高速率外,还需要关注2个技术指标,TOE(TCPOffloadEngine,TCP减负引擎)技术和RSS(Receive-sideScaling接收端调节)技术,它们能大幅减轻CPU的资源,解决了输入/输出流(I/O)的瓶颈,使网络吞吐大幅提升,这两项技术可以使系统的响应指标的TPS值能提升2.1到2.5倍,所以一块好的网卡是保证服务器快速、稳定连接的保障。 一般来说,网卡出现故障的状况较低,即便是损坏也可以使用独立网卡代替,它的危害程度也不是很高。 危害程度:★★ 控制难度:★

曙光服务器制作RAID文档

曙光服务器raid的配置和系统的灌装 一、开机之后,按ctrl+c进入到磁盘管理前置界面,我们在这个界面会看到 我们总共有12块硬盘。(注:这台服务器在买来之后就已经自带的了RAID 和操作系统。所以下图屏幕上显示的信息不是很准确,但是12块硬盘是准确的。)

二、按照屏幕提示我们按ctrl+s进入到配置RAID的界面。(注:在上图的界 面系统会停留五秒,所以在5秒之内我们要按crtl+s进入到下图的配置RAID界面。) 三、因为服务器在出厂的时候就已经自带了系统和raid所以我们需要进入到控制台里删除原有自带的raid。具体步骤:选择Disk Array Management.按空格选择原有的总物理磁盘大小。选择Delete进行删除。

四、因为我们的硬盘过多,DB服务器上总共有十二块硬盘,我们需要进入到控制台2看到其他的8块硬盘,在控制台界面选择Controller Selection选择进 入控制台2(Controller 2).

五、重复第三步删掉原有的raid配置。

六、接下来我们切换回控制台1(Controller 1),然后进入到Disk Array Management创建一个大的物理磁盘空间。主要步骤:当你进入到这个界面的时候,屏幕返回的信息是什么都没有,你需要选择Create Disk Array.这时候我们会看见4块硬盘,用空格分别选择4块硬盘后,选择Save Configuration. 七、保存好以后,返回主菜单,接下来我们进入Logical Drive Management,创建我们需要的raid 1\0.点击Create Logical Drive.因为实现我们已经创建了整合的磁盘,我们会看到一个标识为0 | | 2.18TB |OK的信息,选择它。具体操作看下图:

曙光作业管理-调度系统安装配置手册

Torque + Maui配置手册之抛砖引玉篇 本文将以应用于实际案例(南航理学院、复旦大学物理系、宁波气象局)中的作业调度系统为例,简单介绍一下免费开源又好用的Torque+Maui如何在曙光服务器上进行安装和配置,以及针对用户特定需求的常用调度策略的设定情况,以便可以起到抛砖引玉的作用,使更多的人关注MAUI这个功能强大的集群调度器(后期将推出SGE+MAUI版本)。本文中的涉及的软件版本Torque 版本:2.1.7 maui版本:3.2.6p17。 1. 集群资源管理器Torque 1.1.从源代码安装Torque 其中pbs_server安装在node33上,TORQUE有两个主要的可执行文件,一个是主节点上的pbs_server,一个是计算节点上的pbs_mom,机群中每一个计算节点(node1~node16)都有一个pbs_mom负责与pbs_server通信,告诉pbs_server该节点上的可用资源数以及作业的状态。机群的NFS共享存储位置为/home,所有用户目录都在该目录下。 1.1.1.解压源文件包 在共享目录下解压缩torque # tar -zxf torque-2.1.17.tar.gz 假设解压的文件夹名字为: /home/dawning/torque-2.1.7 1.1. 2.编译设置 #./configure --enable-docs --with-scp --enable-syslog 其中, 默认情况下,TORQUE将可执行文件安装在/usr/local/bin和/usr/local/sbin下。其余的配置文件将安装在/var/spool/torque下 默认情况下,TORQUE不安装管理员手册,这里指定要安装。 默认情况下,TORQUE使用rcp来copy数据文件,官方强烈推荐使用scp,所以这里设定--with-scp. 默认情况下,TORQUE不允许使用syslog,我们这里使用syslog。 1.1.3.编译安装 # make # make install Server端安装设置: 在torque的安装源文件根目录中,执行 #./torque.setup root 以root作为torque的管理员账号创建作业队列。 计算节点(Client端)的安装: 由于计算节点节点系统相同,因而可以用如下SHELL script (脚本名字为torque.install.sh)在

服务器磁盘阵列常见问题及解决方法

服务器磁盘阵列常见问题及解决方法

亠般问题

BIOS启动错误消息 下表说明有关启动时可能显示的BIOS错误消息、其问题以及建议的解决方案。消息问题建议的解决方案 Error: Controller not Responding TimedOut (错误:控制器没有响应超时)Error: Controller Kernel Stopped Running (错误:控制器核心停止运行)Error: Controller Monitor Stopped Running (错误:控制器监控程序停 止运行)这些消息仅于POST期间显 示。它们代表适配器试图 于控制器核心停止运行 时,执行一个命令。 这可能是加载固件时出现 问题或是硬件错误。 ?若要解决问题,请关 闭系统和所有附属 外围设备的电源, 然后再开启系统电 源。 ?如果问题仍然存在, 请与Dell支持人 员联系。 Fatal Error: Controller monitor failed (致命错误:控制器监控程序失败)Fatal Error: Controller unknown fa订ure (致命错误:未知的控制器故障)Fatal Error: Controller kernel self test failed (致命错误:控制器核心自测失败) Fatal Error: Controller Kernel PANIC!!(致命错误:控制器核心发生严重错误!!) Fatal Error: SDRAM initial pattern test fa 订ed (致命错误:SDRAM 初始模式测试 失败)这些错误消息代表适配器 没有响应。这可能是由于 固件损毁或是硬件错误造 成。 ?若要解决问题,请快 闪刷新适配器的固 件。 ?如果问题仍然存在, 请与Dell支持人 员联系。

服务器维修故障诊断思路大全

前言: 相对PC机而言服务器出故障的机率是小多了,但是它的故障给企业也带来了一些影响。作为服务器工程师除要有服务器基础知识以外,还需要具备服务器故障的诊断思路,这样才能最快速的解决问题也可以减少故障停机时间。 本文并不是针对某个厂家服务器故障完全手册,而是根据个人经验总结出来的一些经验思路还有一些总结案例。按照下面思路和方法基本上能够解决目前服务器更换式维修的大多数问题。而且里面的一些操作风险性也不是很大,因为服务器本身就是坏的,最坏的情况下就是它一点都不能工作了呗,(主要确认是否有数据,数据无价啊)而且现在很多厂商都有自己的客服电话关于产品问题打个电话也很方便,所以安心做啦 当然如果服务器在保修期内就打电话让售后工程师上门服务,毕竟顾客就是上帝嘛,但是如果上帝比较着急使用,一般小故障自己解决一下就好了,因为一般报修最快都是第二天(大客户如银行等除外,一般当天还得是晚上才能停机解决) 目录: 一、服务器常见故障分类 二、服务器常见故障现象及其对应排错方法 三、服务器排错基本原则 四、服务器故障需要收集哪些信息 五、服务器硬件故障排错实例 六、服务器软件故障排错实例 七、服务器常见内存故障现象 一、服务器常见故障类型分类: A. 开机无显示 B. 加电BIOS自检阶段故障 C. 系统和软件安装阶段故障和现象 D. 操作系统启动失败 E. 系统运行阶段故障 二、服务器常见故障现象及其对应的排除方法

A.服务器开机无显示(加电无显示和不加电无显示) 1. 检查供电环境 2. 检查电源和故障指示灯(故障指示灯状态,目前很多厂商的服务器都有故障指示灯,或故障诊断卡等。) 3. 按下电源开关时,键盘指示灯是否亮、风扇是否全部转动 4. 是否更换过显示器,尝试更换另外一台显示器 5. 插拔内存,用橡皮擦擦拭一下金手指,如果在故障之前有增加内存,去掉增加的内存尝试 6. 是否添加了CPU,如果有增加CPU尝试去掉 7. 去掉增加的第三方I/O卡包括Raid卡等 8. ClearCMOS (记得使用跳线来清除,尽量不要直接拔电池,每款服务器清除跳线位置不一致,具体找不到电话联系一下厂商客服) 9. 尝试更换主板、内存等主要部件 10.清除静电,将电源线等外插在服务器上的线缆全部拔掉,然后轻按开机键几下 B.加电BIOS自检报错 1. 根据BIOS自检报错信息提示 2. 查看是否外插了第三方的卡或者添加部件,如果有还原基本配置重启 3. 做最小化测试 4. 尝试清除CMOS 5. 看能否正常进入BIOS C. 系统安装阶段故障和现象 1.查看服务器支持操作系统的兼容版本(从厂商能查到兼容性列表) 2.系统安装蓝屏(对蓝屏故障代码诊断) 3.安装在分区格式化的时候找不到硬盘 (阵列驱动没有安装或者没有配置阵列,可以尝试适应引导光盘安装) 4.大于2T的硬盘式应该如何分区(必须使用阵列卡才能实现或者有外插识别卡) (使用阵列卡配置阵列分成一个小于2T的空间,一个大于2T的空间,然后将系统安装在小于2T的上面,安装好系统后在使用GPT方式分区即可) 5.安装过程是死机 (检查兼容性列表---查看硬盘接口选择是否正确---阵列驱动安装是否正确---尝试最小化配置安装检查是否为内存和CPU等问题) 6.引导光盘安装失败

曙光服务器备份还原软件用户使用指南

曙光服务器备份还原软件 (DAWNING Server Backup and Restore Software) 用户使用指南 一、 简介 曙光服务器备份还原软件是专为曙光服务器用户开发的一款基于硬盘和分 区的备份还原软件,实现了硬盘及Windows、 Linux系统分区的本地及网络备份还原功能。具体支持的机型请查看软件光盘中的兼容列表。 二、 主要功能特性 1、支持硬盘和分区的备份还原; 2、支持硬盘到映像文件(将分区或整个硬盘备份为一个映像文件,或将映 像文件还原到所对应的分区或硬盘)和硬盘到硬盘(硬盘或分区的对拷)两种模式; 3、支持本地和网络两种备份还原模式。网络备份还原支持 NFS和SSHFS两 种模式,可实现跨平台的系统备份还原; 4、一次可支持多个硬盘、分区备份还原; 5、支持多种主流文件系统,包括FAT1 6、FAT32、NTFS、EXT2和EXT3。 三、 使用指南 启动计算机后,将光盘放入光驱中,进入BIOS,选择从光驱引导。重启服务器后,会自动引导进入备份还原软件图形界面。 本软件的备份还原模式分为硬盘/映像和硬盘/硬盘两种。下面我们将从这两方面分别介绍如何使用该软件备份还原分区和硬盘。 硬盘/映像 备份 1、选择操作类型 进入备份还原软件图形界面后,首先显示“选择操作类型”界面,如图1所示。选择操作类型和备份还原模式。在这里,我们选择操作类型为“备份”,备份还原模式为“硬盘/映像”。 点击【帮助】,可查看本操作的帮助信息。

点击【关于】,可查看本软件的版本信息。 点击【退出】,可退出系统重新启动计算机。 点击【下一步】,进入“备份方式设置”界面。 图1 “选择操作类型”界面 2、备份方式设置 图2 “备份方式设置”界面 如图2所示,用户可以选择硬盘/映像的备份方式。本软件提供四种方式,分别为本地硬盘到本地映像文件、本地硬盘到远程映像文件、本地分区到本地映像文件和本地分区到远程映像文件。 点击【下一步】,进入“网络信息设置”界面。

服务器常见故障及解决办法

服务器常见故障排除 服务器常见故障一、造成服务器无法启动的主要原因: 1)市电或电源线故障(断电或接触不良) 2)电源或电源模组故障 3)内存故障(一般伴有报警声) 4)CPU故障(一般也会有报警声) 5)主板故障 6)其它插卡造成中断冲突 服务器常见故障二、服务器无法启动? 1)检查电源线和各种I/O接线是否连接正常。 2)检查连接电源线后主板是否加电。 3)将服务器设为最小配置(只接单颗cpu,最少的内存,只连接显示器和键盘)直接短接主板开关跳线,看看是否能够启动。 4)检查电源,将所有的电源接口拔下,将电源的主板供电口的绿线和黑线短接,看看电源是否启动。 5)如果判断电源正常,则需要用替换法来排除故障,替换法是在最小化配置下先由最容易替换的配件开始替换(内存、cpu、主板) 服务器常见故障三、系统频繁重启? 造成系统频繁重启的原因: 1)电源故障(替换法判断解决) 2)内存故障(可从BIOS错误报告中查出) 3)网络端口数据流量过大(工作压力过大) 4)软件故障(更新或重装操作系统解决) 服务器常见故障四、服务器死机故障判断处理: 服务器死机故障比较难以判断,一般分为软件和硬件两个方面: 1)软件故障 首先检查操作系统的系统日志,可以通过系统日志来判断部分造成死机的原因。 电脑病毒的原因。 系统软件的bug或漏洞造成的死机,这种故障需要在判断硬件无故障后做出,而且需要软件提供商提供帮助。 软件使用不当或系统工作压力过大,可以请客户适当降低服务器的工作压力来看看是否能够解决 2)硬件故障 硬件冲突 电源故障或电源供电不足,可以通过对比计算服务器电源所有的负载功率的值来作出判断。 硬盘故障(通过扫描硬盘表面来检查是否有坏道) 内存故障(可以通过主板BIOS中的错误报告和操作系统的报错信息来判断) 主板故障(使用替换法来判断) CPU故障(使用替换法) 板卡故障(一般是SCSI/RAID卡或其他pci设备也有可能造成系统死机,可用替换法判断处理)

曙光IPMI系统管理平台用户使用指南

曙光I P M I系统管理平台 用户使用指南 目录

概述 IPMI是智能型平台管理接口(Intelligent Platform Management Interface)的缩写,它是管理企业级服务器系统中所使用的采用的一种工业标准。它为服务器的监控提供了一种智能的管理方式,用户可以利用IPMI监视服务器的物理健康特征,如温度、电压、风扇工作状态、电源状态等。它能够不依赖操作系统独立运行,即使系统本身的运作不正常,或是由于任何原因而无法提供服务,IPMI仍可正常运作。它适用于Windows、Linux、Solaris或其它混合型操作系统。 ?智能平台管理接口(IPMI) 智能平台管理接口(IPMI)定义了一系列的统一的基于接口的信息,这些信息包括监视器系统硬件健康(风扇速度、温度、电压、电力供应等等)、控制系统组件、和用于以后测试用的关于重要系统事件存储的数据。IPMI提供了远程平台管理功能。 ?基板管理控制器(BMC) 在IPMI 中关键的组成部件是基板管理控制器(BMC),BMC 芯片集成于服务器的主板上。BMC 在IPMI 架构中负责监视和控制系统的可管理设备。BMC 通过智能平台管理总线(IPMB)连接着许多传感器。一个子集有12C 总线。系统软件与BMC 之间的通信用一个keyboard controller style(KCS) 接口。 BMC 具有以下功能: 1.通过系统的串行端口进行访问 2. 故障日志记录和 SNMP 警报发送 3.访问系统事件日志 (System Event Log ,SEL) 和传感器状况 4.控制包括开机和关机 5.独立于系统电源或工作状态的支持

视频服务器核心技术及常见故障解决方法

视频服务器核心技术及常见故障解决方法 随着各地城市监控项目的需求,国内网络应用的稳定与高带宽的飞速发展,这些都成为推动网络监控走向市场的的外部因素。和视频服务器类似的产品就是视频编码器了,但很多时候我们把视频服务器和视频编码器等同起来,但真正的视频服务器和编码器的最大区别是视频服务器更重视视频编码数率和低带宽传输,真正做到优秀的视频算法和产品的结合。 视频服务器在监控中作用 什么是网络视频监控?网络视频监控是相对模拟监控和数字监控而言的。在模拟监控系统中,图像的传输、交换以及存储均基于模拟信号处理技术。数字监控引入了先进的数字信号处理技术,实现了以DVR为典型代表的数字化存储。而网络监控以数字信号处理为基础,采用网络化的方式实现信号的传输、交换、控制、录像存储以及点播回放,并通过设立强大的中心管理平台(CMS),实现对系统内所有编解码设备及录像存储设备的统一管理与集中控制。对用户而言,仅需登录中心管理平台,即可实现全网监控资源的统一调用、浏览和管理。网络视频监控实现了端到端的网络化,系统架构由IP前端、TCP/IP网络、中心管理平台、网络存储设备、电视墙解码器以及客户端等几个部分组成。 视频服务器从核心功能上可以分为视频编码器和视频解码器两大类。视频编码器位于网络视频监控系统的前端,而视频解码器则位于用户访问端(或称为后端)。 视频编码器用于实现前端信号(视频、音频及其它信号)的数字化压缩和网络化,具体功能包括监控点模拟视音频信息和报警信息的接入、编码/压缩、传输以及外围设备(如摄像机、云镜、矩阵等)的控制。上述信息经视频编码器处理后通过IP网络上传至中心管理平台,再由中心管理平台分发至客户端、视频解码器以及录像存储设备。 视频编码器与网络摄像机最大的差异在于,视频编码器的视频源来自模拟摄像机,需要与模拟摄像机配合使用,而网络摄像机是一体化的,本身就集成了模拟视频采集功能。从目前的情况来看,尽管网络摄像机正在大量涌现,但因为以下两个原因,视频编码器仍将在网络视频监控系统中占据不可替代的重要位置:一是大量已建的模拟和数字监控系统亟待网络化改造,为了保护现有模拟摄像机的投资,这些改造将产生庞大的视频编码器部署需求;二是目前网络摄像机的选择面还远远没有模拟摄像机大,难以满足不同用户差异化的应用需求,所以很多应用场合必须基于模拟摄像机加视频编码器的模式实现前端的数字化网络化。 视频解码器则用于在PC客户端的控制下接收平台转发过来的网络视频监控码流,解码输出模拟信号到电视墙、音响等外围设备,通常部署在用户的监控中心。视频解码器与PC客户端的不同在于,视频解码器一般基于硬件解码,通过专门的显示设备显示监控图像,而PC客户端直接通过PC显示屏显示监控图像。由于PC客户端还有更多控制管理功能,且接入灵活、操作方面,所以基于PC客户端进行监控浏览的应用越来越普遍。但由于视频解码器基于硬件,性能稳定、图像质量好,因此对于很多需要集中解码上墙的应用还是有着很普遍的意义。 网络视频服务器关键技术 ARM+DSP双核构架 目前市场上的主流处理芯片,包括TI的达芬奇系列和海思的3510系列都采用了ARM+DSP 的双核架构。在这个架构中,ARM是芯片的主控处理器,负责控制芯片各个模块的工作以及运行操作系统、网络协议、应用软件等;DSP系统主要负责视音频编解码业务处理,通过处理器配合视频编解码模块共同完成音视频的编解码。 H.264视频压缩算法 H.264是由ITU-T的VCEG(视频编码专家组)和ISO/IEC的MPEG(活动图像编码专家

服务器常见故障的判断与维修汇总

服务器常见故障的判断与维修 一、造成服务器无法启动的主要原因 市电或电源线故障(断电或接触不良) 电源或电源模组故障 内存故障(一般伴有报警声) CPU故障(一般也会有报警声) 主板故障 其它插卡造成中断冲突 二、服务器无法启动解决办法 检查电源线和各种I/O接线是否连接正常。 检查连接电源线后主板是否加电。 将服务器设为最小配置(只接单颗cpu,最少的内存,只连接显示器和键盘)直接短接主板开关跳线,看看是否能够启动。 检查电源,将所有的电源接口拔下,将电源的主板供电口的绿线和黑线短接,看看电源是否启动。 如果判断电源正常,则需要用替换法来排除故障,替换法是在最小化配置下先由最容易替换的配件开始替换(内存、cpu、主板) 三、系统频繁重启 电源故障(替换法判断解决) 内存故障(可从BIOS错误报告中查出) 网络端口数据流量过大(工作压力过大) 软件故障(更新或重装操作系统解决) 四、服务器死机故障判断处理 服务器死机故障比较难以判断,一般分为软件和硬件两个方面: * 软件故障 首先检查操作系统的系统日志,可以通过系统日志来判断部分造成死机的原因。 电脑病毒的原因。 系统软件的bug或漏洞造成的死机,这种故障需要在判断硬件无故障后做出,而且需要软件提供商提供帮助。 软件使用不当或系统工作压力过大,可以请客户适当降低服务器的工作压力来看看是否能够解决 * 硬件故障 硬件冲突 电源故障或电源供电不足,可以通过对比计算服务器电源所有的负载功率的值来作出判断。 硬盘故障(通过扫描硬盘表面来检查是否有坏道) 内存故障(可以通过主板BIOS中的错误报告和操作系统的报错信息来判断) 主板故障(使用替换法来判断) CPU故障(使用替换法) 板卡故障(一般是SCSI/RAID卡或其他pci设备也有可能造成系统死机,可用替换法判断处理) 注意:系统死机故障需要在处理完后需要在一段时间内进行一定压力的拷机测试来尽一步检查故障是否彻底解决。 五、安装操作系统时提示找不到硬盘 无物理硬盘设备

宝德服务器RAID 问题处理

宝德服务器RAID 问题处理 Q1问题描述:INTEL U3-1L安装操作系统需要注意哪些? A1解决方案: (1)LINUX 6.2:先做一张驱动软盘FOR LINUX 6.2的,然后开机安装时候输入linux dd就可以了。安装完系统配置网络,图形界面,管理软件都没有问题。 (2)LINUX7.0:不支持(按安装LINUX 6.2的方法,驱动程序为for linux 6.2的) (3)LINUX7.1:开始安装的时候输入linux dd然后加载驱动程序就可以了。 (4)LINUX 7.2:用FOR LINUX 7.1的驱动程序不可以驱动。 (5)NT4:普通安装方法,没有问题,开机按F6加载驱动程序就可以。 (6)WIN2000 SERVER::没有问题,开机按F6加载驱动程序就可以。 Q2问题描述:PROMISE IDE RAID卡做RAID 1后坏掉一个硬盘数据如何恢复? A2解决方案: 操作步骤: 1、打开机箱,将作好RAID的硬盘拔掉其中坏的一个,连接上一个新的硬盘; 2、I:启动按《CTRL+F》进入………… II:[2],查看硬盘状态:一个Free U5 ----新的硬盘(没有数据) 一个Array1 U5 ----原来有数据的硬盘 III:[ESC]返回MENU; 3、I:选[4],选中Array 1 Mirror 2 20547 Critical II:按[DEL],根据提示按[CTRL+Y]删除 III:[ESC]返回MENU 4、I:选[1],移动左右方向键,出现Optimize Array for :Security Typical Application vuse :Not Available 则正常,进行下一步操作(II) II:按[CTRL+Y],根据提示按[Y], III:根据提示,用上下键移动光标选中原硬盘(有数据的硬盘,不能选错,可以看前文的注意),然后按[ENTER]确认 IV:A:根据提示,按[Y],出现please wait while duplicating the image B:About wait 15 minutes 5、出现disk duplication completed any key to reboot the system! 重启OK! Q3问题描述:AMI RAID操作说明 A3解决方案: 一、开机出现 AMI MEGARAID 40-LD BIOS Ver 3.07 Jul 14,2000 Copyright (c)AMERICAN MEGATRENDS INC

服务器常见的十四个故障-分析解决方案

服务器常见的十四个故障分析解决方案 一、造成服务器无法启动的主要原因 : 市电或电源线故障(断电或接触不良) 电源或电源模组故障 内存故障(一般伴有报警声) CPU故障(一般也会有报警声) 主板故障 其它插卡造成中断冲突 二、服务器无法启动 ? 检查电源线和各种I/O接线是否连接正常。 检查连接电源线后主板是否加电。 将服务器设为最小配置(只接单颗cpu,最少的内存,只连接显示器和键盘)直接短接主板开关跳线,看看是否能够启动。 检查电源,将所有的电源接口拔下,将电源的主板供电口的绿线和黑线短接,看看电源是否启动。 如果判断电源正常,则需要用替换法来排除故障,替换法是在最小化配置下先由最容易替换的配件开始替换(内存、cpu、主板) 三、系统频繁重启 ? 造成系统频繁重启的原因: 电源故障(替换法判断解决) 内存故障(可从BIOS错误报告中查出)

网络端口数据流量过大(工作压力过大) 软件故障(更新或重装操作系统解决) 四、服务器死机故障判断处理: 服务器死机故障比较难以判断,一般分为软件和硬件两个方面: 软件故障 硬件故障 软件故障 首先检查操作系统的系统日志,可以通过系统日志来判断部分造成死机的原因。 电脑病毒的原因。 系统软件的bug或漏洞造成的死机,这种故障需要在判断硬件无故障后做出,而且需要软件提供商提供帮助。 软件使用不当或系统工作压力过大,可以请客户适当降低服务器的工作压力来看看是否能够解决 硬件故障 硬件冲突 电源故障或电源供电不足,可以通过对比计算服务器电源所有的负载功率的值来作出判断。 硬盘故障(通过扫描硬盘表面来检查是否有坏道) 内存故障(可以通过主板BIOS中的错误报告和操作系统的报错信息来判断) 主板故障(使用替换法来判断) CPU故障(使用替换法)

服务器常见的十四个故障及分析

一、造成服务器无法启动的主要原因: 市电或电源线故障(断电或接触不良) 电源或电源模组故障 内存故障(一般伴有报警声) CPU故障(一般也会有报警声) 主板故障 其它插卡造成中断冲突 二、服务器无法启动? 检查电源线和各种I/O接线是否连接正常。 检查连接电源线后主板是否加电。 将服务器设为最小配置(只接单颗cpu,最少的内存,只连接显示器和键盘)直接短接主板开关跳线,看看是否能够启动。 检查电源,将所有的电源接口拔下,将电源的主板供电口的绿线和黑线短接,看看电源是否启动。 如果判断电源正常,则需要用替换法来排除故障,替换法是在最小化配置下先由最容易替换的配件开始替换(内存、cpu、主板) 三、系统频繁重启? 造成系统频繁重启的原因: 电源故障(替换法判断解决) 内存故障(可从BIOS错误报告中查出) 网络端口数据流量过大(工作压力过大) 软件故障(更新或重装操作系统解决) 四、服务器死机故障判断处理: 服务器死机故障比较难以判断,一般分为软件和硬件两个方面: 软件故障 硬件故障 软件故障 首先检查操作系统的系统日志,可以通过系统日志来判断部分造成死

机的原因。 电脑病毒的原因。 系统软件的bug或漏洞造成的死机,这种故障需要在判断硬件无故障后做出,而且需要软件提供商提供帮助。 软件使用不当或系统工作压力过大,可以请客户适当降低服务器的工作压力来看看是否能够解决 硬件故障 硬件冲突 电源故障或电源供电不足,可以通过对比计算服务器电源所有的负载功率的值来作出判断。 硬盘故障(通过扫描硬盘表面来检查是否有坏道) 内存故障(可以通过主板BIOS中的错误报告和操作系统的报错信息来判断) 主板故障(使用替换法来判断) CPU故障(使用替换法) 板卡故障(一般是SCSI/RAID卡或其他pci设备也有可能造成系统死机,可用替换法判断处理) 注意:系统死机故障需要在处理完后需要在一段时间内进行一定压力的拷机测试来尽一步检查故障是否彻底解决。 五、安装操作系统时提示找不到硬盘? 故障原因: 无物理硬盘设备 硬盘线缆连接问题 没有安装硬盘控制器驱动或驱动不相符 六、如何获得驱动程序? 使用随机光盘制作相应驱动 七、为什么用正确的驱动仍然无法加载硬盘控制器驱动? 查看是否启用了hostraid功能。

曙光刀片服务器设备安装说明

空军大学设备安装说明 刀片安装:兰空1——兰空9分别对应刀箱设备上的插孔1——9, 刀片硬盘:兰空1左硬盘编号为:1 右硬盘编号为:6 兰空2 左硬盘编号为:2 右硬盘编号为:3 兰空3左硬盘编号为:7 右硬盘编号为:0 兰空4左硬盘编号为:4 右硬盘编号为:8 兰空5左硬盘编号为:3 右硬盘编号为:6 兰空6左硬盘编号为:9 右硬盘编号为:6 兰空7左硬盘编号为:5 右硬盘编号为:3 兰空8左硬盘编号为:0 右硬盘编号为:4 兰空9左硬盘编号为:0 右硬盘编号为:5 存储硬盘:安装方式为从左到右S型安装 一号口安装的硬盘编号为:兰1 S/N:N11WGKXL 二号口安装的硬盘编号为:兰2 S/N:N11WJV6L P 三号口安装的硬盘编号为:兰3 S/N:N11W7P3L 四号口安装的硬盘编号为:兰4 S/N:N11W26SL 五号口安装的硬盘编号为:兰5 S/N:N11W6TDL 六号口安装的硬盘编号为:兰6 S/N:N11TY6ML HBA卡(扩展模块)的安装方式为:从右到左的顺序1——9 依次安装,九块HBA卡分别对应刀箱的九个刀片服务器。 一号插槽安装的HBA卡的编号为:0 二号插槽安装的HBA卡的编号为:9 三号插槽安装的HBA卡的编号为:8 四号插槽安装的HBA卡的编号为:2 五号插槽安装的HBA卡的编号为:1 六号插槽安装的HBA卡的编号为:7 七号插槽安装的HBA卡的编号为:6 八号插槽安装的HBA卡的编号为:5 九号插槽安装的HBA卡的编号为:4 光纤线的连接方式:九个HBA卡扩展模块从右到左1——9 分别为一主一备(奇数为主设备偶数为备设备),每块HBA卡上有两个光纤线接口,只用上边的光纤线接口(第二个光纤线接口是备用的), 存储上边有两个光纤线接口分别为一左一右,两台交换机一主一备分别开放有八个端口(从左到右S型排列为1——8接口) 光纤线1插在HBA卡扩展模块1上,对应的主交换机端接口为2号接口

服务器常见问题

服务器常见问题 Q1 问题描述:为什么处理器报错或自检过程中只找到一个处理器 A1 解决方法:开机--〉按F2 键,进入SETUP 1)依次MAIN -- > PROCESSOR〉-CLEAR PROCESSOR ERRORS [将此选项值设置为YES ; 2)依次ADVANCED -〉- RESET CONFIGURATION DATA [ ] 将此选项的值设置为YES ; 3)依次SERVER >-- PROCESSOR RESET [ ] 将此选项的值设置为YES ; 4)依次SERVER >-- SYSTEM MANAGEMENT:回车--> CLEAR EVENT LOG [ :] 将此选项的值设置为YES 5)按F10,保存退出; Q2 问题描述:为什么开机自检无法通过 A2 解决方法: 1)机器切断电源,将机箱打开,用COMS CLEAR跳线的跳线帽将COMS CLEAR跳线的另外两个针短接(跳线参看主板说明书); 2)机器加电,自检,等机器自检完毕,报CMOS已被清除,然后将机器电源关掉,把跳线复原即可; 3)机器重新开机。 Q3问题描述:怎样格式化SCS硬盘 A3 解决方法: 开机--〉出现CTRL+A B息时,按CTRL+A进入--〉选中通道A -->选中SCSI UTILITY>--将检测到硬盘-->选中要检测的硬盘 -->选中FORMAT可对硬盘进行全面格式化 选中VERIFY可对硬盘进行检测,检查是否有坏道 注意:在格式化硬盘时不能中断或停电,不然会损坏硬盘 Q4问题描述:PL400 CMOS如何清除 A4解决方案:CMOS清除的方法(要跳线的位置): 位于3Pin PwrLED和In tel NB82802AB8芯片之间的JBC2跳线,将2、3短接 Q5 问题描述:机器开机常见问题处理 A5 解决方案: 1、装完系统后,显示器出现花屏现象,系AGP显卡故障。更换后一切正常。 2、开机黑屏,不自检,并且报两声嘟声,系内存未插紧。重插内存,故障解决。 3、开机散热风扇不转,而机箱后侧风扇却转(说明主板已上电),系CPU 散热风扇电源线插错 (插到机箱风扇电源接口),插到RIMM1,侧面的CPU风扇接口后故障解决。 Q6问题描述:NAS 4100, 4300操作指导 A6 解决方案: 一、正常状态 将一台新机器拿出来后,通电开机即可.(接上网线连入网络),在网络中的客户端安装好软 件MaxNeighbornhood(随机有一张光盘的),运行它,它会在网络中搜索MAXTOR NAS.(注意:要等NAS完全启动后才会搜索得到,如果一次找不到,可以搜索多次,要注意网络是通的.)** 另外可以用WIN2000 中带的一个附加组件网络服务来连接,它比MaxNerghbornhood 好用. 搜索到后用鼠标双击它就会有IE窗口来连接,基于WEB的管理?在IE中可以对它进行全面管 理,注意操作时一般的东西不要改,如果机器有问题,你可以先查看磁盘管理器查看硬盘的状

曙光天阔服务器远程控制手册

远程管理操作指南 6.1引言 本文档介绍曙光天阔服务器的IPMI远程管理和远程KVM(KVM over IP)、虚拟媒体(Virtual media)功能的使用方法。 IPMI是一种用于硬件级别的标准。IPMI 定义管理员如何监测系统硬件和传感器、控制系统组件和检索重要系统事件的日志以进行远程管理和恢复。IPMI 监测硬件的状况,例如温度、风扇、电压和硬件错误(存储、网络等)和机箱防盗等。 由于IPMI 独立于操作系统之外,因此即使操作系统已经暂停或服务器已经关闭,管理员仍然可以监测、管理、诊断和恢复系统。IPMI 还包括警示通知和恢复功能,这使得管理员能够监测硬件故障并在故障发生前监测作出反应。IPMI 硬件监测功能还可提供额外的安全级别。通过配置IPMI,检测服务器是否被打开,从而检查机箱侵入状况。另外,将多层权限和密码以及身份验证和在线加密配合使用,能够让IT 管理员安全地许可或拒绝对特定IPMI 功能的访问。 KVM over IP技术是传统KVM切换技术在IP网络上的延伸。通过这项技术,用户可以从本地计算机登录到远程的被管理端,将被管理端的视频输出重定向到本地计算机的显示器,并使用本地计算机的键盘鼠标对远程系统进行操作,从而消除了距离限制,降低设备维护和管理成本。 虚拟媒体功能让用户能够把本地计算机上的光驱或其他存储媒体连接至远程服务器系统,就如同它们直接连接在远程服务器的USB 端口一般。 6.2启动远程管理界面 6.2.1准备工作 曙光天阔I620r-G服务器提供了基于Web的管理界面,系统管理员可以使用Microsoft Internet Explorer或者其他Web浏览器对服务器进行远程监控。这款服务器为管理功能提供了一个专用网口,位置如下图USB接口上方的网口(数字5所示的接口) 在系统BIOS“Advanced-IPMI Configuration-Set LAN Configuration”下,可以对管理专用网口进行网络参数的设置。如下图所示。注意,要保证所用channel处于work状态。

曙光IPMI系统管理平台用户使用指南

曙光IPMI系统管理平台用户使用指南

目录 概述 (3) ?智能平台管理接口(IPMI) (3) ?基板管理控制器(BMC) (3) IPMI的相关配置 (4) ?获取/配置IP地址等信息 (4) 1.在BIOS下进行配置 (4) 2.用DOS工具进行获取/配置 (5) 3.在windows操作系统下配置 (6) 4.在linux操作系统下配置 (7) ?IPMI LAN Dedicate(专用)模式修改 (8) 1.DOS模式下通过IPMICFG工具修改 (8) 2.Windows或linux系统下通过web方式进行修改 (8) 使用web浏览器进行远程登录 (10) ?Web浏览器远程登录管理平台 (10) 1.首页 (10) 2.主菜单 (10) 3.系统信息(System) (11) 4.服务器状态(Server Health) (11) 5.配置(Configuration) (12) 6.远程控制(Remote Control) (21) 7.虚拟介质(Virtual Media) (24) 8.维护(Maintenance) (25) 9.杂项(Miscellaneous) (29) ?Java iKVM控制台 (29) 1.virtual media菜单 (30) 2.Record菜单 (31) 3.键盘宏(Macro)菜单 (31) 4.选项(Options)菜单 (32) 5.用户(User)菜单 (36) 6.屏幕抓图(Capture)菜单 (36) 7.Exit退出iKVM (36) 通过IPMI安装操作系统 (37) ?安装前的准备 (37) 1.网络结构 (37) 2.虚拟介质 (37) 3.介质共享 (37) ?系统安装过程 (38) 1.登录web管理平台 (38) 2.进入iKVM远程控制台 (38) 3.设置虚拟介质 (38) 4.从虚拟光驱引导系统安装过程 (41)

服务器常见问题

服务器常见问题 Q1问题描述:为什么处理器报错或自检过程中只找到一个处理器 A1解决方法:开机--〉按F2键,进入SETUP 1)依次MAIN --〉PROCESSOR --〉CLEAR PROCESSOR ERRORS [ ] :将此选项值设置为YES ;2)依次ADVANCED --〉RESET CONFIGURATION DATA [ ] :将此选项的值设置为YES ; 3)依次SERVER --〉PROCESSOR RESET [ ] :将此选项的值设置为YES ; 4)依次SERVER --〉SYSTEM MANAGEMENT :回车--〉CLEAR EVENT LOG [ ] :将此选项的值设置为YES 5)按F10,保存退出; Q2问题描述:为什么开机自检无法通过 A2解决方法: 1)机器切断电源,将机箱打开,用COMS CLEAR 跳线的跳线帽将COMS CLEAR 跳线的另外两个针短接(跳线参看主板说明书); 2)机器加电,自检,等机器自检完毕,报CMOS已被清除,然后将机器电源关掉,把跳线复原即可; 3)机器重新开机。 Q3问题描述:怎样格式化SCSI硬盘 A3解决方法: 开机--〉出现CTRL+A信息时,按CTRL+A进入--〉选中通道A --〉选中SCSI UTILITY--〉将检测到硬盘--〉选中要检测的硬盘 --〉选中FORMAT可对硬盘进行全面格式化 选中VERIFY可对硬盘进行检测,检查是否有坏道 注意:在格式化硬盘时不能中断或停电,不然会损坏硬盘 Q4问题描述:PL400 CMOS如何清除 A4解决方案:CMOS清除的方法(要跳线的位置): 位于3Pin PwrLED和Intel NB82802AB8芯片之间的JBC2跳线,将2、3短接Q5问题描述:机器开机常见问题处理 A5解决方案: 1、装完系统后,显示器出现花屏现象,系AGP显卡故障。更换后一切正常。 2、开机黑屏,不自检,并且报两声嘟声,系内存未插紧。重插内存,故障解决。 3、开机散热风扇不转,而机箱后侧风扇却转(说明主板已上电),系CPU散热风扇电源线插错 (插到机箱风扇电源接口),插到RIMM1,侧面的CPU风扇接口后故障解决。 Q6问题描述:NAS 4100,4300 操作指导 A6解决方案: 一、正常状态 将一台新机器拿出来后,通电开机即可.(接上网线连入网络),在网络中的客户端安装好软件MaxNeighbornhood(随机有一张光盘的),运行它,它会在网络中搜索MAXTOR NAS.(注意:要等NAS完全启动后才会搜索得到,如果一次找不到,可以搜索多次,要注意网络是通的.) **另外可以用WIN2000中带的一个附加组件网络服务来连接,它比MaxNerghbornhood 好用. 搜索到后用鼠标双击它就会有IE窗口来连接,基于WEB的管理.在IE中可以对它进行全面管理,注意操作时一般的东西不要改,如果机器有问题,你可以先查看磁盘管理器查看硬盘的状

相关主题
文本预览
相关文档 最新文档