服务器维修基本技术手册
- 格式:docx
- 大小:23.17 KB
- 文档页数:7
服务器维护技术手册(二)引言:服务器维护是保证服务器正常运行的关键环节,为了提高服务器的稳定性和性能,服务器维护技术必不可少。
本文将介绍一些常用的服务器维护技术,帮助管理员更好地管理和维护服务器。
正文:一、服务器安全维护1. 定期更新操作系统和软件补丁2. 配置强大的防火墙,限制网络访问3. 使用安全的登录方式,禁止使用弱密码4. 定期备份服务器数据,防止数据丢失5. 监控服务器安全日志,及时发现异常情况二、性能优化与调整1. 定期清理无用的日志和临时文件2. 优化服务器配置,提高硬件资源利用率3. 调整服务程序参数,提升性能4. 监测服务器负载情况,合理分配资源5. 定期进行性能测试,找出瓶颈并进行优化三、存储管理与扩展1. 定期清理无用的文件和数据2. 合理划分磁盘空间,避免磁盘溢出3. 使用RAID技术提供数据冗余和容错能力4. 定期检查硬盘健康状态,及时更换故障硬盘5. 根据业务需求,合理扩展存储空间四、网络配置与优化1. 优化网络带宽的利用率,合理分配带宽资源2. 使用负载均衡技术,提高网络性能和可用性3. 配置反向代理服务器,提高用户访问速度4. 定期检查和维护网络设备,确保正常运行5. 监控网络流量和连接情况,迅速发现和排除故障五、故障排除与恢复1. 使用监控工具定期检测服务器状态2. 快速响应和处理服务器故障报警3. 使用日志和错误信息进行故障排查4. 制定应急预案,保证快速恢复服务器正常运行5. 定期进行灾备演练,确保故障恢复能力总结:服务器维护技术是确保服务器正常运行的关键,本文详细介绍了服务器安全维护、性能优化与调整、存储管理与扩展、网络配置与优化、故障排除与恢复等五个大点。
通过采取这些维护技术,管理员可以更好地管理和维护服务器,提高服务器的稳定性和性能。
服务器性能调优技术手册在当前数字化时代,服务器作为支撑互联网和企业信息系统的核心设备,对于系统的性能表现起着至关重要的作用。
服务器性能调优技术的运用,可以有效提升服务器的性能,提高系统的稳定性和可靠性。
本手册将介绍一些常见的服务器性能调优技术,以帮助管理员和技术人员更好地理解和运用这些技术。
一、硬件优化技术1. 内存扩容与优化内存是服务器性能的关键因素之一。
通过增加内存容量或进行内存优化管理,可以大幅提升服务器的整体性能。
合理分配内存资源,优化内存的使用策略,可以减少过多的硬盘读写操作,提高服务器的响应速度和工作效率。
2. 硬盘配置优化硬盘是计算机系统中的重要组成部分,也是影响服务器性能的关键因素之一。
通过RAID技术的运用,可以提高硬盘的读写性能和容错能力。
同时,优化硬盘的存储结构和数据分布,合理规划磁盘的分区和文件系统,可以充分利用硬盘资源,提升服务器的运行效率。
3. CPU调优CPU是服务器的计算核心,对服务器性能影响较大。
管理员可以通过调整CPU的频率和运行模式,以及合理配置CPU的亲和性和负载均衡,来优化服务器的CPU性能。
此外,合理使用CPU调度算法和运行优先级,可以进一步提高服务器的性能和响应速度。
二、操作系统优化技术1. 网络参数调整通过调整操作系统的网络参数,如最大连接数、队列长度、超时时间等,可以提高网络通信的性能和稳定性。
此外,合理配置网络设备和路由器,优化网络拓扑结构,可以进一步减少网络延迟和数据传输时间,提高服务器的整体性能。
2. 文件系统优化文件系统是服务器与外部存储设备之间的接口,合理的文件系统配置对服务器性能优化尤为重要。
选择合适的文件系统类型,调整文件系统的缓存和预读策略,以及进行文件系统碎片整理等操作,都可以提高服务器数据IO的效率,加快文件读写速度。
3. 关闭无用的服务和进程服务器操作系统通常配备了许多默认启动的服务和进程,但其中很多对实际运行环境没有作用,却会占用系统资源。
服务器维护技术手册一、服务器维护概述在信息技术高速发展的时代,服务器作为重要的信息管理工具,需要定期进行维护以确保其正常运行和数据安全。
本手册将为您介绍服务器维护的重要性,以及维护服务器时需要注意的技术细节。
二、服务器维护的重要性服务器维护是保证服务器系统稳定性和安全性的关键步骤。
合理的服务器维护措施能够提高服务器的性能、延长使用寿命,防止数据丢失和安全漏洞的发生。
不仅如此,维护操作的规范性还能为后续的维护工作提供参考指南。
三、服务器维护之硬件维护1. 温度控制服务器运行时产生大量的热量,过高的温度会导致硬件故障。
因此,在维护过程中要确保服务器的良好通风和散热,定期清理灰尘,确保风扇的正常运转。
2. 电源管理服务器维护需关注电源的供应。
要确保服务器接入可靠的电源插座,并定期检查电源线路和电源适配器的连接是否良好。
在停电、断电等情况下,要及时备份重要数据,以免造成数据丢失。
3. 硬件设备检查服务器维护还包括对硬件设备的定期检查和故障排查。
检查过程中要注意观察硬件是否存在异常磨损、松动或其他物理损坏,及时更换或修理。
四、服务器维护之操作系统维护1. 系统更新操作系统维护的重要环节是及时安装系统更新补丁。
操作系统发布更新版本是为了修复漏洞和提升系统性能。
经常进行系统更新,可提高服务器的安全性和稳定性。
2. 定期备份数据的安全是服务器维护的关键问题。
定期备份服务器的数据能够在出现故障时快速还原系统。
选择合适的备份方法,例如完全备份、增量备份等,根据业务需求设置备份频率。
3. 系统优化服务器维护还需进行系统性能的优化。
清理无效文件、关闭不必要的服务、合理分配系统资源等操作,能够提高服务器性能和效率。
五、服务器维护之网络安全维护1. 防火墙设置服务器维护中,设置和更新防火墙是非常重要的工作。
防火墙能够阻止未经授权的访问和恶意攻击,保障服务器安全。
设定合理的访问规则,并定期检查和更新。
2. 安全更新服务器上的软件和应用程序也需要定期更新,以修补可能的安全漏洞。
宝德PR4908P服务器用户手册声明本手册可能会出现技术或排版印刷的错误,因此宝德计算机系统股份有限公司会定期修订此手册,并将修改后的内容纳入新版本中。
宝德计算机系统股份有限公司拥有对产品、程序进行改进、更新的权力。
宝德计算机系统股份有限公司对于在非宝德计算机系统股份有限公司提供的设备上使用本公司软件的可靠性概不负责。
本手册中载有受版权保护的专利信息,版权所有,未经宝德计算机系统股份有限公司的事先书面许可,本手册中的任何内容均不得复印、翻印或翻译。
Powerleader是深圳宝德科技集团股份有限公司的注册商标。
Intel,XEON是Intel公司的注册商标。
Microsoft是Microsoft公司的注册商标。
Redhat是Red Hat公司的注册商标。
所有其它公司或产品名称分别是持有者的商标或服务标志。
简介本手册主要描述了如何对宝德系列服务器进行操作、升级、配置和疑难解答,它可使操作者熟悉宝德系列服务器并为将来可能出现的问题提供参考。
章节说明本手册包括以下内容:1.使用准备2.系统结构描述3.系统说明与设置4.BIOS设置5.集成RAID配置6.操作系统安装说明7.系统故障诊断特殊标志手册中出现以下三种特定提示标志:警告:会引起人身伤害及灾难性的行为注意:会引起硬件损坏或造成软件故障的行为注释:提供重要信息目录第一章使用准备 (1)1.1摘要 (1)1.2检查运输包装 (1)1.3选择一个放置服务器的合适位置 (1)1.4把服务器安装在机架上 (2)1.5检查电源线 (2)1.6增加设备 (2)1.7连接外围设备 (2)1.8打开显示器和服务器 (3)第二章系统结构描述 (4)2.1PR4908P结构特性 (4)2.2服务器开关面板示意图: (5)2.3系统后面板示意图: (6)2.4主板图示 (8)2.5主板L AYOUT图示 (9)2.6主板系统架构图示 (10)2.7主板跳线设置 (12)2.8导轨安装 (14)第三章系统说明与设置 (18)3.1CPU (18)3.2内存 (24)3.3视频控制器 (26)3.4硬盘控制器 (26)3.5键盘和鼠标 (26)3.6光驱和软驱 (26)3.7PCI扩展 (26)3.8认证兼容操作系统 (26)第四章BIOS设置 (28)第五章集成RAID配置 (1)5.1在BIOS中设置RAID状态 (1)5.2主板集成RAID的操作指南 (1)第六章操作系统安装说明 (5)6.1M ICROSOFT W INDOWS2012R2E NTERPRISE S ERVER安装说明 (5)6.2准备工作: (5)6.3R ED H AT E NTERPRISE L INUX7.364位操作系统和驱动程序安装说明 (21)第七章系统故障排除 (38)7.1系统复位介绍 (38)7.2系统首次启动 (38)7.3其他问题及解决办法 (39)7.4具体问题 (40)使用准备1.1摘要第一章使用准备本章内容的主要任务是讲述如何做一些基本的准备工作.它们包括:检查运输包装;选择一个放置服务器的合适位置;检查电源设置开关;检查电源线;增加设备;连接外围设备;打开显示器和服务器;操作系统安装准备。
网络机房服务器及网络安全设备安装维护手册1. 介绍1.1 机房服务器和网络安全设备概述本手册旨在提供有关网络机房服务器和网络安全设备的安装、配置和维护的指导。
这些设备对于网络基础设施的性能和安全至关重要。
1.2 目标受众本手册的目标受众包括机房管理员、网络管理员和技术支持人员。
它旨在帮助他们正确地安装、配置和维护这些关键设备,以确保网络的可用性、性能和安全性。
2. 安全须知2.1 电源和电压要求电源要求:确保服务器和网络安全设备的电源满足设备制造商的要求,以避免电源故障导致的损害。
2.2 安全注意事项安全是首要任务。
在安装和维护过程中,始终遵循以下安全注意事项:使用防静电设备,避免静电放电对设备的损害。
在工作时,注意设备的重量和尺寸,以避免受伤。
关闭电源并断开电源线,确保电器设备处于断电状态,然后才进行维护。
2.3 防静电措施防止静电放电:使用防静电手环或防静电地板。
将设备存放在防静电袋中。
3. 安装前准备3.1 机房选址和环境要求选择机房位置:确保机房位置干燥、通风良好,远离水源和潮湿环境。
提供足够的空间,以容纳服务器机架和网络安全设备。
电源和冷却要求:安排稳定的电源供应,使用UPS备电源系统以应对突发停电。
实施有效的空调和温度控制措施,以维持适宜的工作温度。
3.2 电源和冷却系统准备安装UPS系统,确保设备在电源故障时有足够的时间来完成安全关机。
确保空调系统运行正常,维持机房内的稳定温度和湿度。
3.3 数据线和网络连接准备确保提供足够的数据线和网络电缆,以连接服务器和网络安全设备到网络。
4. 服务器安装4.1 机架或机柜准备安装服务器机架或机柜,确保它们坚固、稳定,并正确安装在机房中。
4.2 服务器固定和安装使用合适的工具,将服务器正确安装到机架或机柜中,确保固定稳固。
4.3 电源和数据线连接将服务器的电源线插入电源插座,确保连接牢固。
使用适当的数据线连接服务器到网络设备和交换机。
4.4 服务器开机和基本配置启动服务器并按照制造商的说明进行基本配置,包括设置IP地址、子网掩码、网关等。
Nginx服务器技术手册一、概述Nginx是一款高性能的Web服务器,同时也是一款反向代理服务器。
它的出现极大地改善了Web服务器的处理效率和并发连接数,成为了很多网站架构的首选。
本文将介绍Nginx服务器的基本概念、安装配置、性能优化等相关内容,帮助读者更好地理解和应用Nginx服务器。
二、Nginx服务器的基本概念1. Nginx简介Nginx是一款自由、开源的高性能HTTP服务器和反向代理服务器。
它采用事件驱动的异步架构,可以快速地处理大量的并发连接,有效提高服务器的并发性能。
2. Nginx的优势- 高并发能力:Nginx采用异步非阻塞模型,能够处理大量的并发连接,适用于高访问量的网站。
- 内存占用低:Nginx的内存占用较低,可以有效降低服务器资源的消耗。
- 配置简单灵活:Nginx的配置文件简洁明了,支持动态加载配置,方便管理和维护。
- 高度可扩展:Nginx支持模块化的设计,可以通过插件扩展各种功能,满足不同应用需求。
三、Nginx服务器的安装配置1. 环境准备在安装Nginx之前,需要确保操作系统环境满足要求。
Nginx可运行在多个操作系统平台上,例如Linux、Windows等。
2. 下载与安装下载Nginx的安装包,并将其解压到指定目录。
通过配置文件进行相关设置,可以根据需要自定义Nginx服务器的监听端口、日志路径、缓存参数等。
3. 基本配置Nginx的基本配置包括监听端口、虚拟主机配置、反向代理等。
在配置文件中,可以使用server指令设置服务器监听端口,使用location指令设置反向代理规则等。
四、Nginx服务器的性能优化1. 前端优化前端性能优化是指通过各种手段提高页面的加载速度和用户体验,减少服务器的负载压力。
常用的优化方式包括减少HTTP请求、合并文件、压缩资源等。
2. 后端优化后端性能优化主要集中在提高服务器性能和并发能力上,以更好地应对高并发的请求。
常见的优化手段包括使用缓存、调整连接池大小、优化数据库查询等。
服务器维修基本技术手册第一章服务器维修的基本原则和注意事项§1。
1基本原则:1、先想后做。
先想好怎么做,再实际动手。
先分析判断,再进行维修.2、不懂要问.不确定的情况,要查资料,咨询同事,TS L2,TAM后,才动手。
3、先外后内。
先观察使用周围环境。
设备位置、电源、连接、其它设备、温度与湿度是否正常。
之后看设备故障的现象。
显示的内容,及它们与正常情况下的异同。
再看设备内部情况。
灰尘、是否腐蚀、连接、器件的颜色、部件的形状、指示灯的状态等。
最后看设备的软硬件配置安装了何种硬件,资源的使用情况;使用的是使种操作系统,其上又安装了何种应用软件;硬件的设置驱动程序版本等。
4、先软后硬。
先检查软件问题,当可判软件环境是正常时,如果故障不能消失,再从硬件方面着手检查.5、分清主次。
在复现故障现象时,有时可能会看到一台故障机不止有一个故障现象,而是有两个或两个以上的故障现象(如:启动过程中无显,但机器也在启动,同时启动完后,有死机的现象等),为时,应该先判断、维修主要的故障现象,当修复后,再维修次要故障现象,有时可能次要故障现象已不需要维修了。
§1.2 注意事项一、需要提醒客户备份数据二、准备充足的服务器拆装工具和防止静电设备。
三、维修前充分观察客户使用环境和相关的软件状况四、对于复杂的客户应用环境,需要客户配合做相关操作,例如服务器的开关操作及应用关闭五、拆装部件时的观察:要有记录部件原始安装状态的好习惯六、加电过程中的观察:元器件的温度、异味、是否冒烟等;六、请求技术支持之前需要提供详细的硬件软件状态及已经完成详细操作过程和相关日志第二章常见故障判断和维护方法一、服务器加电类故障 No Power1、检测服务器面板指示灯和电源指示灯,及服务器开关指示灯;2、查看电源所连接的电源线;3、针对服务器电源冗余配置,尝试做交换检测4、服务器最小化操作及服务器Nvram清除5、观察服务器电源及内部备件是否有冒烟等现象发生6、更换故障备件做检测,并且升级Bios/BMCFW/Driver到最新二、服务器自检类故障NoPost1、检测服务器是否有得到电源供应2、查看服务器前面板的具体报错信息,并且针对错误信息做相关操作3、针对服务器外部连接设备做移除操作4、服务器最小化操作及服务器Nvram清除5、针对服务器启动的主要备件做插拔及最小化操作6、更换故障备件做检测,并且升级Bios/BMC FW/Driver到最新三、服务器内存故障1、检测服务器前面板是否有内存错误,并且收集DSET和SA日志2、服务器Nvram清除3、针对服务器故障内存做重新插拔操作4、更换故障备件做检测,并且升级Bios/BMC FW/Driver到最新四、服务器死机及不稳定故障1、收集服务器DSET和SA及操作系统的日志2、查看服务器安装的应用软件3、尽量在客户同意下升级Bios/BMC FW/Driver到最新4、移除服务器上第三方硬件并且最小化及服务器Nvram清除5、针对服务器启动的主要备件做插拔及最小化操作6、更换故障备件做检测,并且升级Bios/BMC FW/Driver到最新五、服务器阵列卡和硬盘故障1、收集服务器当前的阵列信息和硬盘配置及槽位,并且收集服务器DSET和TTY日志2、在操作系统能够正常启动的时候,确保服务器的数据备份3、尽量在条件允许和客户的同意下检测HD及SCSI/SAS/SATA等数据线和链路状况4、更换故障备件,如果更换硬盘要确保有处在重建状态,并且要和客户沟通了解重建结果5、如果服务单有针对硬盘的FW操作,需要做相关操作6、更换故障备件做检测,并且升级Bios/BMC FW/Driver到最新六、服务器阵网络故障1、检测服务器网卡的安装情况,是否有松动及网卡指示灯,并且做网线的检测2、在操作系统下做网络Ping操作,并且检测IP配置,网卡Duplex 和Speed配置情况3、尽量在条件允许下检测服务器BIOS里面的网卡配置,及网卡诊断4、更换网卡所连接的外部HUB和交换机的端口,网线更换。
数据中心机房运行维护手册1 总则1.1为了加强数据中心机房的规范化、标准化管理,提高数据中心的工作效率,降低维护成本,增强系统安全性,特制订本作业指导书。
1.2本作业指导书可作为学习与培训教材,为今后持续改进作业质量、提高人员素质和技术水平服务。
2 适用范围2.1本作业指导书适用于XX公司信息通信分公司数据中心机房维护工作。
2.2本作业指导书适用于XX公司信息通信分公司数据中心机房执行。
3 规范性引用文件XX公司《计算机信息系统管理标准》4 支持文件《XX公司信息化工作管理办法》5 安全及预控措施5.1数据中心机房维护时应做好防静电保护,带防静电手腕尽可能地注意安全,特别在清洁服务器内部时,要用专业清洁用品,不得用替代品,以免损坏服务器内电子元件。
5.2 对机房内的电源开关进行维护时,要有工作票及操作流程、步骤,绝不可误操作,必须按照操作规程进行操作。
6 作业准备7 作业周期本作业无固定作业周期。
8 工期定额正常情况下,本项作业工作时间为 4小时。
9 作业项目9.1设备的维护机房内(包括电源间)的所有硬件设备,由设备管理部门负责管理,随时受理和处理硬件设备的突发事故。
保证计算机及附属设备的良好运行状态。
1.机房值班员要每天到机房巡视至少一次。
对各种设备的运转情况(包括电源、空调)进行必要的检查,记录有错误代码的设备,供有关人员检修使用。
2.机房空调必须定期例行检修:空调系统出现故障报警,有关人员要及时处理解决,不得拖延;每半年清洁一次过滤网、排水管和加湿器,定期更换加湿罐(随各地水质而定);每半年清扫一次室外冷凝机组,保证通风良好。
3.电源系统必须定期例行检修:每半年要分析一次机器运行记录,查找隐患,并采取相应的对策;每半年要对蓄电池做一次充放电测试。
清洁或更换机器过滤网,检查机器易损件的运行情况;在确保不影响正常生产的情况下,每年要对UPS设备进行一次双机切换演练。
并对电源配电柜检修;在确保不影响正常生产的情况下,每年要做一次UPS设备、备用发电机、总配电柜切换模拟实验。
服务器维护明细本文档旨在提供服务器维护的完整详情和步骤。
以下是服务器维护的详细内容:1. 维护计划维护计划将根据服务器的需求和优先级制定,以确保服务器的稳定性和性能。
维护计划将包括以下几个主要方面:1.1 定期固定维护每周定期进行固定维护,包括检查服务器硬件状况、操作系统更新、安全补丁安装等。
1.2 预防性维护根据预测和可用性要求,进行预防性维护,确保服务器在关键时刻保持稳定。
1.3 问题修复和紧急维护针对出现的问题和紧急情况,及时进行修复和维护,以最小化服务器故障和数据丢失的风险。
2. 维护步骤维护步骤将根据不同的维护类型和具体需求进行制定。
以下是维护过程的一般步骤:2.1 提前备份服务器数据在维护前,务必提前备份服务器上的所有重要数据,并验证备份的完整性和可恢复性。
2.2 停止服务器服务维护开始前,停止服务器上的所有服务和应用程序,以确保维护期间用户无法访问服务器。
2.3 硬件和操作系统检查对服务器硬件进行检查,包括内存、硬盘、电源等,确保没有故障或损坏。
同时,进行操作系统的更新和安全补丁的安装。
2.4 软件和数据库优化对服务器上运行的软件和数据库进行优化,以提升性能和效率,如清理临时文件、重新索引数据库等。
2.5 安全性检查维护期间进行安全性检查,确保服务器系统没有被入侵或受到恶意软件的侵害。
2.6 测试维护结果在维护完成后,进行必要的测试和验证,确保服务器的正常运行和性能改进。
3. 维护记录为了记录维护的详细信息和结果,维护期间应编写维护记录。
维护记录将包括以下内容:- 维护计划和目标- 维护步骤和操作- 发生的问题和修复过程- 维护结果和性能改进以上是服务器维护的完整版明细,通过遵循维护计划和步骤,可以确保服务器的稳定性和性能。
请在每次维护后更新维护记录,以方便追踪和分析服务器的维护历史和趋势。
服务器维修基本技术手册
第一章服务器维修的基本原则和注意事项
§1.1基本原则:
1、先想后做。
先想好怎么做,再实际动手。
先分析判断,再进行维修。
2、不懂要问。
不确定的情况,要查资料,咨询同事,TS L2,TAM后,才动手。
3、先外后内。
先观察使用周围环境。
设备位置、电源、连接、其它设备、温度与湿度是否正常。
之后看设备故障的现象。
显示的内容,及它们与正常情况下的异同。
再看设备内部情况。
灰尘、是否腐蚀、连接、器件的颜色、部件的形状、指示灯的状态等。
最后看设备的软硬件配置安装了何种硬件,资源的使用情况;使用的是使种操作系统,其上又安装了何种应用软件;硬件的设置驱动程序版本等。
4、先软后硬。
先检查软件问题,当可判软件环境是正常时,如果故障不能消失,再从硬件方面着手检查。
5、分清主次。
在复现故障现象时,有时可能会看到一台故障机不止有一个故障现象,而是有两个或两个以上的故障现象(如:启动过程中无显,但机器也在启动,同时启动完后,有死机的现象等),为时,应该先判断、维修主要的故障现象,当修复后,再维修次要故障现象,有时可能次要故障现象已不需要维修了。
§1.2 注意事项
一、需要提醒客户备份数据
二、准备充足的服务器拆装工具和防止静电设备.
三、维修前充分观察客户使用环境和相关的软件状况
四、对于复杂的客户应用环境,需要客户配合做相关操作,例如服务器的开关操作及应用关闭
五、拆装部件时的观察:要有记录部件原始安装状态的好习惯
六、加电过程中的观察:元器件的温度、异味、是否冒烟等;
六、请求技术支持之前需要提供详细的硬件软件状态及已经完成详细操作过程和相关日志
第二章常见故障判断和维护方法
一、服务器加电类故障 No Power
1、检测服务器面板指示灯和电源指示灯,及服务器开关指示灯;
2、查看电源所连接的电源线;
3、针对服务器电源冗余配置,尝试做交换检测
4、服务器最小化操作及服务器Nvram清除
5、观察服务器电源及内部备件是否有冒烟等现象发生
6、更换故障备件做检测,并且升级Bios/BMC FW/Driver到最新
二、服务器自检类故障 No Post
1、检测服务器是否有得到电源供应
2、查看服务器前面板的具体报错信息,并且针对错误信息做相关操作
3、针对服务器外部连接设备做移除操作
4、服务器最小化操作及服务器Nvram清除
5、针对服务器启动的主要备件做插拔及最小化操作
6、更换故障备件做检测,并且升级Bios/BMC FW/Driver到最新
三、服务器内存故障
1、检测服务器前面板是否有内存错误,并且收集DSET和SA日志
2、服务器Nvram清除
3、针对服务器故障内存做重新插拔操作
4、更换故障备件做检测,并且升级Bios/BMC FW/Driver到最新
四、服务器死机及不稳定故障
1、收集服务器DSET和SA及操作系统的日志
2、查看服务器安装的应用软件
3、尽量在客户同意下升级Bios/BMC FW/Driver到最新
4、移除服务器上第三方硬件并且最小化及服务器Nvram清除
5、针对服务器启动的主要备件做插拔及最小化操作
6、更换故障备件做检测,并且升级Bios/BMC FW/Driver到最新
五、服务器阵列卡和硬盘故障
1、收集服务器当前的阵列信息和硬盘配置及槽位,并且收集服务器DSET和TTY日志
2、在操作系统能够正常启动的时候,确保服务器的数据备份
3、尽量在条件允许和客户的同意下检测HD及SCSI/SAS/SATA等数据线和链路状况
4、更换故障备件,如果更换硬盘要确保有处在重建状态,并且要和客户沟通了解重建结果
5、如果服务单有针对硬盘的FW操作,需要做相关操作
6、更换故障备件做检测,并且升级Bios/BMC FW/Driver到最新
六、服务器阵网络故障
1、检测服务器网卡的安装情况,是否有松动及网卡指示灯,并且做网线的检测
2、在操作系统下做网络Ping操作,并且检测IP配置,网卡Duplex 和Speed配置情况
3、尽量在条件允许下检测服务器BIOS里面的网卡配置,及网卡诊断
4、更换网卡所连接的外部HUB和交换机的端口,网线更换.直连服务器网卡
5、尝试直连服务器网卡, 排除网络设备引起的问题
6、尝试操作系统下更新网卡驱动和FW
7、更换故障备件做检测,并且升级Bios/BMC FW/Driver到最新
七、服务器及磁带机故障
1、检测服务器1启动过程和操作系统下正确识别到磁带机设备
2、在操作系统下尝试更新磁带机的驱动,有条件可以清洁磁带机
3、如果是使用第三备件软件,收集备份软件的日志
4、针对磁带机经常卡带,保证磁带机的FW是最新
5、针对带库磁带设备, 收集日志和相关的错误信息
6、更换故障备件做检测,并且升级Bios/BMC FW/Driver到最新
八、服务器及磁盘存储故障
1、针对服务器和所连接的磁盘存储,掌握基本的关开系统的操作
2、基本掌握磁盘存储的管理配置和使用,及相关日志的收集方法
2、针对磁盘的维护,参考服务器阵列卡和硬盘故障
3、对于服务器和磁盘存储的复杂问题, 及时了解故障情况,多收集信息
4、强调备份数据的重要性
5、针对复杂问题及不能修复的问题,及时和技术支持联系
6、更换故障备件做检测,并且升级Bios/BMC FW/Driver到最新。