服务器健康检查表
- 格式:docx
- 大小:128.60 KB
- 文档页数:3
服务器设备巡检表服务器设备巡检表日期:___________________巡检人员:___________________巡检周期:每月/每季度/半年度/年度:巡检过程中若发现异常情况,请及时记录并向相关人员报告。
1·服务器基本信息●服务器名称:●服务器型号:●服务器IP地质:●服务器所在机房:●服务器提供商:●服务器操作系统:●服务器使用用途:2·网络设备巡检●网络设备名称:●网络设备型号:●网络设备IP地质:●网络设备所在机房:●确认网络设备正常运行:●[ ] 网络设备电源是否正常通电●[ ] 网络设备指示灯是否正常工作●[ ] 网络设备连接状态是否正常●[ ] 网络设备出现故障是否有告警提示●确认网络设备配置正常:●[ ] 网络设备参数配置是否正确●[ ] 网络设备升级和维护记录是否完整3·存储设备巡检●存储设备名称:●存储设备型号:●存储设备IP地质:●存储设备所在机房:●确认存储设备正常运行:●[ ] 存储设备电源是否正常通电●[ ] 存储设备指示灯是否正常工作●[ ] 存储设备连接状态是否正常●[ ] 存储设备出现故障是否有告警提示●确认存储设备配置正常:●[ ] 存储设备参数配置是否正确●[ ] 存储设备升级和维护记录是否完整●确认存储设备备份功能正常:●[ ] 存储设备备份记录是否完整4·数据库服务器巡检●数据库服务器名称:●数据库服务器型号:●数据库服务器IP地质:●数据库服务器所在机房:●确认数据库服务器正常运行:●[ ] 数据库服务器电源是否正常通电●[ ] 数据库服务器指示灯是否正常工作●[ ] 数据库服务器连接状态是否正常●[ ] 数据库服务器出现故障是否有告警提示●确认数据库服务器配置正常:●[ ] 数据库服务器参数配置是否正确●[ ] 数据库服务器升级和维护记录是否完整●确认数据库备份功能正常:●[ ] 数据库备份记录是否完整附件:1·巡检过程中的照片记录2·巡检过程中的报告记录法律名词及注释:1·服务器设备:用于存储和处理数据的专门设备,提供各种服务如网站、数据库等。
服务器机房检查表服务器机房检查表1·机房环境检查1·1 机房温度●检查机房内温度是否在设定范围内(一般为20°C ●25°C)●检查温度控制设备是否正常工作●确保机房内无温度异常区域(例如热点)1·2 机房湿度●检查机房湿度是否在设定范围内(一般为40% ●60%)●检查湿度控制设备是否正常工作●确保机房内无湿度异常现象1·3 机房通风●检查机房通风设备是否正常工作●确保机房内空气流通顺畅1·4 机房灰尘●检查机房内是否存在过多的灰尘●清洁机房内的设备和地面,确保无灰尘积累1·5 机房噪音●检测机房内的噪音水平是否超出规定范围●确保机房内噪音对设备正常运行不会造成干扰1·6 火灾安全●检查机房内的火灾报警系统是否正常运行●确保机房内各种消防设施是有效的●检查机房内的烟雾探测器和灭火装置是否工作正常2·电力设备检查2·1 UPS设备●检查UPS设备的工作状态和电池容量●确保UPS能正常提供电力●检查UPS备用电池是否充电正常2·2 电源线路●检查电源线路的连接是否牢固●检查电源线路的电压和频率是否稳定●确保电源线路存在备用电源供应2·3 发电机组●检查发电机组的工作状态和燃料储备●确保发电机组能正常提供电力●检查发电机组是否进行过定期维护2·4 电力配电●检查电力配电设备是否正常运行●确保电力分配均衡且无过载现象●检查电源插座和电源线路的接地情况3·网络设备检查3·1 交换机和路由器●检查交换机和路由器的工作状态和连接情况●确保交换机和路由器能正常转发数据●检查交换机和路由器的配置是否正确3·2 防火墙●检查防火墙的工作状态和规则配置●确保防火墙能正常过滤网络流量●检查防火墙的日志记录和报警功能是否正常3·3 服务器●检查服务器的工作状态和负载情况●确保服务器能正常运行和响应请求●检查服务器的存储空间和备份情况3·4 网络接入和带宽●检查网络接入设备的工作状态和带宽利用率●确保网络接入稳定且满足业务需求●检查网络流量统计和账单情况4·安全措施检查4·1 门禁系统●检查机房门禁系统的工作状态和权限设置●确保只有授权人员能进入机房●检查门禁系统的日志记录和报警功能是否正常 4·2 监控系统●检查机房监控系统的工作状态和视频存储●确保监控系统能正常录像和播放●检查监控系统的报警功能是否正常4·3 入侵检测系统●检查入侵检测系统的工作状态和规则配置●确保入侵检测系统能及时发现并阻止入侵行为●检查入侵检测系统的日志记录和报警功能是否正常附件:●机房温度湿度记录表●UPS设备运行日志●交换机和路由器配置文件备份●监控系统录像存储记录法律名词及注释:●UPS(不间断电源):一种提供电力供应连续性的装置,用于防止电力中断对设备造成损坏。
服务器健康检查表1环保局服务器健康检查表检查内容:1.检查机房环境,电源温度、湿度是否符合要求:□符合要求□不符合备注:电源:相电压:□符合要求□不符合备注:线电压:□符合要求□不符合备注:零地电压:□符合要求□不符合备注:2.检查系统硬件情况检查设备故障灯是否有亮:□有□无备注:有否异常情况(如硬盘、风扇异常的声音,电缆破损):□有□无备注:3.检查有无内置磁带机内置磁带机:□有□无4.检查系统错误报告(Error Log)有否硬件故障:□有□无故障内容:有否软件故障:□有□无故障内容:2结论:注意:如果故障记录太多,应将故障报告取回,作进一步分析。
5.查文件系统查看有没有“满”的文件系统。
文件系统满可导致系统不能正常工作,尤其是AIX 的基本文件系统。
如/(根文件系统)满则会导致用户不能登录。
有否“满”的文件系统:□有□无备注:6.检查内存交换区(paging pace)使用率使用率是否超过70%:□有□无备注:7.检查CPU 是否繁忙(sar 1 10)CPU 空闲是否小于20%:□有□无备注:8.检查I/O 是否繁忙(iostat 1)是否大数据读写都集中在某些硬盘上:□有□无备注:9.检测诊断(Diagnostic)机器shutdown 后以慢启动方式作自检,启动后运行diag 系统诊断程序。
系统板、CPU、内存、I/O 板:□正常□不正常网卡、SCSI 卡、SSA 卡:□正常□不正常系统其他扩展卡:□正常□不正常硬盘、磁盘阵列:□正常□不正常磁带机、磁带库:□正常□不正常备注:10.通信测试检查各网卡的状态、IP 地址、路由表等:□正常□不正常用“ping”等命令检查通信:□正常□不正常备注:11.检查磁盘阵列(如:7133)状况,并填写下表:序列号硬盘数量硬盘容量硬盘微码有无Hot Spare 何种数据保护12.检查硬盘使用率整体存储空间:GB使用空间:GB客户签字:工程师签字:年月日年月日。
服务器设备巡检表服务器设备巡检表1.前言本文档旨在记录服务器设备的巡检情况,以确保服务器正常运行和提高系统的可用性和可靠性。
2.巡检日期和时间记录每次巡检的日期和时间,以便跟踪维护和保养。
3.物理检查在进行服务器设备巡检时,进行以下物理检查:3.1 机柜- 检查机柜外观是否完好无损。
- 检查机柜门是否关闭并锁好。
- 检查机柜内的设备是否安装稳固。
3.2 电源- 检查主电源是否正常供电。
- 检查电源线是否连接牢固。
3.3 线缆- 检查所有线缆连接是否牢固。
- 检查线缆是否有损坏或磨损现象。
4.硬件检查对服务器设备的硬件进行详细检查,包括但不限于以下项目:4.1 服务器- 检查服务器是否正常开机并运行。
- 检查服务器的指示灯是否正常工作。
- 检查服务器的风扇是否运转正常。
4.2 硬盘- 检查硬盘是否正常运行。
- 检查硬盘是否有错误信息或异常声音。
4.3 内存- 检查内存条是否安装正确。
- 检查内存是否正常工作。
4.4 CPU- 检查 CPU 温度是否正常。
- 检查 CPU 的运行频率是否正常。
5.软件检查检查服务器设备上的软件环境和配置,包括但不限于以下项目:5.1 操作系统- 检查操作系统是否正常启动。
- 检查操作系统的版本和更新情况。
5.2 安全补丁- 检查安装的安全补丁是否最新。
- 检查系统是否存在安全漏洞。
5.3 防火墙- 检查防火墙是否开启并配置正确。
- 检查防火墙日志是否正常。
6.日志检查检查服务器设备上的日志信息,包括但不限于以下项目:6.1 系统日志- 检查系统日志是否有异常报错信息。
- 检查系统日志是否有重要警告提示。
6.2 应用日志- 检查各应用程序的日志是否有异常错误信息。
- 检查应用程序的日志是否有重要警告提示。
7.安全检查针对服务器设备的安全性进行详细检查,包括但不限于以下项目:7.1 密码策略- 检查密码策略是否符合安全要求。
- 检查用户密码是否过期或弱口令。
7.2 用户权限- 检查用户权限是否正确配置。
服务器健康检查表公司标准化编码 [QQX96QT-XQQB89Q8-NQQJ6Q8-MQM9N]
1
环保局服务器健康检查表
检查内容:
1.检查机房环境,电源
温度、湿度是否符合要求:□符合要求□不符合
备注:
电源:
相电压:□符合要求□不符合
备注:
线电压:□符合要求□不符合
备注:
零地电压:□符合要求□不符合
备注:
2.检查系统硬件情况
检查设备故障灯是否有亮:□有□无
备注:
有否异常情况(如硬盘、风扇异常的声音,电缆破损):□有□无
备注:
3.检查有无内置磁带机
内置磁带机:□有□无
4.检查系统错误报告(Error Log)
有否硬件故障:□有□无
故障内容:
有否软件故障:□有□无
故障内容:
2
结论:
注意:如果故障记录太多,应将故障报告取回,作进一步分析。
5.查文件系统
查看有没有“满”的文件系统。
文件系统满可导致系统不能正常工作,尤其是AIX 的基本
文件系统。
如/(根文件系统)满则会导致用户不能登录。
有否“满”的文件系统:□有□无
备注:
6.检查内存交换区(paging pace)使用率
使用率是否超过70%:□有□无
备注:
7.检查CPU 是否繁忙(sar 1 10)
CPU 空闲是否小于20%:□有□无
备注:
8.检查I/O 是否繁忙(iostat 1)
是否大数据读写都集中在某些硬盘上:□有□无
备注:
9.检测诊断(Diagnostic)
机器shutdown 后以慢启动方式作自检,启动后运行diag 系统诊断程序。
系统板、CPU、内存、I/O 板:□正常□不正常
网卡、SCSI 卡、SSA 卡:□正常□不正常
系统其他扩展卡:□正常□不正常
硬盘、磁盘阵列:□正常□不正常
磁带机、磁带库:□正常□不正常
备注:
10.通信测试
检查各网卡的状态、IP 地址、路由表等:□正常□不正常
用“ping”等命令检查通信:□正常□不正常
备注:
11.检查磁盘阵列(如:7133)状况,并填写下表:
序列号硬盘数量硬盘容量硬盘微码有无Hot Spare 何种数据保护
12.检查硬盘使用率
整体存储空间: GB
使用空间: GB
客户签字:工程师签字:
年月日年月日。