磁盘阵列常见日志信息及解决方式
- 格式:pdf
- 大小:143.69 KB
- 文档页数:20
磁盘阵列常见日志简介目录1.控制器事件 01.1 严重警告 01.2 一般警告 (1)1.3 通知 (1)2.磁盘 (2)2.1 严重警告 (2)2. 2 一般警告 (3)3.通道 (4)3.1 严重警告 (4)3.2 通知 (6)4.逻辑盘 (6)4.1 严重警告 (6)4.2 通知 (8)5.常见事件 (10)5.1 严重警告 (10)6.周边设备 (11)6.1 严重警告 (12)7.SES 设备 (13)7.1 严重警告 (13)8.常见外围设备 (14)8.1 严重警告 (14)1.控制器事件1.1 严重警告1 .Controller SDRAM ECC <multi-bits/single-bit> Error Detected发生原因:内存Single-bit/Multi-bits Errors处理方法:检查内存是否故障,重新更新FW,如仍有故障请联系供应商解决出现频率:一般2. Controller SDRAM Parity Error Detected发生原因:内存校验错误处理方法:更新FW,更换内存测试,如故障仍未解决,请联系供应商解决。
出现频率:低3. Controller ALERT: Power Supply Unstable or NVRAM Failed发生原因:电源电压输出过低,或者NVRAM内部错误.处理方法:请与供应商联系,如必要可更换新电源出现频率:低4. Controller ALERT: Redundant Controller Failure Detected发生原因:双控制器其中之一发生故障,另一控制器接管处理方法:检查双控制器在硬件、FW及其他设置上是否一致,如确认为硬件故障所致,请联系供应商解决。
出现频率:低5. CHL:_ FATAL ERROR (_)发现原因:其中一个通道发生故障处理方法:请检查连接线路,双控的模式下,让另一控制器将接替故障控制器的工作,并联系供应商解决.6. Controller BBU Absent or Failed!发生原因:BBU(电池)被移走或故障处理方法:检查BBU是否安装正常出现频率:一般7. BBU Failure Detected发生原因:BBU发生故障处理方法:请联系供应商解决.8. Controller PCI Bus Parity Error Detected发生原因:可能由于控制器内部的温度过高造成部件发生故障处理方法:请联系供应商解决.9. Force Controller Write-Through on Triggered Cause发生原因:控制器切换写入方式为Write-Through处理方法:恢复原来的工作状态,如未解决,请联系供应商解决.1.2 一般警告10. Controller BBU Not Fully Charged!发生原因:BBU充电不足,并且不建议将cach的模式由write-throung改为write-back处理方法:如果电池不能满足长时间的电量负荷,请联系供应商更换电池.11. Controller BBU Thermal Shutdown/Enter Sleep-Mode!发生原因:BBU温度过高(>=45),或是充电完成超过7小时造成控制器BBU突然关闭或者休眠.处理方法:检查环境通风是否良好,电池是否安装正确,出现此日志一般不需要进行特别操作12. Memory Not Sufficient to Fully Support Current Config.发生原因:使用的内存与当前的型号或配置不符处理方法:检查内存是否正常,更换内存测试1.3 通知1. CONTROLLER notice: NVRAM Factory Defaults Restored发生原因:Firmware已经恢复到出厂设置处理方法:请按ESC清掉该信息即可.2. Controller Initialization Completed发生原因:控制器初始化完成.处理方法:系统正常启动.3. Controller NOTICE: Redundant Controller Firmware Updated发生原因:冗余控制器的Firmare已经更新处理方法:按ESC清掉该信息即可.4. Memory is Now Sufficient to Fully Support Current Config.发生原因:添加内存或更换新内存已完成处理方法:按ESC清掉该信息即可.5. NVRAM Restore from Disk is Completed发生原因:已从disk保存的配置恢复到当前运行的配置处理方法:按ESC清掉该信息即可.6. NVRAM Restore from File is Completed发生原因:已从先前保存的一个配置文件恢复到当前运行的配置处理方法:按ESC清掉该信息即可.7. NOTICE: Controller BBU Back On-Line!发生原因:之前报错故障的BBU恢复工作处理方法:按ESC清掉该信息即可.8. NOTICE: Controller BBU Fully Charged!发生原因:控制器BBU充电完成处理方法:按ESC清掉该信息即可.9. NOTICE: Controller BBU Present!发生原因:曾丢失BBU,现已恢复.处理方法:按ESC清掉该信息即可.10. NOTICE: Controller FAN On-Line(_RPM)发生原因:之前报错故障的控制器风扇恢复工作处理方法:按ESC清掉该信息即可.2.磁盘2.1 严重警告1. CHL:_ ID:_ SCSI Target ALERT: Unexpected Select Timeout发生原因:硬盘响应超时,硬盘或与主机的连接线被移走均会导致此问题发生处理方法:检查硬盘是否安装到位,连接线是否可靠2. CHL:_ ID:_ SCSI Target ALERT: Gross Phase/Signal Error Detected发生原因:此通道信号异常处理方法:请联系供应商解决3. CHL:_ ID:_ SCSI Target ALERT: Unexpected Disconnect Encountered发生原因:驱动器通道意外中断处理方法:请检查连接线路,如未解决,请联系供应商.4. CHL:_ ID:_ SCSI Drive ALERT: Negotiation Error Detected发生原因:磁盘通道异常处理方法:请联系供应商解决.5. CHL:_ ID:_ SCSI Target ALERT: Timeout Waiting for I/O to Complete发生原因:可能由于硬盘故障或是线路问题造成硬盘I/O读写超时处理方法:请检查连接线路和硬盘,如未解决,联系供应商解决.6. CHL:_ ID:_ SCSI Target ALERT: SCSI Parity/CRC Error Detected发生原因:磁盘通道发生校验错误处理方法:请检查磁盘连接线路和硬盘, 如未解决,联系供应商解决.7. CHL:_ ID:_ SCSI Target ALERT: Data Overrun/Underrun Detected发生原因:此位置硬盘数据溢出错误处理方法:重新插入此硬盘或更换新硬盘测试,重新更新FW,如故障仍未解决请联系供应商.出现频率:极低8. CHL:_ ID:_ SCSI Target ALERT: Invalid Status/Sense Data Received(Sense_key Sense_code)发生原因:磁盘不能接收到客户端的数据处理方法:请检查磁盘连接线路和硬盘.9. CHL:_ ID:_ SCSI Drive ALERT: Drive HW Error (Sense_key Sense_code)发生原因:磁盘驱动器不能获得硬件的错误报表.处理方法:插拔故障磁盘,让热备盘进行数据的重建.10. CHL:_ ID:_ SCSI Drive ALERT: Bad Block Encountered - Block_number(Sense_key Sense_code)发生原因:磁盘不能获得介质的错误报表,控制器请求磁盘重试.处理方法:按ESC清掉该信息即可11. CHL:_ ID:_ SCSI Drive ALERT: CHL:_ ID:_ Clone Failed发生原因:磁盘初始化无响应处理方法:请检查磁盘连接线路和硬盘,如未解决,请联系供应商.12. Slot _ _ Drive ALERT: Bad Block Encountered - * * * * * * * * *发生原因:在一个RAID 1/3/5的阵列中,通过介质扫描或是在数据重建的过程中,可能出现发现坏块的事情,但如果显示是“Bad Block Encountered”,说明这不是当前的事情,已经由控制器将坏块所在的数据通过数据重建已经转移到了其他好的块道上了.处理方法:按ESC以清掉该错误信息即可.13. CHL:_ ID:_ SCSI Drive ALERT: Block Reassignment Failed -Block_number (Sense_key Sense_code)发生原因:磁盘块分配失败,磁盘可能被认为已经发生故障.处理方法:重新插拔故障硬盘,如未解决,请联系供应商更换新硬盘.14. CHL:_ ID:_ SCSI Drive ALERT: Aborted Command (Sense_keySense_code)发生原因:SCSI磁盘失败命令报告处理方法:按ESC已清掉该错误信息.15. CHL:_ ID:_ ALERT: Media Scan Bad Block Unrecoverable-0x0发生原因:介质扫描不能修复该磁盘的坏块.处理方法:更换新硬盘.以防止数据的丢失.2.2 一般警告1. SMART-CH:_ ID:_ Predictable Failure Detected (TEST)发生原因:当开启模拟SMART的功能测试时提示该信息,说明该磁盘能支持此功能.处理方法:按ESC以清掉该信息即可.2. SMART-CH:_ ID:_ Predictable Failure Detected发生原因:SMART提示该磁盘可能会发生故障,这个信息的提示只会在开启了SMART功能之后才会出现.处理方法:为防止数据的丢失,请联系供应商以更换新硬盘.3. SMART-CH:_ ID:_ Predictable Failure Detected-Starting Clone发生原因:SMART发现该位置的磁盘出现故障,并且备用盘已经在尽行数据的重建.处理方法:请联系供应商以更换新硬盘.4. SMART-CH:_ ID:_ Predictable Failure Detected-Clone Failed发生原因:SMART提示此位置的磁盘已经失效,备用盘接替了该磁盘的数据,并自动关掉该磁盘的电力供应.处理方法:请联系供应商以更换新硬盘.5. CHL:_ ID:_ SCSI Drive ALERT: Block Successfully Reassigned –Block_number (Sense_key Sense_code)发生原因:磁盘坏块被重新成功分配.处理方法:按ESC以清掉该信息即可.6. CHL:_ ID:_ SCSI Drive NOTICE: Scan SCSI Drive Successful发生原因:介质扫描新磁盘成功处理方法:按ESC以清掉该信息即可.3.通道3.1 严重警告1.CHL:_ ALERT: Redundant Loop Connection Error Detected on ID:_发生原因:双环连接情况下,其中一个环路故障或断开处理方法:检查连线是否正常,通道有无故障2.CHL:_ Host Channel ALERT: Channel Failure发生原因:主机通道连接失效处理方法:请检查线路连接,光纤连接或是交换机连接,如果仍未解决问题,请联系供应商.3. CHL:_ Drive Channel ALERT: Channel Failure发生原因:磁盘通道失效.处理方法:请检查线路连接,光纤连接或是交换机连接,如果仍未解决问题,请联系供应商.4. CHL:_ ALERT: Fibre Channel Loop Failure Detected发生原因:光纤通道失效处理方法:请检查线路连接,光纤连接或是交换机连接,如果仍未解决问题,请联系供应商.5. CHL:_ ALERT: Redundant loop for Chl:_ Failure Detected发生原因:其中一个冗余的通道已失效处理方法:请检查线路连接,光纤连接或是交换机连接,如果仍未解决问题,请联系供应商.6. CHL:_ ALERT: Redundant Path for Chl:_ ID:_ Expected but Not Found发生原因:预先设置的通道CHL:_冗余环路连接无效.处理方法:请检查线路连接,光纤连接或是交换机连接,如果仍未解决问题,请联系供应商.7. CHL:_ ID:_ ALERT: Redundant Path for Chl:_ ID:_ Failure Detected发生原因:通道CHL:_冗余环路连接失效处理方法:请检查线路连接,光纤连接或是交换机连接,如果仍未解决问题,请联系供应商.8. CHL:_ Host Channel ALERT: Bus Reset Issued发生原因:通道CHL:_总线重置处理方法:请联系供应商解决.9. CHL:_ Drive Channel ALERT: Data Overrun/Underrun Detected发生原因:CHL:_ ID:_此位置硬盘数据溢出错误处理方法:重新插入此硬盘或更换新硬盘测试,重新更新FW,如故障仍未解决请联系供应商出现频率:极低10. CHL:_ FATAL ERROR (_)发生原因:通道发生严重错误处理方法:请联系供应商解决.11. CHL:_ RCC Channel ALERT: Data Overrun/Underrun Detected发生原因:RCC通道发生数据溢出错误处理方法:请联系供应商解决.12. CHL:_ Host Channel ALERT: Parity/CRC Error Detected发生原因:主机通道发生奇偶校验错误处理方法:请联系供应商解决.13. CHL:_ Drive Channel ALERT: Gross Phase/Signal Error Detected发生原因:此通道信号异常处理方法:请联系供应商解决出现频率:低14. CHL:_ Drive Channel ALERT: Timeout Waiting for I/O to Complete发生原因:由于线路问题或是磁盘故障造成磁盘I/O读写超时处理方法:请联系供应商解决.15. CHL:_ Drive Channel ALERT: Unexpected Disconnect Encountered发生原因:磁盘通道意外中断请联系供应商解决.16. CHL:_ Drive Channel ALERT: Unexpected Select Timeout发生原因:CH响应超时,与主机的连接线被移走会导致此问题发生处理方法:检查连接线是否可靠出现频率:低17. CHL:_ RCC Channel ALERT: Gross Phase/Signal Error Detected发生原因:RCC通道信号异常处理方法:重新更新FW会解决此问题,如故障仍未解决请与供应商联系出现频率:一般18. CHL:_ RCC Channel ALERT: Parity/CRC Error Detected发生原因:RCC通道奇偶校验错误.处理方法:重新更新FW会解决此问题,如故障仍未解决请与供应商联系出现频率:一般19. CHL:_ RCC Channel ALERT: Timeout Waiting for I/O to Complete发生原因:RCC通道I/O读写超时,这可能是连接链路的问题,也可能是盘阵背板的故障问题.处理方法:请联系供应商解决20. Message CHL:_ RCC Channel ALERT: Unexpected DisconnectEncountered发生原因:RCC通道意外中断处理方法:请联系供应商解决3.2 通知1. CHL:_ NOTICE: Fibre Channel Loop Connection Restored发生原因:光纤环路通道恢复正常处理方法:按ESC以清掉该信息即可.2. CHL:_ ID:_ NOTICE: Redundant Path for Chl:_ ID:_ Restored发生原因:通道CHL:_冗余环路连接恢复正常处理方法:按ESC以清掉该信息即可.3. CHL:_ SCSI Drive Channel Notification: SCSI Bus Reset Issued发生原因:SCSI磁盘通道CHL:_总线重置处理方法:按ESC以清掉该信息即可.4. CHL:_ Host Channel Notification: SCSI Bus Reset Issued发生原因:主机通道CHL:_总线重置处理方法:按ESC以清掉该信息即可.5. CHL:_ LIP(__) Detected发生原因:光纤环路LIP被重置.处理方法:按ESC以清掉该信息即可.4.逻辑盘4.1 严重警告1. LG: _ ALERT: CHL:_ ID:_ Media Scan Aborted发生原因:介质扫描失败,可能的原因是用户强迫终止或是严重的系统故障.处理方法:重新手动执行介质扫描,如未解决,请联系供应商解决.2. LG:_ Logical Drive ALERT: Logical Drive Block Marked _________发生原因:通过比较和校验,已经确定坏的数据块,此时连接到此坏的数据块的主机将接收到介质错误的信息.处理方法:磁盘阵列自动尝试执行数据的重建.以恢复坏块的数据.3. LG:_ Logical Drive ALERT: Logical Drive Block Recovered ________发生原因:控制器通过比较和重新校验,已恢复逻辑盘坏块的数据.处理方法:按ESC以清掉该信息即可.4. LG:_ Logical Drive ALERT: Logical Drive Block Marked BAD发生原因:控制器通过比较和重新校验,但无法恢复逻辑盘坏块的数据.此时连接到该坏块的主机将收到介质错误的信息.处理方法:请联系供应商解决.5. LG: Logical Drive ALERT: CHL:_ ID:_ Drive Failure发生原因:对应位置的硬盘已失效处理方法:此故障是硬盘连接问题或硬盘本身故障引起的,请检查硬盘是否插紧,并对此硬盘重新扫描或更换硬盘, 如果盘阵已经设置有备用盘,控制器将自动执行数据的重建.出现频率:一般6. LG: Logical Drive ALERT: CHL:_ ID:_ Drive Missing发生原因:对应位置的硬盘丢失处理方法:此故障是硬盘连接问题或硬盘本身故障引起的,请检查硬盘是否插紧,并对此硬盘重新扫描或更换硬盘。
raid状态
编辑整理:
尊敬的读者朋友们:
这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(raid状态)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为raid状态的全部内容。
一、RAID状态提示图标:。
简介目录1.控制器事件 (2)1.1 严重警告 (2)1.2 一般警告 (3)1.3 通知 (3)2.磁盘 (4)2.1 严重警告 (4)2. 2 一般警告 (6)3.通道 (6)3.1 严重警告 (6)3.2 通知 (8)4.逻辑盘 (9)4.1 严重警告 (9)4.2 通知 (12)5.常见事件 (14)5.1 严重警告 (14)6.周边设备 (16)6.1 严重警告 (16)7.SES 设备 (17)7.1 严重警告 (17)8.常见外围设备 (19)8.1 严重警告 (19)1.控制器事件1.1 严重警告1 .Controller SDRAM ECC <multi-bits/single-bit> Error Detected发生原因:内存Single-bit/Multi-bits Errors处理方法:检查内存是否故障,重新更新FW,如仍有故障请联系供应商解决出现频率:一般2. Controller SDRAM Parity Error Detected发生原因:内存校验错误处理方法:更新FW,更换内存测试,如故障仍未解决,请联系供应商解决。
出现频率:低3. Controller ALERT: Power Supply Unstable or NVRAM Failed发生原因:电源电压输出过低,或者NVRAM内部错误.处理方法:请与供应商联系,如必要可更换新电源出现频率:低4. Controller ALERT: Redundant Controller Failure Detected发生原因:双控制器其中之一发生故障,另一控制器接管处理方法:检查双控制器在硬件、FW及其他设置上是否一致,如确认为硬件故障所致,请联系供应商解决。
出现频率:低5. CHL:_ FA TAL ERROR (_)发现原因:其中一个通道发生故障处理方法:请检查连接线路,双控的模式下,让另一控制器将接替故障控制器的工作,并联系供应商解决.6. Controller BBU Absent or Failed!发生原因:BBU(电池)被移走或故障处理方法:检查BBU是否安装正常出现频率:一般7. BBU Failure Detected发生原因:BBU发生故障处理方法:请联系供应商解决.8. Controller PCI Bus Parity Error Detected发生原因:可能由于控制器内部的温度过高造成部件发生故障处理方法:请联系供应商解决.9. Force Controller Write-Through on Triggered Cause发生原因:控制器切换写入方式为Write-Through处理方法:恢复原来的工作状态,如未解决,请联系供应商解决.1.2 一般警告10. Controller BBU Not Fully Charged!发生原因:BBU充电不足,并且不建议将cach的模式由write-throung改为write-back处理方法:如果电池不能满足长时间的电量负荷,请联系供应商更换电池.11. Controller BBU Thermal Shutdown/Enter Sleep-Mode!发生原因:BBU温度过高(>=45),或是充电完成超过7小时造成控制器BBU突然关闭或者休眠.处理方法:检查环境通风是否良好,电池是否安装正确,出现此日志一般不需要进行特别操作12. Memory Not Sufficient to Fully Support Current Config.发生原因:使用的内存与当前的型号或配置不符处理方法:检查内存是否正常,更换内存测试1.3 通知1. CONTROLLER notice: NVRAM Factory Defaults Restored发生原因:Firmware已经恢复到出厂设置处理方法:请按ESC清掉该信息即可.2. Controller Initialization Completed发生原因:控制器初始化完成.处理方法:系统正常启动.3. Controller NOTICE: Redundant Controller Firmware Updated发生原因:冗余控制器的Firmare已经更新处理方法:按ESC清掉该信息即可.4. Memory is Now Sufficient to Fully Support Current Config.发生原因:添加内存或更换新内存已完成处理方法:按ESC清掉该信息即可.5. NVRAM Restore from Disk is Completed发生原因:已从disk保存的配置恢复到当前运行的配置处理方法:按ESC清掉该信息即可.6. NVRAM Restore from File is Completed发生原因:已从先前保存的一个配置文件恢复到当前运行的配置处理方法:按ESC清掉该信息即可.7. NOTICE: Controller BBU Back On-Line!发生原因:之前报错故障的BBU恢复工作处理方法:按ESC清掉该信息即可.8. NOTICE: Controller BBU Fully Charged!发生原因:控制器BBU充电完成处理方法:按ESC清掉该信息即可.9. NOTICE: Controller BBU Present!发生原因:曾丢失BBU,现已恢复.处理方法:按ESC清掉该信息即可.10. NOTICE: Controller FAN On-Line(_RPM)发生原因:之前报错故障的控制器风扇恢复工作处理方法:按ESC清掉该信息即可.2.磁盘2.1 严重警告1. CHL:_ ID:_ SCSI Target ALERT: Unexpected Select Timeout发生原因:硬盘响应超时,硬盘或与主机的连接线被移走均会导致此问题发生处理方法:检查硬盘是否安装到位,连接线是否可靠2. CHL:_ ID:_ SCSI Target ALERT: Gross Phase/Signal Error Detected发生原因:此通道信号异常处理方法:请联系供应商解决3. CHL:_ ID:_ SCSI Target ALERT: Unexpected Disconnect Encountered发生原因:驱动器通道意外中断处理方法:请检查连接线路,如未解决,请联系供应商.4. CHL:_ ID:_ SCSI Drive ALERT: Negotiation Error Detected发生原因:磁盘通道异常处理方法:请联系供应商解决.5. CHL:_ ID:_ SCSI Target ALERT: Timeout Waiting for I/O to Complete发生原因:可能由于硬盘故障或是线路问题造成硬盘I/O读写超时处理方法:请检查连接线路和硬盘,如未解决,联系供应商解决.6. CHL:_ ID:_ SCSI Target ALERT: SCSI Parity/CRC Error Detected发生原因:磁盘通道发生校验错误处理方法:请检查磁盘连接线路和硬盘, 如未解决,联系供应商解决.7. CHL:_ ID:_ SCSI Target ALERT: Data Overrun/Underrun Detected发生原因:此位置硬盘数据溢出错误处理方法:重新插入此硬盘或更换新硬盘测试,重新更新FW,如故障仍未解决请联系供应商.出现频率:极低8. CHL:_ ID:_ SCSI Target ALERT: Invalid Status/Sense Data Received (Sense_key Sense_code)发生原因:磁盘不能接收到客户端的数据处理方法:请检查磁盘连接线路和硬盘.9. CHL:_ ID:_ SCSI Drive ALERT: Drive HW Error (Sense_key Sense_code) 发生原因:磁盘驱动器不能获得硬件的错误报表.处理方法:插拔故障磁盘,让热备盘进行数据的重建.10. CHL:_ ID:_ SCSI Drive ALERT: Bad Block Encountered - Block_number (Sense_key Sense_code)发生原因:磁盘不能获得介质的错误报表,控制器请求磁盘重试.处理方法:按ESC清掉该信息即可11. CHL:_ ID:_ SCSI Drive ALERT: CHL:_ ID:_ Clone Failed发生原因:磁盘初始化无响应处理方法:请检查磁盘连接线路和硬盘,如未解决,请联系供应商.12. Slot _ _ Drive ALERT: Bad Block Encountered - * * * * * * * * *发生原因:在一个RAID 1/3/5的阵列中,通过介质扫描或是在数据重建的过程中,可能出现发现坏块的事情,但如果显示是“Bad Block Encountered”,说明这不是当前的事情,已经由控制器将坏块所在的数据通过数据重建已经转移到了其他好的块道上了.处理方法:按ESC以清掉该错误信息即可.13. CHL:_ ID:_ SCSI Drive ALERT: Block Reassignment Failed - Block_number (Sense_key Sense_code)发生原因:磁盘块分配失败,磁盘可能被认为已经发生故障.处理方法:重新插拔故障硬盘,如未解决,请联系供应商更换新硬盘.14. CHL:_ ID:_ SCSI Drive ALERT: Aborted Command (Sense_key Sense_code)发生原因:SCSI磁盘失败命令报告处理方法:按ESC已清掉该错误信息.15. CHL:_ ID:_ ALERT: Media Scan Bad Block Unrecoverable-0x0发生原因:介质扫描不能修复该磁盘的坏块.处理方法:更换新硬盘.以防止数据的丢失.2.2 一般警告1. SMART-CH:_ ID:_ Predictable Failure Detected (TEST)发生原因:当开启模拟SMART的功能测试时提示该信息,说明该磁盘能支持此功能.处理方法:按ESC以清掉该信息即可.2. SMART-CH:_ ID:_ Predictable Failure Detected发生原因:SMART提示该磁盘可能会发生故障,这个信息的提示只会在开启了SMART功能之后才会出现.处理方法:为防止数据的丢失,请联系供应商以更换新硬盘.3. SMART-CH:_ ID:_ Predictable Failure Detected-Starting Clone发生原因:SMART发现该位置的磁盘出现故障,并且备用盘已经在尽行数据的重建.处理方法:请联系供应商以更换新硬盘.4. SMART-CH:_ ID:_ Predictable Failure Detected-Clone Failed发生原因:SMART提示此位置的磁盘已经失效,备用盘接替了该磁盘的数据,并自动关掉该磁盘的电力供应.处理方法:请联系供应商以更换新硬盘.5. CHL:_ ID:_ SCSI Drive ALERT: Block Successfully Reassigned –Block_number (Sense_key Sense_code)发生原因:磁盘坏块被重新成功分配.处理方法:按ESC以清掉该信息即可.6. CHL:_ ID:_ SCSI Drive NOTICE: Scan SCSI Drive Successful发生原因:介质扫描新磁盘成功处理方法:按ESC以清掉该信息即可.3.通道3.1 严重警告1.CHL:_ ALERT: Redundant Loop Connection Error Detected on ID:_发生原因:双环连接情况下,其中一个环路故障或断开处理方法:检查连线是否正常,通道有无故障2.CHL:_ Host Channel ALERT: Channel Failure发生原因:主机通道连接失效处理方法:请检查线路连接,光纤连接或是交换机连接,如果仍未解决问题,请联系供应商.3. CHL:_ Drive Channel ALERT: Channel Failure发生原因:磁盘通道失效.处理方法:请检查线路连接,光纤连接或是交换机连接,如果仍未解决问题,请联系供应商.4. CHL:_ ALERT: Fibre Channel Loop Failure Detected发生原因:光纤通道失效处理方法:请检查线路连接,光纤连接或是交换机连接,如果仍未解决问题,请联系供应商.5. CHL:_ ALERT: Redundant loop for Chl:_ Failure Detected发生原因:其中一个冗余的通道已失效处理方法:请检查线路连接,光纤连接或是交换机连接,如果仍未解决问题,请联系供应商.6. CHL:_ ALERT: Redundant Path for Chl:_ ID:_ Expected but Not Found 发生原因:预先设置的通道CHL:_冗余环路连接无效.处理方法:请检查线路连接,光纤连接或是交换机连接,如果仍未解决问题,请联系供应商.7. CHL:_ ID:_ ALERT: Redundant Path for Chl:_ ID:_ Failure Detected发生原因:通道CHL:_冗余环路连接失效处理方法:请检查线路连接,光纤连接或是交换机连接,如果仍未解决问题,请联系供应商.8. CHL:_ Host Channel ALERT: Bus Reset Issued发生原因:通道CHL:_总线重置处理方法:请联系供应商解决.9. CHL:_ Drive Channel ALERT: Data Overrun/Underrun Detected发生原因:CHL:_ ID:_此位置硬盘数据溢出错误处理方法:重新插入此硬盘或更换新硬盘测试,重新更新FW,如故障仍未解决请联系供应商出现频率:极低10. CHL:_ FA TAL ERROR (_)发生原因:通道发生严重错误处理方法:请联系供应商解决.11. CHL:_ RCC Channel ALERT: Data Overrun/Underrun Detected发生原因:RCC通道发生数据溢出错误处理方法:请联系供应商解决.12. CHL:_ Host Channel ALERT: Parity/CRC Error Detected发生原因:主机通道发生奇偶校验错误处理方法:请联系供应商解决.13. CHL:_ Drive Channel ALERT: Gross Phase/Signal Error Detected发生原因:此通道信号异常处理方法:请联系供应商解决出现频率:低14. CHL:_ Drive Channel ALERT: Timeout Waiting for I/O to Complete发生原因:由于线路问题或是磁盘故障造成磁盘I/O读写超时处理方法:请联系供应商解决.15. CHL:_ Drive Channel ALERT: Unexpected Disconnect Encountered发生原因:磁盘通道意外中断请联系供应商解决.16. CHL:_ Drive Channel ALERT: Unexpected Select Timeout发生原因:CH响应超时,与主机的连接线被移走会导致此问题发生处理方法:检查连接线是否可靠出现频率:低17. CHL:_ RCC Channel ALERT: Gross Phase/Signal Error Detected发生原因:RCC通道信号异常处理方法:重新更新FW会解决此问题,如故障仍未解决请与供应商联系出现频率:一般18. CHL:_ RCC Channel ALERT: Parity/CRC Error Detected发生原因:RCC通道奇偶校验错误.处理方法:重新更新FW会解决此问题,如故障仍未解决请与供应商联系出现频率:一般19. CHL:_ RCC Channel ALERT: Timeout Waiting for I/O to Complete发生原因:RCC通道I/O读写超时,这可能是连接链路的问题,也可能是盘阵背板的故障问题.处理方法:请联系供应商解决20. Message CHL:_ RCC Channel ALERT: Unexpected DisconnectEncountered发生原因:RCC通道意外中断处理方法:请联系供应商解决3.2 通知1. CHL:_ NOTICE: Fibre Channel Loop Connection Restored发生原因:光纤环路通道恢复正常处理方法:按ESC以清掉该信息即可.2. CHL:_ ID:_ NOTICE: Redundant Path for Chl:_ ID:_ Restored发生原因:通道CHL:_冗余环路连接恢复正常处理方法:按ESC以清掉该信息即可.3. CHL:_ SCSI Drive Channel Notification: SCSI Bus Reset Issued发生原因:SCSI磁盘通道CHL:_总线重置处理方法:按ESC以清掉该信息即可.4. CHL:_ Host Channel Notification: SCSI Bus Reset Issued发生原因:主机通道CHL:_总线重置处理方法:按ESC以清掉该信息即可.5. CHL:_ LIP(__) Detected发生原因:光纤环路LIP被重置.处理方法:按ESC以清掉该信息即可.4.逻辑盘4.1 严重警告1. LG: _ ALERT: CHL:_ ID:_ Media Scan Aborted发生原因:介质扫描失败,可能的原因是用户强迫终止或是严重的系统故障.处理方法:重新手动执行介质扫描,如未解决,请联系供应商解决.2. LG:_ Logical Drive ALERT: Logical Drive Block Marked _________发生原因:通过比较和校验,已经确定坏的数据块,此时连接到此坏的数据块的主机将接收到介质错误的信息.处理方法:磁盘阵列自动尝试执行数据的重建.以恢复坏块的数据. 3. LG:_ Logical Drive ALERT: Logical Drive Block Recovered ________发生原因:控制器通过比较和重新校验,已恢复逻辑盘坏块的数据.处理方法:按ESC以清掉该信息即可.4. LG:_ Logical Drive ALERT: Logical Drive Block Marked BAD发生原因:控制器通过比较和重新校验,但无法恢复逻辑盘坏块的数据.此时连接到该坏块的主机将收到介质错误的信息.处理方法:请联系供应商解决.5. LG: Logical Drive ALERT: CHL:_ ID:_ Drive Failure发生原因:对应位置的硬盘已失效处理方法:此故障是硬盘连接问题或硬盘本身故障引起的,请检查硬盘是否插紧,并对此硬盘重新扫描或更换硬盘, 如果盘阵已经设置有备用盘,控制器将自动执行数据的重建.出现频率:一般6. LG: Logical Drive ALERT: CHL:_ ID:_ Drive Missing发生原因:对应位置的硬盘丢失处理方法:此故障是硬盘连接问题或硬盘本身故障引起的,请检查硬盘是否插紧,并对此硬盘重新扫描或更换硬盘。
每种芯片组实行起来不一样。
我这里只有nv的,你参考一下。
一、什么是RAID?其具备哪些常用的工具模式?即然提到了RAID磁盘阵列,那么我们就先来了解一下什么是RAID?所谓的RAID,是Redundant Arrays of Independent Disks的简称,中文为廉价冗余磁盘阵列。
由1987年由加州大学伯克利分校提出的,初衷是为了将较廉价的多个小磁盘进行组合来替代价格昂贵的大容量磁盘,希望单个磁盘损坏后不会影响到其它磁盘的继续使用,使数据更加的安全。
RAID作为一种廉价的磁盘冗余阵列,能够提供一个独立的大型存储设备解决方案。
在提高硬盘容量的同时,还能够充分提高硬盘的速度,使数据更加安全,更加易于磁盘的管理。
了解RAID基本定义以后,我们再来看看RAID的几种常见工作模式。
1、RAID 0RAID 0是最早出现的RAID模式,即Data Stripping数据分条技术。
RAID 0是组建磁盘阵列中最简单的一种形式,只需要2块以上的硬盘即可,成本低,可以提高整个磁盘的性能和吞吐量。
RAID 0没有提供冗余或错误修复能力,是实现成本是最低的。
RAID 0最简单的实现方式就是把N块同样的硬盘用硬件的形式通过智能磁盘控制器或用操作系统中的磁盘驱动程序以软件的方式串联在一起创建一个大的卷集。
在使用中电脑数据依次写入到各块硬盘中,它的最大优点就是可以整倍的提高硬盘的容量。
如使用了三块80GB的硬盘组建成RAID 0模式,那么磁盘容量就会是240GB。
其速度方面,各单独一块硬盘的速度完全相同。
最大的缺点在于任何一块硬盘出现故障,整个系统将会受到破坏,可靠性仅为单独一块硬盘的1/N。
为了解决这一问题,便出一了RAID 0的另一种模式。
即在N块硬盘上选择合理的带区来创建带区集。
其原理就是将原先顺序写入的数据被分散到所有的四块硬盘中同时进行读写。
四块硬盘的并行操作使同一时间内磁盘读写的速度提升了4倍。
在创建带区集时,合理的选择带区的大小非常重要。
磁盘阵列的容错和数据恢复技术磁盘阵列是一种通过组合多个磁盘驱动器来提供更高容量、更高性能和更高可靠性的存储系统。
然而,由于各种原因,包括磁盘故障、软件错误或人为错误等,磁盘阵列中的数据可能会丢失或损坏。
为了保护数据的完整性和可靠性,研究和开发者提出了各种容错和数据恢复技术。
在磁盘阵列中,最常见的容错技术是冗余阵列独立磁盘(RAID)技术。
RAID技术通过将数据分布在多个磁盘上,并使用冗余数据来纠正错误和恢复丢失或损坏的数据。
常见的RAID级别包括RAID 0、RAID 1、RAID 5和RAID 6。
RAID 0是一种条带化技术,它将数据分散存储在多个磁盘上,以提高读写性能。
然而,RAID 0没有冗余机制,一旦其中一个磁盘故障,整个磁盘阵列的数据都会丢失。
RAID 1是一种镜像技术,它将数据复制到多个磁盘上。
每个磁盘都包含相同的数据,如果其中一个磁盘故障,数据仍然可以通过其他正常工作的磁盘进行恢复。
RAID 1提供了很好的数据冗余和高可靠性,但是需要更多的存储空间。
RAID 5是一种条带化和分布式奇偶校验技术。
数据被分散存储在多个磁盘上,并使用奇偶校验来计算冗余数据。
如果其中一个磁盘故障,数据可以通过其他磁盘上的奇偶校验进行恢复。
RAID 5提供了很好的读写性能和数据冗余,同时也节省了存储空间。
RAID 6是RAID 5的扩展版本,它使用两个奇偶校验来提供更高的数据冗余性。
RAID 6可以处理两个磁盘的故障,同时提供更高的保护水平。
除了RAID技术,还有其他容错技术用于磁盘阵列的数据恢复。
磁盘阵列通过数据重建和数据恢复技术来处理故障磁盘。
数据重建是指将数据从故障磁盘复制到新的磁盘上,以恢复丢失的数据。
数据恢复则是指通过使用冗余数据或其他备份进行数据恢复。
磁盘阵列的数据恢复技术通常需要在故障发生后尽快采取行动。
为了减少数据恢复的时间和影响,一些存储设备提供了热备援功能。
热备援是指在磁盘故障发生时,自动将备用磁盘接管故障磁盘的工作,从而保持磁盘阵列的正常运行。
服务器阵列-R A I D故障数据恢复技巧服务器阵列 RAID故障数据恢复技巧-.Ihd166 { display:none; }当RAID出现故障时,硬件厂商经常会初始化你的系统或重建(REBUILD)你的RAID,那么,会造成数据无法恢复的巨大损失,因此,当RAID出现故障时,一定要正确处理。
RAID的目的就是利用磁盘空间的冗余实现数据容错,不过这是在所有的磁盘或卷没有任何问题的前提下实现的。
当RAID卷中的单个磁盘出现故障后,尽管数据可能暂时不会受到威胁,但是磁盘冗余已经没有了。
此时任何不当的操作都可能毁掉已经存放的数据。
因此,在充分享受RAID所带来的安全好处时,还应该想到它危险的一面。
RAID磁盘阵列设备,在使用过程中,经常会遇到一些常见故障,这也使得RAID在给我们带来海量存储空间的应用之外,也带来了很多难以估计的数据风险。
本文将重点介绍RAID常见故障及相关处理方式。
RAID故障注意事项1、数据丢失后,用户千万不要对硬盘进行任何操作,将硬盘按顺序卸下来(贴好标记),用镜像软件将每块硬盘做成镜像文件,也可以交给专业数据恢复中心进行。
2、不要对Raid卡进行Rebuild操作,否则会加大恢复数据的难度。
3、标记好硬盘在Raid卡上面的顺序。
4、一旦出现问题,可以拨打专业公司(恩特尔数据恢复中心)的咨询电话找专业工程师进行咨询,切忌自己试图进行修复,除非你确信自己有足够的技术和经验来处理数据风险。
常见Raid 数据丢失故障情况服务器配置网1、软件故障:a.突然断电造成RAID磁盘阵列卡信息的丢失。
b.重新配置RAID阵列信息,导致的数据丢失。
c.磁盘顺序出错,导致系统不能识别数据。
d.误删除、误格式化、误分区、误克隆、文件解密、病毒损坏等情况,导致数据丢失。
2、硬件损坏:a.raid硬盘报红灯错误,硬盘检测报错情况。
b.raid硬盘出现坏道,导致数据丢失。
c.raid一般都会有几块硬盘,同样有故障允许损坏的硬盘数量(如RAID5允许损坏其中一块),当超出损坏的硬盘数量后,RAID数据将无法正常读取。
磁盘阵列的数据安全与数据修复分析(总8页)-CAL-FENGHAI.-(YICAI)-Company One1-CAL-本页仅作为文档封面,使用请直接删除磁盘阵列的数据安全与数据修复分析摘要:由于RAID5磁盘阵列具有很多优越的安全性能,因此得到了广泛的应用。
但在实际工作过中,RAID5阵列还是会产生故障。
本研究在分析RAID5磁盘阵列基础数据结构的基础上,具体分析了RAID5系统产生故障的原因,并就每个原因提出了有针对性的预防措施,最后作者介绍了磁盘阵列数据修复的实用方法。
关键词:磁盘阵列数据存储数据安全数据修复中图分类号:TP309 文献标识码:A 文章编号:1007-9416(2012)01-0186-02由于磁盘阵列具有容量大、数据存取速度快、安全性高等特点,磁盘阵列技术得到了广泛的运用。
尤其是采用RAID5技术的磁盘阵列,由于其采用了奇偶校验技术提供数据冗余信息,大幅提高了系统和数据的安全性,成为了人们首选的磁盘阵列技术。
虽然RAID5模式的安全级别较高,但在实际运用中磁盘阵列上的数据还是会发生的损坏和丢失的情况。
究其原因,这些隐患主要来自于RAID5系统运行和维护过程。
为了使广大系统维护人员能加深对RAID5磁盘阵列的安全隐患的认识,本文在分析了RAID5磁盘阵列的数据结构的基础上,提出了做好磁盘阵列数据安全管理的意见和建议。
1、RAID5磁盘阵列的数据结构RAID5的数据安全性较其他RAID系列的磁盘阵列要高很多,当阵列中的一块物理磁盘出现障时,允许在不停机的情况下对磁盘进行热插拔更换,保证应用系统的持续运行。
RAID5的高安全可靠性主要来自两个技术要点,即冗余数据应用和奇偶校验算法。
冗余数据的生成有多种算法,RAID5采用的是奇偶校验算法。
下面以4个磁盘组成的RAID5为例来说明利用奇偶校验算法生成冗余数据原理和过程,并介绍RAID5数据安全可靠性的原因。
如图1所示,假设在这个由四块磁盘做成的一个逻辑磁盘上12个连续存放的数据块,这些数据块以0,l,……,11命名。
群晖日志 50条群晖是一款功能强大的网络存储设备,它提供了许多实用的功能和服务,可以满足用户对数据管理和共享的需求。
在群晖的日志中,记录了用户的操作记录、系统事件和警告信息等。
下面是群晖日志中的50条记录,让我们一起来了解一下吧。
1. 用户登录成功,IP地址为192.168.1.100。
2. 上传文件成功,文件名为"example.docx"。
3. 用户创建了一个新的文件夹,命名为"工作资料"。
4. 文件"example.pptx"被删除。
5. 系统更新完成,版本号为DSM 7.0。
6. 硬盘1发生故障,正在进行修复。
7. 用户设置了新的管理员密码。
8. 设备温度过高,自动启动风扇进行降温。
9. 执行定时备份任务,备份文件到外部硬盘。
10. 用户下载了一个视频文件,文件大小为1GB。
11. 系统重启完成,正常运行。
12. 硬盘2已更换,正在进行初始化。
13. 用户修改了共享文件夹的权限设置。
14. 文件"example.xlsx"被移动到文件夹"备份文件"。
15. 系统检测到网络连接异常,正在尝试重新连接。
16. 用户添加了一个新的网络用户,用户名为"guest"。
17. 硬盘3已满,无法继续写入数据。
18. 系统安全更新已安装,增强了设备的安全性。
19. 用户设置了远程访问权限,可以通过互联网访问设备。
20. 文件"example.jpg"被重命名为"example_new.jpg"。
21. 硬盘1修复完成,数据已恢复。
22. 用户创建了一个新的共享文件夹,用于家庭影音共享。
23. 文件"example.mp3"被复制到外部硬盘。
24. 系统升级可用,正在下载最新版本。
25. 用户更改了设备的主题样式,选择了暗黑主题。
RAID卷的常见状态及解决方法
(1)良好
卷运转正常且没有检测到已知的错误,在基本卷和动态卷中都会显示这种状态。
(2)良好(未知分区)
卷不能被识别,这可能是由于使用了由其他操作系统创建的分区。
可以将其删除重新创建。
(3)良好(有风险)
卷是可用的,但系统已经检测到磁盘上存在I/O错误。
(4)未知
引导扇区被破坏,这可能是由于磁盘损坏或引导扇区病毒造成。
(5)重新同步
该状态应用于镜像卷。
重新同步会使两个镜像上的数据完全相同。
(6)格式化
卷正在被格式化,并显示格式化进度。
(7)正在重新生成
该状态应用于RAID-5卷,它在替换一个故障磁盘并且包括将丢失的信息写到该卷的一个新成员之后发生。
当重新生成过程正在进行时应避免对该卷的访问,重新生成过程完成时,这个卷将返回到良好状态。
(8)失败的重复
该状态应用于镜像卷和RAID-5卷。
它表明其中一个磁盘出现故障并且该卷不再容错。
尽管这个卷仍是可以访问的,但该卷中另一个磁盘的故障将造成数据的丢失。
只要一有可能就应该替换这个磁盘并重新同步或重新生成该卷。
(9)失败的重复(有危险)
该状态应用于镜像卷和RAID-5卷。
它表明这个卷不再容错且检测到磁盘存在I/O 错误。
建议更换出现故障的磁盘。
(10)失败
该状态应用于基本卷和动态卷。
它表明该卷不能启动且需要人工修复。
美孚磁盘阵列柜组错误分析报告报告提交人:现场工程师:提交日期:2016年9月11日一,故障描述2016年9月6号接到值班室工作人员的报告,发现我公司所施工的英飞拓磁盘阵列机柜发出故障红灯警报。
出现物理磁盘数据丢失,出现问题我公司十分的重视。
积极寻找解决故障的方法,努力设法解决所造成的损失。
主柜损坏的位置为第一行第三列、第二行第二列,扩展柜损坏的位置为第一行第一列、第一行第三列、第二行第二列。
磁盘阵列的配置为RAID5冗余磁盘阵列,储管理服务通过ISCSI 协议做nrv SAN存储。
二,解决过程2016.09.6 CCTV系统两台DVR工作指示灯经常连续跳跃,怀疑不正常工作,因此安全技术员立即和张工沟通,并联系维修服务商,要求立即到厂紧急查看服务商到厂。
对设备进行检查,发现三套磁盘阵列(A/B/C)中,有五块硬盘指示灯故障报警(磁盘阵列损坏硬盘五块,A损坏两块,BC三块硬盘损坏)。
对系统进行重启,系统重新恢复工作,原DVR连续跳跃指示灯恢复常亮状态。
磁盘故障指示灯亮:查看硬盘状态查到第五块硬盘时发现没有磁盘损坏但是出现了多次的报错。
所以判断磁盘有损坏的征兆,但是不是很明显1-15路摄像机只有0904 06:00左右以后录像,且18:00前呈断续录像状态,16-18路摄像机最早视频为07月07日,19-39路摄像机另一部分摄像机录像数据为04月15日系统调试完成后数据将第3块硬盘克隆到新硬盘整个克隆的过程需要6个小时。
克隆完毕将新的硬盘重新装回磁盘阵列柜中,重新启动磁盘阵列柜。
磁盘阵列柜是根据raid5的冗余校验信息的自动修正盘的错误信息的发现C磁盘阵列所对应的盘符下的所有存储录像存储时间均为0904号,且每一路CCTV每一分钟均有2- 6个不等的300M数据包被保存,而正常情况下,每一路CCTV每半小时至一小时才保存300M数据,然后检查磁盘磁盘阵列,发现磁盘阵列对应的存储路径一切正常。
判断与磁盘阵列无关然后检查硬盘录像机,端口有无异常ip是否存在冲突。
简介目录1.控制器事件 (2)1.1 严重警告 (2)1.2 一般警告 (3)1.3 通知 (3)2.磁盘 (4)2.1 严重警告 (4)2. 2 一般警告 (6)3.通道 (6)3.1 严重警告 (6)3.2 通知 (8)4.逻辑盘 (9)4.1 严重警告 (9)4.2 通知 (12)5.常见事件 (14)5.1 严重警告 (14)6.周边设备 (16)6.1 严重警告 (16)7.SES 设备 (17)7.1 严重警告 (17)8.常见外围设备 (19)8.1 严重警告 (19)1.控制器事件1.1 严重警告1 .Controller SDRAM ECC <multi-bits/single-bit> Error Detected发生原因:内存Single-bit/Multi-bits Errors处理方法:检查内存是否故障,重新更新FW,如仍有故障请联系供应商解决出现频率:一般2. Controller SDRAM Parity Error Detected发生原因:内存校验错误处理方法:更新FW,更换内存测试,如故障仍未解决,请联系供应商解决。
出现频率:低3. Controller ALERT: Power Supply Unstable or NVRAM Failed发生原因:电源电压输出过低,或者NVRAM内部错误.处理方法:请与供应商联系,如必要可更换新电源出现频率:低4. Controller ALERT: Redundant Controller Failure Detected发生原因:双控制器其中之一发生故障,另一控制器接管处理方法:检查双控制器在硬件、FW及其他设置上是否一致,如确认为硬件故障所致,请联系供应商解决。
出现频率:低5. CHL:_ FA TAL ERROR (_)发现原因:其中一个通道发生故障处理方法:请检查连接线路,双控的模式下,让另一控制器将接替故障控制器的工作,并联系供应商解决.6. Controller BBU Absent or Failed!发生原因:BBU(电池)被移走或故障处理方法:检查BBU是否安装正常出现频率:一般7. BBU Failure Detected发生原因:BBU发生故障处理方法:请联系供应商解决.8. Controller PCI Bus Parity Error Detected发生原因:可能由于控制器内部的温度过高造成部件发生故障处理方法:请联系供应商解决.9. Force Controller Write-Through on Triggered Cause发生原因:控制器切换写入方式为Write-Through处理方法:恢复原来的工作状态,如未解决,请联系供应商解决.1.2 一般警告10. Controller BBU Not Fully Charged!发生原因:BBU充电不足,并且不建议将cach的模式由write-throung改为write-back处理方法:如果电池不能满足长时间的电量负荷,请联系供应商更换电池.11. Controller BBU Thermal Shutdown/Enter Sleep-Mode!发生原因:BBU温度过高(>=45),或是充电完成超过7小时造成控制器BBU突然关闭或者休眠.处理方法:检查环境通风是否良好,电池是否安装正确,出现此日志一般不需要进行特别操作12. Memory Not Sufficient to Fully Support Current Config.发生原因:使用的内存与当前的型号或配置不符处理方法:检查内存是否正常,更换内存测试1.3 通知1. CONTROLLER notice: NVRAM Factory Defaults Restored发生原因:Firmware已经恢复到出厂设置处理方法:请按ESC清掉该信息即可.2. Controller Initialization Completed发生原因:控制器初始化完成.处理方法:系统正常启动.3. Controller NOTICE: Redundant Controller Firmware Updated发生原因:冗余控制器的Firmare已经更新处理方法:按ESC清掉该信息即可.4. Memory is Now Sufficient to Fully Support Current Config.发生原因:添加内存或更换新内存已完成处理方法:按ESC清掉该信息即可.5. NVRAM Restore from Disk is Completed发生原因:已从disk保存的配置恢复到当前运行的配置处理方法:按ESC清掉该信息即可.6. NVRAM Restore from File is Completed发生原因:已从先前保存的一个配置文件恢复到当前运行的配置处理方法:按ESC清掉该信息即可.7. NOTICE: Controller BBU Back On-Line!发生原因:之前报错故障的BBU恢复工作处理方法:按ESC清掉该信息即可.8. NOTICE: Controller BBU Fully Charged!发生原因:控制器BBU充电完成处理方法:按ESC清掉该信息即可.9. NOTICE: Controller BBU Present!发生原因:曾丢失BBU,现已恢复.处理方法:按ESC清掉该信息即可.10. NOTICE: Controller FAN On-Line(_RPM)发生原因:之前报错故障的控制器风扇恢复工作处理方法:按ESC清掉该信息即可.2.磁盘2.1 严重警告1. CHL:_ ID:_ SCSI Target ALERT: Unexpected Select Timeout发生原因:硬盘响应超时,硬盘或与主机的连接线被移走均会导致此问题发生处理方法:检查硬盘是否安装到位,连接线是否可靠2. CHL:_ ID:_ SCSI Target ALERT: Gross Phase/Signal Error Detected发生原因:此通道信号异常处理方法:请联系供应商解决3. CHL:_ ID:_ SCSI Target ALERT: Unexpected Disconnect Encountered发生原因:驱动器通道意外中断处理方法:请检查连接线路,如未解决,请联系供应商.4. CHL:_ ID:_ SCSI Drive ALERT: Negotiation Error Detected发生原因:磁盘通道异常处理方法:请联系供应商解决.5. CHL:_ ID:_ SCSI Target ALERT: Timeout Waiting for I/O to Complete发生原因:可能由于硬盘故障或是线路问题造成硬盘I/O读写超时处理方法:请检查连接线路和硬盘,如未解决,联系供应商解决.6. CHL:_ ID:_ SCSI Target ALERT: SCSI Parity/CRC Error Detected发生原因:磁盘通道发生校验错误处理方法:请检查磁盘连接线路和硬盘, 如未解决,联系供应商解决.7. CHL:_ ID:_ SCSI Target ALERT: Data Overrun/Underrun Detected发生原因:此位置硬盘数据溢出错误处理方法:重新插入此硬盘或更换新硬盘测试,重新更新FW,如故障仍未解决请联系供应商.出现频率:极低8. CHL:_ ID:_ SCSI Target ALERT: Invalid Status/Sense Data Received (Sense_key Sense_code)发生原因:磁盘不能接收到客户端的数据处理方法:请检查磁盘连接线路和硬盘.9. CHL:_ ID:_ SCSI Drive ALERT: Drive HW Error (Sense_key Sense_code) 发生原因:磁盘驱动器不能获得硬件的错误报表.处理方法:插拔故障磁盘,让热备盘进行数据的重建.10. CHL:_ ID:_ SCSI Drive ALERT: Bad Block Encountered - Block_number (Sense_key Sense_code)发生原因:磁盘不能获得介质的错误报表,控制器请求磁盘重试.处理方法:按ESC清掉该信息即可11. CHL:_ ID:_ SCSI Drive ALERT: CHL:_ ID:_ Clone Failed发生原因:磁盘初始化无响应处理方法:请检查磁盘连接线路和硬盘,如未解决,请联系供应商.12. Slot _ _ Drive ALERT: Bad Block Encountered - * * * * * * * * *发生原因:在一个RAID 1/3/5的阵列中,通过介质扫描或是在数据重建的过程中,可能出现发现坏块的事情,但如果显示是“Bad Block Encountered”,说明这不是当前的事情,已经由控制器将坏块所在的数据通过数据重建已经转移到了其他好的块道上了.处理方法:按ESC以清掉该错误信息即可.13. CHL:_ ID:_ SCSI Drive ALERT: Block Reassignment Failed - Block_number (Sense_key Sense_code)发生原因:磁盘块分配失败,磁盘可能被认为已经发生故障.处理方法:重新插拔故障硬盘,如未解决,请联系供应商更换新硬盘.14. CHL:_ ID:_ SCSI Drive ALERT: Aborted Command (Sense_key Sense_code)发生原因:SCSI磁盘失败命令报告处理方法:按ESC已清掉该错误信息.15. CHL:_ ID:_ ALERT: Media Scan Bad Block Unrecoverable-0x0发生原因:介质扫描不能修复该磁盘的坏块.处理方法:更换新硬盘.以防止数据的丢失.2.2 一般警告1. SMART-CH:_ ID:_ Predictable Failure Detected (TEST)发生原因:当开启模拟SMART的功能测试时提示该信息,说明该磁盘能支持此功能.处理方法:按ESC以清掉该信息即可.2. SMART-CH:_ ID:_ Predictable Failure Detected发生原因:SMART提示该磁盘可能会发生故障,这个信息的提示只会在开启了SMART功能之后才会出现.处理方法:为防止数据的丢失,请联系供应商以更换新硬盘.3. SMART-CH:_ ID:_ Predictable Failure Detected-Starting Clone发生原因:SMART发现该位置的磁盘出现故障,并且备用盘已经在尽行数据的重建.处理方法:请联系供应商以更换新硬盘.4. SMART-CH:_ ID:_ Predictable Failure Detected-Clone Failed发生原因:SMART提示此位置的磁盘已经失效,备用盘接替了该磁盘的数据,并自动关掉该磁盘的电力供应.处理方法:请联系供应商以更换新硬盘.5. CHL:_ ID:_ SCSI Drive ALERT: Block Successfully Reassigned –Block_number (Sense_key Sense_code)发生原因:磁盘坏块被重新成功分配.处理方法:按ESC以清掉该信息即可.6. CHL:_ ID:_ SCSI Drive NOTICE: Scan SCSI Drive Successful发生原因:介质扫描新磁盘成功处理方法:按ESC以清掉该信息即可.3.通道3.1 严重警告1.CHL:_ ALERT: Redundant Loop Connection Error Detected on ID:_发生原因:双环连接情况下,其中一个环路故障或断开处理方法:检查连线是否正常,通道有无故障2.CHL:_ Host Channel ALERT: Channel Failure发生原因:主机通道连接失效处理方法:请检查线路连接,光纤连接或是交换机连接,如果仍未解决问题,请联系供应商.3. CHL:_ Drive Channel ALERT: Channel Failure发生原因:磁盘通道失效.处理方法:请检查线路连接,光纤连接或是交换机连接,如果仍未解决问题,请联系供应商.4. CHL:_ ALERT: Fibre Channel Loop Failure Detected发生原因:光纤通道失效处理方法:请检查线路连接,光纤连接或是交换机连接,如果仍未解决问题,请联系供应商.5. CHL:_ ALERT: Redundant loop for Chl:_ Failure Detected发生原因:其中一个冗余的通道已失效处理方法:请检查线路连接,光纤连接或是交换机连接,如果仍未解决问题,请联系供应商.6. CHL:_ ALERT: Redundant Path for Chl:_ ID:_ Expected but Not Found 发生原因:预先设置的通道CHL:_冗余环路连接无效.处理方法:请检查线路连接,光纤连接或是交换机连接,如果仍未解决问题,请联系供应商.7. CHL:_ ID:_ ALERT: Redundant Path for Chl:_ ID:_ Failure Detected发生原因:通道CHL:_冗余环路连接失效处理方法:请检查线路连接,光纤连接或是交换机连接,如果仍未解决问题,请联系供应商.8. CHL:_ Host Channel ALERT: Bus Reset Issued发生原因:通道CHL:_总线重置处理方法:请联系供应商解决.9. CHL:_ Drive Channel ALERT: Data Overrun/Underrun Detected发生原因:CHL:_ ID:_此位置硬盘数据溢出错误处理方法:重新插入此硬盘或更换新硬盘测试,重新更新FW,如故障仍未解决请联系供应商出现频率:极低10. CHL:_ FA TAL ERROR (_)发生原因:通道发生严重错误处理方法:请联系供应商解决.11. CHL:_ RCC Channel ALERT: Data Overrun/Underrun Detected发生原因:RCC通道发生数据溢出错误处理方法:请联系供应商解决.12. CHL:_ Host Channel ALERT: Parity/CRC Error Detected发生原因:主机通道发生奇偶校验错误处理方法:请联系供应商解决.13. CHL:_ Drive Channel ALERT: Gross Phase/Signal Error Detected发生原因:此通道信号异常处理方法:请联系供应商解决出现频率:低14. CHL:_ Drive Channel ALERT: Timeout Waiting for I/O to Complete发生原因:由于线路问题或是磁盘故障造成磁盘I/O读写超时处理方法:请联系供应商解决.15. CHL:_ Drive Channel ALERT: Unexpected Disconnect Encountered发生原因:磁盘通道意外中断请联系供应商解决.16. CHL:_ Drive Channel ALERT: Unexpected Select Timeout发生原因:CH响应超时,与主机的连接线被移走会导致此问题发生处理方法:检查连接线是否可靠出现频率:低17. CHL:_ RCC Channel ALERT: Gross Phase/Signal Error Detected发生原因:RCC通道信号异常处理方法:重新更新FW会解决此问题,如故障仍未解决请与供应商联系出现频率:一般18. CHL:_ RCC Channel ALERT: Parity/CRC Error Detected发生原因:RCC通道奇偶校验错误.处理方法:重新更新FW会解决此问题,如故障仍未解决请与供应商联系出现频率:一般19. CHL:_ RCC Channel ALERT: Timeout Waiting for I/O to Complete发生原因:RCC通道I/O读写超时,这可能是连接链路的问题,也可能是盘阵背板的故障问题.处理方法:请联系供应商解决20. Message CHL:_ RCC Channel ALERT: Unexpected DisconnectEncountered发生原因:RCC通道意外中断处理方法:请联系供应商解决3.2 通知1. CHL:_ NOTICE: Fibre Channel Loop Connection Restored发生原因:光纤环路通道恢复正常处理方法:按ESC以清掉该信息即可.2. CHL:_ ID:_ NOTICE: Redundant Path for Chl:_ ID:_ Restored发生原因:通道CHL:_冗余环路连接恢复正常处理方法:按ESC以清掉该信息即可.3. CHL:_ SCSI Drive Channel Notification: SCSI Bus Reset Issued发生原因:SCSI磁盘通道CHL:_总线重置处理方法:按ESC以清掉该信息即可.4. CHL:_ Host Channel Notification: SCSI Bus Reset Issued发生原因:主机通道CHL:_总线重置处理方法:按ESC以清掉该信息即可.5. CHL:_ LIP(__) Detected发生原因:光纤环路LIP被重置.处理方法:按ESC以清掉该信息即可.4.逻辑盘4.1 严重警告1. LG: _ ALERT: CHL:_ ID:_ Media Scan Aborted发生原因:介质扫描失败,可能的原因是用户强迫终止或是严重的系统故障.处理方法:重新手动执行介质扫描,如未解决,请联系供应商解决.2. LG:_ Logical Drive ALERT: Logical Drive Block Marked _________发生原因:通过比较和校验,已经确定坏的数据块,此时连接到此坏的数据块的主机将接收到介质错误的信息.处理方法:磁盘阵列自动尝试执行数据的重建.以恢复坏块的数据. 3. LG:_ Logical Drive ALERT: Logical Drive Block Recovered ________发生原因:控制器通过比较和重新校验,已恢复逻辑盘坏块的数据.处理方法:按ESC以清掉该信息即可.4. LG:_ Logical Drive ALERT: Logical Drive Block Marked BAD发生原因:控制器通过比较和重新校验,但无法恢复逻辑盘坏块的数据.此时连接到该坏块的主机将收到介质错误的信息.处理方法:请联系供应商解决.5. LG: Logical Drive ALERT: CHL:_ ID:_ Drive Failure发生原因:对应位置的硬盘已失效处理方法:此故障是硬盘连接问题或硬盘本身故障引起的,请检查硬盘是否插紧,并对此硬盘重新扫描或更换硬盘, 如果盘阵已经设置有备用盘,控制器将自动执行数据的重建.出现频率:一般6. LG: Logical Drive ALERT: CHL:_ ID:_ Drive Missing发生原因:对应位置的硬盘丢失处理方法:此故障是硬盘连接问题或硬盘本身故障引起的,请检查硬盘是否插紧,并对此硬盘重新扫描或更换硬盘。