当前位置:文档之家› EMC CX系列存储日常管理维护和故障排除手册.

EMC CX系列存储日常管理维护和故障排除手册.

EMC CX系列存储日常管理维护和故障排除手册.
EMC CX系列存储日常管理维护和故障排除手册.

一、Clariion CX系列产品硬件介绍

1.Clariion CX系列产品的基本构成

构成:由SPS,DPE/SPE和DAE三部分组成示例:CX4-960

(图1-0)

名词解释: SPS:Standby Power Supply,接DPE或者SPE+DAE OS,对Write Cache提供后备电源保护

SPE:Storage Processor Enclosure,包含两个全冗余的存储控制器 DPE:Disk Processor Enclosure,SPE和DAE OS在同一个Enclosure

DAE:Disk Array Enclosure,磁盘柜,包含15个硬盘槽位,磁盘ID从左至右为0-14 DAE_OS:包含控制器系统(OS)的DAE,占用DAE从左至右前五块硬盘

注:Clariion系列中采用DPE架构的有CX200/300/400/500,而CX600/700,3和4系列均为SPE 架构

2. CX600 / CX700 基本部件及状态灯介绍

2.1 CX600 / CX700 Storage Processor Enclosure (SPE)--前视图

(图1-1)

(1) 3个热插拔风扇模块

(2) 风扇模块错误灯(黄灯亮表示有错误,在前面板上看不见,需拆下前面板才能看见) (3) SPE 电源指示灯(绿灯) SPE 错误指示灯 (黄灯)

2.2 CX600 / CX700 Storage Processor Enclosure (SPE)--后视图

(图1-2)

(1) Storage Processors A

(2) Storage Processors B

(3) 2个热拔插电源模块 (active/active, 1+1)

2.3 CX600 / CX700 Storage Processor (SP)—细节图

(图1-2)

(1) 4 个前端(连主机)2Gb FC 端口(每个 Storage Processor )

(2) 4个后端(连扩展DAE)2Gb FC端口(每个 Storage Processor )

(3) 10/100 局域网管理端口

(4) SP Status LEDs--用于SP启动检测和检查SP的健康状态

(5) Port80h Card--在SP主板上,用与开机自检,

(6) SPS Monitoring Port--连接SPS的串口,用于SP与SPS之间的通讯和控制

(7) Serial/PPP Port--获取动态IP地址进行维护或也可通过HyperTerminal软件检测SP的启动3. CX200 / 300 / 400 / 500 基本部件及状态灯介绍

3.1 CX200 / 300 / 400 / 500 Disk Processor Enclosure (DPE)

(四款产品均为DPE架构,除 SP的前端和后端端口数量有差别外,基本一样,下图为CX500的DPE)

(图1-4)

(1) BE0 –后端总线端口0(HSSDC)--连接DPE和DAE

(2) BE1 –后端总线端口1(HSSDC)--连接DPE和DAE

(3) 两个前端 2Gb 端口(FC) 每个Storage Processor

(4) Enclosure 状态灯--绿色(电源灯),黄灯(错误灯或可用于检测启动过程)

(5) 10/100 以太网管理端口

(6) Serial Mgmt Port (RJ-45)--获取动态IP地址进行维护或也可通过HyperTerminal软件检测SP的启动

(7) SPS Monitoring Port--连接SPS的串口,用于SP与SPS之间的通讯和控制

4. CX3-10 / 3-20 / 3-40基本部件及状态灯介绍

4.1 CX3-10 / 3-20 / 3-40 Storage Processor Enclosure (SPE)--前视图

(图1-5)

(A) 四个热插拔电源模块,从左至右依次为PS_A0 A1 B0 B1

(B) 电源模块故障指示灯,故障时亮黄色

(C) 系统电源指示灯:绿色,常亮系统故障指示灯:黄色,系统故障时亮

4.2 CX3-10 / 3-20 / 3-40 Storage Processor Enclosure (SPE)—后视图

(图1-6)

4.3 CX3-10 / 3-20 / 3-40 Storage Processor (SP)—细节图(三款产品均为SPE架构,除 SP 前端和后端端口数量有差别外,基本一样,下图为CX3-40的SP)

(图1-7)

A:SPS监控端口

B:管理串口

C:电源指示灯:绿色,常亮

D:故障指示灯:黄色,故障时亮

E:服务管理网口

F:客户管理网口

G:后端扩展端口

H:前端光纤端口

5. CX3-80基本部件及状态灯介绍

5.1 CX3-80 Storage Processor Enclosure (SPE)—前视图

(图1-8)

A:电源模块,上有黄色故障指示灯,故障时亮

B:冷却风扇模块,上有黄色故障指示灯,故障时亮

C:系统故障指示灯:黄色,故障时亮

D:系统电源指示灯:绿色,常亮

5.2 CX3-80 Storage Processor Enclosure (SPE)—后视图

(图1-9)

A:电源模块

B:SAN Management Module

C:I/O 模块电源模块

5.3 CX3-80 Storage Processor (SP)—细节图

(图1-10)

A:SP控制器工作状态指示灯

B:I/O Module

5.4 CX3-80 I/O Module --细节图

(图1-11)

A:后端端口工作状态LED

B:后端端口

C:前端端口

D:前端端口工作状态LED

E:I/O模块电源与故障指示灯,黄色灯亮表示有故障

5.5 CX3-80 SAN Management Module --细节图

A:电源指示灯

B:故障指示灯

C:用户管理网络端口

D:服务管理网络端口,仅限于EMC服务人员使用

E:管理串口

F:SPS监控端口

(图1-12)

6. CX4-120 / 240 / 480 基本部件及状态灯介绍

6.1 CX4-120 / 240 / 480 Storage Processor Enclosure (SPE)—前视图

(图1-13)

A0:电源模块

A1:电源模块

B0:电源模块

B1:电源模块

C:CPU模块A

D:CPU模块B

E:CPU模块A电源和故障指示灯

F:CPU模块B电源和故障指示灯

G:存储系统电源和故障指示灯

6.2 CX4-120 / 240 / 480 Storage Processor Enclosure (SPE)—后视图

(图1-14)

A:Management Module(管理模块)

B:I/O Module(I/O模块)

C:Power / Fault LED(电源/故障指示灯)

6.3 CX4-120 / 240 / 480 Storage Processor (SP)—细节图

(图1-15)

A:Management Module(管理模块)

B:Back End Port on I/O Module(I/O模块上的后端端口,连接DAE)

C:FC Front End Port on I/O Module(I/O模块上的前端光纤端口,连接主机)

D:iSCSI Front End Port on I/O Module(I/O模块上的前端iSCSI端口,连接主机)6.4 CX4-120 / 240 / 480 Management Module—细节图

A:Service LAN Port(服务端口,仅限于EMC服务使用)

B:Management LAN Port(用户管理端口)

C:SPS Port(SPS监控端口)

D:Communications Port(管理端口)

E:NMI(系统维护用,勿触动)

(图1-16)

7. CX4-960基本部件及状态灯介绍

7.1 CX4-960 Storage Processor Enclosure (SPE)—前视图

(图1-17)

A1:Power Supply A(电源模块A)

A2:Power Supply B(电源模块B)

B1-B4:Blowers / Fans(风扇模块)

C:Enclosure Fault LED(系统故障指示灯)

D:Power LED(系统电源指示灯)

7.2 CX4-960 Storage Processor Enclosure (SPE)—后视图

(图1-18)

A:Power Supply B(电源模块B)

B:Power Supply A(电源模块A)

C:Management Module(管理模块)

D:Management Module(管理模块)

E:I/O Annex(I/O扩展模块)

7.3 CX4-960 Storage Processor (SP)—细节图

(图1-19)

A:Power LED(电源指示灯)

B:Fault LED(故障指示灯)

C:Unsafe to Remove LED D1-D4:I/O Module(I/O模块)

7.4 CX4-960 Management Module—细节图

A:Fault LED(故障指示灯)

B:Power LED(电源指示灯)

C:USB

D:Management LAN Port(以太网管理端口)

E:Service LAN Port(以太网服务端口,仅限于EMC服务人员)

F:NMI Button

G:Communications Port(服务端口)

H:SPS Port(SPS 监控端口)

(图1-20)

8. Disk Array Enclosure (DAE)基本部件及状态灯介绍

8.1 Disk Array Enclosure (DAE) --前视图

(图1-21)

(10) 硬盘状态灯--绿灯表示连接状态,绿灯闪烁表示磁盘活动状态,黄灯亮表示磁盘报错 (11) 盘柜状态灯--绿灯表示供电正常,黄灯亮表示盘柜有错误

(12) Slot0-4 ,共5块DAE-OS Vault Drives (仅限于DAE_OS),从左至右,Slot 0--Slot4 8.2 Disk Array Enclosure (DAE) --后视图

(图1-22)

Two Link Control Card (LCC)

(1) LCC 状态灯--绿色表示电源,黄色表示有错误

(2) Expansion 端口(HSSDC)--灯亮表示有信号

(3) 光纤环路ID指示灯( Loop ID LED)--0,1,2,3, 表示后端连接的光纤换路(Loop) ID (4) Primary 端口(HSSDC)--灯亮表示有信号 Two DAE电源模块

(5) 两个集成了风扇的电源模块

(6) 风扇错误灯(黄色)

(7) 电源状态灯(绿色--有电,黄色--有错)

(8) 交流电源输入开关,对DAE-OS,DPE或SPE关电,应使用此开关

(9) Enclosure 地址开关-如是DAE-OS的Enclosure,则其必须被设置为0

8.3 Disk Array Enclosure 2P/3P (DAE 2P/3P) --后视图

(图1-23)

A:电源模块,下面电源模块为PS A,上面为PS B

B:LCC模块,下为LCC A,上为LCC B

C:PRI端口,连接SP Back End端口或者上级DAE EXP端口

D:EXP端口,连接下级DAE PRI端口

E:Enclosure ID LED F:Loop ID LED

G:电源与故障指示灯

9. Standby Power Supply (SPS) 基本部件及状态灯介绍

9.1 1 KW I U SPS

(图1-24)

(1) 电源开关

(2) 交流电源输入

(3) SPE & 启动盘所在DAE的交流输出

(4) SPS 监测端口--连接SP的串口,用于SP与SPS之间的通讯和控制

(5) 状态灯 (从下至上)

内部监测灯—亮黄色表示SPS内部监测出错

更换SPS指示灯—亮黄色表示电池寿命已到或者自检出错

电池供电指示灯--当SPS给SP或DAE OS供电时亮黄色

电源灯--当SPS充满电后亮常绿,当SPS电池被充电时闪绿色

9.2 2.2KW 2U SPS

(图1-25)

A:交流输入

B:交流输出

C:电源开关

D:SPS监测端口--连接SP的串口,用于SP与SPS之间的通讯和控制

E:状态灯(从下至上)

内部监测灯—亮黄色表示SPS内部监测出错

更换SPS指示灯—亮黄色表示电池寿命已到或者自检出错

电池供电指示灯--当SPS给SP或DAE OS供电时亮黄色

电源灯--当SPS充满电后亮常绿,当SPS电池被充电时闪绿色

二、如何用 Navisphere看存储的状态

在 Navisphere 中,除正常状态以外,CX 磁盘阵列的四种常见状态

T:一个或者多个部件处于Transition状态,比如LUN正在Rebuilding,SPS正在充电 F:一个或者多个部件出现故障,注意,存储刚加电,由于SPS充电,也会出现F状态X:存储系统不可访问,比如网络连接断开等情况

?:当前Navishper版本不支持对该存储系统进行管理

举例如下:

Array in Transition

Array Faulted

Array Inaccessible

如在 Navisphere 发现有报错,检查 CX磁盘阵列错误的简单方法1、右击存储,选择fault,会显示具体报错信息

2、展开Physical项,可以定位具体故障部件

3、Clariion每个部件都有独立的故障指示灯,在Navishpere发现错误后,可以观察存储故障部件的错误指示灯进一步确认

三、客户发现 Clariion出现问题,应如何报修?

(注:如客户已装了 dial-out或者Call-home, 存储会让管理工作站自动拨号并报修,若无,需客户自己发现并报修)

1.获取 Clariion CX系列阵列的序列号有以下五种方法:

方法一:EMC 工程师在存储安装时会在存储贴上写有序列号的白色标签,标签上会注明客户EMC报修电话、Site ID 、存储序列号等信息,参见下图:

方法二:如安装工程师漏贴标签,注意必须查SPE或DPE上的标签

(DPE架构的从机柜后面查看上图所示位置)

(SPE架构的从机柜正面拆下SPE挡板,查看上图所示位置)

方法三:通过serialization tag查看(仅适用于Clariion 4系列产品) CX4-120/240/480请查看存储SPE后部的黑色标签,上面有产品的PN(型号),SN(序列号)

CX4-960 和CX4-120/240/480差不多,也是在SPE后部有一个黑色标签,只是位置不同

方法四:通过 Navisphere命令查看 CX存储的序列号:(红色字体)

C:\Program Files\EMC\Navisphere CLI>navicli -h 192.168.2.164 getagent

Name: K10 Desc:

Node: A-CK200072300124

Physical Node: K10

Signature: 1912950

Peer Signature: 1912955

SCSI Id: 0

SP Identifier: A

Revision: 3.26.40.5.016

Model: CX3-40c

Model Type: Rackmount

Prom Rev: 3.58.00

SP Memory: 4096

Serial No: CK200072300124

Cabinet: SPE3 C:\Program Files\EMC\Navisphere CLI>

方法五:通过 Navisphere图形界面查看 CX存储的序列号右击存储,选择Properties,在弹出窗口General选项卡中的Serial Number一项

2.拔打 EMC 全球响应中心 800电话报修

如用固定电话报修,请拔打 8008190009

如用手机报修,请拔打4006700009 请依照语音提示进行报修

注意:必须事先准备好序列号,报修时需提供存储序列号( CX系列的序列号格式基本都是 CK2000开头,后跟 8位数字),同时请提供具体的故障描述,如果部件故障,最好能提供故障部件的Part Number(PN),特别是硬盘的PN,以便于服务人员准确准备备件

四、EMC Clariion CX系列开关机注意事项及详细步骤

开机前注意事项:

1. 磁盘阵列在加电前,为确保磁盘柜散热和工作正常,请确认所有磁盘柜的每个槽位都已经

插上硬盘和挡风板

2. 开机前需确保――SPE或 DPE至少要有一个正常工作的 SP,每个 DAE都至少要一块正常工

作的 LCC

1. 检查所有供电线路联接是否正常,是否有松动或改动并改正

2. 从机柜顶部开始,由上至下打开所有 DAE磁盘机箱的电源。

3. 打开机柜最底部两个电池(SPS)(CX300可能只有一个)开关

4. 开机完成.

关机前注意事项:

1.警告: 请不要在关闭两个电池(SPS)的电源开关前,关闭 SPE,DPE,DAE等盘柜的任何一个电源,否则很可能会导致严重错误,并造成数据丢失! (CX300可能只有一个 SPS)

2. 即使关闭两个电池(SPS)的电源开关后,也需要等待 3分钟直到 CX存储写缓存中的数据完全写入硬盘,DAE OS磁盘柜指示灯熄灭后才可关闭 DAE,SPE或 DPE等盘柜的电源

3.停止所有对 CX磁盘阵列访问的应用,以便所有的 I/O能被从 SP的写缓存写回到前 5块盘上。4.如果有 UNIX服务器连接在 CX磁盘阵列上,必须 umount UNIX服务器所有与 CX磁盘阵列相关的文件系统,Windows主机请关闭。

磁盘阵列关机步骤:

1. 关闭机柜最底部的两个电池开关并等待约 3分钟直到 CX存储写缓存中的数据完全写入到硬盘

上后,可看到电池的信号灯完全熄灭,且应看到因电池停止供电, SPE或 DPE机箱及 DAE-OS磁盘机箱的电源灯熄灭。

2. 由下至上,关闭所有 DAE磁盘机箱的开关(机柜内部的PDU)

3. 关闭机柜后面两侧机柜总开关

4. 关机完成.

五、 Clariion 主动性售后支持及 call-home的介绍

1. EMC Powerlink 网站介绍

客户注册登陆后,可免费获取许多 EMC相关的各类技术支持文档,界面和网址如下:

2.CLARiiON Proactive Support Call-home介绍

CALL-Home包括三项主要功能

a) 错误检测功能(需工程师安装软件在监控 PC上)

b) 报错功能:存储出错时,软件会自动拨出 (Dial out)或自动发送电子邮件 (Email out)到

EMC的全球技术支持中心

c) 远程诊断功能:EMC的全球技术支持中心收到“Dial out”或“Email out”或客户报修电

话后,开始远程诊断

方法 1:通过客户提供的电话线路,远程拨入(Dial-in)

方法 2:通过客户提供给 PC管理工作站的 Internet access ,由客户上 WebEx网址申请,并允许全球技术支持中心远程通过 WebEx IP连接访问 PC管理工作站(可选)

3. 客户开通 CLARiiON Proactive Support Call-home所需要提供的条件

a) 由客户提供管理工作站 PC –必须是英文版 Windows NT 4.0 SP 6A或 Windows 2000 SP 2

以上版本,或Windows XP

b) 调制解调器 (ships with Clariion Systems)

c) 电话直线路 (不需打分机号码,由客户提供) – PBX extension或新设直通线路

d) 由 EMC工程师在管理工作站上安装 CLARAlert远程服务套件– Navisphere Manager

Event Monitor – Navisphere Host Agent / CLI – EMC远程主机及客户端

e) WebEx远程访问技术(可选,由客户提供 internet access给 PC管理工作站)

– Minimum Windows Requirements

– Windows 98 and higher

– Web Browser Support: Internet Explorer 5.x and 6, Mozilla 1.6, Netscape 4.7

4. CLARiiON Proactive Support 安全考虑事项

CLARalert软件套件安装在客户提供的工作站上。这样,CLARiiON Proactive Support 的安全级别不仅取决于 CLARalert的安全特性,而且也取决于您在应用程序、主机和网络级别实施的安全性

5.CLARalert 安全性

CLARalert具有强大的安全功能,并且在提供针对远程访问策略的选项方面也具有灵活性。您

可以随时查看与远程访问活动相关的信息以进行审计。远程访问安全选项是由经授权的 EMC 人员

代表客户设置的。这些选项包括:

a) 由客户指定的 EMCRemote 用户名和密码,这样它们就可以遵守您的与密码有关的策略

b) 拨入尝试通知,您可以对每次拨入请求进行批准/拒绝

c) 客户可以设定在 EMCRemote 发出身份验证失败消息之前可允许的重拨次数

d) 禁用 EMCRemote 远程访问功能的能力

e) 使用 EMCRemote 将所有登录和登录失败尝试记录到 CLARalert工作站上的一个文件中

f) 使用 Navisphere响应日志和消息文件以记录拨出尝试和错误代码文本

EMCRemote 是一种专用的客户端/服务器应用程序,服务器组件驻留在 CLARalert工作站上。

这样,只有获授权的人员可以访问该客户端/服务器应用程序。客户端/服务器通信使用一种专有的

按会话性质而设立的 40位算法加密。在拨入时,会在拨号器和客户端软件之间执行特定的“握手”

程序,此程序授权 EMC 客户服务人员连接到工作站上的 EMCRemote。

EMC 支持专家的系统和 CLARiiON Proactive Support 工作站之间的成功“握手”是建立任

何会话所必需的。“握手”过程中的协商是加密的,并且必须在协商成功后才能建立 PPP 会话。因此,利用疯狂拨号(war dial)技巧的潜在攻击者不可能仅凭发现并拨打电话号码而在工作站上建

立会话

6. 介绍 Dial Out 的过程

a) 存储系统生成一个事件,此事件记录到系统的 Host Agent 或 SP Agent 的 navimon.log

文件中

b) Navisphere Event Monitor 中心监视器 Host Agent (事件监视器引擎)每隔2分钟轮询

一次其配置文件中的每一个受监视的存储系统,并从每一个系统的 navimon.log文件中返回自上

次轮询以来出现的新事件。每个系统的 navimon.log文件中的所有新事件接着将写入到中心监视

器 Host Agent navimon.log 文件中。事件监视器逻辑根据 Dial Home筛选器模板文件配置决定

是否触发 Dial Home。事件监视器生成一个 XML 格式的事件消息文件并将其放置到一个运行时目

相关主题
文本预览
相关文档 最新文档