01-01 可靠性故障处理
- 格式:doc
- 大小:335.50 KB
- 文档页数:24
1可靠性概述随着网络的快速普及和应用的日益深入,各种增值业务(如IPTV、视频会议等)得到了广泛部署,网络中断可能影响大量业务、造成重大损失。
因此,作为业务承载主体的基础网络,其可靠性日益成为受关注的焦点。
在实际网络中,总避免不了各种非技术因素造成的网络故障和服务中断。
因此,提高系统容错能力、提高故障恢复速度、降低故障对业务的影响,是提高系统可靠性的有效途径。
1.1 可靠性需求1.2 可靠性度量1.3 可靠性技术1.4 高可靠IP网络组网原则1.1 可靠性需求可靠性需求根据其目标和实现方法的不同可分为三个级别,各级别的目标和实现方法如表1-1所示。
表1-1可靠性需求的级别第1级别需求的满足应在网络设备的设计和生产过程中予以考虑;第2级别需求的满足应在设计网络架构时予以考虑;第3级别需求则应在网络部署过程中,根据网络架构和业务特点采用相应的可靠性技术来予以满足,后续将重点介绍这些可靠性技术。
1.2 可靠性度量通常,我们使用平均故障间隔时间MTBF(Mean Time Between Failures)和平均修复时间MTTR(Mean Time to Repair)这两个技术指标来评价系统的可靠性。
MTBFMTBF是指一个系统无故障运行的平均时间,通常以小时为单位。
MTBF越多,可靠性也就越高。
MTTRMTTR是指一个系统从故障发生到恢复所需的平均时间,广义的MTTR还涉及备件管理、客户服务等,是设备维护的一项重要指标。
MTTR的计算公式为:MTTR=故障检测时间+硬件更换时间+系统初始化时间+链路恢复时间+路由覆盖时间+转发恢复时间。
MTTR值越小,可靠性就越高。
1.3 可靠性技术通过提高MTBF或降低MTTR都可以提高网络的可靠性。
在实际网络中,各种因素造成的故障难以避免,因此能够让网络从故障中快速恢复的技术就显得非常重要。
下面的可靠性技术主要从降低MTTR的角度,为满足第3级别的可靠性需求来提供技术手段。
VRP故障处理设备篇目录目录1 可靠性故障处理........................................................................................................................... 1-11.1 可靠性简介.................................................................................................................................................. 1-21.1.1 可靠性评价指标................................................................................................................................. 1-21.1.2 冗余技术 ............................................................................................................................................ 1-21.1.3 备份状态转换..................................................................................................................................... 1-31.2 可靠性的故障处理...................................................................................................................................... 1-41.2.1 典型组网环境..................................................................................................................................... 1-41.2.2 配置注意事项..................................................................................................................................... 1-61.2.3 故障诊断流程..................................................................................................................................... 1-81.2.4 故障处理步骤..................................................................................................................................... 1-81.3 故障处理案例............................................................................................................................................ 1-101.3.1 主备无法倒换................................................................................................................................... 1-101.4 FAQ ............................................................................................................................................................. 1-111.5 故障诊断工具............................................................................................................................................ 1-121.5.1 display命令....................................................................................................................................... 1-121.5.2 debugging命令.................................................................................................................................. 1-131.5.3 告警 .................................................................................................................................................. 1-131.5.4 日志 .................................................................................................................................................. 1-17VRP故障处理设备篇插图目录插图目录图1-1 备份状态转换 ........................................................................................................................................ 1-3图1-2 倒换前的关系示意图............................................................................................................................. 1-5图1-3 倒换后的关系示意图............................................................................................................................. 1-6图1-4 故障处理流程 ........................................................................................................................................ 1-8图1-5 组网图 .................................................................................................................................................. 1-10VRP故障处理设备篇表格目录表格目录表1-1 主用板和备用板的备份状态信息描述............................................................................................... 1-12VRP故障处理设备篇 1 可靠性故障处理1 可靠性故障处理关于本章本章描述内容如下表所示。
1 可靠性故障处理VRP 故障处理设备篇1.1 可靠性简介可靠性是衡量产品或系统可用度的重要指标。
可用度是指产品或系统对客户持续服务的能力,高可用HA(High Availability)是指一个产品或系统具有很高的可靠性。
1.1.1 可靠性评价指标通常使用MTTR和MTBF这两个指标评价产品或系统的可靠性。
●MTTR:平均修复时间MTTR(Mean Time to Repair)是指一个组件或设备从故障到恢复正常所需的平均时间。
广义的MTTR涉及备件管理、客户服务等,是设备维护的一项重要指标。
●MTBF:平均故障间隔时间MTBF(Mean Time Between Failures)是指一个组件或设备的无故障运行平均时间。
可用度的计算公式为:A=MTBF/(MTBF+MTTR)在电讯行业,99.999%的可用度意味着设备的MTTR每年不得超过5分钟。
1.1.2 冗余技术冗余技术是提高系统可靠性的一种有效方法。
冗余技术在高端路由器的应用在分布式处理模型下,路由器由主控板、业务处理板和网板组成。
●主控板负责路由器的控制平面和管理平面,例如路由学习、路由计算、建立LSP等工作。
●业务处理板负责具体业务处理,如MPLS交换,IP报文转发,QOS保证等工作。
●网板负责各主控板、业务处理板的连接和通信。
高端路由器关键部件都会采用冗余备份。
对于主控板的冗余备份,当主控板因为硬件或软件失效出现故障时,备用主控板接管失效主控板的工作,重新启动控制平面、管理平面、以及各业务处理板。
这个过程一般要持续几分钟,期间数据报文无法处理。
路由器周边的其他路由器通过动态路由协议感知到网络节点故障,重新计算路由。