当前位置:文档之家› 网络可靠性实现

网络可靠性实现

高可用性技术(故障检测技术)在路由网络中的应用

国网电科院信息通信技术服务中心蓝鹏 VER1.0

引言:为了保证网络的不间断运行,特别是核心出口网络的高可用性,通常在部署较大规模网络时,会采取链路级备份、设备级备份等方式。技术上通常使用多管理引擎备份、浮动静态路由、VRRP、HSRP等。虽然这些技术给网络带来了一些备份作用,但是对于实时性要求较高的网络还会存在一些问题,本文结合在H3C路由器上的配置实例说明一些故障检测技术与传统技术的结合(联动)从而实现更为智能的高可用性解决方案。

关键字:可靠性故障检测技术NQA BFD TRACK 路由协议网络收敛

(一)、可靠性概述

随着网络的快速普及和应用的日益深入,网络中断可能影响大量业务,因此,作为业务承载主体的基础网络,其可靠性日益成为倍受关注的焦点。在实际网络中,总避免不了各种非技术因素造成的网络故障和服务中断。因此,提高系统容错能力、提高故障恢复速度、降低故障对业务的影响,是提高系统可靠性的有效途径。

1.可靠性需求

可靠性需求根据其目标和实现方法的不同可分为三个级别,各级别的目标和实现方法如表 1 所示。

级别目标实现方法

1减少系统的软、硬件故障硬件:简化电路设计、提高生产工艺、进行可靠性试验

软件:软件可靠性设计、软件可靠性测试等

2即使发生故障,系统功能也不

设备和链路的冗余设计、部署倒换策略、提高倒换成功率受影响

3尽管发生故障导致功能受损,

提供故障检测、诊断、隔离和恢复技术

但系统能够快速恢复

表 1

在上述三个级别的可靠性需求中,第1级别需求的满足应在网络设备的设计和生产过程中予以考虑;第2级别需求的满足应在设计网络架构时予以考虑;第3级别需求则应在网络部署过程中,根据网络架构和业务特点采用相应的可靠性技术来予以满足。

2.可靠性度量

通常我们使用 MTBF ( Mean Time Between Failures ,平均故障间隔时间)和 MTTR ( Mean Timeto Repair ,平均修复时间)这两个技术指标来评价系统的可靠性。

(1).MTBF

MTBF 是指一个系统无故障运行的平均时间,通常以小时为单位。 MTBF 越多,可靠性也就越高。

(2).MTTR

MTTR 是指一个系统从故障发生到恢复所需的平均时间,广义的 MTTR 还涉及备件管理、客

户服务等,是设备维护的一项重要指标。

MTTR 的计算公式为: MTTR= 故障检测时间 + 硬件更换时间 + 系统初始化时间 + 链路恢复时间 + 路由覆盖时间 + 转发恢复时间。公式中各项的值越小, MTTR 也就越少,可靠性也就越高。

3.可靠性技术

根据上边的描述可知,降低 MTTR 可以提高网络的可靠性。在实际网络中,各种因素造成的故障难以避免,因此能够让网络从故障中快速恢复的技术就显得非常重要。各种可靠性技术将主要从降低 MTTR 的角度,为满足第 3 级别的可靠性需求来提供技术手段。

可靠性技术的种类繁多,根据其解决网络故障的侧重不同,将其大致分为故障检测技术和保护倒换技术:

(1).故障检测技术

故障检测技术侧重于网络的故障检测和诊断,主要使用的技术如表二所示

名称简介

BFD Bidirectional Forwarding Detection (双向转发检测),是一

个通用的、标准化的、介质无关、协议无关的快速故障检测机制,用

于快速检测、监控网络中链路或 IP 路由的转发连通状况

NQA Network Quality Analyzer (网络质量分析),通过发送测试报

文,对网络性能、网络提供的服务及服务质量进行分析,并为用户提

供网络性能和服务质量的参数,如时延抖动、 TCP 连接时延、 FTP 连

接时延和文件传输速率等

Track 用于实现联动功能。联动功能由应用模块、 Track 模块和监测模块

三部分组成,它通过建立联动项来实现不同模块间的联动,即由监测

模块通过 Track 模块触发应用模块来执行某种操作。监测模块负责对

链路状态、网络性能等进行探测,并通过 Track 模块将探测结果通知

给应用模块;应用模块感知到网络状态变化后,及时进行相应处理,

从而避免通信的中断或服务质量的降低

表二

(2). 保护倒换技术

保护倒换技术侧重于网络的故障恢复,主要通过对硬件、链路、路由信息和业务信息等进行冗余备份以及故障时的快速切换,从而保证网络业务的连续性。主要保护倒换技术的如表三所示。

名称简介

接口备份同一台设备的各接口之间形成备份关系,通常由主接口承担业务传输,备份接口处于备份状态。当主接口本身或其所在线路发生故障而

导致业务传输无法正常进行时,可以启用备份接口进行通信

以太网链路聚合

简称链路聚合,它通过将多条以太网物理链路捆绑在一起成为一条逻辑链路,实现了增加链路带宽的目的,而这些捆绑在一起的链路通过相互间的动态备份,可以有效地提高链路的可靠性

MSTP Multiple Spanning Tree Protocol (多生成树协议),是一种二层

管理协议,它通过选择性地阻塞网络中的冗余链路来消除二层环路,

同时还具备链路备份的功能

GR Graceful Restart (平滑重启),是一种保证转发业务在设备进行

转发协议(如BGP 、 IS-IS 、 OSPF 、 LDP 和 RSVP-TE 等)重启

时不中断的技术。它需要周边设备的配合来完成路由等信息的备份与

恢复

VRRP Virtual Router Redundancy Protocol (虚拟路由器冗余协议),

是一种容错协议,在具有组播或广播能力的局域网(如以太网)中,

使设备出现故障时仍能提供缺省链路,有效地避免了单一链路发生故

障后出现网络中断的问题

从前面的介绍可知,可靠性技术的种类繁多,面对越来越复杂的网络环境,要想依靠单一的技术来解决所有的可靠性问题几乎无法实现。因此,需要在对网络环境和用户需求进行细致分析的基础上,综合运用各种可靠性技术来提高网络的可靠性。此外,在建网之初还应充分考虑组网的可靠性,譬如:根据业务现状或业务预测,边缘层的节点在接入时应采用冗余备份机制,分别与汇聚层的节点相连;核心层的各节点之间尽量采用全连接的方式,等等。

(二)、可靠性技术应用实例:

一、单设备多出口模型:

1.网络结构描述:

如图一所示,这种单设备,多出口网络通常在出口路由器上会配置一条以上的默认路由,分别指向不同的ISP下一跳,通过修改优先级的方式(浮动静态路由)实现在路由层面的线路备份,当作为主用线路的链路故障时,作为备用默认路由的路由会浮动成为主用路由

图一

2.存在问题:

路由的切换是与物理接口的状态直接相关的,通常运营商(ISP)提供的专线接入会增加协议转换器等设备与路由器接口相连,协议转换器至路由器的这部分线路故障概率很低,路由器接口始终处于UP状态,当上行链路(协议转换器上层传输网络)或更上一级的网络发生故障时路由并不能切换,数据包仍然会通过该接口转发,造成数据包转发黑洞。

3.解决方法:

在配置静态(默认)路由时,指定了一跳地址可以通过联动功能,利用监测模块(NQA)监视静态路由下一跳的可达性,并根据 Track 项的状态来判断静态路由的可达性。

Track主要由以下三种状态:

(1).Track项状态为Positive时,静态路由的下一跳可达,配置的静态路由将生效;

(2).T rack项状态为Negative时,静态路由的下一跳不可达,配置的静态路由无效;

(3).Track项状态为Invalid时,无法判断静态路由的下一跳是否可达,此时配置的静态路由生效

4.配置实例

(1).创建侦测组和track项,并于静态(默认路由关联)

[RT1]

nqa entry admin test //创建管理员名为admin、操作标签为test的NQA测试组

type icmp-echo //配置测试类型为ICMP-echo,即定期ping测试指定的ip

destination ip 10.0.12.2 // #配置测试的目的地址为10.0.12.2(ISP1的对端互联地址)

frequency 1000 // 配置测试频率为1000ms。

// 配置联动项1(连续失败5次触发联动)

nqa schedule admin test start-time now lifetime forever //启动探测。

track 1 nqa entry admin test reaction 1 //配置Track项1,关联上面创建的NQA测试组(管理员为admin,操作标签为test)的联动项1

#

ip route-static 0.0.0.0 0.0.0.0 10.0.12.2 track 1//添加静态路由并与Track1关联

ip route-static 0.0.0.0 0.0.0.0 10.0.13.3 preference 100 //指向ISP2对端地址的默认路由,优先级为100

(2).查看当前路由器的默认路由

[RT1]display ip routing-table 0.0.0.0 //查看默认路由,有两条度量值相同,优先级不同的默认路由Routing Table : Public

Summary Count : 2

Destination/Mask Proto Pre Cost NextHop Interface

0.0.0.0/0 Static600 10.0.12.2 S0/2/2

Destination/Mask Proto Pre Cost NextHop Interface

0.0.0.0/0 Static 100 0 10.0.13.3 S0/2/1

[RT1]display ip routing-table 0.0.0.0 0 verbose //优先级为60,下一跳地址为10.0.12.2的默认路由处于激活状态,优先级为100 下一跳地址为10.0.13.3的默认路由处于未激活(备份状态)。Routing Table : Public

Summary Count : 2

Destination: 0.0.0.0/0

Protocol: Static Process ID: 0

Preference: 60 Cost: 0

NextHop: 10.0.12.2 Interface: Serial0/2/2

RelyNextHop: 0.0.0.0 Neighbor : 0.0.0.0

Tunnel ID: 0x0 Label: NULL

State: Active Adv GotQ Age: 00h00m03s

Tag: 0

Destination: 0.0.0.0/0

Protocol: Static Process ID: 0

Preference: 100Cost: 0

NextHop: 10.0.13.3 Interface: Serial0/2/1

RelyNextHop: 0.0.0.0 Neighbor : 0.0.0.0

Tunnel ID: 0x0 Label: NULL

Tag: 0

(3).查看NQA测试情况

display nqa result //查看NQA测试结果

NQA entry(admin admin, tag test) test results:

Destination IP address: 10.0.12.2

Send operation times: 1 Receive response times: 1

Min/Max/Average round trip time: 1/1/1

Square-Sum of round trip time: 1

Last succeeded probe time: 2012-05-03 15:38:14.6 //最后测试成功的时间记录display nqa history //查看NQA的实时测试信息。

NQA entry(admin admin, tag test) history record(s):

Index Response Status Time

4070 1 Succeeded 2012-05-03 15:38:49.7

4069 1 Succeeded 2012-05-03 15:38:48.7

4068 1 Succeeded 2012-05-03 15:38:47.7

4067 1 Succeeded 2012-05-03 15:38:46.7

4066 1 Succeeded 2012-05-03 15:38:45.7

4065 1 Succeeded 2012-05-03 15:38:44.7

(4).路由跟踪测试

tracert -q 20 133.1.0.1 //在本端连接的三层交换机上traceroute,公网地址为133.1.0.1的主机,数据包下一跳通过ISP1路由器(10.0.12.2)转发。

traceroute to 133.1.0.1(133.1.0.1) 30 hops max,40 bytes packet, press CTRL_C to break

1 10.0.16.1 14 ms 10 ms 10 ms 20 ms 10 ms 10 ms 20 ms 10 ms 10 ms 20 ms 30 ms 10 ms 10 ms 30 ms 10 ms 20 ms 20 ms 20 ms 20 ms 10 ms

2 10.0.12.2 20 ms 20 ms 20 ms 20 ms 10 ms 30 ms 10 ms 10 ms 20 ms 30 ms 10 ms 10 ms 30 ms 10 ms 20 ms 20 ms 20 ms 20 ms 20 ms 10 ms

3 10.0.24.

4 20 ms 10 ms 30 ms 10 ms 30 ms 10 ms 10 ms 20 ms 20 ms 20 ms 10 ms 30 ms 10 ms 20 ms 20 ms 20 ms 20 ms 20 ms 10 ms 20 ms

4 133.1.0.1 50 ms 50 ms 50 ms 20 ms 60 ms 40 ms 40 ms 40 ms 50 ms 60 ms 50 ms 60 ms 60 ms 50 ms 50 ms 50 ms 50 ms 40 ms 40 ms 60 ms

(5).通过在ISP1路由器侧,通过一个ACL模拟在接口、线路处于正常状态下,上层数据无法正常转发的故障。

[ISP1-router]display acl all

Basic ACL 2000, named -none-, 2 rules,

ACL's step is 5

rule 10 deny source 10.0.12.1 0 (55 times matched) //拒绝源地址为10.0.12.1(对端设备RT1 IP)rule 20 permit

interface Serial0/2/0

link-protocol ppp

firewall packet-filter 2000 inbound //将ACL应用到与对端设备相连的接口上

ip address 10.0.12.2 255.255.255.0

firewall enable //开启防火墙功能

#

(6).在RT1路由器上查看NQA测试情况

display nqa history //当达到上面配置联动项1连续失败5次触发联动)

NQA entry(admin admin, tag test) history record(s):

Index Response Status Time

4092 3000 Timeout 2012-05-03 15:39:30.0

4091 3000 Timeout 2012-05-03 15:39:25.9

4090 3000 Timeout 2012-05-03 15:39:21.9

4089 3000 Timeout 2012-05-03 15:39:17.8

4088 3000 Timeout 2012-05-03 15:39:13.8

display nqa result

NQA entry(admin admin, tag test) test results:

Destination IP address: 10.0.12.2

Send operation times: 1 Receive response times: 0

Min/Max/Average round trip time: 0/0/0

Square-Sum of round trip time: 0

Last succeeded probe time: 0-00-00 00:00:00.0 //NQA测试没有成功的记录。

(6).在RT1路由器上查看NQA失败后的默认路由

display ip routing-table 0.0.0.0 verbose //这时路由器的默认路由已经变为下一跳为10.0.13.2(ISP2)的一条路由了

Routing Table : Public

Summary Count : 1

Destination: 0.0.0.0/0

Protocol: Static Process ID: 0

Preference: 100 Cost: 0

NextHop: 10.0.13.3 Interface: Serial0/2/1

RelyNextHop: 0.0.0.0 Neighbor : 0.0.0.0

Tunnel ID: 0x0 Label: NULL

State: Active Adv GotQ Age: 00h05m59s

Tag: 0

数据包下一跳通过ISP2路由器(10.0.13.3)转发。

traceroute to 133.1.0.1(133.1.0.1) 30 hops max,40 bytes packet, press CTRL_C to break

1 10.0.16.1 14 ms 10 ms 20 ms 20 ms 20 ms 10 ms 20 ms 20 ms 20 ms 20 ms 20 ms 20 ms 20 ms 10 ms 20 ms 20 ms 20 ms 10 ms 30 ms 10 ms

2 10.0.13.

3 10 ms 20 ms 30 ms 10 ms 10 ms 30 ms 10 ms 20 ms 20 ms 20 ms 20 ms 20 ms 10 ms 20 ms 20 ms 20 ms 10 ms 30 ms 10 ms 10 ms

3 10.0.34.

4 20 ms 30 ms 10 ms 10 ms 30 ms 10 ms 20 ms 20 ms 20 ms 20 ms 20 ms 10 ms 20 ms 20 ms 20 ms 10 ms 30 ms 10 ms 10 ms 20 ms

4 133.1.0.1 50 ms 60 ms 60 ms 30 ms 30 ms 50 ms 60 ms 40 ms 40 ms 40 ms 50 ms 50 ms 40 ms 40 ms 40 ms 50 ms 60 ms 60 ms 50 ms 50 ms

(7).ISP路由器故障恢复

[ISP1-router]undo firewall enable //在ISP1路由器上关闭防火墙功能

路由又切换回了ISP侧,下一跳为10.0.12.2。

display nqa history

NQA entry(admin admin, tag test) history record(s):

Index Response Status Time

386 1 Succeeded 2012-05-07 14:34:13.2

385 20 Succeeded 2012-05-07 14:34:12.2

384 20 Succeeded 2012-05-07 14:34:11.2

display ip routing-table verbose

Routing Table : Public

Destinations : 10 Routes : 11

Destination: 0.0.0.0/0

Protocol: Static Process ID: 0

Preference: 60 Cost: 0

NextHop: 10.0.12.2 Interface: Serial0/2/2

RelyNextHop: 0.0.0.0 Neighbor : 0.0.0.0

Tunnel ID: 0x0 Label: NULL

State: Active Adv GotQ Age: 00h00m09s

Tag: 0

Destination: 0.0.0.0/0

Protocol: Static Process ID: 0

Preference: 100 Cost: 0

NextHop: 10.0.13.3Interface: Serial0/2/1

RelyNextHop: 0.0.0.0 Neighbor : 0.0.0.0

Tunnel ID: 0x0 Label: NULL

State: Inactive Adv GotQ Age: 00h23m12s

5.经验总结及注意事项:

(1).当建立NQA测试项时,指定的PING测试地址可以为非直连地址,但必须保证路由可达,这就为测试带来了更多的灵活性,可以检测到更上游的网络情况。如果测试的地址为非直连IP地址,可以在配置NQA项的时候,指定下一跳地址.

nqa entry admin test //创建管理员名为admin、操作标签为test的NQA测试组

type icmp-echo //配置测试类型为ICMP-echo,即定期ping测试指定的ip

destination ip 10.0.24.4 // 配置测试的目的地址为ISP1路由器更上游地址

next-hop10.0.12.2 // 指定到达测试地址的下一跳地址

(2).由于本例中NQA测试,发送的是ICMP-ECHO报文,在使用NQA前需要保证设备没有阻挡ICMP报文

(3).测试的频率、超时触发次数、发送数据包的大小,可以根据需要调整。

二、多设备多出口模型:

1.网络结构描述:

如图二所示的网络结构,这种多设备,多出口网络通常在出口路由器通常会在路由器间运行VRRP、HSRP等路由冗余协议,终端将虚拟网关Ip为作为自己的默认网关,当网络中的主用设备故障或线路故障时,由备用设备接管转发数据。同时作为主用设备的路由器通常会配置track上行链路,链路出现故障的时候会降低优先级,从而切换到备用设备上。

图二

2.存在问题:。

与上面的问题类似,接口跟踪只能检测到物理接口的故障,协议转换器的问题依然存在。上行链路故障并不能被感知到,依然会通过主用设备转发数据。造成转发黑洞。

3.解决方法:

通过在Track模块和VRRP协议之间建立联动,利用监测模块(NQA)监视路由下一跳的可达性,根据测试结果切换VRRP的主备用。同时可以利用VRRP备份组配置,在提供备份的同时提供一些负载均衡。

4.配置示例

(1). 分别在R1和R2路由器中建立两个VRRP组,一部分客户端将10.0.16.254(R1路由器为VRRP master)作为默认网关,一部分客户端将10.0.16.253(R2路由器作为VRRP Master),实现路由的动态备份,以及负载均衡,

R1路由器的VRRP 配置

[RT1-Vlan-interface100]display this

#

interface Vlan-interface100

ip address 10.0.16.1 255.255.255.0

vrrp vrid 10 virtual-ip 10.0.16.254 //VRRP组10 虚拟Ip为10.0.16.254

vrrp vrid 10 track 1 reduced 30 //VRRP组10 与track 1 关联,当track 1 触发时优先级降低30

vrrp vrid 20 virtual-ip 10.0.16.253 //VRRP组20 虚拟Ip为10.0.16.253

R2路由器的VRRP 配置

[RT2-Vlan-interface100]display this

#

interface Vlan-interface100

ip address 10.0.16.2 255.255.255.0

vrrp vrid 10 virtual-ip 10.0.16.254 //VRRP组10 虚拟Ip为10.0.16.254

vrrp vrid 20 virtual-ip 10.0.16.253 //VRRP组10 虚拟Ip为10.0.16.253

vrrp vrid 20 priority 120 //VRRP组20优先级为120(默认为100 )

vrrp vrid 20 track 1 reduced 30 //VRRP组20 与track 1 关联,当track 1 触发时优先级降低30

#

(2).路由器RT1及RT2的NQA配置,与实例一相同

[RT1]display current-configuration | begin nqa

nqa entry admin test

type icmp-echo

destination ip 10.0.13.3

frequency 100

reaction 1 checked-element probe-fail threshold-type consecutive 5 action-type trigger-only

nqa schedule admin test start-time now lifetime forever

track 1 nqa entry admin test reaction 1

[RT2]display current-configuration | begin nqa

nqa entry admin test

type icmp-echo

destination ip 10.0.24.4

frequency 100

reaction 1 checked-element probe-fail threshold-type consecutive 5 action-type trigger-only

#

nqa schedule admin test start-time now lifetime forever

track 1 nqa entry admin test reaction 1

(4).路由器RT1及RT2的VRRP状态

IPv4 Standby Information:

Run Method : VIRTUAL-MAC

Virtual IP Ping : Enable

Total number of virtual routers: 2

Interface VRID State Run Adver. Auth Virtual

Pri Time Type IP ---------------------------------------------------------------------

Vlan100 10 Master 120 1 NONE 10.0.16.254

Vlan100 20 Backup 100 1 NONE 10.0.16.253

[RT2]display vrrp

IPv4 Standby Information:

Run Method : VIRTUAL-MAC

Virtual IP Ping : Enable

Total number of virtual routers: 2

Interface VRID State Run Adver. Auth Virtual

Pri Time Type IP ---------------------------------------------------------------------

Vlan100 10 Backup 100 1 NONE 10.0.16.254

Vlan100 20 Master 120 1 NONE 10.0.16.253

(5).在R3路由器侧,通过一个ACL模拟在接口、线路处于正常状态下,上层数据无法正常转发故障

[RT3]display acl all

Basic ACL 2000, named -none-, 3 rules,

ACL's step is 5

rule 10 deny source 10.0.13.1 0 (2 times matched)

rule 20 permit

[RT3-Serial0/2/0]display this

#

interface Serial0/2/0

link-protocol ppp

firewall packet-filter 2000 inbound //将ACL应用到与R1连接的接口上

ip address 10.0.13.3 255.255.255.0

#

[RT3]firewall enable //开启防火墙

(6).在RT1路由器上查看NQA测试情况

[RT1]display nqa history

NQA entry(admin admin, tag test) history record(s):

2241 3000 Timeout 2012-05-07 15:48:31.6

2240 3000 Timeout 2012-05-07 15:48:28.4

2239 3000 Timeout 2012-05-07 15:48:25.3

2238 3000 Timeout 2012-05-07 15:48:22.2

May 7 15:48:35:203 2012 RT1 VRRP/4/MasterChange:

IPv4 Vlan-interface100 | Virtual Router 10 : MASTER --> BACKUP reason: Received VRRP packet //当5个NQA测试失败后,RT1由备份组10 Master设备切换为BACKUP设备。

[RT1]display vrrp

IPv4 Standby Information:

Run Method : VIRTUAL-MAC

Virtual IP Ping : Enable

Total number of virtual routers: 2

Interface VRID State Run Adver. Auth Virtual

Pri Time Type IP ---------------------------------------------------------------------

Vlan100 10 Backup 90 1 NONE 10.0.16.254

Vlan100 20 Backup 100 1 NONE 10.0.16.253

[RT2] %May 7 15:48:35:547 2012 RT2 VRRP/4/MasterChange:

IPv4 Vlan-interface100 | Virtual Router 10 : BACKUP --> MASTER reason: Timer fired

//同时RT2由备份组10BACKUP设备切换为MASTER设备。

[RT2]display vrrp

IPv4 Standby Information:

Run Method : VIRTUAL-MAC

Virtual IP Ping : Enable

Total number of virtual routers: 2

Interface VRID State Run Adver. Auth Virtual

Pri Time Type IP ---------------------------------------------------------------------

Vlan100 10 Master 100 1 NONE 10.0.16.254

Vlan100 20 Master 120 1 NONE 10.0.16.253

(7).在R4路由器侧,通过一个ACL模拟在接口、线路处于正常状态下,上层数据无法正常转发故障

[RT4]display acl all

Basic ACL 2000, named -none-, 3 rules,

ACL's step is 5

rule 10 deny source 10.0.24.2 0 (2 times matched)

rule 20 permit

[RT4-Serial0/2/0]display this

#

link-protocol ppp

firewall packet-filter 2000 inbound

ip address 10.0.24.4 255.255.255.0

#

[RT4]firewall enable

(8).RT2路由器NQA测试失败后,由RT1路由器成为备份组20的Master负责转发数据

display nqa history

NQA entry(admin admin, tag test) history record(s):

Index Response Status Time

9736 3000 Timeout 2012-05-07 15:58:19.3

9735 3000 Timeout 2012-05-07 15:58:16.2

9734 3000 Timeout 2012-05-07 15:58:13.0

9733 3000 Timeout 2012-05-07 15:58:09.9

%May 7 15:58:22:922 2012 RT2 VRRP/4/MasterChange:

IPv4 Vlan-interface100 | Virtual Router 20 : MASTER --> BACKUP reason: Received VRRP packet

display vrrp

IPv4 Standby Information:

Run Method : VIRTUAL-MAC

Virtual IP Ping : Enable

Total number of virtual routers: 2

Interface VRID State Run Adver. Auth Virtual

Pri Time Type IP Vlan100 10 Backup 100 1 NONE 10.0.16.254

Vlan100 20 Backup 90 1 NONE 10.0.16.253

[RT1]display vrrp

IPv4 Standby Information:

Run Method : VIRTUAL-MAC

Virtual IP Ping : Enable

Total number of virtual routers: 2

Interface VRID State Run Adver. Auth Virtual

Pri Time Type IP Vlan100 10 Master 120 1 NONE 10.0.16.254

Vlan100 20 Master 100 1 NONE 10.0.16.253

5.经验总结及注意事项:(与示例一中类似)

(1).当建立NQA测试项时,指定的PING测试地址可以为非直连地址,但必须保证路由可达,这就为测试带来了更多的灵活性,可以检测到更上游的网络情况。如果测试的地址为非直连IP地址,

nqa entry admin test //创建管理员名为admin、操作标签为test的NQA测试组

type icmp-echo //配置测试类型为ICMP-echo,即定期ping测试指定的ip

destination ip 10.0.24.4 // 配置测试的目的地址为ISP1路由器更上游地址

next-hop10.0.12.2 // 指定到达测试地址的下一跳地址

(2).由于本例中NQA测试,发送的是ICMP-ECHO报文,在使用NQA前需要保证设备没有阻挡ICMP报文

(3).测试的频率、超时触发次数、发送数据包的大小,可以根据需要调整。

(4).备份组的配置不是必须的,可根据实际情况调整

三、分支网络通过MPLS VPN骨干全互联模型

1.网络结构描述:

如图三所示,分支网络通过三层MPLS VPN骨干相连,实现站点各VPN之间的互通,以及各VPN之间的隔离。骨干网使用私有AS号码,AS64512,使用BGP作为路由协议分发、维护VPNV4路由,各路由器通过OSPF协议作为内部IGP使各BGP路由器能通过loopback 0接口互联。为了减少IBGP的全互联数量及易于网络扩展(新加入PE路由器只需要和P1和P2路由器建立IBGP邻居即可)。将P1和P2路由器配置BGP 路由反射器,用来在个BGP反射器客户端间发射VPNV4路由。

图三

2.存在问题

BGP、OSPF路由协议,LDP标签分发协议,通过在邻居间发送和接收hello(keepalive)包,检测

邻居的存货情况,实现网络收敛。当邻居出现故障时,需要等待计时器超时后才能更新邻居信息,重新计算路由,使网络收敛,在收敛前数据无法正常转发。

3.解决方法

利用BFD机制为OSPF,BGP、MPLS 、LDP 提供快速切换能力。

4.配置示例

4.1.BFD与OSPF结合

(1).R1路由器OSPF相关配置及信息

[R1]display current-configuration | begin ospf 10 //R1路由器的OSPF配置所有接口处于区域0中ospf 10 router-id 1.1.1.1

area 0.0.0.0

network 1.1.1.1 0.0.0.0

network 10.8.12.1 0.0.0.0

network 10.8.13.1 0.0.0.0

#

display current-configuration int se0/2/0

#

interface Serial0/2/0

link-protocol ppp

ip address 10.8.12.1 255.255.255.252

ospf cost 10 //修改接口的ospf cost 为10

mpls

mpls ldp

#

return

display current-configuration int se0/2/1

#

interface Serial0/2/1

link-protocol ppp

ip address 10.8.13.1 255.255.255.252

ospf cost 20 //修改接口的ospf cost 为20

mpls

mpls ldp

#

[R1]display ospf peer //查看R1路由器的OSPF邻居信息

OSPF Process 10 with Router ID 1.1.1.1

Neighbor Brief Information

Router ID Address Pri Dead-Time Interface State

2.2.2.2 10.8.12.2 1 37 S0/2/0 Full/ - //R2路由器

3.3.3.3 10.8.13.2 1 38 S0/2/1 Full/ - //R3路由器

display ip routing-table 4.4.4.4 //到达对端R4 loopback接口地址路由下一跳为R2(因为上面的配置中修改了R1 se0/2/0 cost 为10 se/2/1为20 ,度量值较小的优先)

Routing Table : Public

Summary Count : 1

Destination/Mask Proto Pre Cost NextHop Interface

4.4.4.4/32 OSPF 10 1572 10.8.12.2 S0/2/0

(2).在R2路由器上,建立ACL模拟与R1相连接的网络出现故障。

[R2]display acl all

Basic ACL 2000, named -none-, 2 rules,

ACL's step is 5

rule 10 deny source 10.8.12.1 0 (29 times matched)//R1串口互联地址

rule 20 permit (277 times matched)

[R2-Serial0/2/0]display this

#

interface Serial0/2/0

link-protocol ppp

firewall packet-filter 2000 inbound //将ACL作用到与R1互联接口上

ip address 10.8.12.2 255.255.255.252

firewall enable //开启防火墙

(3).监控R1上的OSPF信息

debugging ospf event //开启OSPF事件调试开关

display ospf peer

OSPF Process 10 with Router ID 1.1.1.1

Neighbor Brief Information

Area: 0.0.0.0

Router ID Address Pri Dead-Time Interface State

2.2.2.2 10.8.12.2 1 32 S0/2/0 Full/ - //与R2的邻居关系状态并未发生变化,依然为Full稳定状态

3.3.3.3 10.8.13.2 1 31 S0/2/1 Full/ -

display ip routing-table 4.4.4.4 //到达R4 loopback0 接口地址路由没有发生变化

Routing Table : Public

Summary Count : 1

Destination/Mask Proto Pre Cost NextHop Interface

4.4.4.4/32 OSPF 10 1572 10.8.12.2 S0/2/0

%May 8 10:55:51:203 2012 R1 RM/3/RMLOG:OSPF-NBRCHANGE: Process 10, Neighbor

10.8.12.2(Serial0/2/0) from Full to Init

OSPF 10: Nbr 10.8.12.2 Rcv 1-Way State Full -> Init. //经过ospf Dead time 计时器超时40秒后,拆除邻居关系

display ip routing-table 4.4.4.4 //路由重新计算,网络收敛选择了备份R3线路

Routing Table : Public

Summary Count : 1

Destination/Mask Proto Pre Cost NextHop Interface

4.4.4.4/32 OSPF 10 1582 10.8.13.2 S0/2/1 //下一跳为R3互联地址

(5).在R1及R2路由器互联接口上开启bdf ospf 协议检测功能

[R1-Serial0/2/0]display this

#

interface Serial0/2/0

link-protocol ppp

ip address 10.8.12.1 255.255.255.252

ospf cost 10

ospf bfd enable //打开该接口的ospf bfd 检测

mpls

mpls ldp

#

[R2-Serial0/2/0]display this

#

interface Serial0/2/0

link-protocol ppp

firewall packet-filter 2000 inbound

ip address 10.8.12.2 255.255.255.252

ospf bfd enable //打开该接口的ospf bfd 检测

mpls

mpls ldp

#

(6).开启BFD检测后的故障模拟测试

[R2]firewall enable //在R2路由器上开启防火墙

[R1-Serial0/2/0]

%May 8 10:59:51:813 2012 R1 BFD/4/LOG:Sess[10.8.12.1/10.8.12.2,S0/2/0,Ctrl], Sta: UP->DOWN, Diag: 3

%May 8 10:59:51:813 2012 R1 RM/3/RMLOG:OSPF-NBRCHANGE: Process 10, Neighbor

10.8.12.2(Serial0/2/0) from Full to Down

*May 8 10:59:51:813 2012 R1 RM/6/RMDEBUG:OSPF-BFD: Message Type rcv BFD down, Connect Type direct-connect, Src IP Address 10.8.12.1, Src IFIndex 3, Dst IP Address 10.8.12.2.

*May 8 10:59:51:813 2012 R1 RM/6/RMDEBUG:OSPF-BFD: Message Type delete session, Connect Type direct-connect, Src IP Address 10.8.12.1, Src IFIndex 3, Dst IP Address 10.8.12.2.

OSPF 10: Nbr 10.8.12.2 Rcv LLDown State Full -> Down.

OSPF 10: Nbr 10.8.12.2 Rcv HelloReceived State Down -> Init. //在R1路由器上立刻受到BFD检测到故障,将OSPF邻居重置的消息

[R1-Serial0/2/0]display ip routing-table 4.4.4.4 //路由快速收敛至R3路由器到达目的地址

Routing Table : Public

Summary Count : 1

Destination/Mask Proto Pre Cost NextHop Interface

4.4.4.4/32 OSPF 10 1582 10.8.13.2 S0/2/1

4.2.BFD与BGP结合

(1).R1路由器BGP相关配置及信息

[R1]display current-configuration | begin bgp //与R2及R3路由器以loopback0接口地址为源地址建立邻居(VPNV4类型)

bgp 64512

router-id 1.1.1.1

undo synchronization

peer 2.2.2.2 as-number 64512

peer 3.3.3.3 as-number 64512

peer 2.2.2.2 advertise-ext-community //通告BGP扩展团体属性

peer 2.2.2.2 connect-interface LoopBack0

peer 3.3.3.3 advertise-ext-community

peer 3.3.3.3 connect-interface LoopBack0

#

ipv4-family vpnv4

peer 2.2.2.2 enable

peer 2.2.2.2 next-hop-local

peer 2.2.2.2 advertise-community

peer 3.3.3.3 enable

peer 3.3.3.3 next-hop-local

peer 3.3.3.3 advertise-community

#

import-route direct

#

ipv4-family vpn-instance office

import-route direct

display bgp vpnv4 all peer //查看R1路由器的VPNV4邻居表

BGP local router ID : 1.1.1.1

Local AS number : 64512

Total number of peers : 2 Peers in established state : 2

Peer V AS MsgRcvd MsgSent OutQ PrefRcv Up/Down State

2.2.2.2 4 64512 283 295 0 2 03:38:57 Established //R2

3.3.3.3 4 64512 285 286 0 2 03:45:18Established //R3

display ip routing-table vpn-instance oa 20.1.1.0 //查看oa vpn 20.1.1.0前缀路由

Routing Table : oa

Summary Count : 1

Destination/Mask Proto Pre Cost NextHop Interface

20.1.1.0/24 BGP 255 0 4.4.4.4 NULL0

display ip routing-table vpn-instance office 20.1.1.0 //查看office vpn 20.1.1.0前缀路由Routing Table : office

Summary Count : 1

Destination/Mask Proto Pre Cost NextHop Interface

20.1.1.0/24 BGP 255 0 4.4.4.4 NULL0

(2).R2路由器BGP相关配置及信息

[R2]display current-configuration | begin bgp 64512 //R2使用loopback0接口地址作为源地址与R1、R3、R4建立BGP邻居,R1和R4 作为R2的路由发射器客户端,由R2负责在R1和R4间发射VPNV4路由

bgp 64512

router-id 2.2.2.2

reflector cluster-id 10.10.10.10

网络系统可靠性研究现状与展望资料

网络系统可靠性研究 现状与展望 姓名:杨玉 学校:潍坊学院 院系:数学与信息科学学院 学号:10051140234 指导老师:蔡建生 专业:数学与应用数学 班级:2010级二班

一、摘要 伴随着人类社会的网络化进程,人类赖以生存的网络系统规模越来越庞大、结构越来越复杂,这导致网络系统可靠性问题越来越严峻。本文首先探讨了网络系统可靠性的发展历程、概念与特点,进而从度量参数、建模、分析、优化四个方面系统综述了网络系统可靠性的研究现状,最后对网络系统可靠性研究未来的发展进行了展望。 二、关键词:可靠性;网络系统;综述;现状;展望 三、引言 21 世纪以来,以信息技术的飞速发展为基础,人类社会加快了网络化进程。交通网络、通信网络、电力网络、物流网络……可以说,“我们被网络包围着”,几乎所有的复杂系统都可以抽象成网络模型,这些网络往往有着大量的节点,节点之间有着复杂的连接关系。自从小世界效应[1]和无标度特性[2]发现以来,复杂网络的研究在过去10 年得到了迅速发展,其研究者来自图论、统计物理、计算机、管理学、社会学以及生物学等各个不同领域,仅发表在《Nature》和《Science》上的相关论文就达百篇。对复杂网络系统结构、功能、动力学行为的深入探索、科学理解以及可能的应用,已成为多个学科领域共同关注的前沿热点[3-14]。 随着复杂网络研究的兴起,作为复杂网络最重要的研究问题之一,网络系统可靠性研究的重大理论意义和应用价值也日益凸显出来[15, 16]。人们开始关注:这些复杂的网络系统到底有多可靠?2003 年8 月美加大停电事故导致美国的8 个州和加拿大的2 个省发生大规模停电,约5000 万居民受到影响,损失负荷量61800MW,经济损失约300 亿美元;2005 年12 月台湾海峡地震造成多条国际海底通信光缆发生中断,导致整个亚太地区的互联网服务几近瘫痪,中国大陆至台湾地区、美国、欧洲等方向国际港澳台通信线路受此影响亦大量中断;2008 年1 月,南方冰雪灾害导致我国十余个省市交通瘫痪、电力中断、供水停止、燃料告急、食物紧张……这些我们赖以生存的网络系统规模越来越庞大,结构越来越复杂,但越来越频繁发生的事故也将一系列严峻的问题摆在我们面前:一些微不足道的事故隐患是否会导致整个网络系统的崩溃?在发生严重自然灾

基于人机工程学的矿井通风系统可靠性分析详细版

文件编号:GD/FS-4869 (解决方案范本系列) 基于人机工程学的矿井通风系统可靠性分析详细版 A Specific Measure To Solve A Certain Problem, The Process Includes Determining The Problem Object And Influence Scope, Analyzing The Problem, Cost Planning, And Finally Implementing. 编辑:_________________ 单位:_________________ 日期:_________________

基于人机工程学的矿井通风系统可 靠性分析详细版 提示语:本解决方案文件适合使用于对某一问题,或行业提出的一个解决问题的具体措施,过程包含确定问题对象和影响范围,分析问题,提出解决问题的办法和建议,成本规划和可行性分析,最后执行。,文档所展示内容即为所得,可在下载完成后直接进行编辑。 摘要:矿井通风系统是矿井生产系统的重要辅助系统,其可靠性高低对矿井生产和安全管理有着直接的影响。将人机工程学用于矿井通风系统的可靠性的研究,就是用人机系统的观点来研究矿井通风中人、机、环境3个子系统各自的特点及相关性,并给出了矿井通风“人—机—环境”系统可靠性的定义和数学模型。 关键词:人机工程学;通风系统;可靠性 矿井通风系统由通风动力及其装置、通风井巷网络、风流检测、控制系统组成。在生产时期其任务是利用各种动力,以最经济的方式,向井下各用风地点

提供足够的新鲜空气,保证工作人员的呼吸,稀释并排除瓦斯等各种有害物质,降低热害,给井下工人创造良好的工作环境;发生事故时,有效地控制风流方向和大小,与其他措施相结合,防止灾害的扩大,进而达到消灭事故的目的。人们将其实现上述任务的能力程度称为矿井通风的可靠性。 以前的研究为了简化工程求解的难度,系统的可靠性研究只考虑硬件部分的可靠性,而人和环境被认为完全可靠,即可靠度为1。对“人—机—环境”系统可靠性研究,可以弥补在工程领域可靠性研究只分析硬件可靠性而设定人员为完全可靠的不足,使可靠性的研究更加完善。事实上,系统的故障既可能是由硬件引起的,也可能是由操作人员的操作失误或者是由于环境条件所引起。因此,在分析系统的可靠性时,应该对人—机—环境三要素进行综合考虑。

计算机网络可靠性优化技术研究

计算机网络可靠性优化技术研究 陈 聪 (广西梧州学院,广西梧州543000) 摘要:随着计算机网络用户不断增加,其可靠性问题对于计算机的用户信息至关重要。本文介绍了当前计算机网络的可 靠性概念与设计的原则,并在此基础上提出优化计算机网络可靠性的优化技术,提高了计算机用户的信息安全性。关键词:计算机网络;可靠性;优化技术;经济发展中图分类号:TP393.02文献标识码:A 文章编号:1673-1131(2013)01-0085-02 1计算机网络的可靠性概念 计算机的可靠性指的是网络在操作方式或者在负载条件、维修方式以及温度、辐射、湿度等条件下、并在一定时间内,其的网络仍然保持连通并且达到通信要求的一种能力。计算机网络可靠性是指计算机网络的拓扑结构、并且能够确保计算机的网络能够正常运行的能力,同时也是计算机网络的规划与设计以及运行的重要参数部分[1]。 2计算机网络可靠性设计的原则 进行计算机网络的优化设计与实践过程中,计算机研究人员积累了较多的设计原则与经验,并且对于提高计算机网络的可靠性问题具有较好的指导与规范作用。计算机网络的可靠性设计原则主要涉及以下几个方面内容。 2.1遵循国际的标准 计算机网络的可靠性优化设计应积极使用较为开放的网络体系,确保网络体系或者结构具有升级与扩展的能力。此外系统设计时,需确保其的实用性、先进性以及通用性结构等问题得到解决。 2.2互联能力强 计算机的可靠性设计对系统的互联能力提出较高要求,需要确保系统可支持不同的通信协议,保障网络的可靠性与安全性。同时还要求网络系统的服务器或者产品,具备较强 的容错与冗余能力,更好地满足使用者的需求,进而确保信息数据的安全与网络系统的良好运行。 2.3可管理性强 进行计算机的可靠性设计时,优先考虑技术与科技含量好的网络设备或者管理软件,确保提高网络设计的先进性;此外,对于计算机的网络链路介质而言,要求主干网需要具备充足的带宽,并且具备较高的性价比,有助于提高计算机网络的反应速度。 2.4合理配置资源 计算机可靠性优化设计应该确保网络投资的安全,并且能够充分、合理地对网络资源进行配置,做好网络布线、硬件设施以及操作系统的软件等方面的调配与配置工作。 3计算机网络的可靠性优化设计模型分析 3.1模型概率图 在计算机网络的可靠性优化设计当中,对于较多复杂的系统而言,可将其转化为计算机的网络模型进行分析,再将系统的网络模型转化成图,进而分析其的可靠性,有利于求解。例如,计算机的网络系统模型所使用的概率图,用G (V ,E )来表示,系统中的结点集合V 表示的是服务器、用户终端或者主机;而边集合E 是指计算机的网络链路。图还包含分析问题 2.7网站的运行与维护 课程网站设计制作完成后,就进入运行阶段。这个阶段一个必不可少的工作就是对网站进行必要的维护。网站维护服务基本内容如下: 监测网站的运行情况; 保证网站脚本程序正常运行; 监测并保证您的主机处于正常运行状态; 备份网站内容及数据; 监测域名的解析运行状况;提供网站内容的维护服务,包括:网页文字内容的更新、修改;网页图片内容的处理、更新;网站Flash 动画中文字内容的更新、修改;网页链接指向的更新、修改;网站其他内容的修改; 提供网站改进和完善的意见和建议,提升网站的运行效果;制作新的页面及模块,同时确保网站总体风格的完整和统一。 3结语 本文将软件工程思想引入到课程网站的开发设计过程中,较之传统的开发方法,整个系统结构化更强,逻辑性更加严密; 图文结合,形象、直观,可视化更强;同时还配有完整、规范的软件文档,便于系统的维护与更新。系统提供的个性化学习支持功能,可以大大提高学生的学习效率,真正实现个性化教育。本文论述的个性化网上教学系统设计与实现方法适用于绝大部分课程,并在《中国美术简史》、《网络实用软件》、《国家赔偿法》和《WTO 专题》等多门课程的网上教学系统开发过程中得到了应用,效果显著。参考文献:[1] 郑人杰,殷人昆,陶永雷.实用软件工程[M ].北京:清华大学 出版社,2008,4 [2]陈明.软件工程学教程[M ].科学出版社,2009,7 [3]前沿电脑图像工作室.巧学巧用DreamweaverMX/Fir-eworksMX/FlashMX 制作网页[M ].人民邮电出版社,2009,1 作者简介:刘德学(1965-),男,重庆涪陵人,硕士,副教授,研究 方向为计算机辅助教学。 2013年第1期(总第123期) 2013 (Sum.No123) 信息通信 INFORMATION &COMMUNICATIONS

网络性能和可靠性优化方案及对策

网络性能和可靠性优化设计方案 当前整个社会已进入全面信息化时代,人们对网络的依赖性已越来越强,几乎成为工作、商业和生活中不可缺少的必需工具,但随之伴随而来也产生一些不容忽视的问题,网络系统可靠性就是其中一个主要的问题,网络的快速应用,一旦网络中断必将影响大量业务,甚至可能造成极其重大的社会影响和极大经济损失,因此,作为业务承载主体的基础网络,其可靠性日益成为倍受关注的焦点。在实际网络中,总会避免不了出现网络故障和服务中断的情况,因此,提高系统容错能力、提高故障恢复速度、降低故障对业务的影响,是提高系统可靠性的有效途径。本文将主要研究网络可靠性影响因素及提升网络可靠性的方法,并对网络可靠性方案做出了归纳总结。 网络系统可靠性设计的核心思想则是,通过合理的组网结构设计和可靠性特性应用,保证网络系统具备有效备份、自动检测和快速恢复机制,同时关注不同类型网络的适应成本。为了保证网络的不间断运行,特别是核心出口网络的高可用性,通常在部署较大规模网络时,会采取链路级备份、设备级备份等方式。技术上通常使用多管理引擎备份、浮动静态路由、VRRP、HSRP、GLBP等。虽然这些技术给网络备份起到了一定的作用,但是对于实时性要求较高的网络还会存在一些问题,所以对网络系统进行科学优化设计是网络可靠运行的重要

基础。网络建设目标就是使网络系统能够满足用户应对网络各个方面的正常需求,以避免网络建成后可能出现的各种问题,网络的可靠性和冗余设计在网络建设中必须重点加以考虑。不同的网络,其可靠性的设计目标是不同的,网络解决方案的可靠性需要根据实际需求进行设计,高可靠性的网络不但涉及到网络架构、设备选型、协议选择、业务规划等技术层面的问题,还受用户现有网络状况、网络投资预算、用户管理水平等影响,因此在规划可靠性网络时需要因地制宜,综合考虑各方面的影响因素。 网络可靠性影响因素 网络可靠性是指设备在规定的条件(操作方式、维修方式、负载条件、温度、湿度、辐射等)下,在规定的时间(1000小时、一个季度等),网络保持连通和完成通信要求的能力。它反映了网络拓扑结构支持网络正常运行的能力,是计算机网络规划、设计与运行的重要参数之一。从现实层面讲,当前影响网络可靠性的外因素较多,且形式多样,容不确定性逐渐增加,诸如电子元件老化,传输介质及设备接口故障,软硬件配置因素失当、网络设计层次不恰当、用户非常规操作等等,这些因素的集聚均相应导致网络可靠性的下降。 网络设备及用户终端的影响。要保证网络可靠稳定运行,硬件设备的质量在其中起着很重要的作用,硬件的质量越好,网络运行的连续性和可靠性就会越高。尤其是网络核心和骨干层,其重要性不言而喻,

网络可靠性设计

网络可靠性设计

目录 1.1 网络可靠性设计 (2) 1.1.1 网络解决方案可靠性的设计原则 (3) 1.1.2 网络可靠性的设计方法实例 (4) 1.1.3 网络可靠性设计总结 (9)

1.1网络可靠性设计 可靠性是指:设备在规定的条件下、在规定的时间内完成规定的功能的能力。对于网络系统的可靠性,除了耐久性外,还有容错性和可维护性方面的内容。 1)耐久性。是指设备运行的无故障性或寿命,专业名称叫MTBF(Mean Time Between Failure),即平均无故障时间,它是描述整个系统可靠性的重要指标。对于一个网络系统来说,MTBF是指整个网络的各组件(链路、节点)不间断无故障连续运行的平均时间。 2)容错性。专业名称叫MTTR(Mean Time to Repair),即系统平均恢复时间,是描述整个系统容错能力的指标。对于一个网络系统来说,MTTR是指当网络中的组件出现故障时,网络从故障状态恢复到正常状态所需的平均时间。 3)可维护性。在系统发生故障后,能够很快地定位问题并通过维护排除故障,这属于事后维护;根据系统告警提前发现问题(如CPU使用率过高,端口流量异常等),通过更换设备或调整网络结构来规避可能出现的故障,这属于预防维护。可维护性需要管理人员来实施,体现了管理的水平,也反映了系统可靠性的高低。

表示系统可靠性的公式为: MTBF / ( MTBF + MTTR ) * 100%。 从公式或以看出,提高MTBF或降低MTTR都可以提高网络可靠性。造成网络不可用的因素包括:设备软硬件故障、设备间链路故障、用户误操作、网络拥塞等。针对这些因素采取措施,使网络尽量不出故障,提高网络MTBF指标,从而提升整网的可靠性水平。 然而,网络中的故障总是不可避免的,所以设计和部署从故障中快速恢复的技术、缩小MTTR指标,同样是提升网络可靠性水平的手段。 在网络架构的设计中,充分保证整网运行的可靠性是基本原则之一。网络系统可靠性设计的核心思想则是,通过合理的组网结构设计和可靠性特性应用,保证网络系统具备有效备份、自动检测和快速恢复机制,同时关注不同类型网络的适应成本。 构建可靠的网络,需要从耐久性、容错性以及可维护性三个方面进行网络规划设计。而网络的规划设计是个系统工程,不同的设计方案的可靠性性效果不尽相同,这就需要以科学的方法进行设计,构建符合需要的可靠性网络。 1.1.1网络解决方案可靠性的设计原则 不同的网络,其可靠性的设计目标是不同的。网络解决方案的可靠性需要根据实际需求进行设计。高可靠性的网络不但涉及到网络架构、设备选型、协议选择、业务规划等技术层面的问题,还受用户现有网络状况、网络投资预算、用户管理水平等影响,因此在规划可靠性网络时需要因地制宜,综合考虑各方面的影响因素。

计算机网络可靠性优化设计方法

计算机网络可靠性优化设计方法 摘要:计算机网络使人们的生产生活方式发生了翻天覆地的变化,并进一步带 动了其他科学技术的进步与发展。长期以来,由于人们对计算机网络安全的不重视,致使计算机网络成为不法分子获得不当利益的工具,计算机网络安全形势变 得愈发严峻,人们的隐私甚至国家安全面临极大的威胁。为了营造绿色、安全的 计算机网络环境,就必须要提高计算机网络的可靠性,这对于推动我国现代化社 会的发展是具有重要意义的。 关键词:计算机网络;可靠性;优化设计 1计算机网络可靠性的含义 可靠性是计算机网络的一个基本要求,关系着计算机网络是否能够正常稳定 运行。在计算机网络领域中,影响可靠性的因素有三个,第一个是计算机的网络 环境,包括计算机硬件和环境背景,计算机网络的功能和作用只有借助特定的网 络环境才能够发挥出来。第二个是时间因素,计算机网络只有在一定的时间内完 成工作才有意义,尤其是在当前生活节奏不断加快的情况下,计算机网络只有在 短时间内尽可能快地完成工作,才能够提升人们生产生活的效率,体现出计算机 网络的价值。第三个是计算机网络能力,在满足网络环境和时间要求的基础上, 计算机网络只有具备完成业务的能力,能够发挥出切实有效的作用,才能确保其 可信程度。如果计算机网络的可靠性不足,那么不仅无法保证其能够在短时间内 完成工作,还可能会受到外网的攻击,严重的话还会危害使用者的经济利益。 2影响计算机网络可靠性的主要因素 2.1传输交互设备 网络数据交换设备在每个终端的链路中心称为数据传输和交换设备,数据传 输和交换设备在网络各部分的通信中起着重要作用。传输切换装置作为计算机网 络的主要方式,应当受到技术人员的高度重视,通常来讲这个装置是由两部分组 成的。分别是通信线路以及集线器技术人员,应当明确他们可能出现的种种问题,并且对其展开处理,只有这样才能促进计算机网络的正常运行,保证其在保障期 内有较高的可靠性。由于集线器具有连接终端设备节点的功能,集线器保证了整 个网络的稳定性,并且如果发生某些故障,整个网络就会瘫痪。技术人员应当加 大对计算机网络的关注并且保证其中的终端能够正常运行,也就是当有终端出现 异常情况时,那么要保证与他工作相联系的一些终端能够依法进行正常工作,所 以就是因为要保证终端能够正常工作。这在数据交换设备中是极其重要的一部分,是设备的核心,也是提高计算机网络可靠性的基础。 2.2计算机网络的拓扑结构 计算机的网络节点可以分为三类,一类是涵盖结点路由器、交换机和终端控 制器的转接结点;另一类是用户终端设备的访问节点;最后一类是指含有多个节 点的节点混合体。网络拓扑结构按照复杂程度和可靠性大小排列可以分为星型拓扑、总线型拓扑、环型拓扑、树型拓扑和混合型拓扑五种结构。这里需要注意, 星状拓扑的中心汇聚点非常关键,如果出现故障,那么整个计算机网络就无法正 常工作,但一般计算机网络往往由多种拓扑组得成混合型拓扑,并不会因为中心 汇聚点出现故障而整体瘫痪。 2.3使用人的素质 人是计算机网络所服务的对象,主要是为了满足人类发展而服务的,人类如 果对计算机网络使用的方法得当,而且个人信息保密意识强,也能给计算机增加

计算机网络可靠性的分析与设计

计算机网络可靠性的分析与设计 当今社会是一个信息化社会,此时电脑网络成为了我们生活中的必备品,我们的很多工作都是借助电脑开展的。也就是说当今社会的发展离不开电脑,离不开网络。因此我们可以说网络的稳定性关乎到我们的日常活动,关乎到社会稳定。 标签:计算机网络;可靠性;优化设计 引言 电脑网络的稳定性是当前我们判定网络性能的一个重要指标。比对于西方国家来看,我们国家的网络技术起步不是很早,所以在开展相应的设计工作的时候,只能结合所在区域的具体状态分析群众对于网络的需要,大部分涉及的是网络通信水平,很少牵扯其稳定性方面的内容。所以,不管是从知识层面上来看,亦或是从运用情况上来分析,我们都要提升网络的稳定性。 1 计算机网络可靠性概述 计算机网络可靠性作为一门跨学科体系的科学,其历经了多年的发展,此时已经形成了非常系统的组织框架。按照当前的分类措施,可以把其可靠性划分为四个类型,分别是网络的存在性,网络的效用性,网络抵抗毁灭性,多条件下的网络可靠性。要想确保网络运行稳定的话,就要确保其所有的终端拥有完备的设备。 在设计拓扑结构的时候,必须确保其符合全部的使用人的使用规定,能够被应用到建筑之中,而且还要便于相关的施工工作开展。具体来讲,必须选择正确选择链路介质,确保其和绝大多数的网络产品以及装备等有效的共存,而且还应该具有扩展以及升级等的能力,进而制定规划。计算机网络可靠性有关概念作为一门系统工程科学,反映了计算机网络拓扑结构支持计算机网络正常运行的能力,计算机网络可靠性模型涉及到计算机网络是连通的,一般来说,介质是否稳定与它的长度没有实际的关联;确保结点以及链路的状态良好,结点不会出现问题。 从字面意义上来分析,它的可靠性具体的是指电脑网络在特定的时间范围以及限制条件以内,有着稳定的通信能力。它能够体现网扑的工作状态,是判定网络设计是否合理的关键要素。 2 计算机网络可靠性的影响因素 我们都知道,使用人的终端和设备是直接相连的,因此它的可靠性意义关键。只有确保了它的运行稳定,才能够确保电脑网络的运作稳定。具体来讲,我们必须使用合理的线路以及布线体系,此时电脑网络的稳定性才能够切实提升。除此之外,我们还要分析它的冗余以及容错水平。要想提升它的稳定性,首先要做的

基于复杂网络的城市轨道交通网络可靠性研究

do:i 10.3969/.j issn .1672-6073.2010.02.004 都市快轨交通#第23卷第2期2010年4 月 快轨论坛 基于复杂网络的城市轨道 交通网络可靠性研究 陈菁菁 (上海申通轨道交通研究咨询有限公司 上海 201103) 摘 要 通常的可靠性理论难以有效分析城市轨道交通网络的可靠性。鉴于复杂网络理论对大量现实网络实证研究的有效性,以及城市轨道交通网络作为现实世界网络的典型实例与其他网络具有相似性,应将城市轨道交通网络相关问题的研究归为复杂网络的研究范畴。引入复杂网络的可靠性测度指标,从网络的适应性、稳定性和有效性三方面来构建城市轨道交通网络可靠性的衡量指标,将原先基于设施设备的可靠性研究拓展至基于交通系统管理者和使用者的全局性研究。 关键词 城市轨道交通网络 复杂网络 可靠性测度中图分类号 F51213 文献标志码 A 文章编号 1672-6073(2010)02-0018-04 城市轨道交通网络是由大量相互作用的单元构成的复杂系统,在一定的规则下产生有组织的行为,呈现动态的变化和演化过程,并且具有与外界相互作用的开放性。城市轨道交通网络表现出既有不确定性,又有一定的内部自组织原则的特性,不能简单地将城市轨道交通网络的问题归为随机网络或规则网络的问题来研究。 1 城市轨道交通网络可靠性分析的难度 1.1 大系统与小样本 城市交通网络系统是一个错综复杂的大系统。概率论是可靠性最主要的理论基础,其中的大数定律决定了在可靠性试验或数据分析时,必须有足够的样本量。对于城市轨道交通系统而言,网络可靠性的研究还刚刚 收稿日期:2009-10-10 修回日期:2009-11-20 作者简介:陈菁菁,女,博士,工程师,主要研究城市轨道交通运营安 全与可靠性,c j j yh @ya hoo.c https://www.doczj.com/doc/35918355.html, 基金项目:国家自然科学基金(50478105) 起步,研究的基础很薄弱,特别是在我国的各个城市, 轨道交通仍然处于集中建设时期,具有一定规模的网络还未形成,实际的样本数据匮乏,样本数据少的问题极为突出。因此,如何在小样本条件下确定系统的可靠性参数是一个迫切需要解决的问题。 1.2 模糊性 由于可靠性数据较少,特别是在方案论证和系统设计的早期阶段,由于分析和评定的失效数据样本小,基于大样本数据的概率模型和统计方法难以适用。目前,往往采用专家经验等定性信息的形式来描述系统的可靠性,如/该城市轨道交通网络的可靠度不太高0等,这种描述本身就存在模糊性,难以用基于概率论的可靠性分析与评定方法来处理。 常规的可靠性理论是建立在二态假设和概率假设基础上的。二态假设是指系统只有两种极端状态,完全正常或完全失效。概率假设则要求满足事件明确加以定义、大量样本存在、样本具有概率重复性、不受人为因素影响4个条件。 城市轨道交通网络作为一个系统运行,其工作状态就存在模糊性,很难满足二态假设,难以用基于概率论的可靠性分析与评定方法来处理。某些系统工作状态的正常或不正常,在外延上难以定义明确的界限,具有模糊的概念,如网络中的部分线路已失效,但整个网络并不完全失效,系统可以降级运行等,用二值逻辑和统计方法难以处理,二态假设无法精确描述,具有模糊性。 1.3 建模困难 可靠性评估的数学模型应该正确地反映系统中各个部分之间的内在联系,准确描述系统的实际运行情况。在系统的复杂性与精确性描述之间,由于城市轨道交通网络是由许多分系统、线路、车站、设施设备组

物流网络可靠性及优化设计

物流网络可靠性及复杂性物流网络可靠性研究是一个相对较新的物流研究方向,很多国内外学者在相关文献中提到了这个研究方向的重要性,但几乎还没有系统研究的文献面世。但是,在可靠性基础理论,以及其他一些与可靠性有关的应用领域和研究方向上已经取得了许多研究成果,这为本文的研究开拓了思路并提供了相关理论支持。 1.可靠性的含义 所谓可靠性,是指产品在规定的条件下,在规定的时间内,能够完成规定功能的能力。可靠性有很多数量指标,如寿命、失效率、可靠度等。其中常用的特征是可靠度,可靠度是指产品在规定的条件和规定的时间内,完成规定功的概率。 2.网络可靠性的含义 网络可靠性的研究始于对通信网络的分析,而后,逐渐渗透到电力系统、计算机网络系统和工程系统等各个领域。网络可靠性的分析方法最初只限于两终端问题,随着大型复杂网络系统的发展,使其分析变得更为一般化,同时出现不少新的算法以及新的理论方法。 国内外许多文献对网络可靠性作了定义,虽然有所差别,但最终可认为网络可靠性是指网络系统在实际规定的连续运行过程中,充分完成所规定的正常功能的能力闭。在此,“完成所规定的正常功能的能力或概率”是网络可靠性的测度,它既包含了网络的生存能力和有效性,也反映了网络对用户需求的适应能力;既研究网络正常运行情况下的可靠性,也研究异常情况下的可靠性,是对整个网络运行过程的综合测度。这一定义包括了可靠性研究对象、规定条件、规定时间、规定

功能和概率等五项要素。 3.网络可靠性测度 目前国内外研究是将网络抽象为一个由节点和连接组成的传送各种信息(业务流)的流图进行分析,网络可靠性的测度归纳起来主要有3种:网络的抗毁性、网络的生存性和网络的有效性。 (1)网络的抗毁性(Invulllerability)是网络在人为破坏下的可靠性,是从图论中提出来的,从网络连通性的角度描述了拓扑结构对网络可靠性的影响。一般通过粘聚度和连通度的确定测度表示。近年来多用于军事通信网的研究和部分公用网。 ⑵网络的生存性(survivability)是在随机性破坏下的可靠性,反映了随机性破坏和网络拓扑结构对网络可靠性的影响,是由概率论和图论得出的。其连通性(即网络端到端的连通概率)作为生存性的测度。近来,在自愈网中研究网络的生存性较多。 ⑶网络的有效性(渐ail曲i一ity)又称完成性(pe而rmability),是一种基于业务性能的可靠性测度。它反映了网络在部件失效的情况下,满足业务性能要求的程度。国内外对其测度指标研究较多。随着科学技术的进步,网络可靠性分析在提高网络可靠性与生存性,网络的优化设计中具有重要意义。而网络可靠性理论在社会经济系统、管理领域应用的建模与方法、算法设计等方面还有许多研究工作要做。 4.网络可靠性计算基础 网络可靠性理论涉及到计算,估计和最大化网络在面对随机失效时连接仍然存在的概率。失效或许是由于中断、阻塞或涌堵引起的。对于失效后连接的测量有各种各样的方法,比如节点可靠性(两个节点可

一个中小企业网络规划与设计的方案[1]

一个中小企业网络规划与设计的方案 网络工程设计方案需要一个中小企业网络规划与设计的方案 (1)公司有1000 台PC (2)公司共有多个部门,不同部门的相互访问要求有限制,公司有若干个跨省的分公司 (3)公司有自己的内部网页与外部网站 (4)公司有自己的OA 系统 (5) 公司中的每台机能上互联网 (6)核心技术采用VPN 根据以上 6 个方面的要求说明提出一个网络设计方案 目录 前言 一、项目概述 二、需求概述 三、网络需求 1。布线结构需求 2。网络设备需求 3.IP地址规划 四、系统需求 1.系统要求 2.网络和应用服务 五、存储备份系统需求

1。总体要求 2.存储备份系统建设目标 3.存储系统需求 4.备份系统需求 六、网络安全需求 1.网络安全体系要求 2.网络安全设计模型 前言 根据项目招标书的招标要求来细化为可执行的详细需求分析说明书,主要为针对项目需求进行深入的分析,确定详细的需求状况以及需求模型,作为制定技术设计方案、技术实施方案、技术测试方案、技术验收方案的技术指导和依据 一、项目概述 1。网络部分的总体要求: 满足集团信息化的要求,为各类应用系统提供方便、快捷的信息通路。 良好的性能,能够支持大容量和实时性的各类应用。 能够可靠的运行,较低的故障率和维护要求。 提供安全机制,满足保护集团信息安全的要求. 具有较高的性价比。 未来升级扩展容易,保护用户投资。 用户使用简单、维护容易。 良好的售后服务支持。 2。系统部分的总体要求: 易于配置:所有的客户端和服务器系统应该是易于配置和管理的,并保障客户端的方便使用; 更广泛的设备支持:所有操作系统及选择的服务应尽量广泛的支持各种硬件设备; 稳定性及可靠性:系统的运行应具有高稳定性,保障7*24的高性能无故障运行。

网络可靠性实现

高可用性技术(故障检测技术)在路由网络中的应用 国网电科院信息通信技术服务中心蓝鹏 VER1.0 引言:为了保证网络的不间断运行,特别是核心出口网络的高可用性,通常在部署较大规模网络时,会采取链路级备份、设备级备份等方式。技术上通常使用多管理引擎备份、浮动静态路由、VRRP、HSRP等。虽然这些技术给网络带来了一些备份作用,但是对于实时性要求较高的网络还会存在一些问题,本文结合在H3C路由器上的配置实例说明一些故障检测技术与传统技术的结合(联动)从而实现更为智能的高可用性解决方案。 关键字:可靠性故障检测技术NQA BFD TRACK 路由协议网络收敛 (一)、可靠性概述 随着网络的快速普及和应用的日益深入,网络中断可能影响大量业务,因此,作为业务承载主体的基础网络,其可靠性日益成为倍受关注的焦点。在实际网络中,总避免不了各种非技术因素造成的网络故障和服务中断。因此,提高系统容错能力、提高故障恢复速度、降低故障对业务的影响,是提高系统可靠性的有效途径。 1.可靠性需求 可靠性需求根据其目标和实现方法的不同可分为三个级别,各级别的目标和实现方法如表 1 所示。 级别目标实现方法 1减少系统的软、硬件故障硬件:简化电路设计、提高生产工艺、进行可靠性试验 软件:软件可靠性设计、软件可靠性测试等 2即使发生故障,系统功能也不 设备和链路的冗余设计、部署倒换策略、提高倒换成功率受影响 3尽管发生故障导致功能受损, 提供故障检测、诊断、隔离和恢复技术 但系统能够快速恢复 表 1 在上述三个级别的可靠性需求中,第1级别需求的满足应在网络设备的设计和生产过程中予以考虑;第2级别需求的满足应在设计网络架构时予以考虑;第3级别需求则应在网络部署过程中,根据网络架构和业务特点采用相应的可靠性技术来予以满足。 2.可靠性度量 通常我们使用 MTBF ( Mean Time Between Failures ,平均故障间隔时间)和 MTTR ( Mean Timeto Repair ,平均修复时间)这两个技术指标来评价系统的可靠性。 (1).MTBF MTBF 是指一个系统无故障运行的平均时间,通常以小时为单位。 MTBF 越多,可靠性也就越高。 (2).MTTR MTTR 是指一个系统从故障发生到恢复所需的平均时间,广义的 MTTR 还涉及备件管理、客

如何提高企业网络安全可靠性

如何提高企业网络安全可靠性 LINUX服务器为妥 若有人问你,在中小企业的网络规划中,必须遵守的几个原则是什么?那么,可靠性,必定名列其中,而且是名列前茅的。可见,可靠性在中小企业网络建设中的重要性。但是,俗话说,站着说话不怕腰疼,要提高中小企业网络的可靠性不是嘴巴说说就可以完成的,是需要网络管理员拿出全部智慧来设计中小企业的网络应用才可以达到这个目标。 笔者虽然在中小企业网络管理设计中,对于可靠性有比较深刻的认识。但是,自认为还没有掌握到全部内容。下面,笔者就自己的在这方面的一些经验拿出来供大家参考。 一、服务器还是采用LINUX的好 随着信息化技术的普及,服务器在企业中的应用越来越广泛。如企业若采用ERP系统,则需要有ERP系统服务器;采用文件服务器的话,也需要有专门的服务器来支持这个网络应用。现在网络管理员面临着一个问题,就是该采用什么样的服务器操作系统?现在用的最多的是微软的服务器版本的操作系统与LINUX的开源的免费的服务器操作系统。 那我们该怎么选择呢?我个人倾向与LINUX的服务器操作系统,我现在在企业中部署的两个服务器,也都是采用这个免费的开源的操作系统。我为什么选择这个免费的操作系统呢,主要有以下原因。 一是我们都知道,微软的操作系统补丁太多,时不时的需要给操作系统打补丁。从这里也可以看出,微软的操作系统稳定性不容乐观。而这正式企业网络应用可靠性的最大杀手。 二是微软也不知道得罪了谁,跟其相关的网络应用成为了众多黑客等攻击的对象,什么病毒、木马都在其周围打转。而且攻击的不仅仅是其操作系统本身,还有其上面的相关应用。如SQL SERVER数据库系统、Exchange邮件服务器等等,都是其攻击的对象。相对而言,LINUX因为是开源的,而且其有很多技术专家在为其服务,所以,其仇家就没有这么多。针对LINUX服务器系统的攻击,跟微软的操作系统比起来,可以说是九牛一毛。 虽然LINUX在操作性上,没有微软操作系统那么简便,而且,也不是所有的网络应用都支持这个开源的操作系统。但是,企业网络可靠性的考虑,我还是会好不犹豫的选择LINUX的服务器操作系统。其在稳定性方便,要远远的超过微软的服务器操作系统。而且,还可以省去不断打补丁的烦恼;同时,还可以省一大笔软件的授权费用。这一举多得的事情,我们怎么能够放过呢? 服务器的可靠性,是整个企业网络应用可靠性的基础,我们在网络规划的时候,要引起充分的重视。 采用新技术要慎重 二、避免采用最新的技术 新的技术,对于企业来说,可能意味着高性能,但是,同时也意味着不稳定,是可靠性的又一个隐形杀手。在这方面,我的师傅给我讲过一个非常深刻的例子。 那时,我师傅是一个技术迷,是技术的崇拜者。是幸运也是不幸的是,那时候他在一家国有企业负责网络管理。我们知道,那时候的国有企业可是铁饭碗,而且,网络信息化那时候还是一个新名词。在网络信息化这一方面,国有企业是乐意投资的,因为这是一块活招牌,而且,国家在这方面也有资助。所以,我师傅在资金方面是不用愁的,这使得我师傅有足够的金钱去追从新技术。其实,这也怪不得我师傅,也是当时企业管理层的需要。 那时候,无线局域网刚出现,我师傅应企业管理层的需要,就迫不及待的花费巨资,对企业的网络进行大范围的改造。要知道,那时候无线网络设备刚出来的时候,不但价格昂贵,而且,其技术还不是很完善,存在很多问题,让我师傅吃足了苦头。

矿井通风系统可靠性影响因素分析

矿井通风系统可靠性影响因素分析 【摘要】我国在矿井通风系统可靠性分析评价研究方面做了很多卓有成效的工作,但由于矿井通风系统的时变性、突发性、复杂性等特点,加之矿井通风中系统的一些具体指标尚无统一标准,因此,在矿井通风系统可靠性分析方面尚需结合矿井通风的特点,全面考虑其影响因素,研究探讨评价矿井通风系统可靠性的方法,为实现矿井通风安全管理提供理论及技术支撑。 【关键词】矿井通风;可靠性;安全管理;多因素系统;通风方式;通风动力;通风网络 0 引言 矿井通风系统是由具有相互联系、相互作用、相互影响的构成因素:通风方式、通风方法、通风网路、风流监测和调控设施所组成的,具有向矿井供给新鲜风量,以冲淡排除井下的毒性、窒息性和爆炸性气体和粉尘,保证井下风流的质量符合国家安全卫生标准,营造良好的工作环境,防止各种伤害和爆炸事故的发生,保障井下人员身体健康和生命安全,保护国家资源和财产的一个多因素组成的动态的、统一的整体。而矿井通风系统可靠性就是满足以上功能的可靠程度。 1 矿井通风系统可靠性影响因素 矿井通风系统是受诸多因素影响的一个复杂、随机、非稳定的动态系统。矿井通风系统可靠性主要影响因素包括有:通风方式及方法的合理性、通风网络、通风动力、通风构筑物的状况、自然风压、巷道的贯通与封闭、工作面的推进与转移、采区接替、生产水平过渡、巷道中的行人、行车和堆积物等自然因素;还有通风监测系统的利用,通风管理规章制度及人员的素质等管理因素。 矿井通风系统复杂关联的属性具体表现为系统的多环节性、时变性、可维修性以及系统各影响因素之间的强耦合性。因此,易产生大量影响煤矿井下正常通风及安全生产的随机故障或事故隐患。 因此要研究矿井通风系统的可靠性,需要全面分析整个通风系统的特点及影响矿井通风系统可靠性的诸多因素。 2 矿井通风系统可靠性主要自然影响因素 2.1 通风方式 矿井进、回风井的相对位置的布置方式即为矿井通风方式。矿井通风方式包括中央式、对角式、分区式、混合式 4 种;矿井通风方法有抽出式、压入式、混合式。其抗灾能力各不相同。一般使风流顺向流动、折返性小的通风方式比较优越。通风方式的选择直接影响井下通风线路的长短,关系到矿井通风阻力的大

计算机网络可靠性优化探析

计算机网络可靠性优化探析 发表时间:2019-03-25T16:04:08.157Z 来源:《基层建设》2018年第35期作者:陈浩周坤 [导读] 摘要:计算机网络可靠性的相关概念是在20世纪70年代出现的,由于通讯技术,光纤技术,计算机互联网络技术的迅猛发展,使得网络的功能日益增强,推动着计算机网络可靠性问题的研究不断向纵深方向发展。 国网亳州供电公司安徽省亳州市 236800 摘要:计算机网络可靠性的相关概念是在20世纪70年代出现的,由于通讯技术,光纤技术,计算机互联网络技术的迅猛发展,使得网络的功能日益增强,推动着计算机网络可靠性问题的研究不断向纵深方向发展。随着社会信息化进程的加速,不仅计算机网络的用户在增加,而且计算机网络的连接区域和网络连接规模也在急剧扩展。可靠性这个对于计算机网络来说至关重要的问题,更是要站在宏观的角度上,整体地进行系统地研究和分析。而系统可靠性理论为我们研究计算机网络的可靠性问题提供了理论上的保证;所以必须借助系统可靠性理论来研究和分析计算机网络的可靠性问题。由此,可以看出对计算机网络可靠性问题研究的重要性及紧迫性,计算机网络可靠性的研究有着十分重要的理论意义和实用价值。 关键词:计算机网络;可靠性;优化 1 计算机网络可靠性简述 计算机网络可靠性,就是指计算机网络在一定的环境当中,通过运行模式在规定的时间段内,完成某种业务的处理能力。计算机网络需要拓扑结构对计算机网络正常运行的支持,是衡量计算机网络设计运行的重要指标之一。与其他学科一样,计算机网络可靠性优化也是一门系统的学科,经过不断的发展和完善,建立了内容完整、体系健全的科学内容。一般而言,可以把计算机网络可靠性划分为四个种类:相互之间的连通性、运行过程中的生存性、遭受攻击时的抗破坏性、运行过程中各个部件的有效性。其中研究最为广泛的是对网络连通性,是衡量计算机网络可靠性的重要指标。 2 计算机网络可靠性优化影响因素 2.1 管理对网络可靠性的影响 计算机网络中所需的各种设备通常是由不同的生产厂家共同完成的,在生产过程中,不同的厂家对设备生产的标准不同,设备的规格型号多种多样,形成十分复杂的网络结构模式。在计算机网络的日常维护当中,需要对这些都要有详细的了解,对每一个厂家的信息要有详细的记录。在网络运营过程中,如果出现问题,能够及时的处理,保证网络运行过程当中,数据传输的完整性和安全性。工作人员要熟悉各种设备零部件的特性,加强应用管理,降低事故的发生率。网络管理主要涉及到两个方面的内容,第一是网络管理制度,管理制度是网络正常运行的重要保障,通过完善各种资料,建立健全人员责任制度以及设备保养制度,确保互联网的安全。第二是对计算机运行的软件设施要进行合理的选用,不同的计算机设备在运行过程当中都要有相应的软件设施作为支撑,同时还要对计算机的管理实行数据化处理,根据各种人员、网络接口等方面选用合适的管理软件。 2.2 网络设施设备的影响 设施设备是网络运行的基础,在计算机网络运行过程中会用到各种设施设备,这些设施设备的完善程度对计算机网络可靠性优化具有重要的影响。一方面是用户设备,用户设备是用户在利用互联网过程中所要使用的个人计算机、路由器、网线、软件等各种设施。用户设备安全性的高低对整个计算机网络的可靠性具有重要的影响。确保用户设备的可靠性是一个重要的方面,在高可靠性的基础上,不同用户之间进行数据传输的能力会增强,能够提高计算机网络的可靠性。另外一种是在传输过程中用到的交换段设备。这种设备与其他的设备故障相比较来说,由于其位置的特殊性,在实际过程当中一把很难被发现,具有很大的隐蔽性,对这种故障的处理通常情况下比较困难。要求在设备的铺设过程中,要对线路布置工作做好提前的规划工作,选择好铺设线路,并做好图纸记录工作,方便在发生故障时能够及时的处理,提高计算机网络可靠性。 2.3 计算机网络拓扑结构的影响 拓扑结构是指在计算机网络中,各个工作站(又可以成为节点)的连接形式,一般来说可以分为以下几种类型:总线结构型、点型、环状型、树枝型以及这几种形式和其他类型结合在一起的混合型。在影响计算机网络可靠性的类型当中一般来说主要有两个。一种是总线形式的拓扑,在这种结构模式当中,计算机网络中的全部工作站或者节点都要通过网卡才能将数据内的各种数据传输到总线当中,这种形式下的拓扑是一条整个的联通图,网络中的任何两个点都是标准映射的关系,即一一对应的形式,主要是在局域网中。这种形式存在着一定的缺陷,在任一时间段内,两个(或者两个以上)的工作站利用总线进行数据传输工作时,都会导致工作不能正常进行,传输工作失败。另一种是点型的拓扑。这种形式主要是在局域网中,而且这些局域网利用的是交换机进行传输数据,这种拓扑结构,一般来说结构比较简单、管理控制比较容易,但是也有一些缺点,就是当数据传输时处于中心的工作站发生问题时,将会给整个计算机网络带来严重的后果,整个系统将会瘫痪,数据传输中断。 3 计算机网络可靠性优化设计方案 提高计算机网络可靠性的最有效的方案是提高其网络系统的容错性。计算机网络的容错性设计就是寻找最常见的故障点,通过冗余来加强它们,以最大限度地缩短计算机网络故障的持续时间。本文根据实际需要提出了四种提高计算机网络可靠性设计的设计方案。 3.1容错性设计方案 遵循“并行主干,双网络中心”的原则,将所有的计算机网络的系统线路进行并行设计,计算冗余,通过这种设计方案可以使用户终端的连接处于两个主要的网络点上,形成了一个双网络的连接方式,提升网络的容错性。这种设计方案,在网络出现故障的时候,避免网络中其他用户受到干扰。因此,此设计方案有助于提升计算机网络抗故障的能力,实现了网络的可靠性提升。 3.2双网络结构冗余设计方案 这一设计方案简单理解是在原网络结构基础上再添加一个备用网络。使用这种双网络结构形式,能够提升数据信息的同步传输能力。在计算机网络中出现故障或者主网络出现故障无法正常使用的情况下,备用网络系统会替代原网络系统,保证网络数据信息的传输,实现计算机网络的安全运行。双网络设计方案相对于容错性设计方案造价较高,但对于故障的排除却相对比较简单和容易发现。 3.3构件层次布局的设计方案 将计算机网络系统分为网络应用层、网络服务层、网络操作系统层和网络物理硬件层四个层次来逐步完善计算机网络系统。在计算机

矿井通风系统安全可靠性评价研究

矿井通风系统安全可靠性评价研究 我国评价体系研究方向,改革现有的评价体系从而进行优化,使用最先进的评价体系对通风体系安全评价体系进行评估,准确地反映了真实的工作状态,并将被添加到日常管理里面,让安全性评价和日常管理系统得到更好的水平。 标签:矿井通风系统;安全;可靠性评价 对于通风系统可靠性的评价,不但能获得其可靠性,还可以发现它的影响因素,为进一步优化系统提供参考条件。评估的目的是提高可靠性,减少安全事故的发生率,保证人身安全,提高采矿效率。 1 矿井通风系统安全可靠性评级体系建立的原则 1.1 建立原则 为了保证系统的安全,第一步先要构建一个完整的、科学的、合理的评价标准,这是实行评价方法的一个重要的基础,可以直接影响到最终评价的准确性。系统的建立是对它稳定性的可靠衡量,具有很高的科学基础。 1.2 科学性原则 在建立该安全评价体系的过程中,首先要遵循原则为科学性原则。要建立在国家规定的标准评价方式基础之上,结合自身的矿井环境特点,建立好符合自身的安全评价方式,以便全力保障该系统能够可靠实施。 1.3 可行性原则 可行性是建立安全评价体系的重要部分。无论从理论上講,评价体系建设的安全性是多么的完善,如果在运用中特别麻烦或可行性不乐观,那么建立这个系统都是毫无意义的。所以,在建立系统的过程中,对最大程度上把相关程序进行简化,注意工作的效率,减少不必要的工作流程,不仅要让评价过程变得简单、方便、高效,更要有资格进行最终评价标准。 1.4 普通性原则 在评价指标的制定过程中,应该对相同的原因进行探讨。对待问题,要细致入微,这样可以把矿井内部的情况挖掘并分析出来,结合实际情况解决问题。 2 矿井通风系统安全性评价方式分析 在安全评价方法中应用解析法,第一步就是需要建立一定强度的数学模型,然后根据数值结果用数学模型计算,得出安全标准体系。解析方法包括网络分析

相关主题
文本预览
相关文档 最新文档