常用告警
- 格式:docx
- 大小:23.67 KB
- 文档页数:17
关于S1240中继、信令和时钟的常用告警MNEM UR MEANINGAIS NU Digital trunk: alarm indication signal 数字中继:告警指示信号ANMFAIL PO Announcement file load failure 录音通知文件装载失败CCLD1 U N7-Destination inacesible ( Level 1) N7目的地不可访问(1级)CCLD2 NU N7-Destination inacesible ( Level 2) N7目的地不可访问(2级)CCLD3 PO N7-Destination inacesible ( Level 3) N7目的地不可访问(3级)CCLK1 U N7-Link out of service ( Level 1) 7号信令链路中断(1级)CCLK2 NU N7-Link out of service ( Level 2) 7号信令链路中断(2级)CCLK3 PO N7-Link out of service ( Level 3) 7号信令链路中断(3级)CCLO1 U N7-Link occupancy ( Level 1) 7号信令链路占用(1级)CCLO2 U N7-Link occupancy ( Level 2) 7号信令链路占用(2级)CCLO3 U N7-Link occupancy ( Level 3) 7号信令链路占用(3级)CCLS1 U N7-Link set out of service ( Level 1) 7号信令链路组中断(1级)CCLS2 NU N7-Link set out of service ( Level 2) 7号信令链路组中断(2级)CCLS3 PO N7-Link set out of service ( Level 3) 7号信令链路组中断(3级)CRC41 U Digital trunk: CRC4 error rate > 10e-3 数字中继:CRC4误码率> 10-3 CRC41R U Digital trunk: CRC4 error rate > 10e-3, deteted by remote由远端显示数字中继:CRC4误码率> 10-3CRC42 NU Digital trunk: CRC4 error rate > 10e-6 数字中继:CRC4误码率> 10-6 CRC42R NU Digital trunk: CRC4 error rate > 10e-6, deteted by remote由远端显示数字中继:CRC4误码率> 10-6CT01 U Clock & Tone: different clocks in use 使用不同时钟CT02 NU Clock & Tone: PLL end of range PLL临界CT03 U Clock & Tone: mate PLL out of lock 备用PLL失锁CT04 NU Clock & Tone: OFLL voltage out of range OFLL电压越界CT05 U Clock & Tone: phase alignment 相位调整CT06 U Clock & Tone: partner clock unavailableCT07 U Clock & Tone: PLL switch over PLL切换CT08 U Clock & Tone: dual clock exclusion 双时钟互斥CT09 U Clock & Tone: own setir interrupted 主setir 中断CT10 U Clock & Tone: partner setir interrupted 备用setir 中断CT11 U Clock & Tone: time-of-day bus check 日历总线检查EER01 U Digital trunk: excessive error rate > 10e-3 高误码率> 10-3EER02 NU Digital trunk: excessive error rate > 10e-6 高误码率> 10-6HDB3 U Digital trunk: HDB3-Code violation HDB3码干扰MNEM UR MEANINGHDB32 PO Digital trunk: HDB3-Code violation low in transmission HDB3码传输干扰LCA U Digital trunk: loss of CRC4 alignment CRC4 失调LFA U Digital trunk: loss of frame lignment 帧调整丢失LIS U Digital trunk: loss of incoming signal 输入信号丢失LMA U Digital trunk: loss of multiframe alignment 多帧调整丢失LSNU NU Digital trunk: loss of synchronisation at NT1 U-Side NT1 U侧同步丢失L2PRA NU Digital trunk: layer 2 PRA fault 第二层PRA错NURJA NU Digital trunk: remote junction alarm ( NU ) 远程接点告警NURSA NU Digital trunk: remote signalling alarm ( NU ) 远程信令告警RJA NU Digital trunk: remote junction alarm 远程接点告警RSADK NU Digital trunk: remote signalling alarm for DK-Bit ( CAS ) DK倍远程信令告警SLIP NU Digital trunk: slip between internal and external frequency 内外部时钟的错位SPC NU Semi permanent connection lost 半永久连接丢失TRALIPD PO Digital trunk: daily slip between internal and external frequency 内外部时钟的日错位TRSLIPH NU Digital trunk: hourl slip between internal and external frequency 内外部时钟的时错位URELP U Unrequested loop 不需要的循环。
常用报警电话急救110——报警119——火警120——急救中心122——交通事故114——电话号码查询112——电话故障报修12121——天气预报12117——报时电话中国特种服务电话号码在中国11开头,赋予特种服务号码,110 匪警免费111* 中国邮政基本通话费114* 查号基本通话费119 火警免费12开头,赋予民用特殊号码,如120(医院),121(天气预报),122交通事故报警,126、127、128、129寻呼台(BP机时代)。
还有现在的一些投诉类号码,比如12315,消费者投诉热线,12348市长投诉热线,12358物价局投诉电话,教育乱收费也可以拨打此号码。
120 急救免费121* 气象报时等公共服务基本通话费122 交通事故报警免费123* 政府机关热线基本通话费世界各国报警急救电话号码◆ 亚洲中国香港急救报警电话:999中国澳门急救报警电话:999澳门消防局有两个火灾报警电话号码,一是2222,一是999。
还有一个急救电话号码573366。
其实拨110或112亦可转到999报案中心拨119或120亦可转到消防局(火警及救护车)中国台湾110 警局 119 消防队(含救护车)日本事件,事故的报警电话:110火灾,急病的救急电话:119韩国火警电话和医院的救护车电话:119 泰国报警电话:110火警:199急救中心:1691医疗救助:1669旅游求助:1155新加坡报警电话:999紧急救护/火警电话:99524小时旅游信息热线:180067362000 马来西亚急救/警察电话:999当地旅游咨询电话:1300885776文莱报警电话:993火警电话:995巴基斯坦火警电话:16匪警电话:15救护电话:115菲律宾报警电话:117尼泊尔报警电话:100,110,130印度火警电话:101急救电话:102德里警察局:23011452土耳其交警电话:154防暴电话:155信息电话:174◆ 欧洲法国报警电话:17救护车:15消防车:18急症医生中心:0147077777葡萄牙荷兰匪警电话:3-222222火警电话:3-222333急救电话:112意大利/奥地利报警电话:133急救电话:144火警电话:122英国/爱尔兰报警电话:999(报案,火灾,急救等)德国匪警电话:110急救/火警电话:112希腊警局:100火警:199紧急救护电话:166旅游警局的24小时服务电话:171瑞典急救,火警,匪警电话:112瑞士医疗急救:144报警电话:117火警电话:118空中救援:1414西班牙紧急救援电话:112国家巡警电话:091匈牙利警察电话:107急救电话:104火警电话:105丹麦报警电话:112芬兰犯罪报警:10022事故报警:112冰岛救援电话:112克罗地亚火警电话:93急救中心:94◆ 非洲埃及报警电话:122旅游警察:3906028医疗急救:123塞舌尔警察局电话:288000紧急救护/报警:999坦桑尼亚匪警电话:111火警电话:112救护电话:112南非警察呼叫控制中心电话:10111火警电话:331-2222急救服务电话:999或10177赞比亚紧急事故及火警:999救护车:251200警察总局热线:01-254534◆ 北美洲美国紧急求援电话:911加拿大报警电话是911◆ 南美洲阿根廷火警:100警察局:101医疗急救:107旅游警局:(11)43465007巴西报警电话是190◆ 大洋洲澳大利亚火警/匪警/急救电话:000拨号上网求救:106火灾报警电话号码现在世界火灾报警电话号码各国不同。
prometheus 常用告警规则Prometheus是一款开源的监控系统,常用于对分布式应用的性能进行实时监控和告警。
为了更好地保障系统的稳定运行,我们需要设置一些常用的告警规则,及时发现并解决潜在的问题。
以下是一些常见的Prometheus告警规则及其描述:1. CPU使用率过高告警:当CPU使用率超过阈值时,触发告警。
这可能意味着系统负载过高,需要进一步分析和优化。
2. 内存使用率过高告警:当内存使用率超过阈值时,触发告警。
这可能意味着应用程序存在内存泄漏或者内存使用不合理,需要及时排查和优化。
3. 网络流量异常告警:当网络流量超过设定的阈值时,触发告警。
这可能意味着网络出现异常,需要进一步检查网络设备和配置。
4. 磁盘空间不足告警:当磁盘空间使用率超过设定的阈值时,触发告警。
这可能意味着磁盘空间不足,需要及时清理或扩容磁盘。
5. 数据库连接数过高告警:当数据库连接数超过设定的阈值时,触发告警。
这可能意味着数据库资源不足,需要进行性能优化或者增加数据库服务器。
6. HTTP请求错误率过高告警:当HTTP请求错误率超过设定的阈值时,触发告警。
这可能意味着应用程序存在问题,需要进一步检查HTTP请求处理逻辑。
7. 服务响应时间过长告警:当服务响应时间超过设定的阈值时,触发告警。
这可能意味着系统性能不足,需要进一步优化代码或者增加服务器资源。
8. 服务不可用告警:当服务无法正常访问时,触发告警。
这可能意味着服务出现故障或者网络故障,需要及时处理并恢复服务。
9. 任务执行失败告警:当定时任务执行失败时,触发告警。
这可能意味着定时任务存在问题,需要进一步检查任务执行逻辑和配置。
10. 服务器负载过高告警:当服务器负载超过设定的阈值时,触发告警。
这可能意味着服务器资源不足,需要增加服务器或者优化代码。
以上是一些常用的Prometheus告警规则,通过设置这些规则,我们可以及时发现系统中潜在的问题,并采取相应的措施进行处理。
常用告警说明诺西告警是计算机系统中的一个重要功能,可以及时通知管理员或用户有关系统异常、错误或重要事件的信息。
常用告警说明诺西是一个常见的告警信息,下面将详细介绍这个告警及其应对方法。
诺西告警通常指的是来自诺基亚西门子(Nokia Siemens)的网络设备或系统的告警信息。
这些告警一般与网络设备或系统的性能、状态和操作相关。
通过这些告警,管理员可以追踪和解决设备或系统中的问题,以确保网络的正常运行。
诺西告警通常使用标准的告警代码和文本来描述特定的问题或事件。
下面列举了一些常见的诺西告警及其含义:1. ALM-001: 设备离线该告警表示设备当前无法正常连接到网络,可能是由于设备故障、网络故障或配置问题导致的。
管理员应该检查设备的物理连接、设备的配置以及网络的运行状态,以解决该问题。
2. ALM-002: 内存不足该告警表示设备的内存资源已经耗尽或不足。
这可能会导致设备运行缓慢、延迟响应或其他性能问题。
管理员应该检查设备的内存使用情况,并根据需要进行调整或扩容。
3. ALM-003: CPU负载过高该告警表示设备的CPU使用率已经超过了正常范围,可能会导致设备运行缓慢、延迟响应或其他性能问题。
管理员应该检查设备的CPU使用情况,并根据需要进行优化或升级。
4. ALM-004: 温度过高该告警表示设备的温度已经达到了过高的水平,可能会导致设备故障或其他损坏。
管理员应该检查设备的散热系统、通风情况以及环境温度,并采取措施降低设备的温度。
5. ALM-005: 硬盘故障该告警表示设备的硬盘出现了故障或错误,可能会导致数据丢失、读写错误或其他存储问题。
管理员应该检查设备的硬盘状态,并根据需要进行更换或修复。
除了以上列举的告警,诺西系统还可能有其他各种类型的告警,涵盖了设备的各个方面。
管理员应该熟悉不同类型的告警,并了解如何解决它们。
对于诺西告警的处理,管理员通常采取以下几个步骤:1. 确认告警:管理员需要查看告警的具体内容、代码和描述,以了解告警发生的原因和影响。
xdm 告警列表1.传输告警Span Loss Change(Minor):Span可以理解为两个站点功率监控点之间的总衰耗。
当之间的衰耗值变化范围超出允许的门限时(默认设置为0.5dB),就会出现此告警。
处理之前需要确认一下告警的产生是否暂时的。
这种情况多出现于调试阶段,经常会关闭和开启某个OTU单元的激光器导致站点之间的衰耗值出现变化。
类似的此种情况在恢复后告警自动消失。
如果是由于光缆衰耗割接等引起的一些不可恢复性的衰耗,就需要将放大器的GAIN增益调整到新的数值以适应新的链路状态。
具体的做法只需打开Gain窗口,Adopt然后Apply就可以了。
Out of Tracking Limitation(Major):放大器的自动跟踪功率变化有个范围,默认为0.5~3dB,一当超出这个范围,就会有告警,同时还会伴随Span Loss Change。
由于此时功率变化的范围比较大,必须要认真检查是否线路的衰耗或者板卡等有故障。
例如光纤插拔之后没有复原到位,或者增加或减少了波道的输入。
如果是由于光缆割接引起的光缆衰耗的增加和减少,意味着没有办法回到系统初始的状态,整个时候同样也可以改变放大器的Gain来消除告警。
Out Of SetCapability(Major):放大器的增益是有限的,同时自动跟踪功率变化也有一个限度。
放大器其实是通过调节自身之前的可调衰耗值来调节在线路中的增益的。
当线路衰耗的变化无法使得放大器调整到合适的增益以满足要求的输出功率的时候,就会有此告警。
此时需要建议客户能否将线路的衰耗尽量恢复到初始值。
如果不行,只能将放大器的既定输出更改到合适的值。
保证放大器能1.2.Transmission alarms related to Ethernet and L22.3.Service Alarms4.Timing alarms5.。
常用告警说明诺西诺西是一款广泛使用的告警系统,帮助企业实时监控和管理各种运行时异常和故障。
本文将介绍一些常见的告警类型以及相应的解决方案,以帮助用户更好地理解和处理诺西告警。
一、服务器宕机告警当服务器宕机时,会触发服务器宕机告警。
这可能是由于硬件故障、网络故障或者服务器过载等原因导致的。
处理服务器宕机告警的解决方案如下:1. 检查服务器硬件:首先需要确认服务器是否存在硬件故障。
可以检查服务器的电源、硬盘、内存等组件是否正常。
2. 检查网络连接:如果服务器宕机是由于网络故障导致的,需要检查网络连接是否正常。
可以尝试重新连接网络或者检查网络设备是否工作正常。
3. 调整服务器负载:如果服务器宕机是由于过载导致的,可以尝试通过减少服务器负载来解决。
例如,优化代码、增加服务器资源等。
二、磁盘空间告警磁盘空间告警是指服务器磁盘空间不足导致的告警。
这可能是由于长时间未清理无用文件、磁盘写入速度过快等原因导致的。
处理磁盘空间告警的解决方案如下:1. 清理无用文件:可以通过删除无用的日志文件、临时文件等来释放磁盘空间。
2. 增加磁盘容量:如果磁盘空间经常不足,可以考虑增加服务器的磁盘容量。
3. 优化磁盘写入速度:如果磁盘空间告警是由于磁盘写入速度过快导致的,可以尝试优化代码,减少磁盘写入次数。
三、CPU负载告警CPU负载告警是指服务器CPU负载过高导致的告警。
这可能是由于程序运行过多、代码不优化等原因导致的。
处理CPU负载告警的解决方案如下:1. 优化代码:可以通过优化代码、减少CPU消耗来降低CPU负载。
例如,减少循环次数、合并重复代码等。
2. 增加服务器资源:如果CPU负载经常超过服务器承受范围,可以考虑增加服务器资源。
例如,增加CPU核心数、内存容量等。
3. 分离任务:如果程序运行过多导致CPU负载过高,可以尝试将任务分离到多台服务器上进行处理,从而分担负载。
四、网络连接异常告警网络连接异常告警是指服务器与外部网络连接不稳定或者中断导致的告警。
常见告警、性能及处理在我们日常使用各种设备和系统的过程中,经常会遇到各种各样的告警信息和性能问题。
这些问题如果不及时处理,可能会影响到我们的工作效率、甚至导致严重的后果。
下面,让我们来了解一些常见的告警、性能问题以及相应的处理方法。
首先,来说说网络方面的常见告警和性能问题。
网络连接中断是一个让人十分头疼的问题。
当我们突然无法访问网页、无法收发邮件或者与他人的在线交流中断时,很可能就是网络连接出现了故障。
这时候,我们首先要检查自己的网络设备,比如路由器、交换机等,看看指示灯是否正常。
如果指示灯显示异常,可能是设备出现了硬件故障,需要进行维修或更换。
另外,网络延迟过高也是常见的问题。
当我们在玩网络游戏或者进行视频通话时,如果出现卡顿、画面不流畅的情况,很可能就是网络延迟导致的。
造成网络延迟的原因可能是网络拥堵、服务器负载过高或者本地网络设置问题。
解决这个问题,可以尝试关闭其他占用网络带宽的程序,或者更换网络连接方式,比如从无线网络切换到有线网络。
还有一种常见的网络告警是 IP 冲突。
当多个设备被分配了相同的IP 地址时,就会出现这种情况。
这会导致网络连接不稳定,甚至无法正常上网。
解决方法是手动为每个设备设置不同的静态 IP 地址,或者通过路由器的 DHCP 功能自动分配 IP 地址。
接下来,我们谈谈计算机系统方面的常见告警和性能问题。
系统死机是很多人都遇到过的情况。
电脑突然停止响应,鼠标和键盘都无法操作,这可能是由于系统资源耗尽、软件冲突或者硬件故障引起的。
如果是系统资源耗尽,可以尝试关闭一些占用大量内存和 CPU 资源的程序。
如果是软件冲突,可以卸载最近安装的可疑软件。
如果是硬件故障,可能需要检查硬件设备是否正常工作,或者寻求专业的维修服务。
系统运行缓慢也是一个常见的问题。
当我们打开一个程序需要很长时间,或者在操作过程中经常出现卡顿,这可能是由于系统垃圾文件过多、硬盘空间不足、病毒感染等原因造成的。
4G重要告警解析一、影响小区发射的告警1. ReachabilityProblem(基站退服或脱管)●Alarm Code:ReachabilityProblem●告警影响:e Node B 设备监控失去●告警原因分析:导致该告警的原因主要体现在三个方面:电源、传输、主控卡(C板)故障:1)电源:交流停电等,此时应该有相关环境告警上传;2)传输:传输断3)主控卡故障:主控卡出现掉死、无法正常启动、不断重启等故障;●告警解决方法:电源或传输问题,请相关人员解决;如果是主控卡故障,需要维护人员上站解决;更换主控卡后,需要先问网管人员要一个Yang WO 文件重新下软件并导入WO文件激活。
2.CB INIT FAILURE (C板初始化失败)●Alarm Code:IK4004001●告警影响:整站退服,设备可监控;●告警原因分析:C板故障或者高温导致●告警解决方法:需上站下电重启设备,或热插拔C板,若故障依旧需要更换C板,更换流程请参考ReachabilityProblem(基站退服或脱管)3. NO CONTACT TO BOARD (B板退服)●Alarm Code:IK4009041●告警影响:整站退服,小区不发射;●告警原因分析:若基站无C板或者GPS告警的话,则是B板故障●告警解决方法:网管重启基站不管用的话,需要上站更换,更换B板会自动下软件,基站侧不需要做任何操作,大概需要10分钟左右4. LTECellAdminDown (小区退服)●Alarm Code:LTECellAdminDown●告警影响:相应小区退服;●告警原因分析:一般都是由于基站硬件告警或者小区被lock所致●告警解决方法:首先排除小区或基站是否被locked,其次查看是否有导致小区退服的硬件告警5. NO CONTACT TO BOARD(RRH脱离)●Alarm Code:IK4009138●告警影响:某个RRH对应的小区不发射●告警原因分析:造成此告警的原因可能是电源,光纤及RRH故障●告警解决方法:需下站查看电源及RRH和C板连接的光纤衰耗,如果两种情况都正常的话,就要考虑RRH本身的问题了,最好的方法是塔上和别的正常小区做对调来排查6. CB LOS LOF CPRIPORT *(某个小区RRH脱离)●Alarm Code:IK4004030●告警影响:对应小区不发射●告警原因分析:造成此告警的原因可能是电源,光纤及RRH故障●告警解决方法:需下站查看电源及RRH和C板连接的光纤衰耗,如果两种情况都正常的话,就要考虑RRH本身的问题了,最好的方法是塔上和别的正常小区做对调来排查7.CB ALL CPRIPORTS FAILED (所有小区不RRH脱离)●Alarm Code:IK4004061●告警影响:所有小区不发射●告警原因分析:造成此告警的原因可能是电源,光纤及RRH故障●告警解决方法:需下站查看电源及RRH和C板连接的光纤衰耗,如果两种情况都正常的话,就要考虑RRH本身的问题了,最好的方法是塔上和别的正常小区做对调来排查8.CB TRANS RX LOS CPRIPORT * (某个RRH脱离)●Alarm Code:IK4004042●告警影响:造成此告警的原因可能是电源,光纤及RRH故障●告警原因分析:RRH掉电、不加电,RRH掉死,光纤故障,CCM板卡故障等原因都会出现RRH脱离告警;●告警解决方法:需下站查看电源及RRH和C板连接的光纤衰耗,如果两种情况都正常的话,就要考虑RRH本身的问题了,最好的方法是塔上和别的正常小区做对调来排查;9. CB GPS ANT●Alarm Code:IK4004082●告警影响:GPS时钟不同步,长期告警会造成整站退服●告警原因分析:GPS天线安装问题或者接头等问题●告警解决方法:检查GPS天线及各个接头,告警同时会伴随产生以下告警IK4004012,IK4004014,IK4004157(GPS锁卫星失败)10. ANTENNA_PORT TX VSWR THRESH2(2级驻波)●Alarm Code:IK4011011●告警影响:小区不发射●告警原因分析:天馈接口问题●告警解决方法:下站基站馈线头是否松动或者进水等等11. ANTENNA_PORT GAIN CONTROL TX(天线口传输主分支增益已经超出范围)●Alarm Code:IK4011005●告警影响:小区不发射●告警原因分析:RRH硬件故障●告警解决方法:step1:SAM侧重启该RRH。
E1常用告警介绍
一、KPI告警
1.E1链路延时告警:当E1链路的可用性小于97%时,发出告警,用以提醒维护人员该链路可能存在波动或者故障。
2.E1链路服务质量(QoS)告警:当E1链路参数超过预设值时发出告警,用以提醒维护人员可能存在拥塞、丢失或其他服务质量问题。
3.E1出现的错帧告警:当E1网络检测到帧序号异常或反序时,会发出错帧告警,以提醒维护人员可能存在错帧或错误帧的问题。
4.E1线路超限告警:当E1连接的两端链路的DPT比超出设定的范围时,发出超限告警,用以提醒维护人员可能存在链路噪声和横向干扰等问题。
5.E1线路未知错误告警:当通过E1线路控制时出现未知错误,发出未知错误告警,以提醒维护人员可能存在未知错误的问题。
6.E1线路断线告警:当E1链路断线时,发出断线告警,以提醒维护人员可能存在链路断线或者硬件故障的问题。
7.E1网络错误告警:当E1网络检测到线路错误时,发出错误告警,以提醒维护人员可能存在线路错误的问题。
二、管理告警
1.E1配置错误告警:当E1配置错误时,发出配置错误告警,以提醒维护人员可能存在配置错误的问题。
目录常见告警 14.2 告警列表: 34.2.1 AU-AIS 34.2.2 AU-LOP 44.2.3 B1-EXC 54.2.4 B2-EXC 64.2.5 B3-EXC 74.2.6 FAN-FAIL 84.2.7 HP-LOM 94.2.8 HP-RDI 104.2.9 HP-REI 114.2.10 HP-SLM 124.2.11 HP-TIM 134.2.12 HP-UNEQ 144.2.13 LP-RDI 154.2.14 LP-SLM 164.2.15 LP-TIM 174.2.16 LP-UNEQ 184.2.17 LTI 194.2.18 MS-AIS 204.2.19 MS-RDI 214.2.20 MS-REI 224.2.21 POWER-FAIL 234.2.22 PS 244.2.23 P-LOS 254.2.24 R-LOF 264.2.25 R-LOS 274.2.26 R-OOF 284.2.27 SYNC-LOS 294.2.28 SYN-BAD 304.2.29 TU-AIS 314.2.30 TU-LOP 324.2.31 T-ALOS 334.2.32 T-DLOS 344.2.33 UP-E1-AIS 35第4章第5章常见告警在OptiX设备维护工作中,会遇到很多告警,对告警的有效分析,是解决问题的关键。
要找到问题的根源,首先要从告警产生的原因着手,在查清问题的所在后,运用有效的处理方法排除故障。
下面将单板的一些常见告警列出,并给出告警的定义和产生的原因。
1. SDH接口板:S16、SL4、SD4、SQ1、SL1、SQE、SE2等(1) R-LOS告警:接收侧数据信号丢失,是最常见的告警.。
一般是光纤断或光路衰耗过大。
(2) R-LOF告警:在接收端检测到定帧字节A1≠f6H、A2≠28H,说明接收侧帧同步丢失。
一般由R-LOS告警引起。
(3) B2-EXC告警:B2误码过量。
zookeeper常用告警指标一、概述Zookeeper是一个高可用的、分布式的、开源的协调服务,用于管理共享数据和分布式系统的协调服务。
在Zookeeper环境中,告警指标是用来监控系统状态的重要手段,对于及时发现并解决问题具有重要的作用。
本篇文章将介绍一些Zookeeper常用告警指标。
二、核心指标1. 连接数:Zookeeper的连接数是一个重要的指标,它反映了当前系统中的活跃连接数。
如果连接数长时间不下降或者上升速度过快,可能意味着系统负载过高或者有异常情况发生。
2. 请求速率:Zookeeper的请求速率反映了系统处理请求的能力。
如果请求速率突然上升或者下降,可能意味着系统负载发生变化或者有新的服务加入。
3. 响应时间:响应时间反映了系统处理请求的速度,是衡量系统性能的重要指标。
如果响应时间过长,可能意味着系统负载过高或者有性能瓶颈存在。
4. 数据一致性:数据一致性是Zookeeper的核心特性之一,如果数据一致性出现问题,可能会导致系统崩溃或者数据丢失。
因此,数据一致性指标需要定期检查和监控。
三、扩展指标1. 磁盘使用率:Zookeeper存储数据时,磁盘使用率也是一个重要的指标。
如果磁盘使用率过高,可能会导致系统性能下降或者数据丢失。
2. 网络带宽:网络带宽反映了系统与外部网络之间的通信能力。
如果网络带宽不足,可能会导致系统无法正常接收和处理请求。
3. CPU使用率:CPU使用率反映了系统处理任务的能力。
如果CPU使用率过高,可能会导致系统负载过高或者有异常任务存在。
4. 内存使用率:内存使用率反映了系统内存的占用情况。
如果内存使用率过高,可能会导致系统崩溃或者出现其他异常情况。
四、告警策略对于以上指标,我们需要制定相应的告警策略,以便及时发现并解决问题。
具体来说,我们可以采用以下策略:1. 阈值告警:对于核心指标(如连接数、请求速率、响应时间等),我们可以设定阈值,当指标超过阈值时,发出告警信息。
常用告警含义7743告警,主要是由于GPRS告警引起,不会对掉话率有什么影响,可能会影响彩信、GPRS激活成功率、GPRS掉话率等,处理方式同7745告警。
7745告警:头位数表示:01表示TCH 02表示SDCCH当02时,表示SDCCH掉话率高,查看SDCCH掉话原因,大部分可能为BSC数据错或MSC数据定义有误造成。
当01时,表示TCH掉话率高,最后一位表示载频由于信道失败的掉话占整个载频掉话总数的百分比,如该值超过30%,可考虑重启载频、扇区、BCF。
如重启后仍然存在过多的7745告警,并且小区总体掉话率依然偏高(无直放站情况下大于8%的掉话率)建议更换载频版或BB2板,一般能解决。
1、对于2993的TC掉话告警,我们采取的办法是:如果是单个时隙告警,就关闭该个时隙,让它不再产生TC掉话,因为TC掉话的次数是相当高的,出现2990告警,一个小时的TC掉话就可以到达几百次!所以,我们必须及时采取措施来应对该项告警,如果一个载频由于2993告警关闭了2个或2个以上的时隙,我们就会将其换掉。
还有的情况是由于基站的配置和BSC上的数据不一致,也会导致2993告警的产生,如果是这种情况,就需BSC工程师与现场BTS工程师沟通,双方达成一致的数据配置,都做成一致的数据库,则告警就可解除。
2、对于2915告警,主要是由于基站突发中断或工程新开基站激活ET的时候出现得比较多,我们对于在现网服务的基站采取实时监控的办法,一发生是在用ET的告警,我们马上进行处理,先诊断ET,如果ET无问题,我们再采取自环的方式,判断是那段传输发生了问题,立即解决。
3、对于7767告警,我们主要也是采取实时监控的方式,一发生基站中断的事故,我们马上通知相关部门进行处理。
4、对于8050告警,我们首先察看基站的传输板是否有问题,如果基站无问题,我们将与基站维护人员联系,查清楚是哪个端口有接入,如果无接入产生了该告警,则屏蔽掉该端口,如有接入,则需基站维护人员现场查证后再确认具体故障所在。
常用的告警MNEM UR MEANINGAIS NU Digital trunk: alarm indication signal 数字中继:告警指示信号ANMFAIL PO Announcement file load failure 录音通知文件装载失败CCLD1 U N7-Destination inacesible ( Level 1) N7目的地不可访问(1级)CCLD2 NU N7-Destination inacesible ( Level 2) N7目的地不可访问(2级)CCLD3 PO N7-Destination inacesible ( Level 3) N7目的地不可访问(3级)CCLK1 U N7-Link out of service ( Level 1) 7号信令链路中断(1级)CCLK2 NU N7-Link out of service ( Level 2) 7号信令链路中断(2级)CCLK3 PO N7-Link out of service ( Level 3) 7号信令链路中断(3级)CCLO1 U N7-Link occupancy ( Level 1) 7号信令链路占用(1级)CCLO2 U N7-Link occupancy ( Level 2) 7号信令链路占用(2级)CCLO3 U N7-Link occupancy ( Level 3) 7号信令链路占用(3级)CCLS1 U N7-Link set out of service ( Level 1) 7号信令链路组中断(1级)CCLS2 NU N7-Link set out of service ( Level 2) 7号信令链路组中断(2级)CCLS3 PO N7-Link set out of service ( Level 3) 7号信令链路组中断(3级)CRC41 U Digital trunk: CRC4 error rate > 10e-3 数字中继:CRC4误码率> 10-3 CRC41R U Digital trunk: CRC4 error rate > 10e-3, deteted by remote由远端显示数字中继:CRC4误码率> 10-3CRC42 NU Digital trunk: CRC4 error rate > 10e-6 数字中继:CRC4误码率> 10-6 CRC42R NU Digital trunk: CRC4 error rate > 10e-6, deteted by remote由远端显示数字中继:CRC4误码率> 10-6CT01 U Clock & Tone: different clocks in use 使用不同时钟CT02 NU Clock & Tone: PLL end of range PLL临界CT03 U Clock & Tone: mate PLL out of lock 备用PLL失锁CT04 NU Clock & Tone: OFLL voltage out of range OFLL电压越界CT05 U Clock & Tone: phase alignment 相位调整CT06 U Clock & Tone: partner clock unavailableCT07 U Clock & Tone: PLL switch over PLL切换CT08 U Clock & Tone: dual clock exclusion 双时钟互斥CT09 U Clock & Tone: own setir interrupted 主setir 中断CT10 U Clock & Tone: partner setir interrupted 备用setir 中断CT11 U Clock & Tone: time-of-day bus check 日历总线检查EER01 U Digital trunk: excessive error rate > 10e-3 高误码率> 10-3EER02 NU Digital trunk: excessive error rate > 10e-6 高误码率> 10-6HDB3 U Digital trunk: HDB3-Code violation HDB3码干扰MNEM UR MEANINGHDB32 PO Digital trunk: HDB3-Code violation low in transmission HDB3码传输干扰LCA U Digital trunk: loss of CRC4 alignment CRC4 失调LFA U Digital trunk: loss of frame lignment 帧调整丢失LIS U Digital trunk: loss of incoming signal 输入信号丢失LMA U Digital trunk: loss of multiframe alignment 多帧调整丢失LSNU NU Digital trunk: loss of synchronisation at NT1 U-Side NT1 U侧同步丢失L2PRA NU Digital trunk: layer 2 PRA fault 第二层PRA错NURJA NU Digital trunk: remote junction alarm ( NU ) 远程接点告警NURSA NU Digital trunk: remote signalling alarm ( NU ) 远程信令告警RJA NU Digital trunk: remote junction alarm 远程接点告警RSADK NU Digital trunk: remote signalling alarm for DK-Bit ( CAS ) DK倍远程信令告警SLIP NU Digital trunk: slip between internal and external frequency 内外部时钟的错位SPC NU Semi permanent connection lost 半永久连接丢失TRALIPD PO Digital trunk: daily slip between internal and external frequency 内外部时钟的日错位TRSLIPH NU Digital trunk: hourl slip between internal and external frequency 内外部时钟的时错位URELP U Unrequested loop 不需要的循环。
告警类型网络安全网络安全告警类型网络安全是指保护网络免受未经授权的访问、使用、披露、干扰、破坏或修改的威胁。
随着网络攻击日益普及和恶意程序的不断进化,网络安全告警扮演着至关重要的角色。
在网络安全中,告警类型可以帮助网络管理员及时发现和应对安全漏洞和攻击行为,以下是一些常见的网络安全告警类型:1. 用户登录异常告警:此类告警针对异常登录行为,如从未登录过的IP地址、异常地理位置或异常的登录时间等。
这可能是攻击者尝试获取用户账号和密码的行为,网络管理员可以通过及时监控并撤销相关的异常登录行为,保护用户的账号安全。
2. 网络端口扫描告警:攻击者经常使用端口扫描工具来寻找潜在的漏洞。
网络管理员在监测到大量的端口扫描行为时,可以通过调查扫描源IP地址并强化系统防护来防止潜在的攻击。
3. 恶意软件传播告警:恶意软件(如病毒、木马、蠕虫等)是网络攻击者常用的手段之一。
网络管理员应监测网络中的恶意软件传播行为,对发现的恶意软件来源进行隔离和清除,并及时更新系统的防护措施,以防止进一步的感染。
4. 数据泄露告警:数据泄露可能导致重要的敏感信息被未经授权的人访问或利用。
网络管理员可以通过监测数据的传送和存储行为,发现异常的数据访问行为,及时阻止或限制未授权的数据访问,减少数据泄露的风险。
5. DDoS攻击告警:分布式拒绝服务(DDoS)攻击是通过同时向目标服务器发送大量的请求来使其资源耗尽,造成服务不可用。
网络管理员可以通过监测大量的异常流量和服务响应情况,以及源IP地址和请求的特征来判断是否遭受DDoS攻击,并采取相应的防御措施。
总结起来,网络安全告警类型的目的是通过监测网络流量、用户行为、系统日志和异常事件等来及时发现并应对潜在的网络安全威胁。
网络管理员应时刻保持对网络安全告警的警惕性,并采取相应的措施来加强网络的防护,确保网络安全性和用户的隐私保护。
目录常见告警 14.2 告警列表: 34.2.1 AU-AIS 34.2.2 AU-LOP 44.2.3 B1-EXC 54.2.4 B2-EXC 64.2.5 B3-EXC 74.2.6 FAN-FAIL 84.2.7 HP-LOM 94.2.8 HP-RDI 104.2.9 HP-REI 114.2.10 HP-SLM 124.2.11 HP-TIM 134.2.12 HP-UNEQ 144.2.13 LP-RDI 154.2.14 LP-SLM 164.2.15 LP-TIM 174.2.16 LP-UNEQ 184.2.17 LTI 194.2.18 MS-AIS 204.2.19 MS-RDI 214.2.20 MS-REI 224.2.21 POWER-FAIL 234.2.22 PS 244.2.23 P-LOS 254.2.24 R-LOF 264.2.25 R-LOS 274.2.26 R-OOF 284.2.27 SYNC-LOS 294.2.28 SYN-BAD 304.2.29 TU-AIS 314.2.30 TU-LOP 324.2.31 T-ALOS 334.2.32 T-DLOS 344.2.33 UP-E1-AIS 35第4章第5章常见告警在OptiX设备维护工作中,会遇到很多告警,对告警的有效分析,是解决问题的关键。
要找到问题的根源,首先要从告警产生的原因着手,在查清问题的所在后,运用有效的处理方法排除故障。
下面将单板的一些常见告警列出,并给出告警的定义和产生的原因。
1. SDH接口板:S16、SL4、SD4、SQ1、SL1、SQE、SE2等(1) R-LOS告警:接收侧数据信号丢失,是最常见的告警.。
一般是光纤断或光路衰耗过大。
(2) R-LOF告警:在接收端检测到定帧字节A1≠f6H、A2≠28H,说明接收侧帧同步丢失。
一般由R-LOS告警引起。
(3) B2-EXC告警:B2误码过量。
检测到B2误码个数超过规定值。
4.MS-REI告警:线路板所连的对端站检测到有B2误码,向本站传回M1字节(M1字节表示误码个数)。
(4) MS-AIS告警:检测接收到的复用段开销字节K2 (bit6,7,8)=111 时,上报此告警。
告警含义是整个STM-N帧内除STM-N RSOH外全部为“1”。
由R-LOS告警派生或上游站发来。
(5) MS-RDI告警:检测接收到的复用段开销字节K2(bit6,7,8)=110。
由下游站回告上来,表示下游站接收到的本站信号有故障,说明本站至对端线路段有问题。
(6) AU-AIS告警:整个STM-N帧内除STM-N RSOH和MSOH外全部为“1”。
一般由R-LOS、MS-AIS告警引起,常见业务配置有问题,如前站业务未穿通到本站。
(7) HP-RDI告警:检测接收到的高阶通道开销字节G1(bit5)=1 ,由对端复用段和高阶通道故障引起。
(8) AU-LOP告警:检测到AU指针H1、H2字节非法。
常见业务时隙冲突。
10.HP-TIM告警:高阶通道追踪识别符失配告警。
一般由两端光板的追踪识别符不一致引起。
该告警不会影响业务。
2. 支路板:PQ1、PD1板、PL3板(PL4、PD4板的告警与线路板类似,参见教材)(1) TU-AIS告警:VC-12和TU-12指针全部为“1”。
一般由线路板、交叉板或支路板故障引起。
(2) LP-RDI告警:检测接收到的低阶通道开销字节V5(bit8)=1 。
一般是TU-AIS告警的对告。
(3) TU-LOP 告警:检测到TU指针V1、V2字节非法。
一般在下时隙配置或新增时隙配置时发生时隙冲突。
(4) T-ALOS 告警:2M模拟信号丢失,一般是未上交换业务或DDF架2M线接触不良,是最常见的告警。
(5) PS告警:保护倒换告警。
若支路板设置为保护方式,可发生此告警。
一般发生在通道环上。
(6) E1-AIS告警:输入的2M信号全为“1”。
3. 交叉时钟板: XCS板(7) PS告警:复用段保护倒换告警。
(8) syn-loss告警:当前跟踪的时钟源丢失。
如由于光纤断引起的跟踪上游时钟源丢失。
4. 主控板:SCC板(9) WRG-BDTYPE告警:配置错误告警。
如单板板位实际插的板与该板位定义的类型不符合。
如公务板位定义为OHP类型,实际所插板为OHP2板。
(10) APS-INDI告警:保护倒换指示告警,复用段环倒换时,断纤两侧站点SCC板均产生此告警。
5.1 告警列表5.1.1 AU-AIS项目描述告警名称AU-AIS英文名称AU alarm indication signal中文名称AU告警指示告警级别主要告警分类通信告警告警指示单板告警灯每隔一秒闪烁两次告警原因(1)由MS-AIS、R-LOS、R-LOF告警引发相应VC4通道的AU-AIS告警;(2)业务配置错误;(3)对端站发送AU-AIS;(4)对端站发送部分故障;(5)本站接收部分故障。
处理方法(1)由本站MS-AIS、R-LOS、R-LOF等告警引发的相应VC4通道的AU-AIS告警,检查方法可通过对MS-AIS、R-LOS、R-LOF的分析来定位故障;(2)还有一个可能原因是相应VC4通道的业务有收发错开的现象,导致收端在相应通道上出现AU-AIS告警,在这种情况下,该AU-4中相应的TU上也会伴随出现TU-AIS告警。
这时,请检查出现AU-AIS的站和它的互通业务站,以及中间业务穿通站的业务时隙配置是否错误;(3)更换对端站对应的交叉板和线路板;(4)更换本站的线路板和交叉板。
5.1.2 AU-LOP项目描述告警名称AU-LOP英文名称AU Loss of Pointer中文名称AU指针丢失告警级别主要告警分类通信告警告警指示单板告警灯每隔一秒闪烁两次告警原因(1)对端站发送部分故障;(2)对端站业务配置错误;(3)本站接收误码过大。
处理方法(1)检查对端站及本站业务配置是否正确,如果不正确,重新配置业务;(2)对于155M光接口板一般无此故障,若有的话多为此光板配置有误。
而622M和2500M光接口板接收到AU-LOP告警,应检查对方时钟板是否正常工作、交叉板是否检测到了时钟;(3)如业务为140M业务,检查业务是否正确接入;(4)依次更换对端站对应的交叉板和线路板,定位故障点;(5)更换本站的线路板和交叉板。
备注5.1.3 B1-EXC项目描述告警名称B1-EXC英文名称Regenerator section(B1) excessive errors中文名称再生段(B1)误码过量告警级别次要告警分类服务质量告警告警指示单板告警灯每隔一秒闪烁一次告警原因(1)接收信号衰减偏大;(2)对端站发送部分故障;(3)光纤头不清洁或连接器不正确;(4)本站接收部分故障。
处理方法(1)检查接收光功率是否正常。
如过低,应先检查光缆是否完好,光接头是否清洁及对端光板的发光功率是否正常;(2)在本站自环,如误码消除则是对端光板故障,更换故障单板;如误码增加,则说明本站光板故障,更换单板;(3)工作温度是否过高;(4)如无以上情况,更换故障单板。
备注光板自环时,会影响业务。
5.1.4 B2-EXC项目描述告警名称B2-EXC英文名称Multiplex section(B2) excessive errors中文名称复用段(B2)误码过量告警级别紧急告警分类服务质量告警告警指示单板告警灯每隔一秒闪烁三次告警原因(1)接收信号衰减偏大;(2)光纤头不清洁或光纤连接器不正确;(3)对端站发送部分故障;(4)本站接收部分故障;(5)B1误码引起的。
处理方法(1)如果同时出现B1误码,则应首先解决B1误码;(2)如果只有B2误码,一般是光接口板坏,更换单板;(3)检查设备工作温度是否过高;(4)如无以上情况,更换故障单板。
备注5.1.5 B3-EXC项目描述告警名称B3-EXC英文名称High order path(B3) excessive errors中文名称高阶通道(B3)误码过量告警级别主要告警分类服务质量告警告警指示单板告警灯每隔一秒闪烁两次告警原因(1)接收信号衰减偏大;(2)光纤头不清洁或光纤连接器不正确;(3)对端站发送部分故障;(4)本站接收部分故障;(5) B1、B2误码引起。
处理方法(1)如同时出现B1、B2误码,应先处理B1、B2;(2)如果只有B3误码,一般是光接口板坏,更换单板;(4)检查设备工作温度是否过高;(5)如无以上情况,更换故障单板。
备注5.1.6 FAN-FAIL项目描述告警名称FAN-FAIL英文名称Fan failed中文名称风扇故障告警级别主要告警分类设备告警告警指示单板告警灯每隔一秒闪烁两次告警原因(1)风扇未开;(2)风扇失效。
处理方法(1)检查风扇子架的电源开关是否打开,如没有则打开;(2)检查风扇子架到主子架的电缆连接是否完好;(3)检查风扇工作是否正常。
备注5.1.7 HP-LOM项目描述告警名称HP-LOM英文名称High order path loss of multiframe中文名称高阶通道复帧丢失告警级别主要告警分类通信告警告警指示单板告警灯每隔一秒闪烁两次告警原因(1)业务配置错误;(2) H4字节丢失或不正确。
处理方法(1)多由对端站问题引起,常见原因是对方交叉板故障,或C2字节收/发失配;(2)首先检查对端站及本站业务配置,如配置错误,修改并重新下发配置;(3)检查对端板总线选择是否正确,是否有T-LOS告警,交叉板与线路板是否有故障,可通过光路自环检查对端站是否有硬件故障,如果确定是对端站的故障,顺序更换对端站交叉板、线路板、检查对端站子架;(4)光路自环检查本站是否有故障,更换故障单板。
备注5.1.8 HP-RDI项目描述告警名称HP-RDI英文名称High order path remote defect indication中文名称高阶通道远端接收失效指示告警级别次要告警分类通信告警告警指示单板告警灯每隔一秒闪烁一次告警原因(1)对端站接收到AU-AIS/AU-LOP等告警信号;(2)对端站接收部分故障;(3)本站发送部分故障。
处理方法(1)出现此告警时依据告警流程图检查设备是否有高阶告警,若有,分析高阶告警的原因;(2)检查对端站线路板相应通道是否有AU-AIS、AU-LOP告警,如有则对其进行处理,处理结束后HP-RDI 告警应结束;(3)如对端站没有告警或相应告警结束后HP-RDI告警仍不结束,则判断为单板故障,更换单板。
备注5.1.9 HP-REI项目描述告警名称HP-REI英文名称High order path remote error indication中文名称高阶通道远端误码指示告警级别提示告警分类服务质量告警告警指示单板告警灯不闪告警原因(1)对端站接收到B3误码。