FusionCompute运维故障处理指南
- 格式:pdf
- 大小:1.23 MB
- 文档页数:59
1 故障处理实验介绍1.1 故障处理概述1.1.1 什么是故障?故障是系统不能执行规定功能的状态。
通常而言,故障是指系统中部分元器件功能失效而导致整个系统功能恶化的事件。
设备的故障一般具有五个基本特征:层次性、传播性、放射性、延时性、不确定性等。
1.1.2 故障处理流程故障处理总体流程主要分为四个过程:故障信息收集、故障判断、故障定位、故障排除。
故障信息收集故障信息是故障处理的重要依据,系统维护人员应尽可能多的收集故障信息。
故障判断排除故障之前,系统维护人员根据收集的故障详细信息,对故障范围和类型进行判断。
故障定位故障定位是指从众多可能原因中找出故障原因的过程。
通过一定的方法或手段分析、比较各种可能的故障成因,不断排除非可能因素,最终确定故障发生的具体原因。
以下是故障定位的常用方法:•在管理界面查看告警信息•在管理界面查看监控信息是否正常•查询操作日志,分析操作过程是否有误•在管理界面检查数据配置是否正确•观察设备指示灯状态是否正常故障排除故障排除是指根据不同的故障原因清除故障的过程。
故障排除包括检修线路、修改配置数据、重启相关进程、重启服务器等。
确认故障是否被排除通过查询设备状态、查看设备指示灯和告警等方法确认系统已正常运行,并进行相关业务调测以确保业务正常。
记录故障处理过程故障排除后应记录故障处理要点,给出针对此类故障的防范和改进措施,避免同类故障再次发生。
1.2 实验介绍1.2.1 关于本实验本实验主要介绍FusionCompute,FusionAccess,FusionStorage Block,FusionCloud故障处理,了解故障处理方法和故障处理流程,学习如何处理故障。
1.2.2 实验目的●理解故障处理的思路●掌握FusionCompute故障处理方法●掌握FusionAccess故障处理方法●掌握FusionStorage Block故障处理方法●掌握FusionCloud故障处理方法1.3 实验拓扑华为考试中心HCIE-Cloud实验环境由5台华为RH2288H V3服务器搭建而成,服务器之间使用1台华为S5700交换机进行连接。
一、登录系统时,显示页面为服务器的地址信息1、故障描述通过浏览器访问超融合一体机管理平台地址时,界面显示为服务器的HDM登录页面。
2、应对方案通过HDM口登录服务器管理页面(默认用户名:admin,默认密码:Password@_),点击“网络-专用网口-配置”,查看IPv4地址是否与平台地址冲突。
若冲突,请修改地址。
点击“网络-共享网口-配置”,查看IPv4地址是否与平台地址冲突,若冲突,修改IPv4地址,或去勾选“IPv4配置”项。
使用专用网口进行服务器管理。
二、区域配置不正确1.故障描述创建资产时,提示“区域配置不正确,资产创建失败”。
2.应对方案(1)检查资产信息配置是否存在错误,例如管理IP或名称与组内已有成员是否重复。
如果是资产管理IP、名称重复等错误,请根据提示修改相应配置信息。
(2)检查区域配置是否正确,确保区域配置IP范围在父区域范围内,查看是否存在其它错误,例如IP范围或名称与组内已有成员是否重复。
如果是区域IP范围、名称重复等错误,请根据提示修改相应配置信息。
(3)如果区域未配置,请按照区域配置步骤配置区域信息。
(4)如果上述操作完成后问题仍无法排除,请联系技术支持工程师。
三、管理IP不一致1、故障描述创建资产时,提示“创建失败,管理IP不一致”。
2、应对方案该问题是由于创建资产管理IP与区域IP范围不一致造成的。
解决方法如下:(1)检查资产管理IP是否超出区域IP范围,如果未超出,查看信息配置是否存在错误,例如管理IP或名称与组内已有成员是否重复。
如果是资产管理IP、名称重复等错误,请根据提示修改相应配置信息。
(2)检查区域配置是否正确,确保区域配置IP范围在父区域范围内,查看是否存在其它错误,例如IP范围或名称与组内已有成员是否重复。
如果是区域IP范围、名称重复等错误,请根据提示修改相应配置信息。
(3)如果上述操作完成后问题仍无法排除,请联系技术支持工程师。
四、资产发现失败1、故障描述创建拓扑任务后,自动发现资产功能失效,资产发现失败。
ManageOne FusionManager 运维平台故障处理指南故障处理目录目录前言 (ii)1概述 (1)1.1故障处理流程 (2)1.2故障分类 (3)2信息收集 (4)2.1基本故障信息收集 (5)2.2告警信息收集 (5)3管理节点故障 (6)3.1FusionManager 虚拟机故障 (7)4操作维护类故障 (10)4.1修改虚拟机IP 后虚拟机通信中断 (11)4.2修改管理IP 后登录FusionManager 异常 (12)4.3修改管理IP 后资源界面异常 (13)4.4修改管理IP 后资源使用情况界面异常 (14)4.5主机关联的数据存储异常 (15)5系统时间故障 (17)5.1系统时间错误 (18)A 附录 (20)A.1配置IE 浏览器 (21)A.2配置Firefox 浏览器 (22)A.3登录FusionManager (23)A.4查看告警 (24)B 术语 (26)B.1A-E (27)B.2F-J (28)B.3K-O (30)B.4 P-T (31)B.5 U-Z (32)1 概述关于本章1.1故障处理流程1.2故障分类1.1故障处理流程故障处理总体流程主要分为四个过程:故障信息收集、故障判断、故障定位、故障排除。
具体实施过程如图1-1所示。
说明故障信息收集处理重大故障前,请先联系技术支持处理。
图1-1 常见故障处理流程故障信息是故障处理的重要依据,系统维护人员应尽可能多的收集故障信息。
故障判断排除故障之前,系统维护人员根据收集的故障详细信息,对故障范围和类型进行判断。
故障定位故障定位是指从众多可能原因中找出故障原因的过程。
通过一定的方法或手段分析、比较各种可能的故障成因,不断排除非可能因素,最终确定故障发生的具体原因。
以下是故障定位的常用方法:●在管理界面查看告警信息●在管理界面查看监控信息是否正常●查询操作日志,分析操作过程是否有误●在管理界面检查数据配置是否正确●观察设备指示灯状态是否正常故障排除故障排除是指根据不同的故障原因清除故障的过程。
FusionCompute日常维护与故障处理介绍技术创新,变革未来⚫FusionCompute是华为云计算解决方案的基石,了解和掌握FusionCompute的日常维护和故障处理方法,可以更好的部署和维护企业云计算环境。
通过本章学习,您将能够掌握FusionCompute系统的日常运维能力。
⚫学完本课程后,您将能够:⚫描述日常维护操作⚫区分FusionCompute告警⚫分析常见故障处理步骤⚫描述FusionCompute常见故障处理方法1.维护管理◼日常监控☐配置管理☐用户管理☐FusionCompute备份与恢复2.故障管理日常维护操作⚫为了保证系统长期正常、稳定的运行,维护工程师需要定期对系统进行检查,并根据检查出的异常结果排除故障。
维护项目检查项正常状态维护周期查看系统告警FusionCompute 上的告警无新增告警每天检查FusionCompute 健康状态健康检查报告无“不合格”检查项每天检查设备运行状态服务器、交换机和存储设备的指示灯状态指示灯显示正常每天检查设备运行环境温湿度符合运行环境对温度和湿度的要求。
每周空气质量符合运行环境对空气质量的要求每周防尘情况无明显尘土附着每周查看预警整改公告“/enterpr ise”,选择“公告>产品公告>预警公告>IT >云计算数据中心>FusionSphere >FusionSphere”,查看预警整改公告。
满足预警通知的要求每月查看告警告警级别图标说明紧急已经影响业务、需要立即采取纠正措施的告警为紧急告警。
重要已经影响业务,如果不及时处理会产生较为严重后果的告警为重要告警。
次要目前对业务没有影响,但需要采取纠正措施,以防止更为严重的故障的发生,这种情况下的告警为次要告警。
提示检测到潜在的或即将发生的影响业务的故障,但是目前对业务还没有影响,这种情况下的告警为提示告警。
实时监控⚫管理员可以查看集群、主机以及虚拟机的监控信息,以便于了解集群在指定时间段内的运行状态目录1.维护管理☐日常监控◼配置管理☐用户管理☐FusionCompute备份与恢复2.故障管理⚫管理员可以根据业务需求对FusionCompute系统配置参数作出调整。
FusionCompute云计算平台故障处理指南目录前言 (ii)1概述 (1)1.1故障处理流程 (2)1.2故障分类 (3)2信息收集 (5)2.1基本故障信息收集 (6)2.2告警信息收集 (6)2.3事件信息收集 (8)2.4收集日志 (8)3常见故障处理 (11)3.1用户虚拟机故障 (12)3.1.1虚拟机蓝屏 (12)3.1.2SUSE 虚拟机网卡不可用 (14)3.1.3Ubuntu10.04 及以上版本操作系统中uvp-monitor 进程未启动 (18)3.1.4Windows Server 2003 虚拟机绑定USB 2.0 设备后,虚拟机黑屏或关机失败 (19)3.1.5SUSE 10 虚拟机不能正常使用USB 2.0 设备 (20)3.1.6重启或关闭主机网络服务后,主机网络异常 (21)3.1.7虚拟机同时绑定SCSI 磁盘和IDE 磁盘时无法正常启动 (22)3.1.8本地磁盘的ext4 文件系统损坏 (23)3.1.9虚拟机内存数值显示异常 (25)3.2管理节点故障 (26)3.2.1VRM 虚拟机故障 (26)3.2.2主机操作系统故障 (32)3.3操作维护类故障 (35)3.3.1登录界面时IE 浏览器异常 (36)3.3.2FusionComute 无法获取监控数据 (38)3.3.3修改虚拟机IP 后虚拟机通信中断 (40)3.3.4主机管理网络配置与交换机不匹配 (42)3.3.5异常掉电再上电后,任务长时间无响应 (43)3.3.6网络数据残留导致添加主机失败 (44)3.3.7仲裁IP 地址失效,导致Web 客户端无法登录 (46)故障处理目录3.4Tools 故障 (47)3.4.1Windows 下安装Tools 时弹出警告提示 (47)3.4.2Windows 下安装Tools 时异常中止 (48)4部件更换 (50)4.1部件更换策略 (51)4.2更换主机 (53)A 附录 (57)A.1使用ISO 方式安装VRM 虚拟机 (58)A.2清除FusionCompute 中本地硬盘的残留数据 (63)A.3配置FusionCompute 告警上报 (64)A.4配置单点登录 (66)A.5如何处理虚拟机网卡乱序问题 (67)A.6ISO 镜像方式安装主机 (68)A.7配置IE 浏览器 (76)A.8配置Firefox 浏览器 (79)A.9登录FusionCompute (80)A.10兼容性 (83)B 术语 (94)B.1A-E (95)B.2F-J (96)B.3K-O (97)B.4 P-T (98)B.5 U-Z (99)1 概述关于本章1.1故障处理流程1.2故障分类1.1故障处理流程故障处理总体流程主要分为四个过程:故障信息收集、故障判断、故障定位、故障排除。
FusionCompute云平台运维监控指南前言概述本文档针对FusionCompute系统,提供日常监控的操作指导,以便及时发现和处理系统中的潜在问题,确保系统正常运行。
读者对象本文档(本指南)主要适用于以下工程师:●技术支持工程师●维护工程师符号约定在本文中可能出现下列标志,它们所代表的含义如下。
目录前言 (ii)1告警监控 (1)1.1查看告警 (2)1.2手工清除告警 (3)1.3查看事件 (4)1.4查看告警统计 (4)2实时监控 (6)2.1监控集群 (7)2.2监控主机 (8)2.3监控虚拟机 (10)3自定义监控 (12)3.1查看单对象多指标监控 (13)3.2查看单指标多对象监控 (13)3.3查看TOP 统计结果 (14)4历史KPI 查询 (15)4.1查询单对象多指标数据 (16)4.2查询单指标多对象数据 (17)5设置自定义监控策略 (20)5.1设置单对象多指标监控策略 (21)5.2设置单指标多对象监控策略 (23)5.3设置TOP 统计策略 (24)A 附录 (26)A.1配置IE 浏览器 (27)A.2配置Firefox 浏览器 (30)A.3登录FusionCompute (30)B 术语 (35)B.1A-E (36)B.2F-J (37)B.3K-O (38)B.4 P-T (39)B.5 U-Z (40)1 告警监控关于本章1.1查看告警1.2手工清除告警1.3查看事件1.4查看告警统计1.1查看告警操作场景该任务指导维护工程师通过FusionCompute查看系统告警信息,以便及时发现和解决系统中存在的故障,保证系统的稳定运行。
必备事项前提条件已登录FusionCompute。
操作步骤查看告警1在FusionCompute中,选择“虚拟数据中心监控> 告警”。
进入“告警”页面。
单击FusionCompute界面右上角“告警统计”区域对应的告警个数,可进入“实时告警”页面,且告警列表中会根据告警级别搜索出相关告警信息。
FusionCompute 云计算平台告警处理指南目录前言 (ii)1站点告警 (1)1.1ALM-15.1000077 License 即将失效 (3)1.2ALM-15.1000078 License 已经失效 (4)1.3ALM-15.1001005 未加载license (6)1.4ALM-15.1002000 VRM 主备间节点心跳故障 (8)1.5ALM-15.1004000 License 文件无效 (14)1.6 ALM-15.1004003 MAC 即将不足 (16)1.7 ALM-15.1004004 级联VRM 通信异常 (17)1.8 ALM-15.1004300 VRM 节点内部模块数据不一致 (19)1.9 ALM-15.1007000 监控处理进程异常 (21)1.10 ALM-15.1007001 实时分析进程异常 (23)1.11 ALM-15.1007004 订阅通知进程异常 (25)1.12ALM-15.1007006 VRM 时钟同步进程异常 (27)1.13ALM-15.1007007 VRM 系统定时服务进程异常 (29)1.14ALM-15.1007009 VRM 与NTP 服务器心跳状态异常 (31)1.15ALM-15.1007010 VRM 系统时钟跳变超过一分钟 (35)1.16ALM-15.1007011 配置通道客户端进程异常 (37)1.17 ALM-15.1007017 双机备份进程异常 (39)1.18ALM-15.1007019 VRM 未配置NTP 时钟源 (44)1.19ALM-15.1007099 VRM 备份或上传关键数据失败 (46)1.20ALM-15.1008000 与License Server 通信异常 (48)1.21 ALM-15.1008001 专享升级服务即将到期 (50)1.22 ALM-15.1008002 专享升级服务已经到期 (51)1.23 ALM-15.3002005 主机CPU 数超过许可90% (53)2集群告警 (56)2.1ALM-15.1000025 集群CPU 占用率超过阈值 (57)2.2ALM-15.1000026 集群内存占用率超过阈值 (58)2.3ALM-15.1000027 集群网络流出占用率超过阈值 (60)2.4ALM-15.1000028 集群网络流入占用率超过阈值 (62)2.5 ALM-15.1004006 集群HA 资源即将不足 (65)3主机告警 (67)3.1 ALM-10.1000027 主机与VRM 心跳异常 (69)3.2 ALM-15.1000020 内存预留率超过阈值 (72)3.3ALM-15.1000024 主机网络流入占用率超过阈值 (74)3.4ALM-15.1000032 主机CPU 占用率超过阈值 (76)3.5ALM-15.1000033 主机内存占用率超过阈值 (78)3.6ALM-15.1000034 主机网络流出占用率超过阈值 (80)3.7ALM-15.1000036 主机逻辑磁盘占用率超过阈值 (82)3.8 ALM-15.1000204 主机网口状态异常 (85)3.9ALM-15.1002006 主机与NTP 服务器心跳状态异常 (90)3.10ALM-15.1002018 CNA 节点弹性计算业务进程异常 (94)3.11 ALM-15.1002032 主机时钟同步进程异常 (96)3.12 ALM-15.1002033 主机系统定时服务进程异常 (98)3.13 ALM-15.1002034 系统盘监控进程异常 (100)3.14 ALM-15.1004002 显卡异常消失 (102)3.15ALM-15.1004200 新扩容主机或者更换主机的版本低 (104)3.16ALM-15.1004500 主机物理内存不足,启动虚拟机失败 (106)3.17 ALM-15.1004502 系统存在未受控主机 (107)3.18ALM-15.1004503 主机CPU 能力不支持集群IMC 模式设置 (109)3.19ALM-15.1006001 网口自协商速率没有达到服务器网口的最大速率 (110)3.20 ALM-15.1006002 连接跟踪表将超过阈值 (114)3.21ALM-15.1006003 主机与VRM 网络配置数据不一致 (118)3.22ALM-15.1006004 主机与VRM 网络配置属性不一致 (120)3.23ALM-15.1006005 主机内部模块间网络配置数据不一致 (122)3.24ALM-15.1006006 主机的端口组属性配置异常 (124)3.25ALM-15.1006008 主机管理接口未配置网络冗余 (127)3.26 ALM-15.1006101 虚拟化管理数据异常 (128)3.27 ALM-15.1006102 虚拟化管理目录磁盘容量超过阈值 (130)3.28 ALM-15.1007002 性能监控进程异常 (132)3.29 ALM-15.1007005 主机系统时钟跳变超过一分钟 (134)3.30 ALM-15.1007018 主机未配置NTP 时钟源 (137)3.31ALM-15.1008005 主机管理域CPU 占用率超过阈值 (139)3.32ALM-15.1008006 主机管理域内存占用率超过阈值 (141)3.33ALM-15.1008007 主机虚拟化域CPU 占用率超过阈值 (144)3.34ALM-15.1008008 主机虚拟化域内存占用率超过阈值 (146)3.35 ALM-15.1009003 服务器日志上传失败 (148)3.36 ALM-15.1009004 服务器USB 盘写入失败 (150)3.37 ALM-15.1009005 文件系统只读 (153)3.38 ALM-15.1009006 物理网卡MTU 设置失败 (155)3.39 ALM-15.1009103 虚拟化内存复用压力过大 (157)告警处理目录4虚拟机告警 (160)4.1ALM-15.1000101 虚拟机CPU 占用率超过阈值 (161)4.2ALM-15.1000102 虚拟机内存占用率超过阈值 (163)4.3ALM-15.1000103 虚拟机磁盘占用率超过阈值 (165)4.4 ALM-15.1001012 系统存在未受控虚拟机 (167)4.5 ALM-15.1004005 虚拟机发生蓝屏故障 (169)4.6ALM-15.1004008 创建快照过程异常,虚拟机无法进行操作 (171)4.7ALM-15.1004009 虚拟机HA 时,资源不足导致启动失败 (172)4.8ALM-15.1004100 虚拟机更换内存交换卷失败,可能导致虚拟机异常 (174)4.9 ALM-15.1006000 虚拟机发生反复重启故障 (176)4.10 ALM-15.1006007 安全组虚拟机安全组规则未生效 (178)4.11 ALM-15.1006009 虚拟机网络配置未生效 (180)4.12 ALM-15.1009108 虚拟机虚拟磁盘异常 (183)5存储告警 (185)5.1 ALM-15.1005001 主机存储链路中断 (186)5.2 ALM-15.1005002 存储资源管理链路中断 (189)5.3 ALM-15.1005003 存储使用容量超过阈值 (192)5.4 ALM-15.1005004 主机关联的数据存储异常 (194)5.5 ALM-15.1005005 主机光纤通道中断 (198)1 站点告警关于本章1.1ALM-15.1000077 License即将失效1.2ALM-15.1000078 License已经失效1.3ALM-15.1001005 未加载license1.4ALM-15.1002000 VRM主备间节点心跳故障1.5ALM-15.1004000 License文件无效1.6 ALM-15.1004003 MAC即将不足1.7ALM-15.1004004 级联VRM通信异常1.8ALM-15.1004300 VRM节点内部模块数据不一致1.9ALM-15.1007000 监控处理进程异常1.10ALM-15.1007001 实时分析进程异常1.11ALM-15.1007004 订阅通知进程异常1.12ALM-15.1007006 VRM时钟同步进程异常1.13ALM-15.1007007 VRM系统定时服务进程异常1.14ALM-15.1007009 VRM与NTP服务器心跳状态异常1.15ALM-15.1007010 VRM系统时钟跳变超过一分钟1.16ALM-15.1007011 配置通道客户端进程异常1.17ALM-15.1007017 双机备份进程异常1.18ALM-15.1007019 VRM未配置NTP时钟源1.19ALM-15.1007099 VRM备份或上传关键数据失败1.20ALM-15.1008000 与License Server通信异常1.21ALM-15.1008001 专享升级服务即将到期1.22ALM-15.1008002 专享升级服务已经到期1.23 ALM-15.3002005 主机CPU数超过许可90%1.1ALM-15.1000077 License 即将失效告警解释告警模块按每天凌晨0点到2点校验一次License的周期检测License有效性,当检测到License过期天数小于60天,即License即将失效时,系统产生此告警。
FusionCompute云计算平台故障处理指南目录前言 (ii)1概述 (1)1.1故障处理流程 (2)1.2故障分类 (3)2信息收集 (5)2.1基本故障信息收集 (6)2.2告警信息收集 (6)2.3事件信息收集 (8)2.4收集日志 (8)3常见故障处理 (11)3.1用户虚拟机故障 (12)3.1.1虚拟机蓝屏 (12)3.1.2SUSE 虚拟机网卡不可用 (14)3.1.3Ubuntu10.04 及以上版本操作系统中uvp-monitor 进程未启动 (18)3.1.4Windows Server 2003 虚拟机绑定USB 2.0 设备后,虚拟机黑屏或关机失败 (19)3.1.5SUSE 10 虚拟机不能正常使用USB 2.0 设备 (20)3.1.6重启或关闭主机网络服务后,主机网络异常 (21)3.1.7虚拟机同时绑定SCSI 磁盘和IDE 磁盘时无法正常启动 (22)3.1.8本地磁盘的ext4 文件系统损坏 (23)3.1.9虚拟机内存数值显示异常 (25)3.2管理节点故障 (26)3.2.1VRM 虚拟机故障 (26)3.2.2主机操作系统故障 (32)3.3操作维护类故障 (35)3.3.1登录界面时IE 浏览器异常 (36)3.3.2FusionComute 无法获取监控数据 (38)3.3.3修改虚拟机IP 后虚拟机通信中断 (40)3.3.4主机管理网络配置与交换机不匹配 (42)3.3.5异常掉电再上电后,任务长时间无响应 (43)3.3.6网络数据残留导致添加主机失败 (44)3.3.7仲裁IP 地址失效,导致Web 客户端无法登录 (46)故障处理目录3.4Tools 故障 (47)3.4.1Windows 下安装Tools 时弹出警告提示 (47)3.4.2Windows 下安装Tools 时异常中止 (48)4部件更换 (50)4.1部件更换策略 (51)4.2更换主机 (53)A 附录 (57)A.1使用ISO 方式安装VRM 虚拟机 (58)A.2清除FusionCompute 中本地硬盘的残留数据 (63)A.3配置FusionCompute 告警上报 (64)A.4配置单点登录 (66)A.5如何处理虚拟机网卡乱序问题 (67)A.6ISO 镜像方式安装主机 (68)A.7配置IE 浏览器 (76)A.8配置Firefox 浏览器 (79)A.9登录FusionCompute (80)A.10兼容性 (83)B 术语 (94)B.1A-E (95)B.2F-J (96)B.3K-O (97)B.4 P-T (98)B.5 U-Z (99)1 概述关于本章1.1故障处理流程1.2故障分类1.1故障处理流程故障处理总体流程主要分为四个过程:故障信息收集、故障判断、故障定位、故障排除。
FusionCompute 云计算平台告警处理指南目录前言 (ii)1站点告警 (1)1.1ALM-15.1000077 License 即将失效 (3)1.2ALM-15.1000078 License 已经失效 (4)1.3ALM-15.1001005 未加载license (6)1.4ALM-15.1002000 VRM 主备间节点心跳故障 (8)1.5ALM-15.1004000 License 文件无效 (14)1.6 ALM-15.1004003 MAC 即将不足 (16)1.7 ALM-15.1004004 级联VRM 通信异常 (17)1.8 ALM-15.1004300 VRM 节点内部模块数据不一致 (19)1.9 ALM-15.1007000 监控处理进程异常 (21)1.10 ALM-15.1007001 实时分析进程异常 (23)1.11 ALM-15.1007004 订阅通知进程异常 (25)1.12ALM-15.1007006 VRM 时钟同步进程异常 (27)1.13ALM-15.1007007 VRM 系统定时服务进程异常 (29)1.14ALM-15.1007009 VRM 与NTP 服务器心跳状态异常 (31)1.15ALM-15.1007010 VRM 系统时钟跳变超过一分钟 (35)1.16ALM-15.1007011 配置通道客户端进程异常 (37)1.17 ALM-15.1007017 双机备份进程异常 (39)1.18ALM-15.1007019 VRM 未配置NTP 时钟源 (44)1.19ALM-15.1007099 VRM 备份或上传关键数据失败 (46)1.20ALM-15.1008000 与License Server 通信异常 (48)1.21 ALM-15.1008001 专享升级服务即将到期 (50)1.22 ALM-15.1008002 专享升级服务已经到期 (51)1.23 ALM-15.3002005 主机CPU 数超过许可90% (53)2集群告警 (56)2.1ALM-15.1000025 集群CPU 占用率超过阈值 (57)2.2ALM-15.1000026 集群内存占用率超过阈值 (58)2.3ALM-15.1000027 集群网络流出占用率超过阈值 (60)2.4ALM-15.1000028 集群网络流入占用率超过阈值 (62)2.5 ALM-15.1004006 集群HA 资源即将不足 (65)3主机告警 (67)3.1 ALM-10.1000027 主机与VRM 心跳异常 (69)3.2 ALM-15.1000020 内存预留率超过阈值 (72)3.3ALM-15.1000024 主机网络流入占用率超过阈值 (74)3.4ALM-15.1000032 主机CPU 占用率超过阈值 (76)3.5ALM-15.1000033 主机内存占用率超过阈值 (78)3.6ALM-15.1000034 主机网络流出占用率超过阈值 (80)3.7ALM-15.1000036 主机逻辑磁盘占用率超过阈值 (82)3.8 ALM-15.1000204 主机网口状态异常 (85)3.9ALM-15.1002006 主机与NTP 服务器心跳状态异常 (90)3.10ALM-15.1002018 CNA 节点弹性计算业务进程异常 (94)3.11 ALM-15.1002032 主机时钟同步进程异常 (96)3.12 ALM-15.1002033 主机系统定时服务进程异常 (98)3.13 ALM-15.1002034 系统盘监控进程异常 (100)3.14 ALM-15.1004002 显卡异常消失 (102)3.15ALM-15.1004200 新扩容主机或者更换主机的版本低 (104)3.16ALM-15.1004500 主机物理内存不足,启动虚拟机失败 (106)3.17 ALM-15.1004502 系统存在未受控主机 (107)3.18ALM-15.1004503 主机CPU 能力不支持集群IMC 模式设置 (109)3.19ALM-15.1006001 网口自协商速率没有达到服务器网口的最大速率 (110)3.20 ALM-15.1006002 连接跟踪表将超过阈值 (114)3.21ALM-15.1006003 主机与VRM 网络配置数据不一致 (118)3.22ALM-15.1006004 主机与VRM 网络配置属性不一致 (120)3.23ALM-15.1006005 主机内部模块间网络配置数据不一致 (122)3.24ALM-15.1006006 主机的端口组属性配置异常 (124)3.25ALM-15.1006008 主机管理接口未配置网络冗余 (127)3.26 ALM-15.1006101 虚拟化管理数据异常 (128)3.27 ALM-15.1006102 虚拟化管理目录磁盘容量超过阈值 (130)3.28 ALM-15.1007002 性能监控进程异常 (132)3.29 ALM-15.1007005 主机系统时钟跳变超过一分钟 (134)3.30 ALM-15.1007018 主机未配置NTP 时钟源 (137)3.31ALM-15.1008005 主机管理域CPU 占用率超过阈值 (139)3.32ALM-15.1008006 主机管理域内存占用率超过阈值 (141)3.33ALM-15.1008007 主机虚拟化域CPU 占用率超过阈值 (144)3.34ALM-15.1008008 主机虚拟化域内存占用率超过阈值 (146)3.35 ALM-15.1009003 服务器日志上传失败 (148)3.36 ALM-15.1009004 服务器USB 盘写入失败 (150)3.37 ALM-15.1009005 文件系统只读 (153)3.38 ALM-15.1009006 物理网卡MTU 设置失败 (155)3.39 ALM-15.1009103 虚拟化内存复用压力过大 (157)告警处理目录4虚拟机告警 (160)4.1ALM-15.1000101 虚拟机CPU 占用率超过阈值 (161)4.2ALM-15.1000102 虚拟机内存占用率超过阈值 (163)4.3ALM-15.1000103 虚拟机磁盘占用率超过阈值 (165)4.4 ALM-15.1001012 系统存在未受控虚拟机 (167)4.5 ALM-15.1004005 虚拟机发生蓝屏故障 (169)4.6ALM-15.1004008 创建快照过程异常,虚拟机无法进行操作 (171)4.7ALM-15.1004009 虚拟机HA 时,资源不足导致启动失败 (172)4.8ALM-15.1004100 虚拟机更换内存交换卷失败,可能导致虚拟机异常 (174)4.9 ALM-15.1006000 虚拟机发生反复重启故障 (176)4.10 ALM-15.1006007 安全组虚拟机安全组规则未生效 (178)4.11 ALM-15.1006009 虚拟机网络配置未生效 (180)4.12 ALM-15.1009108 虚拟机虚拟磁盘异常 (183)5存储告警 (185)5.1 ALM-15.1005001 主机存储链路中断 (186)5.2 ALM-15.1005002 存储资源管理链路中断 (189)5.3 ALM-15.1005003 存储使用容量超过阈值 (192)5.4 ALM-15.1005004 主机关联的数据存储异常 (194)5.5 ALM-15.1005005 主机光纤通道中断 (198)1 站点告警关于本章1.1ALM-15.1000077 License即将失效1.2ALM-15.1000078 License已经失效1.3ALM-15.1001005 未加载license1.4ALM-15.1002000 VRM主备间节点心跳故障1.5ALM-15.1004000 License文件无效1.6 ALM-15.1004003 MAC即将不足1.7ALM-15.1004004 级联VRM通信异常1.8ALM-15.1004300 VRM节点内部模块数据不一致1.9ALM-15.1007000 监控处理进程异常1.10ALM-15.1007001 实时分析进程异常1.11ALM-15.1007004 订阅通知进程异常1.12ALM-15.1007006 VRM时钟同步进程异常1.13ALM-15.1007007 VRM系统定时服务进程异常1.14ALM-15.1007009 VRM与NTP服务器心跳状态异常1.15ALM-15.1007010 VRM系统时钟跳变超过一分钟1.16ALM-15.1007011 配置通道客户端进程异常1.17ALM-15.1007017 双机备份进程异常1.18ALM-15.1007019 VRM未配置NTP时钟源1.19ALM-15.1007099 VRM备份或上传关键数据失败1.20ALM-15.1008000 与License Server通信异常1.21ALM-15.1008001 专享升级服务即将到期1.22ALM-15.1008002 专享升级服务已经到期1.23 ALM-15.3002005 主机CPU数超过许可90%1.1ALM-15.1000077 License 即将失效告警解释告警模块按每天凌晨0点到2点校验一次License的周期检测License有效性,当检测到License过期天数小于60天,即License即将失效时,系统产生此告警。
一.OLT-上联(同一台OLT下用户故障)联系网管,协助网管一起处理●OLT上联口亮检查OLT至ODF架光纤跳线检查光衰协同网管和相关抢修队处理●OLT上联口不亮检查OLT至ODF架光纤跳线检查光衰协同网管和相关抢修队处理二.ONU-OLT(同一OLT PON口下用户故障)联系网管,协助网管一起处理●ONU PON口亮检查ONU是否注册检查光衰协同网管和相关抢修队处理●ONU PON口不亮检查ONU与OLT的连接是否正确联系网管,更换PON口更换分光器检查光衰协助网管和抢修队处理三.用户端-ONU(同一ONU或交换机下用户故障)1.用户上联端口亮●交换机上联端口不亮。
检查交换机至ONU连接是否正确。
更换交换机上联端口更换交换机对应的ONU端口检查交换机配置更换交换机至ONU的网线更换交换机更换ONU●交换机上联端口亮检查交换机至ONU网线检查交换机端口状态和配置检查ONU端口状态和配置更换交换机更换ONU2.用户上联端口不亮。
●检查用户电脑网卡至交换机连接是否正确;●更换上联端口●更换网线●更换上联设备四.用户端1.用户电脑问题●错误代码630 ,提示没有合适的网卡或驱动错误原因:硬件错误,可能是网卡损坏或网卡驱动失效造成,或者未安装网卡解决方法:检查网卡是否工作,网络线路是否插好,重新安装网卡驱动程序并确定网卡工作正常。
●错误650 问题:远程计算机没有响应,断开连接原因:网卡故障,非正常关机造成网络协议出错解决:检查网卡,删除所有网络组件重新安装网络。
●错误678 问题:远程计算机没有应答原因:出现此类现象原因很多,主要是硬件没有正确连接。
解决:检查连接是否正确●错误769 :无法连接到指定目标。
问题:这是指你电脑的网络设备有问题解决方法:打开“我的电脑”→“控制面版”→“网络连接”,查看本地连接的是否处在“禁用”状态,是的话只需双击本地连接,看到状态变为“已启用”即可。
若是连本地连接都没有的话,重装网卡驱动,如仍未解决,更换网卡。