中国铁塔运维监控系统(二期)全国培训材料——电子运维
- 格式:doc
- 大小:9.44 MB
- 文档页数:65
运维监控系统【⒈系统概述】本章节主要介绍运维监控系统的概要信息,包括系统的目标、功能和特点等内容。
【⒉系统架构】本章节详细描述运维监控系统的整体架构,包括各个组件、模块和技术栈的组成,并展示它们之间的关系和交互。
【⒊系统模块】本章节罗列出运维监控系统的所有模块,每个模块包括功能描述、输入输出接口、依赖关系等详细信息。
【⑴数据采集模块】本节详细介绍数据采集模块,包括数据采集的对象、采集方式、数据格式等内容。
【⑵数据存储模块】本节详细介绍数据存储模块,包括存储方式、数据结构、数据清洗和去重等操作。
【⑶数据处理模块】本节详细介绍数据处理模块,包括数据预处理、特征提取、数据分析等操作。
【⑷告警模块】本节详细介绍告警模块,包括告警策略、告警通知方式、告警处理流程等内容。
【⑸可视化模块】本节详细介绍可视化模块,包括图表展示、数据查询、报表等功能。
【⒋系统部署与配置】本章节详细描述运维监控系统的部署和配置要求,包括硬件需求、软件依赖、环境准备等内容。
【⒌用户手册】本章节为运维监控系统的用户提供详细的操作手册和教程,包括系统使用、配置和常见问题解答等内容。
【附件】⒈数据采集模块接口文档⒉数据存储模块配置文件示例⒊告警模块示例规则配置【法律名词及注释】⒈版权:指对创作的文学、艺术和科学作品享有的某种特权,并授予他人使用此作品的限定权利。
⒉专利:指为保护发明者在技术领域的创新,国家授予给其专利权,使其在一定期限内对该技术享有独占权利。
⒊商标:指用以区别特定商品或服务的标志,如标识、符号、名称或装潢,以及一系列的声音、颜色和形状等。
运维监控系统培训在当今数字化的时代,企业的信息技术系统变得越来越复杂,运维监控系统成为了保障业务稳定运行的关键工具。
运维监控系统能够实时监测系统的运行状态、及时发现问题并发出警报,帮助运维人员迅速采取措施解决问题,从而减少业务中断的风险,提高系统的可用性和可靠性。
为了让相关人员更好地掌握和运用运维监控系统,进行专业的培训是十分必要的。
一、运维监控系统的重要性运维监控系统就像是企业信息技术系统的“眼睛”和“耳朵”,它能够实时感知系统的运行状况,收集各种性能数据、日志信息等。
通过对这些数据的分析和处理,运维人员可以提前发现潜在的问题,例如服务器的负载过高、网络延迟增大、存储空间不足等。
在问题还没有严重影响业务之前,就能够采取有效的措施进行解决,避免了故障的发生。
此外,当系统出现故障时,运维监控系统能够快速定位问题的所在,提供详细的故障信息,帮助运维人员迅速诊断和解决问题,缩短了故障恢复的时间,减少了业务损失。
同时,运维监控系统还可以对系统的性能进行长期的跟踪和分析,为系统的优化和升级提供依据,从而提高系统的整体性能和稳定性。
二、运维监控系统的功能和特点1、数据采集运维监控系统能够通过多种方式采集系统的各种数据,包括服务器的性能指标(如 CPU 使用率、内存使用率、磁盘 I/O 等)、网络设备的状态信息、应用程序的日志等。
2、实时监测对采集到的数据进行实时分析和处理,以直观的方式展示系统的运行状态,如仪表盘、图表等,让运维人员能够快速了解系统的整体情况。
3、警报通知当系统的某些指标超过预设的阈值或者出现异常情况时,能够及时通过邮件、短信、即时通讯等方式向运维人员发送警报通知,确保问题能够得到及时处理。
4、故障诊断提供详细的故障信息和诊断工具,帮助运维人员快速定位和分析问题的原因。
5、性能分析对系统的性能数据进行长期的存储和分析,生成性能报告,为系统的优化和升级提供依据。
三、运维监控系统的常见类型1、基于主机的监控系统主要关注服务器的性能和状态,包括操作系统的资源使用情况、进程运行情况等。
运维培训计划培训记录内容时间:2022年6月1日-6月30日地点:公司培训中心培训目的:提高运维人员的技能水平,加强团队协作能力,提高运维工作效率和质量。
培训内容:第一周(6月1日-6月7日)1. 网络基础知识培训- 网络拓扑结构- 网络设备及其功能- TCP/IP协议- 子网划分与路由配置2. Linux操作系统基础- Linux系统架构- 基本的Linux命令- 文件和目录权限管理- 系统管理和维护3. 应用软件部署与配置- Tomcat、Nginx等常用web服务器的安装与配置- MySQL、Redis等数据库的安装和配置- Jenkins、Docker等常用工具的安装和使用第二周(6月8日-6月14日)1. Shell脚本编程- Shell脚本的基本语法- Shell脚本的编写和调试- 常见的Shell脚本应用场景2. 系统性能调优与故障排查- 系统性能监控工具的使用- 系统性能优化技巧- 故障排查和故障处理的方法和流程3. 安全管理与漏洞修复- 常见的安全漏洞和攻击方式- 安全防护措施的实施- 漏洞修复和安全补丁的应用第三周(6月15日-6月21日)1. 自动化运维工具介绍- Ansible、SaltStack等自动化运维工具的使用 - 自动化部署和配置管理的实践2. 高可用架构设计与实现- 高可用集群架构的设计原则- Keepalived、Pacemaker等高可用方案的实践 - 数据备份和恢复策略3. 系统监控与告警- Zabbix、Nagios等监控工具的使用- 告警规则的制定和调整- 监控系统的性能优化第四周(6月22日-6月30日)1. 备份与恢复- 数据备份的设计和实施- 数据恢复的方法和流程- 备份策略和周期的制定2. 项目实战演练- 将所学知识应用到实际的项目中- 解决真实的运维问题- 总结和分享项目实践经验3. 结业考核与总结- 考核内容包括理论知识和项目实践- 对培训过程进行总结和反馈- 针对培训过程中的不足和问题进行改进和提升以上是整个运维培训的详细内容和安排,希望各位同学能够认真学习,掌握好每一项知识和技能。
中国铁塔培训资料中国铁塔是国内最大的通信塔基础设施服务提供商之一,致力于为通信运营商提供全方位的塔基础设施服务。
为了提高员工的业务能力和专业知识,中国铁塔经常举办内部培训。
本培训资料将介绍中国铁塔的培训内容和培训方法,旨在帮助员工更好地理解中国铁塔的业务,并提高工作效率和服务质量。
一、培训内容1. 通信行业概述a. 通信行业的发展历程和现状b. 通信网络的基本组成和功能c. 通信行业的发展趋势和前景2. 中国铁塔公司介绍a. 公司的背景和发展历程b. 公司的主要业务和服务范围c. 公司的组织结构和运营模式3. 通信塔基础设施的构成与运维a. 通信塔的种类和功能b. 通信塔的基础设施组成和构造c. 通信塔的运维流程和安全管理4. 业务流程与工作流程a. 业务流程的概念和作用b. 工作流程的设计与改进c. 业务流程管理的重要性和方法5. 客户服务与沟通技巧a. 客户服务的基本原则和方法b. 沟通技巧的要点和技巧c. 解决客户问题的方法和策略二、培训方法1. 理论知识讲解员工将通过专家讲师的授课来学习通信行业的相关知识和中国铁塔公司的业务。
讲师将借助幻灯片、视频等多媒体工具进行知识讲解,以帮助员工更好地理解和消化所学知识。
2. 实际操作演练在培训过程中,员工将有机会进行实际操作演练,例如了解通信塔的构造和运维流程,学习如何进行业务流程管理等。
通过实际操作演练,员工能够更加深入地理解和掌握相关技能。
3. 学习小组讨论培训过程中,员工还将组成学习小组,进行讨论和交流。
通过小组讨论,员工可以互相借鉴和学习,加深对知识的理解,并提高解决问题的能力。
4. 考核评估培训结束后,员工将进行考核评估。
考核形式包括笔试、实际操作等,旨在检验员工对中国铁塔业务和知识的掌握程度,并发现问题和不足之处,进一步提高培训效果。
三、总结通过培训,中国铁塔的员工能够全面了解通信行业的发展和中国铁塔公司的业务,掌握通信塔基础设施的构成和运维方法,提高业务流程管理和客户服务的能力。
中国铁塔运维监控系统(二期)全国培训材料——电子运维运维监控项目组2015-10-19目录一、账号权限配置 (5)1、各省管理员账号 (5)2、新增账号 (6)2.1、新增代维账号 (7)2.2、新增铁塔账号 (8)3、权限配置 (10)4、优化改进点 (11)4.1、增加人员信息导出 (11)4.2、领导类型位置变更 (12)4.3、默认角色权限组优化(待执行) (12)4.4、自定义本省权限组 (13)5、常见问题 (14)5.1、密码修改 (14)5.2、账号删除 (15)5.3、个性化主题设置 (15)二、站址管理................................................. 错误!未定义书签。
1、查询条件优化 (16)2、包站人配置变更记录 (16)3、工单预警提醒配置 (17)4、维修态的设置及恢复 (17)5、新增属性字段 (18)三、运维管理优化 (18)1、查询界面优化 (18)2、新增多站址组合查询 (19)3、工单导出容丰富 (20)四、故障处理流程 (21)1、故障处理流程说明 (21)2、维修态告警、工单屏蔽机制 (21)3、延迟派单机制 (22)4、工单压缩机制 (22)5、新增到站签到操作 (23)6、回单时免责条款加载 (23)7、工单详情界面优化 (25)8、工单预警“三步曲” (25)8.1、单站预警规则 (25)8.2、区域预警规则 (26)8.3、重大故障升级预警规则 (26)五、停电故障流程(发电子流程) (26)1、停电故障处理流程说明 (26)2、发电判断界面优化 (27)3、发电等待过程说明 (27)4、回单界面填写容完善 (28)六、室分故障处理流程 (28)1、菜单位置 (28)2、室分故障流程图 (30)3、故障受理 (31)4、工单界面 (31)5、故障定位 (32)6、回单环节 (32)七、出入站管理流程 (33)1、菜单位置 (33)2、出入站流程图 (34)3、进站通知(申请) (34)4、协调上站 (35)5、到站签到 (36)6、回单 (36)7、及时上站判断 (37)8、结果协调 (37)9、最终确认 (38)10、其它2大流程 (38)八、定位应用 (39)1、人员定位 (39)2、工单调度 (39)3、巡检人员轨迹 (41)九、代维管理(基础管理) (41)1、代维公司基本信息管理 (41)2、公司资质信息管理 (42)3、代维人员管理 (42)4、工具仪表配置管理 (42)5、油机配置管理 (43)6、车辆配置管理 (43)7、代维合同基础信息录入 (43)8、代维业务联系函管理 (44)9、代维配置信息管理 (44)10、工具仪表配置情况管理 (44)11、车辆配置情况管理 (45)十、报表指标 (45)1、资源报表 (45)1.1、站址信息配置情况统计表 (45)1.2、站址信息配置不全清单 (46)2、网络-告警报表 (46)3、网络-工单报表 (46)3.1、故障工单处理情况统计表 (46)3.2、故障工单分类统计表 (47)4、网络-质量报表 (47)4.1、网管监控建设及运行情况统计表 (47)4.2、上线FSU站址监控情况统计表 (48)4.3、运维指标统计表 (48)5、网络-FSU报表 (48)6、客户服务报表 (49)1、断电退服时长指标 (49)2、断电退服时长站址明细表 (50)3、断电退服时长告警明细表 (50)4、室分故障指标 (51)5、室分故障恢复时长站址明细表 (51)6、室分故障恢复时长工单明细表 (52)7、紧急上站成功率指标 (52)8、紧急上站成功率站址明细表 (53)9、紧急维修上站成功率工单明细表 (53)10、发电及时率 (54)11、油机发电时长 (54)7、运营类报表(部使用) (54)十一、网管能力开放 (55)1、运营商账号配置 (55)1.1、新增运营商账号 (55)1.2、运营商权限配置 (56)2、客户网管 (57)2.1、拓扑图展示 (57)2.2、站址查询 (58)2.3、告警查询 (58)2.4、性能查询 (58)2.5、工单查询 (59)3、运营商APP (59)3.1、APP下载 (59)3.2、APP登录 (60)3.3、出入站管理 (61)4、与运营商系统维护对接情况 (63)十二、下阶段关键需求 (64)1、工单管控 (64)2、巡检管控 (64)3、运维调度单 (64)一、账号权限配置1、各省管理员账号系统为每个省设置了一个省级系统管理员账号,如下图,账号已经下发到各省,日常使用中遇到问题请优先联系各省管理员进行处理解决。
通过此账号,省里面可以自定义新账号以及分配角色权限,如果分配了告警或工单的权限,那么各账号默认只能查看到当前组织机构围的告警或工单等信息,不能跨区或跨省查询。
管理员NX管理员XJ管理员XZ2、新增账号在导航菜单找到下图中的图标单击,弹出此部分包含的模块,选择常用图标单击,弹出组织管理模块。
图组织管理导航菜单点击组织管理图标进入组织管理模块。
图组织管理界面查询点击右边侧边栏的可以在侧边栏的下半部分看到该部门下所有的账户记录。
也可以通过来查找对应的部门和人员。
图组织管理查询界面2.1、新增代维账号点击右边侧边栏中用户的超跳转到用户账号管理,点击可以维护该账号的用户名、登录账号以及用户的基本信息。
可重置该账号的登录密码。
图系统用户管理界面新增代维用户:在右边部门组织机构树上,选择一个部门,右键点击“新增用户”,进入用户新增界面,填写完基本信息,点击“保存”完成用户新增。
图系统用户新增界面注意:此处一般用来维护代维人员的账号信息,”用户类型”属性中要选择“代维人员”,“领导类型”中选择“地市-现场维护人员(包站人)”,同时为避免代维员工的账号和铁塔用户账号冲突,建议各省市在配置代维人员账号时,增加前缀(DW_ or DW- 或其它)以示区分。
2.2、新增铁塔账号如果是铁塔员工,需要创建运维监控系统的用户账号,按照上面的模式来操作,可以正常登陆并使用运维监控系统,但通过OA门户进行单点登录时会有问题,提示“账号未授权,联系管理员”之类的话语,因此建议新增铁塔员工的账号时,通过4A系统进行维护,4A系统和我们运维监控系统之间已有接口,可自动实时同步账号,之后在运维监控系统中配置相关角色权限即可正常使用。
在4A系统中操作时,如出现“账号已存在”的提示,需要先修改或删除运维监控系统中的已有账号。
4A系统URL:123.126.34.146:7081/uap/login.jsp,登陆界面如下:登陆后首页如下:各省4A系统管理员如下,3、权限配置在用户信息界面中(点击““),点击“操作权限配置”TAB页,进入用户操作权限配置界面。
勾选分配给用户的权限组或权限项,点击“保存”按钮即可。
图用户操作权限配置界面点击可以浏览该用户所具有的操作权限。
图用户操作权限浏览界面4、优化改进点4.1、增加人员信息导出点击机构,在“人员”tab页中,新增了“导出人员”功能,包括“导出本部门人员”和“导出本部门及下级部门人员”操作。
4.2、领导类型位置变更(考试)“领导类型”属性字段位置的变更:从“部门人员”处移动到了“人员基本信息”,便于在账号配置时一次性完成,提高效率。
另外类型为“地市-现场维护人员(包站人)”和“地市-区域经理”时,系统会进行特殊数据权限限制,会限制其只能查看所关联站址的相关信息。
4.3、默认角色权限组优化(待执行)以人员类型为维度,新增“地市-现场维护人员”、“地市-区域经理”、“地市-维护中心”、“省/市建维部“、”省/市领导“、”省/市管理员“、”总部-响应中心“、”总部-建维部“、”总部-领导“、”运营商“角色,各省配置人员权限时,便于对号入座。
同时又按照功能模块为维度,新增”资源管理(查询)“、”资源管理(操作)“、”网管监控(查询)“、”网管监控(操作)“、“运维管理(查询)”、“运维管理(操作)”、“报表查询”等角色,便于根据各省实际情况给指定人员额外多分配权限,以承担相应职责。
(系统会在后续根据人员的“领导类型”进行一次批量角色替换,同时会对替换后的旧角色组逐渐进行清理)。
4.4、自定义本省权限组为满足各省个性化控制权限需要,新增操作权限自定义功能,除总部默认制定的权限组之外,各省还可以根据本省实际情况需要,重新组合功能菜单形成本省的角色权限组,然后再对本省账号进行授权。
总部创建的权限组并且已分配给省的,省只能查看不可编辑;省自己创建的权限组可以进行编辑,并且在“组织管理”中选择人员后可以进行授权。
5、常见问题5.1、密码修改登陆后,请及时修改默认密码,加强密码的复杂程度,修改密码位置如下图:如果忘记密码,可以由管理员在“组织管理“中进行密码重置,重置后密码默认密码:5.2、账号删除账号删除系统中分为:逻辑删除和物理删除。
在“组织管理”菜单中点击右键的“删除用户”为逻辑删除,删除后还能在“基础数据处理”中进行恢复。
在“基础数据处理“菜单中的”彻底删除“为物理删除,删除后将不可恢复,需谨慎操作。
5.3、个性化主题设置有时在查询数据时,会出现有多页数据但分页按钮显示为灰色,误以为不能操作的情况,如下图:但其实是可以点击的,为避免这种情况,大家可以更换主题,选择一个新的主题后,点击下方“保存“按钮,刷新页面即可:账号权限配置1、查询条件优化新增了归属运营商、运营商是否安装设备、是否免责等查询条件,方便进行信息查找筛选。
2、包站人配置变更记录新增“机房(动环)维护人员配置记录”日志查询功能,便于在出现派错工单情况下分析是系统原因还是人为修改导致。
3、工单预警提醒配置根据各地实际情况不同,以站址为单位,对单站进行设置工单预警提醒,系统根据设置的时间点、人员、通报容信息进行自动推送通知,提高工单处理及时性。
此功能已上线使用了一段时间,近期又新增了批量设置功能以及加入“预警等级”属性。
设置该功能后,如站址产生了工单并且触发了配置的规则,那么会进行app提醒并在工单中记录提醒日志。
4、维修态的设置及恢复可以设置起止时间,到达时间后自动恢复,也可手工再次改成正常态。
5、新增属性字段前期新增了免责相关的属性,近期又新增“是否安装运营商设备”、“发电电压门限值”、“备电能力“等属性。
站址”导出“操作也同步进行了更新,和界面字段保持一致。
三、运维管理优化1、查询界面优化待办箱、监控箱、综合查询菜单中新增查询条件、表头列可定制、工单预警颜色标注等功能,调整工单默认查询时间为最近一个月。
综合查询菜单中调整默认查询类型为“当前工单“,同时加入自动刷新功能。
2、新增多站址组合查询工单-综合查询菜单,新增多站点查询功能,并且可以进行快速保存和快速打开功能。