简述东方电子云架构群控大数据平台的实现
- 格式:doc
- 大小:565.00 KB
- 文档页数:8
大数据平台架构设计与实现随着数据量的爆炸式增长,大数据平台逐渐成为众多企业必不可少的一项重要技术,它能够帮助企业在海量数据中挖掘出更加精准、有用的信息。
然而,一个高效、可靠的大数据平台不仅仅需要拥有大量的数据存储和计算能力,还需要有合理的架构设计和实现方案。
本篇文章着重介绍大数据平台架构设计和实现方案的相关内容。
一、大数据平台的定义在大数据平台的定义中,大数据可以是拥有超过传统数据库管理系统能够存储和处理的能力的数据集合。
可以是结构化数据、半结构化数据或非结构化数据,而大数据平台就是建立在这些大数据之上的数据处理、存储、管理及分析工具的集合。
二、大数据平台的架构设计大数据平台的架构设计是让数据从采集到存储、处理再到分析等各个环节实现自动化流程的过程。
大数据平台的架构设计分为以下三个方面的基础组成:1、数据采集层数据采集层是大数据平台架构的第一步,它负责从各种设备、软件、传感器和各种现场活动中收集数据。
数据采集层应该尽可能地把数据从源头采集,建立在数据生产源的数据采集系统最优。
2、数据存储层数据存储层是大数据平台架构的第二步,它是数据存放的区域。
在数据存储层,数据会被存储在一种或者多种的存储介质中,比如Hadoop的HDFS、Apache的Cassandra、NoSQL、RDBMS等。
对于典型的企业级大数据平台,基于云的数据存储成为了最主流的架构选择。
3、数据处理层数据处理层是大数据平台架构的第三步,它的作用是以批处理、流处理、机器学习等一系列技术手段对数据进行处理和分析。
典型的大数据处理方案,需要基于Hadoop的MapReduce算法和Spark流处理框架。
三、大数据平台的实现方案1、采用异构系统集成采用异构系统集成可以使得数据能在不同的系统和数据源之间进行无缝衔接、便于网络对数据进行管理、分析和智能输出。
比如熟悉的Hadoop、代表Apache的Storm,以及管理方式各异的NoSQL数据库。
电商平台的云计算解决方案随着互联网的发展和智能设备的普及,电子商务迅速崛起,并成为现代商业的重要组成部分。
电商平台的运营离不开高效的技术支持,而云计算解决方案正是其取得成功的重要因素之一。
本文将探讨电商平台中利用云计算解决方案提升效率、降低成本和确保安全性的优势。
一、云计算解决方案的概述云计算是一种基于互联网的计算模式,通过将计算资源、存储和应用程序等服务交付给用户,实现按需使用的特点。
电商平台作为一个大规模数据处理的应用场景,云计算解决方案提供了强大的计算和存储能力,为电商业务的发展提供了支持。
二、提升效率的优势1. 弹性扩展能力:电商平台的访问量通常有较大的波动性,特别是在促销活动期间,用户的访问量可能会短时间内剧增。
云计算解决方案具备弹性扩展的能力,可以根据当前的业务需求自动提供更多的计算和存储资源,以应对突发的访问压力,从而提升平台的稳定性和用户体验。
2. 快速部署和上线:传统的基础设施建设和软件部署需要耗费大量的时间和人力资源,在电商行业的快速发展中显得力不从心。
云计算解决方案以虚拟化的方式提供服务,可以在几分钟内完成服务器的创建和部署,缩短了产品上线的时间,加快了商业项目的推进速度。
3. 高可用性和容灾备份:电商平台的持续运行对高可用性和数据安全性要求极高。
云计算解决方案通过分布式架构和冗余备份技术,实现数据的多副本存储和容灾备份,确保数据的可靠性和平台的稳定性。
即使某个节点出现故障,云计算解决方案也可以自动切换到备用节点,保证服务的持续性。
三、降低成本的优势1. 资源按需使用:传统的计算机系统需要购买和维护大量的硬件设备,并且可能会因为资源过剩或闲置而造成浪费。
云计算解决方案可以根据业务需求动态调整资源,避免了资源的浪费,同时降低了电商平台建设和运营的成本。
2. 付费模式灵活多样:云计算提供了多种付费模式,如按使用时长、按计算资源量等。
电商平台可以根据自身的需求选择适合的付费方式,灵活控制成本。
云计算平台的架构和实现原理随着互联网技术的日益发展,云计算平台也越来越受到人们的追捧和认可。
云计算平台简单来说就是一种将计算资源和数据存储于互联网上的分布式系统,用户可以通过网络等方式轻松地访问这些资源进行各种计算操作,无需关心底层的硬件和软件细节。
但是云计算平台的设计和实现要考虑很多复杂的因素,下面我们就来详细了解一下云计算平台的架构和实现原理。
一、云计算平台的架构云计算平台的架构可以分为四个层次,分别是硬件层、虚拟化层、管理层和应用层。
1.硬件层硬件层是云计算平台的基础,包括服务器、存储设备、网络设备等硬件设备。
这些设备统称为物理资源,是云计算平台的最基本组成部分。
硬件层的设备需要满足高性能、高可靠性、高可扩展性的要求。
2.虚拟化层虚拟化层是建立在硬件层之上的一层虚拟化环境,主要通过虚拟机技术将物理资源进行抽象和隔离,使得不同的用户可以共享相同的物理资源进行计算操作。
虚拟化层的主要作用是将底层物理资源进行虚拟化,提供虚拟机实例的管理、调度和监控等功能。
3.管理层管理层是云计算平台的控制中心,负责对云计算平台各项资源进行管理和调度。
管理层包括资源管理、虚拟机管理、网络管理等子系统,通过各自的模块将云计算平台的各项资源进行统一管理,以满足用户的需求。
4.应用层应用层是云计算平台的最上层,提供给用户进行各种应用程序开发、部署和维护等服务。
应用层包括各种应用程序、应用程序库、开发工具和应用程序管理等模块。
二、云计算平台的实现原理1.虚拟化技术虚拟化技术是云计算平台实现的核心技术。
虚拟化技术可以将物理资源进行抽象和隔离,使得不同的用户可以共享相同的物理资源进行计算操作。
虚拟化技术的主要作用是将底层物理资源进行虚拟化,提供虚拟机实例的管理、调度和监控等功能。
2.管理和调度系统管理和调度系统是云计算平台的核心组成部分,主要通过各自的模块将云计算平台的各项资源进行统一管理,以满足用户的需求。
管理和调度系统的主要功能包括资源分配、负载均衡、故障恢复等。
EASTED云管理平台解决方案v1北京易讯通信息技术股份有限公司易讯通云管理平台解决方案北京易讯通信息技术股份有限公司5月26目录1总论31.1概述31.2建设背景32需求分析42.1客户现状42.2客户需求43建设方案63.1设计原则63.1.1安全可靠73.1.2标准化73.1.3弹性原则73.1.4高可用83.1.5良好的扩展性83.1.6虚拟化83.1.7高性能83.1.8开放接口83.1.9绿色节能93.2总体架构及组成93.2.1系统架构图103.2.2存储架构设计113.2.3网络架构设计173.2.4部署架构设计243.3功能设计253.3.1异构资源管理263.3.2用户管理263.3.3监控告警263.3.4存储管理263.3.5应用管理263.3.6流程管理273.3.7资源调度管理274建设方案亮点274.1规模化的虚拟化数据中心274.2兼容异构的虚拟化274.3灵活的管理方式284.4可靠的安全保障294.5自动化的运维304.6健壮的运维保障304.7强大的大数据平台支撑能力311总论1.1概述1.2建设背景2需求分析2.1客户现状2.2客户需求1)提高运维管理效率,降低成本目前管理维护人员都是进入机房,在机架旁操作服务器,但由于各主机都有自己的维护界面,造成系统维护人员需要逐个进行维护管理,显然这种单点式的维护需要耗费大量的人员成本,且效率很低。
2)提升数据中心安全性通常在出现问题的情况下,可能进入机房进行查看与维护,而由于各系统的数量及种类在不断增加,以往单一的管理模式已经不能满足数据中心发展的需求,需要一个统一的管理门户来对数据中心进行管理维护,且在整个过程中,保证公安系统的安全,做到一站式的授权、认证,操作,审计。
3)业务保密性、可用性,稳定性公安系统相关涉密系统都需要特别管理,对其上所载的业务需要做到安全、稳定,可用。
尤其在在特殊服务器出现宕机等情况下,不能及时的连接或查看相关故障,延误了时间,可能会造成损失,这就需要做到服务器主机的高可用,高稳定,高安全。
大数据平台的架构与搭建指南随着科技的迅速发展和信息的爆炸性增长,大数据已经成为当今社会中不可忽视的一个重要领域。
大数据分析对企业决策、市场预测、用户行为分析以及社会趋势的研究等起着至关重要的作用。
为了处理和分析这些庞大的数据集,建立一个强大而可靠的大数据平台是非常重要的。
本文将介绍大数据平台的架构与搭建指南,帮助您了解如何构建一个符合需求的大数据平台。
一、架构设计1. 数据采集层:大数据平台的第一层是数据采集层,用于从不同的数据源中收集和获取数据。
这包括传感器、移动设备、日志文件等。
数据采集层需要考虑数据的格式、频率和可靠性等方面。
常见的数据采集工具包括Flume、Kafka和Logstash等。
2. 数据存储层:数据存储层用于存储从数据采集层收集的原始数据或已经处理的中间数据。
常见的数据存储技术包括传统的关系型数据库MySQL、NoSQL数据库(如MongoDB、Cassandra等)以及分布式文件系统(如Hadoop的HDFS)。
根据数据的类型和需求,可以选择合适的数据存储技术。
3. 数据处理层:数据处理层是大数据平台的核心组件,用于处理和分析存储在数据存储层的数据。
该层包括批处理和流式处理两种方式。
批处理可以通过Hadoop的MapReduce或Spark等技术来进行,用于处理大量的离线数据;而流式处理可以使用Apache Storm或Flink等技术,实时处理数据流。
此外,数据处理层还可以使用机器学习算法和人工智能技术来进行复杂的数据分析。
4. 数据可视化与应用层:数据可视化与应用层用于展示和应用数据处理结果。
通过数据可视化工具(如Tableau、Power BI等),可以将数据以图表、报表等形式直观地展示出来,帮助决策者更好地理解和利用数据。
此外,数据可视化与应用层还可以开发相应的应用程序或服务,满足不同的业务需求。
二、搭建指南1. 硬件与网络:搭建大数据平台需要考虑合适的硬件和网络基础设施。
大数据云平台智能运营解决方案随着大数据技术的快速发展和广泛应用,越来越多的企业和组织都在云平台上构建自己的大数据系统,但是面临着一些问题,例如大数据处理速度慢、数据安全性差、难以管理等。
为了解决这些问题,出现了大数据云平台智能运营解决方案。
1.效率提升:通过优化大数据处理引擎和算法,提高数据处理和分析的速度。
采用并行计算、分布式存储等技术,实现大规模数据的高效处理。
同时,引入自动化工作流程和任务调度系统,提高数据处理的自动化水平,降低人工干预的成本。
2.数据安全保障:大数据平台中的数据安全问题一直是一个关注焦点。
大数据云平台智能运营解决方案提供了多种安全策略,如数据加密、访问控制、防火墙等,以保护数据的隐私和完整性。
同时,对平台的安全性进行监控和管理,及时检测和阻止潜在的安全威胁。
3.数据质量管理:大数据平台中的数据质量直接影响到后续的分析和决策效果。
大数据云平台智能运营解决方案通过引入数据质量管理的工具和技术,对数据进行质量评估、清洗和校验,提高数据的准确性和一致性。
同时,还可以提供实时监控和预警功能,及时发现数据质量问题,并采取相应的措施进行修复。
4.成本控制:大数据平台的建设和维护通常需要大量的投入,成本较高。
大数据云平台智能运营解决方案通过优化资源利用和成本分析,帮助企业合理规划和分配资源,降低运营成本。
同时,通过自动化的运维和管理功能,减少人工干预,提高效率,从而进一步降低成本。
5.数据治理:大数据平台中的数据分散、冗余、不一致等问题使得数据的管理变得困难。
大数据云平台智能运营解决方案提供了数据治理的工具和技术,对大数据进行集中管理,建立统一的数据模型和标准,实现数据的一致性和共享。
同时,还可以通过数据挖掘和分析技术,发现数据中的潜在关联和价值,为组织提供更好的决策支持。
群控系统方案简介群控系统是一种多设备管理和控制的解决方案,可以有效地集中管理多个设备,实现统一的控制和协调。
本文将介绍群控系统的基本原理、主要功能和架构,并讨论其在不同领域中的应用。
基本原理群控系统基于网络通信和远程控制技术,通过在被控制设备上安装客户端软件,通过服务器与设备进行通信和控制。
主要包括以下几个步骤:1.注册设备:将需要管理和控制的设备注册到群控系统的服务器上。
2.设备识别:服务器通过唯一的设备标识识别和管理每个设备。
3.远程控制:用户通过群控系统的管理平台,发送命令到服务器,服务器将命令转发给对应的设备进行控制。
4.数据交互:群控系统支持设备和服务器之间的数据交互,可以通过服务器收集设备的状态信息、日志等。
5.统计和分析:群控系统提供对设备的状态、使用情况等进行统计和分析,方便后续的优化和管理。
主要功能群控系统提供了一系列的功能,以满足不同场景下对设备的管理和控制需求。
主要功能包括:远程控制群控系统通过远程控制实现对设备的统一控制和操作。
管理员可以通过管理平台发送指令来执行特定任务,如安装新的应用程序、启动或关闭特定应用程序、修改设备设置等。
这样可以大大提高工作效率,减少人力资源的浪费。
批量操作群控系统支持对多个设备进行批量操作,一次性完成多个设备的操作任务。
管理员可以将需要执行的任务批量发送到一组设备,同时控制多个设备的启动、关闭、重启等操作,提高操作效率。
群控系统提供全面的设备监控功能,管理员可以实时监测设备的状态信息,包括设备的在线状态、CPU和内存占用情况、网络流量等。
通过监控设备的状态,管理员可以及时发现设备故障和异常情况,并进行相应的处理。
数据收集与分析群控系统支持对设备的数据进行收集和分析,包括设备的使用情况统计、应用程序使用情况、用户行为分析等。
通过对数据的分析,管理员可以了解设备的使用情况,帮助优化设备的配置和操作,提供更好的用户体验。
架构群控系统的基本架构包括客户端、服务器和管理平台三个组成部分。
大数据平台的架构大数据平台的架构是指为了支持大数据处理和分析而设计的系统结构和组件。
随着数据量的不断增长,传统的数据处理和分析方法已经无法满足对大规模数据的需求,大数据平台的架构应运而生。
下面将介绍一种常见的大数据平台架构。
1.数据采集层:数据采集层是大数据平台的第一层,用于从各种数据源(例如传感器、日志文件、数据库等)收集和捕获数据。
在这一层,常用的工具包括Flume、Kafka等,它们能够以高效方式实时采集和传输大量的数据。
2.存储层:存储层是用于存储大数据的关键组件。
在大数据平台中,通常使用分布式存储系统来存储数据。
常见的分布式存储系统包括Hadoop分布式文件系统(HDFS)、亚马逊的S3、谷歌的GFS等。
这些系统具有高可靠性、高吞吐量和容错性,并且能够扩展以容纳大量数据。
3.计算层:计算层是大数据平台的核心组件,用于对存储在存储层中的大量数据进行计算和分析。
在该层中,通常使用分布式计算引擎进行大规模数据处理。
常见的分布式计算引擎包括Hadoop的MapReduce、Spark等。
这些引擎可以并行处理大规模数据集,并且具有高性能和可伸缩性。
4.数据处理层:数据处理层是为了满足数据处理需求而构建的组件。
在该层中,使用数据处理框架对数据进行清洗、转换和整合。
常见的数据处理框架包括Apache Pig、Apache Hive等。
这些框架提供了丰富的数据处理和转换功能,使用户能够以更高层次的抽象和简化的方式对大数据进行处理。
5.数据应用层:数据应用层是大数据平台的最上层,用于构建各种具体的数据应用。
在该层中,可以使用各种工具和框架来开发和部署数据应用程序。
常见的工具和框架包括Apache Storm、Apache Flink等。
这些工具和框架可以帮助用户构建实时数据流应用、机器学习应用、数据可视化应用等。
6.安全管理层:安全管理层是大数据平台中不可或缺的一部分,用于确保数据的安全性和隐私性。
在该层中,可以使用各种安全工具和技术来保护数据。
大数据平台的系统架构设计与实现随着数字化时代的到来,大数据已经成为了一个重要的话题。
如何利用大数据,成为现代企业的一个重要命题。
为了有效管理和利用数据,传统的数据存储已经无法满足需求,这时候,大数据平台便应运而生。
大数据平台是一个能够支持快速处理和分析大量数据的系统集成方案。
在大数据时代,大数据平台的架构设计和实现是至关重要的。
一、大数据平台的架构设计大数据平台的结构设计通常包括以下几个部分:1. 数据源数据源指大数据平台获取数据的渠道,包括传感器、社交媒体、Web应用程序和传统数据库等。
在架构设计中,需要将数据源进行分类,以便于后续数据分析和处理。
2. 数据采集数据采集是将数据从数据源获取,并将其存储到大数据平台中。
大数据平台通常使用一些常见的大数据工具,如Storm、Kafka和Flume等。
这些工具能够帮助我们获取数据,并将其按照指定的格式写入数据仓库。
3. 数据仓库数据仓库是大数据平台的核心部件。
在数据仓库中,数据被存储在一个中央位置中,并且能够轻松地进行分析和处理。
大数据仓库通常包括存储、索引和查询三个组件。
4. 数据分析数据分析是大数据平台的一个重要组成部分,它可以利用大数据平台存储的数据来寻找数据中隐藏的模式或者规律。
对于大数据平台而言,数据分析通常具有以下几个阶段:(1) 数据预处理:数据预处理是数据分析的第一步,通过预处理,可以帮助我们检查数据是否完整、是否合法,以及数据的质量是否需要进行改进。
(2) 数据挖掘:数据挖掘是数据分析过程中最复杂和最关键的部分,通过数据挖掘,可以找到数据中隐藏的规律和模式,帮助我们更好地理解数据。
(3) 数据可视化:数据可视化可以让我们更加方便地理解数据分析结果。
通过数据可视化,可以将数据分析结果以图表等形式呈现出来,使得数据分析结果更加直观。
二、大数据平台的实现大数据平台的实现需要考虑多方面的因素,包括硬件和软件等。
下面我们从几个方面来讨论大数据平台的实现。
简述东方电子云架构群控大数据平台的实现摘要介绍东方智能控制有限公司为了落实国家和公司关于大数据和云计算方面的指导精神,根据公司实际和市场需求,建立和开发的基于云架构的群控系统大数据平台。
包括该平台的架构设计、采用的技术框架和技术实现,也介绍了如何把云平台从理论到实践的关键技术探索。
关键词云技术;大数据;IMU前言随着人民生活水平不断提高,人们对办公环境和居住环境的舒适性、美观性要求越来越高。
在新建和改建的商用民用建筑中,越来越多的业主要求设计中央空调。
中央空调在为人民营造舒适气候环境同时,也带来了越来越严重的能耗问题。
统计可知,目前楼宇建筑中,制冷制热能耗可占楼宇总能耗的40%。
在空调系统中,能耗主要是机房内的冷热源主机电耗和配套水泵、风机电耗。
为了提高空调系统总体效率,人们开发了许多实现不同控制策略的群控系统,协调空调机房设备运行,最大限度实现机房系统节能运行。
但是,由于空调机房分布地域范围广泛,使用环境千差万别,而群控产品生产厂家缺乏有效的远程监控手段。
导致无法对群控实际运行效果进行跟踪研究,在客户遇到问题后不能及时提供支持。
在最近几年,一些群控厂家也提出了多种多样的群控远程监控方案,但是受限于资金和技术能力,这些群控方案要么投资巨大,要么接入费用高,实用效果不明显,而且由于不能在后期持续有效管理和数据挖掘,这些系统最后要么消失,要么发展成华而不实的展览品。
面对目前的需求,结合长期的冷热源系统群控实践经验和强大的软件开发能力,我们在2014年提出了基于云计算模型的群控系统大数据平台方案,并进行了积极有效的实践。
本文对群控系统大数据平台方案及采用的核心技术做一个简单的介绍。
1 机房群控系统介绍图1 空调系统图民用和商用建筑中,中央空调设备种类繁多,但基本形式类似。
主要由空调用户、空调末端设备、输送管道以及冷热源系统组成。
其中,作为中央空调系统的核心,冷热源系统(机房)具有决定整个空调系统运行状态的关键作用,同时,冷热源系统也是整个中央空调系统的关键能耗部分。
冷热源系统一般包括冷热源主机、冷却水循环泵、冷冻水循环泵、冷却塔风机、压差平衡阀、管路切换开关阀等设备组成。
各设备之间相互关联,群控系统就是冷热源系统大脑,负责设备运行调整,工艺启停工作和故障紧急情况处理,保证节能运行。
1.1 群控系统基本功能(1)运行调节群控系统根据工艺要求,测量系统实际参数,例如机房冷冻水输入和输出温度、压力,并根据实测参数协调各设备的运行参数和启停数量,使系统输出符合目标要求,保证业主对冷热源系统的使用。
(2)启停管理由于各机房设备的启停顺序存在时序和连锁要求,因此,群控设备也要根据这些过程参数调节各设备的启停顺序和转换时间,保证空调系统启停连锁正常,提高设备正常运行能力。
(3)故障处理群控系統还要实时监控空调系统各设备的运行状态,及时发现问题,根据预先设定策略对故障设备进行分离,启动备用设备,报警等故障处理。
(4)节能运行群控系统不仅要保证机房正常可靠运行,随着现在能源问题日益受到关注的时代,还要具有降低系统能耗,提高系统能效的能力。
目前群控系统主要是不同的预定义节能运行策略来达到节能要求的。
(5)历史记录系统运行的历史纪录对分析系统的历史运行情况,故障报警原因分析至关重要,也是保证群控系统正常运行的必须组成。
群控系统不仅要记录自己额运行历史记录,还要对用户的操作记录,相关设备的运行过程都要有持续准确的记录。
1.2 架构形式(1)PLC+开关屏这种形式出现较早,在液晶屏价格昂贵的时候,采用开关屏作为界面,包括按钮、LED仪表,用PLC作为控制部件。
在当时的优势是造价便宜,故障点分散,易于维修。
劣势是信息量少,交互不灵活。
(2)PLC+触摸屏在20世纪90年代,随着触摸屏架构急剧下降,前一种方案成本优势不明显,而且从人机交互上触摸屏更灵活,提供信息更丰富。
因此逐渐取代第一种方案。
(3)PLC+一体化工控机进入20世纪,群控系统功能越来越多,群控算法越来越复杂,涉及模糊控制、专家系统等等。
群控系统已经不仅仅是机房设备管理系统,同时是设备运行专家系统,历史数据存储系统和能耗分析系统。
这就要求群控系统具有更快速的运算能力,更大的存储空间,更优秀画面展示。
因此,一体化工控机和PLC的组合群控系统在一些先进的群控厂家逐渐得到应用。
(4)PLC+云+浏览器PLC+一体化工控机方案虽然相对比较优秀,但是技术要求高,成本相对较高,而且推广后的调试、安装及升级都涉及较多的资源投入。
因此,基于互联网技术的群控系统出现了。
该系统中,本地群控还是PLC+触摸屏形式,但是具有了网络模块,可以直接接入互联网,而在群控公司建立数据中心,将所有数据汇总记录。
利用数据中心的高级运算能力完成各种群控算法,最后远程控制群控系统执行。
该方案降低了前一种的方案的投入成本和维护费用,提高数据利用率,集中管理也降低了运营成本。
我们的基于云架构的大数据平台就是采用的这种方案[1]。
2 基于云架构的群控大数据平台群控节能云平台是建立于已有大数据、云平台相关技术之上,可接入分布于世界各地的冷热源群控系统、冷热源设备,实现海量运行数据和能耗数据的永久存储、数据挖掘、在线整定、专家预测分析等功能的综合性大数据应用平台。
2.1 平台架构2.2 关键技术用最低成本建立最符合实际的云系统,给最需要的用户最方便地接入体验,是我们建立群控大数据平台的技术宗旨。
智能网络终端IMU的引入解决了云平台开发难度大,初期实现周期长的难题,使低成本云平台快速实现成为可能。
分布式后台服务技术ZooKeeper,虽然难度较高,但是可以逐步投入,按需增加,降低购入大型服务器的成本压力。
基于C++的异步IO技术ASIO,最大限度发挥服务器潜力,使普通配置服务就可以胜任高吞吐量大并发任务。
采用非关系型数据库MongoDB,既保证了大数据存储经济性,也提供了分布式数据库访问能力和无限的数据存储扩展能力[2]。
(1)分布式后台服务群控云平台预计设备接入容量将达到万级,如果采用常规的单服务器架构,则必然需要大型服务器主机的支持,投资巨大。
而且设备接入是逐步增加,初期投资回收周期长,也容易造成浪费。
我们根据现有技术发展,决定采用云计算平台架构,用多台服务器组成服务器集群,根据设备接入数量逐步增加服务器数量,满足平台要求的同时又不会造成投资浪费,同时还会提高平台可靠性。
ZooKeeper是Apache的一个分布式的、开放源码的分布式应用程序协调服务。
其包含一个简单的原语操作集,包括命名、配置维护、提供分布式锁、提供分组等服务。
这些服务可被分布式应用以不同形式加以应用。
由于正确而高效地实现这些基础服务极其困难,编写分布式应用的开发人员无法也没有时间实现这些服务,即便正确实现了,也很可能会导致部署和管理的复杂。
为了解决此问题,Apache提供了ZooKeeper项目,可提供可靠的、可扩展的、分布式的、可配置的协调机制来统一系统的状态。
使用ZooKeeper技术可以大幅度节省开发分布式系统的工作量,同时大幅度提高系统的质量。
本项目充分利用了ZooKeeper提供的相关功能,降低了项目开发的难度。
ZooKeeper本身是一个分布式系统,只要多数节点可用整个系统就是可用的,在生产环境至少要部署3个服务节点,也可以部署5个、7个乃至9个节点。
ZooKeeper模型如图2-3所示。
可支持大量客户端连接,每个客户端可以连接到任何一个服务器。
通常,ZooKeeper 集群上的任何操作不是读操作就是写操作。
ZooKeeper 确保所有读和写操作,在所有客户端看来都具有完全相同的顺序。
在提供强一致性保障的同时,ZooKeeper同时给出高可用性承诺,这可以被简单地解释为可以在多台服务器失效的情况下仍然为客户端提供服务。
ZooKeeper使用一个传统的手段来达到高可用性——通过将数据读写分布到几台机器上来实现,这样如果一台失效了,其他的服务器可以接管它的服务,而无须让客户端更智能。
(2)前摄式设计模式从系统架构图可以看到,现场设备和平台的交互都是通过一个个连接服务器来完成,因此,每个连接服务器的效率和可靠性决定了整个云平台数据采集和远程控制的可靠性。
ASIO是一个开源的跨平台的网络编程框架,其初衷是提供一个专家级的高效框架,方便网络开发者进行大规模、系统化的复用,避免低效的重复发明轮子。
该框架实现了Proactor设计模式。
本项目使用Boost.asio来实现底层通讯。
Proactor设计模式基于异步I/O,可充分利用操作系统、CPU、网络接口提供的并发处理机制,较同步方式极大提高了通讯效率。
前摄设计模式占用资源少,单机可支持大量的连接(一台普通的PC机可以同时支持10万个以上的连接),因此采用前摄设计模式有助于提高系统的可伸缩性。
除此之外,该模式还有其他好处,例如,如果多个异步I/O操作被同时发起,且每个操作带有额外信息,比如处理文件I/O时用到的文件位置,那么操作系统就可以优化其自身的缓存方式来避免盲目的数据复制。
不仅如此,操作系统还可以通过重新安排每个操作的时序来进一步优化文件I/O工作效率,使得磁盘头的移动距离总和达到最低,并增加缓存的命中率。
(3)高性能可伸缩数据存储由于设备接入量巨大,且数据间隔时间短,每天要存储的数据量非常庞大。
举例来讲,单台群控系统每天可产生230万个数据,如果接入群控系统达到1000套,则每天实际数据量达到23亿。
在这些数据中,大部分数据并不具有关键作用,如果采用关系型数据库存储,会导致极大浪费,因此,我们选择了非关系型数据库MongoDB数据库作为海量数据存储的管理系统。
MongoDB是一个基于分布式文件存储的数据库。
由C++语言编写。
旨在为WEB应用提供可扩展的高性能数据存储解决方案。
MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。
他支持的数据结构非常松散,是类似json的bson格式,因此可以存储比较复杂的数据类型。
Mongo最大的特点是他支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引[3]。
(4)智能网络模块大数据平台架构关键技术之一是采用智能网络模块作为数据采集终端,相比以前其他网络厂家提出的采用RTU或者DTU方案,智能网络模块降低了云服务设计难度和网络性能风险,提高系统可靠性,使群控大数据平台真正从理论可行走上实际可行。
网络智能模块基于ARM 9系列嵌入式芯片开发,CPU主频速度400MHz,内存最高可到128M,完全可满足高速采样过程中的数据运算处理。
网络智能模块采用了LINUX嵌入式操作系统,可满足高可靠性要求,也支持程序的POSIX设计。