北京市政务大数据平台顶层设计框架及应用方案
- 格式:docx
- 大小:2.89 MB
- 文档页数:15
大数据顶层设计方案1. 背景介绍随着互联网的快速发展和数字化转型的推动,大数据技术在各个行业中的应用越来越广泛。
大数据技术可以帮助企业从庞大的数据中获取有价值的信息,并利用这些信息做出更准确的决策,提高业务效率和创新能力。
然而,大数据技术的应用并不是一件简单的事情,它需要进行系统的顶层设计,以确保各个组件之间的协同工作和整体性能的提升。
本文将介绍一种大数据顶层设计方案,旨在帮助企业建立高效、可靠的大数据平台。
2. 概述大数据顶层设计方案是一个系统的规划和设计过程,它包括以下几个步骤:2.1 确定需求和目标在开始设计之前,需要与企业内部的相关部门和利益相关者进行沟通,明确他们对大数据平台的需求和目标。
例如,他们希望通过大数据平台提升数据分析的准确性和效率,或者希望构建实时数据流处理系统等等。
2.2 架构设计根据需求和目标,设计大数据平台的架构。
架构设计是整个顶层设计方案中最重要的环节,它决定了大数据平台的可扩展性、可靠性和性能。
在设计架构时,需要考虑以下几个方面:•数据采集和存储:确定如何采集和存储企业的数据。
可以使用各种数据源(例如传感器、日志文件等),并选择合适的数据存储技术(例如Hadoop、NoSQL数据库等)。
•数据处理和分析:确定如何对采集到的数据进行处理和分析。
可以使用批处理技术(如MapReduce)或实时流处理技术(如Spark Streaming)。
•数据可视化和报表:确定如何将处理和分析后的数据可视化并生成报表。
可以使用各种数据可视化工具(如Tableau、PowerBI等)。
•数据安全和隐私:确定如何保护企业的数据安全性和隐私性。
可以使用数据加密、访问控制和数据备份等技术。
2.3 技术选型根据架构设计,选择合适的大数据技术和工具。
大数据技术包括各种开源软件和商业解决方案,如Hadoop、Spark、Kafka等。
在选择技术时,需要考虑技术的可行性、成本和生态系统的健全性。
2.4 系统集成和测试在设计和开发大数据平台之前,需要进行系统集成和测试。
一体化政务服务平台总体框架设计方案
一、总体架构设计
1.1总体框架
精一体化政务服务平台的总体框架采用三层架构,其中包括:数据层、服务层和应用层。
数据层的主要功能是数据管理、数据安全以及数据挖掘;服务层的主要功能是提供业务处理、业务网关、服务管理、服务监控等服务;应用层主要提供应用支持、应用服务管理、应用服务监控等应用服务。
1.2系统架构
精一体化政务服务平台的系统架构主要是采用一种多层次架构,它将
系统划分为数据层、服务层和应用层;数据层包括:数据管理、数据安全、数据挖掘等功能;服务层包括:业务处理、业务网关、服务管理、服务监
控等功能;应用层包括:应用支持、应用服务管理、应用服务监控等功能。
1.3系统设计
(1)数据层:数据层的设计主要是对系统数据进行管理,它将系统
的数据分类管理,以确保数据的安全性和可靠性。
同时,数据层还将对数
据进行挖掘,以便挖掘出有用的信息。
(2)服务层:服务层的设计主要是为用户提供业务处理服务,它将
完成用户发起的各种服务请求,并实现相关的业务处理和业务流程管理。
政务云总体架构及技术解决方案V3政务云总体架构及技术解决方案V3是国家政务信息化的一个重要组成部分,通过云计算技术和信息化手段,实现政务管理的数字化、网络化和智能化,提升政务服务水平和效率,促进政府治理体系和能力现代化。
一、政务云总体架构政务云总体架构分为三层,即基础设施层、云平台层和应用层。
基础设施层主要提供服务器、存储、网络等基础设施支持;云平台层负责提供云计算、虚拟化、容器化等统一平台支撑;应用层则是各级政府、政府部门和企事业单位的应用系统,如人事管理系统、财务管理系统、公共安全管理系统等。
各层之间通过API和中间件进行数据和服务的交互和整合,形成了一个开放、共享的政务信息化平台。
二、技术解决方案1、数据安全方案:政务云采用多重安全策略,包括数据加密、访问控制、运营管理、备份与恢复等,保障政务数据的机密性、完整性和可用性。
同时,通过定期的风险评估和安全审计,防范各类安全威胁和风险。
2、云计算方案:政务云采用虚拟化技术和容器化技术,实现资源的统一管理、快速部署和优化利用。
可根据业务需求动态调整资源分配,提高资源利用率和效率。
3、集成方案:政务云平台采用API和中间件技术,实现应用系统之间的无缝集成和数据交换。
同时,提供数据服务和业务流程服务,帮助政府部门和企事业单位实现数字化转型和创新发展。
4、统一运维方案:政务云采用自动化运维工具和服务,提供全方位的运维支持和监控管理。
包括资源管理、应用管理、配置管理、性能监测等,能够快速响应故障和问题,提升服务质量和用户满意度。
综上所述,政务云总体架构及技术解决方案V3是政务信息化发展的重要创新举措,将加快政府数字化转型和治理现代化进程,推进信息化与工业化、城镇化和农业现代化深度融合,促进中国特色现代化建设和全面深化改革。
政务大数据平台总体架构方案政务大数据平台是政府部门的一个重要项目,其目标是在政府机构、企业和公众之间建立一个稳定、高效、安全和可靠的数据资源共享平台,从而提高政府决策的科学性和精准度,为政府和社会各界提供更好的公共服务。
政务大数据平台总体架构方案是政务大数据平台建设的关键要素之一,其涉及到政务大数据平台的技术、业务和数据资源方面的考虑,因此必须使用合适的技术手段和方法来设计和实现。
一、架构设计政务大数据平台总体框架包括四大模块,分别是数据采集、数据存储、数据处理和数据应用。
这个框架在实现政务数据管理和共享方面非常有效,可以适应各种数据类型和处理需求,具有良好的可扩展性和可维护性。
二、数据采集政务大数据平台的数据采集主要包括两个步骤,即数据源识别和数据收集。
在“数据源识别”方面,需要分析政府各个部门、公共机构、企业和个人所涉及的数据资源类型、范围和格式,找出每个数据资源的具体属性和元数据,为后续的数据收集、数据清洗和数据处理提供基础数据。
在“数据收集”方面,需要使用相应的技术手段和方法,收集政府机构、企业和公众所提供的数据,进行整合和分类,确定数据质量标准和评价指标。
三、数据存储政务大数据平台的数据存储主要考虑数据安全和数据管理两个方面,要求数据的存储必须满足数据的完整性、一致性和可靠性。
数据存储采用分布式操作的方式,将数据存储在多个服务器上,避免故障或需要维护或升级服务时,数据的丢失或泄露。
同时,采用了多层次、多种类型的数据存储方式,确保在不同的应用场景下数据可以快速高效地访问。
四、数据处理政务大数据平台的数据处理主要包括数据清洗、数据分析、数据挖掘和数据建模四个步骤,确保数据资源得到充分利用。
具体要通过数据集成、数据统计、数据抽象和数据推理等多种技术手段和方法来实现。
五、数据应用政务大数据平台的数据应用主要是将处理后的数据呈现给用户,以实现数据信息化和可视化。
同时支持一系列数据查询、检索和分析的功能,以满足不同用户的数据需要。
标准实用文案文档北京市政务大数据平台顶层设计框架及应用方案一、大数据在政务领域应用的概述说起大数据技术的应用,首先是在互联网行业起步并逐步拓展到电信、金融、工业等多个领域,产生了巨大的社会价值和产业空间,现正拓展到政务领域。
(一)大数据技术在互联网行业的成功应用,那些地方是值得我们关注的第一,应该是思维观念和运作方式的变化,所谓的互联网思维,其核心理念包括:体外互动:邮件、电话、信件互动---服务导引服务外包:购买服务---简单服务让渡社会:众包---自助服务边界开放:数据开放---创造服务第二,是其技术演进,针对数据处理的技术首先是传统数据分析处理阶段,该阶段是面向结构化数据,非结构化处理效率低;硬件成本高;平台兼容性差。
其次是基于云计算的大数据处理阶段,该阶段总体有了很大的改进和提升,主要体现在:具备结构化/非结构化混合分析的能力;基于消费级硬件,不依赖高性能、高可靠性硬件,从而保障系统性能和可靠性;平台兼容性好、扩展性高;进而业界又提出去IOE的思路。
第三,是数据挖掘分析技术画像技术以及各类数据融合、分析、挖掘、预测等。
这些都是政务领域需要学习与借鉴的。
为此,我认为:大数据在政务领域应用即包括用新的思维、模式与技术来解决电子政务需求,也包括了政务大数据新的应用。
对于第一个方面比较容易理解,对于第二个方面需要对政务大数据给出定义。
有些人认为政府没有大数据,只有传统的小数据或中数据。
这个问题我们将在下一节专门中进行讨论。
政务领域是大数据应用崭新的领域,它将极大的改变政府的管理模式,有利于节约政府投资、提高政府决策能力、提升公共服务和社会管理能力,开展大数据在政务领域的应用是大势所趋,势在必行。
同时,政务大数据本身也不同于其他领域或行业的数据,其复杂程度和需求的多样化比互联网行业大的多,也难的多。
(二)政务大数据的定义及特点按照政府管理的数据来源和种类,可以分为下三类:第一类业务数据:业务办理过程中采集和产生的数据。
政务大数据平台方案1. 概述政务大数据平台是指基于大数据技术和云计算架构,为政府提供数据采集、存储、管理、分析和应用的一种综合性平台。
通过政务大数据平台,政府部门可以实现对海量数据的快速处理和分析,从而更好地了解社会状况、优化政府公共服务、推动决策科学化。
本文档将介绍政务大数据平台的设计和实施方案,为政府部门提供指导和参考。
2. 功能需求2.1 数据采集与存储政务大数据平台需要具备强大的数据采集能力,能够从各个政府部门和相关机构的数据源中获取数据。
数据采集过程中需要考虑数据的准确性、完整性和安全性。
采集到的数据需要按照一定的标准进行格式化和清洗,并存储到适当的数据仓库中。
2.2 数据管理与安全政务大数据平台需要提供数据管理能力,包括数据的组织、分类、索引和检索。
平台还需要设置严格的数据访问权限控制机制,确保数据只能被授权的人员访问和使用。
此外,政务大数据平台还需要具备数据备份和灾备能力,以确保数据的安全性和可靠性。
2.3 数据分析与挖掘政务大数据平台需要具备强大的数据分析和挖掘能力,可以对存储在平台上的海量数据进行快速的分析和挖掘。
平台需要提供各种数据分析工具和算法库,支持数据挖掘、可视化分析、模型建立等功能。
同时,平台还需要支持用户自定义的数据分析任务。
2.4 数据应用与决策支持政务大数据平台需要提供数据应用和决策支持能力,将分析得到的数据结果转化为实际的决策支持建议。
平台需要支持生成各种报表和可视化图表,并提供多种决策支持工具和模块,为政府部门提供科学决策的基础。
3. 技术架构3.1 数据采集与存储政务大数据平台的数据采集和存储部分可以采用分布式存储技术,如Hadoop和Spark等。
数据采集模块可以使用Flume等工具进行数据的实时采集和传输。
数据存储模块可以使用HDFS等分布式文件系统进行数据的容错存储。
3.2 数据管理与安全政务大数据平台的数据管理和安全部分可以采用分布式数据库和权限控制技术。
北京市政务大大数据平台顶层设计框架及应用方案设计标准实用文案北京市政务大数据平台顶层设计框架及应用方案一、大数据在政务领域应用的概述说起大数据技术的应用,首先是在互联网行业起步并逐步拓展到电信、金融、工业等多个领域,产生了巨大的社会价值和产业空间,现正拓展到政务领域。
(一)大数据技术在互联网行业的成功应用,那些地方是值得我们关注的第一,应该是思维观念和运作方式的变化,所谓的互联网思维,其核心理念包括:体外互动:邮件、电话、信件互动---服务导引服务外包:购买服务---简单服务让渡社会:众包---自助服务边界开放:数据开放---创造服务第二,是其技术演进,针对数据处理的技术首先是传统数据分析处理阶段,该阶段是面向结构化数据,非结构化处理效率低;硬件成本高;平台兼容性差。
其次是基于云计算的大数据处理阶段,该阶段总体有了很大的改进和提升,主要体现在:具备结构化/非结构化混合分析的能力;基于消费级硬件,不依赖高性能、高可靠性硬件,从而保障系统性能和可靠性;平台兼容性好、扩展性高;进而业界又提出去IOE的思路。
第三,是数据挖掘分析技术画像技术以及各类数据融合、分析、挖掘、预测等。
文档这些都是政务领域需要学习与借鉴的。
为此,我认为:大数据在政务领域应用即包括用新的思维、模式与技术来解决电子政务需求,也包括了政务大数据新的应用。
对于第一个方面比较容易理解,对于第二个方面需要对政务大数据给出定义。
有些人认为政府没有大数据,只有传统的小数据或中数据。
这个问题我们将在下一节专门中进行讨论。
政务领域是大数据应用崭新的领域,它将极大的改变政府的管理模式,有利于节约政府投资、提高政府决策能力、提升公共服务和社会管理能力,开展大数据在政务领域的应用是大势所趋,势在必行。
同时,政务大数据本身也不同于其他领域或行业的数据,其复杂程度和需求的多样化比互联网行业大的多,也难的多。
(二)政务大数据的定义及特点按照政府管理的数据来源和种类,可以分为下三类:第一类业务数据:业务办理过程中采集和产生的数据。
政务大数据平台建设方案一、背景分析政务大数据是指政府机关及其相关企事业单位等公共部门所管理、生产和积累的各类数据资源,包括民生数据、行政数据、社会数据等。
政务大数据具有广泛的应用价值,可以用于政策制定、公共服务、社会管理等领域,对于提高政府治理能力和服务水平具有重要意义。
二、目标和意义三、建设思路和步骤1.建设思路-从数据采集、存储、处理、共享和应用等方面全面规划,打造全方位的政务大数据管理平台;-以数据安全为核心,保障政务大数据的安全性和可靠性;-引入先进的大数据分析技术,提高数据的挖掘和价值应用能力。
2.建设步骤(1)需求分析和规划:明确政务大数据平台的功能需求和发展方向,制定可行性研究报告,并进行规划布局。
(2)数据采集与整合:建立数据采集系统,包括信息采集、传输、清洗、标准化等环节,整合各部门和机构的数据资源。
(3)数据存储与管理:建设数据仓库和数据管理系统,实现数据的安全存储和高效管理。
(4)数据处理和分析:引入大数据处理和分析技术,对政务大数据进行挖掘和分析,提供科学决策依据。
(5)数据共享与开放:搭建数据共享平台,推动政府和社会各界资源的共享和开放,促进信息的互通互联。
(6)应用服务与评估:基于政务大数据平台,开展相关应用服务,推动政务服务的创新和优化,并对平台的运行效果进行评估和改进。
四、关键技术和措施1.大数据存储和处理技术:包括分布式存储和计算、数据挖掘和机器学习等技术,提高数据的存储和处理效率。
2.数据安全保障技术:采用多层次的数据安全机制,包括访问控制、数据加密和数据备份等技术,保证政务大数据的安全性和可靠性。
3.数据共享和开放技术:建立数据共享平台和标准化的数据交换协议,推动政府数据资源的共享和开放。
4.数据应用和服务技术:构建智能化的数据分析和挖掘平台,提供政府决策和社会服务等相关应用服务。
五、建设成果和推广策略1.建设成果-实现政务大数据资源的整合与共享,提高政府决策的科学性和精确性;-提供方便高效的信息查询和公共服务,提升政府服务水平;-推动政府与社会各界的互动与信息交流,促进政民关系的互信和共赢。
智慧城市大数据平台顶层设计规划建设方案随着城市化进程的加快,城市内的各种数据量也越来越大,如何高效地管理这些数据并将其转化为智慧,成为城市建设需要面对的一个新问题。
因此,建设智慧城市大数据平台变得至关重要。
一、需求分析在规划和建设智慧城市大数据平台之前,需要对需求进行分析,确定数据种类和数据量。
需要考虑的数据包括人口数据、交通数据、气象数据、土地利用数据、建筑数据等。
同时,需要对数据量进行估算,确保大数据平台能够承载足够的数据。
二、系统架构设计基于需求分析,需要建立大数据平台的系统架构设计,包括数据采集、数据存储、数据处理和数据展示等四个方面的内容。
1.数据采集:涉及到各种传感器设备,如交通摄像头、气象站、车辆定位等,需要实现数据的实时采集和传输。
2.数据存储:建立大数据平台必须具备高效存储能力。
数据存储分为实时数据存储和历史数据存储,应根据数据类型和数据量采用不同的存储方式和技术。
3.数据处理:数据处理主要是指对原始数据进行预处理、清洗、整合、分析和挖掘等过程,以达到数据的可视化、可查询和可分析的目的。
4.数据展示:数据的展示是大数据平台中最终的目标,精良的数据可视化设计可以使数据以更直观、更生动的形式呈现。
三、相关技术在建设智慧城市大数据平台时,需要使用到相关技术,如云计算、大数据分析、机器学习、人工智能等。
1.云计算:将存储、计算和应用等服务在云端实现,通过互联网实现数据的实时访问和共享,同时降低硬件和软件成本。
2.大数据分析:大数据平台的主要任务之一是将海量的数据转化为有价值的信息,数据分析技术在这里显得尤为重要。
3.机器学习:对数据进行自动处理,从而挖掘出更深层次的有价值信息。
四、系统安全在智慧城市大数据平台建设中,安全问题至关重要。
必须采取一系列安全措施,防止数据被黑客攻击和泄露。
包括数据加密、数据备份、权限管理、网络安全防御等。
五、结论智慧城市大数据平台的建设无疑能够为城市发展提供良好的数据支撑,从而实现城市的智慧化管理。
北京市政务大数据平台顶层设计框架及应用方案本文摘自穆勇在中关村大数据产业联盟上所做的演讲。
演讲全文:今天很荣幸有这样一个机会,和大家交流探讨大数据在政务领域的应用问题,我看到群里有很多十分熟悉的朋友,所以交流起来也会比较轻松。
有什么问题欢迎大家提出,如果我讲的不对的地方,请不客气批评。
一、大数据在政务领域应用的概述说起大数据技术的应用,首先是在互联网行业起步并逐步拓展到电信、金融、工业等多个领域,产生了巨大的社会价值和产业空间,现正拓展到政务领域。
(一)大数据技术在互联网行业的成功应用,那些地方是值得我们关注的第一,应该是思维观念和运作方式的变化,所谓的互联网思维,其核心理念包括:体外互动:邮件、电话、信件互动---服务导引服务外包:购买服务---简单服务让渡社会:众包---自助服务边界开放:数据开放---创造服务第二,是其技术演进,针对数据处理的技术首先是传统数据分析处理阶段,该阶段是面向结构化数据,非结构化处理效率低;硬件成本高;平台兼容性差。
其次是基于云计算的大数据处理阶段,该阶段总体有了很大的改进和提升,主要体现在:具备结构化/非结构化混合分析的能力;基于消费级硬件,不依赖高性能、高可靠性硬件,从而保障系统性能和可靠性;平台兼容性好、扩展性高;进而业界又提出去IOE的思路。
第三,是数据挖掘分析技术画像技术以及各类数据融合、分析、挖掘、预测等。
这些都是政务领域需要学习与借鉴的。
为此,我认为:大数据在政务领域应用即包括用新的思维、模式与技术来解决电子政务需求,也包括了政务大数据新的应用。
对于第一个方面比较容易理解,对于第二个方面需要对政务大数据给出定义。
有些人认为政府没有大数据,只有传统的小数据或中数据。
这个问题我们将在下一节专门中进行讨论。
政务领域是大数据应用崭新的领域,它将极大的改变政府的管理模式,有利于节约政府投资、提高政府决策能力、提升公共服务和社会管理能力,开展大数据在政务领域的应用是大势所趋,势在必行。
同时,政务大数据本身也不同于其他领域或行业的数据,其复杂程度和需求的多样化比互联网行业大的多,也难的多。
(二)政务大数据的定义及特点按照政府管理的数据来源和种类,可以分为下三类:第一类业务数据:业务办理过程中采集和产生的数据。
第二类民意社情数据:对社会企业个人对象进行统计调查获得的数据。
第三类环境数据:通过物理设备采集获得的气象、环境、影像等数据。
在以前的电子政务建设阶段,政务信息资源开发利用更多的是集中在前两种类型和结构化数据上,而对第三类数据,特别是实时的、非结构化、半结构化数据的开发利用相对较少。
随着政府业务在互联网、移动互联网、物联网等领域广泛和深入的应用,第三类数据的数据量和价值都在迅速增长,相关数据处理技术也逐步成熟。
便于区别不妨把包含第三类数据的政务信息资源叫做是政务大数据。
政务大数据与其他领域大数据相比具有鲜明的特点:体积大,增速高:涵盖经济社会管理的方方面面,数据积累量巨大。
每年处理的数据呈指数级增长。
种类多,价值大:以宏观经济基础数据为例:涵盖经济、社会、医疗、环境、工农业、教育、旅游等社会关键领域数据,具有极为重要的社会和经济价值。
垄断性,难获得:政府部门及公共企事业单位采集数据有些是专营的业务,一般企业是采不到,也买不到。
通过以上可以看出,政务大数据同传统数据相比,不仅包括结构化数据,更包括大量非结构化数据,且具有数据量大、应用价值大、速度快、种类繁多等特点。
我们要高度重视大数据应用对政务工作正在带来和将要带来的各种影响,充分认识推进大数据应用的必要性和紧迫性,加强顶层设计,分专业分步骤实施。
开展政务领域的大数据应用首先是观念、思路的转变,转变电子政务建设主体,由政府营造创新发展环境,引导企业为主体开展电子政务建设,同时,我们政府也需要在实际工作中给予支持和指导,一方面采用给予适当的政府补贴和协助优秀电子政务解决方案的推广应用等方式,帮助初创企业快速成长;另外,在社会服务领域,政府退到后台,提供数据和基础服务,让企业直接面向社会提供贴近需求的服务。
大数据在政务领域的应用可以涉及到政务领域方方面面,今天因为时间有限,就领导决策、社会管理、公共服务等几个方面做简单说明。
领导决策大数据的包容性将打开政府各部门间、政府与公众间的边界,信息孤岛现象大幅消减,数据共享开放成为可能,而数据开放使得公众更多的参与决策,这势必直接影响组织怎样作决策、谁来决策,甚至将改变决策过程和结果,同样会带来如下本质的改变:直觉的判断被迫让位于精准的数据分析,人类必须依靠数据作决策,甚至将决策权完全交给数据。
公众多途径参与,必将深入影响政府决策。
社会管理政府数据与互联网数据相结合,分析艾滋病。
公共服务通过对政府面向市民的互动数据的分析,为市民提供更精细化和个性化的服务,如对政府呼叫中心海量非结构化的语音数据、服务过程和服务问题的分析处理,深度挖掘客服语音数据价值,可以更好的支撑服务和营销,进一步改进政务呼叫中心工作。
另外通过大数据搜集和分析民众关心的问题,包括舆情、口碑等。
为市民提供更好的服务。
二、政务大数据应用基础和前提开展政务大数据应用,需要具备哪些基础工作和必备条件。
在政务领域开展大数据应用并不是从零开始,我们各级政府开展电子政务工作已经多年,在很多领域都做了很多工作,为政务大数据应用奠定坚实的基础,归纳起来有以下几个方面:在信息资源管理的规章、制度、标准方面,国家和北京市政府相应制定并出台一系列规章制度,如《关于加强信息资源开发利用工作的若干意见》(中办发[2004]34号、《中华人民共和国政府信息公开条例》(国务院令第492号,2007)、《关于加强政务信息资源管理的若干意见》(京信发[2009]2号)、《北京市信息化促进条例》(2007),第三章为信息资源开发利用、《政务信息资源共享交换平台管理办法》(京信办发[2008]13号)等。
强化政务信息资源管理的基础工作,如为加强电子政务基础工作,2006年市信息办发布《关于加强部门电子政务基础工作的通知》,要求全市各部门按照“四清两统一” 要求,做好业务、服务和信息资源梳理与目录编制工作等基础工作。
信息资源基础建设设施方面,包括建立了完善的市共享交换平台、物联网应用支撑平台、移动管理平台、政务云、四大基础库、各类重要信息系统及信息资源库350余等基础设施及核心业务信息方面工作。
这些工作为开展政务领域大数据应用奠定坚实的基础。
三、北京市市级大数据平台顶层设计框架大数据在政务领域应用,区别于以往重要一点是:更加强调的事政务大数据的开放和共享,一是委办局之间政务数据资源的共享,二是面向社会公众开放政务数据资源。
政府部门及相关公共企事业不但要尽可能地开放数据资源,还要以购买服务或资源换投资等方式引入政务应用与服务,发挥社会与市场的力量改善政府服务能力。
政府数据的开放共享是大数据在政务领域应用的条件或前提。
一些单位,如北京、上海分别建立了专门的网站,汇集各政府部门可开放的、有经济和社会利用价值的数据资源,为社会企业或个人服务开发者提供各类实时与非实时数据的下载和服务,目前已经取得了一些的成效,并举办了推广活动。
如北京市政务数据资源网,成功举办了“2014年北京市政务数据资源网应用创意大赛”,得到了社会公众广泛的关注,也涌现出了“晒公益平台”、“优质幼儿园、中小学招生地图”、“掌上交通综合信息服务”等一批优质服务产品。
作为北京来说我们已经有了共享交换平台、物联网平台还有政府数据开放网站等重要的信息化基础设施,为什么还需要重新规划一个市级的大数据平台?它与现有的这些平台和系统是什么关系?与各委办局的大数据应用系统又是什么关系?这是由他的功能定位来确定的。
这个平台不同于以往的共享交换平台,强调的是数据的融合、使用、落地。
有些数据比如涉及政府内部数据如人口数据、医保数据等是买不到的。
还有视频数据不是可以随便安摄像头采集的。
还强调了对现有平台、系统及数据资源的调度管理。
(一)平台定位及与其他系统关系与委办局大数据应用系统关系:首先,各委办局或区县可以按照自身业务需要建设大数据系统,也可以为市级大数据平台提供部分数据,并可以从市级政务大数据平台获取各类大数据资源。
其次,各专项大数据应用是在各委办自己大数据应用系统中完成。
与现有信息化基础设施与系统关系:市级政务大数据平台充分利用原系统和平台已经实现的功能,并融合现有数据和新数据,具有现有系统无法实现的海量数据快速处理能力。
(二)市级政务大数据平台的功能目标提供各类数据的融合与共享服务;提供空间、法人、人口基础融合数据资;提供大数据目录的注册、发布、查询、获取、应用等服务。
向各委办局大数据应用平台提供大数据服务支撑,通过首都之窗、Data网站等办公门户向政府部门和社会公共提供数据使用服务。
为需求单位提供大数据处理通用接口及工具,并统一实现与外部数据的接入服务。
通过物联网平台、互联网平台、共享交换平台等信息化基础设施和系统汇集、存储、分析相关数据资源。
强调了对各类数据的处理能力,包括对结构化的、非结构化的、音频、视频、包括各种结构的数据处理能力,特别是有来自于物联网的实时数据,和互联网的日志数据等。
下面我们来看一下,市级大数据平台的业务模型框架、数据模型框架、技术模型框架。
(三)总体功能架构(四)核心功能(1)对基础库、物理网数据、互联网数据、外部数据的采集汇聚。
(2)对以结构化数据为主的传统数据的融合处理。
(3)对以非结构化、音频、视频等新型数据为主的融合处理。
(4)数据质量管控:通过对数据,应用,系统综合管理,构建标准化、流程化、自动化、一体化的数据管理体系。
(5)跨平台调度实现数据互联互通,统一管控:提供跨系统跨平台的任务调度功能,与各子系统紧密接合,涵盖接口子系统、维护子系统、云平台、接口分发平台。
(五)技术架构政务大数据平台的技术架构采用混搭模式,一方面不改变已有的原始数据的存储和管理方式,另一方面,采用大数据新技术处理原有方式不能处理的新数据,重点是对非结构化、新数据的处理。
首先,各委办局通过市级大数据平台可以实现数据的共享和融合,并在此基础上开展各自的大数据应用,如北京市有很多部门负责并参与中小企业数的统计工作,如地税、海关、工商、经信委等,这些部门均有各自数据采集的渠道和途径,但是北京市到底有多少中小企业,每个部门都很难说清楚,也无法统一,对于这个问题,通过市级政务大数据平台数据比对、分析、处理,再经过一定的算法得出大家一致认可的统一的中小企业数和清单,并在此基础上进行数据分析、数据查重等融合处理,使得原有单纯交换来的数据,产生了本质的变化。
其次,市级政务大数据平台具备新数据、非结构化数据的处理能力。
各单位不具备通用数据的处理以及非结构化数据的处理能力和基础设施,而市级政务大数据平台,充分利用市共享交换平台、四大基础库、一系列门户和网站实现数据的统一调度和管理,促进数据交换和共享。