当前位置:文档之家› 电子政务信息交换平台与数据中心的构建

电子政务信息交换平台与数据中心的构建

电子政务信息交换平台与数据中心的构建

摘要:我国绝大多数政府部门都已经建立起自己的业务系统,并在日常业务处理中发挥着重要的作用。由于受各种条件的限制,在建设初期各部门独立建设自己的系统,导致信息孤岛现象大量存在,严重制约了电子政务的进一步发展。通过针对具有同一服务对象建立业务数据交换平台,实现了政府部门间数据共享互联互通需求,解决电子政务中“信息孤岛”问题。电子政务数据中心经过近几年发展,从存储数据概念演变成为数据加工、数据挖掘和决策支持,通知识管理组织和管理数据,并为政府部门和公众提供多种信息服务。

关键词:业务数据交换平台数据中心业务数据整理中间件工作流管理信息孤岛搜索引擎数据仓库决策支持

信息化程度的高低已经成为衡量一个国家综合国力和国际竞争力的主要指标之一。大力推进信息化建设,是顺应时代潮流和世界发展趋势的重大决策,是实现工业化、现代化的必然选择,是促进生产力跨越式发展、增强综合国力和国际竞争力的重要的战略举措。目前,据统计,我国的各级政府部门掌握着全体社会信息资源的80%。在这些掌握社会信息资源的各

部门系统间,不同程度地存在着信息交换和共享不畅的问题:最差的既不互联,也不互通;稍好一点的网络互联但信息资源不能互通;比较好的虽然信息可以“互联互通”,但各部门间的业务却不能协同。如何提高政府部门信息系统的工作效率,充分发挥信息资源的作用,是当前电子政务发展的一个新课题。本文将重点讨论电子政务的数据交换和数据资源建设问题,有关电子政务信息安全问题另文专题讨论。

一、电子政务发展历程与趋势

我国电子政务在二十年的时间里,经历了一个内涵不断丰富、地位不断提高、作用不断增强的发展过程。二十年的电子政务发展虽然促成了一个繁荣的IT市场,但带给我们则是更多

的启示和反思。虽然各级政府都大力推进了信息化建设,但有效信息的利用率低,政府部门内部以及部门之间信息衔接不紧密、信息汇总与实时的综合处理能力弱, "信息孤岛"、重复建设、资源浪费、共享程度低、标准不统一等现象仍然比较突出,已成为我国电子政务建设中共性的关键性问题。通过建立标准规范的信息共享互联互通的信息管理支撑体系,实现政府信息资源建设、管理和应用的一体化,不断提高政府部门经济调节、市场监管、社会管理和公众服务的水平,已成为我国电子政务建设的当务之急。

电子政务信息共享互联互通就是将数字化的政务信息资源(包括政务工作流程,政府法规,

政府公文,政府部门的职能分配,政府公务员和工作人员等各方面资源)进行共享、交互与

流通,从而达到管理信息的准确性、及时性、一致性、和协同性,为正确的分析和决策提供

可靠的依据,同时也为新决策的实施与部署,政府服务管理职能的优化提供信息交互和部署的平台,使电子政务信息化建设实现从前端应用,信息共享与流程的交互,政务决策,到决策的实施与部署的端到端的全流程管理。

电子政务发展历程与趋势图

第一阶段起步阶段

二十世纪八十年代初计算机技术开始向民用领域广泛普及,发达国家已开始将这一高科技技术应用于公共行政管理。受此影响,1987年国务院在北戴河召开了全国政府办公厅系统办公自动化工作会议暨全国政府办公厅系统软件交流会。1988年,全国政府办公厅系统办公自动化工作协调小组成立,从此我国开始了电子政务的建设。1992年,为了推进政府机关的自动化程度,在政府机关普及推广计算机的使用,国务院办公厅下发文件《国务院办公厅关于建设全国政府行政首脑机关办公决策服务系统的通知》(国办[1992]25号文件)。

在九十年代初,随着计算机技术与网络技术的迅猛发展,国内外基本上没有谁坐下来认真思考计算机网络技术到底该怎样运用更有效,只是蜂拥而上。厂商们为了争取更多的经济利益,他们不能也不会引导用户者理性建设应用系统;许多政府部门在信息化大背景下,不管用得着还是用不着,就糊里糊涂卷入信息化的浪潮中;当时没有一个针对信息化工作进行长远规划,也没有出台统一的标准,致使各地政府部门重复投资建设的情况十分严重。另外,政府部门之间的条块分割严重,部门壁垒森严重,使致各自建立的系统之间互不相联,从各自的部门利益出发,不但不加强信息共享,反而加强信息封锁。由此形成了一个个“信息孤岛”。

从历史发展的角度来看,“信息孤岛”出现在当时来说是电子政务的一大进步,到九十年代后期,电子政务经过十年的实现从无到有的飞跃,各政府部门基本上建立自己的信息系统,实现了部门内部的信息化。

第二阶段信息传递

进入九十年代后计算机网络大规模普及应用,政府部门内部实现了从单机作业到网络化处理的转变,是以“金”字头为代表的多项工程取得了突破性进展。1993年,国务院信息化工作领导小组拟定了《国家信息化“九五”规划和2010年远景目标(纲要)》,国务院要求当时的电子部与有关部委大力协调,抓好几项重大的信息工程。从1993年起,我国开始实施金桥、金关、金卡和金税等信息化重大工程。金桥工程是直接为国家宏观经济调控和决策服务,通过建设政府的专用基础通讯网,实现政府之间的相互连接。计划建成一个连接全国各省市区、400多个城市,与几十个部委互联的专用网。金关工程主要是为提高外贸及相关领域的现代化管理和服务水平而建立的信息网络系统。到1999年,已实现了银行、外汇管理机构以及海关的计算机联网,在关税管理中发挥了重要作用。金卡工程是推动银行卡跨行业务的联营工作,现已取得了重要进展。金税工程的首期工程已经完成,主要是建立税务系统的增值税专用发票计算机稽核系统。

金字工程基本上实现了政府部门内部业务数据和公务信息的传递,但是,由于没有现实跨部门的数据共享,部门壁垒依然存在,信息孤岛现象并未消除。

第三阶段数据共享

1999年1月,政府上网工程主网站https://www.doczj.com/doc/579698593.html,正式开通试运行,成为我国政府上网的导航中心和服务中心。2001年,国务院办公厅制定了全国政府系统政务信息化建设的5年计划,即《全国政府系统信息化建设2001-2005年规划纲要》。对我国政府信息化的指导思想、方针、政策等做出明确的规定。

随着电子邮件技术和新一代办公自动化系统在电子政务中得到了广泛应用,政府各部门基本上实现了数据共享。通过建立目录服务等共享数据库,以手工录入或导入导出等方式,将数据、文档等存入共享库中,作为共享信息,实现对所需信息的便捷检索和查询。共享数据库是目前常用的共享技术,其相关应用一般建立在数据库技术基础之上。共享信息一般分为结构性数据和非结构性数据。

由于共享数据库技术没有建立完整的、自动的信息采集、共享体系,信息录入就成为一项费时费力的工作。随着信息系统地大量增加和信息来源的多样化,共享数据库中的信息经常因

为不能及时更新而失效。其次,由于共享数据库技术要求在系统设计阶段就确定数据结构,一旦数据格式或数据结构被确定下来,新增共享信息来源和相关应用的扩展性等存在难题。

第四阶段数据交换

在电子政务网络中,无论是横向还是纵向的部门间,都存在着大量的数据交换需求。为完成这些数据交换任务,一般都会规划一个统一的数据交换系统,作为其他业务系统的底层平台,提供系统内各业务部门间的数据递送服务。为解决电子政务数据交换问题,2002年国务院信息化办公室选择了北京、上海、杭州、青岛四个城市进行企业基础数据交换平台试点建设。

企业基础信息交换信息系统平台,是用于实现工商行政管理部门、税务部门及质量技术监督

部门之间企业基础信息资源共享的业务管理和实现的平台。杭州市试点建设最为成功,系统投入使用3个月内杭州市工商部门通过该系统检查出有23.6%的新增工商户未办理税务登记,有9.8%未办理组织机构代码注册登记,杭州市历年共有税务登记漏管户达11718户,各相关部门积极对不正常企业数据进行分析、处理,积极通过各种方式对漏管户进行催登,对监管薄弱环节及时进行了整改。杭州市企业基础数据交换平台试点建设取得了显著的效果。国信办[2005]10号文是在总结北京市、青岛市、杭州市、深圳市四城市开展企业基础信息

交换试点,特别是杭州市经验的基础上,向全国发布企业基础信息交换平台系统建设的指导性文件。

第五阶段数据中心

2004年上海、北京、武汉等信息化程度较高的大城市开始建设数据中心或数据资源中心。经过十多年的信息化建设,政府各部门均建造了自己的业务处理系统,保存并不断产生着大量的数据信息,为了集中利用这些数据资源,一般的方式是建立统一的政府数据中心,将分散在各部门的公共信息采集到数据中心集中管理,各数据使用部门通过访问数据中心实现信息的共享。

1.跨业务再交换,实现异构数据的整合。由于在电子政务初期建设过程中缺乏统一的数据标准、各部门采用的数据管理技术差异也比较大,经过业务的数据交换之后,只能实现以单一的对象为数据交换。因此,通过建立跨业务再交换系统,完全实现以将各种异构数据进行整合,是建立电子政务数据中心的基本要求。

2.建立信息搜索与数据资源中心。按照国务院《全国政府系统信息化建设2001-2005年规划纲要》的要求,各级政府必须要建立“三网一库”体系。政府机关内部的办公业务网;国务院办公厅与各地区、各部门连接的办公业务资源网;以因特网为依托的政府公众信息网;政

府系统共建共享的电子信息资源库。通建立基于多种渠道的各种异构数据采集系统,并将采集到的数据存入信息资源库。为方便用户检索信息,建立基于电子政应用的搜索引擎。针对外网数据资源建立Web信息检索;针对内网建立基于XML的分布式搜索引擎;针对专网建立元数据搜索引擎。

3.建立数据挖掘与决策支持系统。应用数据仓库技术,对社会重大决策产生影响的统计分析数据,利用现在的信息资源进行深入的知识挖掘。并成为政府各种业务系统、政府部门之间协同工作的数据中心,是政府门户的信息中心、多媒体、文档资料和政策法规的存储中心和预测决策所需的数据仓库中心。

二、业务数据交换平台

业务数据交换是实现跨政府部门间的数据交换,它以单一的业务对象信息(如企业基础信息)在不同的职能部门间为交换基点,实现不同职能部门之间的业务协同和信息共享。业务数据交换的基本架构包括了单一元数据标准、前置交换机系统、信息交换总线(中间件)和工作流管理四大部分组成。

(一)电子政务数据交换体系的选择

电子政务数据交换是随着电子政务发展互联互通的需求日益增加而产生的,政府管理本身的复杂性,决定电子政务结构的复杂性,要实现政府各部门之间进行交互式办公和处理大量为公众服务的事项;而每一个部门的管理业务本身又是一个相对独立的系统,业务差别很大,要使这些不同业务部门的政府机构之间实现互通互联,做到“一线式服务”,是一个非常复杂的问题。如何从根本上解决各部门、各系统之间的数据交换,主要有三种方式:

1.点对点互连。此种方式最为简单,两个系统之间各写一个接口就可以实现数据的交换。一个地级市政府部门多达几十个,他门之间的数据交换呈网状交换,很明显,以局的信息系统即所谓信息孤岛为单位设计同其它局交换的信息交换,其代价、技术的复杂度是相当高的。这种集成的方式是用手工编程,对每一个单位都要开发一个接口。如果有N个应用系统需要集成,就需要建立N(N-1)/2个接口程序。如果一个政府有100个部门,其接口程序的开发工作量是可想而知的。如果某个单位的信息系统发生变化,则相应的接口都会要进行调整。

2.数据交换中心。各应用系统与数据交换中心相连,通过数据交换中心来实现数据共享和路由。这种连接方式实现了数据的无缝交换和共享访问,保证了各业务系统的有效协同,同时又能保证各应用系统的相互独立性和低耦合性,从整体上提高了系统运作效率和安全性。

如果采用数据交换中心技术,则只需要16个接口,比点对点互连方式要优越得多。然而,是不是一个城市只要建立一个统一的交换平台系统就能处理完这如此巨大的社会信息资源呢?从节省投资和效益最大化的角度来看这似乎并没有什么错。经过这几年国内的实践情况看,这个大一统在数据交换中心的模式在具体的应用中遇到了巨大的困难,为什么有一些城市信息共享互联互通屡遭失败呢?是部门壁垒?是数据形态复杂?还是技术实现有问题?这些事实一方面说明了我国电子政务的复杂程度,另一方面方面也说明了技术实现不可能一促而蹴。

3.业务数据交换。以单一的业务对象信息(如企业基础信息)在不同的职能部门间为交换基点,实现不同职能部门之间的业务协同和信息共享。业务数据交换不同于数据中心式的交换,首先它选择关联度高的业务实体,企业基础数据为中心开展政府各主管部门的业务,其他与企业基础数据无关的业务均不纳入交换系统当中。其次,平台共同拥有一个唯一标识,例如企业基础信息交换平台以企业组织机构代码做唯一标识,在面向企业服务的部门中形成了它之间与企业紧密的服务关系。事实上,电子政务数据交换将被划分为业务数据交换和跨业务的数据交换。

业务数据交换体系结构图

2002年10月25日,国务院信息办、国家工商行政管理总局、国家税务总局、国家质量检验检疫总局联合下发了《关于开展企业基础信息交换试点的通知》(国信办〔2002〕62号),

选择北京市、青岛市、杭州市、深圳市四城市,开展工商、国税、地税和质量技术监督部门之间的企业基础信息交换试点。经过一年的试点,杭州市企业基础数据交换平台系统取得了显著的业绩。2003年4月,国信办在杭州市召开了《国家信息化专家论坛》会议,对杭州经验做了深入研讨和评估,主要有以几方面因素:

1.减少系统的复杂程度。社会信息资源一个复杂的系统,无法用一个平台进行交换,但可以拆分成多部件,使这些业务的复杂程度要低于整个系统。杭州市企业基础数据交换平台系统仅局限于工商、国税、地税和质量技术监督四个部门,这就大大降低了系统建设的复杂程度。

2.选择关联度高的业务体。杭州市企业基础数据交换平台系统就是紧紧围绕着企业基础数据开展政府各主管部门的业务,其他与企业基础数据无关的业务均不纳入交换系统当中,系统目标非常明确。

3.具有完整的业务数据功能。工商、国税、地税和质量技术监督均为面向企业服务的部门,其服务架构所针对的是同一种数据标识,即企业组织机构代码,并形成了它之间与企业紧密的服务关系。

国信办[2005]10号文是在总结北京市、青岛市、杭州市、深圳市四城市开展企业基础信息交换试点,特别是杭州市经验的基础上,向全国发布企业基础信息交换平台系统建设的指导性文件。因此,要充分理解国信办[2005]10号文的精神,从技术架构上更多的吸取杭州市的功能经验,按具体的服务应用架构去构建企业基础信息交换平台系统,尽量避免应用上的风险。

(二)业务数据交换台平总体架构

业务数据交换平台系统总体框架由交换前置机系统、数据交换总线系统、交换中心数据库、流程管理和服务监控系统。

业务数据交换台平总体架构图

(以企业基础数据交换平台为例)

1.交换前置机。连接交换前置机与数据交换中心的网络系统(通常为政务内网),交换前置机的操作系统、前置交换数据库、数据交换通讯接口、数据交换桥接接口、前置交换安全管理模块等组成。交换前置机的主要任务是由部门业务数据库到前置交换机数据库之间的信息交换桥接接口,以完成两个信息库之间的在线实时交换。

2.数据交换总线:通过数据标准对比,实现不同部门前置交换信息库之间安全、可靠、稳定、高效的信息交换传递系统。数据交换总线的技术核心是数据交换中间件系统。

3.中心数据库:是以对象的原始数据(如企业登记注册信息)为基础,以元数据主键(如组织机构代码)为唯一标识,经在线实时交换及信息比对后形成的中心数据库。各部门业务数据库与交换中心之间共享信息双向交换的中转数据库。包括部门对外发布的信息和从其他部门接收的信息。

4.管理与服务系统:由数据比对、对象基础信息库管理与维护、日志管理、用户及权限管理、数据备份以及对整个交换运行情况的监控等部分组成。

(三)业务数据交换中间件系统

业务数据交换中间系统是通过集成不同应用系统之间形成松耦合连接,实现信息交换、路由、分发、转换等功能。数据交换系统主要以消息和异步通讯技术为手段,面向服务体系为框架,服务总线为基础,XML 为信息描述语言,实现各应用系统间的集成。

业务数据交换中间件系统结构图

业务数据交换中间件系统由基础服务、消息服务、消息代理服务三部分组成。内置安全和目录管理提供安全认证、信息加密传输和资源访问控制等功能。同时,提供系统管理工具,实现系统的分布式远程管理和监控。数据交换系统的主要功能有以下5个子系统构成

1.基础服务

基础服务主要包括MBean服务、SOAP 服务、Web 服务、XML 消息封装、目录服务和基于PKI 技术的安全认证系统。

l 基础服务提供用于管理服务的MBean服务,实现组件的可管理(包括远程管理和部署)。利用Web 服务、SOAP 服务、XML 消息封装实现基于Web 服务技术的信息封装、信息交换和应用整合,以服务描述语言格式封装业务系统,对外提供Web 服务接口。

l 基础服务提供LDAP 或UDDI 等目录服务,实现服务的注册、查询、检索等功能。基础服务提供符合PKI 规范的安全认证系统,实现消息摘要、身份认证和消息加密功能;同时,提供和外部安全支撑系统的接口,连接符合PKI 规范的外部安全支撑平台。基础服务还提供消息队列存储、事务控制、双机热备、错误处理等服务,以保障基础服务的稳定性和可靠性。

2.消息服务

消息服务将数据以“点到点(Peer to Peer)”方式或“发布/订阅(Pub/Sub)”方式传送,支持基础服务提供的HTTP、HTTPS、RMI、SMTP、SOAP 等多种传输协议。消息服务的主要功能是:

l 支持Web 服务和消息队列两种消息传输机制,保证平台对不同系统的适应性;信息以XML 格式表示,数据交换和传输通过HTTP 等传输协议,数据打包采用SOAP 技术标准。

l 提供可靠的信息传输,支持大规模信息发布、消息队列的存储保护、传输确认、断点续传、一次性传输和消息压缩传输。

l 提供符合PKI 规范的安全信息传输功能,支持SSL 传输、消息报文和消息内容加密等不同级别的安全保护措施,支持消息摘要、数字签名、消息加密。

l 支持局域网(LAN)和广域网(WAN)消息通信,支持静态和动态IP 地址。

l 基于消息软总线的体系结构,利用智能化的信息路由传输机制,动态地实现点到点、点到多点和多点到多点等不同的信息通信方式,支持多播(Multicasting)功能。

l 提供灵活方便的应用开发接口,便于二次开发;提供易于使用的部署工具,方便系统实施。

l 提供易于使用的远程管理接口和图形化界面,实现集中管理。

l 提供和其他消息系统之间的消息传输和转换。

3.消息代理服务

消息代理服务提供消息的传递、转换、过滤、映射和路由等功能。根据设定的消息格式规则和转换规则,进行消息格式的转换。同时,根据消息路由规则,实现消息的路由,并将消息传递给相应的应用系统。

4.消息转换

消息转换根据转换规则,实现不同数据存储格式和表示格式的转换。消息转换规则支持XSLT 语言,用户可自定义消息传输格式。消息传输提供图形化的转换工具,利用图形化界面,将一种应用数据格式“映射”到另一种数据格式,转换工具能够自动生成转换规则文件(XSLT 文件)。转换功能支持XML 和数据库之间、不同数据库之间、不同XML 之间的转换。转换规则文件可以动态地部署到数据交换系统中。

5.消息路由

根据消息路由规则,消息路由服务实现消息在不同的数据交换系统之间和不同消息队列之间的路由。消息路由支持两种路由规则:

l 基于内容的路由根据消息的内容,消息路由按照定义的规则将特定内容的消息路由到不同的数据交换系统或消息队列中。

l 基于消息头的路由根据消息头中的目的地进行消息路由。

(四)业务数据交换工作流程管理

业务流程管理系统是信息交互与管理的中枢,是应用系统间业务流程整合和信息纵横传输的控制中心。流程管理系统基于应用集成技术和Web服务技术,独立于具体应用之外,提供流程设计、重组、部署、管理、监控、审计、优化的环境。流程管理系统提供一系列工具以便设计、修改、监控与管理业务流程及各流程节点对应的服务。流程管理系统支持面向服务、流程驱动的体系结构,既可以将现有不同应用系统的流程协同起来,也可以将新应用系统的流程统一起来,最终将业务流程调整、管理、设置的权力从IT 技术人员手中移交给业务人员。

流程管理系统的体系结构图

流程管理系统的核心组件包括:流程建模、流程模拟、流程运行环境、流程仓库、流程部署、流程管理和监控、流程审计和流程分析与优化。流程管理系统对业务系统的调度,通过应用集成系统和应用适配器系统实现。流程管理系统的主要功能有以下个方面:

1.流程建模。由于一个业务流程包含若干节点,每个节点对应一项操作,各个节点以及节点之间的相互关联构成业务流程。通过提供流程建模和设计工具,对业务流程规则与过程进行定义。

2.流程模拟。通过流程仿真运行环境,对设计完成的业务流程模拟运行,检查流程定义和各个节点配置正确与否,进行流程分析,提供各个节点资源消耗情况报告等。

3.流程运行环境。流程运行环境是流程管理系统的核心部分,它为流程的运行提供虚拟机、状态存储、流程数据存储、服务的调度、任务的分配等核心服务。流程运行环境提供基于Web 服务的外部调用接口,实现对流程定义、流程状态、流程数据、系统管理的查询、更改和监控。同时,还支持跨平台和Web 服务技术。

4.流程仓库。流程仓库提供流程定义的发布、更改、删除和版本控制,以及相关服务的注册、索引、查询、更改和删除。同时,还提供外部应用服务接口的定义和调用。

5.流程部署。提供流程发布工具,将设计好的流程发布到流程仓库中,供流程运行环境使用。

6.流程管理和监控。实现流程调整、系统性能监控、系统异常处理等功能。

7.流程审计。对流程实例的创建、资源的应用、执行的日期、执行的人员、流程的结果等进行审计。

8.流程分析与优化。提供流程的统计报表,分析流程运行中的数据(如资源的利用率、成本、时间等),对流程中影响性能的节点进行优化。同时,提供与不同分析工具的接口。

三、电子政务数据中心

电子政务数据中心归根结底应该以服务于政府和社会为宗旨。对政府来说,应当使政府行政管理、应急指挥和快速反应的能力进一步提高,做到科学、高效的宏观管理和决策。对社会及时发布大量有价值的政务信息,引导企业自主走向市场,对经济发展和社会进步进行导向,减少盲目性。

(一)数据中心总体结构

在政府信息资源开发和应用上,要在体现政府信息公开和面向社会服务的原则基础上,制定政府信息库建设规范、信息资源采集、加工和发布以及管理实施标准,关键是制定统一的规

划和技术标准,以此规范电子政务的可持续发展。保证政府信息资源在政府机构内部实现畅通流转、共享。从这个意义上说,政府信息资源库应当是一个“大、全、精”的政府信息数据库群。

电子政务数据中心结构图

数据中心数据资源库

数据中心的基础是数据资源库,它由业务数据资源数据库、社会资源数据库和元数据库组成

业务数据库由基础数据库、主题操作数据库、办公数据库、公文数据库等组成基础数据库包括人口数据库、企业基础数据库、空间地理和自然资源数据库、以及宏观经济数据库等。主题操作数据库,存有经常使用的业务数据,可存在数据中心,但大量的是以目录形式存储,而其数据总是存在各局委办,这样既保证了数据的动态更新的一致性,也保证了数据的安全性。办公数据库,记录政府系统办公的数据。并联审批,用户使用状态日志以及进行平台管理,电子政务系统维护管理的数据。该项数据根据相关平台工具和业务系统进行定义和维护其结构模型遵循关系数据库的设计原则。文本资料数据库,主要包括国家的政策和指令,本市的资料和条文等信息。在国家政府机构,这样的资料显得额外重要,离开了它,就不能保证各项工作正常进行的方向。目前机关的相关资料以纸面的居多,一些比较少的在库中存放的资料也是以扫描方式进入,因为各单位资源的共享问题,并没有做到资料的互通,查找资料的过程可能就是一个费时费力的过程。

社会资源数据库由互联信息数据库、多媒体资料数据库、电子商务数据库组成。互联信息数据库由互联网信息采集系统按一定要求自动抽取,便公众和政府工作人员方便检索到互联网上的资料。多媒体资料数据库包括各种政务图像、视频,用于宣传报道和视频点播。电子商务数据库是企业交易过程的记录、供求信息和信用信息。

元数据库,建设目标是建立全市统一的政务数据字典和数据中心的元数据模型。该数据库由两部分组成:一是政务数据字典,包括政务叙词表,信息分类、代码和指标体系表。主要用于各职能部门的信息联接与交换。二是数据中心元数据,具体可包括数据模型定义、数据抽取规则、映射转换规则、主题定义、资料分类和维度定义、决策模型定义等等。

基于数据中心资源库的服务体系

政府决策信息,如国家和地方的政策、法规条例、决策咨询、战略发展研究报告(包括各职能机构和院所历年的研究成果)和阶段性的总体规划等;

社会服务信息,如国际国内重大政治新闻、经济运行分析、热点透视、社情民意动态、税收征管、统计报表、市场供求信息、社会与经济预测信息、金融财经信息、科技与人才信息,等等;

政府交流信息,政府部门之间因工作职能的需要交换信息,如各种公文、会议情况、总结报告、记录数据、办公文档、机关行政管理信息、经验介绍、驻外办事处等工作流信息。

应对事件预案,整个城市的各类资源要素储备和分布状况,行政组织及人力资源调配预案,对自然灾害和意外事故的处理,重大突发事件的应急预案。

城市地理信息,如城市地理状况、地下网、管、道和线的分布结构,以及城市规划与发展的思想库以及城市发展和政府行政的历史沿革等信息。

(二)业务数据整理系统

业务数据整理系统是数据中心的一个重要组成部分,是数据中心的门户,它实现不同业务数据平台之间的数据交换、共享和业务流程的对接,实现异构数据整合。

业务数据整理系统结构图

提供对各种数据库系统的访问能力,以实现异构数据库的互联。

提供不同数据格式间的自动转换能力,以保证各种格式的数据均能够按政府数据中心的规范格式存入数据库系统。

提供数据的过滤、填充功能,以实现抽取来源于各种系统的数据内容能够满足数据中心的要求。

提供数据库同步机制,以实现将各业务数据交换平台的中心数据库中的数据自动同步到数据中心的数据库中。

(三)信息资源搜索引擎

网络检索最常用的检索工具就是搜索引擎。所谓搜索引擎(SearchEngine)实际上是专用的WWW服务器,它利用自动搜索软件(如robot,spider,harvest,persuit等)沿着WWW超链,搜索整个WWW上的主页,然后为这些主页的每个文字建立索引并送回集中管理的索引数据库。索引信息包括WWW地址,每个文档中单字出现的频率、位置等。搜索引擎大多采用集中抓取信息,它们努力遍历整个互联网,对遍历的文档生成全文索引,供用户检索。

互联网搜索引擎的基本结构图

基于互联网的搜索引擎,大多采用的是集中式抓取的方式,努力遍历整个互联网,对遍历的文档生成全文索引,供用户检索。然而,任何一个搜索引擎都不能覆盖全部互联网,据不完全统计,目前最好的搜索引擎也只能查询约三分之一的Web页面。如想获得一个比较全面、准确的结果,就必须反复运用多种搜索引擎,这无疑增加了用户的负担。元搜索引擎的出现,在一定程度上解决了这个问题。

元搜索引擎(MetasearchEngine)是建立在搜索引擎之上的搜索引擎。用户只需递交一次检索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将所有的查询结果集中起来以整体统一的格式呈现在用户面前。元搜索引擎采用了一系列的优化运行机制,能够在尽可能短的时间里提供相对全面、准确的信息。

一般地,元搜索引擎包括:检索请求提交机制、检索接口代理机制和检索结果显示机制。“请示提交”负责实现用户个性化的检索设置要求,包括调用的搜索引擎、检索时间的限制、结果数量的限制等。“接口代理”负责将用户的检索请求“翻译”成满足不同搜索引擎的“本地化”要求格式。“结果显示”负责所有元搜索引擎检索结果的去重、合并以及输出格式处理等。从检索机制角度来看,元搜索引擎是一种分布式信息检索系统。由于其检索覆盖面广,系统相对简单,因而发展迅速。

-

基于元数据XML的分布式信息检索过程图

(四)数据仓库与决策支持

数据仓库(Data Warehouse,DW)是指来自于异地、异构的数据源和各种数据库的数据经加工后在一种称之为数据仓库的存储地存储、提取和维护。数据仓库既是一种结构和富有哲理的方法,也是一种技术。数据和信息从不同的数据源提取出来,然后把这些数据转换成公共的数据模型,便于用户的决策查询。

数据仓库体系结构

数据源:是数据仓库系统的基础,是整个系统的数据源泉。通常包括政府部门内部信息和外部信息。内部信息包括存放于各部门操作型数据库中的各种电子政务数据和办公自动化(OA)系统包含的各类文档数据。外部信息包括各类法律法规、社会信息以及各类外部统计数据及各类文档等。

数据的存储与管理:是整个数据仓库系统的核心。在现有各业务系统的基础上,对数据进行抽取、清理,并有效集成,按照主题进行重新组织,最终确定数据仓库的物理存储结构,同时组织存储数据仓库元数据。按照数据的覆盖范围,数据仓库存储可以分为数据中心级数据仓库和部门级数据仓库(通常称为“数据集市”,Data Mart)。数据仓库的管理包括数据的安全、归档、备份、维护、恢复等工作。

OLAP服务器:对分析需要的数据按照多维数据模型进行再次重组,以支持用户多角度、多层次的分析,发现数据趋势。

前端工具与应用:前端工具主要包括各种数据分析工具、报表工具、查询工具、数据挖掘工具以及各种基于数据仓库或数据集市开发的应用。其中数据分析工具主要针对OLAP服务器,报表工具、数据挖掘工具既针对数据仓库,同时也针对OLAP服务器。

数据仓库体系结构图

决策支持系统

决策支持系统和数据仓库执行的都是决策和趋势分析类的应用。决策支持系统中的一些技术可以很好地集成到数据仓库中,使数据仓库的分析能力更加强大。例如:决策支持系统中的传统统计分析模型可以帮助用户对数据仓库中的数据进行更加有效、更加深入的分析,从而更好地掌握和利用信息。

数据挖掘是数据仓库应用中比较重要且相对独立的部分,它可以从数据仓库的海量数据中提取出人们感兴趣的知识,这些知识是隐含的、事先未知的潜在有用信息。提取的知识以概念、规则、规律、模式等形式提供给用户。

数据仓库是面向决策分析的,具有从各种数据源抽取数据,并对数据进行清洗、聚集和转换等各种处理能力。从这个意义上说,数据仓库既是一个信息资源的存储机制,也是一个信息资源分析、处理的支持决策的系统。政府组织的决策行为依赖于信息资源的良好组织,因而基于数据仓库的政府信息资源存储必然成为主流的政府信息资源存储方式。

参考文献

1.《全国企业基础信息共享实施要求》国信办[2005]10号文附件

2.《电子政务信息共享互联互通平台总体框架技术指南》国办秘函[2004]79号文附件

3.《关于开展企业基础信息交换试点方案》国信办[2002] 62号文附件

4.《企业基础信息交换试点方案》国信办[2003] 47号文附件

5.《国务院办公厅关于建设全国政府行政首脑机关办公决策服务系统的通知》(国办[1992]25号文件)

6.《可视化数据挖掘》[美]Tom Soukup著电子工业出版社2004年版

7.《数据挖掘原理与算法》邵峰晶于忠清编著中国水利水电出版社2003年版

8.《电子政务技术》苏新宁吴鹏朱晓峰闵东编著国防工业出版社2003年版

9.《政府信息资源开发与管理》李绪蓉徐焕良编著北京大学出版社2005年版

10.《电子政务技术导论》陆敬筠邵锡军编著北京大学出版社2005年版

相关主题
文本预览
相关文档 最新文档