第二章 空间数据结构和空间数据库
- 格式:doc
- 大小:262.00 KB
- 文档页数:14
二章空间数据结构及编码在当今数字化的时代,空间数据的处理和管理变得越来越重要。
空间数据结构及编码作为地理信息系统(GIS)、计算机图形学等领域的基础,对于有效地存储、组织和检索空间数据起着关键作用。
首先,让我们来理解一下什么是空间数据。
简单来说,空间数据就是具有空间位置和几何特征的数据,比如地图上的点、线、面等要素。
这些数据不仅包含了位置信息,还可能包括属性信息,如土地利用类型、建筑物高度等。
空间数据结构则是指空间数据在计算机中的组织方式。
常见的空间数据结构有矢量数据结构和栅格数据结构。
矢量数据结构是通过记录坐标的方式来表示点、线、面等几何对象。
例如,一个点可以用一对坐标(x, y)来表示,一条线可以由一系列有序的坐标对来定义,而一个面则是由一个封闭的线来界定。
矢量数据结构的优点在于数据精度高、存储空间小、便于进行几何变换和拓扑分析。
但它在处理复杂的空间关系和大规模数据时,计算量可能较大。
相比之下,栅格数据结构将空间区域划分为规则的网格单元,每个单元对应一个数值。
这种结构适合表示连续变化的数据,如地形高程、温度分布等。
栅格数据结构的处理相对简单,但数据冗余度较高,精度可能会受到网格大小的限制。
在实际应用中,选择合适的空间数据结构取决于具体的需求和数据特点。
如果需要精确表示地理要素的形状和边界,矢量数据结构可能更合适;而对于大面积的、连续变化的数据,栅格数据结构可能更为有效。
接下来,我们谈谈空间数据编码。
空间数据编码的目的是为了提高数据存储和传输的效率,便于数据的管理和处理。
常见的空间数据编码方法有很多。
比如,对于矢量数据,常见的编码方式有坐标序列编码、多边形编码等。
坐标序列编码直接记录点的坐标,简单直观,但存储空间较大。
多边形编码则通过一些规则来减少数据存储量,提高处理效率。
对于栅格数据,常见的编码方式有直接编码、行程编码、四叉树编码等。
直接编码就是将每个网格单元的值直接存储,简单但效率低。
行程编码通过记录相同值的连续段来压缩数据。
嘉应学院地理科学与旅游学院《GIS原理及应用》考试大纲一、考试范围与要求考试范围为地理信息系统的基本知识、基本理论与方法、空间数据的基本特征和数据结构、空间数据库、空间数据处理和产品输出等的理论知识,要求学生了解GIS的发展历史和最新进展,掌握空间数据采集和处理的基本技术,熟悉空间分析和应用的一般方法。
二、考试形式与结构考试形式:闭卷、笔试,考试时间为120分钟,试卷卷面满分为100分。
考试结构:1、内容结构:基础知识:50分综合理解分析:50分2、题型结构:三、考试内容与评价目标第一章绪论(一)、评价目标1、识记GIS基本概念2、熟悉GIS的基本构成和发展历史(二)、考试内容1、数据:指输入到计算机并能被计算机进行处理的数字、文字、符号、声音、图象等符号。
数据是对客观现象的表示,数据本身并没有意义。
数据的格式往往和具体的计算机系统有关,随载荷它的物理设备的形式而改变。
信息:现实世界在人们头脑中的反映。
它以文字、数据、符号、声音、图象等形式记录下来,进行传递和处理,为人们的生产、建设、管理等提供决策依据。
地理信息:地理信息是有关地理实体的性质、特征和运动状态的表征及一切有用的知识,他是对表达地理特征与地理现象之间关系的地理数据的解释。
地理信息属于空间信息,它具有空间分布特征、多维结构特征和动态变化特征。
地理信息系统:不同领域、不同专业对GIS的理解不同,目前没有完全统一的被普遍接受的定义:基于技术、工具、系统和学科的定义。
等的定义2、GIS的基本构成:硬件、软件、数据、人员和模型。
3、GIS的发展概况:我国GIS起步较晚,但发展较快,分为以下几个阶段:1)准备阶段(1978-1980):一些知名人士GIS先驱看到GIS的广阔前景和GIS的重要性,进行极积呼吁,为GIS在我国的发展奠定了理论准备基础并做了一些可行性实验。
2)试验阶段(1981-1985):这期间,我国在GIS理论探索,规范探讨,软件开发,系统建立等方面取得了突破和进展,进行了一些典型,试验专题试验软件开发工作。
地理信息系统教程第一章绪论1.信息系统:能对数据和信息进行采集、存储、加工和再现,并能回答用户一系列问题的系统。
具有采集、管理、分析和表达数据的能力。
2.地理信息系统:GIS是由计算机硬件、软件和不同的方法组成的系统,该系统设计用来支持空间数据的采集、管理、处理、分析、建模和显示,以便解决复杂的规划和管理问题3.GIS与IS之间的区别:GIS是空间数据和属性数据的联合体。
4.GIS系统五个基本组成部分:⑴硬件系统,各种设备-物质基础;⑵软件系统,支持数据采集、存储、加工、回答用户问题的计算机程序系统;⑶数据,系统分析与处理的对象、构成系统的应用基础;⑷应用人员,GIS服务的对象,分为一般用户和从事建立、维护、管理和更新的高级用户;⑸应用模型,解决某一专门应用的应用模型,是GIS技术产生社会经济效益的关键所在5.地理信息系统基本功能:⑴数据采集与编辑;⑵数据存储与管理;⑶数据处理和变换;⑷空间分析和统计;⑸产品制作与显示;⑹二次开发和编程6.地理信息系统应用功能:资源管理;区域规划;国土监测;辅助决策第二章地理信息系统的空间数据结构和数据库1.地理实体:指自然界现象和社会经济事件中不能再分割的单元,它是一个具有概括性,复杂性,相对性的概念。
2.地理实体的特征:⑴属性特征——用以描述事物或现象的特性;⑵空间特征——用以描述事物或现象的地理位置以及空间相互关系;⑶时间特征——用以描述事物或现象随时间的变化3.地理实体数据的类型:⑴属性数据——描述空间对象的属性特征的数据;⑵几何数据——描述空间对象的空间特征的数据;⑶关系数据——描述空间对象之间的空间关系的数据4.点:有特定位置;线:具有相同属性的点的轨迹,由一系列的有序坐标表示;面:对湖泊、岛屿、地块等一类现象的描述。
由封闭曲线加内点来表示;体:用于描述三维空间中的现象与物体,它具有长度、宽度及高度等属性5.空间数据结构:是指空间数据适合于计算机存储、管理、处理的逻辑结构,也就是指空间数据以什么形式在计算机中存储和处理。
“地理信息系统教程”习题及参考答案第一章绪论1.什么是数据和信息?它们有何联系和区别?定义:数据是指某一目标定性、定量描述的原始资料,包括数字、文字、符号、图形、图像以及它们能够转换成的数据等形式。
信息是向人们或机器提供关于现实世界新的事实的知识,是数据、消息中所包含的意义。
联系和区别:信息与数据是不可分离的。
信息由与物理介质有关的数据表达,数据中所包含的意义就是信息。
信息是对数据解释、运用与解算,数据即使是经过处理以后的数据,只有经过解释才有意义,才成为信息;就本质而言,数据是客观对象的表示,而信息则是数据内涵的意义,只有数据对实体行为产生影响时才成为信息。
数据是记录下来的某种可以识别的符号,具有多种多样的形式,也可以加以转换,但其中包含的信息内容不会改变。
即不随载体的物理设备形式的改变而改变。
信息可以离开信息系统而独立存在,也可以离开信息系统的各个组成和阶段而独立存在;而数据的格式往往与计算机系统有关,并随载荷它的物理设备的形式而改变。
数据是原始事实,而信息是数据处理的结果。
不同知识、经验的人,对于同一数据的理解,可得到不同信息。
2.什么是地理信息系统(GIS)?与地图数据库有什么异同?与地理信息的关系是什么? GIS定义:GIS是一个发展的概念。
不同领域、不同专业对GIS的理解不同,目前没有完全统一的被普遍接受的定义。
定义①:是对地理环境有关问题进行分析和研究的一门学科,它将地理环境的各种要素,包括它们的空间位置形状及分布特征和与之有关的社会、经济等专题信息以及这些信息之间的联系等进行获取、组织、存储、检索、分析,并在管理、规划与决策中应用。
定义②:是在计算机软硬件支持下,以采集、存储、管理、检索、分析和描述空间物体的定位分布及与之相关的属性数据,并回答用户问题为主要任务的计算机系统。
定义③:是为了获取、存储、检索、分析和显示空间定位数据而建立的计算机化的数据库管理系统。
定义④:地理信息系统是一种决策支持系统。
第一章空间数据库概述1、空间数据库系统由空间数据库、空间数据库管理系统与空间数据库应用系统三部分构成。
2、空间数据的特征:空间特征、非结构化特征、空间关系特征、分类编码特征、数据种类多、抽象性特征、海量数据特征3、数据库的发展阶段⏹人工管理阶段⏹文件系统阶段:数据文件是大量文件的集合形式,每个文件包含大量记录面向用户的数据文件,用户可以通过它进行查询、修改、删除等操作;数据文件与对应的程序有一定的独立性,程序员可以不关心数据的物理存储,只考虑逻辑存储结构;由初期的顺利文件发展为索引文件、直接文件等,数据可随机存取。
数据文件只能对应一个或几个程序,仍依赖程序。
数据文件之间不能建立关系,数据冗余。
⏹文件-关系数据库管理系统:用文件系统管理几何图形数据,用商用RDBMS管理属性数据,几何图形数据和属性数据之间通过对象标识或内部连接码(OID)进行连接。
两者独立地组织、管理和检索。
缺点:该模式中,文件管理系统的功能较弱,特别是在数据的安全性、一致性、完整性、并发控制以及数据损坏后的数据恢复方面缺少基本的功能。
⏹全关系型数据库管理系统:图形和属性数据都用RDBMS来管理模式1:图形数据按关系模型组织。
涉及一系列关系连接运算,相当费时。
模式2:将图形数据的变长部分处理成二进制块(Block)字段。
但Block的读写效率比定长的属性字段慢得多,特别涉及对象的嵌套时,更慢。
⏹对象-关系数据库管理系统:DBMS软件商或GIS软件商基于面向对象技术在RDBMS中进行扩展,使之能直接存储和管理非结构化的空间数据。
主要解决空间数据的变长记录的管理,效率比全关系型二进制Block的管理高得多。
缺点:但仍没有解决对象的嵌套问题,空间数据结构不能由用户定义,用户不能根据GIS要求再定义,使用上受一定限制。
⏹面向对象数据库管理系统:适应于空间数据的表达和管理,它不仅支持变长记录,而且支持对象的嵌套、信息的继承与聚集。
面向对象的空间数据库管理系统允许用户定义对象和对象的数据结构以及它的操作。
《空间数据库》范围及重点1.第一章:绪论1)空间数据库基本概念、组成部分、名称简写之间的联系与区别与联系;答;利用当代的系统方法,在地理学、地图学原理的指导下,对地理空间进行科学的认识与抽象,将地理数据库化为计算机处理时所需的形式与结构,形成综合性的信息系统技术——空间数据库或者SDBMS是海量SD的存储场所、提供SD处理与更新、交换与共享,实现空间分析与决策的综合系统。
组成:存储系统、管理系统、应用系统是SDBS的简称2)目前空间数据库实现方案;答:ORDBMS3)GIS,RS与空间数据库之间的联系;4)常见的空间数据库产品答:轻量级:MS的Access、FoxPro、SUN的MySQL中等:MS的SQL Server系列重量级:Oracle的Oracle不太熟悉的有:Sybase、Informix、DB2 、Ingress、PostgreSQL(PG)等5)产生空间数据库的原因;答:直接利用?SD特征:空间特性非结构化特征空间关系特征多尺度与多态性海量数据特性存在的问题:复杂图形功能:空间对象复杂的空间关系数据变长记录6)空间数据库与普通关系数据库的主要区别。
答:关系数据库管理属性数据,空间数据采用文件库或图库形式;增加大二进制数据类型(BLOB),解决变长数据存储问题;将空间数据/属性数据全部存放在数据库中;但空间特性由程序处理2.第二章:空间数据库模型1)如何理解空间数据库模型;2)空间数据及空间关系;… (1) 空间数据类型几何图形数据影像数据属性数据地形数据元数据:对空间数据进行推理、分析和总结得到的关于数据的数据,数据来源、数据权属、数据产生的时间数据精度、数据分辨率、元数据比例尺地理空间参考基准、数据转换方法…(2) 空间关系指地理空间实体之间相互作用的关系:拓扑关系:形状、大小随投影改变。
在拓扑变换下不变的拓扑变量,如相邻、包含、相交等,反映空间连续变化的不变性方位关系:地理空间上的排列顺序,如前后、上下、左右和东、南、西、北等方位度量关系:距离远近等3)空间数据库如何建模;DB设计三步骤‹ Conceptual Data Model:与应用有关的可用信息组织、数据类型、联系及约束、不考虑细节、E-R模型Logic Data Model 层次、网状、关系,都归为关系,SQL的关系代数(relational algebra, RA) Physical Data Model:解决应用在计算机中具体实现的各种细节,计算机存储、数据结构等4)模型之间如何转换?5)可行的空间数据库建模方案。
第二章空间数据结构和空间数据库本章概述:地理信息系统的操作对象是空间地理实体,建立一个地理信息系统的首要任务是建立空间数据库,即将反映地理实体特性的地理数据存储在计算机中,这需要解决地理数据具体以什么形式在计算机中存储和处理即空间数据结构问题和如何描述实体及其相互关系即空间数据库模型问题。
本章重点介绍主要的空间数据结构和空间数据库模型。
§2.1 地理实体及其描述介绍地理实体的概念,地理实体需要描述的内容,实体的空间特征和实体间的空间关系。
§2.2 矢量数据结构讲述矢量数据的图形表示、获取方式和表示(即矢量编码方法)。
§2.3 栅格数据结构讲述栅格数据的图形表示、栅格数据的组织、栅格结构的建立和栅格数据的表示。
§2.4 矢量栅格一体化数据结构针对矢量栅格数据结构互为优缺点状况,介绍集两者优点为一体的矢量栅格一体化数据结构的概念和具体数据结构设计方法。
§2.5 三维数据结构主要阐述基于栅格的八叉树三维数据结构的基本原理和存储结构。
在矢量结构方面,介绍常用的三维边界表示法的方法原理、特点和应用。
§2.6 空间数据模型首先介绍数据库有关基础知识,传统数据模型如何存储图形数据及其局限性,重点阐述面向对象技术、面向对象模型和用于地理信息系统的空间数据库管理系统的类型。
§2.7 空间数据库的设计、建立和维护介绍空间数据库的设计的内容、建立过程和维护方法。
您可能还想看前贴【GIS原理学习(一)】【GIS原理学习(二)】【GIS 原理学习(三)】【GIS原理学习(四)】§2.1 地理实体及其描述地理信息系统是以地理实体作为描述、反映现实世界中空间对象的单体。
在地理信息系统中需要描述地理实体的名称、位置、形状、功能等内容,这些内容反映了地理实体的时间、空间和属性三种特性,其中空间特性是地理信息所特有的,也是造成空间数据结构和数据库模型异常复杂的原因所在。
此外,实体间的空间关系对空间查询和分析具有重要意义。
一、地理系统和地理实体介绍地理系统和地理实体的概念。
二、实体的描述及存储介绍空间实体描述的内容,空间数据的基本特征、空间数据类型和空间数据存储方式。
三、实体的空间特征空间特征是地理实体所特有的特征,是GIS数据组织、处理和维护的难点所在,可以从空间维数,空间特征类型和实体类型组合三个方面来考察。
四、实体间的空间关系实体间空间关系对于地理信息系统查询和空间分析具有重要意义。
在此阐述空间关系的类型,和拓扑空间关系的定义、种类、表达及意义。
一、地理系统和地理实体地理信息来源于地理系统。
著名数学家钱学森曾指出:地理系统是一个开放的复杂巨系统。
所谓开放性是指地理系统与其它系统有关联,有物质和信息的交往,不是一个封闭系统;复杂巨系统是指地理系统有成千上万的种类繁多的子系统。
抽象是人们观察和分析复杂事物和现象的常用手段之一。
将地理系统中复杂的地理现象进行抽象得到的地理对象称为地理实体或空间实体、空间目标,简称实体(Entity)。
实体现实世界中客观存在的,并可相互区别的事物。
实体可以指个体,也可以指总体,即个体的集合.抽象的程度与研究区域的大小、规模不同而有所不同,如在一张小比例尺的全国地图中,武汉市被抽象为一个点状实体,抽象程度很大;而在较大比例尺的武汉市地图上,需要将武汉市的街道、房屋详尽地表示出来,武汉市则被抽象为一个由简单点、线、面实体组成的庞大复杂组合实体,其抽象程度较前者而言较小。
所以说,实体是一个具体有概括性、复杂性、相对意义的概念。
二、实体的描述和存储从实体需要描述的内容到计算机具体如何存储实体的过程见图2-1-1。
在地理信息系统中,根据具体要求需要描述实体各个侧面如名称、位置、形状和获取这些信息的方法、时间和质量等,记录实体的这些描述内容的空间数据具有三个基本特征:空间特征、属性特征和时间特征,根据反映实体特征的不同,空间数据可分为不同的类型:几何数据、关系数据、属性数据和元数据,而不同类型的空间数据在计算机中是以不同的空间数据结构存储的。
1、空间实体的描述通常需要从如下方面对地理实体进行描述:1)编码:用于区别不同的实体,有时同一个实体在不同的时间具有不同的编码,如上行和下行的火车。
编码通常包括分类码和识别码。
分类码标识实体所属的类别,识别码对每个实体进行标识,是唯一的,用于区别不同的实体。
2)位置:通常用坐标值的形式(或其它方式)给出实体的空间位置。
3)类型:指明该地理实体属于哪一种实体类型,或由哪些实体类型组成。
4)行为:指明该地理实体可以具有哪些行为和功能。
5)属性:指明该地理实体所对应的非空间信息,如道路的宽度、路面质量、车流量、交通规则等。
6)说明:用于说明实体数据的来源、质量等相关的信息。
7)关系:与其它实体的关系信息。
2、空间数据的特征空间数据具有三个基本特征(图2-1-2):图2-1-2 空间数据的基本特征1)属性特征——用以描述事物或现象的特性,即用来说明“是什么”,如事物或现象的类别、等级、数量、名称等。
2)空间特征——用以描述事物或现象的地理位置,又称几何特征、定位特征,如界桩的经纬度等。
3)时间特征——用以描述事物或现象随时间的变化,例如人口数的逐年变化。
由于空间实体具有上述特征,所以在GIS中的表示是非常复杂的。
目前的GIS还较少考虑到空间数据的时间特征,只考虑其属性特征与空间特征的结合。
实际上,由于空间数据具有时间维,过时的信息虽不具有现势性,但却可以作为历史性数据保存起来,因而就会大大增加GIS表示和处理数据的难度。
3、空间数据的类型根据空间数据的特征,可以把空间数据归纳为三类:1)属性数据——描述空间数据的属性特征的数据,也称非几何数据。
即说明“是什么”,如类型、等级、名称、状态等。
2)几何数据——描述空间数据的空间特征的数据,也称位置数据、定位数据。
即说明“在哪里”,如用X、Y坐标来表示。
3)关系数据——描述空间数据之间的空间关系的数据,如空间数据的相邻、包含等,主要是指拓扑关系。
拓扑关系是一种对空间关系进行明确定义的数学方法。
此外,还有元数据,它是描述数据的数据。
在地理空间数据中,元数据说明空间数据内容、质量、状况和其他有关特征的背景信息,便于数据生产者和用户之间的交流。
若根据划分角度不同,还可将空间数据划分为不同的类型。
空间数据的不同划分根据数据来源的不同分为(据郭达志等):1)几何图形数据:主要来源于各种类型的地图和实测几何数据。
2)影象数据:主要来源于卫星遥感和航空遥感等。
3)属性数据:来源于实测数据,文字报表,或地图中的各类符号说明,以及从遥感数据中通过解释得到的信息等。
4)地形数据:来源于地形等高线图的数字化,已建立的格网状的数字化搞成模型(DTM),或其他形式表示的地形表面(如TIN)等。
在具有智能化的GIS中还应有规则和知识数据。
根据表示对象的不同分为分为(据邬伦等)(图2-1-3):1)类型数据:例如考古地点、道路线和土壤类型的分布等;2)面域数据:例如随机多边形的中心点、行政区域界线和行政单元等;3)网络数据:例如道路交点、街道和街区等;4)样本数据:例如气象站、航线和野外样方的分布区等;5)曲面数据:例如高程点、等高线和等值区域;6)文本数据:例如地名、河流名称和区域名称;7)符号数据:例如点状符号、线状符号和面状符号(晕线)等;4、空间数据结构数据结构即数据组织的形式,是适合于计算机存贮、管理、处理的数据逻辑结构。
换句话说,是指数据以什么形式在计算机中存贮和处理。
数据按一定的规律储存在计算机机中,是计算机正确处理和用户正确理解的保证。
空间数据结构是空间数据在计算机中的具体组织方式。
目前尚无一种统一的数据结构能够同时存储上述各种类型的数据,而是将不同类型的空间数据以不同的数据结构存储(图2-1-1)。
一般来说,属性数据与其他信息系统一样常用二维关系表格形式存储。
元数据以特定的空间元数据格式存储,而描述地理位置及其空间关系的空间特征数据是地理信息系统所特有的数据类型,主要以矢量数据结构和栅格数据结构两种形式存储。
三、实体的空间特征可用空间维数、空间特征类型和空间类型组合方式说明实体的空间特征。
1、空间维数有零维、一维、二维、三维之分,对应着不同的空间特征类型:点、线、面、体。
在地图中实体维数的表示可以改变。
如一条河流在小比例尺地图上是一条线(单线河),在大比例尺图上是一个面(双线河)。
2、空间特征类型1)点状实体:点或节点、点状实体。
点:有特定位置,维数为0的物体。
具体有下列类型的点:实体点、注记点、内点和节点等不同类型(图2-1-4)2)线状实体:具有相同属性的点的轨迹,线或折线,由一系列的有序坐标表示,并长度、弯曲度、方向性等特性,线状实体包括线段,边界、链、弧段、网络等。
3)面状实体(多边形):是对湖泊、岛屿、地块等一类现象的描述,在数据库中由一封闭曲线加内点来表示。
具有面积、范围、周长、独立性或与其它地物相邻、内岛屿或锯齿状外形、重叠性与非重叠性等特性。
4)体、立体状实体:用于描述三维空间中的现象与物体,它具有长度、宽度及高度等属性,立体状实体一般具有体积、每个二维平面的面积、内岛、断面图与剖面图等空间特征。
3、实体类型组合现实世界的各种现象比较复杂,往往由上述不同的空间类型组合而成,例如根据某些空间类型或几种空间类型的组合将空间问题表达出来(图2-1-5),复杂实体由简单实体组合表达。
四、空间关系空间关系是指各空间实体之间的空间关系,包括拓扑空间关系,顺序空间关系和度量空间关系。
由于拓扑空间关系对GIS查询和分析具有重要意义,在GIS中,空间关系一般指拓扑空间关系。
1、定义拓扑关系是一种对空间结构关系进行明确定义的数学方法。
是指图形在保持连续状态下变形,但图形关系不变的性质。
可以假设图形绘在一张高质量的橡皮平面上,将橡皮任意拉伸和压缩,但不能扭转或折叠,这时原来图形的有些属性保留,有些属性发生改变,前者称为拓扑属性,后者称为非拓扑属性或几何属性(表2-1-1)。
这种变换称为拓扑变换或橡皮变换。
2、拓扑关系的种类点(结点)、线(链、弧段、边)、面(多边形)三种要素是拓扑元素。
它们之间最基本的拓扑关系是关联和邻接。
1)关联:不同拓扑元素之间的关系。
如结点与链,链与多边形等。
2)邻接:相同拓扑元素之间的关系。
如结点与结点,链与链,面与面等。
邻接关系是借助于不同类型的拓扑元素描述的,如面通过链而邻接。
在GIS的分析和应用功能中,还可能用到其它拓扑关系,如:3)包含关系:面与其它拓扑元素之间的关系。
如果点、线、面在该面内,则称为被该面包含。
如某省包含的湖泊、河流等。
4)几何关系:拓扑元素之间的距离关系。
如拓扑元素之间距离不超过某一半径的关系。