《空间大数据库》复习
- 格式:doc
- 大小:238.52 KB
- 文档页数:10
1、数据库:就是为了一定的目的,在计算机系统中以特定的结构组织、存储、管理和应用的相关联的数据集合,是数据管理的高级阶段。
空间数据库是存取、管理空间信息的数据库,指的是地理信息系统在计算机物理存储介质上存储的应用相关的地理空间数据的总和,一般是以一系列特定结构的文件的形式组织在存储介质之上的空间数据库与关系数据库间的主要区别:1)和关系数据库相比,空间数据库没有固定的运算符集合2)空间数据库处理对象复杂,具有空间范围,不能自然按一维排序3)检测空间谓词需要用到大量复杂计算,所以CPU的代价不是主要由I/O决定空间数据模型:是关于现实世界中空间实体及其相互联系的概念,它为描述空间数据的组织和设计空间数据库模式提供着基本方法空间数据库管理系统:1)一个SDBMS是一个软件模块,它利用一个底层数据库管理系统2)SDBMS支持多种空间数据模型、相应的空间抽象数据类型(ADT)以及一种能够调用这些ADT的查询语言3)SDBMS支持空间索引、高效的空间操作算法以及用于查询优化的特定领域规则空间信息:也就是指在某个空间框架(如地球表面)中的位置信息。
空间信息是指与研究对象的空间地理分布有关的信息,它表示地理系统诸多要素的数量、质量、分布特征,相互联系和变化规律的图、文、声、像等的总称地理信息系统:是用于采集、模拟、处理、检索、分析和表达地理空间数据的计算机信息系统,可以作为ADBMS的前端数据模型:数据模型是一条或一组用于标识和表示空间参照对象的规则,数据模型是数据集的特定结构和模式,是对数据的文件描述,有利于某些性质的前期分析。
数据模型是数据库系统中关于数据内容和数据之间联系的逻辑组织的形式表示。
每一个具体的数据库都是由一个相应的数据模型来定义。
层次模型、网络模型、关系模型、面向对象模型对象模型:对象模型很适合表示有固定形状的空间实体场模型:用于表示连续的或无固定形状的概念2、数据库的发展:(图)数据库系统的前身为文件系统,数据库技术最初产生于20世纪60年代中期,根据数据模型的发展,可以划分为三个阶段:第一代的网状、层次数据库系统;第二代的关系数据库系统;第三代的以面向对象模型为主要特征的关系数据库系统3、场操作可以分为三类:局部操作、聚焦操作、区域操作局部操作:空间框架内一点给定位置的新场的取值只依赖于同一位置场的输入值聚焦操作:在指定位置的结果场的值依赖于同一位置的一个假定小领域输入场的值区域操作:与聚集运算符或微积分中的积分运算有关,如森林的例子中计算每个树种的平均高度4、数据库设计的三个步骤:首先,采用高层次的概念数据模型来组织所有与应用相关的可用信息:重点关注应用的数据类型及其联系和约束,设计过程的这个阶段不考虑具体实现细节。
《空间数据库原理》第一章数据库1、空间数据库:①提供结构用于存储和分析空间数据②空间数据由多维空间的对象组成③在标准数据库中存储空间数据需要大量的空间,从一个标准数据库中检索查询空间数据需要很多时间并且很累赘,通常导致很多错误。
2、DBMS:(数据的操作系统)一种操纵和管理数据库的大型软件,用于建立、使用和维护数据库。
SDBMS:增加了处理空间数据功能的DBMS。
①在它的数据模型中提供空间数据类型和查询语言②至少在执行时支持提供空间数据类型:空间索引;空间链接有效的算法。
在地理信息系统中为什么要研究专门的空间数据库系统?1.空间数据库能提供结构存储和空间数据分析2.空间数据库包含多面空间的对象3.在标准数据库中存储空间数据会需要过多的空间4.标准数据库的查询反馈和空间数据分析会消耗过多时减并且留下大量错误空间5.空间数据库能提供更多有效率的存储和空间数据分析3、哈希(Hash)函数:一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
质数除余法(直接取余法):f(x):=x mod maxM ;maxM一般是不太接近2^t的一个质数。
乘法取整法:f(x):=trunc((x/maxX)*maxlongit) mod maxM,主要用于实数。
平方取中法:f(x):=(x*x div 1000 ) mod 1000000);平方后取中间的,每位包含信息比较多。
第二章数据库基本原理1、数据模型Data Model:关于数据基础或对象以及他们之间的关系的抽象描述被表示在一个数据库中。
3、概念数据模型:也称语义模型,关于实体和实体间联系的抽象概念集,用统一的语言描述、综合、集成的用户视图。
2、数据字典:是指对数据库的内容包括数据项和属性码定义,是元数据的重要组成部分。
(是指对数据的数据项、数据结构、数据流、数据存储、处理逻辑、外部实体等进行定义和描述,其目的是对数据流程图中的各个元素做出详细的说明。
)Metadata:是描述数据的数据,主要是描述数据属性的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。
一、名词解释1.空间数据库:描述与特定空间位置有关的真实世界对象的数据集合。
2.数据库:统一存储和管理数据的基地3.空间数据:指以地球表面空间位置为参照,用来描述空间实体的位置、形状、大小及其分布等诸多方面信息的数据4.空间认知:对现实世界的空间属性包括位置、大小、距离、模式、运动和物体内部关系的认知,是通过获取、处理、存储、传递、和解译空间信息,来获取空间知识的过程5.矢量数据结构:利用欧式几何学中的点、线、面及其组合体来表示地理实体空间分布的一种数据组织方式6.栅格数据结构实际实质就是像元阵列,即像元按矩阵形式的集合7.空间关系:空间目标在一定区域上构成的与空间特性有关的联系。
8.四面体网格:将目标空间用紧密排列但不重叠的不规则四面体形成的网格来表示,其实质就是2D TIN结构在3D空间上的拓展9.空间数据库系统:指带有数据库的计算机系统,采用现代数据库技术来管理空间数据。
10.空间数据引擎:用来解决如何在关系数据库存储空间数据,实现真正的数据库方式管理空间数据,建立空间数据服务器的方法11.空间索引:指在存储空间数据时依据空间对象的位置和形状或空间对象之间的某种空间关系,按一定顺序排列的一种数据结构,其中包含空间对象的概要信息。
12.空间链接查询:是空间数据库系统一种重要的多路查询,即从两个数据集合中检索出所有满足某一条件的空间对象。
13.元数据:是关于数据的数据,用于描述数据的内容、质量、表示方式、空间参照系、管理方式、数据的所有者、数据的提供方式以及数据集的其他特征14.空间元数据:描述地理信息数据集内容、表示、空间参照、质量以及管理的数据二、填空1.空间数据特征包括:时空特征、多维特征、多尺度性、海量数据特征2.空间数据库的作用:①空间数据处理与更新②海量数据存储于管理③空间分析与决策④空间信息交换与共享3.空间数据库的特征:综合抽象特征、非结构化特征、分类编码特征、复杂性与多样性4.空间数据管理的五种方式:基于文件管理方式、文件与关系数据库混合型空间数据库、全关系型空间数据库、对象-关系型空间数据库、面向对象空间数据库5.空间类型的表现形式:感知空间、认知空间、符号空间6.空间认知模式:空间特征感知、空间对象认识、空间格局认知7.空间认知的三层模型:空间概念数据模型、空间逻辑数据模型、物理数据模型8.矢量数据结构主要有spaghetti结构和拓扑矢量数据结构9.最基本的拓扑关系:关联、临接、包含10.栅格数据结构实际实质就是像元阵列,即像元按矩阵形式的集合11.栅格数据取值的四种方法:中心归属法、面积占优法、长度占优法、重要性法12.四叉树编码的方式:规则四叉树、线性四叉树、一对四式四叉树13.栅格数据的存储:全栅格式存储、链式编码、行程编码、块式编码、四叉树编码14.空间关系可分为:拓扑关系、度量关系、顺序关系15.面向对象的数据模型涉及四个抽象概念:分类,概括,聚集,联合、以及继承和传播两个语义模型工具16.TIN常用的算法:逐点插入法、分治算法、三角形生长法17.空间构模方法可归纳为:基于面模型、基于体模型、基于混合模型18.根据模型所具有的主要特征大致可以将其分为4类:三维矢量模型、三维体元模型、混合或集成数据模型、面向实体的数据模型19.图形数据与专题数据的链接基本上有4种方式:图形数据与专题属性数据分别管理、对通用DBMS扩展以增加空间数据库的管理能力、属性数据与图形数据有统一的结构、图形数据与属性数据自成体系20.目前空间索引技术超过50多种,可概括为树结构、线性映射和多维空间区域变换三种类型,从应用范围上可以分为静态索引和动态索引21.典型的空间索引技术包括:R树索引、四叉树索引、网格索引22.四叉树索引的方法有:点四叉树索引、MX四叉树索引、PR四叉树索引、CIF四叉树索引、基于固定网格划分的四叉树索引、线性可排序四叉树索引23.SQL查询语言的优点:非过程化语言、统一的语言、所有关系数据库的公共语言24.SQL查询语言的功能:查询、操纵、定义、控制25.SQL可细分为:DDL、DML、DCL26.主要的空间查询包括:点查询、区域查询、最邻近查询27.空间查询采用的算法:过滤筛选步骤、细化步骤28.查询分析的类型:属性查询、空间查询、空间分析29.空间数据交换的方式:①外部数据交换模式②直接数据访问模式③基于空间数据转换标准的转换④空间数据互操作模式30.空间数据库的设计可分为:需求分析,概念设计,逻辑设计,物理设计,数据库的实现,数据库的运行和维护6个阶段31.空间数据库需求分析主要包括三方面内容:用户基本需求调研、分析空间数据现状、系统环境/功能分析三、问答题1.空间数据库与传统数据库的差异:①信息描述差异。
一、选择题:1、DB,DBMS和DBS三者的关系是(B)A、DB包括DBMS和DBSB、DBS包括DB和DBMSC、DBMS包括DBS和DBD、DBS与DB、DBMS无关2、假定学生关系式S(S#,SNAME,SEX,AGE),课程关系式C(C#,CNAME,TEACHER),学生选课关系是SC(S#,C#,GRAND)。
要查找选修“COMPUTER”课程的“女”学生姓名,将涉及到关系(D)A、SB、SC,CC、S,SCD、S,C,SC3、将E-R图转换为关系模式时,如果两实体间的联系是m:n,下列说法正确的是(C)A、将m方主键(主码)和联系的属性纳入n方的属性中B、将m方属性和n方属性中均增加一个表示级别的属性C、增加一个关系表示联系,其中纳入m方和n方的主键(主码)D、将n方主键(主码)和联系的属性纳入m方的属性中4、由SELECT—FROM—WHERE—GROUP—ORDER组成的SQL语句,在被DBMS处理时,各字句的执行次序为(C)A、SELECT—FROM—WHERE—GROUP—ORDERB、FROM —SELECT—WHERE—GROUP—ORDERC、FROM —WHERE—GROUP—SELECT—ORDERD、SELECT—FROM—GROUP—WHERE—ORDER5、以下不是数据库技术所具备的特点是(D)A、数据结构化B、数据冗余小C、有较高的数据独立性D、数据联系弱6、在信息模型的“学生”尸体中,对每个学生的具体情况的描述,称为(A)A、实体值B、实体型C、属性值D、属性型7、关系数据库三级模式中的(B),可用视图实现。
A、内模式B、外模式C、存储模式D、模式8、可用于区别实体集中不同个体的属性或属性集合,称为该实体的(B)A、属性型B、键C、外部键D、实体型9、设有一个体育项目可以有多个运动员报名,一个运动员课参加多个项目,运动员与体育项目之间是(D)A、一对一的联系B、一对多的联系C、多对一的联系D、多对多的联系10、关系R与关系S只有1个公共属性,T1是R与S作等值连接的结果,T2是R与S作自然连接的结果,则(D)A、T1的属性个数等于T2的属性个数B、T1的属性个数小于T2的属性个数C、T1的属性个数大于或等于T2的属性个数D、T1的属性个数大于T2的属性个数11、数据库系统是由应用程序、DBMS、DB以及DBA组成。
空间分析复习重点文件编码(008-TTIG-UTITD-GKBTT-PUUTI-WYTUI-8256)空间分析的概念空间分析:是基于地理对象的位置和形态特征的空间数据分析技术,其目的在于提取和传输空间信息。
包括空间数据操作、空间数据分析、空间统计分析、空间建模。
空间数据的类型空间点数据、空间线数据、空间面数据、地统计数据属性数据的类型名义量、次序量、间隔量、比率量属性:与空间数据库中一个独立对象(记录)关联的数据项。
属性已成为描述一个位置任何可记录特征或性质的术语。
空间统计分析陷阱1)空间自相关:“地理学第一定律”—任何事物都是空间相关的,距离近的空间相关性大。
空间自相关破坏了经典统计当中的样本独立性假设。
避免空间自相关所用的方法称为空间回归模型。
2)可变面元问题MAUP:随面积单元定义的不同而变化的问题,就是可变面元问题。
其类型分为:①尺度效应:当空间数据经聚合而改变其单元面积的大小、形状和方向时,分析结果也随之变化的现象。
②区划效应:给定尺度下不同的单元组合方式导致分析结果产生变化的现象。
3)边界效应:边界效应指分析中由于实体向一个或多个边界近似时出现的误差。
生态谬误在同一粒度或聚合水平上,由于聚合方式的不同或划区方案的不同导致的分析结果的变化。
(给定尺度下不同的单元组合方式)空间数据的性质空间数据与一般的属性数据相比具有特殊的性质如空间相关性,空间异质性,以及有尺度变化等引起的MAUP效应等。
一阶效应:大尺度的趋势,描述某个参数的总体变化性;二阶效应:局部效应,描述空间上邻近位置上的数值相互趋同的倾向。
空间依赖性:空间上距离相近的地理事物的相似性比距离远的事物的相似性大。
空间异质性:也叫空间非稳定性,意味着功能形式和参数在所研究的区域的不同地方是不一样的,但是在区域的局部,其变化是一致的。
ESDA是在一组数据中寻求重要信息的过程,利用EDA技术,分析人员无须借助于先验理论或假设,直接探索隐藏在数据中的关系、模式和趋势等,获得对问题的理解和相关知识。
数据库复习总结本页仅作为文档封面,使用时可以删除This document is for reference only-rar21year.March第一章数据库系统概论1.试述数据、数据库、数据库系统、数据库管理系统的概念。
数据:描述事物的符号记录称为数据。
数据的种类有文字、图形、图象、声音、正文等等。
数据与其语义是不可分的。
数据库:数据库是长期储存在计算机内、有组织的、可共享的数据集合。
数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。
数据库系统:数据库系统(DBS)是指在计算机系统中引入数据库后的系统构成。
数据库系统由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员构成。
数据库管理系统:数据库管理系统(DBMS)是位于用户与操作系统之间的一层数据管理软件。
用于科学地组织和存储数据、高效地获取和维护数据。
DBMS 主要功能包括数据定义功能、数据操纵功能、数据库的运行管理功能、数据库的建立和维护功能。
2.什么是数据独立性数据独立性又分为哪两个层次为什么需要数据独立性数据独立性是用来描述数据与应用程序之间的依赖程度,包括数据的物理独立性和数据的逻辑独立性,依赖程度越低则独立性越高物理独立性是指用户的应用程序与存储在磁盘上的数据库的数据时相互独立的。
逻辑独立性是指用户的应用程序与数据库的逻辑结构是相互独立的。
作用:数据在磁盘上怎样存储由DBMS管理,用户程序不需要了解,应用程序要处理的只是数据的逻辑结构,这样当数据的物理存储改变了,应用程序不用改变。
数据独立性是通过数据库管理系统的两层映像功能来实现3.什么是数据模型数据模型的基本要素有哪些为什么需要数据模型数据模型是描述数据语义、数据与数据之间联系(数据结构)、数据操作,以及一致性约束的概念和工具的集合数据模型的基本要素:①数据结构:是所研究的对象类型的集合,是对系统的静态特性的描述。
21 空间数据库操作地质图空间数据库建库的过程是对各阶段数据尤其是编稿原图阶段的结构化和非结构化数据综合与解释的过程,是成果标准化以及提供专题服务的最直接体现。
空间数据库模型以中国地质调查局地质调查技术标准《数字地质图空间数据库》(DD2006 06)为依据。
数字地质调查系统为地质图空间数据库的无缝集成、融合和应用提供了可操作平台,地质人员可借助系统提供的一套完整的技术方法和工具,方便地对不同阶段的资料进行继承和综合分析。
系统自动提供空间数据库模板,其基本内容直接继承编稿原图或实际材料图。
21.1 地质图空间数据库建库基本技术路线与操作流程数字地质调查系统提供了与业务流程融合的建库模式(微工作流),把数据生产融入到生产一线, 对主要原始数据和主要最终成果数据库进行统一描述、统一组织、统一存储由地质人员自己在工作过程中逐步生产不同阶段的数据库和数据产品。
使项目人员可以从计算机技术的应用中体会到新技术带来的好处,形成新的工作模式,对提高研究精度、效率和成果的表现形式提供了重要的技术保障。
21.1.1 基于一体化建库模式的迭代建库解决方案地质图空间数据库建库过程是一个“认识—提高—认识—再提高”的过程。
地质人员在实际工作中需根据前人资料或项目验收专家组意见对已经连好的实际材料图或编稿原图进行修改。
当实际材料图或编稿原图发生改变时,从其继承主要信息的地质图空间数据库也需要同步更新,以保证不同阶段整理分析的数据尤其是空间信息的一致性。
因此在数字地质调查系统中采用“迭代”的思想,结合面向对象的第三代地质图空间数据库模型,利用“不同阶段数据模型的继承和传递的技术”将实际材料图、编稿原图等不同阶段数据库进行互通与继承,通过反馈、逐步完善《DD2006-06 数字地质图空间数据库》规定的建库内容(空间信息和属性信息)。
迭代过程如图21.1.1所示。
图21.1.1 基于数字地质调查系统的空间数据库迭代建库过程21.1.2 一站式建库流程对于地质人员而言,空间数据库中的要素类、对象类等是可以通过软件的一站式流程实现自动化提取。
1、举例说明什么是空间数据、非空间数据?如何理解空间查询和非空间查询的区别?常用的空间数据库管理方式有哪几种及其各自特点。
数据:是指客观事务的属性、数量、位置及其相互关系等的符号描述。
空间数据:是对现实世界中空间对象(事物)的描述,其实质是指以地球表面空间位置为参照,用来描述空间实体的位置、形状、大小及其分布特征等诸多方面信息的数据。
河流的泛洪区,卫星影像数据、气象气候数据等都可以是空间数据书店名称店员人数,去年的销售量,电话号码等是非空间数据空间查询是对空间数据的查询或命令人工管理阶段文件管理阶段缺点:1)程序依赖于数据文件的存储结构,数据文件修改时,应用程序也随之改变。
2)以文件形式共享,当多个程序共享一数据文件时,文件的修改,需得到所有应用的许可。
不能达到真正的共享,即数据项、记录项的共享。
常用:文件与数据库系统混合管理阶段优点:由于一部分建立在标准的RDBMS上,存储和检索数据比较有效、可靠。
缺点:1)由于使用了两个子系统,它们各自有自己的规则,查询操作难以优化,存储在RDBMS外的数据有时会丢失数据项的语义。
2)数据完整性的约束条件可能遭破坏,如在几何空间数据系统中目标实体仍存在,但在RDBMS中却已删除。
3)几何数据采用图形文件管理,功能较弱,特别是在数据的安全性、一致性、完整性、并发控制方面,比商用数据库要逊色得多全关系型空间数据库管理系统◆属性数据、几何数据同时采用关系式数据库进行管理◆空间数据和属性数据不必进行烦琐的连接,数据存取较快◆属性间接存取,效率比DBMS的直接存取慢,特别是涉及空间查询、对象嵌套等复杂的空间操作◆GIS软件:System9,Small World、GeoView等本质:GIS软件商在标准DBMS顶层开发一个能容纳、管理空间数据的系统功能。
对象关系数据库管理系统优点:在核心DBMS中进行数据类型的直接操作很方便、有效,并且用户还可以开发自己的空间存取算法。
空间数据库习题答案空间数据库习题答案【篇一:空间数据库复习思考题】xt>1. 什么是空间数据库?阐述空间数据库管理系统的主要功能。
2. 阐述数据库系统的外部、内部体系结构。
3. 什么是数据模型?阐述常用数据模型的基本思想。
4. 什么是空间索引?阐述格网索引、四叉树索引、r树索引的基本思想。
5. 如何扩展sql语言,使其支持空间查询?6. 阐述数据库设计的基本步骤。
7. 阐述数据库的安全性、完整性、并发控制、数据库恢复基本思想。
8. 数据库的完整性确保数据的正确性和相容性,阐述geodatabase提供了哪些措施来保证数据的完整性。
9. 深入理解geodatabase中的要素类、关系类、子类型、属性域、拓扑等基本概念及相关内容。
10. 比较、分析geodatabase中的简单关系和复合关系。
11. 什么是子类型?什么情况下创建子类型,什么情况下创建新的要素类?12. 使用microsoft visio如何设计geodatabase模式?13. 使用arcgis diagrammer如何设计geodatabase模式?14. 拓扑验证(validate)过程中的聚集处理(cluster processing)受哪些因素的影响,如何影响?15. “脏区(dirty areas )”有何作用?简述产生“脏区”的五种情况。
16. 在一个版本化的要素数据集中建立一个新拓扑或者修改一个已存拓扑的模式,请阐述如何完成?17. 请阐述在创建复制和同步复制这一过程中,对geodatabase中的拓扑是如何处理的?18. 阐述要素几何在oracle arcsde geodatabase中如何存储(5种存储方式,及每种存储方式使用的主要系统表)。
19. 阐述oracle geodatabase中的blob数据存储。
20. arcsde geodatabase在oracle中是如何识别事务表和其相联系的要素表、索引表。
GIS复习题GIS 复习题第⼀章1、地理信息:地理信息是有关地理实体和地理现象的性质、特征和运动状态的表征和⼀切有⽤的知识,它是对表达地理特征与地理现象之间关系的地理数据的解释。
2、地理信息系统:⼀种特定的⼗分重要的空间信息系统,是在计算机软、硬件系统⽀持下,对整个或部分地球表层(包括⼤⽓层)的有关地理分布数据进⾏采集、储存、管理、运算、分析、显⽰和描述的技术系统。
3、地理空间分析的三⼤要素:空间位置、属性、时间4、GIS 的基本功能:数据采集功能、数据编辑与处理、数据存储、组织和管理功能、空间查询和空间分析功能、数据输出功能5、GIS 的组成:硬件系统、软件系统、⽹络、空间数据、管理和应⽤⼈员------------------------------------------------------------------------------------------------------------------------------------------第⼆章1、地图投影:按照⼀定的数学法则,建⽴地球椭球⾯上经纬线⽹和平⾯上相应经纬线⽹的数学基础,也就是建⽴地球椭球⾯上的点的地理坐标(λ,φ)与平⾯上对应点的平⾯坐标(x ,y )之间的函数关系2、GIS 中为什么要考虑地图投影(1)地理坐标为球⾯坐标,不⽅便进⾏距离、⽅位、⾯积等参数的量算(2)地球椭球体为不可展曲⾯(3)地图为平⾯,符合视觉⼼理,并易于进⾏距离、⽅位、⾯积等量算和各种空间分析3、投影有哪⼏种变形?(1)长度变形(µ=ds’/ds Vµ=µ-1)(2)⾯积变形(P=dF ’/dF Vp=P-1)(3)⾓度变形:在⼀定点上,⽅位⾓的变形随不同的⽅向⽽变化,所以⼀点上不同⽅向的⾓度变形是不同的。
投影中,⼀定点上的⾓度变形的⼤⼩是⽤其最⼤值来衡量的,称最⼤⾓度变形,通常⽤符号ω表⽰。
4、我国国家的基本⽐例尺地形图有哪些?国家基本⽐例尺地形图有1:1万、1:2.5万、1:5万、1:10万、1:25万、1:50万和1:100万七种。
2022-2022数据库期末复习题(带答案)一、选择题1.在数据库的三级体系结构中,外模式/逻辑模式映象可以保证数据结构和应用程序之间的A.逻辑数据独立性B.物理数据独立性C.数据一致D.数据安全性A.树结构B.网结构C.二维表D.线性表3.主键的属性上有空值违反了A.实体完整性规则B.参照完整性规则C.安全性规D.模型转换规则4.数据独立性是指之间相互独立,不受影响A.概念数据模型和逻辑数据模型B.应用程序和数据库的数据结构C.概念数据模型与数据库的数据结构D.数据与数据库的数据结构参照完整性规则是对的约束。
A.超键B.候选键C.主键D.外键数据库系统三级结构的描述放在中。
(不确定)A.用户数据库B.运行日志C.数据库管理系统D.数据字典如果两个关系没有公共属性,那么其自然连接操作5.6.7.8.A.转化为笛卡尔积操作B.转化为半连接操作C.转化为外部并操作D.结果为空关系9.设关系R和S的元组个数分别为100和300,关系T是R与S的笛卡尔积则T的元组个数是________。
A.400B.10000C.30000D.90000(根据笛卡尔积的定义可知,如果关系R和S的元数分别为r和。
R 和S的笛卡尔积是一个r+的元的元组集合,每个元组的前r个分量来自R的一个元组,后个分量来自S的一个元组;若R中有m个元组,S有n 个元组,则R某S有m某n个元组。
因此,本题R与S的笛卡尔积的元组个数应为100某300=30000。
10.设关系R和S具有相同的目(或称度),且相对应的属性的值取自同一个域,则,R-(R-S)等于A.R∪SB.R∩SC.RSD.R-S11.设有关系R和关系S进行如下图所示的运算,则连接运算(B中含有元组的数目是.A.6B.7C.8D.9RSABCDE123564567878991012.SQL语言中,删除一个表的命令是A.DELETEB.DROPC.CLEARD.REMORE13.SQL语言中,删除记录的命令是A.DELETEB.DROPC.CLEARD.REMORE14.设有一个关系:DEPT(DNO,DNAME),如果要找出倒数第三个字母为W,并且至少包含4个字母的DNAME,则查询条件子句应写成WHEREDNAMELIKEA.‘__W_%’B.‘_%W__’C.‘_W__’D.‘_W_%’15.学生表(某S.DBF)的表结构为:学号(某H,C,8),姓名(某M,C,8),性别(某B,C,2)班级(BJ,C,6),用Inert命令向某S表添加一条新记录,记录内容为:某H某M某BBJ99220221王凌男992201下列命令中正确的是________。
地理空间数据库基础复习题为方便复习先整理有误请指出整理者超哥第一章2.地图数据的获取手段有哪些?a)地图的数字化b)传感器技术c)航空和航天平台技术d)现代遥感技术e)全球定位系统(GPS)和惯性导航系统(INS)3.地图数据使用的坐标体系有哪几种?我国常用:a)北京1954坐标系b)西安1980坐标系c)WGS84坐标系GIS软件环境中关于GIS数据的坐标是如何实现的?GIS利用关系型数据库管理系统的功能把图形的坐标数据当作一个二进制块,交由关系数据库管理系统存储和管理。
4.根据地理实体数字描述方式,空间数据可分为哪两种形式?a)空间对象数据具有几何特征和离散特点的地理要素,如点对象、线对象、面对象、体对象b)场对象数据在一定范围内连续变化的地理对象,如覆盖某一地理空间的格网数字高程模型,不规则三角网,栅格影像数据等。
5.什么是空间数据非结构化特征?空间数据不像一般事务数据一样每一个记录都有相同的结构与长度,因为空间数据包含了拓扑信息,在方便空间数据分析与查询的同时增大了信息管理的难度。
6.空间数据管理演变有哪些过程,说明各过程的特点a)人工管理阶段(20世纪50年代中期)特点:数据不保存;没有数据管理软件;数据冗余b)文件系统阶段(20世纪60年代中期)特点:数据文件是大量数据集合形式;面向用户;数据文件与对应程序有一定独立性;数据文件由顺序文件发展为索引文件、链接文件、直接文件等。
c)文件与数据库系统混合管理阶段(20世纪70年代中期)特点:对用户观点的数据进行更严格描述;允许用户以记录或数据项作单位进行访问;数据的物理存储可以很复杂。
d)全关系型空间数据库管理系统(20世纪70年代后期)特点:不仅可以读写定长的属性数据,而且可以读写非结构化的图形数据,但由于二进制文件的读写效率低,速度慢,效率低。
e)对象关系数据库管理系统特点:能直接管理和存储非结构化的空间数据,效率有所提升,但仍有很大限制。
《GIS空间分析》期末资料(核心版)一、名词解释1.地理信息:是指与空间地理分布有关的事物的信息,它描述了事物的位置、数量、质量、分布特征、相互联系和变化规律。
2.地理信息系统:GIS是一种利用计算机技术以及网络通讯技术(即IT技术)等实现对整个或部分地球表面(包括大气层在内)与空间及地理分布有关的数据进行采集、处理、存储、管理、查询、分析、显示、输出、应用和维护更新的信息系统。
(GIS ≈ 地理数据+ 空间分析)3.GIS空间分析:是空间分析是基于地理对象的空间布局的地理数据分析技术。
其目的在于提取空间信息或者从现有的数据派生出新的数据,是将空间数据转变为信息的过程。
(1)空间分析是GIS的核心和灵魂,是GIS区别于一般的信息系统、CAD或者电子地图系统的主要标志之一(2)基础:地理空间数据库4.要素(Feature):是描述客观世界中的具有共同特征和关系的一组现象(如道路,也称作要素类,feature class)或一个确定的实体及其目标的表示(如某一条道路)。
5.要素集(feature dataset):要素的集合。
6.地理数据库(GeoDatabase):是一种采用标准关系数据库技术来表现和管理地理信息的数据模型。
(1)Geodatabase是现阶段ArcGIS软件中最核心的数据库模型(2)Geodatabase是地理数据统一存储的仓库7.缓冲区:是指对点、线或面实体,按指定的条件,在其周围建立一定宽度范围的空间区域作为分析对象,这个区域(面/多边形)称为缓冲区。
8.矢量叠置分析:就是将具有相同坐标系统的多个空间要素对象的数据层进行叠加,产生一个新数据层面的方法。
产生的数据层面综合了原来两层或多层要素所具有的属性特征。
9.网络分析:是指依据网络拓扑关系(结点与弧段拓扑、弧段的连通性),通过考察网络元素的空间及属性数据,以数学理论模型为基础,对网络的性能特征进行多方面研究的一种分析计算10.DEM:是用数字形式表示高程在地理空间中起伏变化的连续表面,即数字高程模型。
查询1、从查询处理的角度来看,空间数据库与关系数据库之间区别:答:至少有三个主要区别:①、与关系数据库不同,空间数据库没有固定的运算符集合可以充当查询计算的基本构件②、空间数据库要处理非常大量的复杂对象,这些对象具有空间范围,不能自然的排列成一维数组。
③、检测空间谓语要用到计算量极大的算法,所以不能再假定I/O代价在CPU的处理代价中只能主导地位2、空间查询的基本构件:点查询:给定一个查询点P,找出所有包含它的空间对象O;范围或区域查询:给定一个查询多边形P,找出所有与之相交的空间对象O;空间链接:两个表R和S基于一个空间谓语θ进行连接时,该连接成为空间连接。
最近邻居:空间聚集,即给定一个对象O,找出所有距离O最近的对象P3、空间查询处理的“过滤-精炼模式”是什么,其目的?(对象操作的两步查询处理)目的:用两步算法高效地处理复杂的数据类型过滤:寻找Q最终结果的超集S;精炼:利用GIS处理S来找到精确的Q的答案过滤-精炼策略的作用?两个步骤的内容是什么?提示:ppt : Efficient algorithms to answer spatial queriesCommon Strategy - filter and refine(过滤-精炼)Filter Step:Query Region overlaps with MBRs of B,C and D过滤:查询区域与B、C、D的最小外接矩形有重叠部分,保留B、C、D,其他的舍弃Refine Step: Query Region overlaps with B and C精炼:查询区域与B、C有重叠,舍弃D4、空间查询处理中,一般是采用什么(MBR))来替代不同类型的空间实体(如线、面)?这样做有何好处?答:Minimum orthogonal bounding rectangle (MOBR or MBR)最小外接矩形;能够加快查询速度5、对于点查询、区域查询、空间连接查询操作,各自有哪些处理算法(策略)?它们与什么因素有关?答:点查询:数据未排列且没有索引:穷举法,扫描整个文件并判断每条记录是否满足谓语;建立空间索引:在索引中使用find操作;需要查找的磁盘扇区等于索引的深度;空间填充曲线散列:运用折半法寻找点;检验大约logB(n),的磁盘扇区;区域查询:数据未排列且没有索引:穷举法,扫描整个文件并判断每条记录是否满足谓语;建立空间索引:在索引中使用范围查询操作;空间填充曲线散列:验证Z值满足范围查询要求;使用折半查询找到最低的Z值;扫描前面的数据文件直至满足查询要求的最大的Z值空间连接:嵌套循环,检验所有可能的空间谓语对;基于空间分块,只检验普通空间区域的对象对;树匹配:从每张表中找出分层的的对象组22.举例说明单遍扫描查询和多遍扫描查询的概念。
《空间数据库》范围及重点1.第一章:绪论1)空间数据库基本概念、组成部分、名称简写之间的联系与区别与联系;答;利用当代的系统方法,在地理学、地图学原理的指导下,对地理空间进行科学的认识与抽象,将地理数据库化为计算机处理时所需的形式与结构,形成综合性的信息系统技术——空间数据库或者SDBMS是海量SD的存储场所、提供SD处理与更新、交换与共享,实现空间分析与决策的综合系统。
组成:存储系统、管理系统、应用系统是SDBS的简称2)目前空间数据库实现方案;答:ORDBMS3)GIS,RS与空间数据库之间的联系;4)常见的空间数据库产品答:轻量级:MS的Access、FoxPro、SUN的MySQL中等:MS的SQL Server系列重量级:Oracle的Oracle不太熟悉的有:Sybase、Informix、DB2 、Ingress、PostgreSQL(PG)等5)产生空间数据库的原因;答:直接利用?SD特征:空间特性非结构化特征空间关系特征多尺度与多态性海量数据特性存在的问题:复杂图形功能:空间对象复杂的空间关系数据变长记录6)空间数据库与普通关系数据库的主要区别。
答:关系数据库管理属性数据,空间数据采用文件库或图库形式;增加大二进制数据类型(BLOB),解决变长数据存储问题;将空间数据/属性数据全部存放在数据库中;但空间特性由程序处理2.第二章:空间数据库模型1)如何理解空间数据库模型;2)空间数据及空间关系;… (1) 空间数据类型几何图形数据影像数据属性数据地形数据元数据:对空间数据进行推理、分析和总结得到的关于数据的数据,数据来源、数据权属、数据产生的时间数据精度、数据分辨率、元数据比例尺地理空间参考基准、数据转换方法…(2) 空间关系指地理空间实体之间相互作用的关系:拓扑关系:形状、大小随投影改变。
在拓扑变换下不变的拓扑变量,如相邻、包含、相交等,反映空间连续变化的不变性方位关系:地理空间上的排列顺序,如前后、上下、左右和东、南、西、北等方位度量关系:距离远近等3)空间数据库如何建模;DB设计三步骤‹ Conceptual Data Model:与应用有关的可用信息组织、数据类型、联系及约束、不考虑细节、E-R模型Logic Data Model 层次、网状、关系,都归为关系,SQL的关系代数(relational algebra, RA) Physical Data Model:解决应用在计算机中具体实现的各种细节,计算机存储、数据结构等4)模型之间如何转换?5)可行的空间数据库建模方案。
第一章1.GIS的名词分析与推论GIS概念:具有地理数据的采集、管理、分析、表达能力,能为决策者提供有用地理信息的系统。
推论1:地理信息系统采集的数据为空间数据,即具有空间位置,又具有属性特征。
地理信息系统的数据库因此又称为空间数据库。
推论二:地理信息系统具有采集、管理、分析地理数据和表达地理信息的能力。
包括空间数据库建设和空间数据库的应用两个层次。
推论三:地理信息系统包括计算机硬件、软件、数据、系统开发人员和用户,但由于处理和分析的是地理数据,因此,在通用的硬件、软件基础上,还有体现专业特点的硬、软件。
2.GIS空间数据体系空间数据库:空间数据和属性数据的组织矢量有混合式、扩展式和开放式矢量数据的空间数据组织:空间坐标数据的非结构化和属性数据的结构化栅格数据:像元阵列3.GIS数据模型矢量数据模型:简单数据结构(面条结构):如Shapefile、拓扑数据结构:如Coverge、面向对象的数据模型:如Geodatabase栅格数据模型:栅格文件常用格式:*.tif,*.jpg,*.bmp等。
GIS中的栅格格式:ESRI的Grid、Geodatabase的栅格数据集等。
遥感图像的格式:PCI的* .pix,Erdas的*.img等。
4.空间数据库设计核心将现实世界抽象为GIS数据模型,这是数据库设计的核心。
5.名词解释:面条结构:数据按点、线、面为单元进行组织,点、线、面都有自己的坐标数据。
最典型的是面条结构。
拓扑数据结构:不仅存储空间位置,同时存储空间关系。
拓扑关联:指存在于空间图形的不同类型元素之间的拓扑关系。
如结点与弧段、弧段与多边形。
第二章1.名词解释:数据词典:以词典的方式描述和定义E-R模型设计中出现和形成的实体、关系。
数据模型匹配:实现将实体类型和特征类型(Coverage、Shapefile、Grid等)的匹配。
区:基于现有的面特征来描述复杂的区域如多个独立的多边形组成的区域、相互重叠的区域。
《空间数据库》复习1、空间数据具有哪些特点?空间特征空间关系非结构化抽象特征多时空性特征分类编码特征海量数据特征多尺度与多态性2、为什么不适合直接采用关系型数据库对空间数据进行管理?(1)传统数据库管理的是不连续的相关性较小的数字或字符,而空间数据是连续的,并且有很强的空间相关性;(2)传统数据库管理的实体类型较少,并且实体类型间关系简单固定,而GIS数据库的实体类型繁多,实体间存在着复杂的空间关系;(3)传统数据库存储的数据通常为等长记录的数据,而空间数据的目标坐标长度不定,具有变长记录,并且数据项可能很多,很复杂;(4)传统数据库只查询和操作数字和文字信息,而空间数据库需要大量的空间数据操作和查询。
3、常用的空间数据库管理方式有哪几种及其各自特点。
㈠文件关系数据库混合管理方案用一组文件形式来存储地理空间数据及其拓扑关系,利用通用关系数据库存储属性数据,通过唯一的标识符来建立它们之间的连接。
优点:⑴GIS 可通过DBMS提供的高级编程语言的接口,直接操纵属性数据,查询属性数据库,并在GIS的用户界面下,显示查询结果。
⑵在ODBC推出后,GIS软件商只需开发GIS与ODBC的接口软件,就可将属性数据与任何一个支持ODBC的RDBMS连接。
这样用户可在一个界面下处理图形和属性数据。
缺点:⑴属性数据和图形数据通过ID联系起来,使查询运算,模型操作运算速度慢;⑵数据发布和共享困难;⑶属性数据和图形数据分开存储,数据的安全性、一致性、完整性、并发控制以及数据损坏后的恢复方面缺少基本的功能;⑷缺乏表示空间对象及其关系的能力。
㈡全关系式数据库管理方案基于关系模型方式,将图形数据按关系模型组织。
图形数据和属性数据统一存储在通用关系数据库中,即将图形文件转成关系存放在目前大部分关系型数据库提供的二进制块中。
将图形数据变长部分处理成Binary Block字段优点:⑴在全关系型数据库中加入了二进制数据块形式省去大量关系连接操作,可提高查询速度;⑵便于数据的维护。
缺点:⑴不定长记录造成存储效率的下降;⑵实现SQL查询要附加接口,因此它只适用于功能简单的GIS㈢面向对象数据库管理方案面向对象型空间数据库管理系统最适合空间数据的表达和管理。
优点:⑴支持变长记录,还支持对象的嵌套,信息的继承和聚集。
⑵面向对象数据库管理系统允许定义合适的数据结构和数据操作。
缺点:⑴不支持SQL语言,在通用性上受局限。
⑵面向对象型空间数据库管理系统还不够成熟,价格又昂贵,目前在GIS领域还不通用领域还不通用。
㈣对象关系数据库管理方案优点:⑴解决了空间数据的变长记录管理,使数据管理效率大大提高;⑵空间和属性之间联结有空间数据管理模块解决,不仅具有操作关系数据的函数,还具有操作图形的API函数;⑶对象—关系型空间数据库是在标准的关系数据库上加一层空间数据管理模块;用该层功能将地理结构查询语言转化成标准的SQL查询,空间数据查询速度快。
缺点:空间数据对象还不能有用户任意定义,用户使用受一定限制。
如定义的空间函数支持的对象不带拓扑关系,用户不能定义带拓扑关系的数据模型。
4、与Coverage相比GeoDataBase空间数据模型的主要特点和优势。
特点:⑴面向对象的数据模型⑵属性存储在DBMS中⑶行为由客户端来实现⑷空间数据和属性数据的容器⑸ArcGIS有工具可用来移植现有的GIS数据⑹可升缩的解决方案(个人GDB或企业GDB) ⑺具有互操作性优势:在同一数据库中统一管理各种类型的空间数据。
空间数据录入和编辑更加准确,得益于空间要素的合法性规则检查。
空间数据更面向实际的应用领域。
不再是无意义的点线面,而代之以电杆、光缆和用地等。
可以表达空间数据之间的相互关系。
可管理连续的空间数据,无需分幅分块。
支持空间数据的版本管理和多用户并发操作。
5、GeoDataBase属性域和子类型的作用及主要设置与应用过程。
属性域:(作用)可把属性域应用在多个字段上定义属性有效取值围、值域(连续变化区间)和码域(离散取值集合)定义一个属性字段的合法属性值;两种类型:围属性域:从最小值到最大值;杆高=10米到15米编码值属性域:一组值的列表;土地利用=居住,商用,或工业用分割和合并的方针是Geodatabase的属性设置属性域的步骤:⑴选择一种属性⑵设定域的类型⑶设定分割和合并原则子类型:(作用)子类型可应用在所有的记录上要素类或表中对对象进行分组,按某个整数型属性分组,自动符号化要素类每种子类型可根据不同的规则来分配属性取值域, 拓扑规则, 网络规则等等。
6、GeoDataBase在保证数据完整性方面有哪些措施。
Geodatabase提供了两种机制用于构建空间数据完整性—平面拓扑和几何网络。
平面拓扑是地理要素间的空间关系,它是确保数据质量的基础。
拓扑能提高数据的空间分析能力,并且在确保GIS数据库质量方面扮演着重要的角色。
拓扑的实现依赖于一组完整性规则,它定义了空间相关的地理要素和要素类的行为。
几何网络用于模拟线性系统,如道路交通网络。
支持丰富的网络跟踪和分析功能。
7、GeoDataBase几何网络构成要素及主要属性,几何网络建立过程与分析过程。
构成要素:简单接点&复杂接点简单边线&复杂边线孤立交汇点&默认主要属性:Enabled/Disabled状态 Sources 和Sinks Weights建立过程:⑴指定需要创建几何网络的要素集⑵选择参与几何网络的要素类⑶输入几何网络名称⑷确认是否创建复杂边线⑸设置捕捉容限⑹设置权重分析过程:网络流:有些网络分析需要流:顺流逆流跟踪、寻找共同源头和闭合环等类型:未初始化流、明确型流、未明确型流(短路:Find loop)设置:Set Flow Direction更改源和汇:(AncillaryRole 码域字段:None、Source和Sink)实现跟踪操作:⑴设置源和汇⑵设置跟踪选项(Analysis Option对话框)⑶放置标识旗(起点和终点)⑷使用临时障碍物或禁用要素(可选)⑸设置跟踪任务解决跟踪(Solve)几何网络组成的两个要素:要素类(边和节点要素) 逻辑网络(存储连通性关系的表)逻辑网络提供的追踪解决方案:流向设定连通性追踪环路查找流追踪隔离追踪故障追踪8、GeoDataBase拓扑的作用、特点及其建立和应用工作过程。
作用:拓扑是在要素之间构建了空间关系的模型用于确保空间数据的完整性;基于一致的几何要素。
在要素间定义有效的空间关系特点:(拓朴关系的优势)用户可自行定义哪些要素类将受拓朴关系规则的约束;多个点线面要素类(层)可以同时受同一组拓朴关系规则的约束;提供了大量的拓朴关系规则,以后将提供更多;用户为自己的数据可以自行指定必要的拓朴关系规则;拓朴关系及规则在商业DBMS中进行管理,可支持多用户并发处理;用户可以局部建立或检查拓朴关系以提高效率。
9、常用的GeoDataBase多边形拓扑规则、线要素拓扑规则及点要素拓扑规则。
多边形拓朴规则(9条):Must not overlap 不能互相重叠(案例:宗地之间不能互相重叠。
)Must not have gaps 是连续的无缝隙的(案例:土地利用要素类必须是连续的无缝隙的)Contains point 包含点要素(案例:建筑物或宗地必须拥有一个地址(点要素表示))Boundary must be covered 边界被覆盖(案例:宗地多边形边线必须由宗地边线覆盖。
)Muts be covered by feature class of polygon 被多边形要素覆盖(案例:县多边形必须位于省多边形。
)Must be covered by (大区域)被(小区域)覆盖(案例:省要素必须被县要素所覆盖。
)Must not overlap with 不能重合(案例:海洋不能和陆地重合。
)Must cover each other 互相覆盖(案例:县要素外边线构成的多边形和这些县的辖省要素类多边形。
)Area boundary must be covered by boundary of区域边界被其他边界覆盖 (案例:邮政代码区域是由多块宗地构成的。
)线拓朴规则(12条):Must not have dangles 不能包含悬挂结点(案例:宗地地段不能包含悬挂结点)Must not have pseudo-nodes 不能有虚设的结点(案例:用于两个结点构成的弧段。
)Must not overlap 不能互相重叠(案例:街道不能互相重叠。
)Must not self overlap 不能自己重叠(案例:街道不能自重叠。
)Must not intersect 不能相交(案例:地块线(等高线)不能相交。
)Must not self intersect 不能自己相交(案例:街道要素不能够自相交。
)Must not intersect or touch interior 不能相交或不能在端点接触(案例:地块边线不能和地块边线相交(只能够在端点处接触)。
)Must be single part 必须是单部件要素(案例:所有巴士路线必须是单部件要素。
)Must not overlap with 不能互相重叠(案例:道路和铁路不能互相重叠。
)Must be covered by feature class of – lines 必须被—线的要素覆盖(案例:巴士路线必须被街道所覆盖。
)Endpoint must be covered by 端点必须被覆盖(案例:管道末端必须有阀门)Must be covered by boundary of(line)被边线覆盖(案例:宗地地段要素必须被多边形要素的边线所覆盖。
)点拓朴规则(4条):Must be properly inside polygons 必须被多边形包括(案例:城市点要素必须被行政区划多边形要素所包含。
)Must be covered by boundary of(point)必须被点的边界包括(案例:国界碑必须在国土的边界上。
)Must be covered by endpoint of 必须被…的末端覆盖(案例:阀门必须被管道末端覆盖。
)Point must be covered by line 必须被线覆盖(案例:收费站必须在公路上。
)特殊拓朴规则:Must be larger than cluster tolerance:这条规则将找到所有比拓朴容限小的要素。
但并不会自动删除这些要素,给用户留下操作决定权。
10、什么是地址匹配,GeoDataBase地址匹配的作用及数据需求。
地址数据分析客户信息管理分发地址匹配应用地址匹配:A 地址匹配就是将地址描述信息创建为空间要素的处理过程。