当前位置:文档之家› 数据库技术复习资料

数据库技术复习资料

数据库技术复习资料
数据库技术复习资料

1.与网状和层次数据库相比,关系数据库有哪些优点?

与层次和网状模型比较,关系模型有下列优点:数据结构单一;建立在严格的数学概念基础上;将数据定义和数据操纵统一在一种语言中,使用方便,易学易用。

2.试述关系模型的完整性规则

实体完整性:关系中键属性的值不能取空值。

参照完整性:是关系间引用所遵循的规则,与外键有关。

用户定义的完整性:数据间应满足的语义约束关系,由用户定义,由系统检查。

3.试述等值连接与自然连接的区别和联系

等值连接表示为R A=BS,自然连接表示为R S;自然连接是除去重复属性的等值连接。两者之间的区别和联系如下:1、自然连接一定是等值连接,但等值连接不一定是自然连接。

等值连接不把重复的属性除去;而自然连接要把重复的属性除去。2、等值连接要求相等的分量,不一定是公共属性;而自然连接要求相等的分量必须是公共属性。3等值连接不把重复的属性除去;而自然连接要把重复的属性除去。

4.函数依赖、部分依赖、完全依赖、传递依赖、平凡依赖

5.函数依赖公理和推论

Armstrong公理(三个公理):

设r是R(U)上的一个关系,X、Y、Z、W U。

A1. 自反律: 若Y X U, 则 X→Y;

A2. 增广律: 若X→Y且Z U,则 XZ→YZ;

A3. 传递律: 若X→Y, Y→Z,则 X→Z.

有以上三个公理,可以推出以下3个推论:

推论1(合成规则):若X→Y,X→Z,则X→YZ

推论2(分解规则):若X→Y且Z Y,则X→Z

推论3(伪传递规则)若X→Y,YZ→W,则XZ→W。

6.函数依赖的覆盖和等价

对于在模式R上的函数依赖集F和G,如果对G中的每一个函数依赖X→Y,都有F|=X→Y,称F是G的一个覆盖。把逻辑蕴含符号引入函数依赖集的覆盖中,记为:F|= G

定义(等价和覆盖)

在模式R上的FDs F和G,若F+=G+,则称F和G等价。记作F G。

定理:已知模式R上的函数依赖集 F和G。当且仅当 F|=G 且 G|=F ,则 F G。

1.试述数据库设计过程,及每个阶段的任务。

数据库的设计可分为以下六个阶段:需求分析、概念设计、逻辑设计、物理设计、实施和运行、使用和维护。

需求分析:信息需求、处理需求、安全性和完整性方面的需求。

概念设计:在需求分析的基础上,通过对用户需求进行分析、归纳、抽象,形成一个独立于具体DBMS和计算机硬件结构的整体概念结构,常用工具用ER模型。

逻辑设计:在概念结构设计的基础上,在一定的原则指导下将概念模式(E-R图)转换为某个具体DBMS支持的数据模型相符合的、经过优化的逻辑结构,其中用对数据逻辑结构进行优化采用范式理论。

物理设计:为逻辑数据结构选取一个最适合应用环境的物理结构,包括存储结构和存取方法等。

数据库实施和运行:用DBMS提供的数据定义语言(DDL)和其它实用程序将数据库逻辑结构设计和物理设结构计结果用DDL严格描述出来,成为DBMS可以接受的源代码,再调试产生目标模式,最后将数据装入数据库。

数据库的使用和维护:收集和登记数据库运行的情况记录,用于评价并改善数据库系统的性能。

2.什么是数据库的逻辑结构设计?试述其设计步骤。

逻辑结构设计:把概念结构设计阶段设计好的基本E-R图转换为与选用DBMS产品所支持的数据模型相符合的逻辑结构。

逻辑结构设计的方法:

1. 将概念结构转换为一般的关系、网状、层状模型;

2. 将转换来的关系、网状、层状模型向特定DBMS支持下的数据模型转换;

3. 对数据模型进行优化。

3.试述数据库物理设计的内容和步骤。

数据库的物理设计:为一个给定的逻辑数据模型选取一个最适合应用要求的物理结构的过程。

数据库物理设计的步骤:

(1)确定数据库的物理结构,在关系数据库中主要指存取方法和储存结构。

(2)对物理结构进行评价,评价的重点是时间和空间效率。

4.数据库管理系统的主要功能有哪些?

数据库管理系统是位于用户和操作系统之间的数据管理软件。科学地组织和存储数据、高效地获取和维护数据,用户使用的各种数据库命令以及应用程序的执行,最终都是DBMS来实现的。

DBMS 的主要功能包括: (1) 数据库定义;(2) 数据操纵 (3) 数据库控制;(4) 数据库维护

5.数据库管理系统有哪几部分组成?

DBMS的组成如下:

(1)数据和元数据存储

(2)存储管理器

(3)查询处理器

(4)事务管理器

(5) 输入模块---模式修改、查询和修改

6.开发一个数据库管理系统的主要技术难点在哪里?对中国如何尽快开发自己的数据库管理系统,给出你的建议。

1.分布式数据库的有哪些特点?

分布式数据库系统的特点

1. 数据是分布的

2. 数据是逻辑相关的

3. 结点自治性

2.分布式数据库管理系统有哪几部分组成?

分布式数据库管理系统的组成

1.局部数据库管理系统(LDBMS)

2.全局数据库管理系统(GDBMS)

3.全局数据字典GDD

4.网络通信管理CM

3.分布式数据库系统能够提供哪些分布透明性?不同透明性对应用程序的编程有什么影

响?

分片透明性:关系如何分片对用户是透明的,指用户不必关心数据是如何分片的。其应用程序的编写与集中式数据库相同。

位置透明性 (较常用):用户需知道数据在哪个片段,而不必知道所操作的数据放在哪个节点。数据在结点间的转移不会影响应用程序。

局部映象透明性:该透明性提供数据到局部数据库的映象。在编程时不但需要了解全局关系的分片模式,还需要了解各片段存放的站点。

无透明性

4.半连接在分布式查询优化中的作用?会计算简单的半连接。

5.试述事务的概念及事务的4 个特性。

事务(Transaction):是用户定义的一个数据库操作序列,是数据恢复和并发控制的基本单位,数据库系统在执行事务时,要么执行事务中全部操作,要么一个操作都不执行。一般用Ti表示第i个事务。

原子性(Atomic):一个事务要么全执行,要么全不执行。

一致性(Consistency):事务执行的结果必须是使数据库从一个一致状态变到另一个一致性状态。

隔离性(Isolation):事务更新过的数据在事务结束前对其他事务不可见。

持久性(Durability):已完成事务对数据的更新应持久,发生故障应恢复。

6.在数据库管理系统中为什么要采用并发控制技术?常用并发控制技术有哪些?

DBMS对事务采用并发机制的主要目的:

(1)改善系统的资源利用率:对于一个事务来说,在不同阶段使用不同的资源,若并发执行可以交叉使用这些资源,有利于提高系统资源的利用率。

(2)改善短事务的响应时间:若设有两个事务T1 和T2,其中T1是长事务,交付系统在先;T2是短事务,交付系统比T1稍后。如果串行执行,则须等T1执行完毕后才能执行T2。而T2的响应时间会很长。一个长事务的响应时间长一些还可以得到用户的理解,而一个短事务的响应时间过长,用户一般难以接受。如果T1 和T2并发执行,则T2可以和T1重叠执行,可以较快地结束,明显地改善其响应时间.

DBMS对事务采用并发机制的方法:基于封锁的方法、基于时戳的方法、版本更新方法。其中封锁方法在商业化数据库管理技术中使用最为普遍。

7.什么是两段封锁协议?

二段锁协议(Two-Puase Looking 2PL协议)

(1). 任何事务在对数据操作前必须先获得锁;

(2). 事务在释放一个锁后不再获得任何锁。

第一阶段是获得封锁,也称为扩展阶段。在这阶段,事务可以申请获得任何数据项上的任何类型的锁,但是不能释放任何锁。

第二阶段是释放封锁,也称为收缩阶段。在这阶段,事务可以释放任何数据项上的任何类型的锁,但是不能再申请任何锁。

8.数据库恢复的基本技术有哪些?

事务恢复的目的是当数据库出现故障时能恢复到一个正确一致的状态。

集中式数据库系统中恢复的手段主要是利用转储和日志。

转储:数据库管理员定期将整个数据库复制到磁带或另一个磁盘上保存起来的过程。

日志:保存每一次对数据库进行更新操作的有关信息的文件,由DBMS自动建立和记录。

9.什么是日志文件?为什么要设立日志文件?

日志文件的主要内容:

(1).事务处理的标识符(开始、结束);

(2).操作的类型(插入、删除、修改);

(3).更新前的值;

(4).更新后的值.

10.数据库运行中可能产生的故障有哪几类?

故障种类:事务故障、系统故障、介质故障。

⑴事务故障:由于某种原因导致事务尚未运行完成并提交就被中断所产生的故障。比如:算术运算的溢出、零作除法、违反完整性等。

⑵系统故障:系统在运行过程中,由于某种原因致使所有正在运行的事务都以非正常的方式终止而引起的故障。比如:硬件和软件故障、突然停电等。

⑶介质故障:系统在运行过程中,由于某种原因致使存储在外存储器中的数据部分丢失或全部丢失的故障。

11.试述实现数据库安全性控制的常用方法和技术。

用户鉴别、存取权限控制、视图机制、跟踪审查、数据加密存储

12. 给出下列名次的含义

对象、类、封装、继承、多态、对象标识、子类、超类。

对象

属性集合描述对象的状态、组成和特征

方法集合描述对象的行为特征

消息集合是对象向外提供的界面,由对象接收和响应

对象标识:每个对象都有一个内部标识符OID,OID在整个系统中是唯一的,一旦生成就不能改变。

封装:每个对象都是其状态和行为的封装体。

类:具有相同特征对象的集合;对象为类中的实例。

类本身看作对象,称为类对象。

面向对象数据库模式是类的集合,形成类层次结构

一组相关类形成类层次结构

子类、超类

子类和超类间具有继承关系

子类继承超类的属性和方法。

单继承和多继承

解决同名冲突的方法:

子类与超类间的同名冲突按子类优先处理;

多个超类间的同名冲突,按说明超类的先后取第一个超类中的定义或规定继承的超类;

提供显式方法: 从多个冲突的实例变量或方法中继承一个;继承多个,在类定义中重新命名。

多态性:同一操作有不同的实现,取决于具体对象。

13. 叙述面向对象模型中“对象标识”与关系模型中的“键”的相同点和不同点。

对象标识是指每个对象都有的一个内部标识符OID,OID在整个系统中是唯一的,一旦生成就不能改变。而键是指在关系中能唯一标示元组的最小属性集。它可以不止一个,可以是多个属性的组合。它们的作用值相同的。

1.叙述key/value的数据结构。

key/value的数据结构:域(Domain)+数据项(Item) 域类似于传统关系数据库中的“表”,但域无结构,作用是容纳数据项;数据项用Key定义,一个域中的不同数据项可能具有不同的结构,数据属性全部是字符串类型,但在有些实现中,属性也可以具有简单的类型,如整型、字符串数组等。

2. Key/Value数据模式与关系数据库的比较有哪些优点和缺点?

Key/Value的优点:

–便于扩展,适于云计算的环境

–与应用程序代码的兼容性更好

Key/Value的缺点:

–数据完整性约束转移至应用程序

–目前的很多Key/Value数据存储系统之间不兼容

–在云环境中,很多用户和应用使用同一个系统。为了避免一个进程使共享环境超载,往往严格限制一个单独的查询所能够产生的全局影响。

3.在数据切分机制中,一致性哈希算法的基本原理是什么?

下面就来按照5个步骤简单介绍consistent hashing算法的基本原理。

(1)环形hash空间

考虑通常的hash算法都是将value映射到一个32位的key值,也即是0~2^32-1次方的数值空间;我们可以将这个空间想象成一个首(0)尾(2^32-1)相接的圆环

(2)把数据对象映射到hash空间

接下来考虑4个对象object1~object4,通过hash函数计算出的hash值key在环上的分布如下图所示。

hash(object1) = key1;

……

hash(object4) = key4;

(3)把cache映射到hash空间

Consistent hashing的基本思想就是将对象和cache都映射到同一个hash数值空间中,并且使用相同的hash算法。

假设当前有A,B和C共3台cache,那么其映射结果将如图3所示,他们在hash空间中,以对应的hash值排列。

hash(cache A) = key A;

……

hash(cache C) = key C;

(4)把对象映射到cache

现在cache和对象都已经通过同一个hash算法映射到hash数值空间中了,接下来要考虑的就是如何将数据对象映射到服务器cache上面了。

在这个环形空间中,如果沿着顺时针方向从对象的key值出发,直到遇见一个cache,那么就将该对象存储在这个cache上,因为对象和cache的hash值是固定的,因此这个cache必然是唯一和确定的。这样就找到了对象和cache的映射方法!

依然继续上面的例子,那么根据上面的方法,数据对象object1将被存储到服务器cache A上;object2和object3对应到cache C;object4对应到cache B。

(5)考察cache的变动

前面讲过,通过简单hash然后求余的方法带来的最大问题就在于:当cache有所变动时,cache会失效,进而对后台服务器造成巨大的冲击,现在就来分析分析consistent hashing算法。

(a)移除cache

考虑假设cache B挂掉了,根据上面讲到的映射方法,这时受影响的将仅是那些沿cache B逆时针遍历直到下一个cache(cache A)之间的对象,也即是本来映射到cache B 上的那些数据对象。

因此这里仅需要变动对象object4,将其重新映射到cache C上即可;参见下图。(b)添加cache

再考虑添加一台新的cache D的情况,假设在这个环形hash空间中,cache D被映射在对象object2和object3之间。这时受影响的将仅是那些沿cache D逆时针遍历直到下一个cache(cache B)之间的对象(它们是本来映射到cache C上对象的一部分),将这些对象重新映射到cache D上即可。

因此这里仅需要变动对象object2,将其重新映射到cache D上。

一致性哈希算法优点:每个节点都负责存储环中该节点与其后继节点之间区域对应的存储对象,也称为“区间负责制”。区间负责制使得节点的加入和退出只需要其邻居节点进行数据迁移,而不影响其它节点

一致性哈希算法缺点:采用随机的位置值来决定数据项存储在哪个节点上,这导致节点之间负载不均衡。

4.云计算按照服务类型可以分为哪几类?

从专用到通用分为:将软件作为服务(SaaS)、将平台作为服务(PaaS)、将基础设施作为服务(IaaS)。

5.Google云计算中分布式结构化数据表Bigtable的设计动机是什么?

需要存储的数据种类繁多:Google目前向公众开放的服务很多,需要处理的数据类型也非常多。包括URL、网页内容、用户的个性化设置在内的数据都是Google需要经常处理的;

海量的服务请求:Google运行着目前世界上最繁忙的系统,它每时每刻处理的客户服务请求数量是普通的系统根本无法承受的;

商用数据库无法满足Google的需求:一方面现有商用数据库设计着眼点在于通用性,根本无法满足Google的苛刻服务要求;另一方面对于底层系统的完全掌控会给后期的系统维护、升级带来极大的便利

6.试比较Hadoop中的数据库HBase和传统关系数据库的不同.

Hbase和传统关系数据库的不同主要体现在:

1. 数据类型

Hbase只有简单的字符串类型,所有类型都是交由用户自己处理,它只保存字符串。而关系数据库有丰富的类型选择和存储方式、数据操作,Hbase操作只有很简单的插入、查询、删除、清空等,表和表之间是分离的,没有复杂的表和表之间的关系,所以也不能也没有必要实现表和表之间的关联等操作。而传统的关系数据通常有各种各样的函数、连接操作。

2.存储模式

Hbase是基于列存储的,每个列族都有几个文件保存,不同列族的文件是分离的。传统的关系数据库是基于表格结构和行模式保存的。

3.数据维护

Hbase的更新正确来说应该不叫更新,而且一个主键或者列对应的新的版本,而它旧有的版本仍然会保留,所以它实际上是插入了新的数据,而不是传统关系数据库里面的替换修改。

4.可伸缩性

Hbase和Bigtable这类分布式数据库就是直接为了这个目的开发出来的,能够轻易的增加或者减少(在硬件错误的时候)硬件数量,而且对错误的兼容性比较高。而传统的关系数据库通常需要增加中间层才能实现类似的功能。

7. 了解MapReduce的基本工作原理。

MapReduce原理的要点:

数据分割、任务调度、故障处理等细节对程序员透明;

利用资源无关性的原理,提高处理效率;

合理的任务粒度,优化容错处理和整体效率;

本地计算:充分利用数据的空间局部性来减少网络传输,节省带宽资源;

减少中间数据的产生,优化网络传输。

8.了解Hadoop中的分布式数据库--- Hbase的逻辑模型和物理模型。

逻辑模型:表格里存储一系列的数据行,每行包含一个可排序的行关键字、一个可选的时间戳及一些可能有数据的列(稀疏)

数据行有三种基本类型的定义:

行关键字是数据行在标准唯一标识,时间戳是每次数据操作对应关联的时间戳,列定义为:

物理模型:实际上就是把概念模型中的一个行进行分割、并按照列族存储

空的单元格不存储,未指明时间戳则返回指定列的最新数据值

9. 了解在亚马逊的分布式Key/value数据存储与管理系统Dynamo中,采用的哪些技术来保证数据的可伸缩性和最终一致性。

Dynamo综合了一些著名的技术来实现可伸缩性和可用性:数据划分(data partitioned)和使用一致性哈希的复制(replicated),并通过对象版本(object versioning)提供一致性。

10.阐述SQL Azure和SQL Server的相同点和不同点。

1.物理管理和逻辑管理

SQL Azure在管理上突出强调了物理管理,能够自动复制所有存储数据以提供高可用性,同时还可以管理负载均衡、故障转移等功能;

SQL Azure的物理资源;

SQL Azure不能使用SQL Server备份机制,所有的数据都是自动复制备份;

2.服务提供

SQL Server时,需要准备和配置所需要的硬件和软件;

Windows Azure平台上创建了账户后,便可以使用SQL Azure数据库,同时还可以访问所有提供的服务;

SQL Azure订阅都会绑定到微软数据中心的某个SQL Azure服务器SQL Azure服务器上的数据库通常会在数据中心其他物理机上进行备份。

3.Transact-SQL支持

SQL Azure中由微软进行物理资源的管理,因而这些类型的参数并不适用于SQL Azure 4.特征和类型

SQL Azure不支持SQL Server的所有特征和数据类型。在现今版本的SQL Azure中,不支持分析、复制、报表和服务代理等服务

11.大数据的4V特征是什么?

“大量化(Volume)、多样化(Variety)、快速化(Velocity)、价值密度低(Value)”就是“大数据”的显著特征,或者说,只有具备这些特点的数据,才是大数据。

12.分布式数据系统的CAP原理的三要素是什么?

分布式数据系统的CAP原理的三要素:

一致性(Consistency)

可用性(Availability)

分区容忍性(Partition tolerance)

一致性(Consistency)是指执行了一次成功的写操作之后,未来的读操作一定可以读到这个写入的值。

可用性(Availability)(指的是快速获取数据) :每一次操作总是能够在确定的时间返回。

分区容忍性(Partition-tolerance)系统中任意信息的丢失或失败不会影响系统的继续运作。

13.几种主流NoSQL数据库包括哪些?

(1) BigTable(2) Dynamo(3) Cassandra(4) HBase(5) Redis(6) MongoDB

14.数据仓库数据的基本特征是什么?

(1)数据仓库的数据是面向主题

面向主题是一个在较高层次上对数据进行归类与组织的标准,每个主题基于对应一个宏观的决策分析领域。

(2)数据仓库的数据是集成的

首先要统一原始数据中所有矛盾之处,如:同名异义、单位不同、字长不一致等,还要还要把原始数据转变为面向主题方式组织的决策分析数据,然后才能放入数据仓库中。(3)数据仓库的数据是不可更新的

数据仓库的数据是企业相当一段时间内的历史数据,它主要供企业决策分析之用,所涉及的操作主要是数据查询,一般没有更新操作。

(4)数据仓库的数据是随时间变化的

①数据仓库随时间变化不断增加新的数据内容。

②数据仓库随时间变化不断删去旧的数据内容。

③数据仓库中包含有大量的综合数据,且随着时间的变化不断地进行重新综合。

15.什么是数据挖掘?数据挖掘常用的技术方法哪几种?

1.数据挖掘

数据挖掘是从超大型数据库(VLDB)或数据仓库中发现并提取隐藏在内的模式的过程,这些模式是有效的、新颖的、有潜在使用价值的和易于理解的。目的是帮助决策者寻找数据间潜在的关联,发现经营者被忽略的要素,而这些要素对预测趋势、决策行为也许是十分有用的信息。

此外,数据挖掘的对象除传统数据库和数据仓库外,现在扩展到Internet环境下的Web 数据挖掘等许多方面。

DM的技术基础是人工智能,其常用的技术方法有:人工神经网络、遗传算法、决策树方法、粗集方法等。其它还有邻近搜索方法、规则推理、模糊逻辑和公式发现等。

数据库系统概论期末试题及答案(重点知识)

试题十 一、单项选择题 (本大题共15小题,每小题2分,共30分) 在每小题列出的四个备选项中只有一个是符合题目要 求的,错选、多选或未选均无分。 1. 数据库系统的特点是( )、数据独立、减少数据冗余、避免数据不一致和加强了数据保护。 A .数据共享 B .数据存储 C .数据应用 D .数据保密 2. 数据库系统中,物理数据独立性是指( )。 A .数据库与数据库管理系统的相互独立 B .应用程序与DBMS 的相互独立 C .应用程序与存储在磁盘上数据库的物理模式是相互独立的 D .应用程序与数据库中数据的逻辑结构相互独立 3. 在数据库的三级模式结构中,描述数据库中全体数据的全局逻辑结构和特征的是( )。 A .外模式 B .内模式 C .存储模式 D .模式 4. E-R 模型用于数据库设计的哪个阶段( )? A .需求分析 B .概念结构设计 C .逻辑结构设计 D .物理结构设计 5. 现有关系表:学生(宿舍编号,宿舍地址,学号,姓名,性别,专业,出生日期)的主码是( )。 A .宿舍编号 B .学号 C .宿舍地址,姓名 D .宿舍编号,学号 6. 自然连接是构成新关系的有效方法。一般情况下,当对关系R 和S 使用自然连接时,要求R 和S 含有一个或多个共有的( )。 A .元组 B .行 C .记录 D .属性 7. 下列关系运算中,( )运算不属于专门的关系运算。 A .选择 B .连接 C .广义笛卡尔积 D .投影 8. SQL 语言具有( )的功能。 ( 考 生 答 题 不 得 超 过 此 线 )

A.关系规范化、数据操纵、数据控制 B.数据定义、数据操纵、数据控制 C.数据定义、关系规范化、数据控制 D.数据定义、关系规范化、数据操纵 9.如果在一个关系中,存在某个属性(或属性组),虽然不是该关系的主码或只是主码的一部分,但却是另一个关系的主码时,称该属性(或属性组)为这个关系的() A.候选码 B.主码 C. 外码 D. 连接码 10.下列关于关系数据模型的术语中,()术语所表达的概念与二维表中的 “行”的概念最接近? A.属性 B.关系 C. 域 D. 元组 11.假定学生关系是S(S#,SNAME,SEX,AGE),课程关系是C(C#,CNAME, TEACHER),学生选课关系是SC(S#,C#,GRADE)。 要查找某个学生的基本信息及其选课的平均成绩,将使用关系()A.S和SC B.SC和C C.S和C D.S、SC和C 12.在SQL语言的SELECT语句中,用于对结果元组进行排序的是()子句。 A. GROUP BY B.HAVING C.ORDER BY D.WHERE 13.设有关系SC(SNO,CNO,GRADE),主码是(SNO,CNO)。遵照实体完整性规则,下面()选项是正确的。 A.只有SNO不能取空值B.只有CNO不能取空值 C.只有GRADE不能取空值D.SNO与CNO都不能取空值 14.下面关于函数依赖的叙述中,()是不正确的。 A.若X→Y,WY→Z,则XW→Z B.若Y X,则X→Y C.若XY→Z,则X→Z,Y→Z D.若X→YZ,则X→Y,X→Z 15.设有关系R(A,B,C)和S(C,D)。与SQL语句select A,B,D from R,S where R.C=S.C等价的关系代数表达式是() A.σR.C=S.C(πA,B,D(R×S)) B.πA,B,D(σR,C= S.C(R×S)) C.σR.C=S.C((πA,B(R))×(πD(S))) D.σR,C=S.C(πD((πA,B(R))×S))

校园基础地理空间数据库建设设计方案

校园基础地理空间数据库建设设计方案 遥感1503班第10组 (杨森泉张晨欣杨剑钢熊倩倩) 测绘地理信息技术专业 昆明冶金高等专科学校测绘学院 2017年5月

一.数据来源 二. 目的 三 .任务 四. 任务范围 五 .任务分配与计划六.小组任务分配七. E-R模型设计八.关系模式九.属性结构表十.编码方案

一.数据来源 原始数据为大二上学期期末实训数字测图成果(即DWG格式的校园地形图) 导入GIS 软件数据则为修改过的校园地形图 二.目的 把现实世界中有一定范围内存在着的应用数据抽象成一个数据库的具体结构的过程。空间数据库设计要满足用户需求,具有良好的数据库性能,准确模拟现实世界,能够被某个数据库管理系统接受。

三.任务 任务包括三个方面:数据结构、数据操作、完整性约束 具体为: ①静态特征设计——结构特性,包括概念结构设计和逻辑结构设计; ②动态特性设计——数据库的行为特性,设计查询、静态事务处理等应用程序; ③物理设计,设计数据库的存储模式和存储方式。 主要步骤:需求分析→概念设计→逻辑设计→物理设计 原则:①尽量减少空间数据存储冗余;②提供稳定的空间数据结构,在用户的需要改变时,数据结构能够做出相应的变化;③满足用户对空间数据及时访问的需求,高校提供用户所需的空间数据查询结果;④在空间元素间为耻复杂的联系,反应空间数据的复杂性;⑤支持多种决策需要,具有较强的应用适应性。 四、任务范围 空间数据库实现的步骤、建库的前期准备工作内容、建库流程 步骤:①建立实际的空间数据库结构;②装入试验性数据测试应用程序;③装入实际空间数据,建立实际运行的空间数据库。 前期准备工作内容:①数据源的选择;②数据采集存储原则;③建库的数据准备;④数据库入库的组织管理。 建库流程:①首先必须确定数字化的方法及工具;②准备数字化原图,并掌握该图的投影、比例尺、网格等空间信息;③按照分层要求进行

数据库复习题答案

(说明:仅仅代表个人观点,答案正确率为98%,可能会有错的地方,有问题请问度娘) 复习参考资料 选择题 :30分(15题) 名词解释:20分(4题) 综合题:50分 一、选择题: 1. 数据库系统是采用了数据库技术的计算机系统,数据库系统由数据库、数据库管理系统、应用系统和( C)。 A. 系统分析员 B. 程序员 C. 数据库管理员 D. 操作员 2. 数据库(DB),数据库系统(DBS)和数据库管理系统(DBMS)之间的关系是( A)。 A. DBS包括DB和DBMS B. DBMS包括DB和DBS C. DB包括DBS和DBMS D. DBS就是DB,也就是DBMS 3. 下面列出的数据库管理技术发展的三个阶段中,没有专门的软件对数据进行管理的是( D)。 I.人工管理阶段 II.文件系统阶段 III.数据库阶段 A. I 和 II B. 只有 II C. II 和 III D. 只有 I 4. 下列四项中,不属于数据库系统特点的是(C )。 A. 数据共享 B. 数据完整性 C. 数据冗余度高 D. 数据独立性高 5. 数据库系统的数据独立性体现在( B)。 A. 不会因为数据的变化而影响到应用程序 B. 不会因为数据存储结构与数据逻辑结构的变化而影响应用程序

C. 不会因为存储策略的变化而影响存储结构 D. 不会因为某些存储结构的变化而影响其他的存储结构 6. 描述数据库全体数据的全局逻辑结构和特性的是(A )。 A. 模式 B. 内模式 C. 外模式 D. 以上三种 7. 要保证数据库的数据独立性,需要修改的是( C)。 A. 模式与外模式 B. 模式与内模式 C. 三级模式之间的两层映射 D. 三层模式 8. 要保证数据库的逻辑数据独立性,需要修改的是( A)。 A. 模式与外模式之间的映射 B. 模式与内模式之间的映射 C. 模式 D. 三级模式 9. 用户或应用程序看到的那部分局部逻辑结构和特征的描述是( C)模式。 A. 模式 B. 物理模式 C. 子模式 D. 内模式 10. 下述( D)不是DBA数据库管理员的职责。 A. 完整性约束说明 B. 定义数据库模式 C. 数据库安全 D. 数据库管理系统设计 11. 概念模型是现实世界的第一层抽象,这一类模型中最著名的模型是(D )。 A. 层次模型 B. 关系模型 C. 网状模型 D. 实体-关系模型 12. 区分不同实体的依据是(B )。 A. 名称 B. 属性 C. 对象 D. 概念 13. 关系数据模型是目前最重要的一种数据模型,它的三个要素分别是(B )。 A. 实体完整性、参照完整性、用户自定义完整性 B. 数据结构、关系操作、完整性约束 C. 数据增加、数据修改、数据查询 D. 外模式、模式、内模式 14. 在(A )中一个结点可以有多个双亲,结点之间可以有多种联系。 A. 网状模型

(完整版)数据库系统概论期末试题及答案(重点知识)

试题十 1. 数据库系统的特点是( )、数据独立、减少数据冗余、避免数据不一致和加强了数据保护。 A .数据共享 B .数据存储 C .数据应用 D .数据保密 2. 数据库系统中,物理数据独立性是指( )。 A .数据库与数据库管理系统的相互独立 B .应用程序与DBMS 的相互独立 C .应用程序与存储在磁盘上数据库的物理模式是相互独立的 D .应用程序与数据库中数据的逻辑结构相互独立 3. 在数据库的三级模式结构中,描述数据库中全体数据的全局逻辑结构和特征的是( )。 A .外模式 B .内模式 C .存储模式 D .模式 4. E-R 模型用于数据库设计的哪个阶段( )? A .需求分析 B .概念结构设计 C .逻辑结构设计 D .物理结构设计 5. 现有关系表:学生(宿舍编号,宿舍地址,学号,姓名,性别,专业,出生日期)的主码是( )。 A .宿舍编号 B .学号 C .宿舍地址,姓名 D .宿舍编号,学号 6. 自然连接是构成新关系的有效方法。一般情况下,当对关系R 和S 使用自然连接时,要求R 和S 含有一个或多个共有的( )。 A .元组 B .行 C .记录 D .属性 7. 下列关系运算中,( )运算不属于专门的关系运算。 A .选择 B .连接 C .广义笛卡尔积 D .投影 8. SQL 语言具有( )的功能。 A .关系规范化、数据操纵、数据控制 B .数据定义、数据操纵、数据控制 C .数据定义、关系规范化、数据控制 D .数据定义、关系规范化、数据操纵 ( 考 生 答 题 不 得 超 过 此 线 )

中文三大全文数据库的比较

中文三大全文数据库的比较 摘要通过本课程的学习,结合本人的学习情况从三大数据库对论文的收录情况、检索功能、检索结果、检索界面等方面对中文三大全文数据库——《中文期刊网全文数据库》、《维普中文科技期刊数据库》和《万方数据资源系统数字化期刊》进行了比较,阐述了一些自己对这三大全文数据库的认识。最后并谈了谈本人的学习收获和对本课程的些许建议。 关键词中文期刊网全文数据库维普中文科技期刊数据库万方数据资源系统数字化期刊全文数据库 收录情况:这三个数据库基本覆盖了科学技术和社会科学的各个领域。其中“维普”期刊的收藏量占有绝对优势,几乎覆盖了中国出版的所有中文期刊,并且收录了大量内部发行期刊,收录的年限最长,其中收录自然科学和工程技术方面的期刊量比“CNKI”多出近50%,但在文史哲类方面则几乎是空白,因此,“维普”适合用户进行科技文献的回溯性检索。“CNKI”重点收录了国内公开出版的核心期刊与具有专业特色的中西文期刊,综合性上做得较好。而“万方”收录期刊数量为三者中最少,但核心期刊比率高,收录文献的质量最高。 检索功能:三个数据库都提供了关键词、篇名、刊名、作者、机构、文摘等6个检索入口。就其特殊检索功能而言,“CNKI”在每个检索入口提供了检索词字典,通过使用它可以规范所输入的检索词,有利于更全更准地检索文献信息。“维普”在主题标引用词的基础上,编制了同义词库,有助于相关文献的检索,提高文献的查全率。“万方”在检索时,可以对期刊所分布的地域进行限定。 检索结果:比如通过著者字段的检索,张安将教授是从事化学研究的,他所发表的论文是科技方面的,在上表中“CNKI”收录了16篇,“万方”收录了5篇,而“维普”收录了24篇(换成医学方面的);张靖龙教授是从事文学研究的,在上表中“CNKI”收录了9篇,“万方”收录了0篇,“维普”收录了1篇。从这个比较中可以看出,三个数据库中综合性最强的是“CNKI”。三个数据库中文摘做得最好的是“CNKI”,不仅可以从中获得文献的基本情况,而且能通过超级链接的方式,找到更多与查找主题相关的内容。 检索界面:“CNKI”配备了功能强大的网络数据库全文检索系统,从它的检索界面中可以看出,该数据库检索方法简单、灵活,即使不具有专业检索知识的用户也很容易掌握。“维普”通过分类和导航实现文献的浏览,还能通过初级和高级检索进行检索,页面之间衔接的比较清楚。“万方”通过多种途径检索文献,但是页面过于复杂、繁琐,很难让初次接触的读者顺利地检索到文献,同时在页面的组织、导航的实现上也有待改善。 过渡一下,下面结合自己这学期的学习情况写咱这学期学习本课程的收获和一些建议方面的内容等。(控制在150—300字)。 最后写参考文献。

数据库系统概论期末试题及答案整理版

《数据库原理及应用》试题1 一、选择题 1、数据库系统的基本特征是_________。 A 、数据的统一控制 B 、数据共享性和统一控制 C 、数据共享性、独立性和冗余度小 D 、数据共享性和数据独立性 (难度系数C )正确答案:C 2、DB 、DBMS 和DBS 三者之间的关系是_________。 A 、DBS 与D B 和DBMS 无关 B 、DBMS 包括DBS 和DB C 、DB 包括DBMS 和DBS D 、DBS 包括DB 和DBMS (难度系数B )正确答案:D 3、设有关系R 和S ,关系代数 S)(R R -- 表示的是_________。 A 、R ∩S B 、R ―S C 、R ÷S D 、R ∪S (难度系数B )正确答案:A 4、自然连接是构成新关系的有效方法。一般情况下,当对关系R 和S 使用 自然连接时,要求R 和S 含有一个或多个共有的__________。 A 、行 B 、属性 C 、记录 D 、元组 (难度系数C )正确答案:B 5、以下是信息世界的模型,且实际上是现实世界到机器世界的一个中间层 次的是_________。 A 、数据模型 B 、概念模型 C 、关系模型 D 、E-R 图 (难度系数C )正确答案:C 6、构成E —R 模型的三个基本要素是_________。 A 、实体、属性值、关系; B 、实体、属性、联系; C 、实体、实体集、联系; D 、实体、实体集、属性; (难度系数C )正确答案:B 7、在关系代数运算中,五种基本运算为_________。

A 、并、差、选择、投影、连接 B 、并、交、选择、投影、笛卡尔积 C 、并、差、选择、投影、笛卡尔 积 D 、并、除、投影、笛卡尔积、选择 (难度系数B )正确答案:C 8、在下列关于规范化理论的叙述中,不正确的是_________。 A 、任何一个关系模式一定有键。 B 、任何一个包含两个属性的关系模式一定满足3NF 。 C 、任何一个包含两个属性的关系模式一定满足BCNF 。 D 、任何一个包含三个属性的关系模式一定满足2NF 。 (难度系数B )正确答案:D 9、设有关系模式R(A,B,C)和S(C,D)。与SQL 语句“SELECT A,B,D FROM R,S WHERE R.C=S.C ”等价的关系代数表达式为_________。 A 、S))(R (σπS.C R.C D B,A,?= B 、S))(R (πσD B,A,S. C R.C ?= C 、(S))π(R)(πσ D B A,S.C R.C ?= D 、S)(R))(π(πσB A,D S.C R.C ?= (难度系数A )正确答案:A 10、SQL 的视图是从_________中导出的。 A 、基本表 B 、视图 C 、数据库 D 、基本表或视图 (难度系数C )正确答案:D 11、用如下的SQL 语句创建一个Teacher 表 CREATE TABLE Teacher ( TNO Char(6) NOT NULL, NAME Char(8) NOT NULL, SEX Char(2), SAL INT, SDETP char(12) check (SDEPT IN(‘IS ’,’MA ’,’CS ’))) 可以插入到Teacher 表中的元组是_________。 A 、(‘T0203’,‘刘刚’,NULL ,NULL ,‘IS ’) B 、( NULL , ‘王芳’,‘女’,‘1200’,‘CS ’) C 、(‘T0111’,NULL ,‘男’,23,‘MA ’) D 、(‘T0101’,‘李华’,男,2100,‘EN ’) (难度系数A )正确答案:A

无锡市基础空间数据库SHP格式方案(大比例尺)

无锡市基础空间数据SHP格式设计方案 (大比例尺) 1、综述 1.1目的 为无锡市规划局基础空间数据建库提供标准。 1.2适用范围 1:500、1:1000、1:2000基础地形图数据 1.3制定原则 ●保证按本方案生产的数据可以实现同SHP数据的高效互转; ●保证按本方案生产的数据在转入数据库后可以实现标准图的输出; ●操作方便。 1.4类型约定 ● ●

1.5引用标准 《GB/T 14804-93 1:500 1:1000 1:2000 地形图要素分类与代码》(1994-08-01)《GB/T 7929-1995 1:500 1:1000 1:2000 地形图图式》(1996-05-01) 《GB 1:500 1:1000 1:2000 地形图数字化规范》(1998-08-01) 《GB/T14804-93 1:500 1:1000 1:2000 地形图要素分类与代码》(1994-08-01)《GT地籍数据库标准》 《GB/T 13923-92 国土基础信息数据分类与代码》(1993-07-01) 2、实体的划分 数据在SDE的服务器里是按照点、线、面和注记划分的,每一个SDE图层(FEATURECLASS)只能存储上述的一种空间对象。由于这种存储模型的限制,势必造成很多国标中的复杂地物被拆分到不同的SDE图层。为了在编码中体现设计的合理性、对实体的物理存储进行统一的管理,特在数据库的设计中在对空间实体做逻辑的划分。 2.1简单点 ●简单点实体只记录插入点的位置和相关属性,所有的简单点实体都必须以插入符号 的形式采集。 ●简单点状实体对应ARCOBJECT体系的IPOINT对象。 ●采集单位在使用点符号的时候要保证简单点的符号要和本方案提供的符号描述一 致,符号的插入点一致。 2.2简单无向线 ●简单线需要作业单位针对每一种实体制作线符号,这里所指的线符号必须是采集系 统提供的线符号库,不能用程序绘制。

数据库原理复习资料整理

第一章 1.四大基本概念: 数据:数据库中存储的基本对象,它是描述事物的符号记录。种类有:文字、图形、图象、声音等。特点是:数据与其语义是不可分的。 数据库:(Database,简称DB)是长期储存在计算机内、有组织的、可共享的大量数据集合。其特点是:数据按一定的数据模型组织、描述和储存;可为各种用户共享;冗余度较小;数据独立性较高;易扩展。(特点:永久存储、有组织、可共享) 数据库管理系统:是位于用户与操作系统之间的一层数据管理软件。 数据库管理系统的主要功能:数据定义功能;数据组织、存储和管理;数据操纵功能;数据库的事物管理和运行管理;数据库的建立和维护功能;其他功能。 数据库系统:是指在计算机系统中引入数据库后的系统。一般由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员(和用户)构成。 在不引起混淆的情况下常常把数据库系统简称为数据库。 2.数据管理技术的三个阶段及其特点 人工管理阶段:特点:1、数据不保存。 2、没有软件系统对数据进行管理。 3、这一时期没有文件的概念,数据的组织方式必须由程序员自行设计。 4、一组数据对应一组程序,数据是不共享的。 5、数据不具有独立性,当数据结构发生变化时,应用程序要变化。 文件系统阶段:特点:1、数据可以长期保存。 2、由文件系统管理数据。 3、数据共享性差, 冗余度大—文件是面向应用的。 4、数据独立性差—是不具有弹性的无结构的数据集合,文件之间是孤立的,不能反映事物间联系。 数据库系统阶段:特点:数据的管理者:DBMS 数据面向的对象:现实世界 数据的共享程度:共享性高 数据的独立性:高度的物理独立性和一定的逻辑独立性 数据的结构化:整体结构化 数据控制能力:由DBMS统一管理和控制 3、数据库系统的特点:数据结构化;数据的共享性高,冗余度低,易扩充;数据独立性高;数据有DBMS统一管理和控制。 4、数据模型的组成要素:数据结构、数据操作和完整性约束。 数据结构是对系统静态特性的描述。 数据操作是对系统动态特性的描述。 5、概念模型: 基本概念:实体:客观存在并可相互区别的事物称为实体。 属性:实体所具有的某一特性称为属性。 码:唯一标识实体的属性集称为码。 域:属性的取值范围称为该属性的域。 实体型:具有相同属性的实体具有的共同的特征和性质,即: 用实体名及其属性名集合来抽象和刻画同类实体。

数据库系统概论各章复习试题及答案

数据库系统概论复习资料: 第一章: 一、选择题: 1.在数据管理技术的发展过程中,经历了人工管理阶段、文件系统阶段和数据库系统阶段。在这几个阶段中,数据独立性最高的是 A 阶段。 A.数据库系统 B.文件系统 C.人工管理 D.数据项管理 2.数据库的概念模型独立于 A 。 A.具体的机器和DBMS B.E-R图 C.信息世界 D.现实世界 3.数据库的基本特点是 B 。 A.(1)数据可以共享(或数据结构化) (2)数据独立性 (3)数据冗余大,易移植 (4)统一管理和控制 B.(1)数据可以共享(或数据结构化) (2)数据独立性 (3)数据冗余小,易扩充 (4)统一管理和控制 C.(1)数据可以共享(或数据结构化) (2)数据互换性 (3)数据冗余小,易扩充 (4)统一管理和控制 D.(1)数据非结构化 (2)数据独立性 (3)数据冗余小,易扩充 (4)统一管理和控制 4. B 是存储在计算机内有结构的数据的集合。 A.数据库系统B.数据库 C.数据库管理系统 D.数据结构 5.数据库中存储的是 C 。 A.数据 B.数据模型C.数据以及数据之间的联系 D.信息 6. 数据库中,数据的物理独立性是指 C 。 A.数据库与数据库管理系统的相互独立 B.用户程序与DBMS的相互独立 C.用户的应用程序与存储在磁盘上数据库中的数据是相互独立的 D.应用程序与数据库中数据的逻辑结构相互独立 7. 数据库的特点之一是数据的共享,严格地讲,这里的数据共享是指 D 。 A.同一个应用中的多个程序共享一个数据集合 B.多个用户、同一种语言共享数据 C.多个用户共享一个数据文件 D.多种应用、多种语言、多个用户相互覆盖地使用数据集合 8.数据库系统的核心是 B 。 A.数据库 B.数据库管理系统 C.数据模型 D.软件工具 9. 下述关于数据库系统的正确叙述是 A 。 A.数据库系统减少了数据冗余 B.数据库系统避免了一切冗余 C.数据库系统中数据的一致性是指数据类型一致 D.数据库系统比文件系统能管理更多的数据 10. 数将数据库的结构划分成多个层次,是为了提高数据库的①和②。 ①A.数据独立性 B.逻辑独立性 C.管理规范性 D.数据的共享 ②A.数据独立性 B.物理独立性 C.逻辑独立性 D.管理规范性 【答案:】①B ②B 11. 数据库(DB)、数据库系统(DBS)和数据库管理系统(DBMS)三者之间的关系是 A 。 A.DBS包括DB和DBMS B.DDMS包括DB和DBS C.DB包括DBS和DBMS D.DBS就是DB,也就是DBMS

数据库复习材料教案资料

数据库复习材料

Oracle数据库体系结构 一、填空题 1.Oracle数据库系统的物理存储结构主要由3类文件组成,分别为数据文件、日志文件、控制文件。 2.用户对数据库的操作如果产生日志信息,则该日志信息首先被存储在日志缓冲区中,随后由 LGWR 进程保存到日志文件中。 3.一个表空间物理上对应一个或多个数据文件。 4.在Oracle的逻辑存储结构中,根据存储数据类型,可以将段分为数据段、索引段、回退段、LOB段或临时段。 5.在Oracle的逻辑存储结构中,数据块是最小的I/O单元。 6. 表空间的管理类型可以分为本地管理和字典管理. 7.在ORACLE系统中,为了实现对表,视图和索引等数据库对象进行了管理,ORACLE采用模式实现。 8.一个模式只能够被一个数据库用户所拥有,其创建的所有模式对象都保存在自己的模式中。 9如果定义了CHAR数据类型的字段,并且向其赋值时,字符串的长度小于定义的长度,则使用空格填充;而VARCHAR2类型的字段用于存储变长的字符串,即如果向该列赋的字符长度小于定义时的长度,该列的字符长度只会是实际字符数据的长度,系统不会使用空格填充。 10.ROWID实际上保存的是记录的物理地址,因此通过ROWID来访问记录可以获得最快的访问速度。

11.在创建表空间命令的STORAGE子句中可以设置6个存储参数。其中,INITIAL指定为表中的数据分配的第一个盘区大小;NEXT指定为存储表中的数据分配的第二个盘区大小;PCTINCREASE指定从第二个盘区之后,每个盘区相对于上一个盘区的增长百分比;MINEXTENTS指定允许为表中的数据所分配的最小盘区数目;MAXEXTENTS指定允许为表中的数据所分配的最大盘区数目。 12.通过数据块空间管理参数可以控制数据块中空闲空间的使用方法,其中PCTFREE用于控制数据块的更新预留的空间,而PCTUSED用于控制数据块在删除时释放空间的门槛。 13、如果出现了失败故障,用户修改的数据没有永久地写到数据文件里,那么就可以利用(控制文件)找到数据的更改,这样做过的工作就不会丢失了. 14、(控制文件)是一个小的二进制文件,它维护着数据库的全局物理结构,用以支持数据库成功地启动和运行. 15、表空间是Oracle数据库中数据的逻辑组织,每个数据库至少有一个(SYSTEM系统)表空间. 16、(DBWR)进程把修改过的数据块从内存写回到数据库的数据文件中. 17、当用户进程出错,PMON后台进程负责清理它 18、创建数据库时自动建立的tablespace名称SYSTEM tablespace 19、数据库表空间一般分为永久性表空间、还原表空间、临时表空间 二、选择题 1.下列选项中,哪一部分不是Oracle实例的组成部分? C A.系统全局区SGA

国内三大中文期刊全文数据库的比较

国内三大中文期刊全文数据库的比较研究(建议新手查阅) 中国期刊网全文数据库》、《维普中文科技期刊数据库》和《万方数据库资源系统数字化期刊》是国内影响力和利用率很高的综合性中文电子期刊全文数据库,这三个数据库已经成为大多数高等院校、公共图书馆和科研机构文献信息保障系统的重要组成部分。在互联网中,这三大数据库也成为中文学术信息的重要代表,体现了我国现有的中文电子文献数据库的建设水平。 笔者结合工作和学习中的实践,就上述三大数据库的收录情况、检索功能、检索结果、检索界面、用户服务等方面进行全面的比较,并通过检索实践举例进行比较分析,以供参考。 1 收录情况(数据较早,甚至不是2004年的数据,感觉更像2002年左右的数据,后面将尽可能给出最新的数据值。) 收录范围与数量 《中国期刊网全文数据库》(本文中简称“清华”)是由清华同方光盘股份有限公司、光盘国家工程研究中心和中国学术期刊(光盘版)电子杂志社共同研制出版的综合性全文数据库。该数据库收录自从1994年来公开出版发行的6600余种国内核心期刊和一些具有专业特色的中英文期刊全文,累积全文文献618万多篇,题录1500万余条,按学科分为理工A(数理科学)、理工B(化学化工能源与材料)、理工C(工业技术)、农业、医药卫生、文史哲、经济政治与法律、教育与社会科学、电子技术与信息科学九大类,126个专题文献数据库。 《中文科技期刊数据库》(本文中简称“维普”)由科技部西南信息中心主办,重庆维普资讯有限公司制作。其前身为《中文科技期刊篇名数据库》。该数据库收录了自1989年以来国内出版发行的12000种期刊,其中全文收录8000余种,按学科分为经济管理、教育科学、图书情报、自然科学、农业科学、医药卫生、工程技术等7大类,27个专辑,200个专题,按《中图法》编制了树型分类导航和刊名导航系统,基本覆盖了国内公开出版的具有学术价值的期刊,同时还收录了中国港台地区出版的108种学术期刊,积累700余万篇全文文献,数据量以每年100万篇的速度递增。 《万方数据资源系统数字化期刊》(本文中简称“万方”)是万方数据库资源系统三大组成部分之一,由中国科技信息研究所属下的北京万方数据股份有限公司创办。万方期刊收录了我国自然科学的大量期刊以及社会科学的部分期刊,范围包括基础科学、医药卫生、农业科学、工业技术、人文科学等5大类,以及英文版期刊、中国科学系列杂志,共2500多

数据库系统概论期末考试复习资料

数据库系统概论复习资料: 第一章: 一选择题: 1. 在数据管理技术的发展过程中,经历了人工管理阶段、文件系统阶段和数据库系统阶段。在这几个阶段中, 阶段(A )。A .数据库系统 2. 3. 数据独立性最高的是 数据库的概念模型独立于 F A o A.具体的机器和 DBMS B .E-R 图 C .信息世界 D .现实世界 数据库的基本特点是 B o A .(1)数据可以共享 (或数据结构化) (2) 数据独立性 数据冗余大, 易移植 (4) 统一管理和控制 B .(1)数据可以共享 (或数据结构化) (2) 数据独立性 数据冗余小, 易扩充 (4) 统一管理和控制 C .(1)数据可以共享 (或数据结构化) (2) 数据互换性 数据冗余小, 易扩充 (4) 统一管理和控制 D .(1)数据非结构化 (2) 数据独立性 数据冗余小, 易扩充 (4) 统一管理和控制 B 答案:B B .文件系统 C .人工管理 D .数据项管理 是存储在计算机内有结构的数据的集合。 A .数据库系统 B.数据库C .数据库管理系统 D.数据结构 5. 数据库中存储的是 _C 。 A .数据 B .数据模 间的联系 D . 6. 数据库中,数据的物理独立性是指 C ________________ 。 A .数据库与数据库管理系统的相互》 B — 与 C .用户的应用程序与存储在磁盘上数据库中的数据是相互独立的 C 7..数据库的特点之一是数据的共享,严格地讲,这里的数据共享是指 4. 信息 DBMS 的相互独立 ..D .应用程序与数据库中数据的逻辑结构相互独立 A .同一个应用中的多个程序共享一个数据集合 B .多个用户、同一种语言共享数据 C .多个用户共享一个数据文件 D .多种应用、多种语言、多个用户相互覆盖地使用数据集合 8. 据库系统的核心是 B __________ 。A .数据库B .数据库管理系统 C .数据模型 D .软件工具 答案:B 9. 下述关于数据库系 ― A __________________ 。 A .数据库系统减少了数据冗余 B .数据库系统避免了一切冗余 D .数据库系统比文件系统能管理更多的数据 数将数据库的结构划分成多个层次,是为了提高数据库的 ① A .数据独立性 B . ② A .数据独立性 B . 数据库(DB)、数据库系统 .DBS 包括 DB 和 DBMS 10. 逻辑独立性 C .管理规范性 物理独立性 C .逻辑独立性 答案: C .数据库系统中数据的一致性是指数据类型一致 答案:A ①B 和 ②B 。 11. A 12. A 13. 14. 15. A 16 A 17. A 18. A D .数据的共享 D .管理规范性 (DBS)和数据库管理系统(DBMS 三者之间的关系是答案:A B . DDMS 包括 DB 和 DBS C . DB 包括 DBS 和 DBMS D . DBS 就是 DB,也就是 DBMS D 。 答案:①B 在数据库中,产生数据不一致的根本原因是 .数据存储量太大 B .没有严格保护数据 C .未对数据进行完整性控制 D .数据冗余 答案:D 数据库管理系统(DBMS 是 D A .数学软件B .应用软件 C .计算机辅助设计 D .系统软件 答案:D 数据库管理系统(DBMS 的主要功能是 B ________ 。A.修改数据库 B .定义数据库 C .应用数据库D.保护数据库 数据库系统的特点是 _A _______ 、数据独立、减少数据冗余、避免数据不一致和加强了数据保护。 .数据共享 B .数据存储 C .数据应用 D .数据保密 答案:A 数据库系统的最大特点是 A 。 ?数据的三级抽象和二级独立性 B ?数据共享性 C ?数据的结构化 数据库管理系统能实现对数据库中数据的查询、插入、修改和删除等操作,这种功能称为 .数据定义功能 B .数据管理功能 C .数据操纵功能 D .数据控制功能 数据库管理系统是 B __________ 。 ?操作系统的一部分 B .在操作系统支持下的系统软件 C ?一种编译程序 描述数据库中全体数据的全局逻辑结构和特征的是 () 答案: D C 答案:C ?数据独立性 答案: D ?一种操作系统 答案: 19.据库的三级模式结构中, A .外模式 B .内模式 C .存储模式 20据库系统的数据独立性是指 B A .不会因为数据的变化而影响应用程序 C .不会因为存储策略的变化而影响存储结构 21.信息世界中的术语,与之对应的数据库术语为 22次型、网状型和关系型数据库划分原则是 _ D .模式 B.不会因为系统数据存储结构与数据逻辑结构的变化而影响应用程序 D ?不会因为某些存储结构的变化而影响其他的存储结构 D A .文件 B .数据库 C .字段 D .记录 答案: 答案: D A .记录长度 B .文件的大小 C .联系的复杂程度 D .数据之间的联系 23. 传统的数据模型分类,数据库系统可以分为三种类型 __C _____________ 。 A 24. 25. A 答案:D .大型、中型和小型 B .西文、中文和兼容 C .层次、网状和关系 D 层次模型不能直接表示 C A . 1 : 1关系 B . 1 : m 关系 C 数据库技术的奠基人之一 E.F . Codd 从1970年起发表过多篇论文,主要论述的是 .层次数据模型 B .网状数据模型 C .关系数据模型 D .面向对象数据模型 ?数据、图形和多媒体 .m : n 关系 D . C 。 答案:C :1和1 : m 关系 答案:C 二、填空题 数据管理技术经历了 人工管理、文件系统 数据库是长期存储在计算机内、有 DBMS 是指 它是位于用户 1. 2. 3. 4. 和数据库系统三个阶段。 答案:①人工管理 答案:①组织 ②共享 答案:①数据库管理系统 ②用户 ③操作系统 数据库的运行管理 和数据库的建立以及维护 等4个方面。 ②文件系统 ②数据库系统 5. 6. 组织的、可共享的数据集合。 和 ③ 之间的一层管理软件。 、数据操纵功能 数据库管理系统的主要功能有数据定义功能 答案:①数据定义功能 ②数据操纵功能 数据独立性又可分为逻辑数据独立性 _和物理数据独立性。 答案:①逻辑数据独立性 ②物理数据独立性 当数据的物理存储改变了,应用程序不变,而由DBMS 处理这种改变,这是指数据的—物理独立性 _。 答案:物理独立性

数据库复习资料全

数据库原理 1.1试述数据、数据管理、数据库管理系统、数据库的概念。 数据:描述事物的符号记录成为数据,如数值数据、文本数据和多媒体数据(如图形、图像、音频和视频)等。 数据管理:是对数据进行有效的分类、组织、编码、存储、检索、维护和应用,它是数据处理的中心问题。 数据库管理系统:是由一个相互关联的数据的集合和一组用以访问、管理和控制这些数据的程序组成。 数据库是长期储存在计算机内、有组织的、可共享的数据集合。 1.4什么是数据独立性?数据独立性又分为哪两个层次?为什么需要数据独立性? 数据独立性是用来描述数据与应用程序之间的依赖程度,包括数据的物理独立性和数据的逻辑独立性,依赖程度越低则独立性越高。 数据独立性又分为外模式/模式映像、模式/内模式映像两个层次。 数据的独立性把数据的定义从应用程序中分离出来,加上存取数据的方法又由数据库管理系统负责提供,从而大大简化了应用程序的编写,并减少了应用程序的维护代价。 1.6什么是数据模型?数据模型的基本要素有哪些?为什么需要数据模型? 数据模型是一个描述数据语义、数据与数据之间联系(数据结构)、数据操作,以及一致性(完整性)约束的概念工具的集合。 数据模型的基本要素:1、数据结构;2、数据操作;3、数据的完整性约束条件。 由于计算机不可能直接处理现实世界中的具体事物,所以人们必须事先把具体事物转换成计算机能够处理的数据。也就是把现实世界中具体的人、物、活动、概念等用数据模型这个工具来进行抽象、表示和处理。 1.7为什么数据模型要分为概念模型、逻辑模型和物理模型3类?试分别解释概念模型、逻辑模型和物理模型。 数据模型应满足3方面的要求:一是能比较真实地模拟现实世界;二是容易被人所理解;三是便于在计算机上实现。一种数据模型要很好地同时满足这3方面的要求是很困难的,因此数据库管理系统针对不同的使用对象和应用目的,分别采用概念模型、逻辑模型和物理模型。 概念模型:概念层次的数据模型称为概念数据模型,它按用户的观点或认识对现实世界的数据和信息进行建模,主要用于数据库设计。 逻辑模型:逻辑层是数据抽象的中间层,用于描述数据库数据的整体逻辑结构。 物理模型:物理层是数据抽象的最底层,用来描述数据的物理存储结构和存取方法。 1.9关系模型的主要优点有哪些? 关系数据模型具有以下优点: (1)关系模型建立在严格的数学概念的基础之上,有关系代数作为语言模型,有关系数据理论作为理论基础。 (2)关系模型的概念单一。无论实体还是实体之间的联系都是用关系来表示,对数据的操作结果还是关系。所以其数据结构简单、清晰,用户易懂易用。 (3)关系模型的存取路径对用户透明,从而具有更高的数据独立性、更好的安全保密性,也简化了程序员的工作,提高了软件的开发和维护效率。 1.10为什么数据库管理系统要对数据进行抽象?分为哪几级抽象? 一个商用的数据库管理系统必须支持高效的数据检索。这种高效性的需求促使设计者在数据库管理系统中使用复杂的数据结构来表示和存储数据。由于许多数据库管理系统的用户并未受过计算机专业训练,系统开发人员就通过多个层次上的抽象来实现对用户屏蔽复杂性,以简化用户与系统的交互。分为物理层

数据库基础知识试题(含答案)

数据库基础知识试题 部门____________ __________ 日期_________ 得分__________ 一、不定项选择题(每题1.5分,共30分) 1.DELETE语句用来删除表中的数据,一次可以删除( )。D A .一行 B.多行 C.一行和多行 D.多行 2.数据库文件中主数据文件扩展名和次数据库文件扩展名分别为( )。C A. .mdf .ldf B. .ldf .mdf C. .mdf .ndf D. .ndf .mdf 3.视图是从一个或多个表中或视图中导出的()。A A 表 B 查询 C 报表 D 数据 4.下列运算符中表示任意字符的是( )。B A. * B. % C. LIKE D._ 5.()是SQL Server中最重要的管理工具。A A.企业管理器 B.查询分析器 C.服务管理器 D.事件探察器 6.()不是用来查询、添加、修改和删除数据库中数据的语句。D A、SELECT B、INSERT C、UPDATE D、DROP 7.在oracle中下列哪个表名是不允许的()。D A、abc$ B、abc C、abc_ D、_abc 8.使用SQL命令将教师表teacher中工资salary字段的值增加500,应该使用的命令 是()。D A、Replace salary with salary+500 B、Update teacher salary with salary+500 C、Update set salary with salary+500 D、Update teacher set salary=salary+500 9.表的两种相关约束是()。C

数据库复习题全

数据库与管理信息系统复习题 一、简答题 1. 试述数据库二级映像和数据独立性之间的关系 DBMS在三级模式之间提供二级映像——“外模式|模式映像”和“模式|内模式映像”,保证了数据库的数据具有较高的逻辑独立性和物理独立性。 数据库的二级映像保证了数据库外模式的稳定性,从底层保证了应用程序的稳定性,除非应用需求本身发生变化,否则应用程序一般不需要修改。 数据库的三级模式与二级映像实现了数据与程序之间的独立性,使数据的定义和描述可以从应用程序中分离出来。另外,由于数据的存取由DBMS管理,用户不必考虑存取路径等细节,从而简化了应用程序的编制,大大降低了应用程序的维护和修改成本。 2.请举例说明在同一个关系内部也可能存在参照的完整性约束。 参照完整性约束是不同关系之间或一个关系的不同元组之间的制约。不仅在关系间存在引用,同一关系内部属性也可能存在引用关系。也就是说,参照完整性规则中,参照关系和目标关系(被参照关系)可以是同一个关系。 比如对于关系“学生(学号,姓名,性别,专业号,年龄,班长)”,主键是学号,班长属性表示该学生所在班级的班长的学好呢,这班长的属性实际引用了学号属性,也就是是说,班长必须是实际存在的学生的学号。 3.简述事务的特性。(PPT上只给出了四个特性,我又在后面加了每个特性的意思,作为参考) 事务的:原子性、一致性、隔离性、持续性 (1)原子性 事务的原子性指的是,事务中包含的程序作为数据库的逻辑工作单位,它所做的对数据修改操作要么全部执行,要么完全不执行。这种特性称为原子性。 (事务的原子性要求,如果把一个事务可看作是一个程序,它要么完整的被执行,要么完全不执行。就是说事务的操纵序列或者完全应用到数据库或者完全不影响数据库。这种特性称为原子性。假如用户在一个事务内完成了对数据库的更新,这时所有的更新对外部世界必须是可见的,或者完全没有更新。前者称事务已提交,后者称事务撤消(或流产)。DBMS必须确保由成功提交的事务完成的所有操纵在数据库内有完全的反映,而失败的事务对数据库完全没有影响) (2) 一致性 事务的一致性指的是在一个事务执行之前和执行之后数据库都必须处于一致性状态。即事务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态。这种特性称为事务的一致性。 (假如数据库的状态满足所有的完整性约束,就说该数据库是一致的。一致性处理数据库中对所有语义约束的保护。假如数据库的状态满足所有的完整性约束,就说该数据库是一致的。例如,当数据库处于一致性状态S1时,对数据库执行一个事务,在事务执行期间假定数据库的状态是不一致的,当事务执行结束时,数据库处在一致性状态S2。) (3) 隔离性 隔离性指并发的事务是相互隔离的。一个事务的执行不能被其他事物干扰。即一个事务内部的操作及使用的数据对其他并发事务是隔离的,并发执行的各个事务之间不能相互干扰。 (隔离性是DBMS针对并发事务间的冲突提供的安全保证。DBMS可以通过加锁在并发执行的事务间提供不同级别的隔离。假如并发交叉执行的事务没有任何控制,操纵相同的共享对象的多个并发事务的执行可能引起异常情况。DBMS可以在并发执行的事务间提供不同级别的隔离。隔离的级别和并发事务的吞吐量之间存在反比关系。较多事务的可隔离性可能会带来较高的冲突和较多的事务流产。流产的事务要消耗

相关主题
文本预览
相关文档 最新文档