第4章 关系数据库规范化理论
- 格式:pdf
- 大小:796.63 KB
- 文档页数:68
1、设计性能较优的关系模式称为规范化,规范化主要的理论依据是()。
A.关系规范化理论B.关系运算理论C.关系代数理论D.数理逻辑正确答案:A2、下列关于规范化理论各项中正确的是()。
A.对于一个关系模式来说,规范化越深越好B.满足第二范式的关系模式一定满足第一范式C.第一范式要求---非主码属性完全函数依赖关键字D.规范化一般是通过分解各个关系模式实现的,但有时也有合并正确答案:B3、X→Y能从推理规则导出的充分必要条件是()。
A.B.C.D.正确答案:D4、两个函数依赖集F和G等价的充分必要条件是()。
A.B.C.D.5、设有关系模式R(A,B,C,D,E),函数依赖集F={A→B,B→C,C→D,D→A},ρ={AB,BC,AD}是R上的一个分解,那么分解ρ相对于F()。
A.既是无损连接分解,又是保持函数依赖的分解B.是无损连接分解,但不是保持函数依赖的分解C.不是无损连接分解,但是保持函数依赖的分解D.既不是无损连接分解,也不是保持函数依赖的分解正确答案:D6、关系模式中,满足2NF的模式()。
A.可能是1NFB.必定是1NFC.必定是3NFD.必定是BCNF正确答案:B7、不能使一个关系从第一范式转化为第二范式的条件是()。
A.每一个非主属性都完全函数依赖于主码B.每一个非主属性都部分函数依赖于主码C.关系中没有非主属性D.主码由一个属性构成正确答案:B二、判断题1、关系模式的分解是唯一的。
(错)2、一个关系模式属于BC范式,它一定属于第三范式。
(对)3、在关系模式R(U,F)中,如果X→Y,且存在X的真子集X1,使X1→Y,称函数依赖X→Y为完全函数依赖。
(错)4、函数依赖集F={A→B,B→C,C→A,C→B,A→C,BC→A},它的最小函数依赖集Fmin={A→B,B→C,A→C}。
(错)三、填空题1、被函数依赖集F逻辑蕴涵的函数依赖的全体构成的集合,称为。
正确答案:函数依赖集F的闭包2、设有关系模式R(A,B,C,D,M,N),函数依赖集F={N→D,M→D,D→B,BC→D,DC→N},R的候选码为。
关系数据库规范化理论数据库设计的问题可以简单地描述为:如果要把一组数据存储到数据库中,如何为这些数据设计一个合适的逻辑结构呢?在关系数据库系统中,就是如何设计一些关系表以及这些关系表的属性。
这就是本章主要介绍的关系模式的规范化设计问题;问题的提出假设有如下关系sS(sno,name,sex,cno,cname,degr) 其中,s表示学生表,对应的各个属性依次为学号、姓名、性别、课程号、课程名和成绩。
主码为(sno,cno);这个关系模式存在如下问题:(1)数据冗余当一个学生选修多门课程就会出现数据冗余。
例如:可能存在这样的记录(s0102,’王华’,’男’,c108,’c语言’,84),(s0102,’王华’,’男’,c206,’数据库原理与应用’,92)和(s0108,’王丽’,’女’,c206,’数据库原理与应用’,96),这样导致name、sex和cname属性多次重复存储。
(2)不一致性由于数据存储冗余,当更新某些数据项时,就有可能一部分字段修改了,而另一部分字段未修改,造成存储数据的不一致性。
例如:可能存在这样记录:(s0102,’王华’,’男’,c108,’c语言’,84),(s0108,’王丽’,’女’,c206,’数据库原理与应用’,92),这就是数据不一致性;(3)插入异常如果某个学生未选修课程,则其no、name 和sex属性值无法插入,因为cno为空,关系数据模式规定主码不能为空或部分为空,这便是插入异常。
例如,有一个学号为s0110的新生“陈强”,由于尚未选课,不能插入到关系s中,无法存放该学生的基本信息。
(4)删除异常当要删除所有学生成绩时,所有no、name和sex属性也都删除了,这便是删除异常。
例如,关系s中只有一条学号为s0105的学生记录:(s0105,’王华’,’男’,c018,’c语言’,84),现在需要将其删除,在该记录删除后,学号为s0105的学生“王华”的基本信息也被删除了,而没有其他地方存放该学生的基本信息。
关系数据库的规范化理论与数据库设计在当今数字化的时代,数据成为了企业和组织的重要资产,而关系数据库作为存储和管理数据的重要手段,其设计的合理性直接影响着数据的质量、完整性和可用性。
关系数据库的规范化理论是指导数据库设计的重要原则,它能够帮助我们避免数据冗余、更新异常等问题,从而提高数据库的性能和可靠性。
首先,我们来了解一下关系数据库的基本概念。
关系数据库是由一组二维表组成的,每张表都有一个唯一的表名,表中的每一行称为一个元组,代表一个实体;每一列称为一个属性,代表实体的一个特征。
通过在不同的表之间建立关联,我们可以实现数据的查询和操作。
那么,什么是规范化理论呢?规范化理论是一种用于设计关系数据库的方法和原则,其目的是通过对关系模式进行分解和优化,消除数据冗余和更新异常,确保数据的一致性和完整性。
规范化理论主要包括第一范式(1NF)、第二范式(2NF)、第三范式(3NF)等。
第一范式要求表中的每个属性都是不可再分的原子值。
例如,如果有一个“联系人信息”表,其中包含“地址”这个属性,如果地址又分为“省”“市”“区”“详细地址”等子属性,那么就不满足第一范式,需要将其拆分成多个属性。
第二范式要求在满足第一范式的基础上,每个非主属性都完全依赖于主键。
举个例子,如果有一个“订单”表,主键是“订单号”,而“客户姓名”和“客户地址”等非主属性只依赖于“客户编号”,而不是“订单号”,那么就不满足第二范式,需要将其拆分成两个表,一个是“订单”表,一个是“客户”表。
第三范式要求在满足第二范式的基础上,每个非主属性都不传递依赖于主键。
比如说,有一个“员工”表,主键是“员工编号”,“部门名称”依赖于“部门编号”,而“部门编号”又依赖于“员工编号”,这就不满足第三范式,需要将“部门名称”这个属性移到“部门”表中。
规范化理论在数据库设计中具有重要的意义。
通过规范化设计,可以减少数据冗余,节省存储空间。
想象一下,如果一个客户的信息在多个表中重复存储,不仅浪费空间,而且当客户信息发生变化时,需要在多个地方进行更新,容易导致数据不一致。
第四章关系数据库规范化理论一个关系数据库模式由一组关系模式组成,一个关系模式由一组属性名组成。
关系数据库设计,就是如何把已给定的相互关联的一组属性名分组,并把每一组属性名组成关系的问题。
然而,属性的分组不是唯一的,不同的分组对应着不同的数据库应用系统,它们的效率往往相差很远。
为了使数据库设计合理可靠,简单实用,长期以来,形成了关系数据库设计的理论——规范化理论。
4.1 关系规范化的作用规范化,就是用形式更为简洁,结构更加规范的关系模式取代原有关系模式的过程。
如果将两个或两个以上实体的数据存放在一个表里,就会出现下列三个问题: 数据冗余度大插入异常删除异常所谓数据冗余,就是相同数据在数据库中多次重复存放的现象。
数据冗余不仅会浪费存储空间,而且可能造成数据的不一致性。
插入异常是指,当在不规范的数据表中插入数据时,由于实体完整性约束要求主码不能为空的限制,而使有用数据无法插入的情况。
删除异常是指,当不规范的数据表中某条需要删除的元组中包含有一部分有用数据时,就会出现删除困难。
(以P98工资表为例)解决上述三个问题的方法,就是将不规范的关系分解成为多个关系,使得每个关系中只包含一个实体的数据。
(讲例子解)当然,改进后的关系模式也存在另一问题,当查询职工工资时需要将两个关系连接后方能查询,而关系连接的代价也是很大的。
那么,什么样的关系需要分解?分解关系模式的理论依据又是什么?分解完后能否完全消除上述三个问题?回答这些问题需要理论指导。
下面,将加以讨论:4.2 函数依赖实体间的联系有两类:一类是实体与实体之间联系;另一类是实体内部各属性间的联系。
数据库建模一章中讨论的是前一类,在这里我们将学习第二类。
和第一类一样,实体内部各属性间的联系也分为1:1、1:n和m:n三类:例:职工(职工号,姓名,身份证号码,职称,部门)1、一对一关系(1:1)设X、Y是关系R的两个属性(集)。
如果对于X中的任一具体值,Y中至多有一个值与之对应,反之,对于Y中的任一具体值,X中也至多有一个值与之对应,则称X、Y两属性间是一对一关系。
关系数据库规范化理论在当今数字化的时代,数据的管理和处理变得至关重要。
关系数据库作为一种广泛应用的数据存储和管理方式,其规范化理论是确保数据库设计的合理性、有效性和可靠性的重要基石。
那么,什么是关系数据库规范化理论呢?简单来说,它是一套用于设计关系数据库的原则和方法,旨在减少数据冗余、避免数据不一致性,并提高数据的完整性和存储效率。
让我们先从数据冗余这个问题说起。
想象一下,如果在一个数据库中,相同的信息被多次重复存储,这不仅会浪费存储空间,还可能导致数据更新时出现不一致的情况。
比如说,在一个学生管理系统中,如果学生的基本信息(如姓名、性别、出生日期等)在多个表中都有重复记录,当需要修改某个学生的信息时,就很容易出现有的地方改了,有的地方没改的混乱局面。
为了解决这个问题,规范化理论提出了一系列的范式,从第一范式(1NF)到第五范式(5NF),逐步提高数据库设计的质量。
第一范式要求数据表中的每个字段都应该是不可再分的原子值。
举个例子,如果有一个“地址”字段,包含了“省份、城市、区县、街道”等信息,这就不符合 1NF,应该将其拆分成多个字段,分别存储每个具体的部分。
第二范式则是在满足 1NF 的基础上,要求非主属性完全依赖于主键。
比如说,在一个订单表中,如果“订单号”是主键,而“商品名称”和“商品价格”等信息不完全依赖于“订单号”,而是还依赖于“商品编号”,那么就不符合 2NF,可能会导致数据冗余和更新异常。
第三范式进一步要求非主属性之间不存在传递依赖于主键的关系。
比如,在一个员工表中,如果“员工编号”是主键,“部门编号”依赖于“员工编号”,而“部门地址”又依赖于“部门编号”,这就存在传递依赖,不符合 3NF。
随着数据库设计的复杂度增加,还有更高阶的范式,如巴斯范式(BCNF)、第四范式(4NF)和第五范式(5NF),但在实际应用中,通常达到第三范式就能够满足大多数的需求。
规范化理论的好处是显而易见的。