第三章(3)-范式及无损分解
- 格式:ppt
- 大小:203.00 KB
- 文档页数:20
有损分解和无损分解
有损分解和无损分解是关系数据库中模式分解的两种类型。
在关系模式分解时,如果原关系模型下任一合法的关系值在分解之后能通过自然联接运算恢复起来,那么这种分解被称为无损分解。
相反,如果分解后无法通过自然联接运算完全恢复原始关系模型的信息,那么这样的分解称为有损分解。
例如,设R是一个关系模式,F是R上的一个依赖集,R分解为关系模式的集合p= {R1 (U1),R2 (U2),....,Rn (Un)}。
对于R中满足F的每一个关系r,如果都有r= π R1 (r)⋈π R2 (r)⋈.. π Rn (r),则称分解相对于F是无损连接分解,否则是有损连接。
举例来说,考虑一个关系模式R(A,B,C,D,E),其函数依赖集F={A→C,B→C,C→D,DE→C,CE→A}。
如果我们将R分解为{R1 = (A,D),R2 = (A,B),R3= (B,E),R4= (C,D,E),R5=(A,E)},并且对于满足F的任何一个关系r,都能通过自然联接运算将其恢复到原始关系模式,那么这就是一个无损分解的例子。
总之,无损分解和有损分解的关键区别在于是否可以完全通过联接操作恢复原始关系模型的数据。
在进行关系数据库设计时,了解这两种分解方法有助于更好地优化数据库结构以提高查询和维护的效率。
资料范本本资料为word版本,可以直接编辑和打印,感谢您的下载关于表的规范化地点:__________________时间:__________________说明:本资料适用于约定双方经过谈判,协商而共同承认,共同遵守的责任与义务,仅供参考,文档可直接下载或修改,不需要的部分可直接删除,使用时请详细阅读内容规范化:满足第一范式是表的最低要求,不满足第一范式要求的数据库(表)就不能称之为关系数据库。
在此基础上满足更高要求的称为第二范式,简记为2NF,其余依此类推,还有第三范式(3NF)、BC范式(BCNF)、第四范式(4NF)、第五范式(5NF)。
BCNF可以看作是修正了的第三范式。
把表从低范式,通过投影运算转换成若干高一级范式的过程,叫做表的规范化。
一般地说,表满足的范式级别越高,设计的表越是规范,表的质量越高,数据的冗余度越小,共享性越高,所占的存储空间越少,并将数据的不一致性减少到最低程度,这也是对表进行规范化的目的。
但是,高范式的数据库查询起来比较复杂。
所以,不应一味追求高范式,一般满足第三范式或BC范式就可以了二、表的规范化1、第一范式(1NF)如前所述,第一范式要求表的每一个字段都是不可再分的最小单位。
例1:学生(学号,姓名,学院,地址,选修课程成绩(课程号,课程名,成绩))表数据如下:表一不满足第一范式的表显然,这样的表是不满足第一范式的。
因为[选修课程成绩]字段还可分为3个字段即(课程号,课程名,成绩)。
如果不把它进行规范化,即转换成满足第一范式的表,将会产生很多问题,如:删除异常,即本来只想删除成绩的,不得不把课程号和课程名也删除了!转换的方法就是把可以拆分的字段进行拆分,即把[选修课程成绩]分解成3个字段:[课程号],[课程名],[成绩]。
变成下面满足第一范式的表:表二满足第一范式的表2、第二范式(2NF)一个关系应满足1NF是最起码的条件。
但是,仅满足1NF的关系还可能存在一些问题。
一:大部分是对一个关系模式分解成两个模式的考察,分解为三个以上模式时无损分解和保持依赖的判断比较复杂,考的可能性不大,因此我们只对“一个关系模式分解成两个模式”这种类型的题的相关判断做一个总结。
以下的论述都基于这样一个前提:R是具有函数依赖集F的关系模式,(R1 ,R2)是R的一个分解。
首先我们给出一个看似无关却非常重要的概念:属性集的闭包。
令α为一属性集。
我们称在函数依赖集F下由α函数确定的所有属性的集合为F下α的闭包,记为α+ 。
下面给出一个计算α+的算法,该算法的输入是函数依赖集F和属性集α,输出存储在变量result中。
算法一:result:=α;while(result发生变化)dofor each 函数依赖β→γ in F dobeginif β∈result then result:=result∪γ;end属性集闭包的计算有以下两个常用用途:·判断α是否为超码,通过计算α+(α在F下的闭包),看α+ 是否包含了R中的所有属性。
若是,则α为R的超码。
·通过检验是否β∈α+,来验证函数依赖是否成立。
也就是说,用属性闭包计算α+,看它是否包含β。
(请原谅我用∈符号来表示两个集合之间的包含关系,那个表示包含的符号我找不到,大家知道是什么意思就行了。
)看一个例子吧,2005年11月系分上午37题:● 给定关系R(A1,A2,A3,A4)上的函数依赖集F={A1→A2,A3→A2,A2→A3,A2→A4},R的候选关键字为________。
(37)A. A1 B. A1A3 C. A1A3A4 D. A1A2A3首先我们按照上面的算法计算A1+ 。
result=A1,由于A1→A2,A1∈result,所以resul t=result∪A2=A1A2由于A2→A3,A2∈result,所以result=result∪A3=A1A2A3由于A2→A4,A2∈result,所以result=result∪A3=A1A2A3A4由于A3→A2,A3∈result,所以result=result∪A2=A1A2A3A4通过计算我们看到,A1+ =result={A1A2A3A4},所以A1是R的超码,理所当然是R的候选关键字。
名词解释1.数据独立性:是指应用程序和数据库的数据结构之间相互独立,不受影响。
2.物理数据独立性:就是对内模式的修改尽量不影响逻辑模式,当然对外模式和应用程序的影响更小。
3.逻辑数据独立性:4.DBMS;是指数据库系统中对数据进行管理的软件系统,它是数据库的核心组成部分。
5.关键码;能唯一标识实体的属性或属性集;能唯一标识文件中每个记录的字段或字段集。
6.概念模型:表达用户需求观点的数据全局逻辑结构的模式型7.逻辑模型:表达计算机实现观点的DB全局逻辑结构的模型。
8.外部模型:表达用户使用观点的DB局部逻辑结构的模型。
9.内部模型:表的DB物理结构的模型。
10.外模式:是用户与数据系统的接口,使用户用到的那部分数据的描述。
11.内模式:是数据库在物理方面的描述,定义所有内部记录类型,索引和文件的组织方式,以及数据控制方面的细节。
12.逻辑模式:是数据库中全部数据的整体逻辑结构的描述。
二.1数据库系统的生存期:数据库应用系统从开始规划,设计,实现,维护,到最后被新的系统取代而停止使用的整个时间。
2.DFD(数据流图):是从“数据”和“对数据的加工”两方面表达数据处理系统工作过程的一种图形表示法,具有直观,已于被用户和软件人员双方都能理解的一种表达系统功能的描述方式。
3.简单属性:是不可在分割的属性。
4.复合属性:是不可分解其他属性的属性。
三.1.数据冗余:是指同一数据在系统中多次重复出现。
2.数据依赖:对于当前关系r的任意两个元组,如果x值相同,则要求Y值也相同,即有一个X值就有一个Y值与之相对应,或者说Y 值由X值决定。
3.平凡函数依赖:4.候选键:X是R的一个超键,如果X→U在R上成立,但对于X的任意一个真子集X1,都有X1→U不成立,那么称X1是R上的一个候选键。
5,无损分解:6第一范式:如果关系模式R的每个关系r的属性值都是不可分的原子值,那么称R是第一范式。
7.第二范式:如果关系R是1NF,且每个非主属性完全函数依赖候选键。
单词汇总(数据库专业一点的词汇其实主要就是每章后面review items的内容,在这里简单列一下,如果你实在没时间看书,至少这些单词要认识。
):1.数据库系统:database system(DS),database management system(DBMS)2.数据库系统(DS),数据库管理系统(DBMS)3.关系和关系数据库table= relation,column = attribute属性,domain, atomic domain, row= tuple,relational database, relation schema, relation instance, database schema, database instance;4.表=关系,列=属性属性,域,原子域,排=元组,关系型数据库,关系模式,关系实例,数据库模式,数据库实例;1.key们: super key, candidate key, primary key, foreign key, referencing relation, referencedrelation;2.超码,候选码,主码,外码,参照关系,被参照关系5.关系代数(relational algebra):selection, project, natural join, Cartesian product, set operations,union, intersect, set difference ( except\minus), Rename, assignment, outer join, grouping, tuple relation calculus6.(关系代数):选择,项目,自然连接,笛卡尔积,集合运算,集,交集,集合差(除\负),重命名,分配,外连接,分组,元组关系演算7. sql组成:DDL:数据库模式定义语言,关键字:createDML:数据操纵语言,关键字:Insert、delete、updateDCL:数据库控制语言,关键字:grant、removeDQL:数据库查询语言,关键字:select8.3.SQL语言:DDL,DML,DCL,QL,sql query structure, aggregate functions, nested subqueries,exists(as an operator), unique(as an operator), scalar subquery, assertion, index(indices), catalogs, authorization, all privileges, granting, revoking, grant option, trigger, stored procedure, stored function4.SQL语言:DDL,DML,DCL,QL,SQL查询结构,聚合函数,嵌套子查询,存在(如运营商),独特的(如运营商),标量子查询,断言指数(指数),目录,授权,所有权限,授予,撤销,GRANT OPTION,触发器,存储过程,存储函数9.表结构相关:Integrity constraints, domain constraints, referential integrity constraints10.完整性约束,域名约束,参照完整性约束5.数据库设计(ER 模型):Entity-Relationship data model, ER diagram, composite attribute,single-valued and multivalued attribute, derived attribute,binary relationship set, degree of relationship set, mapping cardinality,1-1, 1-m, m-n relationship set (one to one, one to many, many to many), participation, partial or total participation, weak entity sets, discriminator attributes, specialization and generalization6.实体关系数据模型,ER图,复合属性,单值和多值属性,派生属性,二元关系集,关系集,映射基数的程度,1-1,1-米,MN关系集合(一对一,一对多,多对多),参与部分或全部参与,弱实体集,分辨符属性,特化和概化11.函数依赖理论:functional dependence, normalization, lossless join (or lossless) decomposition,First Normal Form (1NF), the third normal form (3NF), Boyce-codd normal form (BCNF), R satisfies F, F holds on R, Dependency preservation保持依赖, Trivial, closure of a set of functional dependencies函数依赖集的闭包, closure of a set of attributes属性集闭包,Armstrong’s axioms Armstrong公理, reflexivity rule自反律, augmentation rule,增广率, transitivity传递律, restriction of F to R i ,F在Ri上的限定,canonical cover正则覆盖,extraneous attributes无关属性, decomposition algorithm分解算法.7.函数依赖,规范化,无损连接(或无损)分解,第一范式(1NF),第三范式(3NF)BC范式(BCNF),R满足F,F持有R,依赖保存,平凡,一组函数依赖封闭,一组属性,8.事务:transition, ACID properties ACID特性,并发控制系统concurrency control system,故障恢复系统recovery system,事务状态transition state, 活动的active, 部分提交的partially committed, 失败的failed, 中止的aborted, 提交的committed,已结束的terminated, 调度schedule,操作冲突conflict of operations, 冲突等价conflict equivalence,冲突可串行化conflict serializablity,可串行化顺序serializablity order,联级回滚cascading rollback,封锁协议locking protocol,共享(S)锁shared-mode lock (S-lock),排他(X)锁exclusive-mode lock (X-lock), 相容性compatibility, 两阶段封锁协议2-phase locking protocol, 意向锁intention lock, 时间戳timestamp, 恢复机制recovery scheme,日志log, 基于日志的恢复log-based recovery, 延迟的修改deferred modification, 立即的修改immediate modification, 检查点checkpoint.数据库系统DBS Database System数据库系统应用Database –system applications文件处理系统file-processing system数据不一致性data inconsistency一致性约束consistency constraint数据抽象Data Abstraction实例instance模式schema物理模式physical schema逻辑模式logical schema物理数据独立性physical data independence数据模型data model实体-联系模型entity-relationship model(E-R)关系数据模型relational data model基于对象的数据模型object-based data model半结构化数据模型semistructured data model数据库语言database language数据定义语言data-definition language数据操纵语言data-manipulation language查询语言query language元数据metadata应用程序application program规范化normalization数据字典data dictionary存储管理器storage manager查询管理器query processor事务transaction原子性atomicity故障恢复failure recovery并发控制concurrency-control两层和三层数据库体系结构two-tier/three-tier 数据挖掘data mining数据库管理员DBA database administrator表table关系relation元组tuple空值null value数据库模式database schema数据库实例database instance关系模式relation schema关系实例relation instance码keys超码super key候选码candidate key主码primary key外码foreign key参照关系referencing relation被参照关系referenced relation属性attribute域domain原子域atomic domain参照完整性约束referential integrity constraint 模式图schema diagram查询语言query language过程化语言procedural language非过程化语言nonprocedural language关系运算operations on relations选择元组selection of tuples选择属性selection of attributes自然连接natural join笛卡尔积Cartesian product集合运算set operations关系代数relational algebraSQL查询语言SQL query structureSelect 字句select clauseFrom 字句from clauseWhere 字句where clause自然连接运算natural join operationAs字句as clauseOrder by 字句order by clause相关名称(相关变量,元组变量) correlation name (correlation variable,tuple variable)集合运算set operationsUnionInterestExcept空值null values真值“unknown”truth “unknown”聚集函数aggregate functionsavg,min,max,sum,countgroup byhaving嵌套子查询nested subqueries集合比较set comparisons{《,《=,》,》=}{some,all}existsuniquelateral字句lateral clausewith字句with clause标量子查询scalar subquery数据库修改database modification删除deletion插入insertion更新updating参照完整性referential integrity参照完整性约束referential –integrity constraint 或子集依赖subset dependency可延迟的deferrable断言assertion连接类型join types内连接和外连接inner and outer join左外连接、右外连接和全外连接left 、right and full outer joinNatural 连接条件、using连接条件和on连接条件natural using and so on视图定义view definition物化视图materialized views视图更新view update事务transactions提交commit work回滚roll back work原子事务atomic transaction完整性约束integrity constraints域约束domain constraints唯一性约束unique constraintCheck 字句check clause参照完整性referential integrity级联删除cascading delete级联更新cascading updates断言assertions日期和时间类型date and time types默认值default values索引index大对象large object用户定义类型user-defined types域domains目录catalogs模式schemas授权authorization权限privileges选择select插入insert更新update所有权限all privileges授予权限granting of privileges收回权限revoking of privileges授予权限的权限privileges to privileges Grant option角色roles视图授权authorization on views执行授权execute authorization调用者权限invoker privileges行级授权row-level authorizationJDBCODBC预备语句prepared statements访问元数据accessing metadataSQL注入SQL injection嵌入式SQL embedded SQL游标cursors可更新的游标updatable cursors动态SQL dynamic SQLSQL函数SQL functions存储过程stored procedures过程化结构procedural constructs外部语言例程external language routines触发器triggerBefore 和after 触发器before and after triggers过渡变量和过渡表transition variables and tables递归查询recursive queries单调查询monotonic queries排名函数ranking functionsRankDense rankPartition by分窗windowing联机分析处理(OLAP)online analytical processing多维数据multidimensional data度量属性measure attributes维属性dimension attributes转轴pivoting数据立方体data cube切片和切块slicing and dicing上卷和下钻rollup and drill down交叉表cross-tabulation第七章实体-联系数据模型Entity-relationship data model实体和实体集entity and entity set属性attribute域domain简单和复合属性simple and composite attributes单值和多值属性single-valued and multivalued attributes空值null value派生属性derived attribute超码、候选码以及主码super key ,candidate key, and primary key 联系和联系集relationship and relationship set二元联系集binary relationship set联系集的度degree of relationship set描述性属性descriptive attributes超码、候选码以及主码super key ,candidate key, and primary key 角色role自环联系集recursive relationship setE-R图E-R diagram映射基数mapping cardinality一对一联系one-to-one relationship一对多联系one-to-many relationship多对一联系many-to-one relationship多对多联系many-to-many relationship参与participation全部参与total participation部分参与partial participation弱实体集和强实体集weak entity sets and strong entity sets分辨符属性discriminator attributes标识联系identifying relationship特化和概化specialization and generalization超类和子类superclass and subclass属性继承a ttribute inheritance单和多继承single and multiple inheritance条件定义的和用户定义的成员资格condition-defined and userdefined membership 不相交概化和重叠概化disjoint and overlapping generalization全部概化和部分概化total and partial generalization聚集aggregationUMLUML类图UML class diagram第八章E-R模型和规范化E-R model and normalization分解decomposition函数依赖functional dependencies无损分解lossless decomposition原子域atomic domains第一范式(1NF)first normal form(1NF)合法关系legal relations超码super keyR满足F R satisfies FF在R上成立F holds on RBoyce-Codd范式BCNF Boyce-Codd normal form(BCNF)保持依赖dependency preservation第三范式(3NF)third normal form(3NF)平凡的函数依赖thivial functional dependencies函数依赖集的闭包closure of a set of functional dependenciesArmstrong公理Armstrong ‘s axioms属性集闭包closure of attribute setsF在Ri上的限定restriction of F to Ri正则覆盖canonical cover无关属性extraneous attributesBCNF分解算法BCNF decomposition algorithm3NF分解算法3NF decomposition algorithm多值依赖multivalued dependencies第四范式(4NF)fourth normal form(4NF)多值依赖的限定restriction of a multivalued independency投影-连接范式(PJNF)project-join normal form(PJNF)域-码范式(DKNF)domain-key normal form(DKNF)泛关系universal relation唯一角色假设unique-role assumption 去规范化denormalization。
1、已知关系模式R(ABC),F={A→C,B→C},求F+。
可以直接通过自反律、增广律、传递律加以推广:F+={φ→φ,A→φ,B→φ,C→φ,A→C,B→C,AB→φ,AB→A,AB→B,AB→C,AB→BC,AB→AB,AB→ABC,BC→φ,BC→C,BC→B,BC→BC,AC→φ,AC→C,AC→A,AC→AC,ABC→φ,ABC→A,ABC→B,ABC→C,ABC→BC,ABC→AB,ABC→ABC}4.6 试分析下列分解是否具有无损联接和保持函数依赖的特点:(1)设R(ABC),F1={A→B} 在R上成立,ρ1={AB,AC}。
首先,检查是否具有无损联接特点:第1种解法--算法4.2:(1) 构造表(2)根据A→B进行处理结果第二行全是a行,因此分解是无损联接分解。
第2种解法:(定理4.8)设 R1=AB,R2=ACR1∩R2=AR2- R1=B∵A→B,∴该分解是无损联接分解。
然后,检查分解是否保持函数依赖πR1(F1)={A→B,以及按自反率推出的一些函数依赖}πR2(F1)={按自反率推出的一些函数依赖}F1被πR1(F1)所蕴涵,∴所以该分解保持函数依赖。
2、设R(ABC),F2={A→C,B→C}在R上成立,ρ2={AB,AC}首先,检查是否具有无损联接特点:第1种解法(略)第2种解法:(定理4.8)设 R1=AB,R2=ACR1∩R2=AR2- R1=C∵A→C,∴该分解是无损联接分解。
然后,检查分解是否保持函数依赖πR1(F2)={按自反率推出的一些函数依赖}πR2(F2)={A→C,以及按自反率推出的一些函数依赖}∵F1中的B→C没有被蕴涵,所以该分解没有保持函数依赖。
3、设R(ABC),F3={A→B},在R上成立,ρ3={AB,BC}.首先,检查是否具有无损联接特点:第1种解法:(1) 构造表(2)根据A→B进行处理没有一行全是a行。
因此这个分解不具有无损联接特性。