当前位置:文档之家› 四级数据库工程师知识点总结

四级数据库工程师知识点总结

四级数据库工程师知识点总结
四级数据库工程师知识点总结

第一章数据库原理概论

1.数据库,数据库管理系统

?数据库(DB)是按一定结构组织并可以长期存储在计算机内的、在逻辑上保持一致的、可共享的大量相关联数据的集合,是存放数据的仓库。

?数据库中的数据按一定的数据模型组织、描述和存储,具有较小的冗余度、较高的数据独立性和易扩展型,并可为在一定组织范围内的各种用户所共享。

?数据库管理系统(DBMS)是位于用户与操作系统之间的一个定义、操作、管理、构建和维护数据库的系统软件,是数据库和用户之间的一个接口,并为不同用户和应用程序之间共享数据库提供便利。

?文件系统与数据库系统的区别是:文件系统面向个某一应用程序,共享性差,冗余度大,数据独立性差,记录内有结构,整体无结构,由应用程序自己控制。数据库系统面向现实世界,共享性高,冗余度小,具有较高的物理独立性和一定的逻辑独立性,整体结构化,用数据模型描述,由数据库管理系统提供数据的安全性、完整性、并发控制和恢复能力。

2.数据库应用系统(DBAS)生命周期

1.项目规划阶段

①系统调查,对应用单位进行全面调查,发现其存在的主要问题,并画出层次图以了解企业的组织结构。

②可行性分析,从技术、经济、效益、法律等方面对建立数据库的可行性进行分析,然后写出可行性分析报告,组

织专家进行讨论。

③确定数据库系统的总目标,并对应用单位的工作流程进行优化和制定项目开发计划,在得到决策部门授权后,即

进入数据库系统的开发工作。

2.需求分析阶段

①数据需求分析

②功能需求分析(数据处理需求分析、业务规则需求分析)

③性能需求分析(数据操作响应时间或数据访问响应时间、系统吞吐量、允许并发访问的最大用户数、每秒TPS代

价值)

④其他需求分析(存储需求分析、安全性需求分析、备份和恢复需求分析)。

3.系统设计阶段

?概念设计阶段

①进行数据抽象,设计局部概念模型。常用的数据库抽象方法是“聚集”、“概括”。聚集:将若干个对象和它们之

间的联系组合成一个新的对象。概括:将一组具有某些共同特性的对象抽象成更高一层意义上的对象。

②将局部概念模型综合成全局概念模型。

③评审,评审分为用户评审和DBA及应用开发人员评审两部分。

?逻辑设计阶段

①数据库逻结构设计

将E—R图转换为初始关系模式,对初始关系模式进行优化,检查关系表对数据库事务的支持性,确定关系模式完整性约束,设计基于关系模式的用户视图。

②数据库事务概要设计

③应用程序概要设计

?物理设计阶段

数据库物理设计的目的是将数据的逻辑模式转换为实现技术规范,其目标是设计数据存储方案,以便提供足够好的性能并确保数据库数据的完整性、安全性和可恢复性。通常,数据库物理设计并不包括文件和数据库的具体实现细节(例如如何创建文件、建立数据库以及如何加载数据等)。

①确定存储结构

②存取路径的选择和调整

③确定数据存放位置

④确定存储分配

4.数据库的实现和部署阶段

①用DDL定义数据库结构。

②组织数据入库。

③编制与调试应用程序。

④数据库试运行,包括功能调试、性能测试。

5.数据库的运行与维护阶段

在数据库运行阶段,维护工作主要由DBA完成,主要包括

①数据库的转储和恢复

②数据库安全性、完整性控制

③数据库性能的监督、分析和改进

④数据库的重组和重构

3.数据库管理员 (DBA)

?数据库管理员(Database Administrator,DBA) 的职责

1.决定数据库中的信息内容和结构;

2.决定数据库的存储结构和存储策略;

3.定义数据的安全性要求和完整性约束;

4.监控数据库的使用和运行。

4.数据与信息

?信息(Information)是人们对客观事物状态和特征的反映。是对现实事物的状态和特征的描述,是进行决策的重要依据。信息的价值与它的准确性、及时性、完整性和可靠性有关。

?数据(Data)是信息的表达方式和载体。是人们描述客观事物及其活动的抽象表示,是描述事物的符号记录,是利用信息技术进行采集、处理、存储和传输的基本对象。

?两者的关联:数据是信息的符号表示或称载体,信息是数据的内涵,是数据的语义解释。

?描述信源的数据是信息和数据冗余之和,即:数据=信息+数据冗余。

5.数据依赖

?关系模式产生的问题以及解决这些问题的方法都与数据依赖的概念密切相关。

?数据依赖是可以作为关系模式的取值的任何一个关系所必须满足的一种约束条件,是通过一个关系中各个元组的某些属性值之间的相等与否体现出来的相互关系。

?这是实现世界属性间相互联系的抽象,是数据内在的性质,是语义的体现。

?数据依赖极为普遍地存在于现实世界中。现在人们已经提出了许多类型的数据依赖,其中最重要的函数依赖和多值依赖。

6.数据字典

?数据库统中,除了存储关系中的数据外,还需要维护关于数据库的描述信息,这列信息称为数据字典,或系统目录。

系统数据也称为数据字典或系统目录和元数据。

?数据库中的数据通常可分为用户数据和系统数据个两部分。用户数据是用户使用的数据;系统数据称为数据字典,包括对数据库的描述信息、数据库的存储管理信息、数据库的控制信息、用户管理信息和系统事务管理信息等。

7.视图(View)

?视图是基于SQL语句的结果集的可视化的表。

?视图是指计算机数据库中的视图,是一个虚拟表,其内容由查询定义。同真实的表一样,视图包含一系列带有名称的列和行数据。但是,视图并不在数据库中以存储的数据值集形式存在(物理上并不存在)。行和列数据来自由定

义视图的查询所引用的表,并且在引用视图时动态生成。

?视图包含行和列,就像一个真实的表。视图中的字段就是来自一个或多个数据库中的真实的表中的字段。我们可以向视图添加 SQL 函数、WHERE 以及 JOIN 语句,我们也可以提交数据,就像这些来自于某个单一的表。

?数据库的设计和结构不会受到视图中的函数、where 或 join 语句的影响。

?

8.索引

?SQL索引有两种,聚集索引和非聚集索引,索引主要目的是提高了SQL Server系统的性能,加快数据的查询速度与减少系统的响应时间。

?聚集索引存储记录是物理上连续存在,而非聚集索引是逻辑上的连续,物理存储并不连续。聚集索引一个表只能有一个,而非聚集索引一个表可以存在多个。

?聚集索引的键值可以重复,数据行以聚集索引的顺序进行存储

第二章数据模型和数据库系统的模式结构

1.数据模型

?数据模型是对现实世界进行抽象的工具,它按计算机系统的观点对数据建模,用于提供数据库系统中信息表示和操作手段的框架,主要用于DBMS的实现,是数据库系统的核心和基础。

?数据模型通常由数据结构、数据操作和完整性约束三要素组成。

?数据操作表示数据模型的动态行为。数据操作是指对数据库中各种对象(型)的实例(值)允许执行的操作的集合,包括操作及有关的操作规则。数据库主要有检索和修改(包括插入、删除、更新)两大类操作。数据模型必须定义这些操作的确切含义、操作符号、操作规则(如优先级)以及实现操作的语言。

?数据从现实生活进入到数据库实际经历了三个阶段:现实世界阶段、信息世界阶段和计算机世界(数据世界)阶段,

?数据模型定义了数据库中数据的组织、描述、储存和操作规范,可分为概念模型、数据结构模型、物理模型三大类。

1.概念数据模型(概念模型):概念模型也称信息模型,位于客观现实世界与机器世界之间,是现实世界到信息世界

的抽象。面向人,独立于具体的计算机。

?传统的概念数据模型有E-R模型、扩充的E-R模型、面向对象模型及谓词模型。典型代表是实体-联系模型。

?ER模型基础上增加概括,聚集等语义描述,形成扩充的实体-联系模型,即EER模型。ER模型与关系模型关联,EER 模型(扩充的E-R模型)与对象-关系模型关联。

?1976年Peter Chen首次提出了概念数据模型。

?概念模型应具备以下特点:有丰富的语义表个达能力;易于交流理解;易于变动;易于向各种数据模型转换。

2.逻辑数据模型(数据结构模型):是信息世界到数据世界的抽象,面向计算机。如关系模型。

?传统的逻辑数据类型有层次模型、网状模型、关系模型。此外还有面向对象模型和对象-关系模型。

?面向对象模型既是概念模型又是逻辑模型。

?1968年美国的IBM公司推出了第一个数据库管理系统IMS,它是基于层次模型的数据库管理系统,是首例成功的数据库管理系统的商品软件。

?1970年IBM公司的高级研究员E.F.Codd提出了关系数据模型。

3.物理模型(物理层模型):描述逻辑模型的物理实现,是数据库最底层的抽象,它确定数据的物理存储结构、数据

存取路径以及调整、优化数据库的性能。其设计目标是提高数据库性能和有效利用存储空间。

?数据模型需满足的三点要求

①能比较真实地模拟现实世界;

②容易为人们所理解;

③便于在计算机上实现。

2.数据约束

数据约束包括数据完整性约束、数据安全性约束以及并发控制约束等。数据约束既刻画了数据静态特征,也表示了数据动态行为规则。

3.数据库的三级模式结构

?

?数据库的二级映像和数据的独立性

?外模式/模式映象:保证数据库的逻辑独立性;

?模式/内模式映象:保证数据库的物理独立性。

4.关系数据模型

?关系数据模型数据结构用单一的二维表结构来表示实体及实体间的联系。二维表中的列(字段)称为属性,属性的个数称为关系的元或度。二维表中的行(记录的型),即对关系的描述称为关系模式。在一个关系的若干个候选码或侯选键中指定一个用来唯一标识该关系的元组,则称这个被指定的候选码或侯选键为该关系的主码或主键。关系中包含在任何一个候选码中的属性称为主属性。

5.E-R模型

E-R图也称实体-联系图(Entity-Relationship Diagram),提供了表示实体类型、属性和联系的方法,用来描述现实世界的概念模型。它是描述现实世界关系概念模型的有效方法,是表示概念关系模型的一种方式。用“矩形框”

表示实体型,矩形框内写明实体名称;用“椭圆图框”表示实体的属性,并用“实心线段”将其与相应关系的“实体型”连接起来;用“菱形框“表示实体型之间的联系成因,在菱形框内写明联系名,并用”实心线段“分别与有关实体型连接起来,同时在“实心线段“旁标上联系的类型(1:1,1:n或m:n)。

第三章关系数据模型和关系数据库系统

1.关系数据语言

?关系数据语言分为关系代数语言、关系验算语言和兼具两者特点的语言,如SQL。

?关系数据语言的共同特点是:语言具有完备的表达能力,是非过程化的集合操作语言,功能强,能够独立使用也可以嵌入高级语言中使用。

?关系验算语言包括元祖关系验算语言和域关系验算语言。

?关系代数为关系模型定义了一组操作,关系验算为关系查询提供了一个更高级的描述性表示法。

2.关系代数基本运算

?关系代数的五个基本操作:并、差、笛卡尔积、投影和选择,其他操作均可以用这五种基本操作来表示。

?相容性:R和S具有相同的度,且每个相对应的属性都具有相同的域。

1.并(并记录)

2.差(减元素)

3.交(交元素)

4.广义积

5.选择(选记录)

6.投影(投字段)

如投影后有重复元组,则应去掉。

7.θ连接(有条件的广义积)

?又称连接

8.等值连接(条件为等值的θ连接)

9.自然连接(合并等值列的等值连接)

?自然连接的两个表必须有公共属性,否则就成了笛卡尔积

10.除

3.关系代数的六种扩充操作

1.广义投影:对投影的扩展。它是在若干算术表达式上的投影,这些算术表达式只涉及常量和关系中的属性;

2.赋值:通过赋值给临时变量,可以将关系代数表达式分开写,达到将复杂的表达式化整为零,成为简单的表达式;

3.外连接:对自然连接的扩展。将自然连接缺失的元组加上来。包括全外连接、左外连接(保留左表)和右外连接;

4.外部并:直接并;

5.半连接;

6.聚集操作。

4.关系模型三要素

1.关系数据结构

2.关系操作集合

3.关系完整性约束:实体完整性、参照完整性和用户定义完整性

?实体完整性:实体完整性要求每一个表中的主键字段都不能为空或者重复的值。

实体完整性指表中行的完整性。要求表中的所有行都有唯一的标识符,称为主关键字。主关键字是否可以修改,或整个列是否可以被删除,取决于主关键字与其他表之间要求的完整性。

?参照完整性保证相关表数据的正确性和一致性。

5.E-R模型向关系模型转换规则

1.一个实体类型转换成一个关系模式,实体的属性就是关系的属性,实体的码就是关系的码;

2.一个1:1联系可以转换为一个独立的关系模式,也可以与联系的任意一端实体所对应的关系模式合并;

3.一个1:n联系转换为一个独立的关系模式,也可以与联系的n端实体所对应的关系模式合并;

4.一个m:n联系转换为一个关系模式,与该联系相连的各实体的码以及联系本身的属性组均转换为关系的属性,而关

系的码为各实体码的组合。

第四章关系数据库标准语言SQL

1.SQL语言

?SQL称为结构化查询语言,它是由1974年由Boyce和Chamberlin提出的,1975年至1979年IBM公司的San Jose Research Laboratory研制了关系数据库管理系统的原型系统System R,并实现了这种语言。

?SQL语言的特点

1.综合统一,SQL语言集数据定义语言(DDL)、数据操纵语言(DML)、数据控制语言(DCL)的功能于一体,语言风格

统一,可以独立完成数据库生命周期中的全部活动;

2.高度非过程化,用SQL语言进行数据操作,用户只需提出“做什么”,而不必指明“怎么做”,因此用户无须了解

存取路径,存取路径的选择以及SQL语句的操作过程由系统自动完成;

3.面向集合的操作方式,采用集合操作方式,不仅查找结果可以是元组的集合,而且一次插入、删除、更新操作的对

象也可以是元组的集合(一次一个集合);

4.灵活的使用方式,SQL语言既是自含式语言,又是嵌入式语言,在不同的使用方式下,SQl语言的语法结构基本上

是一致的;

5.语言简洁,易学易用,功能强。

2.SQL数据类型

?SQL的数据类型分为如下四类:预定义数据类型、构造数据类型、用户定义数据类型和大对象类型。

?预定义数据类型包括数值型,字符串型,位串型,时间型和布尔型。

3.数据定义语言

?数据定义语言(DDL:Data Definition Language)用来创建数据库的各种对象。包括数据库模式、表、视图、索引、域、触发器、自定义类型等。

?DROP

?ALTER:SQL语言用ALTER TABLE语句扩充和修改基本表。

4.数据操纵语言(DML:Data Manipulation Language)对象:记录

?INSERT:将数据插入到一个表中。

?

?UPDATE

?DELETE

5.数据控制语言

?数据控制语言(DCL:Data Control Language)

?GRANT:把对指定操作对象的指定操作权限授予指定的用户或角色。

?

?WITH GRANT OPTION子句:获得某种权限的用户还可以把这种权限再授予其他用户。

?REVOKE

6.谓词

?LIKE:模糊查询,通配符:

下划线_:可以匹配任意一个字符;

百分号%:可以匹配0到多个字符;

方括号[]:用于转义(事实上只有左方括号用于转义,右方括号使用最近优先原则匹配最近的左方括号);

尖号^:用于排除一些字符进行匹配。

7.游标

?游标是处理结果集的一种机制,它可以定位到结果集中的某一行,多数据进行读写,也可以移动游标定位到你所需要的行中进行操作数据。

?

?

8.储存过程

?存储过程(Stored Procedure)是在大型数据库系统中,一组为了完成特定功能的SQL 语句集,存储在数据库中,经过第一次编译后调用不需要再次编译,用户通过指定存储过程的名字并给出参数(如果该存储过程带有参数)来执行它。存储过程是数据库中的一个重要对象。

9.触发器(trigger)

?触发器是SQL server 提供给程序员和数据分析员来保证数据完整性的一种方法,它是与表事件相关的特殊的存储过程,它的执行不是由程序调用,也不是手工启动,而是由事件来触发,比如当对一个表进行操作(INSERT、UPDATE、DELETE)时就会激活它执行。

?

?

?INSTEAD OF创建前触发器:指定执行触发器而不是执行引发触发器执行SQL语句,从而替代触发语句的操作。

?FOR或AFTER创建后触发器:只有在引发的SQL语句中指定的操作都已成功执行,并且所有的约束检查也成功完成后才执行触发器。

?一张表上可以建立多个后触发器,但只能建立一个前触发器。

?DELETED表和INSERTED表:DELETED表用于存储DELETE和UPDATE语句所影响的行的副本;INSERTED表用于存储INSERT和UPDATE语句所影响的行的副本。

第五章关系数据库的规划化理论与数据库设计

1.数据库规范化和范式

?数据库的设计范式是数据库设计所需要满足的规范,满足这些规范的数据库是简洁的、结构明晰的,不会发生插入(insert)、删除(delete)和更新(update)操作异常。反之则是乱七八糟,不仅给数据库的编程人员制造麻烦,而且面目可憎,可能存储了大量不需要的冗余信息。范式是符合某一种级别的关系模式的集合。关系数据库中的关系必须满足一定的要求,满足不同程度要求的为不同范式。

?第一范式(1NF)

?关系中的每个属性都不可再分。

?第二范式(2NF)

?每个表必须有仅有一个数据元素为主关键字(Primary key),其他数据元素与主关键字一一对应。

?2NF在1NF的基础之上,消除了非主属性对于码的部分函数依赖。

?第三范式(3NF)

?表中的所有数据元素不但要能唯一地被主关键字所标识,而且它们之间还必须相互独立,不存在其他的函数关系。

?3NF在2NF的基础之上,消除了非主属性对于码的传递函数依赖。

?巴斯范式(BCNF)

?第四范式(4NF)

2.函数依赖

?函数依赖是指关系中属性间(或者说是表中字段间)的对应关系。

?定义:设 R 为任一给定关系,如果对于 R 中属性 X 的每一个值,R 中的属性 Y 只有唯一值与之对应,则称 X 函数决定 Y 或称 Y 函数依赖于 X ,记作 X→Y。其中,X 称为决定因素。

?部分函数依赖:设X,Y是关系R的两个属性集合,存在X→Y,若X’是X的真子集,存在X’→Y,则称Y部分函数依赖于X。

?完全函数依赖: 设X,Y是关系R的两个属性集合,存在X→Y ,若X’是X的真子集,对每一个X’都有X’!→Y,则称Y完全函数依赖于X。

?传递函数依赖:在关系模式R(U)中,设X,Y,Z是U的不同的属性子集,如果X确定Y、Y确定Z,且有X不包含Y,Y不确定X,(X∪Y)∩Z=空集合,则称Z传递函数依赖于X。

?多值依赖

3.关系模式的分解

?无损分解:对关系模式分解时,原关系模式的任何一个合法的关系值在分解之后应该能通过自然连接运算恢复起来

?保持函数依赖分解:

?属性集的闭包F+:设F为一个函数依赖集,F的闭包是指F逻辑蕴涵的所有函数依赖集合。F的闭包记作F+。

?Armstrong公理

?设U为属性总体集合,F为U上的一组函数依赖集,对于关系模式R(U,F),X、Y、Z为属性U的子集,有下列推理规则。

?基本公理:

1.自反律:如果Y∈X∈U,则X→Y 成立。(平凡函数依赖);

2.增广律:如果X→Y 在 R(U)成立,且Z∈U,则XZ→YZ成立;

3.传递律:如果X→Y,Y→Z 成立,则X→Z 成立。

?推理规则:

1.合并:{X→Y,X→Z},则X→YZ;

2.分解:{X→Y,Z∈Y},则X→Z(或:X→YZ,那么X→Y,X→Z);

3.伪传递:{X→Y,YW→Z},则WX→Z;

4.复合:{X→Y,W→Z},则XW→YZ;

5.自积律:{X→YZ,Z→W},则X→YZW。

?无损分解的判断:如果分解成两个R1,R2,则如果R1∩R2是R1或R2的超码,则R上的分解(R1,R2)是无损分解。?保持依赖的判断: 如果F上的每一个函数依赖都在其分解后的某一个关系上成立,则这个分解是保持依赖的。

?若要求到达分解具有无损连接性那么模式分解一定可以达到BCNF,并进一步达到4NF;若要求分解函数依赖,那么模式分解可以达到3NF,但不一定能够达到BCNF;若要求分解既具有无损连接性,又保持函数依赖,则模式分解可以达到3NF,但不一定能达到BCNF。

4.数据库设计的过程,各设计阶段的主要任务

?按照规范的设计方法,一个完整的数据库设计一般分为需求分析、概念结构设计、逻辑结构设计、数据库物理设计、数据库的实施、数据库运行与维护六个阶段。

?各阶段的任务如下

1.需求分析:分析用户的需求,包括数据、功能和性能需求;

2.概念结构设计:主要采用E-R模型进行设计,包括画E-R图;

3.逻辑结构设计:通过将E-R图转换成表,实现从E-R模型到关系模型的转换;

4.数据库物理设计:储存记录的格式设计;储存方法设计,存取方法设计;

5.数据库的实施:包括编程、测试和试运行;

6.数据库运行与维护:系统的运行与数据库的日常维护。

第6章数据库管理系统

1.数据库管理系统主要成分

?存储管理器、查询处理器、事务管理器。

2.磁盘储存器

?磁盘存储器是存储介质层次结构中最常用的二级存储器。盘面被逻辑地划分为磁道,磁道又被划分为扇区,扇区是从磁盘读出和写入信息的最小单位,扇区之间有小的间隙。

?每个盘面都对应一个读写头,读写头通过在盘面上移动来访问不同的磁道。

?磁盘块是磁盘空间分配的基本单位,也是在磁盘与主存之间传输数据的逻辑单元,一个磁盘块由一个或多个扇区所组成。

?磁盘控制器是计算机系统和磁盘驱动器硬件之间的接口,它通常在磁盘驱动单元内部实现。

3.查询处理的基本步骤和查询优化的主要方法

?关系型数据库管理系统查询处理分为以下四个步骤:查询分析、查询检查、查询优化、查询执行。

?系统在将语法分析树转换为关系代数表达式之前个还需要进行预处理,主要包括如下:

?视图扩展,如果查询语句中用到的关系实际上是一个视图,则在FROM列表中凡用到该关系的地方必须用描述该视图的语法树来替换。

?语义查询,确保该查询语句语义上有效。

4.事务管理的基本概念

?事务(Transaction)是由一系列对系统中数据进行访问与更新的操作所组成的一个程序执行逻辑单元。

?完整的事务概要设计包括:事务名称、事务所访问的关系名及其属性名、事务的处理逻辑及事务用户。

?事务的ACID特性

1.原子性(Atomicity):指事务必须是一个原子的操作序列单元。事务中包含的各项操作在一次执行过程中,只允许

出现“全部执行成功”和“全部执行失败”两种状态。任何一项操作失败都会导致整个事务的失败,同时其它已经被执行的操作都将被撤销并回滚,只有所有的操作全部成功,整个事务才算是成功完成。

2.一致性(Consistency):指事务的执行不能破坏数据库数据的完整性和一致性,一个事务在执行之前和执行之后,

数据库都必须处以一致性状态。

比如:如果从A账户转账到B账户,不可能因为A账户扣了钱,而B账户没有加钱。

3.隔离性(Isolation):指在并发环境中,并发的事务是互相隔离的,一个事务的执行不能被其它事务干扰。也就是

说,不同的事务并发操作相同的数据时,每个事务都有各自完整的数据空间。

4.持久性(Duration):事务的持久性是指事务一旦提交后,数据库中的数据必须被永久的保存下来。即使服务器系

统崩溃或服务器宕机等故障。只要数据库重新启动,那么一定能够将其恢复到事务成功结束后的状态。

5.数据库系统的几种故障及其恢复方式

?事务内部的故障:事务内部故障可分为预期的和非预期的,其中大部分的故障都是非预期的。预期的事务内部故障是指可以通过事务程序本身发现的事务内部故障; 非预期的事务内部故障是不能由事务程序处理的,如运算溢出故障、并发事务死锁故障、违反了某些完整性限制而导致的故障等。

?恢复方式:在不影响其他事务运行的情况下,强行回滚该事务,即撤销该事务已经做出的任何对数据库的修改,使得该事务好像根本没有启动一样。这类恢复操作称为事务撤销。

?系统故障:系统故障也称为软故障,是指数据库在运行过程中,由于硬件故障、数据库软件及操作系统的漏洞、突然停电灯情况,导致系统停止运转,所有正在运行的事务以非正常方式终止,需要系统重新启动的一类故障。这类

事务不破坏数据库,但是影响正在运行的所有事务。

?恢复方式:待计算机重新启动之后,对于未完成的事务可能写入数据库的内容,回滚所有未完成的事务写的结果;

对于已完成的事务可能部分或全部留在缓冲区的结果,需要重做所有已提交的事务(即撤销所有未提交的事务,重做所有已提交的事务)。

?介质故障:介质故障也称为硬故障,主要指数据库在运行过程中,由于磁头碰撞、磁盘损坏、强磁干扰、天灾人祸等情况,使得数据库中的数据部分或全部丢失的一类故障。

?介质故障的软件容错:使用数据库备份及事务日志文件,通过恢复技术,恢复数据库到备份结束时的状态。

?介质故障的硬件容错:采用双物理存储设备,使两个硬盘存储内容相同,当其中一个硬盘出现故障时,及时使用另一个备份硬盘。

?计算机病毒故障: 计算机病毒故障是一种恶意的计算机程序,它可以像病毒一样繁殖和传播,在对计算机系统造成破坏的同时也可能对数据库系统造成破坏(破坏方式以数据库文件为主)。

?恢复方式:使用防火墙软件防止病毒侵入,对于已感染病毒的数据库文件,使用杀毒软件进行查杀,如果杀毒软件杀毒失败,此时只能用数据库备份文件,以软件容错的方式恢复数据库文件。

6.X锁、S锁、封锁协议

?封锁是并发控制的一个非常重要的技术。基本的封锁分两种:排他锁(简称X锁)和共享锁(简称S锁)。

?排他锁:排他锁又称为写锁。若事务T对数据对象A加上X锁,事务T可以读A也可以修改A,其他事务不能再对A加任何锁,直到T释放A上的锁。这保证了其他事务在T释放A上的锁之前不能再读取和修改A。

?共享锁:共享锁又称为读锁。若事务T对数据对象A加上S锁,则事务T可以读A但不能修改A,其他事务只能再对A加S锁,而不能加X锁,直到T释放A上的S锁。这保证了其他事务可以读A,但在T释放A上的S锁之前不能对A做任何修改。

?基于封锁的并发控制的两阶段封锁协议

?两阶段封锁协议要求每个事务分两个阶段提出加锁和解锁申请。

?增长阶段,事务可以获得锁,但不能释放锁;

?缩减阶段,事务可以释放锁,但不能获得锁。

?两阶段封锁协议能保证可串行性。

第7章数据技术的发展

1.分布式数据库系统

?分布式数据库系统:数据分布存储于若干场地,并且每个场地由独立于其它场地的DBMS进行数据管理。

?分布式数据库系统由局部数据库管理系统、全局数据库管理系统、全局数据字典、通信管理四部分组成。

?分布式数据库系统设计的主要目标之一就是数据处理的本地化,即将关系中的数据分成若干互不重叠的子集。用户的一个全局查询必须转换成几个片段查询。

?完备性原则是指必须把全局关系的所有数据映射到片段中,决不允许有属于全局关系的数据却不属于它的任何一个片段。

?全局外模式是全局应用的用户视图,即终端用户看到的逻辑上并未分布的表、视图等;全局概念模式用于描述全体数据的逻辑结构和特征;分片模式用于描述每个数据片段以及全局关系到片段的映像,是分布式数据库系统中全局数据的逻辑划分视图;分配模式用于描述各片段到物理存放场地的映像;局部概念模式用于描述全局关系在场地上存储的物理片段的逻辑结构以及特征;局部内模式用于描述局部概念模式涉及的数据在本场地的物理存储。

?分布式数据库总的数据分布策略可以从数据分片和数据分配两个角度来考虑,一般先数据分片,再数据分配。分片是对关系的操作,而分配是对分片结果的操作。分片模式是描述每个数据片断以及全局关系到片段的映像,分配模式是描述各片断到物理存放场地的映像。

?分布式数据库分片类型

1.水平分片:按一定的条件把全局关系的所有元组划分成若干个不相交的子集,每个子集为关系的一个片段;

2.垂直分片:将一个关系以列为单位“垂直地”分割,关系的垂直片段只保留关系的某些属性,且每一个垂直分片都

包含该关系的主键;

3.导出分片:又称为导出水平分片,即水平分片的条件不是本关系属性的条件,而是其他关系属性的条件。

4.混合分片:以上三种方法的混合。可以先水平分片再垂直分片,或先垂直分片再水平分片,或其他形式的分片,但

他们的结果是不相同的。

?数据分配方式

1.集中式:所有数据片段都安排在同一个场地上。

2.分割式:所有数据只有一份,它被分割成若干逻辑片段,每个逻辑片段被指派在一个特定的场地上。

3.全复制式:数据在每个场地重复存储。也就是每个场地上都有一个完整的数据副本。

4.混合式:这是一种介乎于分割式和全复制式之间的分配方式。

?分布式数据库系统按不同层次提供的分布透明性

1.分片透明性:分片透明性是最高层次的分布透明性,分片透明性位于全局概念模式与分片模式之间,是指用户只需

对全局关系进行操作,不必考虑数据的分片及存储场地,其应用程序的编写与集中式数据库相同。当分片模式改变时,只需改变全局概念模式到分片模式之间的映像,而不会影响到全局概念模式和应用程序。

2.位置透明性:位置透明性位于分片模式与分配模式之间,是指用户不必知道数据的存储场地,即数据分配到哪个或

哪些场地存储对用户是透明的。当存储场地发生变化时,只需改变分片模式到分配模式之间的映像,而不会影响分片模式、全局概念模式和应用程序。

3.局部数据模型透明性:局部数据模型透明性处于分配模式与局部概念模式之间,它使用户在编写应用程序时不但要

了解全局数据的分片情况,还要了解各片段的副本复制情况及各片断和它们副本的场地位置分配情况,但是不需要了解各场地上数据库的数据模型。

?查询代价

集中式数据库系统中,查询代价主要是由CPU代价和I/O代价来衡量的,在分布式数据库系统中,由于数据分布在

多个不同的场地上,使得查询处理中还要考虑站点间传输数据的通信代价。分布式数据库查询中,导致数据传输通信代价大的主要原因是各个站点分片间的连接和并操作。

?分布式数据库最基本特征是本地自治、非集中式管理以及高可用性。

2.面向对象的数据库系统

?三种最基本的构造器是:原子、结构或元组,以及汇集。

?对象查询语言(OQL)是专门为ODMG对象模型定制的查询语言。

?OQL在设计时要与编程语言紧密配合使用,这些编程语言在ODMG中定义了绑定,比如C++、Smalltalk以及Java。?OQL语法和关系型标准查询语言SQL的语法相似,只是增加了有关ODMG概念的特征。

?对象数据库(ODB)设计与关系数据库(RDB)设计的区别

1.如何处理联系;

2.如何处理继承;

3.对象数据库设计中,有必要在设计时尽早指定操作,因为它们是类描述中的一部分。

3.对象-关系数据库系统

?对象关系数据库以关系模型为基础,它的数据库模式最顶层仍然是命名的关系的集合,又进行了面向对象的扩充,支持面向对象的模型,因此表中的对象可以很丰富,表已经不再是传统意义下符合第一范式的简单的二维表。对象-关系数据库的面向对象扩展都在SQL环境中进行的,因此易于被传统的数据库用户所接受.

?对象-关系数据库提供继承机制。

4.NOSQL数据库系统

?NOSQL(NOSQL=Not Only SQL),意即“不仅仅是SQL",泛指非关系型的数据库。

?一般把NOSQL所采用的的模型分为四类:键值、文档、列和图。

?BASE指的是基本可用、软状态和最终一致性。

5.数据仓库

?数据仓库系统由数据仓库、仓库管理和分析工具三部分组成。分析工具分为查询工具和挖掘工具。

?元数据是数据仓库的核心,它用于存储数据模型,定义数据结构、转换规划、仓库结构、控制信息等。

?数据仓库应用是一个典型的客户机/服务器(C/S)结构形式。

?数据仓库特点

1.数据仓库是面向主题的;

2.数据仓库的数据是集成的;

3.数据仓库的数据是相对稳定的;

4.数据仓库数据是反映历史变化的。

6.数据挖掘

?知识发现的过程可以概括为三部分:数据准备、数据挖掘、及结果的解释和评估;

?数据挖掘阶段首先要确定挖掘的任务或目的,如数据分类、聚类、关联规则发现或序列模式发现等。

?数据挖掘的结果可能会发现一些新的信息类型:关联规则、序列模式、分类树等。

?影响数据挖掘质量的要素有两个:一所采用的数据挖掘技术的有效性,二是用于挖掘数据的质量和数量(数据量的大小)

?数据分类

?分类是学习一种模型的过程,该模型描述了数据的不同类别,这些类别是预先确定的。

?分类活动也称为有监督的学习;有监督的学习指的是模型的学习在被告知每个训练样本属于哪个类的“指导”下进行的,新数据使用训练数据集中得到的规则进行分类。

?可用于进行分类的算法有很多,比如决策树方法、BAYES方法、神经网络方法、支持向量机方法等。

7.数据库的基本安全性问题

?典型的DBMS包含一个数据库安全和授权子系统,由它来负责实现数据库的安全性功能以避免发生未授权的访问;?自主安全性机制:用于向用户授予特权,包括以指定的方式访问指定的数据文件、记录或字段的能力;

?强制安全性机制:用于对多级安全性进行控制,这一机制基于角色的概念来强制执行安全性策略和权限。

?数据库安全性的控制措施

1.访问控制:限制对数据库系统整体访问;

2.推理控制:对统计数据库安全性相应的控制措施;

3.流控制:防止信息向未授权用户流动;

4.数据加密;

8.OLAP与OLTP

?OLTP(on-line transaction processing):联机事务处理。

?OLAP的基本功能包括切片、切块、钻取和旋转。

excel期末知识点总结

1.文件的建立与打开: office图表新建新工作簿确定 打开 2.文件的保存与加密保存: office图表保存 xls 准备加密文档输入密码确定再次输入并确定 3.强制换行:alt+enter 4.删除与清除:删除整个单元格,清除格式、内容、批注 5.填充序列: 等差等比: 在单元格中输入起始值开始填充序列选择等差等比、行列输入步长值、终止值 文字序列: 在单元格输入文字序列 office按钮 excel选项常用编辑自定义序列选中刚才输入的文字序列导入确定6.复制移动: 移动覆盖左键拖拽 复制移动覆盖 ctrl+左键拖拽 移动插入 shift+左键拖拽 复制移动插入 ctrl+shift+左键拖拽 7.插入行列:选中要插入数量的行或列右键插入 8.为行、列、单元格命名: 先选中要命名的区域在左上角的名称框内输入名字 直观,快速选定 如何删除名称:公式名称管理器选中删除 9.批注:单击单元格审阅新建批注 10.科学计数法: >=12位用科计表示 123456789012=1.234567E+11 1.A3=R3C1 R为行C为列 C1 C2 C3 R1 R2 R3A3 2.数组运算Ctrl+Shift+Enter 3.将某一函数,作为另一函数的参数调用。最多可以嵌套七层 COUNT(参数1,参数2,…)功能:求一系列数据中数值型数据的个数。 COUNTA(参数1,参数2,…)功能:求“非空”单元格的个数。 COUNTBLANK(参数1,参数2,…)功能:求“空”单元格的个数。 COUNTIF功能:求符合条件的单元格数 4.四舍五入函数ROUND(number, num_digits) =ROUND(1234.567,2)=1234.57 =ROUND(1234.567,1)=1234.6 =ROUND(1234.567,0)=1235 =ROUND(1234.567,-1)=1230 =ROUND(1234.567,-2)=1200 负的往左,正的往右

大学英语四级固定搭配知识点汇总

大学英语四级完形填空 / 翻译常考部分固定搭配名词与介词的搭配 influence on对的影响 impact on对的影响 nothing but只有;只不过(=only) access to通往的路 answer to 的答案;的解决办法 solution to 的解决办法 barrier to 的障碍 (=obstacle to) comment on 对的评论 thanks to 由于 形容词与介词的搭配 1) 形容词与介词 with 的搭配 be busy with 忙于 be content with 对满意 be in sympathy with 赞同,同情 be satisfied with 对感到满意 be disappointed with sth. 对感到失望 be popular with sb. 受到某人的欢迎或喜欢 be patient with sb. 对某人有耐心 be fed up with sth.对极其厌倦(=be tired of sth.)

介词短语和短语介词 according to根据所说;按照 as for至于,就方面说 as to至于,关于 at all costs 不惜任何代价 at any cost 不惜任何代价 at the cost of 以为代价 at large完全地;详尽地 ahead of在前面,先于;胜过 at all events无论如何 at the expense of归付费 at ease自由自在;舒适,舒坦 with ease容易地 at any rate 无论如何;至少 at a speed of 以的速度 at full speed 以全速 at heart在内心里;实质上 动词短语 account for说明(原因等);解释 take into account考虑;重视 accuse sb. of sth.控告(某人某事)(=charge sb. with sth.)

数据库原理与应用知识总结

关系范式: 1.设有关系模式:学生修课管理(学号,姓名,所在系,性别,课程号,课程名,学分,成绩)。 设一名学生可以选修多门课程号,一门课程号可以被多名学生选修;一名学生有唯一的所在系,每门课程号有唯-的课程名和学分。 回答以下问题: (1)根据上述规定写出关系模式R的基本函数依赖; (2)找出关系模式R的候选码; (3)试问关系模式R最高已经达到第几范式?为什么? (4)将R分解成3NF模式集。 答: (1)学号> (姓名,所在系,性别) F 课程号> (课程名,学分) F (学号,课程号) >成绩F (学号,课程号) > (姓名,所在系,性别) P (2)候选码:学号,课程号 (3)存在部分函数依赖,R达到第一范式 (4) Student (学号,姓名,所在系,性别) sc (学号,课程号,成绩) Course (课程号,课程名,学分) 2.t-sql语句: (1)删除数据库drop database

(2)修改数据库alter database (3)使用SOL语句创建读者信息表,并设置读书编号的主键,读者姓名取值唯一。 Create table 读者信息表 (读者编号varchar(13)primary key, 读者姓名varchar(10)unique, 性别varchar(2)not null , 年龄int , 证件号码varchar (30)not null ); (4)使用SOL语句创建图书信息表、图书馆借阅表。 Create table 图书信息表 (图书编号varchar(13)primary key, 图书名称varchar(40)not null, 作者varchar(21)not null, 译者varchar(30), 出版社varchar(50)not null, 出版日期date not null, 图书价格money not null); Create table 图书借阅信息表 (图书编号varchar(13), 读书编号varchar(13),

大学英语四级必备知识点知识点汇总

英语四级必备知识点 (1)*短语 1.Practice makes perfect.熟能生巧。 2.God helps those who help themselves.天助自助者。 3.Easier said than done.说起来容易做起来难。 4.Where there is a will,there is a way.有志者事竟成。 5.One false step will make a great difference.失之毫厘,谬之千里。 6.Slow and steady wins the race.稳扎稳打无往而不胜。 7.A fall into the pit,a gain in your wit.吃一堑,长一智。 8.Experience is the mother of wisdom.实践出真知。 9.All work and no play makes jack a dull boy.只工作不休息,聪明孩子也变傻。 10.Beauty without virtue is a rose without fragrance.无德之美犹如没有香味的玫瑰,徒有其表。 11.More hasty,less speed.欲速则不达。

12.It's never too old to learn.活到老,学到老。 13.All that glitters is not gold.闪光的未必都是金子。 14.A journey of a thousand miles begins with a single step.千里之行始于足下。 15.Look before you leap.三思而后行。 16.Rome was not built in a day.伟业非一日之功。 17.Great minds think alike.英雄所见略同。 18.well begun,half done.好的开始等于成功的一半。 19.It is hard to please all.众口难调。 20.Out of sight,out of mind.眼不见,心不念。 21.Facts speak plainer than words.事实胜于雄辩。 22.Call back white and white back.颠倒黑白。 23.First things first.凡事有轻重缓急。 24.Ill news travels fast.坏事传千里。 25.A friend in need is a friend indeed.患难见真情。

数据库原理(王珊)知识点整理

目录 1.1.1四个基本概念1 数据(Data)1 数据库(Database,简称DB)1 长期储存在计算机内、有组织的、可共享的大量数据的集合、1 基本特征1 数据库管理系统(DBMS)1 数据定义功能1 数据组织、存储和管理1 数据操纵功能1 数据库的事务管理和运行管理1 数据库的建立和维护功能(实用程序)1 其它功能1 数据库系统(DBS)2 1.1.2 数据管理技术的产生和发展2 数据管理2 数据管理技术的发展过程2 人工管理特点2 文件系统特点2 1.1.3 数据库系统的特点3 数据结构化3 整体结构化3 数据库中实现的是数据的真正结构化3 数据的共享性高,冗余度低,易扩充、数据独立性高3 数据独立性高3

物理独立性3 逻辑独立性3 数据独立性是由DBMS的二级映像功能来保证的3 数据由DBMS统一管理和控制3 1.2.1 两大类数据模型:概念模型、逻辑模型和物理模型4 1.2.2 数据模型的组成要素:数据结构、数据操作、数据的完整性约束条件4 数据的完整性约束条件:4 1.2.7 关系模型4 关系数据模型的优缺点5 1.3.1 数据库系统模式的概念5 型(Type):对某一类数据的结构和属性的说明5 值(Value):是型的一个具体赋值5 模式(Schema)5 实例(Instance)5 1.3.2 数据库系统的三级模式结构5 外模式[External Schema](也称子模式或用户模式),5 模式[Schema](也称逻辑模式)5 内模式[Internal Schema](也称存储模式)5 1.3.3 数据库的二级映像功能与数据独立性6 外模式/模式映像:保证数据的逻辑独立性6 模式/内模式映象:保证数据的物理独立性6 1.4 数据库系统的组成6 数据库管理员(DBA)职责:6 2.1.1 关系6 域(Domain):是一组具有相同数据类型的值的集合6

java期末考试知识点总结

java知识点总结 应同学要求,特意写了一个知识点总结,因比较匆忙,可能归纳不是很准确,重点是面向对象的部分。 java有三个版本:JAVA SE 标准版\JAVA ME移动版\JAVA EE企业版 java常用命令:java, javac, appletview java程序文件名:.java, .class java的两类程序:applet, application; 特点,区别,这两类程序如何运行 java的主方法,主类,共有类;其特征 java的数据类型,注意与C++的不同,如字符型,引用型,初值 java与C++的不同之处,期中已总结 java标记符的命名规则 1)标识符有大小写字母、下划线、数字和$符号组成。 2)开头可以是大小写字母,下划线,和$符号(不能用数字开头) 3)标识符长度没有限制 4)标识符不能使关键字和保留字 面向对象的四大特征 抽象、封装、继承、多态 封装,类、对象,类与对象的关系,创建对象,对象实例变量 构造函数,默认构造函数,派生类的构造函数,构造函数的作用,初始化的顺序,构造方法的重载 构造函数:创建对象的同时将调用这个对象的构造函数完成对象的初始化工作。把若干个赋初值语句组合成一个方法在创建对象时一次性同时执行,这个方法就是构造函数。是与类同名的方法,创建对象的语句用new算符开辟了新建对象的内存空间之后,将调用构造函数初始化这个新建对象。 构造函数是类的特殊方法: 构造函数的方法名与类名相同。 构造函数没有返回类型。 构造函数的主要作用是完成对类对象的初始化工作。 构造函数一般不能由编程人员显式地直接调用。 在创建一个类的新对象的同时,系统会自动调用该类的构造函数为新对象初始化。 类的修饰符:public类VS 默认; abstract类; final类; 1)类的访问控制符只有一个:public,即公共的。公共类表明它可以被所有其他类访问和引用。 若一个类没有访问控制符,说明它有默认访问控制特性,规定该类智能被同一个包中的类访问引用(包访问控制)。 2)abstract类:用abstract修饰符修饰的类被称为抽象类,抽象类是没有具体对象的概念类,抽象类是它所有子类的公共属性集合,用抽象类可以充分利用这些公共属性来提高开发和维护效率。 3)final类:被final修饰符修饰限定的,说明这个类不能再有子类。所以abstract与final 不能同时修饰一个类。 域和方法的定义 1)域:定义一个类时,需要定义一组称之为“域”或“属性”的变量,保存类或对象的数据。

英语四级考试必备基础语法知识

英语四级考试必备基础语法知识 动词时态 1)现在完成进行时态 (have/has been + -ing 分词构成): 动作或状态从过去某时开始,继续到现在,可能继续下去,也可能刚刚结束. I’ve been writing letters for an hour. I’ve been sitting in the garden. 2)过去完成进行时(由had been + ing分词构成): 过去某个时刻以前一直在进行的动作 I’d been working for some tim e when he called. We had been waiting for her for two hours by the time she came. 3)将来完成进行时: 将来某个时刻以前一直在进行的动作. By next summer, he will have been working here for twenty years. In another month’s time she’ll have been studying here for three years. 4)将来完成时(由shall/will have + 过去分词构成): 将来某时已发生的事. I shall have finished this one before lunch. They’ll have hit the year’s target by the end of October. 动词语态 可以有两种被动结构的类型,例如: He was said to be jealous of her success. It was said that he was jealous of her success. 能同时适用于上述两个句型的主动词通常都是表示“估计”,“相信”等意义的动词,常见的有assume,believe,expect,fear,feel,know,presume,report,say,suppose,understand等. It is supposed that the ship has been sunk. The ship is supposed to have been sunk. 担当be supposed to 与不定式的一般形式搭配时往往表示不同的意义.例如: Why are you driving so fast in this area? You are supposed to know the speed to know the speed limit. (你应该晓得速度限制) 双宾语及宾补结构的被动语态 双宾语结构的被动语态: 双宾语结构变为被动语态时,可以把主动结构中的一个宾语变为主语,另一个宾语仍然保留在谓语后面,但多数是把间接宾语变为主语. He was asked a number of questions at the press conference.

四级英语知识点总结

四级英语知识点总结 四级英语知识点总结 英语不像汉语可以有固定的形容过去与现在的词语,要想表达不同时间的内容就必须懂得时态的转换。英语中事情发生的时间可分为现在、过去、将来和过去将来四种形式,发生的方式可分为一般、过去、进行和完成进行四种形式。 将时间形式和动作方式结合起来,就构成了以下:一般、完成、进行、完成进行几种时态。下面我们为大家仔细总结了英语中常用的几种时态,希望对大家的考试有所帮助。 现在:现在一般时do、现在完成时have done、现在进行时is doing、现在完成进行时have been doing 过去:过去一般时did、过去完成时had done、过去进行时was doing、过去完成进行时had been doing 将来:将来一般时will do、将来完成时will have done、将来进行时will be doing、将来完成进行时will have been doing、过去将来:过去将来一般时would do、过去将来完成时would have done、过去将来进行时would be doing、过去将来完成进行时would have been doing 英语的时态是靠动词的变化和时间状语来表达的。英语中的时态共有十六种,但是常考的或较常用的只有9种。 要掌握英语的时态和语态,必须掌握好英语中的助动词:第三人称单数:does。

主语+be+v.ing〔现在分词〕形式 They have lived in Beijing for five years. 他们在北京已经住了5年了。 4、一般过去时 表在过去某个特定时间发生且完成的动作,或过去习惯性动作,不强调对现在的影响,只说明过去。常跟明确的过去时间连用,如:yesterday; last week; in 1945, at that time; once; during the war; before; a few days ago be动词+行为动词的过去式,否定句式:在行为动词前加didnt,同时还原行为动词,或waswere+doing+其它 Beijing was hosting the 29th Olympic Games in August 2008. 在20xx年8月,北京正在举行29届奥运会。 6、过去完成时 表示过去某个时间之前已经完成的动作,即过去完成时的动作发生在“过去的过去”,句中有明显的参照动作或时间状语,这种时态从来不孤立使用。 7、一般将来时 表在将来某个时间会发生的动作或情况。常和tomorrow, next year等表示将来的时间状语连用。 am/are/is+going to+do 或will/shall+am/is/are/about to + do 、am/is/are to + do;

数据库原理知识总结和期末试卷

数据库知识要点归纳 第1章数据库基础知识 1.数据库(DB)是一个按数据结构来存储和管理数据的计算机软件系统。 数据库是长期储存在计算机内的、有组织的、可共享的数据集合。 数据库管理数据两个特征:1.数据整体性 2.数据库中的数据具有数据共享性 2.数据库管理系统(DBMS)是专门用于管理数据库的计算机系统软件 3.数据库应用系统是在数据库管理系统(DBMS)支持下建立的计算机应用系统,简写为DBAS。数据库应用系统是由数据库系统、应用程序系统、用户组成的。 例如,以数据库为基础的财务管理系统、人事管理系统、图书管理系统,成绩查询系统等等。 4.数据库系统DBS是一个实际可运行的存储、维护和应用系统提供数据的软件系统,是存储介质、处理对象和管理系统的集合体。它通常由软件、数据库和数据管理员组成。 5.数据库中数据独立性数据和程序之间的依赖程度低,独立程度大的特性称为数据独立性高。1、数据的物理独立性数据的物理独立性是指应用程序对数据存储结构的依赖程度。2、数据的逻辑独立性数据的逻辑独立性是指应用程序对数据全局逻辑结构的依赖程度。 6.数据库的三级模式是模式、外模式、内模式。1.模式(Schema)一个数据库只有一个模式 2.外模式(External Schema)一个数据库有多个外模式。3.内模式(Internal Schema)一个数据库只有一个内模式。 7.数据库系统的二级映象技术 第2章数据模型与概念模型 1.实体联系的类型:一对一联系(1:1)一对多联系(1:n)多对多联系(m:n) 2.E-R图描述现实世界的概念模型,提供了表示实体集、属性和联系的方法。 长方形表示实体集椭圆形表示实体集的属性菱形表示实体集间的联系 3.数据模型的三要素数据结构、数据操作、数据约束条件 数据结构分为:层状结构、网状结构和关系结构 常见的数据模型:层次模型、网状模型和关系模型。 层次模型用树形结构来表示各类实体以及实体间的联系

高一期末知识点总结

高一期末知识点总结 第一篇:宇宙与地球 专题1 地球在宇宙中的位置 A 1、天体的概念 2、最基本的天体共同的特征 3、主要天体的特征(恒星、星云、行星、卫星、彗星、流星体) 4、天体系统的层次 5、太阳系的中心天体 6、河外星云的成员 7、宇宙年 8、太阳系八大行星按距离太阳远近的名称 9、八大行星的共同特点 10、距离地球最近的恒星 11、太阳辐射的形式 12、太阳结构(外层、内层) 13、太阳大气的主要特征 14、各层主要的太阳活动的标志 15、太阳活动的主要标志 16、太阳活动的周期 17、太阳对地球的影响

18、八大行星的分类 19、地球成为有生命存有的天体的条件 专题2 地球的伙伴——月球B 20、月球的环境特点 21、月球的地形特点 22、月球公转周期、自转周期、方向 23、地球的天然卫星 24、熟悉月相的名称、各月相的出现的农历时间 25、月相循环一个周期的时间、名称 26、日食、月食出现的原因 27、日食、月食时,月球、地球、太阳的三者位置 28、日食、月食出现时的月相情况 29、潮、汐的概念 30、潮、汐出现的原因(不必展开阐述) 31、理解潮汐随月球而不是太阳的出没而出现潮起潮落的现象的原因 32、连续两次涨潮的时间间隔 33、大潮、小潮出现的月相农历时间 34、潮汐与人类的关系 专题3 人类对太空的探索A 35、太空探索的意义、太空探索的历程 专题4 地球的运动C

36、地球自转的方向、周期、一个周期所需的时间、速度 37、地轴北端的指向 38、恒星日与太阳日的区别(时间、参照物、成因) 39、南、北两极上空所观察到的地球自转的方向 40、什么是地方时、区时、北京时间 41、时区划分的方法 42、国际日期变更线两侧日期的变化 43、地球表面作水平运动的物体发生偏向的的规律(南、北半球、赤道的区别) 44、地球公转的方向、周期、速度 45、黄赤交角的度数 46、太阳直射点在赤道、北回归线、南回归线上的日期、节气 47、正午太阳高度角在纬度和季节上变化的规律 48、晨昏线的区分 49、昼夜长短在纬度和季节上变化的规律极昼、极夜现象 50、天文角度、传统上、气候上四季的划分 第二篇岩石与地貌 专题5 板块运动B 1、用于解释地壳运动的三大学说的名称 2、六大板块的名称 3、板块构造学说的主要观点

大学英语四级常用谚语知识点汇总

英语专业四级写作必备名言谚语 个人修养类 道德爱情 1. A candle lights others and consumes itself. 蜡烛照亮别人,燃烧了自己。 2. A fair death honors the whole life. 死得其所,流芳百世。 3. A fox may grow gray, but never good. 江山易改,本性难移。 4. Ambition is the germ from which all growth of nobleness proceeds. 抱负是一切高 尚操行的萌芽。 5. A good conscience is a soft pillow. 不做亏心事,不怕鬼叫门。 6. A good fame is better than a good face. 美名胜过美貌。 7. A liar is not believed when he speaks the truth.说谎者即使讲真话也没人相信。 8. A little knowledge is a dangerous thing. 浅学误人。 9. A man is not old as long as he is seeking something. A man is not old until regrets take the place of dreams. (J. Barrymore) 只要一个人还有追求,他就没有老。直到后悔 取代了梦想,一个人才算老。( J·巴里摩尔) 10. A word spoken is past recalling.一言既出,驷马难追。 11. All that glitters is not gold. 闪光的不一定都是金子。 12. Beauty lies in the lover ’ s eyes.情人眼里出西施。 13. Do as you would be done by. 己所不欲,勿施于人。 14. Doing is better than saying. 与其挂在嘴上,不如落实在行动上。(行动胜于言语。) 15. Don ’ t try to teach your grandmother to suck eggs. 不要班门弄斧。 16. Friendship is like earthenware: once broken, it can be mended; love is like a mirror: once broken, that ends it. (Josh Billings , American humorist) 友谊就像陶器,破了可以修补;爱情好比镜子,一旦打破就难重圆。(美国幽默作家乔什·比林斯) 17. Friendship is love without his wings. (George Gordon Byron, British poet) 友谊是没有羽翼的爱。(英国诗人 G· G·拜伦) 18. Handsome is he who does handsomely. 行为漂亮才算美。 19. Hasty love, soon cold. 一见钟情难持久。 20. He is not fit to command others that cannot command himself. 正人先正己。 21. If you run after two hares, you will catch neither. 脚踏两条船,必定落空。 22. Love cannot be compelled. 爱情不能强求。 23. Love is never without jealousy. 没有妒忌就没有爱情。 24. Love me, love my dog. 爱屋及乌。 25. On earth there is nothing great but man; in the man there is nothing great but mind. (A. Hamilton)地球上唯一伟大的是人,人身上唯一伟大的是心灵。( A·哈密尔顿)? 理想现实 1. Complacency is the enemy of study. 学习的敌人是自满。 2. A young idler, an old beggar. 少壮不努力,老大徒伤悲。 3. Living without an aim is like sailing without a compass. (Alexander Dumas, French writer) 生活没有目标就像航海没有指南针。(法国作家亚历山大·大仲马) 4. An aim in life is the only fortune worth finding.(Robert Louis Stevenson ) 生活的目标,是唯一值得寻找的财富。( R· L·史蒂文森)

大学英语四级考试技巧重点总结(最新)

大学英语四级考试,是每个大学生都要过的一项英语水平考试。 那么如何顺利复习考过英语四级,有哪些英语四级考试技巧和经验总结呢? 接下来就给大家详细讲讲这些问题吧,希望对大家复习英语四级有所帮助。 一、英语四级考试听力技巧 备考听力,要先复习好听力。 在平时的复习中,可以充分利用琐碎时间练习。 然后只要掌握一定的英语四级考试技巧,听力就能拿到高分。 英语四级考试听力技巧可概括为以下3点: 第一就是听前预测。 大家可以在听力开始播放之前就快速浏览一遍题目,划出题干和选项中的关键词,这样可以大致推测出这篇文章的主题是什么。 第二就是记笔记。 大家在听的时候要及时记下和题目有关的关键信息,这样做题时就能够快速定位正确选项,而不用每道题都回想半天。 第三就是要特别注意试题的排列次序。 因为四级听力题常常将小题按录音材料的内容排列顺序。 所以如果没有时间预先阅读选项或时间不宽裕,大家也可以边听录音边依次浏览选项,同时进行思考、答题。 二、英语四级考试翻译技巧 英语四级考试翻译题型与听力,阅读,写作相比不一样。 因为,其它几部分只需要提升英语水平即可。 而翻译,不仅需要扎实的英语基础,更需要深厚的中文功底。 英语基础知识的夯实,你可以在真题中学习。

真题资料可以帮你逐句精解单词和语法知识,词汇注释和语法知识详细到可以不用查阅任何资料。 能为你的复习节省大量的时间,大大提高你的复习效率。 翻译做题技巧: 1.翻译时有必要增加词语来使英文的表达更加顺畅。 2.为了有更强的节奏感和押韵,汉语中也经常会出现排比句。 在翻译这些句子时,为了符合英文表达的逻辑,就要有所删减或省略。 3.注意词类变形和词性转换,尤其是名词、动词、形容词之间的转换。 4.要注意语态之间的转换。汉语中主动语态出现频率较高,英语中被动语态的使用率较高。 5.在遇到较长的句子或较复杂的句子时,可以考虑分译,以使译文简洁,通俗易懂。 三、英语四级考试写作技巧 英语四级写作复习技巧之前,建议大家多学习四级范文。 写作考试技巧: 1.卷面整洁,不要做涂改。 2.少用模板、少说空话,多些现场发挥,这点要求你要注意平时积累。 建议大家背点开头、结尾的万能句型,积累一些好的写作语料,四级作文就成了。 相关文章: 1.英语知识 2.30%的英文 3.英语资料下载 4.英语最实用口语100句

数据库原理(王珊)知识点整理

目录 1.1.1四个基本概念 (1) 数据(Data) (1) 数据库(Database,简称DB) (1) 长期储存在计算机内、有组织的、可共享的大量数据的集合、 (1) 基本特征 (1) 数据库管理系统(DBMS) (1) 数据定义功能 (1) 数据组织、存储和管理 (1) 数据操纵功能 (1) 数据库的事务管理和运行管理 (1) 数据库的建立和维护功能(实用程序) (1) 其它功能 (1) 数据库系统(DBS) (1) 1.1.2 数据管理技术的产生和发展 (1) 数据管理 (1) 数据管理技术的发展过程 (1) 人工管理特点 (1) 文件系统特点 (1) 1.1.3 数据库系统的特点 (2) 数据结构化 (2) 整体结构化 (2) 数据库中实现的是数据的真正结构化 (2) 数据的共享性高,冗余度低,易扩充、数据独立性高 (2) 数据独立性高 (2) 物理独立性 (2) 逻辑独立性 (2) 数据独立性是由DBMS的二级映像功能来保证的 (2) 数据由DBMS统一管理和控制 (2) 1.2.1 两大类数据模型:概念模型、逻辑模型和物理模型 (2) 1.2.2 数据模型的组成要素:数据结构、数据操作、数据的完整性约束条件 (3) 数据的完整性约束条件: (3) 1.2.7 关系模型 (3) 关系数据模型的优缺点 (3) 1.3.1 数据库系统模式的概念 (3) 型(Type):对某一类数据的结构和属性的说明 (3) 值(Value):是型的一个具体赋值 (3) 模式(Schema) (3) 实例(Instance) (3) 1.3.2 数据库系统的三级模式结构 (3) 外模式[External Schema](也称子模式或用户模式), (3) 模式[Schema](也称逻辑模式) (3) 内模式[Internal Schema](也称存储模式) (3) 1.3.3 数据库的二级映像功能与数据独立性 (3)

大学数据结构期末知识点重点总结

第一章概论 1.数据结构描述的是按照一定逻辑关系组织起来的待处理数据元素的表示及相关操作,涉及数据的逻辑结构、存储结构和运算 2.数据的逻辑结构是从具体问题抽象出来的数学模型,反映了事物的组成结构及事物之间的逻辑关系 可以用一组数据(结点集合K)以及这些数据之间的一组二元关系(关系集合R)来表示:(K, R) 结点集K是由有限个结点组成的集合,每一个结点代表一个数据或一组有明确结构的数据 关系集R是定义在集合K上的一组关系,其中每个关系r(r∈R)都是K×K上的二元关系 3.数据类型 a.基本数据类型 整数类型(integer)、实数类型(real)、布尔类型(boolean)、字符类型(char)、指针类型(pointer)b.复合数据类型 复合类型是由基本数据类型组合而成的数据类型;复合数据类型本身,又可参与定义结构更为复杂的结点类型 4.数据结构的分类:线性结构(一对一)、树型结构(一对多)、图结构(多对多) 5.四种基本存储映射方法:顺序、链接、索引、散列 6.算法的特性:通用性、有效性、确定性、有穷性 7.算法分析:目的是从解决同一个问题的不同算法中选择比较适合的一种,或者对原始算法进行改造、加工、使其优化 8.渐进算法分析 a.大Ο分析法:上限,表明最坏情况 b.Ω分析法:下限,表明最好情况 c.Θ分析法:当上限和下限相同时,表明平均情况 第二章线性表 1.线性结构的基本特征 a.集合中必存在唯一的一个“第一元素” b.集合中必存在唯一的一个“最后元素” c.除最后元素之外,均有唯一的后继 d.除第一元素之外,均有唯一的前驱 2.线性结构的基本特点:均匀性、有序性 3.顺序表 a.主要特性:元素的类型相同;元素顺序地存储在连续存储空间中,每一个元素唯一的索引值;使用常数作为向量长度 b. 线性表中任意元素的存储位置:Loc(ki) = Loc(k0) + i * L(设每个元素需占用L个存储单元) c. 线性表的优缺点: 优点:逻辑结构与存储结构一致;属于随机存取方式,即查找每个元素所花时间基本一样 缺点:空间难以扩充 d.检索:ASL=【Ο(1)】 e.插入:插入前检查是否满了,插入时插入处后的表需要复制【Ο(n)】 f.删除:删除前检查是否是空的,删除时直接覆盖就行了【Ο(n)】 4.链表 4.1单链表 a.特点:逻辑顺序与物理顺序有可能不一致;属于顺序存取的存储结构,即存取每个数据元素所花费的时间不相等 b.带头结点的怎么判定空表:head和tail指向单链表的头结点 c.链表的插入(q->next=p->next; p->next=q;)【Ο(n)】 d.链表的删除(q=p->next; p->next = q->next; delete q;)【Ο(n)】 e.不足:next仅指向后继,不能有效找到前驱 4.2双链表 a.增加前驱指针,弥补单链表的不足 b.带头结点的怎么判定空表:head和tail指向单链表的头结点 c.插入:(q->next = p->next; q->prev = p; p->next = q; q->next->prev = q;) d.删除:(p->prev->next = p->next; p->next->prev = p->prev; p->prev = p->next = NULL; delete p;) 4.3顺序表和链表的比较 4.3.1主要优点 a.顺序表的主要优点 没用使用指针,不用花费附加开销;线性表元素的读访问非常简洁便利 b.链表的主要优点 无需事先了解线性表的长度;允许线性表的长度有很大变化;能够适应经常插入删除内部元素的情况 4.3.2应用场合的选择 a.不宜使用顺序表的场合 经常插入删除时,不宜使用顺序表;线性表的最大长度也是一个重要因素 b.不宜使用链表的场合 当不经常插入删除时,不应选择链表;当指针的存储开销与整个结点内容所占空间相比其比例较大时,应该慎重选择 第三章栈与队列 1.栈 a.栈是一种限定仅在一端进行插入和删除操作的线性表;其特点后进先出;插入:入栈(压栈);删除:出栈(退栈);插入、删除一端被称为栈顶(浮动),另一端称为栈底(固定);实现分为顺序栈和链式栈两种 b.应用: 1)数制转换 while (N) { N%8入栈; N=N/8;} while (栈非空){ 出栈; 输出;} 2)括号匹配检验 不匹配情况:各类括号数量不同;嵌套关系不正确 算法: 逐一处理表达式中的每个字符ch: ch=非括号:不做任何处理 ch=左括号:入栈 ch=右括号:if (栈空) return false else { 出栈,检查匹配情况, if (不匹配) return false } 如果结束后,栈非空,返回false 3)表达式求值 3.1中缀表达式: 计算规则:先括号内,再括号外;同层按照优先级,即先乘*、除/,后加+、减-;相同优先级依据结合律,左结合律即为先左后右 3.2后缀表达式: <表达式> ::= <项><项> + | <项><项>-|<项> <项> ::= <因子><因子> * |<因子><因子>/|<因子> <因子> ::= <常数> ?<常数> ::= <数字>|<数字><常数> <数字> ∷= 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 3.3中缀表达式转换为后缀表达式 InfixExp为中缀表达式,PostfixExp为后缀表 达式 初始化操作数栈OP,运算符栈OPND; OPND.push('#'); 读取InfixExp表达式的一项 操作数:直接输出到PostfixExp中; 操作符: 当‘(’:入OPND; 当‘)’:OPND此时若空,则出错;OPND若 非空,栈中元素依次弹出,输入PostfixExpz 中,直到遇到‘(’为止;若为‘(’,弹出即 可 当‘四则运算符’:循环(当栈非空且栈顶不是 ‘(’&& 当前运算符优先级>栈顶运算符优先 级),反复弹出栈顶运算符并输入到 PostfixExp中,再将当前运算符压入栈 3.4后缀表达式求值 初始化操作数栈OP; while (表达式没有处理完) { item = 读取表达式一项; 操作数:入栈OP; 运算符:退出两个操作数, 计算,并将结果入栈} c.递归使用的场合:定义是递归的;数据结构是 递归的;解决问题的方法是递归的 2.队列 a.若线性表的插入操作在一端进行,删除操作 在另一端进行,则称此线性表为队列 b.循环队列判断队满对空: 队空:front==rear;队满: (rear+1)%n==front 第五章二叉树 1.概念 a. 一个结点的子树的个数称为度数 b.二叉树的高度定义为二叉树中层数最大的叶 结点的层数加1 c.二叉树的深度定义为二叉树中层数最大的叶 结点的层数 d.如果一棵二叉树的任何结点,或者是树叶, 或者恰有两棵非空子树,则此二叉树称作满二 叉树 e.如果一颗二叉树最多只有最下面的两层结点 度数可以小于2;最下面一层的结点都集中在 该层最左边的位置上,则称此二叉树为完全二 叉树 f.当二叉树里出现空的子树时,就增加新的、特 殊的结点——空树叶组成扩充二叉树,扩充二 叉树是满二叉树 外部路径长度E:从扩充的二叉树的根到每个 外部结点(新增的空树叶)的路径长度之和 内部路径长度I:扩充的二叉树中从根到每个内 部结点(原来二叉树结点)的路径长度之和 2.性质 a. 二叉树的第i层(根为第0层,i≥0)最多有 2^i个结点 b. 深度为k的二叉树至多有2k+1-1个结点 c. 任何一颗二叉树,度为0的结点比度为2的 结点多一个。n0 = n2 + 1 d. 满二叉树定理:非空满二叉树树叶数等于其 分支结点数加1 e. 满二叉树定理推论:一个非空二叉树的空子 树(指针)数目等于其结点数加1 f. 有n个结点(n>0)的完全二叉树的高度为 ?log2(n+1)?,深度为?log2(n+1)?? g. 对于具有n个结点的完全二叉树,结点按层 次由左到右编号,则有: 1) 如果i = 0为根结点;如果i>0,其父结点 编号是(i-1)/2 2) 当2i+1∈N,则称k是k'的父结点,k'是 的子结点 若有序对∈N,则称k' k″互为兄弟 若有一条由k到达ks的路径,则称k是 的祖先,ks是k的子孙 2.树/森林与二叉树的相互转换 a.树转换成二叉树 加线: 在树中所有兄弟结点之间加一连线 抹线: 对每个结点,除了其最左孩子外, 与其余孩子之间的连线 旋转: 45° b.二叉树转化成树 加线:若p结点是双亲结点的左孩子,则将 的右孩子,右孩子的右孩子, 所有右孩子,都与p的双亲用线连起来 线 调整:将结点按层次排列,形成树结构 c.森林转换成二叉树 将各棵树分别转换成二叉树 将每棵树的根结点用线相连 为轴心,顺时针旋转,构成二叉树型结构 d.二叉树转换成森林 抹线:将二叉树中根结点与其右孩子连线,及 沿右分支搜索到的所有右孩子间连线全部抹 掉,使之变成孤立的二叉树 还原:将孤立的二叉树还原成树 3.周游 a.先根(次序)周游 若树不空,则先访问根结点,然后依次先根周 游各棵子树 b.后根(次序)周游 若树不空,则先依次后根周游各棵子树,然后 访问根结点 c.按层次周游 若树不空,则自上而下自左至右访问树中每个 结点 4.存储结构 “左子/右兄”二叉链表表示法:结点左指针指 向孩子,右结点指向右兄弟,按树结构存储, 无孩子或无右兄弟则置空 5. “UNION/FIND算法”(等价类) 判断两个结点是否在同一个集合中,查找一个 给定结点的根结点的过程称为FIND 归并两个集合,这个归并过程常常被称为 UNION “UNION/FIND”算法用一棵树代表一个集合, 如果两个结点在同一棵树中,则认为它们在同 一个集合中;树中的每个结点(除根结点以外) 有仅且有一个父结点;结点中仅需保存父指针 信息,树本身可以存储为一个以其结点为元素 的数组 6.树的顺序存储结构 a. 带右链的先根次序表示法 在带右链的先根次序表示中,结点按先根次序 顺序存储在一片连续的存储单元中 每个结点除包括结点本身数据外,还附加两个 表示结构的信息字段,结点的形式为: info是结点的数据;rlink是右指针,指向结点 的下一个兄弟;ltag是一个左标记,当结点没 有子结点(即对应二叉树中结点没有左子结点 时),ltag为1,否则为0 b. 带双标记位的先根次序表示法 规定当结点没有下一个兄弟(即对应的二叉树 中结点没有右子结点时)rtag为1,否则为0 c. 带双标记位的层次次序表示法 结点按层次次序顺序存储在一片连续的存储单 元中 第七章图 1.定义 a.假设图中有n个顶点,e条边: 含有e=n(n-1)/2条边的无向图称作完全图 含有e=n(n-1) 条弧的有向图称作有向完全图 若边或弧的个数e < nlogn,则称作稀疏图, 否则称作稠密图 b. 顶点的度(TD)=出度(OD)+入度(ID) 顶点的出度: 以顶点v为弧尾的弧的数目 顶点的入度: 以顶点v为弧头的弧的数目 c.连通图、连通分量 若图G中任意两个顶点之间都有路径相通,则 称此图为连通图 若无向图为非连通图,则图中各个极大连通子 图称作此图的连通分量 d.强连通图、强连通分量 对于有向图,若任意两个顶点之间都存在一条 有向路径,则称此有向图为强连通图 否则,其各个极大强连通子图称作它的强连通 分量 e.生成树、生成森林 假设一个连通图有n个顶点和e条边,其中n-1 条边和n个顶点构成一个极小连通子图,称该 极小连通子图为此连通图的生成树 对非连通图,则将由各个连通分量构成的生成 树集合称做此非连通图的生成森林 2.存储结构 a.相邻矩阵表示法 表示顶点间相邻关系的矩阵 若G是一个具有n个顶点的图,则G的相邻矩 阵是如下定义的n×n矩阵: A[i,j]=1,若(Vi, Vj)(或)是图G的边 A[i,j]=0,若(Vi, Vj)(或)不是图G的边 b.邻接表表示法 为图中每个顶点建立一个单链表,第i个单链表 中的结点表示依附于顶点Vi的边(有向图中指 以Vi为尾的弧)(建立单链表时按结点顺序建 立) 3.周游 a. 深度优先周游: 从图中某个顶点V0出发,访问此顶点,然后依 次从V0的各个未被访问的邻接点出发,深度优 先搜索遍历图中的其余顶点,直至图中所有与 V0有路径相通的顶点都被访问到为止 b. 广度优先周游: 从图中的某个顶点V0出发,并在访问此顶点之 后依次访问V0的所有未被访问过的邻接点,随 后按这些顶点被访问的先后次序依次访问它们 的邻接点,直至图中所有与V0有路径相通的顶 点都被访问到为止,若此时图中尚有顶点未被 访问,则另选图中一个未曾被访问的顶点作起 始点,重复上述过程,直至图中所有顶点都被 访问到为止 4.拓扑排序 拓扑排序的方法是:1)选择一个入度为0的顶 点且输出之 2)从图中删掉此顶点及所有的出边 3)回到第1步继续执行,直至图空或者图不空 但找不到无前驱(入度为0)的顶点为止 5.单源最短路径(Dijkstra算法) 6.每对顶点间的最短路径(Floyd算法) 7.最小生成树 a.Prim算法 b.Kruskal算法 c.两种算法比较:Prim算法适合稠密图, Kruskal算法适合稀疏图 第八章内排序 算法最大时间平均时间 直接插入排 序 Θ(n2) Θ(n2) 冒泡排序Θ(n2) Θ(n2) 直接选择排 序 Θ(n2) Θ(n2) Shell排序Θ(n3/2) Θ(n3/2) 快速排序Θ(n2) Θ(nlog n) 归并排序Θ(nlog n) Θ(nlog n) 堆排序Θ(nlog n) Θ(nlog n) 桶式排序Θ(n+m) Θ(n+m) 基数排序Θ(d·(n+r)) Θ(d·(n+r)) 最小时间S(n) 稳定性 Θ(n) Θ(1) 稳定 Θ(n) Θ(1) 稳定 Θ(n2) Θ(1) 不稳定 Θ(n3/2) Θ(1) 不稳定 Θ(nlog n) Θ(log n) 不稳定 Θ(nlog n) Θ(n) 稳定 Θ(nlog n) Θ(1) 不稳定 Θ(n+m) Θ(n+m) 稳定 Θ(d·(n+r)) Θ(n+r) 稳定 第十章检索 1.平均检索长度(ASL)是待检索记录集合中元 素规模n的函数,其定义为: ASL= Pi为检索第i个元素的概率;Ci为找到第i个元 素所需的比较次数 2.散列 a.除余法 用关键码key除以M(取散列表长度),并取余 数作为散列地址 散列函数为:hash(key) =key mod M b.解决冲突的方法 开散列方法:把发生冲突的关键码存储在散列 表主表之外(在主表外拉出单链表) 闭散列方法:把发生冲突的关键码存储在表中 另一个位置上 c.线性探查 基本思想:如果记录的基位置存储位置被占用, 就在表中下移,直到找到一个空存储位置;依 次探查下述地址单元:d0+1,d0+2,...,m-1, 0,1,...,d0-1;用于简单线性探查的探查 函数是:p(K, i) = i d.散列表的检索 1.假设给定的值为K,根据所设定的散列函数h, 计算出散列地址h(K) 2. 如果表中该地址对应的空间未被占用,则检 索失败,否则将该地址中的值与K比较 3. 若相等则检索成功;否则,按建表时设定的 处理冲突方法查找探查序列的下一个地址,如 此反复下去,直到某个地址空间未被占用(可 以插入),或者关键码比较相等(有重复记录, 不需插入)为止 e.散列表的删除:删除后在删除地点应加上墓 碑(被删除标记) f.散列表的插入:遇到墓碑不停止,知道找到真 正的空位置 第十一章索引技术 1.概念: a.主码:数据库中的每条记录的唯一标识 b.辅码:数据库中可以出现重复值的码 2.B树 a.定义:B树定义:一个m阶B树满足下列条 件: (1) 每个结点至多有m个子结点; (2) 除根和叶外 其它每个结点至少有??个子结点; (3) 根结点至少有两个子结点 例外(空树,or独根) (4) 所有的叶在同一层,可以有??- 1到m-1个 关键码 (5) 有k个子结点的非根结点恰好包含k-1个关 键码 b.查找 在根结点所包含的关键码K1,…,Kj中查找给 定的关键码值(用顺序检索(key少)/二分检索 (key多));找到:则检索成功;否则,确定要查 的关键码值是在某个Ki和Ki+1之间,于是取 pi所指结点继续查找;如果pi指向外部结点, 表示检索失败. c.插入 找到的叶是插入位置,若插入后该叶中关键码 个数

相关主题
文本预览
相关文档 最新文档