数据库复习笔记
- 格式:doc
- 大小:34.00 KB
- 文档页数:4
数据库复习资料1、数据库的基本概念概念模型数据模型分成两个不同的层次(1) 概念模型也称信息模型,它是按用户的观点来对数据和信息建模。
(2) 数据模型主要包括网状模型、层次模型、关系模型等,它是按计算机系统的观点对数据建模。
概念模型的用途概念模型用于信息世界的建模是现实世界到机器世界的一个中间层次是数据库设计的有力工具数据库设计人员和用户之间进行交流的语言对概念模型的基本要求较强的语义表达能力,能够方便、直接地表达应用中的各种语义知识简单、清晰、易于用户理解。
概念模型是现实世界到机器世界的一个中间层次。
相关概念:实体、实体型、实体集、联系、码、属性等实体(Entity)客观存在并可相互区别的事物称为实体。
可以是具体的人、事、物或抽象的概念。
实体型(Entity Type)用实体名及其属性名集合来抽象和刻画同类实体称为实体型实体集(Entity Set)同型实体的集合称为实体集联系(Relationship)现实世界中事物内部以及事物之间的联系在信息世界中反映为实体内部的联系和实体之间的联系实体型间联系两个实体型一对一联系(1:1)三个实体型一对多联系(1:n)一个实体型多对多联系(m:n)码(Key)唯一标识实体的属性集称为码。
属性(Attribute)实体所具有的某一特性称为属性。
一个实体可以由若干个属性来刻画。
表示方法:E-R图数据模型:网状模型:网状模型是一个网络层次模型实际是网状模型的一个特例网状模型的条件允许一个以上的结点无父结点一个结点可以有多于一个的父结点优点能够更为直接地描述现实世界,如一个结点可以有多个双亲具有良好的性能,存取效率较高缺点结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握;DDL、DML语言复杂,用户不容易使用关系模型:优点1、建立在严格的数学概念的基础上2、概念单一。
数据结构简单、清晰,用户易懂易用。
实体和各类联系都用关系来表示。
心之所向,所向披靡1、通常,一个数据库的数据模型由数据结构、数据操作和数据的约束条件三部分组成。
其中,数据结构和数据的约束条件为数据的静态特性。
2、数据模型实际上是模型化数据和信息的工具。
根据模型应用的不同目的,可以将模型分为两大类:概念层数据模型(概念模型)从数据的语义视角来抽取模型,是按用户的观点来对数据和信息进行建模。
组织层数据模型(逻辑模型)从数据的组织层次来描述数据。
3、数据模型中的组织层数据模型从数据的组织方式来描述数据,目前主要包括四种组织层数据模型:层次模型、网状模型、关系模型和对象-关系模型。
4、实体之间的联系可分为三种:一对一关系,一对多关系和多对多关系5、关系模型的操作对象是集合,也就是关系。
6、关系数据模型的数据操作主要包括四种:查询、插入、删除和修改数据。
7、关系模型的数据完整性约束包括:实体完整性、参照完整性和用户定义的完整性。
8、数据库系统的三级模式结构分别为:外模式( ),模式()和内模式( )。
9、中提供的整数数据类型有:和10、要在表中存储一个小数数据,具体要求如下:小数位保留三位,整数位最大有10位,应该选用的数据类型为(13,3)或(13,3)。
11、要在要在表中存储个人爱好资料,该资料可以不填,最多可填200汉字,应该选用的数据类型为(400)来定义。
12、统一字符编码字符串类型每个字符占两个字节。
13、一个汉字节两个字节。
名词解释1、什么是数据库,作用是什么?答:1、存放数据的一个有组织,有结构的系统。
2、一个软件系统。
1、数据存储2、数据查询3、数据管理4、数据共享5、数据挖掘6、数据安全2、什么是数据库系统,作用是什么?答:本质上是一个用计算机存储数据的系统,一般由数据库、数据库管理系统(及相关实用工具)、应用程序、数据库管理员组成。
主要作用除保存数据外,还提供对数据进行各种管理和处理:安全管理、数据共享、数据查询。
3、什么是数据库管理系统,作用是什么?答:是一个专门用于实现对数据进行管理和维护的系统软件。
UNIT 1四个基本概念1.数据(Data):数据库中存储的基本对象2.数据库的定义:数据库(Database,简称DB)是长期储存在计算机内、有组织的、可共享的大量数据集合3.数据库管理系统(简称DBMS):位于用户与操作系统之间的一层数据管理软件(系统软件)。
用途:科学地组织和存储数据;高效地获取和维护数据主要功能: 数据定义功能; 数据操纵功能; 数据库的运行管理; 数据库的建立和维护功能(实用程序)4.数据库系统(Database System,简称DBS):指在计算机系统中引入数据库后的系统数据库系统的构成数据库数据库管理系统(及其开发工具)应用系统数据库管理员(DBA)和用户数据管理技术的发展过程人工管理阶段文件系统阶段数据库系统阶段数据库系统管理数据的特点如下(1) 数据共享性高、冗余少;(2) 数据结构化;(3) 数据独立性高;(4) 由DBMS进行统一的数据控制功能数据模型用来抽象、表示和处理现实世界中的数据和信息的工具。
通俗地讲数据模型就是现实世界数据的模拟。
数据模型三要素。
数据结构:是所研究的对象类型的集合,它是刻画一个数据模型性质最重要的方面;数据结构是对系统静态特性的描述数据操作:对数据库中数据允许执行的操作及有关的操作规则;对数据库中数据的操作主要有查询和更改(包括插入、修改、删除);数据操作是对系统动态特性的描述数据的约束条件:数据及其联系应该满足的条件限制E-R图实体:矩形框表示属性:椭圆形(或圆角矩形)表示联系:菱形表示组织层数据模型层次模型网状模型关系模型(用“二维表”来表示数据之间的联系)基本概念:●关系(Relation):一个关系对应通常说的一张表●元组(记录): 表中的一行●属性(字段):表中的一列,给每一个属性名称即属性名●分量:元组中的一个属性值,分量为最小单位,不可分●主码(Key):表中的某个属性组,它可以唯一确定一个元组。
●域(Domain):属性的取值范围。
☐加密的基本思想根据一定的算法将原始数据(术语为明文,Plain text)变换为不可直接识别的格式(术语为密文,Cipher text)。
不知道解密算法的人无法获知数据的内容。
☐触发器(Trigger)用户定义在关系表上的一类由事件驱动的特殊过程,一旦定义,任何用户对表的增加、修改和删除工作均由服务器自动激活相应的触发器,在DBMS核心层进行集中的完整性控制。
触发器类似于约束,但是比约束更加灵活,可以进行更为复杂的检查和操作,具有更精细和更强大的数据控制能力。
☐重点掌握并能够灵活运用关系模式规范化的方法和关系模式分解的方法,这也是本章的难点。
关系数据库:基于关系模型的数据库,利用关系来描述现实世界。
⏹关系模式由五部分组成,即它是一个五元组:R ( U, D, DOM, F ) ☐R:关系名☐U:组成该关系的属性名集合☐D:属性组U中属性所来自的域☐DOM:属性到域的映象集合☐F:属性间的数据依赖关系集合⏹由于D和DOM对模式设计关系不大,因此可以把关系模式看做一个三元组:R <U, F>。
例如:关系模式:S(Sno, Sdept, Sno→Sdept)⏹当且仅当U上的一个关系r 满足F时,r 称为关系模式R <U, F>的一个关系。
数据依赖是数据库模式设计的关键,它是一个关系内部属性与属性之间的一种约束关系,这种约束关系是通过属性间的值是否相等体现出来的数据间的相互关系。
它是现实世界属性间相互联系的抽象,是数据内在的性质,是语义的体现。
数据依赖有很多类型,其中最重要的是:函数依赖(Functional Dependency,简记为FD)多值依赖(Multivalued Dependency,简记为MVD)其中,函数依赖起着核心的作用,是模式分解和模式设计的基础,范式是模式分解的标准。
⏹一个“好”的模式应当:不会发生插入异常、删除异常、更新异常,数据冗余应尽可能少。
⏹造成这些问题的原因,是由该模式中的某些数据依赖引起的。
数据库学习笔记与总结1.数据库1.1.基本查询语句1. S electSELECT column_name,column_name FROM table_name;SELECT * FROM table_name;SELECT DISTINCT column_name,column_name FROM table_name;2. W hereSELECT * FROM Websites WHERE country='CN'SQL 使用单引号来环绕文本值,如果是数值字段,请不要使用引号运算符描述= 等于<> 不等于。
注释:在SQL 的一些版本中,该操作符可被写成!= > 大于< 小于>= 大于等于<= 小于等于BETWEEN 在某个范围内LIKE 搜索某种模式IN 指定针对某个列的多个可能值SELECT * FROM Websites WHERE country='CN' AND alexa > 50SELECT * FROM Websites WHERE country='USA' OR country='CN';SELECT * FROM Websites WHERE alexa > 15 AND (country='CN' OR country='USA');3. O RDER BYORDER BY 关键字默认按照升序对记录进行排序。
如果需要按照降序对记录进行排序,您可以使用DESC 关键字。
SELECT column_name,column_nameFROM table_nameORDER BY column_name,column_name ASC|DESC;SELECT * FROM Websites ORDER BY country,alexa;4. I NSERT INTOINSERT INTO table_nameVALUES (value1,value2,value3,...);NSERT INTO table_name (column1,column2,column3,...) VALUES (value1,value2,value3,...);5. U PDEATEUPDATE table_nameSET column1=value1,column2=value2,...WHERE some_column=some_value;6. D ELETEDELETE FROM Websites WHERE name='百度' AND country='CN';1.2.高级查询1.LIKESELECT TOP 50 PERCENT * FROM Websites;SELECT * FROM Websites WHERE name LIKE 'G%'"%" 符号用于在模式的前后定义通配符(缺省字母);“_”代替一个字符2.IN、BETWEEN、AS(1) IN 操作符允许您在WHERE 子句中规定多个值(2) BETWEEN 操作符用于选取介于两个值之间的数据范围内的值(3) AS 为表名称或列名称指定别名SELECT * FROM WebsitesWHERE name IN ('Google','菜鸟教程')SELECT column_name(s)FROM table_nameWHERE column_name BETWEEN value1 AND value2;3.JOIN(1)INNER JOIN 与JOIN 是相同的。
数据库复习总结知识点大全数据库是指按照数据模型组织、描述和存储数据的集合。
数据库系统是指由数据库、数据库管理系统(DBMS)和应用程序组成的系统。
本文将对数据库的相关知识点进行复习总结,包括数据库的概念、数据库管理系统、关系数据库和面向对象数据库的比较、SQL语言、数据库设计、数据完整性、数据索引、事务和并发控制等内容。
1.数据库的概念-数据库是指按照数据模型组织、描述和存储数据的集合。
-数据库系统是指由数据库、数据库管理系统(DBMS)和应用程序组成的系统。
2.数据库管理系统(DBMS)-DBMS是指用于管理数据库的软件系统,提供了对数据库的访问、操作和管理的功能。
3.关系数据库和面向对象数据库的比较-关系数据库以表格的形式存储数据,使用结构化查询语言(SQL)进行操作,适用于结构化数据。
-面向对象数据库以对象的形式存储数据,使用面向对象的查询语言进行操作,适用于半结构化和非结构化数据。
-关系数据库适用于多表之间关系复杂的数据,而面向对象数据库适用于对象之间关系复杂的数据。
4.SQL语言- SQL(Structured Query Language)是用于管理关系数据库的标准化查询语言。
-SQL包括数据库定义语言(DDL)、数据库操作语言(DML)、数据查询语言(DQL)和数据控制语言(DCL)等部分。
-DDL用于创建、修改和删除数据库和表的结构。
-DML用于插入、更新和删除数据。
-DQL用于查询数据。
-DCL用于授权和撤销权限。
5.数据库设计-数据库设计是指根据应用需求,将实体、属性和关系映射到数据库的过程。
-数据库设计的步骤包括需求分析、概念设计、逻辑设计和物理设计。
-需求分析阶段通过收集应用需求,确定数据库中的实体、属性和关系。
-概念设计阶段将实体、属性和关系转换为概念模型,通常使用E-R图进行表示。
-逻辑设计阶段将概念模型转换为逻辑模型,通常使用关系模型进行表示。
-物理设计阶段根据逻辑模型选择合适的存储结构、索引和数据分布方案。
数据库复习总结知识点大全第一篇:数据库复习总结知识点大全《黄色填充区域是不确定区域需要在找找》1.数据库有什么特点?主要特点(1)实现数据共享。
(2)减少数据的冗余度。
(3)数据的独立性。
(4)数据实现集中控制。
(5)数据一致性和可维护性,以确保数据的安全性和可靠性。
主要包括:①安全性控制:以防止数据丢失、错误更新和越权使用;②完整性控制:保证数据的正确性、有效性和相容性;③并发控制:使在同一时间周期内,允许对数据实现多路存取,又能防止用户之间的不正常交互作用;④故障的发现和恢复:由数据库管理系统提供一套方法,可及时发现故障和修复故障,从而防止数据被破坏(6)故障恢复。
由数据库管理系统提供一套方法,可及时发现故障和修复故障,从而防止数据被破坏。
2.数据库系统是数据库、数据库管理系统、硬件、操作人员的合在一起的总称数据库管理系统,用来管理数据及数据库的系统。
数据库系统包含数据库管理系统、数据库及数据库开发工具所开发的软件(数据库应用系统)。
3.内模式内模式也称存储模式,一个数据库只有一个内模式。
它是数据物理结构和存储方式的描述,是数据在数据库内部的表示方式。
4.外模式也称子模式或用户模式,是数据库用户(包括应用程序员和最终用户)能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。
5.数据模型的三要素:数据结构、数据操作及完整性约束条件 1):数据结构,就是前面说的数据在数据区中的存储结构,在关系模型中就是采用的关系模型了,就是“二维表”的形式2):数据操作,指的是对数据的一些操作,包括查询、删除、更新、插入等等3):数据的完整性约束:就是对所存数据的约束规则,有实体完整性、参照完整性等等,就是取值唯一、不能为空等一系列操作6.E-R图即实体-联系图(Entity Relationship Diagram),是指提供了表示实体型、属性和联系的方法,用来描述现实世界的概念模型。
数据库系统概率复习笔记(简略)⼀、绪论数据:数据库中存储的基本对象,描述事物的符号记录称为数据。
数据库:长期存储在计算机中,⼤量数据的集合。
数据库管理系统:位于⽤户和操作系统之间的⼀层数据管理软件。
数据独⽴性:物理独⽴性,逻辑独⽴性⼈⼯管理阶段:冗余度极⼤,⽆共享性系统管理阶段:冗余度⼤,共享性差数据库管理阶段:冗余度⼩,共享性强数据模型:对现实世界数据特征的抽象数据模型有两类:概念模型,逻辑和物理模型数据模型包含:数据结构,数据操作,数据约束信息世界基本概念:实体:客观存在并可相互区分的事物称为实体属性:实体所具有的某⼀特性叫做属性码:唯⼀标识实体的属性外码:关系模式R中存在属性不是R的码,但是另⼀个关系模式的码,则称该属性为R的外码主属性:包含在候选码中的属性域:取值范围常⽤的逻辑数据模型:层次模型⽹状模型关系模型关系的完整性约束有三种:实体完整性参照完整性⽤户定义完整性数据库系统三级模式:外模式:也叫⼦模式,或者⽤户模式,是⽤户数据库的视图模式:也叫逻辑模式,是全体数据的逻辑结构的描述内模式:也叫存储模式,⼀个数据库只有⼀个内模式,是存储⽅式的描述⼆级映像:外模式/模式映像:当模式发⽣变化时,会⾃动调整影响,使外模式保持不变,保证了数据的逻辑独⽴性。
模式/内模式映像:当内模式发⽣改变时,会⾃动调整映像,使模式保持不变,保证了物理独⽴性。
数据库管理⼈员的职责:设计数据库让⽤户学会使⽤数据库的运⾏与维护重构⼆、关系数据库关系:实体与实体之间的联系关系模式:对关系的描述关系数据库:各种各样的关系集合基本关系操作:常⽤5种:选择,投影,并,差,笛卡尔积关系的三类完整性选择:选取表中⼏个元组。
投影:选择若⼲列,组成⼀个新的关系。
三、关系数据库标准语⾔SQL四、数据库安全性数据库的⼀⼤特点就是数据库可以共享共享必定会带来安全性问题安全性控制的常⽤⽅法:⽤户识别与鉴定存取控制视图审计密码存储五、数据库完整性数据库完整性为了防⽌不合语义、不正确的数据数据库安全性为了防⽌⾮法⽤户与⾮法操作六、关系数据库理论⼀个设计的不好的关系模式中可能会出现以下问题:数据的冗余度⼤插⼊异常删除异常修改⿇烦规范化1NF:关系模式R中所有属性都是不可再分的数据项2NF:关系模式R中每⼀个⾮主属性都是完全依赖于码的3NF:每⼀个⾮主属性既不部分依赖于码也不传递依赖于码BCNF:数据库表中不存在任何⼀个字段对任⼀候选字段的传递函数依赖七、数据库设计设计步骤:需求分析概念模型设计: E-R图逻辑模型设计:层次结构、⽹状结构、关系结构物理模型设计:为逻辑数据模型选取⼀个最适合运⾏的物理环境数据库实施数据库运⾏与维护数据字典内容:数据项数据结构数据流数据存储处理过程⼋、数据库编程ODBC编程ODBC(OPEN DATABASE CONNECTIVITY) 开放数据库连接为了解决在某个RDBMS中编写的应⽤程序不能在另⼀个RDBMS下运⾏的问题ODBC体系:应⽤程序驱动程序管理器数据库驱动程序数据源管理数据源是⽤户最终需要访问的数据ODBC⼯作流程:配置数据源初始化环境建⽴连接分配语句句柄句柄:⼀个指针执⾏SQL语句返回结果集查找完成九、关系系统及其优化查询查询处理步骤查询分析查询检查查询优化查询执⾏⼗、数据库恢复技术事务:⼀个数据库操作序列⼀个不可分割的基本单位特性:原⼦性⼀致性隔离性持续性数据库恢复的⽅法数据转储登记⽇志⽂件⼗⼀、并发控制并发控制问题产⽣的原因是多⽤户数据库的存在不同的多事务执⾏⽅式事务串⾏执⾏交叉并发执⾏同时并发执⾏封锁排它锁(X锁) 共享锁(S锁)活锁与死锁活锁:⼀直在尝试获取资源,⼀直失败,有可能⾃⾏解开死锁:互相占有对⽅所需要的资源,永远解不开避免活锁的⽅法:按照次序进⾏封锁解决死锁的⽅法:预防死锁:⼀次封锁法顺序封锁法死锁检测与解除并发调度可串⾏化调度:多个事务并发执⾏的结果与按照某⼀次序串⾏执⾏的结果相同。
第一章数据库知识入门信息,数据,数据处理,数据管理的概念;数据管理技术发展的三个阶段;数据库的概念,数据库系统的构成;MIS、数据库设计的含义;数据模型定义,概念模型的作用;实体联系(E-R)模型的概念和表示方法。
实体,属性,域,实体型、值、集,码的概念,实体联系及种类,E-R图示。
能够用E-R图画出简单的E-R模型;关系数据模型。
关系,元组,属性,域,候选码,主码,外码的概念;关系的基数与度数;关系的特点;关系模式及表示方法。
E-R模型向关系模型的转换。
VFP6.0的启动和退出;能够区分不同场合使用不同的术语。
1.数据库技术是目前计算机信息处理(数据处理)的主要技术之一,核心内容是数据管理。
信息是关于事物(或我们所关注的对象)以及事物间的联系的知识。
信息与能源、物质并列为人类社会活动的三大要素。
数据是为表达信息的符号记录。
数据是信息的载体,信息是数据的内涵。
所谓数据处理,就是指对数据的收集、整理、组织、存储、维护、查询、加工、传输的过程。
数据处理的目的是获取有用的信息,核心是数据。
2.计算机数据管理技术随着计算机软硬件技术的发展经历了三个阶段:手工管理阶段、文件系统阶段、数据库阶段。
3.所谓数据库(DB:Data Base),简而言之,就是相关联的数据的集合。
4.简述数据库技术的特点。
答:数据库技术是数据管理发展到数据库系统阶段所采用的技术,主要特点包括:⑴.数据结构化:数据库中存储的数据是相互联系的。
⑵.数据共享性好、冗余度低:数据库中的数据是面向整个组织的,是完备的。
不同用户从数据库中抽取出所需的数据,使数据冗余度减到最低,实现数据共享。
⑶.数据独立性强:数据库采用三级模式、两级映射,很强的数据独立性。
⑷.DBMS统一管理:数据库的定义、创建、维护、运行操作等所有功能由DBMS统一管理和控制。
5. 简述数据库系统的组成部分。
数据库系统是指在计算机中引入数据库后的系统构成,由计算机软硬件、数据库、数据库管理系统(DBMS)、应用程序以及数据库管理员(DBA:Data Base Administrator)和数据库用户构成。
高级数据库技术笔记一、数据库基础概念1. 数据库(Database):是一个组织数据的方法,它以某种方式存储,使数据可以检索,修改和删除。
2. 关系型数据库(RDBMS):使用二维表结构来存储和组织数据,表之间通过字段建立关系。
3. 索引(Index):是一种数据结构,用于快速查找和检索数据。
4. SQL(Structured Query Language):用于与数据库进行交互的高级语言。
二、数据库设计1. 实体-关系模型(ER图):用于表示现实世界中的实体以及它们之间的关系。
2. 规范化(Normalization):通过消除冗余和避免数据依赖来提高数据库的可靠性和性能。
3. 数据库设计原则:保持数据的一致性、完整性、可维护性和可扩展性。
三、SQL高级特性1. 存储过程(Stored Procedure):是一段预编译的SQL代码,用于完成特定任务,并可被数据库反复执行。
2. 触发器(Trigger):是一种在表上定义的事件驱动的程序,它在表数据发生变化时自动执行。
3. 视图(View):是SQL中一种虚拟的表,它基于其他表或查询生成,用户只能看到其中的数据,而无法直接修改。
4. 游标(Cursor):用于遍历和操作大量数据,是处理大量数据时的有效工具。
四、高级查询技术1. 连接(Join):将两个或多个表中的数据进行匹配和关联,以获取更丰富的信息。
2. 聚合函数(Aggregate Functions):如SUM、COUNT、AVG 等,用于对数据进行统计和计算。
3. 子查询(Subquery):在一个SQL语句中嵌套另一个SQL语句,用于获取更详细或更复杂的数据。
4. 排序(Ordering):对查询结果进行排序,以便更方便地分析和比较数据。
五、数据库安全与性能优化1. 用户权限管理:设置不同的用户权限,确保数据的安全性和保密性。
2. 备份与恢复:定期备份数据库,以防止数据丢失或损坏。
3. 性能优化:通过调整SQL语句、优化索引、增加硬件资源等方式提高数据库性能。
数据库期末考试复习题库(非常全面)第一部分第一章:一选择题:1 •在数据管理技术的发展过程中,经历了人工管理阶段、文件系统阶段和数据库系统阶段。
在这几个阶段中,数据独立性最高的是阶段。
A •数据库系统B •文件系统C •人工管理D •数据项管理答案:A2. _____________________________________________ 数据库的概念模型独立于____________________________________________________ 。
A. 具体的机器和DBMS B . E-R图C •信息世界D •现实世界答案:A3. ______________________________________ 数据库的基本特点是。
A . (1)数据可以共享(或数据结构化) ⑵数据独立性⑶数据冗余大,易移植(4)统一管理和控制B . (1)数据可以共享(或数据结构化) ⑵数据独立性⑶数据冗余小,易扩充(4)统一管理和控制C . (1)数据可以共享(或数据结构化) ⑵数据互换性⑶数据冗余小,易扩充(4)统一管理和控制D . (1)数据非结构化(2)数据独立性⑶数据冗余小,易扩充(4)统一管理和控制答案:B4. ________________ 是存储在计算机内有结构的数据的集合。
A. 数据库系统B.数据库C•数据库管理系统 D •数据结构答案:B5. ___________________________________ 数据库中存储的是。
A. 数据 B •数据模型C•数据以及数据之间的联系 D •信息答案:C6. __________________________________________________ 数据库中,数据的物理独立性是指____________________________________________ 。
A. 数据库与数据库管理系统的相互独立B. 用户程序与DBMS勺相互独立C. 用户的应用程序与存储在磁盘上数据库中的数据是相互独立的D. 应用程序与数据库中数据的逻辑结构相互独立答案:C7..数据库的特点之一是数据的共享,严格地讲,这里的数据共享是扌旨。
一、基本概念1、数据(1)数据的定义:对客观事物的符号表示,如图形符号、数字、字母等,数据是数据库中存储的基本对象。
(2)数据的种类:文字、图形、图象、声音(3)数据的特点:数据与其语义是不可分的2、数据库数据库(DataBase 简称 DB)是按照数据结构来组织、存储和管理数据的仓库。
3、数据库管理系统(比如:MySql)(1)数据库管理系统(DatabaseManagementSystem 简称 DBMS)是一种控制和管理数据库的大型软件,是用于建立、使用和维护数据库。
(2)关系型数据库管理系统称为 RDBMS,R 指 Relation。
(3) DBMS 的作用:它对数据库进行统一的管理和控制,以保证数据库的安全性和完整性。
4、数据库系统数据库系统(DatabaseSystem,简称 DBS),是由数据库及其管理软件组成的系统。
5、数据库管理员数据库管理员 (DatabaseAdministrator,简称 DBA),负责全面管理和控制数据库系统。
6、DBA、DBMS、DB 和 DBS 之间的关系7、数据库的优点(1)数据按一定的数据模型组织、描述和储存(2)可为各种用户共享(3)冗余度较小,节省存储空间(4)易扩展,编写有关数据库应用程序二、数据库管理系统(DBMS)1、DBMS 的主要功能(1)数据定义功能:提供数据定义语言(DDL)用于定义数据库的所有特性和属性,特别是行布局、列定义、键列 (有时是选键方法)、文件位置和存储策略,包括命令:DROP(删除数据库)删除数据库:dropdatabaseifexists 数据库名CREATE(创建数据库)创建表:createtableifnotexists 表名(列名列名约束)ALTER(修改数据库)添加列名:altertable 表名 add 列名约束条件修改列名:altertable 表名 change 老列名新列名数据类型修改列字段数据类型:altertable 表名modity 列名数据类型删除列名:altertable 表名 drop 列名修改表名:altertable 表名 rename 新表名GRANT(赋予权限)REVOKE(从当前用户或者组中取销权限)、TRUNCATE(只删除表中的所有数据,不删除表的结构)命令将快速删除数据表中的所有记录,但保留数据表结构。
1.数据管理的几个阶段及其对比1人工管理阶段2.文件系统阶段3.数据库系统阶段2.数据库三级模式外模式、模式、内模式;外模式又称子模式或用户模式,对应于用户级;它是某个或某几个用户所看到的数据库的数据视图,是与某一应用有关的数据的逻辑表示;模式又称概念模式或逻辑模式,对应于概念级;它是由数据库设计者综合所有用户的数据,按照统一的观点构造的全局逻辑结构,是对数据库中全部数据的逻辑结构和特征的总体描述;内模式又称存储模式,对应于物理级,它是数据库中全体数据的内部表示或底层描述,是数据库最低一级的逻辑描述,它描述了数据在存储介质上的存储方式和物理结构,对应着实际存储在外存储介质上的数据库;3.物理数据独立性和逻辑数据独立性物理独立性是指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的;即,数据在磁盘上怎样存储由DBMS管理,用户程序不需要了解,应用程序要处理的只是数据的逻辑结构,这样当数据的物理存储改变了,应用程序不用改变;逻辑独立性是指用户的应用程序与数据库的逻辑结构是相互独立的,即,当数据的逻辑结构改变时,用户程序也可以不变;4.DB、DBMS、DBSDB:Database数据库:数据库Database是按照数据结构来组织、存储和管理数据的建立在计算机存储设备上的仓库;DBMS:数据库管理系统:数据库管理系统Database Management System是一种操纵和管理数据库的大型软件,用于建立、使用和维护数据库,简称DBMSDBS:数据库系统:DBS 即Database System,中文意为“数据库系统”,是指带有数据库并利用数据库技术进行数据管理的计算机系统;数据库系统DBS一般由4个部分组成:①数据库,即存储在磁带、磁盘、光盘或其他外存介质上、按一定结构组织在一起的相关数据的集合;②数据库管理系统DBMS;它是一组能完成描述、管理、维护数据库的程序系统;它按照一种公用的和可控制的方法完成插入新数据、修改和检索原有数据的操作;③数据库管理员DBA;④用户和应用程序;5.DBMS的功能数据定义;数据操作;数据库的运行管理;数据组织、存储与管理;数据库的保护;数据库的维护;通信;6.数据库管理系统的组成、主要模块:存储管理和事务处理查询处理器:DDL编译器、DML编译器、嵌入式DML的预编译器和查询运行核心程序;存储管理器:权限和完整性管理器、事物管理器、文件管理器和缓冲区管理器;7.DBA及其作用DBA是对系统进行集中控制的人,被称为数据库管理员;主要作用有:模式定义;存储结构及存取方法定义;模式及物力组织的修改;数据访问授权;日常维护;8.数据模型概念模型、结构模型概念模型;逻辑模型;物理模型;概念模型Conceptual Data Model,是面向数据库用户的现实世界的模型,主要用来描述世界的概念化结构;在概念数据模型中最常用的是E-R模型、扩充的E-R模型、面向对象模型及谓词模型;逻辑模型Logical Data Model,这是用户从数据库所看到的模型,是具体的DBMS所支持的数据模型,如网状数据模型Network Data Model、层次数据模型Hierarchical Data Model等等;此模型既要面向用户,又要面向系统,主要用于数据库管理系统DBMS的实现;物理模型Physical Data Model,是面向计算机物理表示的模型,描述了数据在储存介质上的组织结构,它不但与具体的DBMS有关,而且还与操作系统和硬件有关;9.关系模式关系的描述称为关系模式Relation Schema通常简记为:RU或RA1,A2,…,An其中R为关系名,U为属性名集合,A1,A2,…,An为各属性名;10.超码、候选码、主码超码是一个或多个属性的集合,这些属性可以让我们在一个实体集中唯一地标识一个实体;如果K 是一个超码,那么K的任意超集也是超码,也就是说如果K是超码,那么所有包含K的集合也是超码;候选码是从超码中选出的,自然地候选码也是一个或多个属性的集合;因为超码的范围太广,很多是我们并不感兴趣即无用处的;所以候选码是最小超码,它们的任意真子集都不能成为超码;主码:从多个候选码中任意选出一个做为主码,如果候选码只有一个,那么候选码就是主码;11.强实体、弱实体及其区别其定义为一个实体对于另一个实体一般为强实体,也可以是依赖于其他强实体的弱实体具有很强的依赖联系,而且该实体主键的一部分或全部从其强实体或者对应的弱实体依赖的强实体中获得,则称该实体为弱实体;注:在现实世界中,有时某些实体对于另一些实体有很强的依赖关系,即一个实体的存在必须以另一实体的存在为前提;前者就称为“弱实体”,后者称为“强实体”;比如在人事管理系统中,职工子女的信息就是以职工的存在为前提的,子女实体是弱实体,子女与职工的联系是一种依赖联系;表示方法:在ER模型中也称实体-联系图Entity Relationship Diagram,弱实体用双线矩形框表示;与弱实体的联系用双线菱形框表示;注意:强实体与弱实体的联系只能是1:1或1:N;弱实体参与联系时应该是“完全参与”,因此弱实体与联系间的联系也画成双线边;12.关系代数基本操作:选择、投影、并、差、笛卡尔乘积、更名运算;附加的关系代数运算:集合交、连接θ连接、自然连接、除、赋值;拓展的关系代数:广义投影、聚集函数、外连接;13.自然连接、外连接及其适用场合自然连接:在连接运算当中,一种最常用的连接是自然连接;如果关系R与S具有相同的属性组B,且该属性组的值相等时的连接称为自然连接,;结果关系的属性集合为R的属性并上S减去属性B的属性集合R和S自然连接可记作:RS={t r⌒ts tr∈R∧ts∈S∧trA=tsB}自然连接也可看作是在广义笛卡尔积R×S中选出同名属性上符合相等条件元组,再进行投影,去掉重复的同名属性,组成新的关系;外连接:如果把舍弃的元组也保存在结果关系中,而在其他属性上空值,那么这种连接就叫外连接;如果只把左边关系R要舍弃的元组保留就叫左外连接,如果只把右边关系S中要舍弃的元组保留右外连接;自然连接与等值连接的区别1. 等值连接中不要求相等属性值的属性名相同,而自然连接要求相等属性值的属性名必须相同,即两关系只有在同名属性才能进行自然连接;2. 等值连接不将重复属性去掉,而自然连接去掉重复属性,也可以说,自然连接是去掉重复列的等值连接;14.视图及其作用视图是从一个或几个基本表或视图导出的表;它与基本表不同,是一个虚表;数据库只存放视图的定义,而不存放视图对应的数据,这些数据仍存放在原来的基本表中;视图的作用1. 视图能够简化用户的操作2. 视图使用户能以多种角度看待同一数据3. 视图对重构数据库提供了一定程度的逻辑独立性4. 视图能够对机密数据提供安全保护5. 适当的利用视图可以更清晰的表达查询;15.SQL标准的发展SQL-86:“数据库语言SQL”SQL-89:“具有完整性增强的数据库语言SQL”,增加了对完整性约束的支持SQL-92:“数据库语言SQL”,是SQL-89的超集,增加了许多新特性,如新的数据类型,更丰富的数据操作,更强的完整性、安全性支持等;SQL-399年:新的标准,增加对面向对象模型的支持16.DDL、DML、DCLDDLData Definition Language 数据定义语言用于操作对象和对象的属性,这种对象包括数据库本身,以及数据库对象,像:表、视图等等,DDL对这些对象和属性的管理和定义具体表现在Create、Drop 和Alter上;DMLData Manipulation Language 数据操控语言用于操作数据库对象中包含的数据,也就是说操作的单位是记录;如insert、update、delete等对记录的操作;DCLData Control Language 数据控制语句的操作是数据库对象的权限,这些操作的确定使数据更加的安全;17.嵌入式SQL、宿主语言嵌入式SQL英文: Embedded SQL是一种将SQL语句直接写入C语言等编程语言源代码中的方法;借此方法,可使得应用程序拥有了访问数据以及处理数据的能力;在这一方法中,将SQL文嵌入的目标源码的语言称为宿主语言;18.ODBC、JDBC开放数据库连接Open Database Connectivity,ODBCJDBCJava Data Base Connectivity,java数据库连接是一种用于执行SQL语句的Java API,可以为多种关系数据库提供统一访问,它由一组用Java语言编写的类和接口组成;19.数据库完整性及其主要措施数据库完整性Database Integrity是指数据库中数据的正确性和相容性,要防止不合语义的数据进入数据库;保证数据库完整性的措施主要有:完整性约束、触发器;完整性约束包括:非空约束、主键约束、check约束、唯一约束、参照完整性约束、断言; 20.触发器及其功能触发器是一种特殊的存储过程,它在试图更改触发器所保护的数据时自动执行触发器有如下作用:可在写入数据表前,强制检验或转换数据;触发器发生错误时,异动的结果会被撤销;部份数据库管理系统可以针对数据定义语言DDL使用触发器,称为DDL触发器;可依照特定的情况,替换异动的指令INSTEAD OF;21.数据库安全性及其主要措施数据库安全性:保护数据库,防止不合法的使用造成的数据泄露、更改或破坏;22.范式、各范式之间的关系范式是符合某一种级别的关系模式的集合;关系数据库中的关系必须满足一定的要求,满足不同程度要求的为不同范式第一范式:第一范式是为了要排除重复组的出现,所采用的方法是要求数据库的每个列的值域都是由原子值组成;每个字段的值都只能是单一值;第二范式:它的规则是要求数据表里的所有数据都要和该数据表的键主键与候选键有完全依赖关系:每个非键属性必须独立于任意一个候选键的任意一部分属性;第三范式:要求所有非键属性都只和候选键有相关性,也就是说非键属性之间应该是独立无关的;BCNF:BCNF与第三范式的不同之处在于:第三范式中不允许非主属性被另一个非主属性决定,但第三范式允许主属性被非主属性决定;而在BCNF中,任何属性包括非主属性和主属性都不能被非主属性所决定;任何一个BCNF必然满足:所有非主属性都完全函数依赖于每个候选键所有主属性都完全函数依赖于每个不包含它的候选键没有任何属性完全函数依赖于非候选键的任何一组属性23.函数依赖:完全依赖、部分依赖、传递依赖、多值依赖完全函数依赖:设X,Y是关系R的两个属性集合,X’是X的真子集,存在X→Y,但对每一个X’都有X’→Y,则称Y完全函数依赖于X;部分函数依赖:设X,Y是关系R的两个属性集合,存在X→Y,若X’是X的真子集,存在X’→Y,则称Y 部分函数依赖于X;传递函数依赖:设X,Y,Z是关系R中互不相同的属性集合,存在X→YY →X,Y→Z,则称Z传递函数依赖于X;多值函数依赖:设RU是一个属性集U上的一个关系模式, X、Y和Z是U的子集,并且Z=U-X -Y;关系模式RU中多值依赖X→→Y成立,当且仅当对RU的任一关系r,给定的一对x,z值,有一组Y的值,这组值仅仅决定于x值而与z值无关平凡函数依赖:当关系中属性集合Y是属性集合X的子集时YX,存在函数依赖X→Y,即一组属性函数决定它的所有子集,这种函数依赖称为平凡函数依赖;非平凡函数依赖:当关系中属性集合Y不是属性集合X的子集时,存在函数依赖X→Y,则称这种函数依赖为非平凡函数依赖;24.规范化的主要目的:消除冗余使结构合理,使数据冗余尽量小,清除插入,删除和更新异常.25.无损连接分解、无损链接分解:关系模式R<U,F>的一个分解ρ={ R1<U1,F1>,R2<U2,F2>, …,Rn<Un,Fn>}若R与R1、R2、…、Rn自然连接的结果相等,则称关系模式R的这个分解ρ具有无损连接性Lossless join保持函数依赖分解:设关系模式R<U,F>被分解为若干个关系模式R1<U1,F1>,R2<U2,F2>,…,Rn<Un,Fn>其中U=U1∪U2∪…∪Un,且不存在Ui Uj,Fi为F在Ui上的投影,若F所逻辑蕴含的函数依赖一定也由分解得到的某个关系模式中的函数依赖Fi所逻辑蕴含,则称关系模式R的这个分解是保持函数依赖的Preserve dependency;26.索引在关系数据库中,索引是一种单独的、物理的数对数据库表中一列或多列的值进行排序的一种存储结构,它是某个表中一列或若干列值的集合和相应的指向表中物理标识这些值的数据页的逻辑指针清单;索引的作用相当于图书的目录,可以根据目录中的页码快速找到所需的内容;27.建立索引的优缺点优点:通过创建唯一索引,可以保证数据记录的唯一性;可以大大加快数据检索速度;可以加速表与表之间的连接,这一点在实现数据的参照完整性方面有特别的意义;在使用ORDER BY和GROUP BY子句中进行检索数据时,可以显着减少查询中分组和排序的时间;缺点:但过多的索引会多耗费空间,且降低了插入、删除、更新的效率;28.主索引、辅助索引主索引:在顺序排序的文件中,搜索键指定文件的顺序的索引;也称为聚类索引,主索引的搜索键通常但不一定是主键;辅助索引:搜索键指定与文件顺序不同的顺序的索引; 也称为非聚类索引;29.稠密索引、稀疏索引稠密索引- 对文件中的每个搜索键值显示索引记录;稀疏索引- 某些搜索键值的索引记录;30.查询处理、查询处理的一般过程第一步:语法分析和翻译;第二步:优化查询;第三步:执行查询31.决定查询代价的主要因素磁盘读写;CPU;内存;网络;32.查询优化的目的及一般原则查询优化:对于给定的查询选择代价最小的操作序列,使查询过程既省时间,具有较高的效率,这就是所谓的查询优化;一般原则1 选择运算尽早进行;在优化策略中这是最重要、最基本的一条;它常常可使执行时节约几个数量级,因为选择运算一般使计算的中间结果大大变小;2 投影运算尽早进行;3 投影运算与选择运算可同时进行;如有若干投影和选择运算,并且它们都对同一个关系操作,则可以在扫描此关系的同时完戌所有的这些运算以避免重复扫描关系;4 将笛卡儿积与随后的选择运算合并为连接运算;5 投影运算与其他运算同时进行;33.事务以及事务的ACID性质事务Transaction是访问并可能更新数据库中各种数据项的一个程序执行单元unit原子性:一个事务transaction中的所有操作,要么全部完成,要么全部不完成,不会结束在中间某个环节;事务在执行过程中发生错误,会被回滚Rollback到事务开始前的状态,就像这个事务从来没有执行过一样;一致性:在事务开始之前和事务结束以后,数据库的完整性没有被破坏;这表示写入的资料必须完全符合所有的预设规则,这包含资料的精确度、串联性以及后续数据库可以自发性地完成预定的工作;隔离性:数据库允许多个并发事务同时对齐数据进行读写和修改的能力,隔离性可以防止多个事务并发执行时由于交叉执行而导致数据的不一致;事务隔离分为不同级别,包括读未提交Read uncommitted、读提交read committed、可重复读repeatable read和串行化Serializable;持久性:事务处理结束后,对数据的修改就是永久的,即便系统故障也不会丢失;34.事务的主要状态35.并行调度在并行调度中,来自不同事务的指令可以交叉执行;当并行调度等价于某个串行调度时,则称它是正确的36.并行调度有可能引起的问题重点:丢失修改丢失修改;读脏数据;不能重复读37.可串行性的并行调度每个事务中,语句的顺序在各种调度中始终保持一致;在这个前提下,如果一个并发调度的执行结果与某一串行调度的执行结果等价,则称该并发调度为“可串行化调度”,否则称为“不可串行化调度”;38.封锁并发控制的主要技术是封锁Locking;某事务对某个数据操作之前,先对其加锁,其他事务不能更新加锁的数据,直到释放封锁为止39.死锁及其解决办法Deadlock死锁:两个事务处于相互等待状态,永远不能结束;解决方法:撤销不重要的事务;死锁的预防一次封锁法:要求每个事务必须一次将所有要使用的数据全部加锁,否则就不能继续执行;顺序封锁法:预先对数据对象规定一个封锁顺序,所有事务都按这个顺序实行封锁;40.独占锁或排他锁和共享锁1 排他锁X锁或WLOCK某事务对数据加上排他锁,该事务可读写数据,其他事务不能再对数据加任何类型的锁,也就不能读写该数据,只有等待开锁2 共享锁S锁或RLOCK1.允许其他事务对同一数据进行检索,但不得对同一数据进行修改操作2.若事务T对数据对象A加上S锁,则事务可以T读A但不能修改A,其它事务只能再对A加S锁,而不能加X锁,直到T释放A上的S锁;这就保证了其它事务可以读A,但在T释放A上的S锁之前不能对A做任何修改;41.两段锁协议两段锁协议是指每个事务的执行可以分为两个阶段:生长阶段加锁阶段和衰退阶段解锁阶段;加锁阶段:在该阶段可以进行加锁操作;在对任何数据进行读操作之前要申请并获得S锁,在进行写操作之前要申请并获得X锁;加锁不成功,则事务进入等待状态,直到加锁成功才继续执行;解锁阶段:当事务释放了一个封锁以后,事务进入解锁阶段,在该阶段只能进行解锁操作不能再进行加锁操作;结论:1 若并行执行的所有事务均遵守两段锁协议,则对这些事务的所有并行调度策略都是可以串行化的2 所有遵守两段锁协议的事务,其并行执行的结果一定是正确的3 但可串行化的调度中,不一定所有事务都必须符合两段锁协议42.恢复计算机系统中硬件的故障、软件的错误、操作员的失误以及恶意的破坏仍是不可避免的,这些故障轻则造成运行事务非正常中断,影响数据库中数据的正确性,重则破坏数据库,使数据库中全部或部分数据丢失,因此数据库管理系统恢复子系统必须具有把数据库从错误状态恢复到某一已知的正确状态亦称为一致状态或完整状态的功能,这就是数据库的恢复;43.完全备份与增量备份差异备份完全备份:备份数据库和日志;增量备份:只备份自上次全面备份以来数据库发生的变化部分;44.C/S结构、B/S结构C/S 结构:即大家熟知的客户机和服务器结构B/S结构Browser/Server:浏览器/服务器模式45.分布式数据库系统分布式数据库系统DDBS包含分布式数据库管理系统DDBMS和分布式数据库DDB;在分布式数据库系统中,一个应用程序可以对数据库进行透明操作,数据库中的数据分别在不同的局部数据库中存储、由不同的DBMS进行管理、在不同的机器上运行、由不同的操作系统支持、被不同的通信网络连接在一起;。
数据库概念模型:层次模型,网状模型,关系模型,面向对象模型模式结构:子模式、概念模式、内模式什么是数据库:按照一定结构来组织、存储和管理数据的仓库。
数据库存储的是数据,数据是信息的载体。
信息-->信息采集-->数据(编码),数据-->数据处理-->信息(解码)。
数据库(Database):存放数据的仓库;存放于计算机存储设备;按照一定的规范和格式;数据库管理系统(DBMS):位于操作系统和用户之间的数据库管理软件,主要用于科学、高效管理数据,让和用户更方便地存储、查找和使用数据。
表(关系):由行、列组成的二位关系表数据库管理技术经历了人工管理、文件系统、数据库系统三个阶段。
人工阶段:计算机不通过数据管理;程序和数据是不可分割的整体;数据不能共享;不单独保存数据;文件系统阶段:数据以文件形式持久保存在外部存储设备上;程序和数据实现了分离;数据的逻辑结构和物理结构有了区别;没有专门的数据库管理系统,文件的建立,数据增、删、改、查都要用程序来实现。
缺点:数据冗余;不一致性;数据联系弱数据库系统阶段:为了让数据能在不同应用间实现共享,同时为了用户能更方便使用数据,逐渐形成了数据管理学科分支,计算机中数据又数据库系统来完成。
数据库结构分为3级:1,面向用户或应用程序员的用户级。
2,面向建立和维护数据库人员的概念级。
3,面向系统程序员的物理级。
描述数据库物理存储和实现的细节:1.数据和索引的存储空间分配2.用于数据存储的记录描述(数据结构)3.记录放置数据压缩、加密描述实体、数据类型及约束:1所有实体、实体属性和实体间的联系2.数据的约束3数据的语义信息4安全性和完整性分层模式的意义::1保证数据的独立性,较低层的修改不会影响高层2逻辑独立性:外部模式不受概念模式变化的影响3物理独立性:概念模式不受内部模式变化的影响数据模型定义:对现实世界数据特征的抽象目的:使数据更容易表达、理解数据组成:实体:客观存在的、可以相互区分的事物,可以是具体事物,也可以是抽象事物。
数据库的知识点(总结)1. 数据库基础概念数据库:用于存储和管理数据的系统。
数据库管理系统(DBMS):软件系统,提供数据库的创建、管理、和操作功能。
数据模型:描述数据结构、数据关系、数据语义和一致性约束的概念工具。
2. 数据库类型关系型数据库:如MySQL、PostgreSQL、Oracle,使用表格结构来表示数据及其关系。
非关系型数据库(NoSQL):如MongoDB、Redis,适用于分布式数据存储和大数据应用。
3. SQL基础DDL(数据定义语言):用于定义数据库结构,如CREATE、ALTER、DROP。
DML(数据操作语言):用于数据的查询和操作,如SELECT、INSERT、UPDATE、DELETE。
DCL(数据控制语言):用于控制访问权限,如GRANT、REVOKE。
TCL(事务控制语言):用于管理事务,如COMMIT、ROLLBACK。
4. 关系数据库设计范式:用于消除数据冗余和提高数据完整性的设计原则。
-第一范式(1NF)-第二范式(2NF)-第三范式(3NF)- BCNF(Boyce-Codd范式)5. 索引作用:提高数据库查询速度。
类型:B树索引、哈希索引、全文索引等。
6. 事务管理ACID特性:-原子性(Atomicity)-一致性(Consistency)-隔离性(Isolation)-持久性(Durability)7. 数据库优化查询优化:使用索引、优化SQL语句。
数据库设计优化:规范化、反规范化。
缓存机制:如Redis缓存。
8. 分布式数据库特点:数据分布在多个节点上,支持水平扩展。
CAP理论:一致性(Consistency)、可用性(Availability)、分区容错性(Partition Tolerance)。
9. 数据库安全用户权限管理:控制用户对数据库的访问权限。
数据加密:保护敏感数据。
10. 数据备份与恢复备份:全量备份、增量备份、差异备份。
恢复:从备份中恢复数据。
《数据库原理》知识点总结归纳数据库原理是计算机科学中的重要基础课程,它涉及到数据库的架构、数据模型设计、数据操作和查询、事务处理等方面的知识。
下面对《数据库原理》的主要知识点进行总结归纳。
1.数据库基本概念-数据:存储在计算机中的描述事物属性和关系的符号记录。
-数据库:长期存储在计算机内、有组织地、可共享的大量数据的集合。
-数据库管理系统(DBMS):用于管理和操作数据库的软件系统。
-数据库系统:由DBMS、数据库和应用程序组成的完整系统。
2.数据模型-关系模型:基于关系理论,将数据组织成二维表格形式。
-实体-关系模型:基于实体和实体之间的关系来描述现实世界。
-层次模型:数据组织为树形结构。
-网状模型:数据组织为图形结构。
-对象模型:以对象为中心来描述数据。
3.关系代数和关系演算-关系代数:一组运算符和规则,用于操作关系数据库的各种操作,包括选择、投影、并、差、交、连接等。
-关系演算:基于数理逻辑的一种查询方式,分为元组关系演算和域关系演算。
4.数据库设计-概念设计:确定数据库的整体结构和模式。
-逻辑设计:将概念模型转化为关系模型。
-物理设计:确定存储结构、访问路径、索引等。
5.数据库查询-SQL语言:结构化查询语言,用于对数据库进行操作和查询。
-查询优化:通过优化查询计划来提高查询效率。
6.事务处理-事务:是对数据库进行访问和更新的基本单位,具有原子性、一致性、隔离性和持久性的特性。
-并发控制:用于处理多个事务并发执行时可能出现的并发不一致问题,包括锁、并发控制技术等。
7.数据库完整性和安全性-完整性约束:用于保证数据库中数据的完整性,包括实体完整性、参照完整性、用户定义的完整性等。
-安全性:包括用户权限管理、数据加密、备份和恢复等。
8.数据库备份和恢复-备份:将数据库的副本存储在其他位置,以防止数据丢失。
-恢复:将备份的数据库恢复到原来的状态,包括崩溃恢复和事务恢复。
以上是《数据库原理》的主要知识点总结归纳,通过对这些知识点的掌握,可以深入理解数据库的基本原理和操作,为实际应用提供支持。
数据库复习基本知识1、数据库的4个基本概念:数据(描述事物的符号记录)、数据库(长期存储在计算机内、有组织的、可共享的大量数据的集合。
数据库中的数据按一定的数据模型组织、描述和存储,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享概括的讲,数据库数据具有永久存储、有组织和可共享三个基本特点)、数据管理系统(DBMS)和数据库系统(DBS)2、数据库系统的特点:数据结构化(数据库系统实现整体数据的结构化,这是数据库的主要特征这一,也是数据库系统与文件系统的本质区别)、数据的共享性高、冗余度低且易扩充(数据共享可以大大减少数据冗余,节约存储空间,数据共享还能够避免数据之间的不相容性与不一致性)、数据的独立性高(物理独立性和逻辑独立性)、数据由数据库管理系统统一管理和控制(必须具备的4各控制功能1、数据的安全性保护2、数据的完整性检查3、并发控制4、数据库恢复)3、数据库的定义:数据库是长期存储在计算机内有组织、大量、共享的数据集合。
它可以提供各种用户共享,具有最小冗余度和较高的数据独立性。
数据库管理系统在数据库建立、运用和维护时对数据库进行统一控制,以保证数据的完整性和安全性,并在多用户同时使用数据库时进行并发控制,在发生故障后对数据库进行恢复。
4、两大数据模型:1、概念模型(也称信息模型,主要用于数据库设计)2、数据模型(包括逻辑模型和物理模型逻辑模型主要用于数据库管理系统的实现)数据模型应满足三方面的要求:1、能比较真实的模拟现实世界2、容易为人所理解3、便于在计算机上实现5、概念模型:它是按用户的观点来对数据和信息建模,主要用于数据库设计,从现实世界到概念模型的转换是由数据库设计人员完成的。
6、数据模型:它是对现实世界数据特征的抽象。
是用来描述数据、组织数据和对数据进行操作的。
数据模型是数据库系统的核心和基础。
包括逻辑模型(主要包括层次模型、网状模型、关系模型等。
它是按计算机系统的观点对数据建模,主要用于数据库管理系统的实现)和物理模型(对数据最底层的抽象,它描述数据在系统内部的表示方式和存取方方法是面向计算机系统的)从概念模型到逻辑模型的转换可以有数据可设计人员完成,也可以用数据可设计工具协助设计人员完成;从逻辑模型到物理模型的转换主要由数据库管理系统完成。
DBS由数据库、数据库管理系统、应用系统、数据库管理员、用户构成
人工管理阶段、文件系统阶段(数据共享性差冗余度大②数据独立性差)、数据库系统阶段人工管理阶段没有软件对数据进行管理:数据不保存。
数据库系统的特点:①数据结构化②数据的共享性高,冗余度低,易扩充
③数据独立性高:物理独立性和数据的逻辑独立性
物理独立性指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的。
数据的物理存储改变时,应用程序不用改变。
逻辑独立性是指用户的应用程序与数据库的逻辑结构是相互独立的,也就是说,数据的逻辑结构改变了,用户程序也可以不变。
数据独立性是由DBMS的二级映像功能来保证的
④数据由DBMS统一管理和控制
数据模型是数据库系统的核心和基础。
逻辑模型包括:层次模型、网状模型、关系模型、面向对象模型、对象关系模型。
数据模型的三要素:数据结构、数据操作和完整性约束。
关系数据库系统采用关系模型作为数据的组织方式:它是目前最重要的一种数据模型
数据库系统通常采用三级模式结构:数据库管理系统内部的系统结构:外模式、模式和内模式。
模式:逻辑模式:中间层,逻辑级上的视图。
描述数据的全局逻辑结构。
全DBMS提供模式描述语言(模式DDL)严格定义模式。
一个数据库只有一个模式。
模式是数据库的中心和关键,独立于数据库的其他层次。
外模式:子模式或用户模式,数据库用户的数据视图。
局部逻辑结构。
外模式是模式的子集,一个应用程序指能使用一个外模式。
DBMS提供模式描述语言(模式DDL)严格定义外模式。
内模式:存储模式,一个数据库只有一个内模式.它是物理数据结构和存储方式的描述,是数据在数据库内部的表示方式。
DBMS提供描述语言(内模式DD或存储模式DDL)严格定义模式。
外模式/模式映像:
模式/内模式映像
这两级映像保证了数据库系统中的数据较高的逻辑独立性和物理独立性
数据库系统人员:数据库管理员(DBA)、系统分析员、数据库设计人员、应用程序员和最终用户。
数据库系统的软件包括:DBMS、支持DBMS运行的操作系统、高级语言和编译系统、以DBMS为核心的应用开发工具。
第二章:
候选码:若关系中的某一属性组的值能唯一地标示一个元祖,则称该属性组为候选码。
若一个关系有多个候选码,则选定其中的一个为主码。
候选码的诸属性为主属性,不包含任何候选码属性的称为非主属性或非码属性。
关系模式的所有属性是这个关系模式的候选码:全码。
▲关系(三种类型:基本关系又叫基本表或表)、查询表、和视图表。
每个分量都是不可分解的数据项。
关系模式是静态稳定的,关系是动态不断变化的,因为关系操作在不断地更新着数据库的数据。
关系模型中常用的关系操作包括:查询操作和插入、删除、修改操作两大部分
查询操作又可以分为:选择、投影、连接、除、并、差、交、笛卡尔积。
选择、投影、并、差、笛卡尔积是5种基本操作。
五种基本关系代数运算:并、差、交、笛卡尔积、选择、投影
专门的关系运算符有:选择、投影、连接、除运算
实体完整性规则:p49
参照完整性规则:p51
用户定义的完整性:针对某一具体关系数据库的约束条件,反映某一具体应用所涉及的数据必须满足的语义要求。
R⋂S=R-(R-S)
连接是从两个关系的笛卡尔积中选取属性间满足一定条件的元组
外连接:把舍弃的元祖也保存在结果关系中,而在其他属性上填空值。
左外连接/右外连接选择:σ在关系R中选择满足给定条件的诸元组
投影:关系R上的投影是从R中选出若干属性列组成新的关系
第四章:数据库安全性
计算机三类安全性问题:计算机系统安全性;技术安全;管理安全;政策法律
数据库安全性控制:用户标识和鉴定(最外层安全保护)、存取控制、视图和密码存储。
最重要的技术是存取控制、视图和审计技术。
数据库安全性所关心的主要是DBMS的存取控制机制。
①用户定义权限,将用户权限等级到数据字典中。
DBMS提供语言定义用户权限编译后放在数据字典:安全规则或授权规则。
自主存取控制(DAC):用户对于不同的数据库对象有不同的存取权限,不同的用户对同一对象也有不同的权限,而且用户还可将用户的存取权限转授给其他用户。
非常灵活GRANT/REVOKE WITH GRANT OPTION
(对模式的授权)创建数据库模式的权限:CREATE USER(系统超级用户)
SQL中用CREATE ROLE语句创建角色,用GRANT给角色授权
默认有CONNECT权限用户不能创建新用户和模式、基本表;只能登陆
RESOURCE:权限的用户可以创建基本表和视图,成为创建对象的属主。
不能创建模式和用户CREATE TABLE
DBA权限的用户:超级用户;创建新的用户、模式、基本表和视图,拥有所有数据库对象的存取权限,还可以授予权限一般用户。
CREATE USER;CREAE SCHEMA CREATE TABLE
强制存取控制(MAC):每个数据库对象都被标以一定的密级,每个用户也被授予某一个级别的许可证。
MAC中,DBMS所管理的全部尸体被分为主体和客体两大类。
主体是系统的活动实体,包括DBMS管理的实际用户,也包括代表用户的各进程。
客体是系统中的被动实体,是受主体操纵的,包括文件、基本表、索引、视图等。
主体和客体,DBMS为它们每个实例指派一个敏感度标记。
敏感度标记:绝密、机密、可信、公开。
主体的敏感度标记:许可证级别;客体的敏感度标记:密级。
DAC和MAC共同构成DBMS的安全机制
系统首先进行DAC检查,对通过检查的允许存取的数据库对象再进行DAC检查;
只有通过MAC检查的数据库对象方可存取;实现MAC首先要实现DAC;
第五章:数据库完整性
数据库完整性是指数据的正确性和相容性(selection)完整性检查的是不合语义的、不正确的数据;三大完整性一般由SQL的DDL语句来实现。
拒绝执行(NO ACTION)CASCADE
参照完整性:FOREIGN KEY(Sno) REFERENCES Student(Sno)
发生不一致时:拒绝操作/级联操作/设置为空值默认策略:拒绝执行。
数据库四中方法列举:①新奥尔良方法:规范化设计法②基于E-R模型的数据库设计方法:数据库概念设计阶段广泛采用的方法;③3NF的设计方法:逻辑阶段采用的方法
④
数据库设计的基本步骤:
①需求分析/阶段
②概念结构设计阶段/关键对用户需求进行综合、归纳与抽象形成独立于具体DBMS的概念模型。
E-R图
③逻辑结构设计将概念模型转化为某个DBMS所支持的数据模型(关系模型),并进行优化建立必要的视图形成数据的外模式。
④物理结构设计逻辑数据模型选取一个合适应用环境的物理结构(存储结构和存取方法)
⑤数据库实施建立数据库,编制与调试应用程序,组织数据入库,并进行试运行
⑥数据库运行和维护
调查的重点是“数据”和“处理”获得用户对数据库的如下要求:
①信息要求
②处理要求
③安全性与完整性要求
调查用户需求的具体步骤:
①调查组织机构的情况
②调查各部门的业务活动情况
③协助用户确定对新系统的各种要求,包括信息要求、处理要求、安全性与完整性要求。
④确定新系统的边界。
具体的调查方法:
①跟班作业
②开调查会
③请专人介绍
④询问
⑤设计调查表请用户填写
⑥查阅记录
(必考)数据流程图表达了数据和处理过程的关系。
在SA方法中,处理过程的处理逻辑常常借助判定表或判定书来描述。
系统中的数据借助数据字典DD来描述。
数据字典通常包括:数据项、数据结构、数据流、数据存储、处理过程。
设计概念结构的方法和步骤:自顶向下;自底向上;逐步扩张。
首先核心概念结构然后想外扩充。
混合策略:自顶向下和自底向上相结合:自顶向下策略设计一个全局概念结构的框架,以它为骨架集成由自底向上策略中设计的各局部概念结构。
自底向下进行分析,自底向上设计概念结构。