数据库原理与应用重要知识点总结
- 格式:doc
- 大小:68.00 KB
- 文档页数:5
数据库的原理与应用学什么一、数据库的原理数据库是现代计算机系统中重要的组成部分,为了更好地学习和应用数据库,我们需要先了解数据库的原理。
以下是数据库的原理要点:1.数据库的定义:数据库是一个按照一定规则存储、组织、管理和控制的数据集合。
它提供了持久化存储数据的能力,并支持对数据的高效访问和查询。
2.数据模型:数据库采用不同的数据模型来组织和表示数据。
常见的数据模型包括层次模型、网络模型、关系模型和面向对象模型。
其中,关系模型是最常用的数据模型,使用表格来表示数据,并通过关系代数和关系演算对数据进行操作。
3.数据库管理系统:数据库管理系统(DBMS)是用于管理数据库的软件系统。
它负责数据库的创建、维护、备份和恢复,并提供了数据的高效访问和查询接口。
常见的DBMS包括Oracle、MySQL和SQL Server等。
4.数据库的特性:数据库具有四个基本特性,即原子性、一致性、隔离性和持久性(ACID)。
原子性指数据库中的操作要么全部执行,要么全部不执行;一致性指数据库始终处于一致的状态;隔离性指不同的事务之间应该相互隔离,不互相影响;持久性指数据一旦提交到数据库中,就应该永久存储。
二、数据库的应用学什么数据库作为一种重要的数据管理工具,广泛应用于各个领域。
学习数据库的原理和应用对于提升我们的技能和竞争力具有重要意义。
以下是学习数据库的几个应用方面:1. 数据库设计与规范化数据库设计是数据库应用的基础,它涉及到如何合理地组织数据、定义表结构、确定关系和约束等。
学习数据库设计可以帮助我们更好地理解和抽象现实世界的数据,提高数据管理和查询的效率。
规范化是数据库设计中一个重要的概念,它通过分解关系表,消除冗余数据,提高数据存储的效率和数据操作的准确性。
学习规范化可以帮助我们设计出更加合理和高效的数据库结构。
2. 数据库查询与优化数据库查询是数据库应用中最常见的操作之一。
通过学习数据库查询语言(如SQL),我们可以实现多表联接、条件查询、聚合查询等功能,从而提取出我们所需的数据。
数据库原理及应用概念及重点数据库原理主要包括数据模型、数据库设计、数据存储和检索技术等方面。
数据模型是数据库的逻辑结构,它定义了数据的组织方式和之间的关系。
常见的数据模型包括层次模型、网状模型、关系模型和对象模型等。
其中,关系模型是目前应用最广泛的一种数据模型,它基于关系代数和谓词逻辑,用表格的形式来表示和操作数据。
数据库设计是指根据应用需求和数据模型设计数据库的结构和关系。
好的数据库设计能够提高数据的存储效率和查询性能,并降低数据冗余和数据不一致等问题。
在数据库设计中,需要考虑数据的完整性约束、主键和外键的定义、表的规范化等。
数据存储和检索技术是数据库原理中的重要内容。
数据存储技术主要指如何将数据存储到物理介质中,例如磁盘、固态硬盘等。
常见的存储结构包括堆文件、有序文件、哈希文件和索引文件等。
数据检索技术指根据用户的查询条件从数据库中检索出满足条件的数据。
查询优化是数据检索中的核心问题,它的目标是提高查询的效率和性能。
数据库应用包括关系数据库管理系统(RDBMS)的应用和非关系数据库的应用。
关系数据库管理系统是一种由软件实现的数据库管理系统,它提供了数据的存储、检索和管理功能,例如MySQL、Oracle、SQL Server 等。
非关系数据库则是指以非关系模型(如键值对模型、文档模型、图形模型等)来存储和管理数据的数据库系统,例如MongoDB、Redis等。
数据库在实际应用中具有广泛的应用场景和重要性。
首先,数据库可以用于存储和管理大量的结构化数据,例如企业的客户信息、订单信息、库存信息等。
它可以提供高效的数据存储和查询功能,方便用户进行数据分析和决策支持。
其次,数据库可以提供数据的共享与共同访问功能,多个用户可以通过网络同时访问和修改数据库,实现信息的共享和协同工作。
此外,数据库还可以进行数据备份和恢复,保证数据的安全性和可靠性。
总结起来,数据库原理及应用是计算机科学中的重要领域,它包括数据模型、数据库设计、数据存储和检索技术等方面。
湖北省考研计算机应用技术复习资料数据库原理与应用重点知识点整理数据库是现代计算机系统中非常重要的软件应用之一,也是计算机应用技术考研的重点内容之一。
掌握数据库原理与应用的相关知识点对于考生们顺利通过考试至关重要。
本文将针对湖北省考研计算机应用技术复习资料,对数据库的原理与应用进行重点整理。
一、数据库基本概念与常用术语1. 数据库的基本概念数据库是指按照数据结构来组织、存储和管理数据的仓库。
它可以用来存储并管理各种类型的数据,提供数据的快速访问和更新。
2. 数据库管理系统(DBMS)数据库管理系统是指对数据库进行管理和维护的软件系统。
常见的数据库管理系统有Oracle、MySQL、SQL Server等。
3. 数据库的常用术语- 数据:数据库中存储的基本单位,可以是文字、数字、图片等形式的数据。
- 数据库表:是由一组相关的数据组成的数据集合,用于存储一个特定的实体或概念。
- 字段:数据库表中的列,表示表中的一个属性。
- 记录:数据库表中的行,表示表中的一个实例或记录。
- 主键:用于唯一标识数据库表中的记录,确保数据的唯一性。
- 外键:用于建立表与表之间的关系,实现数据的关联操作。
二、关系数据库与SQL语言1. 关系数据库关系数据库是一种以表格形式组织数据的数据库,它通过表与表之间的关系来表示数据的联系。
关系数据库的最大特点是具有严格的数据一致性和完整性。
2. SQL语言SQL是结构化查询语言,是一种用于在关系数据库中进行操作的标准语言。
SQL语言包括数据查询、数据插入、数据更新、数据删除等操作,能够方便地对数据库进行管理和维护。
三、数据库设计与规范化1. 数据库设计原则- 数据库设计需符合实际业务需求,能够满足数据存储与操作的要求。
- 数据库设计应遵循一定的规范,提高数据库的运行效率和可靠性。
2. 数据库规范化数据库规范化是指将不符合规范的数据库设计进行调整,达到数据库结构合理、数据存储无冗余和一致性的要求。
数据库原理与应用湖北省考研复习重点梳理数据库原理与应用是计算机科学与技术专业考研的一门重要课程,该课程旨在让学生了解数据库的基本概念、原理和应用,以及掌握数据库的设计与管理技术。
在湖北省考研中,数据库原理与应用也是一个重要的考点。
为了帮助考生顺利复习,本文对数据库原理与应用的重点知识进行了梳理和总结。
一、数据库基本概念1. 数据库概述数据库的定义和特点,数据库管理系统的组成和作用。
2. 数据模型概念模型、逻辑模型和物理模型的概念及其关系,常用数据模型如关系模型、层次模型和网络模型。
3. 数据库系统的三级模式和数据独立性外模式、概念模式和内模式的定义和作用,数据独立性的概念和实现方式。
二、关系数据库1. 关系模型基本概念关系、属性、关系模式和关系数据库的定义,候选键、主键和外键的概念及其关系。
2. 关系代数与关系演算关系代数的基本运算和扩充运算,关系演算(元组关系演算和域关系演算)的基本操作和查询方式。
3. 关系数据库设计理论函数依赖的概念和性质,范式理论(1NF、2NF、3NF、BCNF、4NF、5NF)及其应用,关系数据库设计的各个阶段和方法。
三、SQL语言1. SQL语言的基本概念SQL的起源和发展,SQL语言的特点和分类。
2. 数据定义语言(DDL)CREATE、ALTER、DROP等操作的语法和使用方法,数据类型的定义和应用。
3. 数据操纵语言(DML)SELECT、INSERT、UPDATE、DELETE等操作的语法和使用方法,条件查询的语法和应用。
4. 视图和索引视图的定义和应用,索引的概念和创建方法,索引的优化和使用技巧。
四、数据库设计与管理1. 数据库设计的基本原则数据库设计的目标和准则,数据模型与数据库设计的关系。
2. 数据库设计的步骤和方法需求分析、概念设计、逻辑设计和物理设计的步骤和方法,数据库设计工具的使用。
3. 数据库管理系统数据库管理系统的架构和组成,数据库的创建与维护,数据完整性和安全性的保证。
数据库原理与应用重要知识点总结1.数据库的基本概念数据库是指存储、管理和组织数据的集合,它通过一系列的操作来实现对数据的有效管理和利用。
数据库管理系统(DBMS)则是对数据库进行管理的软件系统。
2.数据模型数据模型是描述数据库结构的方式,常见的数据模型有层次模型、网状模型和关系模型。
其中,关系模型在实际应用中应用最广泛。
3.关系模型关系模型通过表格的形式来表示数据,表格中的行表示记录,列表示字段。
表格之间可以建立关系,例如通过外键实现表格之间的关联。
4.数据库管理系统(DBMS)DBMS是对数据库进行管理和操作的软件系统,它提供了数据的存储、检索、更新和删除等功能。
常见的DBMS有MySQL、Oracle、SQL Server 等。
5.SQL语言SQL(Structured Query Language)是用于访问和管理关系数据库的语言,它包括数据定义语言(DDL)、数据查询语言(DQL)、数据操作语言(DML)和数据控制语言(DCL)等。
6.数据库设计数据库设计是指根据系统需求和功能要求,将现实世界中的实体和关系转化为数据库中的表格和关系的过程。
数据库设计需要考虑数据的完整性、安全性、可扩展性等方面。
7.关系数据库规范化关系数据库规范化是将数据库中的表格按照一定的条件和规则进行分解和重组的过程。
目的是减少数据冗余、提高数据的存储效率和查询性能。
8.数据库索引数据库索引是对数据库中的数据进行快速访问的数据结构,它可以提高查询效率。
常见的索引类型有B树索引、哈希索引和全文索引等。
9.数据库事务数据库事务是一系列的数据库操作,它要么全部完成,要么全部不完成。
事务具有ACID属性,即原子性、一致性、隔离性和持久性。
10.数据库安全性数据库安全性是指保护数据库中的数据免受恶意攻击和非法访问的能力。
数据库的安全措施包括用户认证、访问控制、数据加密等。
11.数据库备份与恢复数据库备份是指将数据库中的数据和结构以其中一种形式进行复制和存储,以防止数据丢失。
数据库原理与应用重点知识提纲第一章数据库系统概述(1)数据库、数据库管理系统、数据库应用系统的概念。
(2)数据描述与数据模型。
(3)理解层次模型、网状模型、关系模型的特点与优点。
(4)关系模型的基本概念:关系、元组、属性、属性值、值域、分量、关系的状态、关系模式、关系的键(候选键,主键、外键)与属性(主属性,非主属性)等。
(5)数据库内部体系结构中的三级模式结构。
概念模式,外模式,内模式。
(6)数据库系统内部体系结构中的两级映像。
术语:关系模式:是一种用于描述二维表格结构的表示方式,由关系模式和与该关系模式名相关联的属性名表组成。
其形式为:关系模式名(属性名1,属性名2,…,属性名n)。
关系模型:是一种用二维表格结构表示数据及数据之间联系的数据模型。
候选键:如果一个属性集能唯一地标识一个关系中的元组而又不含有多余属性,则称该属性值为该关系的候选键。
主键:是指当某个关系模式有多个候选键时,被用户选用的那个候选键。
外键:如果关系模式R1中的某属性集是另一个关系模式R2的主键,则该属性在关系模式R1中称为外键。
概念模式:是对数据库中全部数据的整体逻辑结构的描述,体现了全局、整体的数据观点,所以称为数据库的整体逻辑结构。
外模式:是表达用户使用观点和用到的那部分数据的逻辑描述,体现了应用程序员对数据库的数据观点。
内模式:是数据库在物理结构和物理存储方面的描述,规定了数据的内部记录类型、记录建起技术、文件的组织方式和数据控制方面的细节等。
简述:1.简述数据库与文件系统的区别。
学习指导P72.关系的主键有哪些特性?(唯一性、非冗余性,有效性)3.将数据库系统的体系结构设计成三级的意义是什么?第二章关系运算(1)了解笛卡尔积、关系的数学定义。
(2)理解基于传统集合理论的关系运算:并、交、差、广义笛卡尔积。
(3)理解关系代数特有的关系运算:投影、选择、商、联接、自然连接。
(4)掌握使用基本关系运算表示4种非基本关系运算的方法。
数据库原理与应用重点
数据库原理与应用的重点有以下几个方面:
1. 数据库的基本概念和体系结构:理解数据库的基本概念,包括数据的组织形式和结构,数据的模型和关系等。
掌握数据库的体系结构,了解数据库的层次结构、数据模型和数据库管理系统(DBMS)的功能。
2. 数据库的设计与规范化:学习数据库的设计原理和方法,掌握数据库设计的规范化过程,包括函数依赖、范式等概念,了解如何将现实世界的数据转化为数据库的结构。
3. 数据库查询语言:掌握SQL(Structured Query Language)
语言的基本原理和常用命令,包括数据的查询、插入、更新和删除等操作,了解SQL语言的高级特性,如连接查询、子查询、聚合函数等。
4. 数据库索引和性能优化:了解数据库索引的原理和作用,学习如何设计合适的索引以提高查询的性能。
了解数据库的性能优化技术,如查询优化、表分区、并发控制等,提升数据库的性能和并发能力。
5. 数据库事务和并发控制:了解数据库事务的概念和特性,学习数据库的并发控制和事务处理机制,包括锁机制、隔离级别等,确保数据库的一致性和可靠性。
6. 数据库安全和备份恢复:学习数据库的安全机制和控制方法,
了解数据库的权限管理和访问控制,保护数据库的安全性。
学习数据库的备份恢复技术,包括数据备份、日志恢复等,保障数据库的可用性和可靠性。
7. 分布式数据库和大数据处理:了解分布式数据库的原理和架构,学习分布式数据库的设计和管理方法,掌握大数据处理的基本概念和技术,包括分布式存储、分布式计算等。
以上是数据库原理与应用的重点内容,通过学习这些内容,可以全面掌握数据库的基本原理和应用技术,为实际的数据库设计、管理和应用提供支持。
数据库原理及应用考点
数据库原理及应用是计算机科学中的重要内容,涉及到数据库
的设计、管理和应用等方面。
以下是一些常见的数据库原理及应用
的考点:
1. 数据库基本概念,了解数据库的定义、特点和分类,例如关
系型数据库和非关系型数据库。
2. 数据库设计,掌握数据库设计的基本原则和方法,包括实体
关系模型(ERM)、关系模型(RM)等。
3. 数据库范式,了解数据库范式的概念和不同级别的范式(如
第一范式、第二范式、第三范式),以及它们的优缺点和应用场景。
4. SQL语言,熟悉结构化查询语言(SQL)的基本语法和常用
操作,包括数据查询、插入、更新和删除等。
5. 数据库索引,了解索引的作用和原理,以及如何选择和创建
索引来提高数据库的查询性能。
6. 事务管理,理解事务的概念和特性,熟悉事务的隔离级别和并发控制方法,如锁机制和多版本并发控制(MVCC)等。
7. 数据库安全,了解数据库安全的基本原则和措施,包括用户权限管理、数据加密和备份恢复等。
8. 数据库性能优化,熟悉常见的数据库性能优化技术,如查询优化、索引优化、表设计优化和硬件优化等。
9. 数据库备份与恢复,了解数据库备份和恢复的方法和策略,包括全量备份、增量备份和事务日志等。
10. 数据库应用开发,掌握使用编程语言与数据库进行交互的方法,如连接数据库、执行SQL语句和处理结果等。
这些考点涵盖了数据库原理和应用的核心概念和技术,掌握这些知识可以帮助您设计和管理高效、安全的数据库系统,并进行相关的应用开发。
数据库原理与应用重要知识点总结三级模式模式:模式又称逻辑模式,是数据库中全体数据的整体逻辑结构和特征的描述。
是所有用户的公共数据视图。
外模式:外模式又称为子模式或用户模式,是数据库用户能看见和使用的局部数据的逻辑结构和特征的描述。
是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。
内模式:内模式又称存储模式,是数据物理结构和存储方式的描述。
是数据在数据库内部的表示方式。
两级映像外模式/模式映像:对于每一个外模式,数据库系统都有一个外模式/模式映像,它定义了该外模式与模式的对应关系。
当模式改变时,由数据库管理员对各个外模式/模式映像做相应的修改,可以使外模式不变,保证了数据与程序的逻辑独立性——数据的逻辑独立性。
模式/内模式映像:一个数据库只有一个模式,也只有一个内模式。
这一映像是唯一的,用于定义数据全局逻辑结构与存储结构之间的对应关系。
当数据库存储结构改变时,由数据库管理员对模式/内模式映像做相应的修改即可,可以使模式保持不变,从而应用程序也不必改变,保证了数据与程序的物理独立性——数据的物理独立性。
存取控制机制:定义用户权限,并将用户权限存入数据字典中(这些定义被称为安全规则或授权规则)。
权限即用户对某一数据对象的操作权力。
合法性检查,当用户发出存取数据库操作的请求后,DBMS查找数据字典,根据安全规则进行合法性检查,若用户的请求超出了定义的权限/密级/角色,系统将拒绝执行此操作。
视图机制:视图--虚表--导出表为不同用户定义不同的视图,把数据对象限制在一定的范围。
通过视图机制把要保密的数据对无权操作的用户隐藏起来。
审计系统提供的一种事后检查的安全机制。
建立审计日志,用以记录用户对数据库的所有操作。
检查审计日志,找出非法存取数据的人、时间和内容。
审计很浪费时间和空间,主要用于安全性要求较高的部门。
RBAC(基于角色的存取控制)role-based access control特点:由于角色/权限之间的变化比角色/用户关系之间的变化相对要慢得多,减小了授权管理的复杂性,降低管理开销。
数据库原理与应用课程总结第一部分基础理论一、与数据库有关的4个重要概念和1个常识1、数据2、数据库3、数据库管理系统DBMS是位于用户与操作系统之间的一层数据管理软件,为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。
主要功能:数据定义、数据操纵、数据运行管理(4性)DBMS总是基于某种数据模型,可以分为层次型、网状型、关系型、面向对象型DBMS。
4、数据库系统结构组成与人员组成、理解图1.1数据库技术:是一门研究数据库结构、存储、管理和使用的软件学科。
数据库应用系统5、一个常识(1)三个阶段每个阶段的优缺点(2)理解数据库系统的特点(数据结构化、数据的共享性、冗余度低以及数据的独立性、数据的统一管理和控制)二、数据模型1、计算机信息处理的三大世界、两类模型(概念模型、结构模型),理解计算机信息处理的基本步骤。
2、数据模型(结构模型)的三要素(逻辑模型)3、概念模型(结合数据库概念设计理解)(1)特点(2)基本概念(实体、属性、码、实体型、实体集、联系及联系方式)(3)表示方法 ER模型(画法)4、常用的模型(数据结构化的基础)(1)层次、网状和关系(2)每种模型的数据结构、数据操作、约束和存取特点。
(3)重点在关系模型(详细见第2章)数据结构(从用户的观点:二维表)常用术语:关系、元组、属性、主码、关系模式关系模式的表示方法关系模型必须是规范化的数据操纵与完整性关系数据模型的存储结构优缺点三、数据库系统结构1、不同的角度(从数据库管理系统和从最终用户)2、三模式(模式、外模式和内模式)3、二级映象与数据独立性4、重要概念(模式、外模式、内模式、数据的逻辑独立性与物理独立性)四、关系数据库及其操作1、关系模型的数学依据(建立在集合代数的基础上)2、从集合论的角度谈关系数据结构(笛卡儿积的子集)3、关系及关系操作(1)关系数据结构及其有关定义(域、笛卡儿积、关系、关系模式、关系数据库)(2)关系操作:查询操作和更新查询操作:关系代数查询、关系演算和具有双重特点的SQL4、关系的完整性5、关系代数传统的集合运算、专门关系运算(投影、选择、连接和除法运算)、关系代数的写法(注意3个问题、7个例题)、关系优化。
数据库原理与应用重要知识点总结三级模式模式:模式又称逻辑模式,是数据库中全体数据的整体逻辑结构和特征的描述。
是所有用户的公共数据视图。
外模式:外模式又称为子模式或用户模式,是数据库用户能看见和使用的局部数据的逻辑结构和特征的描述。
是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。
内模式:内模式又称存储模式,是数据物理结构和存储方式的描述。
是数据在数据库内部的表示方式。
两级映像外模式/模式映像:对于每一个外模式,数据库系统都有一个外模式/模式映像,它定义了该外模式与模式的对应关系。
当模式改变时,由数据库管理员对各个外模式/模式映像做相应的修改,可以使外模式不变,保证了数据与程序的逻辑独立性——数据的逻辑独立性。
模式/内模式映像:一个数据库只有一个模式,也只有一个内模式。
这一映像是唯一的,用于定义数据全局逻辑结构与存储结构之间的对应关系。
当数据库存储结构改变时,由数据库管理员对模式/内模式映像做相应的修改即可,可以使模式保持不变,从而应用程序也不必改变,保证了数据与程序的物理独立性——数据的物理独立性。
存取控制机制:定义用户权限,并将用户权限存入数据字典中(这些定义被称为安全规则或授权规则)。
权限即用户对某一数据对象的操作权力。
合法性检查,当用户发出存取数据库操作的请求后,DBMS查找数据字典,根据安全规则进行合法性检查,若用户的请求超出了定义的权限/密级/角色,系统将拒绝执行此操作。
视图机制:视图--虚表--导出表为不同用户定义不同的视图,把数据对象限制在一定的范围。
通过视图机制把要保密的数据对无权操作的用户隐藏起来。
审计系统提供的一种事后检查的安全机制。
建立审计日志,用以记录用户对数据库的所有操作。
检查审计日志,找出非法存取数据的人、时间和内容。
审计很浪费时间和空间,主要用于安全性要求较高的部门。
RBAC(基于角色的存取控制)role-based access control特点:由于角色/权限之间的变化比角色/用户关系之间的变化相对要慢得多,减小了授权管理的复杂性,降低管理开销。
灵活地支持企业的安全策略,并对企业的变化有很大的伸缩性。
强制存取控制MAC mandatory access control强制存取控制是通过对敏感度标记进行控制的。
定义:每一个数据对象都被标以一定的密级,每一个用户也被授予某一级别的许可证,对于任意一个对象,只有具有合法许可证的用户才可以存取。
特点:严格,不是用户能够直接感知或进行控制的。
适用性:对数据有严格而固定密级分类的部门——军事部门,政府部门。
敏感度标记:绝密、机密、可信、公开仅当主体的许可证级别大于或等于客体的密级时,该主体才能读取相应的客体。
仅当主体的许可证级别小于或等于客体的密级时,该主体才能写相应的客体。
自主存取控制discretionary access control定义:用户对不同的数据库对象有不同的权限,不同的用户对同一数据对象也有不同的权限,而且用户还可以将其拥有的存取权限转授给其他用户。
特点:非常灵活权限控制三要素:用户、数据库对象、操作类型数据库安全性:保护数据库以防止不合法的使用所造成的数据泄漏、更改或破坏。
实现数据库安全性控制的常用方法和技术用户身份鉴别:静态口令鉴别、动态口令鉴别、生物特征鉴别、智能卡鉴别存取控制视图机制审计数据加密SQL的特点1.综合统一2.高度非过程化3.面向集合的操作4.以同一种语法结构提供两种使用方式(既是自含式语言,又是嵌入式语言)5.语言简单,易学易用SQL的功能和组成:DDL(data definition language)数据定义语言:数据定义功能DML(data manipulation language)数据操纵语言:数据查询、数据更新功能DCL(data control language)数据控制语言:数据控制功能数据库完整性是指数据的正确性和相容性1.实体完整性:主码唯一且主属性不为空值2.参照完整性:外码或为空,或为对应主码的某个值3.用户定义完整性:针对某一具体应用所涉及的数据必须满足的约束条件DBMS的完整性控制机制应具有哪三方面的功能1.定义功能2.检查功能3.违约处理功能触发器定义:触发器是提供给程序员和数据分析员来保证数据完整性的一种方法。
一个触发器有三部分组成:事件、条件、动作NoSQL数据库:键值数据库:Riak、Redis、Memcached、Amazon’s Dynamo、Project Voldemort主要应用GitHub(Riak)、BestBuy(Riak)、Twitter(Redis和Memcached)、StackOverFlow(Redis)、Instagram(Redis)、Youtube(Mencached)、Wikipedia(Memcached)列存储数据库:Cassandra、Hbase、Hypertable、Amazon SimpleDB主要应用Ebay(Cassandra)、Instagram(Cassandra)、NASA(Cassandra)、Twitter(Cassandra and Hbase)Facebook(Hbase)、Yahoo!(Hbase)文档型数据库:MongoDB、CouchDB、RavenDB、OrientDB、Terrastore主要应用:SAP(MongoDB)、Codecademy(MongoDB)、Foursquare(MongoDB)、NBC News(RavenDB)图形数据库:Neo4J、InfoGrid、Infinit Graph、OrientDB、HyperGraphDB、FlockDB主要应用Adobe(Neo4J)、Cisco(Neo4J)、T-Mobile(Neo4J)事务是用户定义的一个数据库操作序列,这些操作要么全做,要么全不做,它们是一个不可分割的工作单位。
原子性atomicity:事务是数据库的逻辑工作单元,事务中包括的诸操作要么都做,要么都不做,不可分割。
一致性consistecy:事务的执行结果必须使数据库从一个一致性状态转变到另一个一致性状态。
隔离性isolation:一个事务的执行不能被其他事务干扰。
持续性durability:一个事务一旦提交,它对数据库中数据的改变就应该是永久的,接下来的其他操作或故障不应该对其执行结果有任何影响。
ACID故障的种类:事物内部故障、系统故障——软故障、介质故障——硬故障、计算机病毒事物内部故障:余额不足运算溢出并发事务发生死锁违反完整性约束系统故障:造成系统停止运行的任何事件,系统必须重新启动1.特定类型的硬件错误2.CPU故障3.操作系统故障4.DBMS代码错误5.停电介质故障:系统外存故障,破坏性最大1.磁盘损坏2.磁头碰撞3.瞬间强磁场干扰计算机病毒:是一种人为的故障或破坏1.破坏数据2.破坏系统故障对数据库的影响:1.数据库本身的破坏,数据不可访问。
介质故障、病毒2.数据库可以访问,但数据不正确。
事物内部故障、系统故障、病毒数据库恢复技术把数据库从错误状态恢复到某一已知的正确状态的功能叫数据库恢复恢复的基本原理:数据冗余*如何建立冗余数据1.数据转储:由DBA定期地将整个数据库复制到磁带或另一磁盘上的过程2.登记日志文件日志文件:记录事务对数据库更新操作的文件。
存储过程存储过程是指存储在服务器上的一组预编译的SQL语句,它是封装重复任务操作的一种方法。
存储过程的作用:允许模块化的程序设计更快的执行速度有效降低网络流量较好的安全机制ODBC 开放数据库连接Open DataBase Connectivity微软公司开发的标准的接口协议,包括数据通信方法、数据传输协议、DBMS等多种技术,允许应用程序以SQL为数据存储标准,来存取不同的DBMS管理的数据。
1.并发操作可能带来数据的不一致性——丢失修改——不可重复读——读“脏”数据产生数据不一致性的主要原因是并发操作破坏了事务的隔离性。
解决办法:封锁,即给事务加锁(1)排它锁(Exclusive Locks,X锁,写锁)若事务T对数据对象A加上X锁,则只允许T读取和修改A,其他任何事务都不能再对A加任何类型的锁,直至T释放A上的X锁。
(2)共享锁(Share Locks,S锁,读锁)若事务T对数据对象A加上X锁,则事务T可以读取A但不能修改A,其他事物只能对A加S锁,而不能加X锁,直至T释放A上的S锁。
封锁协议一级封锁协议:事务T在修改数据R之前必须先对其加X锁,直至事务结束才释放。
——防止丢失修改二级封锁协议:在一级封锁协议基础上,若事务T在读取数据R之前必须先对其加S锁,读完后即可释放。
——防止丢失修改,还可以防止读“脏”数据三级封锁协议:在一级封锁协议基础上,若事务T在读取数据R之前必须先对其加S锁,直至事务结束才释放——防止丢失修改及读“脏”数据,还可以防止不可重复读活锁:如果事务T1封锁了数据R,事务T2又请求封锁数据R,于是T2等待;接着T3、T4也请求封锁数据R,T3、T4也等待;当T1释放了R上的锁之后,系统首先批准了T3,T3释放了R上的锁之后,系统接着批准了T4,T2仍然等待,这种现象即活锁。
预防办法:等待队列中的元素出队策略采取先来先服务策略。
死锁:如果事务T1封锁了数据R1,事务T2封锁了数据R2;然后T1又申请封锁R2,于是T1等待;接着T2又申请封锁R1,于是T2也等待;……,造成两个事务无限等待,这种现象即死锁。
预防办法:在有多个封锁数据对象时,可采取一次封锁法、顺序封锁法。
死锁的诊断:超时法、等待图法死锁的解除:如果发生了死锁,则选择处理死锁代价最小的事务,将其撤销,释放此事务持有的所有的锁,使其它事务得以继续运行下去。
并发事务正确性的准则____可串行性___。
什么样的并发调度是正确的调度?可串行化的调度室正确的调度。
可串行化的调度的定义:多个事务的并发执行是正确的,当且仅当其结果与按某一次序串行地执行它们时的结果相同,称这种调度策略为可串行化的调度。
两段锁协议:1.在对任何数据进行读、写操作之前,首先要申请并获得对该数据的封锁;——扩张阶段2.在释放一个封锁之后,事务不再申请和获得任何其他封锁。
——收缩阶段封锁粒度:封锁对象的大小多粒度封锁:在一个系统中同时支持多种封锁粒度供不同事务选择意向锁:如果对一个结点加意向锁,则说明该结点的下层结点正在被加锁;对任一结点加锁,必须先对它的上层结点加意向锁。
封锁冲突检查:不需检查其下层结点上的锁。
X锁与任何其它类型的锁都不相容,如果数据对象被加上X锁,后裔结点不可能被以任何锁的形式访问,因此XIS 锁没有意义。
完整性约束是否能够保证数据库在处理多个事务时处于一致状态?答:完整性约束能保证操作后的数据满足某种约束条件,并不能使多个事务被正确的调度,无法保证数据库处于一致状态。