第11章 数据库设计
- 格式:doc
- 大小:475.78 KB
- 文档页数:13
国开学习网电大数据库应用技术第11章测验答案以下是对国开研究网电大数据库应用技术第11章测验的答案:1. 数据库事务具有ACID特性,即原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)和持久性(Durability)。
3. 数据库的并发控制机制包括两阶段封锁(Two-Phase Locking)、时间戳(Timestamp)和多版本并发控制(MVCC)。
4. 数据库索引是一种用于加快数据访问速度的数据结构。
常见的索引类型有B树索引、哈希索引和位图索引。
5. 在数据库设计中,关系模型用于描述数据之间的关联关系。
关系模型包括实体(Entity)、属性(Attribute)和关系(Relationship)。
6. SQL(Structured Query Language)是一种用于管理关系型数据库的编程语言。
SQL可以用于创建、查询和操作数据库中的数据。
7. 数据库触发器(Trigger)是一种在特定事件发生时自动执行的程序。
触发器可以用于实现数据的自动更新和完整性约束。
8. 数据库备份是一种用于保护数据免受数据丢失的措施。
常见的数据库备份方式包括完全备份、增量备份和差异备份。
9. 数据库性能优化是一种通过优化数据库结构和查询语句,提高数据库查询性能和响应速度的方法。
常见的优化手段包括索引优化和查询优化。
10. 数据库安全性是指保护数据库免受非法访问和数据泄露的一种措施。
常见的数据库安全措施包括访问控制、加密和审计。
以上就是对国开研究网电大数据库应用技术第11章测验的答案。
如有其他问题,请随时咨询。
编号:版本:状态:密级:分发号:XXX数据库设计说明编制/日期:审核/日期:标审/日期:会签/日期:批准/日期:XX科技有限公司XXXX年X月文档修订记录目录1范围 (1)1.1标识 (1)1.2数据库概述 (1)1.3文档概述 (1)2引用文档 (1)3数据库级设计决策 (2)4数据库详细设计 (3)4.X(数据库设计级别的名称) (3)5用于数据库访问或操纵的软件单元详细设计 (5)5.X(软件单元的唯一标识符,或者一组软件单元的标志符) (6)6需求可追踪性 (8)7注释 (9)1范围1.1标识【注释:本条应描述本文档所适用的系统和软件(数据库)的完整标识,(若适用)包括其标识号、名称、缩略名、版本号和发布号。
】1.2数据库概述【注释:本条应简要描述本文档所适用数据库的用途。
它还应描述数据库的一般特性;概述其开发、使用和维护的历史;标识项目的投资方、需方、用户、开发方和保障机构等;标识当前和计划的运行现场;列出其他有关文档。
】1.3文档概述【注释:本条应概述本文档的用途和内容,并描述与它的使用有关的安全保密方面的要求。
】2引用文档【注释:本章应列出引用文档的编号、标题、编写单位、修订版及日期,还应标识不能通过正常渠道得到的文档的来源。
】3数据库级设计决策【注释:本章应根据需要分条给出数据库级设计决策,即数据库的行为设计决策(忽略其内部实现,从用户角度出发描述数据库将怎样运转以满足需求)以及其他影响数据库进一步设计的决策,并给出决策理由。
如果决策在系统需求或软件需求中均是明确的,本章应如实陈述。
针对关键性需求(例如对安全性或保密性需求)的设计决策,应在专门的章条中加以叙述。
如果设计决策依赖于系统状态或方式,应指明这种依赖关系。
如果部分或全部设计决策在用户的或商用的数据库管理系统(DBMS)中进行了描述,本章可以直接引用。
本章应给出或引用需要了解的设计约定。
数据库级设计决策的例子如下:a) 关于数据库将接收的查询或其他输入以及它将产生的输出(显示、报表、消息、响应等)的设计决策,包括与其他系统、硬件、软件及用户的接口(本文档的5.X.d条指出这项说明应考虑的主题)。
数据库技术的发展1.1 数据库技术发展阶段(1)第一代数据库系统第一代数据库管理系统是指层次模型数据库系统和网络模型数据库系统。
层次模型数据库包括:IMS,System 2000,TDMS等网络模型数据库包括:CODASYL下属的DBTG(2)第二代数据库系统第二代数据库系统是指支持关系模型的关系数据库系统数据库的关系模型是由IBM研究实验室的研究员E.F.Codd于1970年提出的。
(3)第三代数据库系统第三代数据库系统是指把面向对象技术与数据库技术相结合的系统,又称新一代数据库系统。
第三代数据库系统的三条原则:支持更加丰富的对象结构和规则;包含第二代DBMS;对其他子系统开放。
1.2 数据库系统体系结构1.21 集中式数据库系统集中式数据库系统是指运行在一台计算机上,不与其他计算机系统交互的数据库系统,所有的DBMS功能,应用程序的执行和用户界面处理都在一个机器上进行。
一般人们把使用计算机的方式分为两类:单用户系统和多用户系统。
一个典型的多用户系统有更多的磁盘和更多的存储器,可以有多个CPU,并且有一个多用户操作系统。
为个人计算机这样的单用户系统设计的数据库系统一般不提供多用户数据库系统所提供的许多特性。
1.22 分布式数据库系统体系结构(1)分布式数据库系统的概念一个分布式数据库系统包含一个结点的集合,这些结点通过某种类型的网络连接在一起。
其中,每一个结点是一个独立的数据库系统结点,这些结点协调工作,使得任何一个结点上的用户都可以对网络上的任何数据进行访问,就如同这些数据都存储在用户自己所在的结点上一样。
分布式系统的所有问题是内部的,实现级别的问题,而不是外部的,用户级别的问题。
(2)分布式数据库系统的特点提供了不同透明度层次的分布式数据库管理增加了可靠性和可用性提高了性能:将数据存储在最靠近他且频繁使用的地方的方法来对数据库进行分片。
大型数据库分布在多个站点上,而使每个站点上都存在较小型的数据库,这对性能的提高有很大帮助。
第11章 数据库设计
讲授内容: 附加内容:
11.1 数据库概述
11.2 需求分析 11.3
概念设计 11.4 逻辑设计 11.5 物理设计
学习要点 家庭作业
英文课件/Lecture Notes 1
,
2
11.1 数据库概述
一、 信息社会与数据库
信息社会与企业信息化
信息成为社会的重要资源;
社会构架逐步从“金字塔式”向“网络化”过渡; 组织/企业动态化、边界模糊化,企业信息化:
虚拟企业(Virtual Organization/Enterprise ):
根据需要把优势互补的企业(合作伙伴)联合起来,以最有效、最经济的方式参与市场竞争、迅速响应瞬息万变的市场需求,提高竞争力。
企业信息化:
指企业如何与环境相协调,开发、利用好信息资源,使生产经营活动借助于信息的及时处理、顺畅流通而高质量、高效率的运作。
企业信息化的根本任务:
建立企业集成信息系统(EIIS )。
数据中心原理
人们的认知过程:
组织/企业动态化、边界模糊化,企业信息化:
James Martin 80年代提出;
企业集成信息系统应以数据为中心:数据类是相对稳定的;处理是多变的;集成化的数据环境。
数据规划、数据库设计&管理成为重点、难点;
西方企业中的重要角色:- CIO (Chief Information Officer ) - DA (Data Administrator ) - DBA
二、数据库的生命周期
生命周期
各阶段主要工作
规划(Planning)
应用范围确定,应用环境分析
投资估算,风险/效益分析
数据标准化工作(信息分类与编码)
DBMS及其支撑环境的规划、选择与配置
人员的培训与配备
设计(Design)
定义需求
数据建模
设计模式(外、逻辑、内)
设计完整性约束
设计典型应用
建立(Build)
DBMS
实现(数据模式、完整性约束、安全模式)
加载数据
应用培训
管理&维护(Administration & Maintenance)
性能监视,DB
调整
日常管理与维护(安全、完整性、备份与恢复)DB重组(Reorganization)
扩充&重构(Extending & Restructuring)
DB扩充
DB重构
三、数据库设计
任务与目标
任务:
的特点,设计出满足要求的数据模式(外模式、逻辑/概念模式、内模式)及典型应用。
目标:
方法与特点
方法:面向数据的方法-----信息工程方法(IEM):
业集成信息系统的基础。
特点:
过程与步骤
(见教材P231图11-1)
需求分析(Requirements Analysis)
定义需求规格说明
构造元数据纲目库(Metadata Repository)
概念设计(Conceptual Design)
数据建模(E/R)
逻辑设计(Logical Design)
模式转换(E/R to Relational)
模式规范化
完整性约束设计
外模式设计
典型应用设计
物理设计(Physical Design)
内模式设计
(TOP)
11.2 需求分析
一、分析的过程
Source: Oracle CASE*METHODTM 二、提交的成果
需求规格说明
:
初步的实体/联系图(E/R)
业务功能层次图(BFH
)
功能/实体、功能/业务单位、实体/
业务单位矩阵
数据流图(DFD
)
数据分布、约束、输出格式需求
数据量,功能使用频率,用户期望性能
各种策略:审计,控制,后备/恢复,转换,etc.
元数据纲目库:
对每个数据:
数据名
类型/长度
编码规则
更新要求
使用频率
数据量
语义约束
保密要求
11.3 概念设计
一、概述
任务
数据建模 / 企业建模。
技术
实体/联系建模(E/R Modeling)。
方法
集中式模式设计法(Centralized Schema Design Approach):
视图集成法(View Integration Approach):
二、视图集成
步骤
确认视图中的对应(“同一”)与冲突(“矛盾”)
命名冲突
概念冲突
域冲突
约束冲突
修改视图,解决部分冲突
修改视图,以尽可能地调和视图间的各种“冲突”
合并视图,形成全局模式(Global Schema)
合并各视图中的对应部分、保留特殊部分、删除冗余部分,力求使全局模式简明清晰
视图合并集成的策略
(TOP)
11.4 逻辑设计
一、概述
任务
设计数据库的逻辑(概念)模式和外模式。
技术
E/R
数据模式向关系数据模式转换;
关系模式规范化(已学过);
模式调整;
外模式设计。
二、E/R向关系转换
基本规则:
实体的转换:
模式及属性的命名:易读、好记。
e.g. 合同的关系模式:
contract(code, name, first-part, second-part, sign-date, total-price, …)
ht(bm, mc, jf, yf, qdrq, zj, …)------不好!
属性域的处理:
非原子属性的处理:
键的处理:
弱实体的处理:
联系的转换:
1:1联系:
1:N联系:
M:N联系:
M:N:P联系:
三、关系模式的规范化(已学过)
四、模式的调整
为改善DB性能的调整:
减少连接运算:
减小表的大小:
尽可能使用快照(Snapshot):
为节省存储空间的调整:
减少属性的长度:
用替身(Dummy)属性减少重复数据所占的存储空间: e.g.
五、外模式的设计
局部E/R数据模式(即用户视图)。
[例] E/R to Relational
(TOP)
11.5 物理设计
一、概述
设计数据库的内模式(即存储模式)。
目的是:
(1)提高DB的性能;(乃主要目的!)
(2)有效地利用存储空间。
技术
存储机制的选择:Array有四种选择:
无簇表:(1) 表和(2) 索引的表
簇表:(3) 散列簇表和(4) 索引簇表
分区设计:Array
数据在多个磁盘上合理分布,以合理地安排I/O,从而提高DB性能。
二、 存储机制的选择
索引的选择:
建立:一般地,PK 及UNIQUE 属性列上的索引是DBMS 自动建立的; 其他属性列上的索引需用户(一般是DBA )手工建立。
使用:索引的使用由DBMS 自动决定,即对用户是透明的。
下列情况,宜在有关属性列上建索引:――即用(2)索引的表
常用来连接(Join )相关表的列上宜建索引。
常用的连接是通过PK/FK 来实现的,PK 列上DBMS 自动建立了索引,因此,最好在FK 列上也建索引(假如对FK 列的更新不是太频繁的话)。
以读为主的表,其常用查询涉及的列上宜建索引。
(假如范围查询满足条件的行数≤20%表行,等值查询满足条件的行数≤5%表行;且条件不是IS NOT NULL
的话)。
对只需访问索引块而不需访问数据块的查询是常用查询的表,其相应列上宜建索引。
(1)查询某属性值的MIN, MAX, AVG, SUM, COUNT 等组函数值,且无GROUP BY 子句;
(2) 查询某属性值EXISTS 或NOT EXISTS 。
下列情况,不宜在有关属性列上建索引:
很少出现在查询条件中的列。
(没意义)
属性值很少的列。
(没必要)
太小的表。
(没必要)
属性值分布严重不均匀的列。
(反而不如全表扫描)
经常频繁更新的表/列。
(系统维护索引的开销太大)
过长的列。
(如:Oracle 规定不能在LONG 或LONG RAW 类型的列上建索引)
簇集的选择:
建立:簇集的建立需用户(一般是DBA )手工完成。
使用:簇集的使用由DBMS 自动决定,即对用户是透明的。
(实际中常用散列簇集,较少用索引簇集)。
下列情况,宜在有关属性列上建簇集:
更新较少的表,且对其只进行等值查询时,宜建散列簇集。
――即用(3)
散列簇表
更新较少的表,且对其既进行等值查询又进行范围查询时,可建索引簇集。
――即用(4)索引簇表
下列情况,不宜在有关属性列上建簇集:
频繁更新的表,则宁可用普通的表。
更新较少的表,但对其只进行范围查询时,则宁可用索引的表。
三、分区设计的原则
水平分割关系,以减少访盘冲突、提高I/O并行性。
分散热点数据(Hot Spot Data),均衡I/O
负荷。
保证关键数据(e.g. DD
)的快速访问,缓解系统瓶颈。
实际系统中,如何简单地实现分区设计?
------一个DB可被划分为一个或多个称表空间(Table Space)的逻辑存储单元,一个表空间所对应的一个或多个数据文件(Data File)可物理存储于不同的磁盘上。