第1章数据仓库的基本概念
- 格式:ppt
- 大小:553.50 KB
- 文档页数:58
《数据库基础与应用》课程标准适用专业:计算机应用层次: ________________ 史专________________ 授课形式:____________ 全日制 ________________ 课程性质:专业必修课学时数: ________________ 64 ______________《数据库基础与应用》课程标准一、适用对象适用于全日制中专计算机应用专业学生二、课程性质与定位《数据库基础与应用》课程是计算机应用专业的一门专业必修课。
数据库系统已成为计算机科学教育中必不可少的部分,因而,牢固地掌握数据库系统知识已成为我们日常学习的核心内容。
信息时代的计算机应用人才,应当熟练掌握计算机科学技术中的数据库技术,并能够根据实际需求应用数据库系统进行数据信息管理。
数据库是数据管理的最新技术,是计算机学科的重要组成部分。
数据库技术发展迅速,其应用早已超出计算机专业的范畴,各专业领域的人们都在学习和使用数据库。
根据数据库的发展情况,本书摒弃了以往教材中不可缺少的网状数据库和层次数据库两大内容,以关系型数据库管理系统作为实例。
三、课程教学目标通过本课程的理论学习和上机实验,使学生了解现在数据库的流行趋势和先进的知识;初步掌握数据库管理系统的基本原理,数据库的基本设计方法;掌握一种流行数据库系统的基本操作方法和编程技术;重点培养学生数据库应用系统软件开发的技术和能力。
四、本课程学时安排五、课程教学内容和基本要求(按章节详细阐述)第一章:数据库概述(一)教学重点和难点1.教学重点:数据库和数据模型的基本概念数据模型的三要素概念模型的表示方法数据库技术的发展过程与研究领域数据库系统的模式结构与体系结构DBMS的功能与组成2.教学难点:数据库和数据模型的有关概念、数据库技术的发展与研究领域以及数据库系统的结构。
(二)教学内容和基本要求1.教学内容:1.1引言1.1.1数据、数据库、数据库系统和数据库管理系统的基本概念1.1.2数据管理的进展1.1.3数据库技术的研究领域1.2数据模型1.2.1数据模型的三要素1.2.2概念模型1.2.3三种主要的数据模型1.3数据库系统的结构1.3.1数据库系统的模式结构1.3.2数据库系统的体系结构1.3.3数据库管理系统2.教学目的及要求:本章主要讲述了数据库的有关概念,通过本章的学习,读者应该理解数据库的基本概念、数据库的三级模式结构和二级映像功能;知道数据模型的三要素,会画E-R图。
管理系统中计算机应用考试分析考试结构考试试卷对不同能力层次要求的试题所占的比例大致是:“识记”为30%;“领会”为40%;“简单应用”为20%;“综合应用”为10%。
试题难易程度合理,可分为四档:易、较易、较难、难,这四档在试卷中所占的比例约为3:4:2:1。
考试方式考试方式为闭卷,笔试,考试时间为150分钟。
评分采用百分制,60分为及格。
题型如图:考试题型及分值:题型题量分值总分单选30130名词解释5315简答题5525应用题31030考试技巧真题分值及分布情况:➢重点章节:第四、五、六、七章,分值占比超过40%;➢一般章节:第一、二、三、八,九章;➢关于第十章,仅做了解考试技巧1.单项选择题考察知识点:基本概念、基本思想、基本原理;特点:各个章节均匀分布,一般3-4题/章节备考策略:依据大纲,复习仔细,多做题,多刷题考试技巧2.名词解释题考察知识点:基本概念“是指”、“所谓”、“就是”、“称为”、…特点:不完全是教材中直白的概念,需要理解。
考试技巧3.简答题考察知识点:基本是教材中的某个知识点,题干都是教材中的一句话。
范式,范式的分解,SQL语句考试技巧4.应用题特点:分值最高,失分最容易、学员反应最难的部分考察知识点:ER图绘制,与关系模式的转换范式及分解,主码,外码,SQL语句操作完善数据流图,控制结构图,U/C矩阵决策树和决策表【备考要点】:一定要多练,多做考试技巧1、按照题目顺序做VS 先完成大分值,再完成小分值;2、先做容易,再做难的;3、难题攻克:找到题目主题,结合日常经验灵活解答。
注意:1、不要空题,特别是大分值题目;2、没有把握的选择题可以用排除法解答;3、题目顺序一般和章节顺序对应;4、历年真题要做熟,做会,弄懂。
考试方法1、选择题:题干法、排除法,不要花费过多时间。
2、填空题:熟记知识点,重点掌握近几年填空题出现的知识点。
3、名称解释题:要点是否展开,注意逻辑性和答题要点及逻辑。
数据仓库与数据分析第一、二、三章一、数据处理的类型:1、操作型处理:操作型处理主要完成数据的收集、整理、存储、查询和增、删改操作等,主要由一般工作人员和基层管理人员完成。
2、分析型处理:分析型处理是对数据的再加工,往往要访问大量的历史数据,进行复杂的统计分析,从中获取信息,因此也称为信息型处理,主要由中高级管理人员完成。
操作型数据处理:二、联机事务处理系统(OLTP)的主要功能:对事务进行处理,快速地响应客户的服务要求,使企业的业务处理自动化。
其主要性能指标是事务处理效率和事务吞吐率,每个事务处理的时间越快越好,单位时间能完成的事务数量越多越好。
三、dbms:数据库管理系统。
Dwms:数据仓库管理系统。
OLAP:联机分析处理。
Oltp基于db,olap基于dw。
四、事务:用户定义的一个数据库操作序列,这些操作要么全做、要么全不做,是一个不可分割的工作单元。
在关系数据库中,一个事务可以是一条SQL语句、一组SQL语句或整个程序。
五、事务的ACID性质:1、原子性:事务是一个逻辑工作单元,是一个整体,是不可分割的。
2、一致性:事务在完成时,必须使所有的数据都保持一致状态。
3、隔离性:事务并发执行也能保持原子性和一致性,则是事务的隔离性。
4、持久性:一旦事务成功完成,该事务对数据库所施加的所有更新都是永久的。
六、决策支持系统(DSS):分析型数据处理的典型。
决策支持系统需要具备的基本功能是建立各种数学模型,对数据进行统计分析,得出有用的信息作为决策的依据和基础。
DSS对数据集成的迫切需要是数据仓库技术出现的最重要动因。
分析型数据处理需要访问大量的当前和历史数据,进行复杂的计算,即需要本部门的数据也会需要其他部门的数据,甚至是竞争对手的数据。
七:操作型数据和分析型数据的区别:操作型数据分析型数据细节的综合的,或提炼的当前数据历史数据可更新(可以update)不更新(不可update,但可insert)操作需求事先可知道操作需求事先不知道完全不同的生命周期生命周期符合SDLC(软件开发生命周期)对性能要求高对性能要求宽松一个时刻操作一单元一个时刻操作一集合事务驱动分析驱动面向业务处理面向分析一次操作数据量大,计算复杂一次操作数据量小,计算简单支持日常操作支持管理需求八、数据分散的原因:1、事务处理应用的分散:OLTP系统一般只需要与本部门业务有关的当前数据,没有包括企业范围内的集成应用。
第一章数据仓库与数据挖掘概述无习题第二章数据仓库概述一.判断题在分析型处理产生后,数据处理的环境由原来的以单一数据库为中心的数据环境发展为以数据仓库为基础的体系化环境。
在事务型(操作型)数据处理下,数据处理的环境主要是以单一数据库为中心的数据环境。
数据仓库是为构建分析型数据处理环境而出现的一种数据存储和组织技术.面向应用,是数据仓库区别于传统的操作型数据库的关键特征。
一个数据仓库是通过集成多个异种数据源来构造的。
由于在数据仓库中只进行数据的初始装载和查询操作,所以,数据一旦进入数据仓库,就是稳定的,基本上不会被更新。
数据立方体必须是3维的。
在数据仓库中,概念分层定义了一个映射序列,可以将低层概念映射到更一般的高层概念。
方体的格,是在单个维上定义的映射序列,可以将低层概念映射到更一般的高层概念。
雪花模型通过在每个维表基础上,增加附加维表的方式来降低星型模型中可能会存在的冗余现象。
在事实星座模型中,有且仅能有一个事实表。
在数据仓库的设计过程中,要坚持“数据驱动和需求驱动双驱动,且以需求驱动为中心”的原则。
二.单选题在以下人员中,被誉为“数据仓库之父”的是:()(知识点:数据仓库的基本概念;易)A. H.Inmon B. E.F.Codd C. Simon D. Pawlak以下关于数据仓库的说法正确的是:()(知识点:数据仓库的基本概念;难)A. 数据仓库中的数据只能来源于组织内部的操作型数据库B. 数据仓库是为应对事务型数据处理的需要而产生的C. 数据仓库是面向主题的,这是其区别于操作型数据库的关键特征D. 数据仓库必须是面向企业全局的,不能以部门为单位建立数据仓库以下哪项不是“信息包图”中的元素?()(知识点:数据仓库的三级模型;难)A. 维度B. 维的概念层次及相应层次上的数量C. 度量D. 方体的格以下哪项不属于数据仓库的逻辑模型?()(知识点:数据仓库的三级模型;中)A. 星型模型B. 雪花模型C. 度量模型D. 事实星座模型在数据仓库的设计过程中,下列描述正确的是()(知识点:数据仓库的设计;难)A. 数据仓库是“数据驱动+需求驱动”双驱动,但必须以需求驱动为中心B. 数据仓库主要面向分析型处理环境,在设计时很难完全明确用户的需求C. 数据仓库与数据库一样,其数据主要来自于企业的业务流程D. 数据仓库的设计目标是要提高事务处理的性能下面哪项关于星型模型的说法是不正确的:()(知识点:数据仓库的三级模型;难)A. 有一个事实表,且事实表中的属性由指向各个维表的外键和一些相应的度量数据组成B. 有一组小的附属表,称为维表,且每维一个维表C. 事实表的每个字段都是事实度量字段D. 由于每维只能建立一个维表,使得维表中有些信息会产生冗余在数据仓库的概念模型中,通过()来实现数据从客观世界到主观认识的映射。
第1章数据仓库的概念与体系结构1.数据仓库就是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合。
2.元数据是描述数据仓库内数据的结构和建立方法的数据,它为访问数据仓库提供了一个信息目录,根据元数据用途的不同可将数据仓库的元数据分为技术元数据和业务元数据两类。
3.数据处理通常分成两大类:联机事务处理OLTP和联机分析处理OLAP。
4.多维分析是指对以“维”形式组织起来的数据(多维数据集)采取切片(Slice)、切块(dice)、钻取(Drill-down 和Roll-up 等)和旋转(pivot)等各种分析动作,以求剖析数据,使用户能从不同角度、不同侧面观察数据仓库中的数据,从而深入理解多维数据集中的信息。
5. ROLAP是基于关系数据库的OLAP实现,而MOLAP是基于多维数据结构组织的OLAP实现。
6.数据仓库按照其开发过程,其关键环节包括数据抽取、数据存储与管理和数据表现等。
7.数据仓库系统的体系结构根据应用需求的不同,可以分为以下4种类型:两层架构、独立型数据集市、依赖型数据集市和操作型数据存储、逻辑型数据集市和实时数据仓库。
8.操作型数据存储实际上是一个集成的、面向主题的、可更新的、当前值的(但是可“挥发”的)、企业级的、详细的数据库,也叫运营数据存储。
9.“实时数据仓库”意味着源数据系统、决策支持服务和数据仓库之间以一个接近实时的速度交换数据和业务规则。
10.从应用的角度看,数据仓库的发展演变可以归纳为5个阶段:以报表为主、以分析为主、以预测模型为主、以营运导向为主、以实时数据仓库和自动决策为主。
11.什么是数据仓库?数据仓库的特点主要有哪些?答:数据仓库就是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,通常用于辅助决策支持。
数据仓库的特点包含以下几个方面:(1)面向主题。
数据仓库技术名词解释
数据仓库技术是一种用于帮助企业集成、存储和分析大量数据的技术。
这种技术主要基于数据库系统技术发展而来,逐步形成了一系列独立的新应用技术。
通过数据仓库技术,大量的数据可以从不同的数据源中提取、转换并加载到一个数据存储库中。
然后,对这些数据进行多维分析和报告,以帮助企业做出更明智的商业决策。
数据仓库是一个为企业提供决策支持的数据存储系统,可以提供包括历史数据、实时数据、汇总数据等在内的所有类型的数据支持。
数据仓库的架构通常采用星型模型或雪花模型,以方便进行多维分析和查询。
此外,数据仓库技术还可以帮助企业提高数据质量,通过对收集到的数据进行清理和转换,提高数据的质量和准确性。
以上内容仅供参考,如需更多信息,建议查阅数据仓库相关书籍或咨询该领域专业人士。
数据仓库第⼀章数据仓库概念数据仓库(英语:Data Warehouse,简称数仓、DW),是⼀个⽤于存储、分析、报告的数据系统。
数据仓库的⽬的是构建⾯向分析的集成化数据环境,为企业提供决策⽀持(Decision Support)。
数据仓库本⾝并不“⽣产”任何数据,其数据来源于不同外部系统;同时数据仓库⾃⾝也不需要“消费”任何的数据,其结果开放给各个外部应⽤使⽤,这也是为什么叫“仓库”,⽽不叫“⼯⼚”的原因。
第⼆章场景案例数据仓库为何⽽来?先下结论:为了分析数据⽽来,分析结果给企业决策提供⽀撑。
信息总是⽤作两个⽬的:操作型记录的保存和分析型决策的制定。
数据仓库是信息技术长期发展的产物。
下⾯以中国⼈寿保险公司(chinalife)发展为例,阐述数据仓库为何⽽来?2.1 操作型记录的保存中国⼈寿保险(集团)公司下辖多条业务线,包括:⼈寿险、财险、车险,养⽼险等。
各业务线的业务正常运营需要记录维护包括客户、保单、收付费、核保、理赔等信息。
联机事务处理系统(OLTP)正好可以满⾜上述业务需求开展, 其主要任务是执⾏联机事务和查询处理。
其基本特征是前台接收的⽤户数据可以⽴即传送到后台进⾏处理,并在很短的时间内给出处理结果。
关系型数据库是OLTP典型应⽤,⽐如:Oracle、Mysql、SQL Server等。
2.2 分析型决策的制定随着集团业务的持续运营,业务数据将会越来越多。
由此也产⽣出许多运营相关的困惑:能够确定哪些险种正在恶化或已成为不良险种?能够⽤有效的⽅式制定新增和续保的政策吗?理赔过程有欺诈的可能吗?现在得到的报表是否只是某条业务线的?集团整体层⾯数据如何?为了能够正确认识这些问题,制定相关的解决措施,瞎拍桌⼦是肯定不⾏的。
最稳妥办法就是:基于业务数据开展数据分析,基于分析的结果给决策提供⽀撑。
也就是所谓的数据驱动决策的制定。
然后,⾯临下⼀个问题:在哪⾥进⾏数据分析?数据库可以吗?2.3 OLTP环境开展分析可⾏吗?结论:可以,但是没必要。
~第一章数据库系统概述选择题B、B、A简答题1.请简述数据,数据库,数据库管理系统,数据库系统的概念。
P27数据是描述事物的记录符号,是指用物理符号记录下来的,可以鉴别的信息。
数据库即存储数据的仓库,严格意义上是指长期存储在计算机中的有组织的、可共享的数据集合。
数据库管理系统是专门用于建立和管理数据库的一套软件,介于应用程序和操作系统之间。
《数据库系统是指在计算机中引入数据库技术之后的系统,包括数据库、数据库管理系统及相关实用工具、应用程序、数据库管理员和用户。
2.请简述早数据库管理技术中,与人工管理、文件系统相比,数据库系统的优点。
数据共享性高数据冗余小易于保证数据一致性数据独立性高可以实施统一管理与控制减少了应用程序开发与维护的工作量…3.请简述数据库系统的三级模式和两层映像的含义。
P31答:数据库的三级模式是指数据库系统是由模式、外模式和内模式三级工程的,对应了数据的三级抽象。
两层映像是指三级模式之间的映像关系,即外模式/模式映像和模式/内模式映像。
4.请简述关系模型与网状模型、层次模型的区别。
P35使用二维表结构表示实体及实体间的联系建立在严格的数学概念的基础上概念单一,统一用关系表示实体和实体之间的联系,数据结构简单清晰,用户易懂易用【存取路径对用户透明,具有更高的数据独立性、更好的安全保密性。
第二章关系数据库选择题C、C、D简答题1.请简述关系数据库的基本特征。
P48答:关系数据库的基本特征是使用关系数据模型组织数据。
2.请简述什么是参照完整性约束。
P55¥答:参照完整性约束是指:若属性或属性组F是基本关系R的外码,与基本关系S的主码K 相对应,则对于R中每个元组在F上的取值只允许有两种可能,要么是空值,要么与S中某个元组的主码值对应。
3.请简述关系规范化过程。
答:对于存在数据冗余、插入异常、删除异常问题的关系模式,应采取将一个关系模式分解为多个关系模式的方法进行处理。
一个低一级范式的关系模式,通过模式分解可以转换为若干个高一级范式的关系模式,这就是所谓的规范化过程。