数据仓库之概念描述
- 格式:ppt
- 大小:584.50 KB
- 文档页数:83
客户关系管理-形成性考核一复习资料
注:请认真核对是您需要的题目后再下载!
【题目】
【单选题】下列选项中,()是对数据仓库概念的正确描述。
A. 数据仓库是面向过程的、集成的数据集合
B. 数据仓库是与时间无关、不可修改的数据集合
C. 数据仓库是在企业管理和决策中面向主题的、与时间相关的数据集合
D. 数据仓库是随时间变化的、不稳定的数据集合
[提示:仔细阅读试题,并作答]
正确的答案是:数据仓库是在企业管理和决策中面向主题的、与时间相关的数据集合
【题目】
【单选题】crm是对企业( )的信息化。
A. 前台业务
B. 物料供应部门
C. 后台业务
D. 生产部门
[提示:仔细阅读试题,并作答]
正确的答案是:前台业务
【题目】
【单选题】以下选项按目标客户分类,()应属于企业级的crm。
A. 跨国公司或者大型企业
B. 200人以上跨地区经营的企业
C. 200人以下企业
D. 1000人以上企业
[提示:仔细阅读试题,并作答]
正确的答案是:跨国公司或者大型企业
【题目】
【单选题】从技术的角度看,呼叫中心对内通过计算机和( )联系客户数据库和各部门的资源。
A. Intranet
B. Extranet
C. 互联网络
D. 电话网络
[提示:仔细阅读试题,并作答]
正确的答案是:电话网络
【题目】
【单选题】下列选项中不是数据仓库的特征的是
A. 随时间变化
B. 集成。
数据仓库基本概念对数据仓库最大的误解是把它当作一个现成的可以直接买来使用的产品。
数据仓库和数据库不同,它不是现成的软件或者硬件产品。
确切说,数据仓库是一种解决方案,是对原始的操作数据进行各种处理并转换成有用信息的处理过程,用户可以通过分析这些信息从而作出策略性的决策。
随着计算机技术的迅速发展,信息处理技术也得到了长足的发展,从70年代中期的MIS系统发展到现代的数据仓库(Data Warehouse)技术。
许多厂商都在开发自已的数据仓库解决方案,并通过各种渠道大力推广。
但就数据仓库技术而言,目前仍存在着许多认识上的误区,本文将着重介绍一些数据仓库的基本概念以及建立数据仓库时应该注意的一些情况。
数据仓库不是现成软件或硬件产品对数据仓库最大的误解可能是把它当作一个现成的可以直接买来使用的产品。
事实上,数据仓库和数据库不同,它不是现成的软件或者硬件产品。
比较确切地说,数据仓库是一种解决方案,是对原始的操作数据进行各种处理并转换成有用信息的处理过程,用户可以通过分析这些信息从而作出策略性的决策。
因此,在很多场合,我们也把数据仓库系统称为决策支持系统。
由于这个原因,数据仓库的用户不是类似银行柜员的终端操作人员,而是针对各个业务部门的用户和有关决策人员。
因此,数据仓库的用户比传统的OLTP(联机事务处理:On-line Transaction Processing)用户少得多。
OLTP与OLAPOLTP系统也称为生产系统,它是事件驱动、面向应用的,比如银行的储蓄系统就是一个典型的OLTP系统。
OLTP的基本特点是:·对响应时间要求非常高;·用户数量非常庞大,主要是操作人员;·数据库的各种操作基于索引进行。
OLAP(联机分析处理:On-line Analytical Processing)是基于数据仓库的信息分析处理过程,是数据仓库的用户接口部分。
OLAP系统是跨部门、面向主题的,其基本特点是:·基础数据来源于生产系统中的操作数据(Operational Data);·响应时间合理;·用户数量相对较小,其用户主要是业务决策与管理人员;·数据库的各种操作不能完全基于索引进行。
数据仓库基础知识1、什么是数据仓库?权威定义:数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。
1)数据仓库是用于支持决策、面向分析型数据处理;2)对多个异构的数据源有效集成,集成后按照主题进行重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。
面对大数据的多样性,在存储和处理这些大数据时,我们就必须要知道两个重要的技术。
分别是:数据仓库技术、Hadoop。
当数据为结构化数据,来自传统的数据源,则采用数据仓库技术来存储和处理这些数据,如下图:2、数据仓库和数据库的区别?从目标、用途、设计来说。
1)数据库是面向事务处理的,数据是由日常的业务产生的,并且是频繁更新的;数据仓库是面向主题的,数据来源多样化,经过一定的规则转换得到的,用于分析和决策;2)数据库一般用来存储当前事务性数据,如交易数据;数据仓库一般存储的是历史数据;3)数据库设计一般符合三范式,有最大的精确度和最小的冗余度,有利于数据的插入;数据仓库设计一般不符合三范式,有利于查询。
3、如何构建数据仓库?数据仓库模型的选择是灵活的,不局限与某种模型方法;数据仓库数据是灵活的,以实际需求场景为导向;数仓设计要兼顾灵活性、可扩展性、要考虑技术可靠性和实现成本。
1)调研:业务调研、需求调研、数据调研2)划分主题域:通过业务调研、需求调研、数据调研最终确定主题域3)构建总线矩阵、维度建模总线矩阵:把总线架构列表形成矩阵形式,行表示业务处理过程,即事实,列表示一致性的维度,在交叉点上打上标记表示该业务处理过程与该维度相关(交叉探查)4)设计数仓分层架构5)模型落地6)数据治理4、什么是数据中台?数据中台是通过数据技术,对海量数据进行采集、计算、存储、加工,同时统一标准和口径。
数据中台把数据统一之后,会形成标准数据,再进行存储,形成大数据资产层,进而为客户提供高效服务。
这些服务和企业的业务有较强关联性,是企业所独有且能复用的,他是企业业务和数据的积淀,其不仅能降低重复建设,减少烟囱式协助的成本,也是差异化竞争的优势所在。
数据仓库的描述数据仓库是一种技术性的建模工具,它可以为企业提供有用的信息,有助于实现组织的商业目标。
近年来,由于企业对数据分析的日益重视,数据仓库的需求也在不断增长。
这里,我将介绍数据仓库的概念、特征以及建造方法。
一、念数据仓库是一种特殊的数据库,它用于存储和管理组织的历史数据,有助于组织实现其商业目标。
它是一个集中的,统一的,完整的数据存储库,它被设计成可以满足决策支持系统的要求。
数据仓库通常包括一个大型的数据库,用于存储组织数据。
这些数据可以是历史数据、实时数据、混合数据或经过处理的数据。
它们可以从不同的数据源中提取,例如企业资源计划系统(ERP)、交易处理系统(TPS)、会计系统等。
二、特征数据仓库具有以下特点:(1)集中:数据仓库可以把企业的数据集中存放在一起,减少数据的冗余,提高数据的准确性。
(2)统一:数据仓库可以将来自不同数据源的数据统一进行分类和管理,提高数据的一致性和可比性。
(3)完整:数据仓库在存储数据时,可以把企业的所有历史数据都存储起来,从而支持更好地决策分析。
(4)可靠:数据仓库可以提供可靠和弹性的数据存储,可以不受客观环境的影响,充分保护企业数据的安全。
(5)可扩展性:数据仓库可以根据企业业务的发展情况,对数据存储进行扩容,以满足企业对数据存储的需求。
(6)可分析性:数据仓库可以支持复杂的数据分析,例如商业智能、数据挖掘和机器学习等,可以提供企业更有效的决策分析支持。
三、建造方法建造数据仓库通常需要经过以下步骤:(1)数据收集:收集并清洗企业信息,将企业的业务数据以结构化的形式存储在数据仓库中。
(2)数据整合:将企业的来自不同部门的数据进行整合,以满足数据仓库的需求。
(3)数据质量:定义数据的质量指标,对数据仓库中的数据进行检查,以确保数据的准确性。
(4)数据建模:根据组织的业务需求,使用结构化概念技术(SDT)来建模数据,以便于后续数据分析。
(5)数据应用:利用数据仓库中的数据,以及运用数据挖掘和机器学习等技术,为企业提供决策支持。
数据仓库-数据集市-BI-数据分析-介绍数据仓库数据集市BI数据分析介绍在当今数字化的时代,数据已经成为企业和组织最宝贵的资产之一。
如何有效地管理、分析和利用这些数据,以获取有价值的信息和洞察,成为了摆在众多企业面前的重要课题。
在这个过程中,数据仓库、数据集市、商业智能(BI)和数据分析等技术和概念发挥着至关重要的作用。
接下来,让我们一起深入了解一下这些概念。
数据仓库,简单来说,就是一个用于存储和管理企业数据的大型数据库系统。
它的目的是将来自不同数据源(如操作系统、数据库、文件等)的数据整合到一个统一的、一致的环境中,以便进行分析和决策支持。
数据仓库中的数据通常是经过清洗、转换和集成的,以确保数据的质量和一致性。
它采用了特定的架构和技术,如星型模式、雪花模式等,来优化数据的存储和查询性能。
数据仓库就像是一个大型的数据仓库,将各种各样的数据收集起来,经过整理和分类,以便后续的使用。
与数据仓库密切相关的是数据集市。
数据集市可以看作是数据仓库的一个子集,它专注于特定的业务领域或主题,例如销售数据集市、客户数据集市等。
数据集市的数据来源于数据仓库,经过进一步的筛选和加工,以满足特定业务部门或用户的需求。
数据集市的规模通常比数据仓库小,但更具针对性和灵活性,能够更快地提供相关的数据和分析结果。
接下来,我们谈谈商业智能(BI)。
BI 是一套用于将数据转化为有价值的信息和知识的技术和工具。
它包括数据报表、数据可视化、数据挖掘、联机分析处理(OLAP)等功能。
通过 BI 系统,用户可以以直观的方式查看和分析数据,从而发现数据中的趋势、模式和关系。
BI 帮助企业管理层做出更明智的决策,提高企业的竞争力和运营效率。
例如,通过数据报表,管理层可以清晰地了解企业的销售业绩、成本支出等情况;通过数据可视化,复杂的数据可以以图表、地图等形式展现,更容易理解和分析。
数据分析则是一个更广泛的概念,它涵盖了从数据收集、数据处理、数据分析到结果解释和报告的整个过程。
一、名词解释1. 数据仓库:是一种新的数据处理体系结构 .是面向主题的、集成的、不可更新的(稳定性)、随时间不断变化 (不同时间)的数据集合.为企业决策支持系统提供所需的集成信息。
2. 孤立点:指数据库中包含的一些与数据的一般行为或模型不一致的异常数据。
3. OLAP:OLAP 是在OLTP 的基础上发展起来的.以数据仓库为基础的数据分析处理 .是共享多维信息的快速分析.是被专门设计用于支持复杂的分析操作 .侧重对分析人员和高层管理人员的决策支持。
4. 粒度:指数据仓库的数据单位中保存数据细化或综合程度的级别。
粒度影响存放在数据仓库中的数据量的大小 .同时影响数据仓库所能回答查询问题的细节程度。
5. 数据规范化:指将数据按比例缩放(如更换大单位).使之落入一个特定的区域(如 0-1) 以提高数据挖掘效率的方法。
规范化的常用方法有:最大-最小规范化、零-均值规范化、小数定标规范化。
6. 关联知识:是反映一个事件和其他事件之间依赖或相互关联的知识。
如果两项或多项属性之间存在关联.那么其中一项的属性值就可以依据其他属性值进行预测。
7. 数据挖掘:从大量的、不完全的、有噪声的、模糊的、随机的数据中.提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
8. OLTP:OLTP 为联机事务处理的缩写.OLAP 是联机分析处理的缩写。
前者是以数据库为基础的.面对的是操作人员和低层管理人员 .对基本数据进行查询和增、删、改等处理。
9. ROLAP:是基于关系数据库存储方式的 .在这种结构中.多维数据被映像成二维关系表.通常采用星型或雪花型架构.由一个事实表和多个维度表构成。
10. MOLAP:是基于类似于“超立方”块的OLAP 存储结构.由许多经压缩的、类似于多维数组的对象构成.并带有高度压缩的索引及指针结构 .通过直接偏移计算进行存取。
11. 数据归约:缩小数据的取值范围.使其更适合于数据挖掘算法的需要 .并且能够得到和原始数据相同的分析结果。
数据仓库的概念模型的概念数据仓库是一种用于支持决策分析和业务报告的数据存储和管理系统。
它的主要目标是将来自不同数据源的大量数据集成到一个统一的、结构化的、易于查询和分析的数据集中,以便帮助企业进行决策制定和战略规划。
数据仓库的概念模型是数据仓库设计的核心基础,它描述了数据仓库中存储的数据以及数据之间的关系和属性。
概念模型体现了数据仓库的逻辑结构,为数据仓库的建立、使用和维护提供了指导和便利。
数据仓库的概念模型通常采用星型模型或雪花模型。
星型模型是以事实表为核心,围绕事实表构建多个维度表。
事实表存储了事实数据,如销售量、收入等,而维度表包含了与事实数据相关的各种维度,如时间、地区、产品等。
事实表和维度表通过外键关联起来,形成一个星形的数据结构。
星型模型简单直观,易于理解和查询,适用于较为简单的数据仓库场景。
雪花模型在星型模型的基础上进一步细化了维度表,将维度表再次分解成更小的表。
这种模型可以更好地表达维度之间的关系,但也带来了更复杂的查询和维护操作。
通常情况下,星型模型适用于规模较小、数据结构相对简单的数据仓库,而雪花模型适用于规模较大、数据结构复杂的数据仓库。
在数据仓库的概念模型中,一般还包括以下几个关键元素:1. 数据源:数据仓库的数据源包括各种数据库、文件、应用系统等,数据从这些源中抽取、清洗和转换后存储到数据仓库中。
2. ETL过程:ETL(抽取、转换、加载)是数据仓库的重要组成部分。
在ETL过程中,数据从各个源系统中抽取出来,经过一系列的转换操作,最后加载到数据仓库中。
ETL过程的设计和实现对数据仓库的性能和质量有着重要影响。
3. 元数据:元数据是数据仓库中的数据描述信息,包括数据定义、数据源、数据转换规则、数据质量、数据字典等。
元数据的管理对于数据仓库的正确理解和有效使用至关重要。
4. 查询和报告:数据仓库的主要目标是提供给决策者和业务用户一个易于查询和分析的数据集。
因此,数据仓库的概念模型需要考虑查询和报告的需求,提供适当的数据结构和查询接口。
数据仓库名词解释数据仓库是一个面向主题的、集成的、稳定的、直接面向最终用户的数据集合,用于支持企业决策制定、分析和决策支持系统。
数据仓库是一个独立的数据存储和管理系统,其目标是针对企业中各个部门的数据进行整合、清洗、加工和建模,从而提供一套一致、可信、易于访问和理解的数据,帮助用户进行数据分析和企业决策。
以下是一些与数据仓库相关的重要概念和名词的解释:1. 数据集成:将来自不同数据源的数据整合到数据仓库中,包括内部和外部数据源。
2. 数据清洗:数据清洗是指通过一系列的操作,消除数据中的错误、重复、缺失和不一致的部分,提高数据的质量。
3. 数据加工:对数据进行转换、聚合、计算和抽取,以满足用户的特定需求和分析目的。
4. 主题:数据仓库的主题是指根据企业的业务需求而组织起来的数据类别或领域,例如销售、人力资源、供应链等。
5. 元数据:元数据是描述数据的数据,包括数据的源头、结构、定义、关系等。
元数据对于数据仓库的管理和使用非常重要。
6. 维度:维度是数据仓库中描述主题的属性,如时间、地理位置、产品、客户等,用于分析和查询。
7. 度量:度量是数据仓库中可以计量和比较的数据,如销售额、利润、客户数量等。
8. 星型模式:星型模式是一种常见的数据仓库建模技术,其中一个中心表(事实表)围绕着多个维度表进行关联。
9. 粒度:粒度是指数据仓库中所记录的事实的详细程度,如日销售额、月销售额、年销售额等。
10. OLAP(联机分析处理):OLAP是一种针对多维数据进行快速查询和分析的技术,通过透视表、图表和报表等方式展现数据。
11. ETL(抽取、转换和加载):ETL是数据仓库中的核心过程,用于从源系统中抽取数据,通过转换和加工后加载到数据仓库中。
12. 决策支持系统:决策支持系统是通过利用数据仓库中的数据和分析工具,辅助管理层做出决策的信息系统。
数据仓库在企业中扮演着重要的角色,它能够提供一致、准确的数据,帮助企业决策者进行数据分析和制定决策。
一、数据仓库的概念及使用情况介绍1996年, Inmon 在他的专著《Building the Data Warehouse》中, 对数据仓库做了如下定义,即“面向主题的、完整的、非易失的、不同时间的、用于支持决策的数据集合”。
这和传统的OLTP系统有很大的区别,它属在线分析(OLAP)系统的范畴。
面向主题的,指的是它将依据一定的主题,比如经销商、产品、定单等汇总各个OLTP系统的数据。
完整的, 指的是要求对各个系统数据表示进行转换,用统一编码表示,比如,A系统用001表示退货, 而B系统用999表示退货,在数据仓库中必须统一成一个编码。
非易失的, 指的是系统用户只读数据,不得修改数据。
数据仓库完整地记录了各个历史时期的数据,而OLTP系统不会保留全部的历史记录。
OLTP系统也难以支持决策查询,例如从几千万笔记录中获取不同区域的汇总报表。
完整的数据仓库应包括:1.数据源->2.ETL ->3.数据仓库存储->4.OLAP ->5.BI工具现实中可以实现的方案有:1.数据源-> BI工具2.数据源-> OLAP -> BI工具3.数据源-> 数据仓库存储-> BI工具4.数据源-> 数据仓库存储-> OLAP -> BI工具5.数据源-> ETL -> 数据仓库存储-> OLAP -> BI工具可见其中必需的是数据源和前端,其他的部分都可根据具体情况决定取舍。
建立数据仓库的步骤:1) 收集和分析业务需求2) 建立数据模型和数据仓库的物理设计3) 定义数据源4) 选择数据仓库技术和平台5) 从操作型数据库中抽取、净化、和转换数据到数据仓库6) 选择访问和报表工具7) 选择数据库连接软件8) 选择数据分析和数据展示软件9) 更新数据仓库数据仓库设计的主要步骤如下:1. 系统主题的确定这要求系统设计人员多与业务人员沟通, 详细了解业务需求、报表需求,再归纳成数据仓库的主题。