联机分析中的切块操作方法
- 格式:doc
- 大小:10.75 KB
- 文档页数:2
OLAP是一个赋予动态的、企业分析的名词,这些分析是注释的、熟悉的、公式化数据分析模型的生成、操作、激活和信息合成。
能够在变量间分辨新的或不相关的关系,能够区分对处理大量数据必要的参数,而生成一个不限数量的维和指明跨维的条件表达式。
OLAP是针对特定问题的联机数据访问和分析。
通过信息(维数据)的多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。
OLAP特点:1.假定性:需要初始的假设来给出导航数据分析的方向,最终用分析的结果来验证初始的假设。
2.快速性:用户对OLAP的快速反映能力有很高的要求。
3.可分析性:能处理与应用有关的任何逻辑分析和统计分析。
用户可以在OLAP平台上进行分析,也可以连接到其他外部分析工具上。
4.多维性:是OLAP的关键属性,系统提供对数据分析的多维视图和分析,如对层次维和多重层次维完全支持。
5.信息性:系统能及时获取信息,并能管理大容量的信息。
OLAP分类:1.关系OLAP(ROLAP)结构:使用关系或扩充关系DBMS存放并管理数据仓库,采用基于稀疏矩阵表示方法的星形结构或雪花结构存储多维数据,数据检索比MOLAP低效。
2.多维OLAP(MOLAP)结构:核心是其数据存储采用矩阵(可能是多维方阵)方式,数据检索高效。
3.混合OLAP(HOLAP)结构:结合ROLAP和MOLAP技术,在MOLAP立方体中存储高级别的聚集,在ROLAP中存储低级别的聚集。
4.桌面OLAP结构:没有自己的数据存储库,把用户的查询翻译为对数据源的查询,然后再把结果合成返回给用户。
5.客户OLAP:相对与Server OLAP,把部分数据下载到本地,为用户提供本地的多维分析。
OLAP常用分析方法:1.数据切片(Slicing)和数据切块(Dicing)2.钻取:数据上钻(Drilling-up)、数据下钻(Drilling-down)、数据上卷(Rolling-up)3.数据旋转(Pivoting/Rotating)-概括来说,数据仓库系统是指具有综合企业数据的能力,能够对大量企业数据进行快速和准确分析,辅助做出更好的商业决策的系统。
第一章数据仓库与数据挖掘概述1.数据库与数据仓库的本质差别是什么?答:数据库用于事务处理,数据仓库用于决策分析;数据库保持事务处理的当前状态,数据仓库既保存过去的数据又保存当前的数据;数据仓库的数据是大量数据库的集成;对数据库的操作比较明确,操作数据量少,对数据仓库操作不明确,操作数据量大。
数据库是细节的、在存取时准确的、可更新的、一次操作数据量小、面向应用且支持管理;数据仓库是综合或提炼的、代表过去的数据、不更新、一次操作数据量大、面向分析且支持决策。
6.说明OLTP与OLAP的主要区别。
答:OLTP针对的是细节性数据、当前数据、经常更新、一次性处理的数据量小、对响应时间要求高且面向应用,事务驱动; OLAP针对的是综合性数据、历史数据、不更新,但周期性刷新、一次处理的数据量大、响应时间合理且面向分析,分析驱动。
8.元数据的定义是什么?答:元数据(metadata)定义为关于数据的数据(data about data),即元数据描述了数据仓库的数据和环境。
9.元数据与数据字典的关系什么?答:在数据仓库中引入了“元数据”的概念,它不仅仅是数据仓库的字典,而且还是数据仓库本身信息的数据。
18.说明统计学与数据挖掘的不同。
答:统计学主要是对数量数据(数值)或连续值数据(如年龄、工资等),进行数值计算(如初等运算)的定量分析,得到数量信息。
数据挖掘主要对离散数据(如职称、病症等)进行定性分析(覆盖、归纳等),得到规则知识。
19.说明数据仓库与数据挖掘的区别与联系。
答:数据仓库是一种存储技术,它能适应于不同用户对不同决策需要提供所需的数据和信;数据挖掘研究各种方法和技术,从大量的数据中挖掘出有用的信息和知识。
数据仓库与数据挖掘都是决策支持新技术。
但它们有着完全不同的辅助决策方式。
在数据仓库系统的前端的分析工具中,数据挖掘是其中重要工具之一。
它可以帮助决策用户挖掘数据仓库的数据中隐含的规律性。
数据仓库和数据挖掘的结合对支持决策会起更大的作用。
OS Java CORBA COM+ Middleware XML&WebService Patterns ONE&NET P2P Development Database Download Doc什么是联机分析处理(OLAP )(转载自北大高科网站,/)联机分析处理 (OLAP) 的概念最早是由关系数据库之父E.F.Codd 于1993年提出的,他同时提出了关于OLAP 的12条准则。
OLAP 的提出引起了很大的反响,OLAP 作为一类产品同联机事务处理 (OLTP) 明显区分开来。
当今的数据处理大致可以分成两大类:联机事务处理OLTP (on-line transaction processing )、联机分析处理OLAP (On-Line Analytical Processing )。
OLTP 是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。
OLAP 是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。
下表列出了OLTP 与OLAP 之间的比较。
OLAP是使分析人员、管理人员或执行人员能够从多角度对信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。
OLAP的目标是满足决策支持或者满足在多维环境下特定的查询和报表需求,它的技术核心是"维"这个概念。
“维”是人们观察客观世界的角度,是一种高层次的类型划分。
“维”一般包含着层次关系,这种层次关系有时会相当复杂。
通过把一个实体的多项重要的属性定义为多个维(dimension),使用户能对不同维上的数据进行比较。
因此OLAP也可以说是多维数据分析工具的集合。
OLAP的基本多维分析操作有钻取(roll up和drill down)、切片(slice)和切块(dice)、以及旋转(pivot)、drill across、drill through 等。
管理信息系统1.管理信息系统是什么?它和一般的计算机应用有什么不同?管理信息系统是一个以人为主导,利用计算机硬件、软件、网络通信设备以及其他办公设备,进行信息的收集、传输、加工、储存、更新和维护,以企业战略竞优、提高效益和效率为目的,支持企业高层决策、中层控制、基层动作的集成化的人机系统。
?管理信息系统与计算机应用的不同:计算机只是管理信息系统的一种工具。
没有计算机也有管理信息系统,管理信息系统只有优劣之分,不存在有无的问题。
2.如何理解管理信息系统不仅仅是一个技术系统,而且是社会技术系统?管理信息系统和所有系统工程一样,由人类通过组织、管理、协作而建立形成并不断发展。
管理信息系统的目的在于辅助决策,而决策只能由人来做,因而管理信息系统必然是一个人机结合的系统。
在管理信息系统中,各级管理人员既是系统的使用者,又是系统的组成部分。
因参与建立和发展管理信息系统而联系起来的人群,在组织管理下形成了一个社会系统。
建立、发展管理信息系统是这个社会系统的目标,也是其产出。
对这个社会系统运行控制的效果是影响管理信息系统优劣的决定因素。
因为社会系统的介入,管理信息系统才成了一个有机结合、可持续发展的整体系统工程。
否则,它将只是一堆机器的拼凑组合。
在管理信息系统开发过程中,要根据这一特点,正确界定人和计算机在系统中的地位和作用,充分发挥人和计算机各自的长处,使系统整体性能达到最优。
3.什么是信息?什么是数据?信息与数据有何区别和联系?信息:是指经过某种方式加工的,能对接收者的行为和决策产生影响的数据,或称对事实、状态特征的认识和解释。
数据:是指未经加工的事实或着重对一种特定现象的描述,或称对原始事实、状态的记录符号。
区别:数据是符号,是物理性的,信息是加工过并能对接受者的行为和决策产生影响的数据,是逻辑性(观念性)的;信息具有与数据不同的基本属性,即信息具有:事实性、等级性、可压缩性、扩散性、分享性、增值性、转换性。
简述olap的基本操作OLAP(联机分析处理)是一种数据处理技术,它允许用户通过非常具有交互性的界面查询或分析数据,而无需编写复杂的SQL语句或程序。
因此,OLAP系统已成为商业智能的核心组成部分。
OLAP的基本操作通常包括以下几个方面:1. 切片(slice):即选定一个二维表,然后选取其中一行、一列或一个单元格,从而得到一个更小的子表。
切片操作可以帮助用户在数据集中快速找到特定行、列或单元格,从而更好地理解数据。
2. 切块(dice):即选定一个多维数据集,然后根据用户的选择,从中选择一个或多个维度和相应的切片,得到一个新的多维子集。
切块操作可以帮助用户更好地理解数据的关联关系。
3. 旋转(pivot):即将多维数据集的某些维度交换,以便更好地观察不同维度之间的关系。
例如,在一个销售数据库中,用户可以将销售日期作为列,将不同地区作为行,以便更好地分析不同地区的销售情况。
4. 过滤(filter):即根据用户的要求,从数据集中筛选特定的数据子集,该子集符合特定的条件或条件。
例如,在一个销售数据库中,可以根据特定的地区、时间范围或产品类型过滤数据,以便更好地分析数据。
5. 聚合(aggregate):即使用各种函数(如求和、平均值或计数)将多个数据点或值合并为一个值或汇总数据,以便更好地分析更大的数据集。
例如,在一个销售数据库中,可以根据某个地区、某个产品或某个时间段聚合数据,以便更好地理解数据。
总之,OLAP是一种非常强大的数据处理技术,它允许用户通过简单易用的界面快速地查询、分析和理解数据。
通过使用OLAP的基本操作,用户可以更好地了解数据,并在商务决策中做出更明智的选择。
联机分析中的切块操作方法
在联机分析中,切块操作是将数据集分割成更小的块,以便更高效地进行处理和分析。
切块操作的方法取决于数据集的类型和分析的需求。
以下是几种常见的切块操作方法:
1. 时间切块:将时间序列数据按照预定义的时间段进行切块,例如按天、按小时、按分钟等。
这种方法适用于需要对时间序列数据进行时序分析的场景,例如预测、异常检测等。
2. 空间切块:将空间数据按照预定义的区域进行切块,例如按照网格划分、按照地理区域划分等。
这种方法适用于需要对空间数据进行分布模式分析或者区域统计的场景。
3. 数据类型切块:将数据集按照不同的数据类型进行切块,例如将文本数据按照关键词进行切块、将图像数据按照特征进行切块等。
这种方法适用于需要对不同类型的数据进行特定处理的场景,例如文本分类、图像识别等。
4. 随机切块:将数据集随机切分成大小相等或大小不等的块。
这种方法适用于需要对数据集进行随机采样或者进行并行处理的场景。
5. 依据切块条件切块:将数据集按照预先定义的切块条件进行切块。
例如,将
销售数据按照产品类型划分,将用户数据按照地理位置划分等。
这种方法适用于根据特定的切块条件进行数据分析的场景。
无论采用哪种切块操作方法,在切块之后,可以对每个块进行独立的处理和分析,从而实现更高效的数据处理和分析。