OLAP分析
- 格式:ppt
- 大小:2.55 MB
- 文档页数:25
OLAP是一个赋予动态的、企业分析的名词,这些分析是注释的、熟悉的、公式化数据分析模型的生成、操作、激活和信息合成。
能够在变量间分辨新的或不相关的关系,能够区分对处理大量数据必要的参数,而生成一个不限数量的维和指明跨维的条件表达式。
OLAP是针对特定问题的联机数据访问和分析。
通过信息(维数据)的多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。
OLAP特点:1.假定性:需要初始的假设来给出导航数据分析的方向,最终用分析的结果来验证初始的假设。
2.快速性:用户对OLAP的快速反映能力有很高的要求。
3.可分析性:能处理与应用有关的任何逻辑分析和统计分析。
用户可以在OLAP平台上进行分析,也可以连接到其他外部分析工具上。
4.多维性:是OLAP的关键属性,系统提供对数据分析的多维视图和分析,如对层次维和多重层次维完全支持。
5.信息性:系统能及时获取信息,并能管理大容量的信息。
OLAP分类:1.关系OLAP(ROLAP)结构:使用关系或扩充关系DBMS存放并管理数据仓库,采用基于稀疏矩阵表示方法的星形结构或雪花结构存储多维数据,数据检索比MOLAP低效。
2.多维OLAP(MOLAP)结构:核心是其数据存储采用矩阵(可能是多维方阵)方式,数据检索高效。
3.混合OLAP(HOLAP)结构:结合ROLAP和MOLAP技术,在MOLAP立方体中存储高级别的聚集,在ROLAP中存储低级别的聚集。
4.桌面OLAP结构:没有自己的数据存储库,把用户的查询翻译为对数据源的查询,然后再把结果合成返回给用户。
5.客户OLAP:相对与Server OLAP,把部分数据下载到本地,为用户提供本地的多维分析。
OLAP常用分析方法:1.数据切片(Slicing)和数据切块(Dicing)2.钻取:数据上钻(Drilling-up)、数据下钻(Drilling-down)、数据上卷(Rolling-up)3.数据旋转(Pivoting/Rotating)-概括来说,数据仓库系统是指具有综合企业数据的能力,能够对大量企业数据进行快速和准确分析,辅助做出更好的商业决策的系统。
OLAP概述 OLAP分析,又称多维分析,是使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的并真实反映企业维特性的信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。
OLAP也可以简单定义成使用户能够以多维视图分析数据的工具。
通常用来进行多维分析的维有时间、地点、产品、度量值(如销售额)等。
例如,在销售经理查看销售数据时,他可能想了解某个产品在某个地区、某段时间的销售额,并通过交叉表的功能来按不同的维对销售数据进行分析和通过挖掘功能来了解深层次的信息。
图3-20:数据的多维形式通过三维方式展现数据,并在此基础上进行分析,能够揭示出在二维方式下隐藏的关系;并通过方便的数据导航功能,使用户更易比较数据变量之间的关系,从而可以发现数据中隐藏的信息。
关系型数据库往往不能支持对数据进行逻辑分析和统计分析。
而采用OLAP系统,用户无须编程就可以定义新的逻辑、统计等方面的计算,并可将其做为分析的一部分,并以用户理想的方式给出报告。
用户可以在OLAP平台上进行数据分析,也可以连接到其他外部分析工具上,如时间序列分析工具、数据挖掘工具等。
OLAP产品根据其实现多维分析的技术以及要实现的目标而分为三类: (1)、MOLAP(多维联机分析处理)。
MOLAP将事务型数据进行综合,通过多维结构的“立方体”的数据结构来储存经综合的数据。
MOLAP通过其层次型数据库及在内存内的索引来保障数据访问的性能。
用户可以利用数据导航工具来进行钻取、交叉查询及产生关于“立方体”的报告。
根据MOLAP的技术特点,MOLAP擅长于对一定数量的数据进行大量、复杂、快速的、反复的分析。
MOLAP通常用来进行假设分析和问题求解,如在预算应用中。
图3-21:MOLAP架构图(2)、ROLAP(关系型联机分析处理)。
ROLAP在分析数据是直接到关系型数据库中取数据,而不建立自己的“立方体”。
OLAP和DM的区别和联系1.基本概念OLAP(Online Analysis Processing):在线分析处理。
侧重于对信息的分析,通常涉及对信息的切分、多维化、前推和回溯,以及回答what-if问题。
更与中高管理层的业务范围相关,并更集中于对企业管理决策的支持。
常见的分析处理应用如多维视图、预测、敏感性分析、成本控制等。
同时,在线处理往往需要较强大的软、硬件及复杂的分析方法与工具的支持。
DM:2.区别和联系所谓OLAP(Online Analytical Process)意指由数据库所连结出来的在线分析处理程序。
有些人会说:我已经有OLAP的工具了,所以我不需要Data Mining。
事实上两者间是截然不同的,主要差异在于Data Mining用在产生假设,OLAP 则用于查证假设。
简单来说,OLAP是由使用者所主导,使用者先有一些假设,然后利用OLAP来查证假设是否成立;而Data Mining则是用来帮助使用者产生假设。
所以在使用OLAP或其它Query的工具时,使用者是自己在做探索(Exploration),但Data Mining是用工具在帮助做探索。
举个例子来看,一市场分析师在为超市规划货品架柜摆设时,可能会先假设婴儿尿布和婴儿奶粉会是常被一起购买的产品,接着便可利用OLAP的工具去验证此假设是否为真,又成立的证据有多明显;但Data Mining则不然,执行Data Mining的人将庞大的结帐数据整理后,并不需要假设或期待可能的结果,透过Mining技术可找出存在于数据中的潜在规则,于是我们可能得到例如尿布和啤酒常被同时购买的意料外之发现,这是OLAP所做不到的。
Data Mining常能挖掘出超越归纳范围的关系,但OLAP仅能利用人工查询及可视化的报表来确认某些关系,是以Data Mining此种自动找出甚至不会被怀疑过的数据模型与关系的特性,事实上已超越了我们经验、教育、想象力的限制,OLAP可以和Data Mining互补,但这项特性是Data Mining无法被OLAP取代的。
OS Java CORBA COM+ Middleware XML&WebService Patterns ONE&NET P2P Development Database Download Doc什么是联机分析处理(OLAP )(转载自北大高科网站,/)联机分析处理 (OLAP) 的概念最早是由关系数据库之父E.F.Codd 于1993年提出的,他同时提出了关于OLAP 的12条准则。
OLAP 的提出引起了很大的反响,OLAP 作为一类产品同联机事务处理 (OLTP) 明显区分开来。
当今的数据处理大致可以分成两大类:联机事务处理OLTP (on-line transaction processing )、联机分析处理OLAP (On-Line Analytical Processing )。
OLTP 是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。
OLAP 是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。
下表列出了OLTP 与OLAP 之间的比较。
OLAP是使分析人员、管理人员或执行人员能够从多角度对信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。
OLAP的目标是满足决策支持或者满足在多维环境下特定的查询和报表需求,它的技术核心是"维"这个概念。
“维”是人们观察客观世界的角度,是一种高层次的类型划分。
“维”一般包含着层次关系,这种层次关系有时会相当复杂。
通过把一个实体的多项重要的属性定义为多个维(dimension),使用户能对不同维上的数据进行比较。
因此OLAP也可以说是多维数据分析工具的集合。
OLAP的基本多维分析操作有钻取(roll up和drill down)、切片(slice)和切块(dice)、以及旋转(pivot)、drill across、drill through 等。
OLAP及其多维数据分析国防科技大学系统工程与数学系陈元陈文伟联机分析处理(OLAP)的概念最早是由关系数据库之父E.F.Codd于1993年提出的。
当时,Codd认为联机事务处理(OLTP)已不能满足终端用户对数据库查询分析的需要,SQL对大数据库进行的简单查询也不能满足用户分析的需求。
用户的决策分析需要对关系数据库进行大量计算才能得到结果,而查询的结果并不能满足决策者提出的需求。
因此Codd提出了多维数据库和多维分析的概念,即OLAP。
一、OLAP的概念根据OLAP产品的实际应用情况和用户对OLAP产品的需求,人们提出了一种对OLAP更简单明确的定义,即共享多维信息的快速分析。
(1)快速性用户对OLAP的快速反应能力有很高的要求。
系统应能在5秒内对用户的大部分分析要求做出反应。
如果终端用户在30秒内没有得到系统响应就会变得不耐烦,因而可能失去分析主线索,影响分析质量。
对于大量的数据分析要达到这个速度并不容,因此就更需要一些技术上的支持,如专门的数据存储格式、大量的事先运算、特别的硬件设计等。
(2)可分析性OLAP系统应能处理与应用有关的任何逻辑分析和统计分析。
尽管系统需要事先编程,但并不意味着系统已定义好了所有的应用。
用户无需编程就可以定义新的专门计算,将其作为分析的一部分,并以用户理想的方式给出报告。
用户可以在OLAP平台上进行数据分析,也可以连接到其他外部分析工具上,如时间序列分析工具、成本分配工具、意外报警、数据开采等。
(3)多维性多维性是OLAP的关键属性。
系统必须提供对数据分析的多维视图和分析,包括对层次维和多重层次维的完全支持。
事实上,多维分析是分析企业数据最有效的方法,是OLAP的灵魂。
(4)信息性不论数据量有多大,也不管数据存储在何处,OLAP系统应能及时获得信息,并且管理大容量信息。
这里有许多因素需要考虑,如数据的可复制性、可利用的磁盘空间、OLAP产品的性能及与数据仓库的结合度等。
在线分析处理OLAP在数据分析中的应用近年来,随着数据量的快速增长和复杂性的增加,数据分析在各行各业中的重要性不断凸显。
为了能够高效地进行数据分析,许多组织和企业开始采用在线分析处理(OLAP)技术。
本文将介绍OLAP的基本原理、主要功能以及在数据分析中的应用。
一、OLAP基本原理OLAP是一种基于多维数据模型的数据分析技术。
它以多维数据立方体为基础,将数据按照不同的维度进行组织和存储,使得用户可以方便地从不同的角度对数据进行分析和探索。
OLAP具有以下几个基本概念:1. 多维数据模型:OLAP使用多维数据模型来描述分析对象和分析结果。
多维数据模型以立方体为基础,将数据按照事实表和维度表进行组织,形成多维数据空间。
2. 维度和指标:维度是描述事实的属性,如时间、地理位置、产品等;指标是需要分析的事实数据,如销售额、访问量等。
OLAP通过对维度和指标的组合,形成多维数据立方体。
3. 切片和钻取:切片是指根据某个维度或者指标对数据进行筛选,只保留满足条件的数据;钻取是指根据需要,从总体数据中逐步细化到更详细的细节。
4. 聚集和计算:OLAP可以对多维数据进行聚集操作,从而实现对数据进行汇总和计算。
聚集操作可以提高数据分析的效率。
二、OLAP主要功能OLAP具有以下几个主要的功能,这些功能使得OLAP成为数据分析的有力工具:1. 多维数据分析:OLAP可以根据不同的维度对数据进行切片、钻取和旋转等操作,从而使用户可以从不同的角度对数据进行分析,发现数据中的规律和趋势。
2. 查询和报表功能:OLAP可以通过灵活的查询和报表工具,帮助用户快速获取需要的数据,并生成丰富的报表和图表,便于数据的可视化展示和沟通。
3. 高性能计算:由于OLAP采用了多维数据模型和聚集技术,可以对大规模数据进行高效的计算和分析,减少了数据查询和分析的时间消耗。
4. 数据挖掘和预测:OLAP可以结合数据挖掘和预测算法,从海量的数据中挖掘出有价值的信息和规律,为组织和企业的决策提供支持。