当前位置:文档之家› 使用维度功能表

使用维度功能表

Analyzer 2007教育训练
第三章:使用维度菜单

维度的功能列表 u?维度?对分析者而言,就是分析数 据的角度。分析者会尝试从各种不 同分析角度的组合查看数值(量值) 的变化 u对程序开发人员而言,维度放在轴 上的就如同?Select?语法;设定过 滤条件就类似于?Where?语法

设定过滤条件来筛选维度成员
u 使用设定过滤条件来筛选想要分析的维度成员 u 使用方式:直接勾选所要的成员 该阶层有设定过滤条件时,维 度架构名称会显示成蓝色 实心图示代表底下阶层中成员 有被拿掉的情况 单选时会出现该成员名称 多选时则以【*】表示,鼠标 移至该维度时会有Hint显示

成员过多时的过滤条件设定
此功能仅支持AS2005
清除条件

进阶过滤…依文字
只能用于连接 AS 2005的Cube

进阶过滤…依数值
该Cube所有的 量值都可以选

进阶过滤…依日期

便捷过滤
关闭此功能
以下拉式选单来设定 单一成员为过滤条件

过滤条件使用默认值
时间维度需放置在此 区域方可使用默认值
该维度属性 Type=Time即為 时间维度

过滤条件使用默认值
下列情形不用设定格式: ?年?成员全部都是阿拉伯数字{1998, 1999, 2000…} ?季?成员全部都是阿拉伯数字{1, 2, 3, 4} ?月?成员全部都是阿拉伯数字{1, 2, 3..12} 若成员不完全是阿拉伯数字则要,范例如下: {第1季,第2季…}则格式需设定为 :?第{0}季? {Quarter 1, Quarter 2}则格式需设定为 :?Quarter {0}? {1月,2月,3月…}则格式需设定为 :?{0}月?
若想依月份来设预设值,如?本月?, 虽然月份的成员全是阿拉伯数字, 但季成员 含有格式, 则仍必须填写季格式。 若使用?自定义?选项,也必须填写完整的格式 在使用默认值前, 最好将所有的格式都填上去。 若你的成员不是阿拉伯数字, 如{一月,二月…}或{第一季,第二季..},则无法使用 本默认值功能,必须将成员改以阿拉伯数字显示。

维度成员排序
u 维度可以依照不同阶层设定递增/递减排序 u 维度成员排序是依照成员的文字做排列依据
A-Z表示升序 Z-A表示递减排序

仅显示顶端/仅显示底端
u 显示前几名或最后几名 u MDX语法:TopCount(3) = Head( Order(成员), 3 )

TopCount与ButtomCount的观念
TopCount(5):表示希望是找出前五名成员,则结果会是(E、D、A、G、H)。 TopCount(5) TopSum(150 TopSum (150) ):表示要找出排名最顺序在前面的几个成员总和加起来大于150 ,则结果会是(E、D、A、G),因为累积加到G的总和是164大于150。 TopPercent(50 TopPercent (50) ):表示要找出排名最顺序在前面的那哪几个成员占合计百分比 超过50%,则结果会是(E、D、A),因为到A的加总占合计的61%

仅显示顶端之自定义筛选条件
所选取的维度 与层级
u 显示范围: u 全部资料:选取全部资料来清除 筛选条件 u 仅显示顶端数据(Top) u 仅显示底端数据(Buttom) u 限制数量:填入Top(N)的N u 计算方式: u 依照数量(Count) :即TopCount u 依照百分比(%) :即TopPercent u 依照合計(Sum) :即TopSum u 依据的量值: TopCount时用来作为 计算依据的量值

同时显示顶端与底端
Ctrl+鼠标左键 托放置四周边界

成员属性的定义与用途
u 从维度数据表中选取的字段,可以用来描述维度成员 u 只要维度数据表可以Join到的Tables中的字段都可以设定为成员属性 u 成员属性可以是文字与数字,可以用来说明及与量值合并计算

设定维度成员之成员属性
只有列维度才能显示成员属性

调整报表行列中维度的顺序
地区→时间
时间→地区

变更维度结构显示名称

移除层级与移除维度
u 原本时间维度的层级是年→季→月,可以移除掉[季],改成年→月 u 如果要将整个时间维度从数据轴上移除,可用【移除维度】功能 u 如果要重新将[季]层级加回来,可以從Schema Tree中重新拖拉季层级进来

时间维度表的创建说明

时间维度表的创建 时间维度是数据仓库最常用的维度,时间维度表创建可以用下面的代码。 方法一:使用临时表 /*起始年后的152 年365*151 +37 = 55152 / /*先建好临时表以用作主键编号*/ select top 55152 identity(int,1,1) as iid into #tmp from sysobjects a,sysobjects b,sysobjects c /*写好数据select into 时间维度表*/ select iid as 时间主键, dateadd(day,iid-1,'1949-01-01') as 时间, year(dateadd(day,iid-1,'1949-01-01')) as 年份, month(dateadd(day,iid-1,'1949-01-01')) as 月份, day(dateadd(day,iid-1,'1949-01-01')) as 日期, datepart(quarter,(dateadd(day,iid-1,'1949-01-01'))) as 季度, datepart(weekday,(dateadd(day,iid-1,'1949-01-01'))) as 星期, day(dateadd(day,iid-1,'1949-01-01')) as 月的第几天, datepart(week,(dateadd(day,iid-1,'1949-01-01'))) as 年的第几周into tj_web_time_dimension from #tmp

/*设置主键*/ alter table tj_web_time_dimension add constraint addPrimarykey primary key(时间主键) 方法二:使用循环 CREATE TABLE [dbo].[tj_web_time_dimension]( [时间主键] [int] IDENTITY(1,1) NOT NULL PRIMARY KEY CLUSTERED , [时间] [datetime] NULL, [年份] [int] NULL, [月份] [int] NULL, [日期] [int] NULL, [季度] [int] NULL, [星期] [int] NULL, [月的第几天] [int] NULL, [年的第几周] [int] NULL, ) declare @beginDate datetime, @endDate datetime, @tempdate datetime set @beginDate = '2000-1-1' set @endDate = '2010-1-1' set @tempDate = @beginDate while @tempDate <= @endDate

人的四种性格类型

人的四种性格类型 2008-08-29 21:21 人的四种性格类型:"多血质","胆汁质","黏液质",和"抑郁质". 古希腊名医希波克拉底认为人体内有四种体液,某种体液占主导,其行为方式,反应和情绪表现就带有这一类型的特点,这就是他的气质类型的体液说,他把人的气质分为多血质、胆汁质、粘液质、抑制质四种,但他还不能对气质作科学的解释。 俄国著名的生理学家巴甫洛夫经过五十多年对人的高级神经活动的研究,他把四种神经类型科学的解释为气质的生理基础: 高级神经活动类型神经过程的特性气质类型 强度平衡性灵活性强型兴奋型 (不可遏止型)强不平衡灵活胆汁质 活泼型平衡灵活多血质 安静型平衡不灵活粘液质 弱型抑制型弱不平衡不灵活抑郁型 四种气质类型有不同的心理特点,这些特点各有优点和不足,很难说哪种类型最好。即使某种气质类型缺点全都很突出,也不是一成不变。因在教育与社会实践的影响下气质能不断得到改善。 请你边看边琢磨,你属于哪一种类型? 多血质 优点:外向、活泼好动;轻松愉快、热情、可亲、开朗、豁达;好交际、健谈、机敏;适应能力强、善组织、工作有效率、富有朝气;表情丰富、情绪发生迅速丰富多变;反应敏捷、对新事物敏感而不深刻。 缺点:兴趣广泛而浮躁、易随波逐流;轻率不踏实、事不遂心则热情锐减;情感不易深沉、易见异思迁;缺乏耐力与毅力、易轻率作决定。 胆汁质 外向而兴奋精力充沛;情绪发生迅速、强烈、热情、乐观、率直、语言、行动迅速、雷历风行;能克服困难埋头工作、果敢、坚持。 缺点:冲动、莽撞、易怒而难以自制;刚愎、暴躁、倔强甚至挑衅;一旦精力耗尽则情绪低落、信心受挫;烦躁、粗心。

粘液质 优点:内向、沉静、谨慎、稳重;语言动作迟缓、不易暴露内心活动、性情平和;办事认真、细心、有韧性、严守秩序、有条理;不善言谈、交际、忍让、务实、可依赖。 缺点:执拗、不灵活、适应能力差;迟钝、被动、冷淡、显得落落寡合、有惰性、保守、萎蘼不振。 抑郁质 优点:严重内向、柔弱、敏感、腼腆;情绪发生慢而体验强烈;严肃、不怕困难、善于体察别人不易发现的问题。 缺点:情绪脆弱,畏缩、顺从;多愁善感;胆小,忧心忡忡;落落寡合、冷漠、多疑、犹豫不决;缺乏自信,常为小事而动感情。 在你对号入座的时候,要记住: 提示 1 :气质在个性结构中先天成分较多,但它的可塑性很大; 提示 2 :教育和社会实践是青少年改造气质消极面,完善优点的必要途径,只有投身于社会大课堂,在各种实践中学会认识自我,正确评价自我,就一定会有个好气质。 提示 3 :这里介绍的四种典型气质类型,具体到每个人身上却不一定那样典型,也许是某一类型为主兼有其他类型的某些特点。 提示 4 :随着年龄的增长,生活方式的变化以及自我教育,气质类型的某些特点常会为另一些特点所掩盖,并向好的方面转化。 提示 5 :任何气质类型对人的行为、活动的效率都有影响,气质中消极的情绪甚至起破坏作用。 下面介绍一种简易的自我检查方法只要认真、客观的回答都可以对自己的气质类型特点有所认识并做到扬长避短。 克列奇默尔 (Kretchmer.E) 德国精神病学家。他在对精神病患者与正常人的性格研究中发现他们的性格并不存在任何差别,而患者得病前与得病后的情况有很大联系,这种气质倾向正常时已经存在了

四种性格类型

解析四种性格类型 俗话说,爬山要懂山性,游泳要懂水性,做营销的一定要懂人性。现在就人性和大家分享: 我们把人分为活泼型(S型)、完美姓(M型)、力量型(C型)、和平西型(P型) 四种: 一、活泼型(S型)——让我们和活泼型一起快乐!活泼型的人在黑夜把自己高 高挂在星宿上,把月亮带回家。迷念生活的童话,总希望永远活的快乐。典型的活泼型情感外露,热情奔放,他们懂得把工作变成乐趣,而且乐于与人交往。他们能够从任何事情中发掘出兴奋。他们既外向,又乐观。天啦!如果没有活泼型的人,生活该是多么死气沉沉!我们需要欢笑、幽默和心情舒畅、热情和精力还有热情和魅力。 二、完美型(M型)——让我们和完美型一起统筹!即使在婴儿阶段,完美型的 人似乎懂得深思熟虑。他们文静,随和,喜欢独处。完美型的成年人是个思想家,他们对待目标严肃认真,强调做事情先后和组织,崇尚美感和才智,回为生活作长远且最好的安排。如果这世界少了完美型的人,我们会少了诗歌、文学、哲学、和音乐,埋藏我们性格深处的教养、品位、才干便会失去;世界可能少了很多工程师、发明家、科学家,我们的经济和咨讯都会失去平衡。完美型的人是人类的灵魂、智慧、精神、核心。喔,世界多么需要完美型! 三、力量型(C型)——让我们与力量型一起行动!力量型的人,永远充满动力, 他们会充满理想,他勇于攀登高不可攀的顶峰,总是对准目标前进。当活泼型的人在说话,完美型的人在思考,力量型的人会进取。他有不二定律:“现在就按我的方式去做!”。你会发现,他的脾气最容易懂,并且是最好相处的。力量型的人能够和人坦诚的与人交流,他知道一切将会妥当——只要他来负责。由于力量型的是目标主导蒹具有与升俱来的领导素质,他们往往在自己的选择中达致顶峰。大多数具政治影响力的领导,都是力量型的。我们需要灵活、控制、司令、自信、强烈意志、主宰、决策程序、权力、更快、完备! 四、和平型(P型)——让我们与和平型一起轻松!上天特别创造了和平型的人, 他是情感的缓冲器,提供了稳定和平衡。和平型缓和色彩斑斓的活泼型;拒绝过分欣赏力量型的优秀决定;对完美型的复杂计划也不过分认真。和平型的人是我们中间伟大的促进平等者。他告诉我们:“这没有什么了不起。”确实从长远来说,

数据仓库与数据挖掘 课后答案 (陈志泊 著) 清华大学出版社

第1章数据仓库的概念与体系结构 1.数据仓库就是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合。 2.元数据是描述数据仓库内数据的结构和建立方法的数据,它为访问数据仓库提供了一个信息目录,根据元数据用途的不同可将数据仓库的元数据分为技术元数据和业务元数据两类。 3.数据处理通常分成两大类:联机事务处理OLTP和联机分析处理OLAP。 4.多维分析是指对以“维”形式组织起来的数据(多维数据集)采取切片(Slice)、切块(dice)、钻取(Drill-down 和Roll-up 等)和旋转(pivot)等各种分析动作,以求剖析数据,使用户能从不同角度、不同侧面观察数据仓库中的数据,从而深入理解多维数据集中的信息。 5. ROLAP是基于关系数据库的OLAP实现,而MOLAP是基于多维数据结构组织的OLAP实现。 6.数据仓库按照其开发过程,其关键环节包括数据抽取、数据存储与管理和数据表现等。 7.数据仓库系统的体系结构根据应用需求的不同,可以分为以下4种类型:两层架构、独立型数据集市、依赖型数据集市和操作型数据存储、逻辑型数据集市和实时数据仓库。 8.操作型数据存储实际上是一个集成的、面向主题的、可更新的、当前值的(但是可“挥发”的)、企业级的、详细的数据库,也叫运营数据存储。 9.“实时数据仓库”意味着源数据系统、决策支持服务和数据仓库之间以一个接近实时的速度交换数据和业务规则。 10.从应用的角度看,数据仓库的发展演变可以归纳为5个阶段:以报表为主、以分析为主、以预测模型为主、以营运导向为主、以实时数据仓库和自动决策为主。 11.什么是数据仓库?数据仓库的特点主要有哪些? 答:数据仓库就是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,通常用于辅助决策支持。 数据仓库的特点包含以下几个方面:(1)面向主题。操作型数据库的数据组织是面向事务处理任务,各个业务系统之间各自分离;而数据仓库中的数据是按照一定的主题域进行组织。主题是一个抽象的概念,是指用户使用数据仓库进行决策时所关心的重点领域,一个主题通常与多个操作型业务系统或外部档案数据相关。(2)集成的。面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据作抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企事业单位一致的全局信息。也就是说存放在数据仓库中的数据应使用一致的命名规则、格式、编码结构和相关特性来定义。(3)相对稳定的。操作型数据库中的数据通常实时更新,数据根据需要及时发生变化。数据仓库的数据主要供单位决策分析之用,对所涉及的数据操作主要是数据查询和加载,一旦某个数据加载到数据仓库以后,一般情况下将作为数据档案长期保存,几乎不再做修改和删除操作,也就是说针对数据仓库,通常有大量的查询操作及少量定期的加载(或刷新)操作。(4)反映历史变化。操作型数据库(OLTP)主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含较久远的历史数据,因此总是包括一个时间维,以便可以研究趋势和变化。数据仓库系统通常记录了一个单位从过去某一时点(如开始启用数据仓库系统的时点)到目前的所有时期的信息,通过这些信息,可以对单位的发展历程和未来趋势做出定量分析和预测。 12. 简述数据仓库4种体系结构的异同点及其适用性。 答:(1)两层架构(Generic Two-Level Architecture)。 (2)独立型数据集市(Independent Data Mart)。 (3)依赖型数据集市和操作型数据存储(Dependent Data Mart and Operational Data Store)。 (4)逻辑型数据集市和实时数据仓库(Logical Data Mart and Real-Time Data Warehouse)。 13. 答:数据仓库技术的发展包括数据抽取、存储管理、数据表现和方法论等方面。在数据抽取方面,未来的技术发展将集中在系统集成化方面。它将互连、转换、复制、调度、监控纳入标准化的统一管理,以适应数据仓库本身或数据源可能的变化,使系统更便于管理和维护。在数据管理方面,未来的发展将使数据库厂商明确推出数据仓库引擎,作为数据仓库服务器产品与数据库服务器并驾齐驱。在这一方面,带有决策支持扩展的并行关系数据库将最具发展潜力。在数据表现方面,数理统计的算法和功能将普遍集成到联机分析产品中,并与Internet/Web 技术紧密结合。按行业应用特征细化的数据仓库用户前端软件将成为产品作为数据仓库解决方案的一部分。数据仓库实现过程的方法论将更加普及,将成为数据库设计的一个明确分支,成为管理信息系统设计的必备。 14. 答: (1)IBM 公司提供了一套基于可视化数据仓库的商业智能(BI)解决方案,包括:Visual Warehouse

维度建模与关系建模的比较

维度建模与关系建模的比较 徐辉强北京大学智能科学系1001213776 摘要: 数据仓库技术的快速发展,使得从数据库中获取信息快速高效准确。但涉及一个能够真正支持用户进行决策分析的数据仓库,并非是一件轻而易举的事情。这需要经历一个从实现环境到抽象模型,从抽象模型到具体实现的过程。要完成这一过程,必须依靠各种不同的数据模型。本文主要将介绍两种数据数据仓库建模技术实体关系建模与维度建模,并比较两者之间的关系 关键词:数据仓库、实体关系建模、维度建模 1、引言 传统的数据库技术是以单一的数据资源,即数据库为中心,进行从事务处理、批处理到决策分析等各种类型的数据处理工作。近年来,计算机技术正向着两个不同的方向扩展:一是广度计算;二是深度计算。特别是数据库处理可以大致地划分为两大类:操作型处理和分析型处理(或信息型处理)。这种分离划清了数据处理的分析型环境与操作型环境之间的界限,由原来的以单一数据库为中心的数据环境发展为一种新的体系化环境,从而导致了数据仓库技术的出现和迅速发展。

数据仓库是决策支持系统(dss)和联机分析应用数据源的结构化数据环境。数据仓库研究和解决从数据库中获取信息的问题。数据仓库的特征在于面向主题、集成性、稳定性和时变性。 数据仓库之父William H. Inmon在1991年出版的“Building the Data Warehouse”一书中所提出的定义被广泛接受——数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。 数据仓库,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它并不是所谓的“大型数据库”。数据仓库的方案建设的目的,是为前端查询和分析作为基础,由于有较大的冗余,所以需要的存储也较大。 设计好一个数据仓库是一个相对比较复杂的过程,需要抽象数据进行具体化,并且建立好模型,因此在这个过程中,模型设计是一个比较重要的一环。 2、关系建模 实体关系模型是通过两个概念(“实体”和“关系”)构造特定的数据模型,实体关系模型是一种抽象的工具,能够简化复杂的数据关系,并用规范的方式表示出来,使其易于理解。关系模型:用二维表的形式表示实体和实体间联系的数据模型。关系数据模型是以集合论中的关系概念为基础发展起来的。关系模型中无论是实体

客户的四种类型及表现形式

客户的四种类型及表现形式 课后测试 1. 客户的四种性格类型是通过两个维度区分出来的,一是(),二是表达度。√ A能力度 B情感度 C思考度 D行动度 正确答案: B 2. 所谓表达度,指的是一个人的()的强烈程度。√ A表达思维 B表达逻辑 C表达能力 D表达欲望 正确答案: D 3. 下列选项中,不属于支配型客户的性格特征的是:√ A以自我为中心 B表现得很强势 C注重他人的感受 D性格非常坚定 正确答案: C 4. 对于支配型客户,服务人员应当采用的服务方法是:√ A影响 B争论 C掌控

正确答案: D 5. 如果企业需要劝员工离职,派遣()的管理者前去最为适合。√ A和蔼型 B表达型 C支配型 D分析型 正确答案: C 6. 下列选项中,对表达型客户性格特征描述错误的是:√ A喜欢取悦他人 B喜欢聊天 C善于准确把握其他人的情感需求 D承受压力能力较强 正确答案: D 7. 在各种服务状态中,适用于表达型客户的是:√ A迎合 B平等 C掌控 D影响 正确答案: C 8. 如果某人的钱包、手机、电脑和办公桌上都是家人的照片,最有可能属于()的性格。× A支配型 B和蔼型 C表达型

正确答案: B 9. 一个人非常喜欢说话,但总是无法表明自己的真实想法,这种人属于:× A表达度高 B表达度低 C情感度高 D情感度低 正确答案: A 10. 下列选项中,不属于分析型客户性格特征的是:√ A属于指责型人格 B喜欢问问题 C不会轻易说“不” D所提意见通常很有道理 正确答案: C 判断题 11. 支配型客户的情感需求大于现实需求。此种说法:√ 正确 错误 正确答案:错误 12. 对于和蔼型的客户,服务人员尽量不要让其做选择性的决定。此种说法:√ 正确 错误 正确答案:正确 13. 如果表达型的客户说“这件事不行”,就说明这件事没有任何商量余地。此种说法:× 正确

多维数据库维度层次的理解

多维数据库维度层次的理解 多维度数据库是按照多维数据模型的思想来建立的。而一个多维数据模型是由多个维度和实事组成。维度是多维数据模型中非常重要的概念,要进行多维分析、编写高效准确的MDX 查询,首先要对维及其维度的概念分层有比较深刻的理解。 维是描述事实的角度,也即观察数据的角度。一个多维数据模型通常都包含多个维度。比如:描述企业的销售信息这样一个事实,我们就可能要用到客户维度、时间维度、产品维度、仓库维度等。在多维数据库中,维度表的来源通常都是关系数据库中的基础数据表,如上面提到的客户维度就来自关系数据库中的客户表,产品维度就来自关系数据库中的产品表等等。而这些维度表除了与事实表相关联的键属性以外还有很多其它的数据表属性。在基于关系数据库的查询中,我们可能更多的关注表之间的关系。而在多维数据库中,应该把思维改进一下,应该理解和注意维度属性之间的关系,分析维度中每个属性之间的关系。而维度属性之间的关系就引出了本文的中心——维度层次。 还是上面那个企业销售的例子,对于客户维度,除了键属性外,可能还会有客户的名字属性,所在国家,所在城市以及省,性别,教育情况,职业等信息。通过分析这些属性的值,可以发现:城市是属于某个省的,而省又是属于某个国家的,所以在这些属性的值中就表现了一种层次关系。分析这个层次结构如下图: 图一:客户维度属性层次分析图 上图中左边是客户维度表中国家属性,城市属性和省属性所组成的层次表示,右边就是这几个属性的值之间的关系。在SSAS中,图中左边的部分表示一个层次,这个层次由四个级别组成,这四个级别分别是:国家,省,城市和客户。在这个层次中国家是粒度最大的级别,客户是粒度最小的级别。在进行多维数据分析的时候,我们就可能会在这个层次的不同级别上进行综合或分析,上卷或下钻。 维度中的层次关系有的时候是隐含的,由数据的意义表示。所以维度层次有的时候可以自动生成,但更多的时候是人为定义的。对维进行概念分层使得我们可以在任意的抽象级别分析数据。 在SSAS中有一些与层次相关的函数,要利用好这些函数,其前提就是要理解维度的层次结构。这些函数我将会在另一篇文章中介绍。

SSAS 使用手册

SQL SERVER 2008 SSAS使用手册 1BI、OLAP、Analysis Services 1.1 BI概念简介 BI系统负责从多个数据源中搜集数据,并将这些数据进行必要的转换后存储到一个统一的存储介质中,并提供给使用者将这些数据转换为使用者所需信息的功能。 一个BI系统通常包括5层: 1.数据源层(data source layer):由每日的操作数据、文本数据、Excel表格、Access数据库、其他外部数据组成; 2.数据转换层(data transformation layer):转换数据源层为统一的连续数据,并放入数据存储层; 3.数据存储和提取层(data storage and retrieval layer):数据仓库; 4.分析层(analytical layer):多维度的OLAP数据库,为决策者提供分析依据; 5.展示层(presentation layer):报表和可视化工具。 与目前的RDC系统对应,BSERP数据库便相当于一个数据源层,它提供实时的事务数据。一个由SSIS(SQL Server Integration Services)提供的ETL功能可以将业务数据库中的操作性数据通过一定的规则转换为统一的连续数据,它提供的便是一个数据转换层的功能。通过SSIS转换后的数据,存储到DW_RDC数据仓库中。DW_RDC是一个关系型的数据仓库,包含两种类型的表:维度表和事实表。它提供一个数据存储和提取的功能,但是这里的数据仍然不是多维数据,所以我们需要将这些数据通过SSAS(SQL Server Analysis Services)转换成多维数据并提供分析功能,这些多维数据,存储在BI_RDC 中。最后,我们将BI_RDC的数据通过Analyzer展示工具进行多维可视化的展现。 1.2 OLAP、Analysis Services 由SSAS生成的BI_RDC是一个OLAP(On-Line Analysis Process)多维数据库。OLAP是与OLTP(On-Line Transaction Process)相对应的概念,OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事物处理;OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。一些在BI系统中的重要概念,也是从OLAP中的概念延伸过来的,比如:属性、层次结构、维度,度量值等。 Integration Services、Analysis Services以及Reporting Services是SQL Server提供的BI工具,分别提供BI系统的数据转换层、分析层和展示层的功能。可以看到使用微软的SQL SERVER 产品可以完全实现BI系统中能够提供的所有功能。其中,Microsoft SQL Server 2005 Analysis Services 为商业智能应用程序提供了联机分析处理 (OLAP) 功能和数据挖掘功能。Analysis Services 支持 OLAP,能够设计、创建和管理包含从其他数据源(如,关系型数据库)聚合来的数据的多维结构。对于数据挖掘应用程序,Analysis Services 使您能够通过使用各种各样的业界标准数据挖掘算法,设计、创建和查看从其他数据源构造的数据挖掘模型。 1.3 使用SSAS需要了解的概念 1.3.1Cube、Dimension和Measure Cube就像一个坐标系,每一个Dimension代表一个坐标轴,要想得到一个点,就必须在每一个坐标轴上取的一个值,而这个点就是Cube中的Cell。见下图(来源于https://www.doczj.com/doc/294680092.html,/zh-cn/library/ms144884.aspx):

MBTI的人格类型分为四个维度

MBTI的人格类型分为四个维度,每个维度有两个方向,共计八个方面,即共有八种人格特点,具体如下: 我们与世界相互作用方式(e)外向------内向(i) 我们获取信息的主要方式(s)感觉------直觉(n) 我们的决策方式(t)思考------情感(f) 我们的做事方式(j)判断------知觉(p) 每个人的性格都在四种维度相应分界点的这边或那边,我们称之为“偏好”。例如:如果你落在外向的那边,称为“你具有外向的偏好”;如果你落在内向的那边,称为“你具有内向的偏好”。 在现实生活中,每个维度的两个方面你都会用到,只是其中的一个方面你用的更频繁、更舒适,就好像每个人都会用到左手和右手,习惯用左手的人是左撇子,习惯用右手的人是右撇子。同样,你的人格类型就是你用的最频繁、最熟练的那种。 四个维度各有两个方面,一共组成2*2*2*2=16种人格类型 维度解释 我们与世界的相互作用方式 外向e 关注自己如何影响外部环境:将心理能量和注意力聚集于外部世界和与他人的交往上。例如:聚会、讨论、聊天 内向i 关注外部环境的变化对自己的影响:将心理能量和注意力聚集于内部世界,注重自己的内心体验。例如:独立思考,看书,避免成为注意的中心,听的比说的多 我们获取信息的主要方式 感觉s

关注由感觉器官获取的具体信息:看到的、听到的、闻到的、尝到的、触摸到的事物。例如:关注细节、喜欢描述、喜欢使用和琢磨已知的技能 直觉n 关注事物的整体和发展变化趋势:灵感、预测、暗示,重视推理例如:重视想象力和独创力,喜欢学习新技能,但容易厌倦、喜欢使用比喻,跳跃性地展现事实。 我们的决策方式 思考t 重视事物之间的逻辑关系,喜欢通过客观分析作决定评价。 例如:理智、客观、公正、认为圆通比坦率更重要 情感f 以自己和他人的感受为重,将价值观作为判定标准 例如:有同情心、善良、和睦、善解人意,考虑行为对他人情感的影响,认为圆通和坦率同样重要 我们的做事方式 判断j 喜欢做计划和决定,愿意进行管理和控制,希望生活井然有序 例如:重视结果(重点在于完成任务)、按部就班、有条理、尊重时间期限、喜欢做决定 知觉p 灵活、试图去理解、适应环境、倾向于留有余地,喜欢宽松自由的生活方式例如:重视过程、随信息的变化不断调整目标,喜欢有多种选择。

数据库维度的基本概念

基本概念: 1.多维数据集: 多维数据集是联机分析处理(OLAP)中的主要对象,是一项可对数据仓库中的数据进行快速访问的技术。多维数据集是一个数据集合,通常从数据仓库的子集构造,并组织和汇总成一个由一组维度和度量值定义的多维结构。 2.xx(dimension): 是多维数据集的结构性特性。它们是事实数据表中用来描述数据的分类的有组织层次结构(级别)。这些分类和级别描述了一些相似的成员集合,用户将基于这些成员集合进行分析。 3.度量值: 在多维数据集中,度量值是一组值,这些值基于多维数据集的事实数据表中的一列,而且通常为数字。此外,度量值是所分析的多维数据集的中心值。 即,度量值是最终用户浏览多维数据集时重点查看的数字数据。您所选择的度量值取决于最终用户所请求的信息类型。一些常见的度量值有sales、cost、expenditures和productioncount等。 4.元数据: 不同OLAP组件中的数据和应用程序的结构模型。元数据描述OLTP数据库中的表、数据仓库和数据集市中的多维数据集这类对象,还记录哪些应用程序引用不同的记录块。 5.级别: 级别是维度层次结构的一个元素。级别描述了数据的层次结构,从数据的最高(汇总程度最大)级别直到最低(最详细)级别。 6.数据挖掘:

数据挖掘使您得以定义包含分组和预测规则的模型,以便应用于关系数据库或多维OLAP数据集中的数据。之后,这些预测模型便可用于自动执行复杂的数据分析,以找出帮助识别新机会并选择有获胜把握的机会的趋势。 7.多维OLAP(MOLAP): MOLAP存储模式使得分区的聚合和其源数据的复本以多维结构存储在分析服务器计算机上。根据分区聚合的百分比和设计,MOLAP存储模式为达到最快查询响应时间提供了潜在可能性。总而言之,MOLAP更加适合于频繁使用的多维数据集中的分区和对快速查询响应的需要。 8.关系OLAP(ROLAP): ROLAP存储模式使得分区的聚合存储在关系数据库的表(在分区数据源中指定)中。但是,可为分区数据使用ROLAP存储模式,而不在关系数据库中创建聚合。 9.混合OLAP(HOLAP): HOLAP存储模式结合了MOLAP和ROLAP二者的特性。 10.粒度: 数据汇总的层次或xx。 11.聚合|聚集: 聚合是预先计算好的数据汇总,由于在问题提出之前已经准备了答案,聚合可以改进查询响应时间。 12.切块: 由多个维的多个成员限定的分区数据,称为一个切块。 13.切片(slice): 由一个维的一个成员限定的分区数据,称为一个切片。

MBTI的人格类型分为四个维度

MBTI(人格类型量表Myers-Briggs Type Indicator)的人格类型分为四个维度,每个维度有两个方向,共计八个方面,即共有八种人格特点,具体如下: 我们与世界相互作用方式(e)外向------向(i) 我们获取信息的主要方式(s)感觉------直觉(n) 我们的决策方式(t)思考------情感(f) 我们的做事方式(j)判断------知觉(p) 每个人的性格都在四种维度相应分界点的这边或那边,我们称之为“偏好”。例如:如果你落在外向的那边,称为“你具有外向的偏好”;如果你落在向的那边,称为“你具有向的偏好”。 在现实生活中,每个维度的两个方面你都会用到,只是其中的一个方面你用的更频繁、更舒适,就好像每个人都会用到左手和右手,习惯用左手的人是左撇子,习惯用右手的人是右撇子。同样,你的人格类型就是你用的最频繁、最熟练的那种。 四个维度各有两个方面,一共组成2*2*2*2=16种人格类型 维度解释 我们与世界的相互作用方式 外向e 关注自己如何影响外部环境:将心理能量和注意力聚集于外部世界和与他人的交往上。例如:聚会、讨论、聊天 向i 关注外部环境的变化对自己的影响:将心理能量和注意力聚集于部世界,注重自己的心体验。例如:独立思考,看书,避免成为注意的中心,听的比说的多 我们获取信息的主要方式 感觉s

关注由感觉器官获取的具体信息:看到的、听到的、闻到的、尝到的、触摸到的事物。例如:关注细节、喜欢描述、喜欢使用和琢磨已知的技能 直觉n 关注事物的整体和发展变化趋势:灵感、预测、暗示,重视推理例如:重视想象力和独创力,喜欢学习新技能,但容易厌倦、喜欢使用比喻,跳跃性地展现事实。 我们的决策方式 思考t 重视事物之间的逻辑关系,喜欢通过客观分析作决定评价。 例如:理智、客观、公正、认为圆通比坦率更重要 情感f 以自己和他人的感受为重,将价值观作为判定标准 例如:有同情心、善良、和睦、善解人意,考虑行为对他人情感的影响,认为圆通和坦率同样重要 我们的做事方式 判断j 喜欢做计划和决定,愿意进行管理和控制,希望生活井然有序 例如:重视结果(重点在于完成任务)、按部就班、有条理、尊重时间期限、喜欢做决定 知觉p 灵活、试图去理解、适应环境、倾向于留有余地,喜欢宽松自由的生活方式例如:重视过程、随信息的变化不断调整目标,喜欢有多种选择。

事实表设计

事实表中一般要包含2部分:一是由主键和外键所组成的键部分,另一部分是用户希望在数据仓库中所了解的数值指标,这些指标是为每个派生出来的键而定义和计算的,称为事实或指标。由于事实是一种度量,所以事实表中的这种指标往往需要具有数值化和可加性的特征。但是在事实表中,只有那些具有完全可加性的事实才能根据所有的维度进行累加而具有意义。而事实表有一些事实表示的是某种强度,这类事实就不具有完全加法性,而是一种半加法性。例如,账目余款反映的是某个时间点的数据,它可以按照地点和商品等大多数维度进行累加,但是对于时间维度则例外,将一年中每个月的账目余款进行累加是毫无意义的,而决策者则可能需要了解所有地区和所有商品账目余款的累加值。在事实表中还有一些事实是非加法性的,即这些事实具有对事实的描述特性,在这种情况下一般要将这些非加法性事实转移到维度表中。 以事实表中度量的可加性情况,可以把事实表及其包含的事实分为4种样式。 1.事务事实 事务事实以企业事件的单一情况为基础,因此通常只包含事实的次数这一种度量条件,应该尽可能以最低级别来表示。比如银行的ATM提款机的提款次数,使用某种服务的次数等。2.快照事实 快照事实以企业在某一特定时间的特殊状态为基础。也就是只有在某一段时间内才出现的结果。它们也许没有包含所有维的条件,比如不是所有的产品每天都有销售量。 3.线性项目事实 这类事实通常用来储存关于企业经营项目的详细信息。包括表现与企业相关的个别线性项目的所有度量条件,比如销售数量、销售金额、成本和运费等数值数据,也就是关键性能指标。此类事实运用范围很广,比如采购、销售和库存等。 4.事件(状态事实) 这是类特殊的事实,通常只表示事件发生与否和一些非事实本身具备的细节。它所表现的是一个事件发生后的结果变化,并且没有度量数值表示。如哪些产品在促销期间内没有卖出,有还是没有,就是事件或状态事实所表现的结果。 在事实表模型的设计中还需要注意到派生事实。派生事实主要有2种,一种是可以用同一事实表中的其他事实计算得到,例如销售行为中的商品单价可以用商品的销售总金额和销售数量计算得到,对于这些派生事实一般不保留在事实表中;另一种是非加法性事实,例如各种商品的利润率等各种比率。 在事实表模型的设计中必须要考虑到事实表中的这些事实特性,通过多次反复来确定。首先,通过调查确定所有可能的基本事实和派生事实;然后,对所有的事实按照功能或某种方式进行排序,以删除重复的事实;接着,确认那些基于不同准则但是有相同性质的派生事实,例如公司门市销售总额与地区销售总额虽由于维度的不同而被定义为不同的事实,但实际计算方法是一样的;最后,再一次确定事实表模型,在确认中要检查所有的计算派生事实的基本事实是否已经包含在模型中,并且与用户取得—致。 在设计事实表时,一定要注意使事实表尽可能地小,因为过于庞大的事实表在表的处理、备份和恢复及用户的查询等方面需要较长的时间。在实际设计时,可以利用减少列的数量、降低每一列的大小和把历史数据归档到单独的事实表中等多种方法来降低事实表的大小。另外,在事实表中还要解决好数据的精度和粒度的问题,下面将阐释粒度的设计方法。 =========================== 事实、度量和事实表 确定分析内容的构成:事实及其粒度 事实表是数据库中最大的表,是星形模型结构的核心。事实表包含了基本商业事务的详细信息,是对商务活动进行客户关系、销售趋势和产品趋势等分析的素材。事实表的设计包括对

数据中心建模方案

数据中心建模方案 前言 每个行业有自己的模型,但是不同行业的数据模型,在数 据建模的方法上,却都有着共通的基本特点。 什么是数据模型 数据模型是抽象描述现实世界的一种工具和方法,是通过抽象的实体及实体之间联系的形式,来表示现实世界中事务的相系的 一种映射。 在这里,数据模型表现的抽象的是实体和实体之间的关系, 通过对实体和实体之间关系的定义和描述,来表达实际的业务中 具体的业务关系。 数据仓库模型是数据模型中针对特定的数据仓库应用系统 的一种特定的数据模型,一般的来说,我们数据仓库模型分为几 下几个层次。

数据仓库模型 通过上面的图形,我们能够很容易的看出在整个数据仓库得建模过程中,我们需要经历一般四个过程: ?业务建模,生成业务模型,主要解决业务层面的分解和程序化。 ?领域建模,生成领域模型,主要是对业务模型进行抽象处理,生成领域概念模型。 ?逻辑建模,生成逻辑模型,主要是将领域模型的概念实体以及实体之间的关系进行数据库层次的逻辑化。 ?物理建模,生成物理模型,主要解决,逻辑模型针对不同关系型数据库的物理化以及性能等一些具体的技术问题。 因此,在整个数据仓库的模型的设计和架构中,既涉及到业务知识,也涉及到了具体的技术,我们既需要了解丰富的行业经验, 同时,也需要一定的信息技术来帮助我们实现我们的数据模型,最重要的是,我们还需要一个非常适用的方法论,来指导我们自己针对我们的业务进行抽象,处理,生成各个阶段的模型。

为什么需要数据模型 在数据仓库的建设中,我们一再强调需要数据模型,那么数据模型究竟为什么这么重要呢?首先我们需要了解整个数据仓库的建设的发展史。 数据仓库的发展大致经历了这样的三个过程: ?简单报表阶段:这个阶段,系统的主要目标是解决一些日常的工作中业务人员需要的报表, ?以及生成一些简单的能够帮助领导进行决策所需要的汇总数据。这个阶段的大部分表现形式为数据库和前端报表工 具。 ?数据集市阶段:这个阶段,主要是根据某个业务部门的需要,进行一定的数据的采集,整理,按照业务人员的需要,进行多维报表的展现,能够提供对特定业务指导的数据, 并且能够提供特定的领导决策数据。 ?数据仓库阶段:这个阶段,主要是按照一定的数据模型,对整个企业的数据进行采集,整理,并且能够按照各个业 务部门的需要,提供跨部门的,完全一致的业务报表数据,能够通过数据仓库生成对对业务具有指导性的数据,同时,为领导决策提供全面的数据支持。

四种性格气质类型

人的四种气质类型: "多血质" "胆汁质" "黏液质" 和"抑郁质". 古希腊名医希波克拉底认为人体内有四种体液,某种体液占主式,反应和情绪表现就带有这一类型的特点,这就是他的气质类型的体液说,他把人的气质分为多血质、胆汁质、粘液质、抑制质四种, 四种气质类型有不同的心理特点,这些特点各有优点和不足,很难说哪种型最好。即使某种气质类型缺点全都很突出,也不是一成不变。因在教育与会实践的影响下气质能不断得到改善。 请你边看边琢磨,你属于哪一种类型?

多血质 优点: 外向、活泼好动;轻松愉快、热情、可亲、开朗豁达; 机敏;适应能力强、善组织、工作有效率、富有朝气;表情丰富、情绪发生速丰富多变;反应敏捷、对新事物敏感而不深刻。 缺点: 兴趣广泛而浮躁、易随波逐流;轻率不踏实、事不遂心则热情锐减;情 感不易深沉、易见异思迁;缺乏耐力与毅力、易轻率作决定。 胆汁质 优点 外向而兴奋精力充沛;情绪发生迅速、强烈、热情、乐观、率直、语言、行动 迅速、雷历风行;能克服困难埋头工作、果敢、坚 缺点:冲动、莽撞、易怒而难以自制;刚愎、暴躁、倔强甚至挑衅;一旦精力 耗尽则情绪低落、信心受挫;烦躁、粗心。

粘液质 优点: 内向、沉静、谨慎、稳重;语言动作迟缓、不易暴露内心活动、性情平 和;办事认真、细心、有韧性、严守秩序、有条理; 不善言谈、交际、忍让、务实、可依赖。 缺点:执拗、不灵活、适应能力差;迟钝、被动、 冷淡、显得落落寡合、有惰性、保守、萎蘼不振。 抑郁质 优点: 严重内向、柔弱、敏感、腼腆;情绪发生慢而体验强烈; 严肃、不怕困难、善于体察别人不易发现的问题。 缺点: 情绪脆弱,畏缩、顺从;多愁善感;胆小,忧心忡忡;落落寡合、冷漠、 多疑、犹豫不决;缺乏自信,常为小事而动感情。

维度建模

维度建模的基本概念及过程 摘要:本文首先介绍维度模型中的维度表和事实表这2个基本构成要素的基础知识;其次,介绍设计维度模型的4个基本步骤;再次,围绕某银行为实现业务价值链数据集成的需要,介绍多维体系结构中的3个关键性概念:数据仓库总线结构、一致性维度、一致性事实。 关键词:维度表;事实表;维度模型设计过程;数据仓库总线结构;一致性维度;一致性事实。 引言: 与流行的说法不同,Ralph Kimball本人并没有定义“维度”和“事实”这样的术语。术语“维度”与“事实”,最初是20世纪60年代在一个由General Mills与Dartmouth大学主持的联合研究计划中提出的。70年代,AC Nielsen和IRI都一致地使用这些术语描述他们的数据发布应用,用现在更为准确的话来说,就是关于零售数据的维度数据集市(Data Mart)。在简明性成为生活方式的潮流之前的长时期内,早期的数据库垄断组织们致力于将这些概念用来简化用做分析的信息。他们意识到,除非数据库做得简单易用,否则没有人会用它。因此,在将可理解性和性能作为最高目标的驱动下,产生了维度模型的构造思想。 1 维度表和事实表 1.1 事实表 事实表是维度模型的基本表,其中如图所示存放有大量的业务性能度量值。力图将从一个业务处理过程得到的度量值数据存放在单个数据集市。由于度量值数据压倒性地成为任何数据集市的最大部分,因此应该避免在企业范围内的不同地方存储其拷贝。用术语“事实”代表一个业务度量值。可以设想一个作为例子的情形:查询某个客户在某个机构下某个产品合约账户的某个币种的某个时点余额,在各维度值(客户、产品合约、账户、机构、币种、日期)的交点处就可以得到一个度量值。维度值的列表给出了事实表的粒度定义,并确定出度量值的取值范围

数据仓库建模方法论 2018-3-29

数据仓库建模方法论 通过上一篇数据仓库建设的全局概览,我们认识了数据仓库,也明确了数据建模在仓库建设中的核心地位,数据仓库模型是整个大厦的基石,也是个难点。这么重要的环节就有必要单独拿出来详细说明一下。(本文的重点是维度建模)1什么是数据模型 数据模型是抽象描述现实世界的一种方法,是通过抽象的实体及实体之间的联系来表示现实世界中事务的相互关系的一种映射。 数据仓库模型是数据模型中针对特定的数据仓库应用系统的特定模型。由下图四部分内容组成: ●业务建模,主要解决业务层面的分解和程序化。 ●领域建模,主要对业务模型进行抽象处理,生成领域概念模型。 ●逻辑建模,主要将领域模型的概念实体以及实体之间的关系进行数据库层 次的逻辑化。 ●物理建模,主要解决逻辑模型针对不同关系型数据库的物理化以及性能等 一些具体的技术问题。

2数据仓库数据模型架构 数据仓库模型由五部分组成,如下图: 系统记录域:数据仓库业务数据存储区,模型保证了数据的一致性。(继续使用Oracle?) 内部管理域:也就是元数据模型的存储管理。(工具待定) 汇总域:系统记录域的汇总数据,数据模型保证的主题分析的性能,满足部分报表查询。 分析域:用于各个业务部分的具体的主题分析。也就是数据集市。 反馈域:针对前端反馈的数据,根据业务需求而定。 3数据模型的作用 ●进行全面的业务梳理,改进业务流程。 ●建立全方位的数据视角,打通信息孤岛,去除数据差异。 ●解决业务的变动,提高数据仓库灵活性。 ●帮助数据仓库系统本身的建设。

4如何创建数据仓库模型 4.1数据仓库建模四个阶段 4.1.1业务建模 ●划分整个企业的业务,一般按部门划分,进行各个部分之间业务工作 的界定,理清各业务部门之间的关系。 ●深入了解各业务部门工作流程的方法。 ●提出修改和改进业务部门工作流程的方法。 ●数据建模的范围界定,确定数据仓库项目的目标和阶段划分。 4.1.2领域概念建模 ●抽取关键业务概念,并抽象化。 ●将业务概念分组,按业务主线聚合类似的分组概念。 ●细化分组概述,理清分组概念内的精力流程并抽象化。 ●理清分组概念之间的关联,形成完整的领域概念模型。 4.1.3逻辑建模 业务概念实体化、事实实体化、说明实体化,并考虑其属性内容。 4.1.4物理建模 ●针对特定物理平台做出相应的技术调整 ●针对模型的性能考虑,结合特定平台做出相应调整

相关主题
文本预览
相关文档 最新文档