当前位置:文档之家› 数据仓库课后习题答案

数据仓库课后习题答案

数据仓库课后习题答案
数据仓库课后习题答案

第一章作业

1.数据库与数据仓库的本质差别是什么?书P2

(1)数据库用于事务处理,数据仓库用于决策分析。(2)数据库保持事物处理的当前状态,数据仓库即保存过去的数据又保存当前的数据。(3)数据仓库的数据是大量数据库的集成。(4)对数据库的操作比较明确,操作数量较小。对数据仓库操作不明确,操作数据量大。

6.

OLTP OLAP

细节性数据综合性数据

当前数据历史数据

经常更新不更新,但周期性刷新

一次性处理的数据量小一次处理的数据量大

对响应时间要求高响应时间合理

面向应用,事务驱动面向分析,分析驱动

8.定义为关于数据的数据,描述数据仓库中数据及其环境的数据。

9.元数据不仅仅是数据仓库的字典,而且还是数据仓库本身功能的说明数据,是整个数据仓库的核心。数据字典是关于数据库中数据的描述,而不是数据本身,数据字典是数据库的元数据。

18、统计学与数据挖掘的不同。

统计学主要是对数量数据或连续值数据进行数值计算的定量分析,得到数量信息。数据挖掘主要对离散数据进行定性分析,得到规则知识。在统计学中有聚类分析和判别分析,它们与数据挖掘中的聚类和分类相似。但是,采用的标准不一样,统计学的聚类采用的“距离”是欧式距离,即两点间的坐标(数值)距离。而数据挖掘的聚类采用的“距离”是海明距离,即属性取值是否相同,相同者距离为0,不相同者距离为1。

总之,统计学与数据挖掘是有区别的,但是,它们之间是相互补充的。不少数据挖掘的著作中均把统计学的不少方法引入到数据挖掘中,与将机器学习中不少方法引入到数据挖掘中一样,作为从数据获取知识的一大类方法。

19、说明数据仓库与数据挖掘的不同。

数据仓库是在数据库的基础上发展起来的。它将大量的数据库的数据按决策需求进行重新组织,以数据仓库的形式进行存储,将为用户提供辅助决策的随机查询、综合信息以及随时间变化的趋势分析信息等。

数据仓库是一种存储技术,其数据存储量是一般数据库的100倍,包含大量的历史数据、当前的详细数据以及综合数据。它能适应不同用户对不同决策需要提供所需的数据和信息。

数据挖掘是从人工智能机器学习中发展起来的。它研究各种方法和技术,从大量的数据中挖掘出有用的信息和知识。最常用的数据挖掘方法是统计分析方法、神经网络方法和机器学习中研究的方法。数据挖掘中采用机器学习的方法有归纳学习方法(如覆盖正例排斥反例方法,如AQ系列算法、决策树方法等)、遗传算法、发现学习算法(如公式发现系统BACON)等。

利用数据挖掘的方法和技术从数据仓库中挖掘的信息和知识,反映了数据仓库中数据的规律性。用户利用这些信息和知识来指导和帮助决策。例如,利用分类规则来预测未知实体的类别。

23:数据仓库与联机分析出口里、数据挖掘在决策支持方面有什么不同?

答:数据仓库视为辅助决策而建立的,单依靠数据仓库达到辅助决策的能力是有限的,综合信息和预测信息是数据仓库所获得的辅助决策信息。数据仓库中增加联机分析处理和数据挖掘等分析工具,能较大的提高辅助决策能力。数据仓库和联机分析处理几数据挖掘结合的决策支持系统,是以数据仓库为基础的,称为基于数据仓库的决策支持系统。概括地说:基于数据仓库的决策支持系统是从数据仓库的数据中获取辅助决策信息和知识,为决策提供支持。

25画出基于数据仓库的决策支持系统结构图。如图:

28. 如何理解商业智能与基于数据仓库的决策支持系统的区别于联系?

答:可以认为,商业智能是对商业信息的搜集、管理和分析过程,目的是使企业的各级决策者获得知识或洞察力(insight ),促使他们做出对企业更有利的决策。商业智能一般由数据仓库、联机分析处理、数据挖掘、数据备份和恢复等部分组成。商业智能的实现涉及到软件、硬件、咨询服务及应用,其基本体系结构包括数据仓库、联机分析处理和数据挖掘三个部分。

第二章作业

1. 画出数据仓库的结构图,说明各部分内容。P18

答:当前基本数据是最近时期的业务数据,是数据仓库用户最感兴趣的部分数据量大。随着时间的推移,有数据仓库的时间控制机制转为历史数据,轻度综合数据是从当前基本数据中提取出来的,最高一层是高度综合数据层,这一层的数据十分精炼,是一种准决策数据。

2. 说明数据仓库结构图中包含轻度综合层与高度综合数据层的作用。这些数据为什么不是临时计算出来的。P18-19

数据仓库除了存储按主题组织起来的当前详细数据外,还需要存储综合数据,这是为了适应决策需求而增加的。在数据库中需要得到综合数据时,采用数据立方体的方法对详细数据进行综合。在数据仓库中并不采取临时计算的方式得到综合数据,而在用户提出需要综合数据之前,就预先将可能的综合数据利用数据立方体计算好,存入综合数据层中,这种综合数据层在用户查询时,能迅速提供给用户。

3. 说明数据集市与数据仓库的区别和联系。P20

6.画出数据仓库系统结构图,说明把仓库管理和分析工具作为数据仓库系统的两个独立组成部分的原因。图:P22原因:

仓库管理:安全和特权管理;跟踪数据的更新;数据质量检查;管理和更新元数据;审计和报告数据仓库的使用和状态;删除数据;复制、分割和分发数据;备份和恢复;存储管理。

访问工具:为用户访问数据仓库提供手段

9.画出数据仓库的运行结构图,说明三层C/S 结构和两层C/S 结构的不同点。

二层C/S 结构

三层C/S 结构

客户端 数据仓库服务器

客户端 OLAP 服务器

数据仓库服务器

OLAP服务器将加强和规范化决策支持的服务工作,集中和简化了数据仓库服务器的部分工作,即OLAP服务器从数据仓库服务器中抽取数据,在OLAP服务器中转换成客户端要求的多维视图,并进行多维数据分析,将分析结果传送给客户端,这种结构形式工作效率更高。

11.数据模型与数学模型有什么区别?

答:数据模型是数据特征的抽象,数据管理教学的形式框架,数据库系统中用以提高信息表示和操作手段的形势构架。数据模型包括数据库的数据的结构部分、数据库数据的操作部分和数据库数据的约束条件。

数学模型是根据对研究对象所观察到的现象及实践经验,归结成的一套反映其内部因素数量关系的数学公式、逻辑准则和具体算法。用以描述和研究客观现象的运动规律。

15.第三范式数据模型与星型模型有什么不同?

第三范式不同于星型模型之处在于,把事实表和维表的属性作为一个实体都集中在同一数据库表中,或分成多个实体用多个表来表示,每个表按第三范式组织数据。它减少了为表中的键和不必要的属性。

17.简单说明ETL过程的主要步骤。

ETL过程的主要步骤概括为:(1)决定数据仓库中需要的所有的目标数据(2)决定所有的数据源,包括内部和外部的数据源(3)准备从源数据到目标数据的数据映射关系(4)建立全面的数据抽取规则(5)决定数据转换和清洗规则(6)为综合表制定计划(7)组织数据缓冲区域和检测工具(8)为所有的数据装载编写规程(9)维度表的抽取、转换和装载(10)事实表的抽取、转换和装载

18、说明数据抽取工作的内容。P28

21.数据装载方式与类型有哪些?

答:数据仓库中最基本的元数据相当于数据库系统中的数据字典。由于数据仓库和数据库有很大的不同,因此元数据的作用远不是数据字典所能相比的。元数据在数据仓库中有着举足轻重的作用,它不仅仅定义了数据仓库有什么,指明了数据仓库中数据的内容和位置,刻画了数据的抽取和转换规则,存储了与数据仓库有关的各种商业信息,而且整个数据仓库的运行都是基于元数据的,如数据的修改,跟踪,抽取,装入,综合等。

23.什么是关于数据源的元数据?

答:关于数据模型的元数据描述了数据仓库中有什么数据以及数据之间的关系,是用户管理数据仓库的基础。这种元数据可以支持从数据仓库中获取数据。用户可以提出需要哪些表,系统从中选一个表,并得到表之间的关系。重复该过程,用户希望能够得到希望的数据。24.什么是关于数据模型的元数据?

答:关于数据模型的元数据描述了数据仓库中有什么数据以及数据间的关系,支持用户从数据仓库中获取数据。

25.什么是关于数据仓库映射的元数据?

答:关于数据仓库映射的元数据,反映了数据源与数据仓库数据之间的映射,以及数据项是从哪个特定的数据源抽取的,经过了哪些转换、变换和装载。

第三章作业

1.联机分析处理(OLAP)的简单定义是什么?它体现的特征是什么。P40

2.OLAP准则中的主要准则有哪些?P41

3. 什么是维?关系数据库是二维数据吗?如何理解多维数据?P43

维是人们观察数据的特定角度。关系数据库不是二维数据,只是通过二维关系表示了数据的多维概念。多维数据就是从多个特定角度来观察特定的变量。

4.MDDB(Multi Dimensional Database, 多维数据库)是以多维的方式组织数据,即以维作为坐标系,采用类似于数组的形式存储数据。RDBMS(relational database management system,关系型数据库管理系统)通过数据、关系和对数据的约束三者组成的数据模型来存放和管理数据

MDDB特点:

1.数据库中的元素具有相同的数值

2.多维数据库表达清晰,

3.占用存储少

RDBMS的特点:

1.数据以表格的形式出现

2.每行为各种记录名称

3.每列为记录名称所对应的数据域

4.许多的行和列组成一张表单

5.若干的表单组成database

5.1.数据存取速度

ROLAP服务器需要将SQL语句转化为多维存储语句,临时“拼合”出多维数据立方体。因此,ROLAP的响应时间较长。MOLAP在数据存储速度上性能好,响应速度快。

2.数据存储的容量

ROLAP使用的传统关系数据库的存储方法,在存储容量上基本没有限制。

MOLAP通常采用多平面叠加成立体的方式存放数据。当数据量超过操作系统最大文件长度时,需要进行数据分割。多维数据库的数据量级难以达到太大的字节级。

3.多维计算的能力

MOLAP能够支持高性能的决策支持计算。ROLAP无法完成多行的计算和维之间的计算。

4.维度变化的适应性

MOLAP增加新的维度,则多维数据库通常需要重新建立。ROLAP对于维表的变更有很好的适应性。

5.数据变化的适应性

当数据频繁的变化时,MOLAP需要进行大量的重新计算,甚至重新建立索引乃至重构多维数据库。在ROLAP中灵活性较好,对于数据变化的适应性高。

6.软硬件平台的适应性

ROLAP对软硬件平台的适应性很好,而MOLAP相对较差。

7.元数据管理

目前在元数据的管理,MOLAP和ROLAP都没有成形的标准。

6.在HOLAP中,对最常用的维度和维层次,使用多维数据表来存储,对于用户不常用的维度和数据,采用ROLAP星型结构来存储。

7.多维数据显示的两种方法:关系数据库方式和多维数据库方式。

关系数据库可以显示更多维的数据,但用事实表显示多维数据时,重复数据很多,也很繁琐;多维数据库虽然不能同时显示三维以上数据,但显示的数据很精炼。

11、多维数据显示的经验规则是什么?

答:多维数据的显示只能在平面上展现出来,用多维数据库显示时,不能同时显示三维以上数据,但可以固定一些维成员,重点显示两维维数据。最有效表示多维数据使用多维类型结构(MTS),即每一维用一条线段表示,维度中每一个成员都用线段上的一个区间表示。还可以使用行、列和页表三个显示组来表示。

经验规则:

1.将维度尽量放在页中,除非确定需要同时看到一个维度的多个成员;

2.当维度嵌套在行货列中时,考虑到垂直空间比水平空间更有用,所以讲维度嵌套在列中比嵌套在行中要好;

3.在决定数据的屏幕显示方式前,应首先弄清楚需要查找和分析比较的内容;

12、举例说明OLAP的多维数据分析的切片操作。

答:切片就是在某两个维上取一定区间的维成员或全部维成员。

如用三维数组表示为(地区,时间,产品,销售额),如果在地区维度上选定一个维成员,就可以得到在该地区的一个切片(关于时间和产品的切片)。

13比如部门销售数据表中部门1的销售额为900元,对时间维进行下钻操作,可以得到各个季度分别的销售额为多少。

14

(1)切片:切片就是在某两个维上取一定区间的为成员或全部维成员,而在其余的维上选定一个维成员的操作。切片的作用就是舍弃一些观察角度,使人们能在两个维上集中观察数据。

(2)切块:切块分两种情况:(1)在多维数据的某一个维上选定某一区间的维成员的操作。(2)选定多维数组的一个三维子集的操作。切块可以看成是在切片的基础上确定某一个维成员的区间得到的片段,也即由多个切片叠合起来的。

(3)钻取:向下钻取是使用户在多层数据中能通过导航信息而获得更多的细节性数据,向上钻取获取概括性信息。

(4)旋转:通过旋转可以得到不同视角的数据,旋转操作相当于平面数据将坐标轴旋转。

15、广义OLAP功能如何提高多维数据分析能力。

广义OLAP功能主要是通过四个模型逐层深入从而提高多维数据分析能力。这四个模型分别是:

(1)绝对模型:它属于静态数据分析,通过比较历史数据值或行为来描述过去发生的事实。该模型查询比较简单,综合路径是预先定义好的,用户交互少。

(2)解释模型:它也属于静态数据分析,分析人员利用系统已有的多层次的综合路径层层细化,找出事实发生的原因。

(3)思考模型:它属于动态数据分析,旨在说明在一维或多维上引入一组具体变量或参数后将会发生什么。分析人员在引入确定的变量或公式关系时,必须创建大量的综合路径。

(4)公式模型:它的动态数据分析能力更高,该模型表示在多个维上,需要引入哪些变量或参数,以及引入后所产生的结果。

16、说明数据立方体的概念

数据立方体的概念是1996年,Jim Gray等首次提出的。数据立方体是实现多维数据查询与分析的一种重要手段。实质上,数据立方体就是数据仓库结构图中的综合数据层。从此,基于数据立方体的生成方法一直是OLAP和数据仓库领域研究者所关注的热点问题。

多数据集的属性分为维属性和度量属性。维数性是观察数据对象的角度,而度量属相则反映数据对象的特征。对于多维数据分析而言,本质上是沿着不同的维度进行数据获取的过程。在数据立方体中,不同维度组合构成了不同的子立方体,不同维值的组合机器对应的度量值构成相应的对于不同的查询和分析。因此,数据立方体的构建和维护等计算方法成为了多维数据分析研究的关键问题。

17答:OLAP的逻辑结构由OLAP视图和数据存储两部分组成。OLAP视图:对于用户来说它是数据仓库或数据集市中数据的多维逻辑表示,不管数据怎么存储和存储在何处。数据存储:要求选择数据实际存储方式和实际存储位置,两种常用的选择是多维数据存储和关系数据存储。

18答:OLAP的物理结构包括基于数据存储的两种方式:多维数据存储和关系数据存储。多维数据存储主要有两种选择:多维数据存储于客户端或OLAP服务器。在第一种情况,多维数据存储于客户端,数据分析也在客户端,这样形成了“胖”客户端,这是一种两层客户/服务器的物理结构。在第二种情况,多维数据存储放在OLAP服务器中,抽取数据仓库中的数据,然后将其转换成多维数据结构,并把OLAP 服务器传给客户端,这时客户端就变成了“瘦”客户端,这是一种经典的三层客户/服务器物理结构。

19.说明浓缩立方体的压缩方法和效果。

答:浓缩立方体计算方法的基本原理是,在某些属性或组合下的一个元组相对于其他元组具有唯一性,则称为基本单一组(BST),当它的超集也是BST,且都是取同一度量值,在聚集运算时,可以把这些属性的度量值对应的元组压缩成一条元组存储。

一般来说,浓缩立方体的压缩率可以达到30%-70%。

20.多维数据分析的MDX语言与数据库的SQL语言有什么不同?

答:MDX语言结合了多维数据集,指定“维度”(ON子句)和“创建表达式计算的新成员”(MEMBER子句),这样就可以来从多维数据集中挖掘出指定的数据。

21MDX提供的函数children来完成这个操作。Children 函数返回一个自然排序的集,该集包含指定成员的子成员。如果指定的成员没有子成员,则此函数返回一个空集。

示例

下例将返回 Geography 维度中 Geography 层次结构的 United States 成员的子成员。

SELECT [Geography].[Geography].[Country].&[United States].Children ON 0

FROM [Adventure Works]

第四章作业

1.数据仓库的需求分析的任务是什么?P67

需求分析的任务是通过详细调查现实世界要处理的对象(企业、部门用户等),充分了解源系统工作概况,明确用户的各种需求,为设计数据仓库服务。概括地说,需求分析要明确用那些数据经过分析来实现用户的决策支持需求。

2.数据仓库系统需要确定的问题有哪些?P67

3.实现决策支持所需要的数据包括哪些内容?P68

(1)源数据(2)数据转换(3)数据存储(4)决策分析

4.概念:将需求分析过程中得到的用户需求抽象为计算机表示的信息结构,叫做概念模型。

特点:(1)能真实反映现实世界,能满足用户对数据的分析,达到决策支持的要求,它是现实世界的一个真实模型。

(2)易于理解,便利和用户交换意见,在用户的参与下,能有效地完成对数据仓库的成功设计。

(3)易于更改,当用户需求发生变化时,容易对概念模型修改和扩充。

(4)易于向数据仓库的数据模型(星型模型)转换。

5.用长方形表示实体,在数据仓库中就表示主题,椭圆形表示主题的属性,并用无向边把主题与其属性连接起来;

用菱形表示主题之间的联系,用无向边把菱形分别与有关的主题连接;

若主题之间的联系也具有属性,则把属性和菱形也用无向边连接上。

6.数据库的概念模型设计主要采用E-R概念模型的设计方法。

数据仓库的概念模型设计主要采用E-R概念模型和面向对象的分析方法。

7 .图4.1所示的概念模型:商品和客户是两个主题,商品的销售信息等同于客户的购物信息,而每个商品具有本身的商品固有信息和商品号,还有就是商品的库存信息;客户具有自己的固有信息,还有就是客户号。

8.逻辑模型:计算机所支持的有E-R图转换成的数据模型,数据的逻辑结构

数据仓库的逻辑模型:星型模型

9.数据仓库的逻辑模型:用来构建数据仓库的数据库逻辑模型。

在数据库中,逻辑模型有关系、网状、层次,可以清晰的表示各个关系。

10.举例说明从数据仓库的概念模型到逻辑模型的转换?

概念模型是对每个决策与属性及主体之间的关系用E-R图来表示的,E-R图能有效的将现实的世界表示成信息世界,他利于向计算机的表示形式进行转化。而逻辑模型设计是需求分析主题域,将概念模型E-R图转化为逻辑模型,即计算机表示的数据模型,数据仓库的数据模型一般采用星型模型。例如概念模型设计时,确定了商品和客户两个主题。其中商品对于商场来说是更基本的业务对象,商品的业务有销售、采购、库存。其中商品销售时最重要的业务。它是进行决策分析的重要方面。星型模型的设计如下:确定决策分析需求,数据仓库是面向决策分析的,决策需求是建立多维数据模型的依据。例如分析销售额趋势,对商品的销售量,促销手段对销售的影响。

从需求中识别出事实,从决策主题确定的情况下,选择或设计反映决策主体业务表。例如在商品主题中,以销售数据为事实表。

确定维,确定影响事实的各种因素,对销售业务的维一般的包括商店,地区,部门,城市,时间,商品等。

确定数据汇总的水平,存在于数据仓库中的数据包括汇总的数据。数据仓库中对数据不同粒度的综合形成了多层次的数据结构。例如对于时间维,可以用年月日不同水平进行汇总。

设计事实表和维表,设计事实表和维表的属性,再事实表中应该记录哪些属性是有维表的数量来决定的,一般来说,与事实表相关的维表的数量应该适中,太少的维表会影响查询的质量,用户得不到需要的数据,太多的数据会影响查询的速度。

11. 在数据仓库中为什么考虑数据的粒度层次划分?

答:所谓的粒度是指数据仓库宗数据单元的详细程度和级别,数据越详细,粒度越小,层次级别九月低;数据综合度越高,粒度越大,层次级别就越高。在传统事务处理系统中,对数据的处理,操作都是再详细数据级别上的,即最低的粒度。但是数据仓库环境中主要是分析处理,粒度的划分键直接影响数据仓库中数据量以及所适合的查询类型。一般需要将数据划分为详细数据,轻度综合,高度综合三级或更多及粒度。不同粒度级别的数据用于不同类型的分析处理。力度的划分是数据仓库设计工作的一项重要内容,粒度划分是否适当影响数据仓库性能的一个重要方面。

12.数据仓库的记录系统包括什么内容,举例说明?

答:数据仓库中的数据来源与多个已经存在的事务处理系统外部系统,由于各个原系统的数据是面向应用的,不能完整地描述企业中的主题域,并且多个数据源的数据存在者许多不一致,因此要从数据仓库的概念模型出发,结合主题的多个表的关系模式,需要确定现有系统的哪些数据能较好地适应数据的需求。这就要求选择最完整的、最及时的、最准确的、最接近外部实体源的数据作为记录系统,同时这些数据所在的表的关系模式接近于构成主体的多个标的关系模式。记录系统的定义要记入数据仓库的元数据。

13、什么是物理模型?数据仓库的物理模型设计包括哪些工作?

答:物理模型就是逻辑模型在计算机中的物理结构,其中包括存储结构和存取方法;数据仓库的物理模型设计的工作包括:估计存储容量、确定数据的存储计划、确定索引策略、确定数据存放位置和确定存储分配。

14、为什么数据仓库物理模型设计中要建立汇总计划和确定数据分区方案?

答:如果数据仓库只存储最小粒度的数据,每次查询遍历所有的明细记录,然后生成汇总信息,这会造成很大的开销,因此要建立汇总计划;

分区可以将表分解成易于管理的小表,对事实表的分区医保采用垂直分区或水平分区,这样使得大表被分成小表,因此要建立分区方案。

16.概念模型:E-R图;逻辑模型:星型模型

物理模型:存储结构、索引、数据存放位置、存储分配。

17.(1)位索引技术:①Bit-Wise索引技术;②B-Tree索引技术

(2)表示技术

(3)广义索引

18.答:1、B-Tree只适合于高基数字段,但对于低基数字段毫无价值。

2、B-Tree索引需占一定的空间和时间,增加了在数据仓库中构造和维护索引的代价。

3、数据仓库应用中常常是复杂的查询,并经常带有分组及聚合条件,此时B-Tree索引往往无能为力。

19、数据仓库中采用标识技术有什么好处。

答:使用标准的数据库技术来储存数据仓库是非常昂贵的。较好的替代方法是用基于标识的技术来储存数据仓库。

一旦将基于标识的数据库存放在内存中,处理速度会得到很大的提高。

数据越多,标识数据比标准的、基于记录的数据更有利。

因为数据被大量压缩,所以整个数据库可以存放在内存中。

可以索引所有的行和所有的列。

21、说明数据仓库开发的四个阶段和12个步骤

答:如下图所示发:分为分析设计阶段;数据获取阶段;决策支持阶段;维护与评估阶段。

22. 数据获取阶段包括数据抽取,数据转换,数据装载3个步骤。数据抽取:数据抽取主要进行数据源的确认,确定数据抽取技术,确认数据抽取频率,按照时间要求抽取数据。数据转换:数据抽取得到的数据不能直接存入数据仓库的。数据转换工作包括:数据格式的修改,字段的解码,单个字段的分离,信息的合并,变量单位的转化,时间的转化,数据汇总等。数据装载:数据装载包括初始装载,增量装载,完全刷新。

23. 数据仓库的简历就是要达到决策支持的目的。决策支持阶段包括信息查询和知识探索两个步骤。信息查询:信息查询者使用数据仓库发现目前存在的问题。为适应信息查询者的要求,数据仓库一般采用如下的方法提高信息查询效率:创建数据陈列,预连接表格,预聚集数据,聚类数据。知识探索:只是探索者使用数据仓库能对发现的问题找出原因。

24. 维护与评估阶段包括数据仓库增长,数据仓库维护,数据仓库评价。数据仓库增长:数据仓库建立以后,随着数据用户的不断增加,时间的曾增长,用户查询需求更多,数据会迅速增长。数据仓库维护:数据仓库维护包括适应数据仓库增长的维护和正常系统维护两类。数据仓库评估:数据仓库评估包括系统性能评定,投资回报分析,数据质量评估。

25.概括说明“概念模型、逻辑模型、物理模型”分别是什么样的数据模型?

答:将需求分析过程中得到的用户需求抽象为计算机表示的信息结构,即概念模型。逻辑模型是由概念模型进一步转化成计算机支持的数据模型。物理模型是逻辑模型设计的数据模型适应应用要求在计算机中的存储结构和存取方法。

28. 当有一个或多个维表没有直接连接到事实表上,而是通过其他维表连接到事实表上时,其图解就像多个雪花连接在一起,故称雪花模型。雪花模型是对星型模型的扩展。它对星型模型的维表进一步层次化,原有的各维表可能被扩展为小的事实表,形成一些局部的 "层次" 区域,这些被分解的表都连接到主维度表而不是事实表。

管理大量数据,数据的高效装入和数据压缩,存储介质的管理,元数据的管理,数据仓库语言,高效索引,多维数据仓库和数据管理

第五章作业

1.数据仓库的两类用户有什么本质的不同?P96

数据仓库的用户有两类:信息使用者和探索者。

信息使用者是使用数据仓库的大量用户,信息使用者以一种可以预测的、重复性的方式使用数据仓库平台。探索者完全不同于信息使用者,他们有一个完全不可预测的、非重复性的数据使用模式。

2.数据仓库的信息使用者与数据库的信息使用者有什么不同?

数据库的信息使用者主要关心当前某一个时间段内的数据,而数据仓库的信息使用者关心企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。

3.1非规格化

规范化的作用是产生一种完全没有数据冗余的设计方法。

但是,有时在数据仓库设计中引入一些有限的数据冗余来提高数据访问效果。

2创建数据阵列

创建数据阵列,将相关类型的数据(如:1月、2月、3月等月份中的数据)存储在一起,提高访问效果。

3预连接表格

一个公用键和共同使用的数据将表格合并在一起。

共享一个公用键,可以将多个表格合并到一个物理表格中。这样做可以很大程度的提高数据访问效率。

4预聚集数据

根据“滚动概括”结构来组织数据。

当数据被输入到数据仓库中时,以每小时为基础存储数据。在这一天结束时,以每天为基础存储累加每小时的数据。在一周结束时,以每周为基础存储累加每天的数据。月末时,则以每月为基础存储累加每周的数据。

5聚类数据

将不同类型的数据记录放置在相同的物理位置。这为用户查看这些记录,可以在同一地点找到它们,提高查询效率。

6压缩数据

压缩可以使可读取的数据量极大。

定期净化数据

定期删除数据仓库中不需要的数据,可以为每个用户提高性能。

7合并查询

如果查询定期发生,那么可以通过把这些查询合并到同一个表格中,从而节省大量资源。

4. 增加一些数据冗余,相当于增加了某些相同的数据,这些数据往往是我们很需要的或者是经常被使用的,由于这些数据所占总量的比例增加,所以被访问的概率增加,从而减少了查询时间,提高了查询速度。

5. 聚类数据:基于产生共同信息,将不同类型的数据记录放置在相同的物理位置。

聚集数据:即概括数据,相同的商业维度和指标存储数据。

6. 合并查询:把定期的一些查询合并到同一个表格中,来节省大量资源,达到扫描数据仓库表格的次数最小化。

7. 探索者所作的工作有哪些?

答:探索者查看治疗和历史记录,在多数情况下,探索者考虑数据不同类型和数据具值之间的关系。探索者要做的工作概括分析,抽取、建模和分类。

8. 数据仓库的探索者的工作与数据库的数据挖掘者的工作有什么不同?

答:数据仓库的探索者是寻找不平常的且有用的商业运作模型的用户群,探索者查看详细的资料和历史记录,他们要做的的工作有概括分析、抽取、建模和分类;

而数据库的数据挖掘者是那些对数据库中数据做出归纳和分析的专业人士,他们从数据库的数据中提炼出有用的信息和一些数据的客观规律。

9.说明企业需要哪些战略信息与实现方法。

答:企业需要的战略信息有:销量最好的产品名单、出现问题的地区、查找出现问题的原因、对比其他的数据(横向钻取)、显示最大利润以及一些警告信息。

实现方法有:查询与报表决策支持、多维分析和原因分析和预测未来。

11.数据库是面向事务的设计,数据仓库是面向主题设计的。

数据库一般存储在线交易数据,数据仓库存储的一般是历史数据。

数据库是为捕获数据而设计,数据仓库是为分析数据而设计,它的两个基本的元素是维表和事实表。

12.说明如何利用数据仓库发现问题并找出产生问题的原因

答:主要是通过三个步骤来完成的:概括分析,抽取,建模。

概括分析是第一步。分析数据的完整性和准确性。抽取是通过概括分析,所学数据的轮廓已经基本显示出来。数据抽取就是将数据仓库中抽取制定的数据并组织起来,进一步分析而不影响数据仓库的正常工作。最后一步是建模,通过以上两步的得到的数据信息进行建模从而进一步分析数据,达到发现问题及其问题的原因。

13.说明如何利用数据仓库来进行预测

答:就是建立相应的预测模型,利用历史数据建立回归方程。一般的预测模型有多元回归模型、三次平滑预测模型、生长曲线预测模型。除了预测模型外,采用聚类模型或分类模型也能达到一定的预测效果。

14.脏数据是指在数据源中抽取、转换和装载到数据仓库的过程中出现的多余数据和无用数据。产生脏数据的途径:1,开始时定义了一些

多余的数据或由于一些不合适的转换规则在转换过程中产生的无用数据。2,来自不同数据源的数据在数据结构、数据编码、数据定义等方面是不兼容的,在集成这些数据时,未对所有不同情况的数据都转成同意形式,产生遗漏或用了不匹配的转化方法而产生的数据。3,输入的数据已经过期。由于工作业务的改变,某些前期业务的数据已经过期,仍遗留在数据仓库中而造成的过期无用数据。4,用户需求的改变或数据质量有了新的要求时,那些没有适应改变要求的数据成了无用的数据。

15.清理脏数据的方法有:1,检查抽取数据的定义和数据转换规则的正确性,对那些不合适的定义和规则所造成的脏数据进行清理。2,在对多个数据源进行集成时,必须对所有不同结构、不同编码、不同定义的数据,严格按照同意格式转换后再集成,清楚那些遗留或不匹配方法产生的脏数据。3对过期数据,在形成历史数据后,根据这种数据量的大小来决定是否需要进行重新整理。

17.企业基本情况:

18.沃尔玛一直是 Teradata 的大客户,该公司的 Teradata 装机是全球最大的数据仓库之一,并且在该公司与各家供应商的数据共

享网络(称为“零售链”)中发挥着重要作用。现在还不清楚惠普的胜利对 Teradata 会产生什么影响,看起来,沃尔玛不大可能一下子全部放弃在 Teradata 方面的投资,不过,惠普公司在数据仓库方面的任何获胜都会抢走 Teradata 的潜在业务。至周三上午为止,惠普和沃尔玛的官方都没有立即发布评论。

19.决策支持系统(decision support system ,简称dss)是辅助决策者通过数据、模型和知识,以人机交互方式进行半结构化或非结

构化决策的计算机应用系统。它是管理信息系统(mis)向更高一级发展而产生的先进信息管理系统。它为决策者提供分析问题、建立模型、模拟决策过程和方案的环境,调用各种信息资源和分析工具,帮助决策者提高决策水平和质量。决策支持系统,是以管理科学、运筹学、控制论、和行为科学为基础,以计算机技术、仿真技术和信息技术为手段,针对半结构化的决策问题,支持决策活动的具有智能作用的人机系统。该系统能够为决策者提供所需的数据、信息和背景资料,帮助明确决策目标和进行问题的识别,建立或修改决策模型,提供各种备选方案,并且对各种方案进行评价和俦优选,通过人机交互功能进行分析、比较和判断,为正确的决策提供必要的支持。

DSS的概念是在20世纪70年代提出的,并在80年代获得发展。它的产生原因有:传统的MIS没有给企业带来巨大的效益,人在管理中的积极作用要得到发挥;人们对信息处理规律认识提高,面对不断变化的环境,要求更高层次的系统来直接支持决策;计算机应用技术的发展为DSS的发展提供了物质基础。

第六章作业

1.数据挖掘与知识发现两个概念有什么不同?P116

2.知识发现过程由哪三部分组成?每部分的工作是什么?P116

3.数据挖掘的对象有哪些?他们各自的特点是什么?P118

4.P120

5.聚类是指在没有类的数据中,按“距离”概念聚集成若干类。在同一类别中,个体之间的距离较小,而不同类别上的个体之间的距离偏大。

分类是在聚类的基础上,对已确定的类找出该类别的概念描述,它代表了这类数据的整体信息。

6.当发生有丢失的数据、观察不到的数据,隐藏的数据、录入过程中发生错误的数据等情况时,即产生了不完全数据。

7 两个变量X和Y的采样,其中X是独立变量,总有观测值;Y是响应变量,可能涉及丢失值。以Y=?代表丢失值,以(X=i,Y=?)代表不完全的记录。丢失数据模式分别取决于Y=?的概率是否依赖于Y与X的状态。如果这一概率依赖于X但不依赖于Y,则认为数据是随机丢失的。

8两个变量X和Y的采样,其中X是独立变量,总有观测值;Y是响应变量,可能涉及丢失值。以Y=?代表丢失值,以(X=i,Y=?)代表不完全的记录。丢失数据模式分别取决于Y=?的概率是否依赖于Y与X的状态。如果Y=?的概率既不依赖于Y也不依赖于X的状态,则认为数据是完全随机丢失的。

9.那种丢失数据的模式可以忽的?

答:丢失数据模式分类取决于Y=?的概率是否依赖于Y与X的状态。如果这一概率依赖于X但是不依赖于Y ,则认为数据是随时丢失(Missing at Random);如果Y=?的概率既不依赖于Y也不依赖于X的状态,则认为数据时完全丢失的(Missing Completely at Random)。对于数据随时丢失与完全丢失分两种情况,如果数据挖掘方法不受影响,那么丢失数据的模式是可以忽略的。但是Y=?的概率即依赖于Y也依赖于X时,则丢失数据的模式是不可忽略的。

10那种丢失数据的模式是不可以忽略的?

答:丢失数据模式分类取决于Y=?的概率是否依赖于Y与X的状态。如果这一概率赖于X但是不依赖于Y ,则认为数据是随时丢失(Missing at Random);如果Y=?的概率既不依赖于Y也不依赖于X的状态,则认为数据时完全丢失的(Missing Completely at Random)。对于数据随时丢失与完全丢失分两种情况,如果数据挖掘方法不受影响,那么丢失数据的模式是可以忽略的。但是Y=?的概率即依赖于Y也依赖于X时,则丢失数据的模式是不可忽略的。

11、处理丢失数据的方法有哪些?

答:处理丢失数据的方法有:基于已知数据的方法、基于猜测的方法、基于模型的方法、基于贝叶斯理论的方法和基于决策树的方法。12、数据浓缩包括哪两方面?

答:数据浓缩包括属性约简和元组压缩两个方面。

13属性约简的原则是保持数据库中分类关系不变。

14属性约简一般采用:粗糙集方法或信息论方法。

15元组压缩有:相同元组(记录)合并;利用概念树进行归并;对元组的聚类

16、如何利用概念树进行元组的压缩?

答:数据库中记录的属性字段按归类方式进行合并,建立起来的层次结构称为概念树。利用概念树提升的方法可以大大浓缩数据库中的记录。多个属性字段的概念树提升,将得到高度概括的只是基表,然和转化成规则,就完成了利用概念树压缩数据的目的。

17、ID3方法建立决策树的基本思想?

答:ID3方法建立决策树是通过信息论中互信息最大作为根节点,递归依次根据数据建立树的思想。从而完成决策树的建立。

18、“信息增益”是“互信息”么?

答:是一样的。I(C,V)=H(C)-H(C|V)=info(T)-infov(T)=gain(T)

19,神经网络方法是模拟了人脑神经元结构,以MP模型和Hebb学习规则为基础,建立三大类多种神经网络模拟,分别为前馈式网络,反馈式网络和自组织网络。

20,遗传算法的三个算子为繁殖(选择),交叉(重组),变异(突变)。

21,BACON发现系统完成了物理学中大量定律的重新发现。它的基本思想是对数据项进行初等数学运算形成组合数据项,若它的的值为常数项,就得到了组合数据项等于常数的公式。FDD发现系统的基本思想是对两个数据项交替取初等函数后与另一个数据项的线性组合若为直线时,就找到了数据项的初等函数的线性组合公式。该系统所发现的公式比BACON系统发现的公式更宽些。

22、公式发现中的BACON方法与FDD方法的基本思想是什么?

答:BACON的基本思想是对数据反复进行初等数学运算形成的组合数据项,若它的值为常数,就得到了组合数据项等于常数的公式。

FDD的基本思想是对两个数据项交替取初等函数后与另一数据项的线性组合,反复进行不同的初等函数试验,当线性组合为直线时,就找到了数据项的初等函数的线性组合公式。

23、数据挖掘的知识表示有哪些?

答:规则知识,决策树知识,知识基,神经网络权值,公式知识和案例。

材料力学作业题7(弯曲变形)

第七章弯曲变形 一、是非题 1 梁内弯矩为零的横截面其挠度也为零。 ( ) 2 梁的最大挠度处横截面转角一定等于零。 ( ) 3梁的最大挠度必然发生在梁的最大弯矩处。( ) 4若两梁的抗弯刚度相同,弯矩方程也相同,则两梁的挠曲线形状完全相同。( ) 5 绘制挠曲线的大致形状,既要根据梁的弯矩图,也要考虑梁的支承条件。( ) 6 静不定梁的基本静定系必须是静定的和几何不变的。 ( ) 二、选择或填空 1 等截面直梁在弯曲变形时,挠曲线曲率最大发生在( )处。 A. 挠度最大 B. 转角最大 C. 剪力最大 D. 弯矩最大 2 将桥式起重机的主钢梁设计成两端外伸的外伸梁较简支梁有利,其理由是( )。 A. 减小了梁的最大弯矩值 B. 减小了梁的最大剪力值 C. 减小了梁的最大挠度值 D. 增加了梁的抗弯刚度值 3 图示两梁的抗弯刚度EI相同,载荷q相同, 则下列结论中正确的是( )。 A. 两梁对应点的内力和位移相同 B. 两梁对应点的内力和位移不相同 C. 内力相同,位移不同 D. 内力不同,位移相同 4 为提高梁的抗弯刚度,可通过( )来实现。 A. 选择优质材料 B. 合理安排梁的支座,减小梁的跨长 C. 减少梁上作用的载荷 D. 选择合理截面形状 三计算题 1 图示梁,弯曲刚度EI为常数。试绘制挠曲轴的大致形状,并用积分法计算截面C的转角。

2 图示简支梁,左右端各作用一个力偶矩分别为M1和M2的力偶,欲使挠曲轴拐点位于离左端l/3处,则M1和M2应保持何种关系。 3图示梁,弯曲刚度EI为常数。试用叠加法计算截面B的转角和截面C的挠度。

4 图示电磁开关,由铜片AB与电磁铁S组成。为使端点A与触点C接触,试求磁铁S所需吸力的最小值F以及间距a的尺寸。铜片横截面的惯性矩I z=0.18×10-12m4,弹性模量E=101GPa。

(完整word版)建设数据仓库的八个步骤

大数据技术部 建设数据仓库的八个步骤2017年04月25日编制

建设数据仓库的八个步骤 摘要: 建立数据仓库是一个解决企业问题的过程,业务人员往往不懂如何建立和使用数据仓库,发挥其决策支持的作用;信息部门的人员往往又不懂业务,不知道应该建立哪些决策主题。 关键词:数据仓库元数据 建设数据仓库 建立数据仓库是一个解决企业问题的过程,业务人员往往不懂如何建立和使用数据仓库,发挥其决策支持的作用;信息部门的人员往往又不懂业务,不知道应该建立哪些决策主题,从数据源中抽取哪些数据。因此数据仓库的项目小组应该由业务人员和信息部门的人员共同组成,双方需要相互沟通,协作开发数据仓库。 开发数据仓库的过程包括以下几个步骤。 1.系统分析,确定主题 建立数据仓库的第一个步骤就是通过与业务部门的充分交流,了解建立数据仓库所要解决的问题的真正含义,确定各个主题下的查询分析要求。 业务人员往往会罗列出很多想解决的问题,信息部门的人员应该对这些问题进行分类汇总,确定数据仓库所实现的业务功能。一旦确定问题以后,信息部门的人员还需要确定一下几个因素: ·操作出现的频率,即业务部门每隔多长时间做一次查询分析。 ·在系统中需要保存多久的数据,是一年、两年还是五年、十年。 ·用户查询数据的主要方式,如在时间维度上是按照自然年,还是财政年。 ·用户所能接受的响应时间是多长、是几秒钟,还是几小时。

由于双方在理解上的差异,确定问题和了解问题可能是一个需要多次往复的过程,信息部门的人员可能需要做一些原型演示给业务部门的人员看,以最终确定系统将要实现的功能确实是业务部门所需要的。 2.选择满足数据仓库系统要求的软件平台 在数据仓库所要解决的问题确定后,第二个步骤就是选择合适的软件平台,包括数据库、建模工具、分析工具等。这里有许多因素要考虑,如系统对数据量、响应时间、分析功能的要求等,以下是一些公认的选择标准: ·厂商的背景和支持能力,能否提供全方位的技术支持和咨询服务。 ·数据库对大数据量(TB级)的支持能力。 ·数据库是否支持并行操作。 ·能否提供数据仓库的建模工具,是否支持对元数据的管理。 ·能否提供支持大数据量的数据加载、转换、传输工具(ETT)。 ·能否提供完整的决策支持工具集,满足数据仓库中各类用户的需要。 3.建立数据仓库的逻辑模型 具体步骤如下: (1)确定建立数据仓库逻辑模型的基本方法。 (2)基于主题视图,把主题视图中的数据定义转到逻辑数据模型中。 (3)识别主题之间的关系。

数据仓库复习题

第一章概述 1.数据挖掘的定义?(书P2,PPT_P8) 从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 2.数据挖掘的源是否必须是数据仓库的数据?可以有哪些来源?(PPT_P14) 关系数据库、数据仓库、事务数据库、高级数据等 3.数据挖掘的常用方法?(P4、PPT_P29) 聚类分析、决策树、人工神经网络、粗糙集、关联规则挖掘、统计分析等 4.数据挖掘的过程包括哪些步骤,每一步具体包括哪些内容?(书P2-3,PPT_P17-19) 确定业务对象、数据准备、数据挖掘、结果分析与知识同化。 5.数据挖掘与数据仓库的关系(联系和区别)?书P6-7,PPT_P45-46 联系:1,数据仓库为数据挖掘提供了更好的,更广泛的数据源 2,数据仓库韦数据挖掘提供了新的支持平台。 3,数据仓库为更好地使用数据挖掘工具提供了方便 4,数据挖掘对数据仓库提供了更好的决策支持。 5,数据挖掘对数据仓库的数据组织提出了更高的要求 6,数据挖掘还为数据仓库提供了广泛的技术支持 区别:数据仓库是一种存储技术,它包含大量的历史数据、当前的详细数据以及综合数据,它能为不同用户的不同决策需要提供所需的数据和信息。~~数据挖掘是从人工智能机器学习中发展起来的,它研究各种方法和技术,从大量的数据中挖掘出有用的信息和知识。 第二章数据仓库 1.数据仓库的定义 数据仓库——是一个面向主题的、集成的、随时间而变化的、不容易丢失的数据集合,支持管理部门的决策定制过程。 2.数据仓库数据的四大基本特征: 面向主题的、集成的、不可更新的、随时间变化的。 3.数据仓库体系结构有三个独立的数据层次: 信息获取层、信息存储层、信息传递层。 4.粒度的定义?它对数据仓库有什么影响? (1)是指数据仓库的数据单位中保存数据细化或综合程度的级别。粒度越小,细节程度越高,综合程度越低,回答查询的种类就越多。 (2)影响存放在数据仓库中的数据量大小;影响数据仓库所能回答查询问题的细节程度。 5.在数据仓库中,数据按照粒度从小到大可分为四个级别: 早期细节级、当前细节级、轻度细节级和高度细节级。 6.数据分割的标准:可按日期、地域、业务领域、或按多个分割标准的组合,但一般包括日期项。 7.数据仓库设计中,一般存在着三级数据模型: 概念数据模型、逻辑数据模型、物理数据模型 8.数据仓库设计步骤 (1)概念模型设计 (2)技术准备工作 (3)逻辑模型设计 (4)物理模型设计 (5)数据仓库的生成

训诂学复习试题及答案

《训诂学》试题 一、单项选择题(每题的四个选项中只有一个正确答案,将答案写在题后的括号内,每小题1分,共20分) 1、以下着作,兼注音义的是() A、《尔雅》 B、《经传释词》 C、《经典释文》 D、《释名》 2、解释正文,同时解释前人注释的训诂术语是() A、疏 B、笺 C、音义 D、释文 3、柳宗元《捕蛇者说》:“苛政猛于虎也”,句中“政”指() A、统治 B赋税 C政治制度 D统治者 4、对原文的误字误读进行更正的术语是() A、之言 B、当为 C、读若 D、析言 5、训诂学史上,“浑言”、“析言”两个术语开始使用于() A、东汉 B、唐代 C、宋代 D、清代 6、提示同义词间内在联系及区别的术语是() A、读若 B、谓 C、如字 D析言 7、“盗,逃也”。释义的方式是() A、互训 B、直训 C、义界 D、推因 8、《陈情表》:“而今刘氏,日薄西山,气息淹淹。”句中“薄”的读音是() A、bá B、bà C、báo D、pā 9、“肥,多肉也”释义的方式是 A、互训 B、推因 C、摹写 D、义界 10、“百丈山怀海禅师始立天下禅林规式,谓之清规。”“清规”指() A、佛寺所定的规则和戒律 B、满清规矩 C、清真规矩 D、繁琐、不合理的成规 11、下列词语,属于佛教词汇的是() A、庄严 B、庄重 C、严肃 D、威严

12、《上林赋》:“仁频并闾”仁频即槟郎。句中“仁频”来自() A、朝鲜语 B、日语 C、爪哇语 D、马来西亚语 13、下列着作郭璞作注的是() A、《诗经》 B、《论语正义》 C、《孝经正义》 D、《尔雅正义》 14、孔颖达撰《五经正义》,包括《尚书正义》、《毛诗正义》、《礼记正义》、《春秋左传正义》和() A、《周易正义》 B、《论语正义》 C、《孝经正义》 D、《尔雅正义》 15、《孟子正义》的着者是() A、陈奂 B、马瑞尘 C、刘宝楠 D、焦循 16、汉朝人注释经籍鉴定了训诂学的基础,代表人物有() A、毛晋 B、郑玄 C、孔颖达 D、邢岗 17、训诂学发展的中落期在 A、先秦 B、两汉 C、魏至唐 D、宋至明 18、《诗经·南周·桃夭》:“之子于归,宜其室家。”“归”指() A、出嫁 B、回家 C、偿还 D、行礼 19、古籍在刻印、传抄过程中出现的失落字现象称为() A、衍文 B、脱文 C、讹文 D、倒文 20、利用他书来校勘本书的校勘法叫做() A、对校法 B、他校法 C、文物校书法 D、理校法 二、多项选择题(每小题列出的五个选项中至少有两个是符合题目要求的,将代码填写在题后的括号内,少选、错选、多选均不得分;本大题共5小题,每小题2分,共10分) 1、章炳麟《国故论衡》认为,“训诂”包含() A、通论 B、驸经 C、绪论 D、略例 E、概说 2、训诂的方法包括 A、据文证义 B、依境别义 C、因声求义 D、以形索义 E、析词审义 3、萧统的《文选》在唐代主要的注体有() A、李善注 B、五臣注 C、郭璞注 D、范宁注 E、孔颖达注

数据仓库报告

数据仓库 学号:20111004458 班级:193113 姓名:华秀 指导老师:李程俊 2015年1月20日

目录 一、数据仓库的定义 (3) 二、实时数据仓库的技术基础和研究现状 (3) 1.技术基础: (3) 2.研究现状 (7) 三、什么是OLTP、OLAP它们的区别有哪些? (8) OLTP: (8) OLAP: (8) OLAP和OLTP的区别 (8) 四、OLAP有哪些操作 (9) 五、数据立方体 (10) 六、数据挖掘分类 (11) 七、数据挖掘技术 (11) (1)决策树方法 (11) (2)关联规则 (12) (3)神经网络 (12) (4)遗传算法 (12) (5)聚类分析 (12) (6)统计学习 (12) (7)粗糙集 (13) 八、 K means聚类算法 (13)

一、数据仓库的定义 数据仓库之父Bill Inmon在1991年出版的“Building the Data Warehouse”一书中所提出的定义被广泛接受:数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。 对于数据仓库的概念我们可以从两个层次予以理解,首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。数据仓库是近年来才提出的新概念.所谓数据仓库(Data Warehouse)是指这样一种数据的存储地,来自于异地、异构的数据源或数据库的数据经加工后在数据仓库中存储、提取和维护.传统数据库主要面向业务处理,而数据仓库面向复杂数据分析、高层决策支持.数据仓库提供来自种类不同的应用系统的集成化和历史化的数据,为有关部门或企业进行全局范围的战略决策和长期趋势分析提供了有效的支持.数据仓库使用户拥有任意提取数据的自由,而不干扰业务数据库的正常运行. 当前,一些企业已经在传统数据处理方面有了较丰富的经验,他们采用数据仓库希望能从中得到更多好处,例如,以合理的代价取得有效的决策支持、促进企业中业务处理过程的重组、改善并强化对客户的服务、强化企业的资产/负债管理、促进市场优化、加速资金周转、帮助实现企业的规模优化.数据仓库的产生和发展为数据采掘技术开辟了新的战场,同时也提出了新的要求和挑战.目前的研究还主要着眼于数据仓库的构建和维护的基本理论、方法上,例如数据仓库更新问题的研究,因为这是迈向实用化的第一步的、首要的任务.下一步将把重点放在数据仓库的有效应用研究上.为高级的决策支持服务是数据仓库的最终目的,因此基于数据仓库的数据采掘理论和技术的研究,自然成为信息科学学术界的热点问题. 二、实时数据仓库的技术基础和研究现状 1.技术基础: 数据仓库系列技术,主要支撑技术有以下一些: 数据库技术、ETL技术、OLAP技术、元数据管理技术、前台展现技术、报表技术、挖掘技术、仿真优化技术。 这些支撑技术结合各行业业务后,可以生产各式各样的应用。当然这些技术中,重点突出了在数据仓库方面的特征,而忽略了计算机技术的一些特征。比如:OLAP技术,那么就需要计算机存储技术、压缩技术、分区技术、加解密技术、图形化技术等等,这里就不再单独列示。 数据库技术是支撑数据仓库技术的最基础技术。有关系数据库、层次数据库、网络数据库等类型,目前呈现比较好的发展态势的对象关系数据库也是一种类型。最典型的是关系数据库的应用。在数据仓库实践中,关系数据库是实质的数据库存储工具,但针对不同的数据仓库方案,有的关系数据库是还提供了有关的数据仓库元素的查询函数或组件,在支撑数据仓库数据存储的基础上,还能支撑数据仓库的数据探查,比如:Teradata,但是,大部分数据库,以及在大部分数据仓库建设方案中,只是利用数据库作为数据存储的工具。这样,实质上数据仓库与数据库在技术表现看起来可能是一样的,但是,在系统存储模型上却有着本质的区别。数据库技术在存储模型建设方面强调数据模型的规范性和高效存储能力(少冗

数据仓库-期末考试复习题

复习思考题(重点) 一、单项选择题 (1) 一般信息管理中,采用哪种方式的概念模型最多 A. MapReduce模型 B. 实体-关系模型 C.02O模型 D.B/S模型 (2)在关系表中,下列哪种属性不能承担主列关键字(Key)? A. 身份证号 B.银行卡号 C.加密电文 D.企业标识码 (3)数据仓库的生命周期中,不包含下列哪个阶段? A.规划分析阶段 B.设计实施阶段 C.使用维护阶段 D.反馈提升阶段 (4)多维切片是指: A.在多个维度上观察全员操作 B.多个成员的操作片段 C.旋转数据集的部分维度 D.在线分析或联机分析 (5) 一般信息管理中,采用哪种方式的分布式物理模型最多 A. MapReduce模型 B. 实体-关系模型 C.02O模型 D.B/S模型 (6)在关系表中,下列哪种属性可以成为外键(Key)? A. 客户信用程度 B.银行卡行号 C.加密的身份证号 D.实体商户地址 (7)数据仓库的生命周期中,不包含下列哪个阶段排在第三阶段? A.规划分析阶段 B.设计实施阶段 C.使用维护阶段 D.反馈提升阶段 (8)多维报表是指: A.在多个维度上观察全员操作 B.不同维度格式不同叠加展示 C.旋转数据集的部分维度 D.在线分析或联机分析 (9)数据表的多维索引的作用是: A.使数据表更节省存储空间 B.加快数据存储速度 C. 表格格式美观大方 C. 加快数据查找效率 (10)MapRedude结构中的MAP职能是? A.钻取 B.汇聚 C.分发 D.结晶 (11)下列哪种客户需求可以直接成为数据仓库的多维报表? A.客户销售业绩清单 B.客户基本名册 C.客户关系图表 D.客户反馈信息 (12) 数据仓库开发强调哪种主体特征? A. 信息安全性 B.业务流程 C.操作事务性 D.数据实时性 (13)数据仓库与数据库系统相比,更加提倡: A.空间换时间 B.数据范式更严格 C.冗余度更小 C. 更加适用于分布式结构 (14)透视表属于OLAP中的哪种能力范畴? A.存储能力 B.展示能力 C.稳定性能力 D.安全性能力 (15)OLAP的系统结构分为: A.胖客户端系统和瘦客户端系统 B. OLAP服务器和多维数据存储 C. OLAP服务器和传输分析处理后结果 C. 多维数据存储和分析处理后结果 (16)MapRedude结构中的Reduce职能是? A.钻取 B.汇聚 C.分发 D.结晶 (17)下列哪种信息不能直接成为数据仓库的元数据? A.客户姓名的格式 B.客户基本信息 C.客户关系图 D.客户反馈法则 (18) noSQL数据库更强调哪种特征? A. 不兼容SQL命令 B.非关系结构 C.非事务性 D.分布式计算 (19)下列哪种关于数据仓库开发的观点是错误的?

训诂学试题(1)汇总

训诂学试题 一、解释下列训诂术语(每题3分,共15分) 1.形训——是以形说义的方法,即通过对字的形体结构的分析来寻求解释词义的释词方法。 2.互训——即以意义相同之字,相互训释。 3.犹——相当于现代汉语的“等于说”,一般用于以同义词或近义词作释。 4.读曰——又称“读为”“破字”,即用本字本义来说明假借字。 5.当为——校勘术语,用以直接指明正字以纠正误字。也称“当作”。 二、填空题(每空1分,共20分) 1.我国的传统语言学(旧称小学)大体上包括三个部分,即_音韵学_、_文字学_、_训诂学_。 2.所谓义疏,也是一种传注形式,其名源于六朝佛家的解释佛典,以后泛指_正义_。 3.学习和研究训诂学,应该采取正确的态度,它要求实事求是、无征不信。具体说来,应注意如下三点:一曰务平实,忌好奇;二曰重证据,戒臆断;三曰宁阙疑,勿强解。 4.谓和谓之不同:使用谓之时,被释的词放在谓之的后面;使用谓时,被释的词放在谓的前面。 5.《一切经音义》有两种,一种的编者是释玄应,凡二十五卷;另一种的编者是释慧琳,凡一百卷。 6.王念孙、王引之,世称高邮王氏父子,称他们的四部主要著作为高邮王氏四种,即:《读书杂志》、《广雅疏证》、《经义述闻》、《经传释词》。 7.读破又称破字或易字,这个术语包含两个意思:其一是指用本字来改读古书中的假借字。其二是指改变一个字原来的读音以表示意义的转变。 8.训诂的中心内容是释词,因此所谓训诂的方法,主要就是释词的方法。 三、辨识下列各题解释的正误(判断下列各题,正确的在题后括号内打“√”,错的打“╳”。每小题2分,共10分) 1.诸将微闻其计,以告项羽。( ╳ ) 微闻:略略听到。 2.若跨有荆、益,保其岩阻。( √ ) 保:依恃,凭仗。 3.察笃夭隐,孤寡存只。( √ ) 笃:察。 4.杯觞引满从衣湿,墙壁书多任手顽。( ╳ ) 从:随着。 5.牧童向日眠春草,渔父隈岩避晚风。(╳ ) 隈:躲在。 五、写出下列训诂学家的主要著作(每小题1分,共8分) 1.郝懿行:《易说》《书况》 2.刘熙:释名、孟子注 3.张揖:广雅、埤仓、古今字诂 4.颜师古:匡谬正俗、急就章注、汉书注、五经正义 5.郭璞:尔雅注 6.服虔:春秋左氏传行谊、春秋汉义驳 7.邢昺:论语正义尔雅义疏孝经正义 8.桂馥:说文解字义证 六、写出下列著作的作者及主要内容(每题4分,共12分) 1.周礼正义——书名,八十六卷,二百余万字,

材料力学B试题6弯曲变形

弯曲变形 1. 已知梁的弯曲刚度EI 为常数,今欲使梁的挠曲线在x =l /3处出现一拐点,则比值M e1/M e2为: (A) M e1/M e2=2; (B) M e1/M e2=3; (C) M e1/M e2=1/2; (D) M e1/M e2=1/3。 答:(C) 2. 外伸梁受载荷如 致形状有下列(A)(B)、(C),(D)四种: 答:(B) 3. 简支梁受载荷并取坐标系如图示,则弯矩M 、剪力F S 与分布载荷q 之间的关系以及挠曲线近似微分方程为: (A)EI x M x w q x F F x M ) (d d ,d d , d d 2 2S S ===; (B)EI x M x w q x F F x M ) (d d ,d d , d d 2 2 S S =-=-=; (C)EI x M x w q x F F x M )(d d ,d d , d d 2 2S S -==-=; (D)EI x M x w q x F F x M )(d d ,d d , d d 2 2S S -=-==。 答:(B) 4. 弯曲刚度为EI 的悬臂梁受载荷如图 示,自由端的挠度EI l M EI Fl w B 232 e 3+=(↓) 则截面C 处挠度为:

(A)2 e 3 322323??? ??+??? ??l EI M l EI F (↓); (B)2 3 3223/323?? ? ??+??? ??l EI Fl l EI F (↓); (C)2 e 3 322)3/(323? ? ? ??++??? ??l EI Fl M l EI F (↓);(D)2 e 3 322)3/(323? ? ? ??-+??? ??l EI Fl M l EI F (↓)。 答:(C) 5. 画出(a)、(b)、(c)三种梁的挠曲线大致形状。 答: 6. 7. (a)、(b)刚度关系为下列中的哪一种: (A) (a)>(b); (B) (a)<(b); (C) (a)=(b); (D) 不一定。 答:(C) 8. 试写出图示等截面梁的位移边界条件,并定性地画出梁的挠曲线大致形状。 答:x =0, w 1=0, 1 w '=0;x =2a ,w 2 w 2;x =2a ,32 w w '='。 9. 试画出图示静定组合梁在集中力F 作用下挠曲线的大致形状。 (a) (b) (c) w ===θw w

数据仓库与数据挖掘课程设计报告书

目录 1. 绪论 (2) 1.1项目背景 (2) 1.2 提出问题 (2) 2 数据库仓库与数据集的概念介绍 (2) 2.1数据仓库 (2) 2.2数据集 (2) 3 数据仓库 (3) 3.1 数据仓库的设计 (3) 3.1.1数据仓库的概念模型设计 (3) 3.1.2数据仓库的逻辑模型设计 (3) 3.2 数据仓库的建立 (3) 3.2.1数据仓库数据集 (3) 3.2.2建立维表 (4) 4.数据挖掘操作 (4) 4.1数据预处理 (4) 4.1.1描述性数据汇总 (4) 4.2决策树 (4) 5、实验心得 (12) 6、大总结 (12)

1. 绪论 1.1项目背景 在现在大数据时代,各行各业需要对商品及相关关节的数据进行收集处理,尤其零售行业,于企业对产品的市场需求进行科学合理的分析,从而预测出将来的市场,制定出高效的决策,给企业带来经济收益。 1.2 提出问题 对于超市的商品的购买时期和购买数量的如何决定,才可以使销售量最大,不积压商品,不缺货,对不同时期季节和不同人群制定不同方案,使企业收益最大,通过数据挖掘对数据进行决策树分析,关联分析,顺序分析与决策分析等可以制定出最佳方案。 2 数据库仓库与数据集的概念介绍 2.1数据仓库 数据仓库是为企业所有级别的决策制定过程提供支持的所有类型数据的战略集合。它是单个数据存储,出于分析性报告和决策支持的目的而创建。为企业提供需要业务智能来指导业务流程改进和监视时间、成本、质量和控制。 数据仓库是决策系统支持(dss)和联机分析应用数据源的结构化数据环境。数据仓库研究和解决从数据库中获取信息的问题。数据仓库的特征在于面向主题、集成性、稳定性和时变性。 2.2数据集 数据集是指一种由数据所组成的集合。Data set(或dataset)是一个数据的集合,通常以表格形式出现。每一列代表一个特定变量。每一行都对应于某一成员的数据集的问题。它列出的价值观为每一个变量,如身高和体重的一个物体或价值的随机数。每个数值被称为数据资料。对应于行数,该数据集的数据可能包括一个或多个成员。

2018年自考《训诂学》试题及答案

2018年自考《训诂学》试题及答案 填空题 □“训”和“诂”两个字连用,最早见于汉代毛亨所作的《毛诗诂训传》。 □孔颖达认为:“诂者,古也。古今异言,通之使人知也。训者,道也。道物之貌以告人也。”“诂”是解释“异言”的,“训”是“道形貌”的。 □《毛诗诂训传名义考》的作者是马瑞辰。 □黄侃先生认为:诂就是故,本来的意思。解释词的本义。训就是顺,引申的意思,解释词的引申义。训诂是用语言来解释语言,包括词的本义和引申义。□训诂工作是以扫除古代文献中语言文字障碍为实用目的的一种工具性的专 门工作。 □训诂工作主要有三种:注释工作、纂集工作、考证工作。 □训诂材料包括:随文释义的注释材料,跟注释工作相对应;纂集类训诂专书,跟纂集工作相对应;考证材料,与考证工作相对应的材料。 □前人所称的“传”、“说”、“解”、“诠”、“疏”、“证”、“微”、“诂”、“注”、“义证”、“正义”等,都是随文注释的名称。 □纂集类训诂专书有:依物类分篇汇集同训词的《尔雅》;依照据形说义原则用部首统帅文字的《说文解字》;专门纂集声训以明语源的《释名》;沟通方言词与标准语音义的《方言》等。 □考证专书包括:孔颖达《五经正义》;顾炎武《日知录》;王念孙、王引之《读书杂志》与和《经义述闻》;钱大昕《二十二史考异》与《十驾斋养新录》;赵翼《陔余丛考》;沈家本《历代刑法考》;李慈铭《越慢堂日记》; □训诂体例指训诂工作中所运用的训诂体式和条例。它包括对训诂现象的科学解释,对训诂方法科学依据的理论说明和从程序上加以分解,对文献词义的存在形式、运动规律、特点性质的科学论述。 □黄侃说:“训诂者,用语言解释语言之谓。若以此地之语释彼地之语,或以今时之语释昔时之语,虽属训诂之所有事,而非构成之原理。真正之训诂学,即以语言解释语言,初无时地之限域,且论其法式,明其义例,以求语言文字之系统与根源是也。” □训诂是用语言解释语言的材料,训诂学是研究语言意义的理论。 □训诂学三个时期是:早期训诂学、晚期训诂学、现代训诂学。 □文字学、音韵学和训诂学(字的形、音、义)古代合称“小学”。 □训诂学在具体实践中所面临的两大任务是:应用训诂学和理论训诂学。 □应用训诂学侧重于实际应用,主要是解读和注释古代文献。 □理论训诂学侧重于理论探讨,如词和义之间的关系等。□应用训诂学和理论训诂学二者的关系是:理论探讨以实际应用为目的,实际应用以理论探讨为指导。 □训诂的产生期在先秦两汉;训诂的深入与扩展期在魏晋隋唐;训诂的更新与变革期在宋元明;训诂实践的兴盛与训诂理论的探讨期在清代;训诂学科学理论的创建期在近现代。 □训诂的萌芽期在先秦,训诂工作的系统化期在两汉。 □训诂发展的标志主要表现在以下三个方面:再度注释的出现、训诂范围的扩大、集注、集解的出现与字书、韵书、义书的分立。 □再度注释的代表是孔颖达奉敕所作的《五经正义》。 □郭璞注《尔雅》和《方言》。

工程力学习题库-弯曲变形

第8章 弯曲变形 本章要点 【概念】平面弯曲,剪力、弯矩符号规定,纯弯曲,中性轴,曲率,挠度,转角。 剪力、弯矩与荷载集度的关系;弯曲正应力的适用条件;提高梁的弯曲强度的措施;运用叠加法求弯曲变形的前提条件;截面上正应力分布规律、切应力分布规律。 【公式】 1. 弯曲正应力 变形几何关系:y ερ = 物理关系:E y σρ = 静力关系:0N A F dA σ==?,0y A M z dA σ==?,2z z A A EI E M y dA y dA σρ ρ == =?? 中性层曲率: 1 M EI ρ = 弯曲正应力应力:,M y I σ= ,max max z M W σ= 弯曲变形的正应力强度条件:[]max max z M W σσ=≤ 2. 弯曲切应力 矩形截面梁弯曲切应力:b I S F y z z S ??=* )(τ,A F bh F S S 2323max ==τ 工字形梁弯曲切应力:d I S F y z z S ??=* )(τ,A F dh F S S ==max τ 圆形截面梁弯曲切应力:b I S F y z z S ??=* )(τ,A F S 34max =τ 弯曲切应力强度条件:[]ττ≤max

3. 梁的弯曲变形 梁的挠曲线近似微分方程:() ''EIw M x =- 梁的转角方程:1()dw M x dx C dx EI θ= =-+? 梁的挠度方程:12()Z M x w dx dx C x C EI ??=-++ ??? ?? 练习题 一. 单选题 1、 建立平面弯曲正应力公式z I My /=σ,需要考虑的关系有( )。查看答案 A 、平衡关系,物理关系,变形几何关系 B 、变形几何关系,物理关系,静力关系; C 、变形几何关系,平衡关系,静力关系 D 、平衡关系, 物理关系,静力关系; 2、 利用积分法求梁的变形,不需要用到下面那类条件( )来确定积分常 数。查看答案 A 、平衡条件 B 、边界条件 C 、连续性条件 D 、光滑性条件 3、 在图1悬臂梁的AC 段上,各个截面上的( )。 A .剪力相同,弯矩不同 B .剪力不同,弯矩相同 C .剪力和弯矩均相同 D .剪力和弯矩均不同 图1 图2 4、 图2悬臂梁受力,其中( )。

数据仓库与数据挖掘课后习题答案

数据仓库与数据挖掘 第一章课后习题 一:填空题 1)数据库中存储的都是数据,而数据仓库中的数据都是一些历史的、存档的、归纳的、计算的数据。 2)数据仓库中的数据分为四个级别:早起细节级、当前细节级、轻度综合级、高度综合级。3)数据源是数据仓库系统的基础,是整个系统的数据源泉,通常包括业务数据和历史数据。4)元数据是“关于数据的数据”。根据元数据用途的不同将数据仓库的元数据分为技术元数据和业务元数据两类。 5)数据处理通常分为两大类:联机事务处理和联机事务分析 6)Fayyad过程模型主要有数据准备,数据挖掘和结果分析三个主要部分组成。 7)如果从整体上看数据挖掘技术,可以将其分为统计分析类、知识发现类和其他类型的数据挖掘技术三大类。 8)那些与数据的一般行为或模型不一致的数据对象称做孤立点。 9)按照挖掘对象的不同,将Web数据挖掘分为三类:web内容挖掘、web结构挖掘和web 使用挖掘。 10)查询型工具、分析型工具盒挖掘型工具结合在一起构成了数据仓库系统的工具层,它们各自的侧重点不同,因此适用范围和针对的用户也不相同。 二:简答题 1)什么是数据仓库?数据仓库的特点主要有哪些? 数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支

持管理决策。 主要特点:面向主题组织的、集成的、稳定的、随时间不断变化的、数据的集合性、支持决策作用 2)简述数据挖掘的技术定义。 从技术角度看,数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取隐含在其中的、人们不知道的、但又是潜在有用的信息和知识的过程。 3)什么是业务元数据? 业务元数据从业务角度描述了数据仓库中的数据,它提供了介于使用者和实际系统之间的语义层,使得不懂计算机技术的业务人员也能够读懂数据仓库中的数据 4)简述数据挖掘与传统分析方法的区别。 本质区别是:数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所得到的信息应具有先前未知、有效和实用三个特征。 5)简述数据仓库4种体系结构的异同点及其适用性。 a.虚拟的数据仓库体系结构 b.单独的数据仓库体系结构 c.单独的数据集市体系结构 d.分布式数据仓库结构

《训诂学基础》期末试题A卷附答案

《训诂学基础》期末试题A卷附答案 试题部分 一、单项选择题(每小题1分,共5分) 1.?训?和?诂?两个字连用,最早见于( ) A. 《毛诗诂训传》 B. 《毛诗诂训传名义考》 C. 《说文解字》 D. 《尔雅》 2.魏晋隋唐时期是() A. 训诂的产生期 B. 训诂的深入与扩展期 C. 训诂的更新与变革期 D. 训诂实践的兴盛与训诂理论的探讨期 3.《说文解字注》的作者是() A. 许慎 B. 梅膺祚 C. 段玉裁 D. 戴震 4.《墨子间诂》属于() A. 传注 B. 章句 C. 义疏 D. 集解 5.《释名》的作者是() A. 许慎 B. 段玉裁 C. 刘熙 D. 黄侃 二、填空题(每小题2分,共10分) 1.三种不同性质的训释是:、、。 2.训诂考证的三种方法:、、。 3.黄侃先生认为:诂就是,本来的意思。解释词的。训就是,引申的意思,解释词的。训诂是用语言来解释语言,包括词的。 4.声训的作用主要有两个:、。 5.从训诂的体式来看,专门解释古书正文的叫,既解释古书的正文,又解释前人的传住的一般叫。 三、名词解释题(每小题3分,共18分) 1.乾嘉学派: 2.《经籍纂诂》: 3.以形说义: 4.义训:

5.同源词: 增字足义: 四、说明下列各例属何种训诂方式(每小题1分,共10分) 1、宫谓之室,室谓之宫。(《尔雅·释宫》) 2、党、晓、哲,知也。楚谓之党,或曰晓;齐宋之间谓之哲。(《方言》) 3、二足以羽谓之禽,四足而毛谓之兽。(《尔雅·释鸟》) 4、邑外曰郊,郊外曰野。(《诗政训传》) 5、天,颠也。(《说文解字》) 6、福者,备也;备者,备百顺之名也,无所不顺之谓备。(《礼记》) 7、采,采取也,从木从爪。(《说文解字》) 8、庸也者,用也;用也者,通也者,得也。(《庄子·齐物论》) 9、乱,治也。(《尔雅·释诂》) 10、黑与青谓之黻,五色备课之绣。(《诗政训传》) 五、简答题(每小题5分,共25分) 1.义界的实质、原则是什么?它的局限性是什么? 2.通释语义与随文释义的区别是什么? 3.解释?望文生训?的含义,并说明产生这一训诂弊病的主要原因。

材料力学习题册答案第章弯曲变形

第六章弯曲变形 一、是非判断题 1.梁的挠曲线近似微分方程为EIy’’=M(x)。(√)2.梁上弯矩最大的截面,挠度也最大,弯矩为零的截面,转角为零。(×)3.两根几何尺寸、支撑条件完全相同的静定梁,只要所受载荷相同,则两梁所对应的截面的挠度及转角相同,而与梁的材料是 否相同无关。(×)4.等截面直梁在弯曲变形时,挠曲线的曲率最大值发生在转角等于零的截面处。(×)5.若梁上中间铰链处无集中力偶作用,则中间铰链左右两侧截面的挠度相等,转角不等。(√)6.简支梁的抗弯刚度EI相同,在梁中间受载荷F相同,当梁的跨度增大一倍后,其最大挠度增加四倍。(×)7.当一个梁同时受几个力作用时,某截面的挠度和转角就等于每一个单独作用下该截面的挠度和转角的代数和。(√)8.弯矩突变的截面转角也有突变。(×) 二、选择题 1. 梁的挠度是(D) A 横截面上任一点沿梁轴线方向的位移 B 横截面形心沿梁轴方向的位移 C横截面形心沿梁轴方向的线位移

D 横截面形心的位移 2. 在下列关于挠度、转角正负号的概念中,(B)是正确的。 A 转角的正负号与坐标系有关,挠度的正负号与坐标系无关 B 转角的正负号与坐标系无关,挠度的正负号与坐标系有关 C 转角和挠度的正负号均与坐标系有关 D 转角和挠度的正负号均与坐标系无关 3. 挠曲线近似微分方程在(D)条件下成立。 A 梁的变形属于小变形 B 材料服从胡克定律 C 挠曲线在xoy平面内 D 同时满足A、B、C 4. 等截面直梁在弯曲变形时,挠曲线的最大曲率发生在(D)处。 A 挠度最大 B 转角最大 C 剪力最大 D 弯矩最大 5. 两简支梁,一根为刚,一根为铜,已知它们的抗弯刚度相同。跨中作用有相同的力F,二者的(B)不同。 A支反力 B 最大正应力 C 最大挠度D最大转角6. 某悬臂梁其刚度为EI,跨度为l,自由端作用有力F。为减小最大挠度,则下列方案中最佳方案是(B) A 梁长改为l /2,惯性矩改为I/8 B 梁长改为3 l /4,惯性矩改为I/2 C 梁长改为5 l /4,惯性矩改为3I/2 D 梁长改为3 l /2,惯性矩改为I/4 7. 已知等截面直梁在某一段上的挠曲线方程为: y(x)=Ax2(4lx - 6l2-x2),则该段梁上(B)

数据仓库习题答案

第一章 1.为什么不能依靠传统的业务处理系统进行决策分析?(P1-3) 2.在将数据源中的数据加载到数据仓库之前需要完成那些工作?为什么要进行这些工作?(数据准备P13-14 另外加“抽取”) 3.(选做)如果创建一个数据仓库,主要是分析关于客户的人口统计(收入、家庭人口、家庭位置、爱好等)。数据仓库的目的在于将特定的产品推销给合适的潜在客户群。这个数据仓库应该从哪些地方获取数据源,数据仓库的体系结构应该包含哪些部分。(P12,8) 4.从数据挖掘与数据库、统计学、机器学习的关系来讨论什么是数据挖掘? 5.在数据挖掘过程中需要涉及到哪些过程?(P31-35) (1). 确定挖掘对象 清晰地定义出业务问题,认清数据挖掘的目的是数据挖掘的重要一步. (2)数据准备 1) 数据的选择:选择出适用于数据挖掘应用的数据. 2) 数据的预处理:研究数据的质量, 并确定将要进行的挖掘操作的类型.、(3) 模型的构建:建立一个分析模型.这个分析模型是针对挖掘算法建立的。(4)数据挖掘:对所得到的经过转换的数据进行挖掘. (5)结果分析:解释并评估结果.其使用的分析方法一般应作数据挖掘操作而定,通常会用到可视化技术. (6)知识的应用:将分析所得到的知识集成到业务信息系统的组织结构中去,使其在实际的管理决策分析中得到应用 6.在现实中有哪些人需要使用数据挖掘技术来帮助他的工作? (P35) 第二章 名词解释; 维:关于一个组织想要记录的透视或实体。 维表:对维各个属性的描述。 事实:数值的度量。 事实表: 包括事实的名称或度量,以及每个相关维表的关键字。 元数据: 数据的数据,可以对数据仓库中的各种数据进行详细的描述与说明,说明每个数据的上下关系,使每个数据具有符合现实的真实含义,使用户可以了解这些数据之间的关系. 粒度:数据仓库中数据单元的详细程度和级别. 星型模型: 最常用的数据仓库设计结构的实现模式。使数据仓库形成了一个集成系统,为用户提供分析服务对象。核心是事实表,围绕事实表的是维度表。通过事实表将各种不同的维度表连接起来,各个维度表都连接到中央事实表。雪花模型:对星型模型的冗余的维度表进一步分解,对星型模型中的维度表进行了规范化处理。 问答: 1.简述olap 与oltp的区别; Olap:在线分析处理;oltp:联机事务处理。 PAGE 5

历史系史学概论考试试题及答案

一切历史都是当代史:这个命题包含三层意思:一是研究历史总是研究者现时 现刻的思想活动;二是历史研究是由现时生活需要激发起来的;三是历史是按 现时人的兴趣和价值取向来思考和理解的。这个命题含有明显的历史相对主义 的消极成分,但也含有一定的合理因素,那就是确认了一个事实:历史认识的 起点,来源于研究者感受到的现实需要。 列举从古自今史考的名著:司马光《通鉴考异》、顾炎武《日知录》、赵翼《廿二史札记》、钱大昕《廿二史考异》、王鸣盛《十七史商榷》、章学诚《文史通义》、崔述《考信录》 列举20世纪历史学概论性著作:曹佐熙《史学通论》、李则纲《史学通论》、周容《史学通论》、杨鸿烈《史学通论》、李大钊《史学要论》、朱希祖《中国史学通论》、蒋祖怡《史学纂要》。 列举史学方法著作:梁启超《中国历史研究法》、姚永朴《历史研究法》、浮田和民《史学原论》、梁启超《新史学》 马克思史学的东西:翦伯赞《中国史纲》、范文澜《中国通史简编》、吕振羽《简明中国通史》 侯外庐《中国思想通史》、郭沫若《中国古代社会研究》 列举出列举出五部查阅资料的工具书:唐代欧阳洵《艺文类聚》、北宋李昉、李穆《太平御览》、三国魏文帝时刘劭、王象等《皇览》、明解缙《永乐大典》、,清纪昀《四库全书总目》、宋代李昉﹑扈蒙﹑李穆《太平广记》、北宋李昉﹑徐铉﹑宋白及苏易《文苑英华》、清朝陈梦雷《古今图书集成》、唐初的虞世南《北堂书钞》 名解历史观:历史观又称“社会历史观”。人们对社会历史的根本观点、总的看法,是世界观的组成部分。世界观与历史观是相互影响、相互制约的。历史观 的基本问题是社会存在与社会意识的关系问题,这是哲学基本问题在社会历史 领域的延伸。阶级史观(革命史观) 又称阶级斗争史观,从阶级的视角去研究历史,研究各个历史阶层中不同主导的阶级和各个阶级的发展状况对所在历史时 期的影响、文明史文明史观认为,人类社会的历史就是人类文明演进的历史、 唯物史观生产力决定生产关系,生产关系综合的经济基础决定上层建筑;生产 关系对生产力,上层建筑对经济基础有巨大的反作用。全球史观(整体史观)、(近)现代化史观、英雄史观、正统史观、个人历史观等。 历史比较研究法:历史比较研究法是对历史上同类事件、人物和现象进行比较 和对照,并分析其异同及缘由,从而寻求历史规律的一种方法。遵循“可比性 原则”——拿来作比较的事物,其材料必须是同类的,同一范畴的,采用同一 标准的,处理方法也是相同的。从历史事实出发进行比较。明确比较研究的主 题,确定比较对象。深入比较,找出异同。广泛验证,揭示规律。这样就有助 于克服史学研究的片面性、狭隘性,可以起到“间接实验法”的作用结论鲜明, 有说服力有助于开拓视野,启发思路,发现新问题。比较方法不是唯一的,也 不是万能的,结论会有不完全性或或然性,结论还带有很大的揣测性,容易产 生牵强附会。

数据仓库与数据挖掘习题

数据仓库与数据挖掘习题 1.1什么是数据挖掘?在你的回答中,强调以下问题: (a) 它是又一个骗局吗? (b) 它是一种从数据库,统计学和机器学习发展的技术的简单转换吗? (c) 解释数据库技术发展如何导致数据挖掘 (d) 当把数据挖掘看作知识发现过程时,描述数据挖掘所涉及的步骤。 1.2 给出一个例子,其中数据挖掘对于一种商务的成功至关重要的。这种商务需要什么数据挖掘功能?他们能够由数据查询处理或简单的统计分析来实现吗? 1.3 假定你是Big-University的软件工程师,任务是设计一个数据挖掘系统,分析学校课程数据库。该数据库包括如下信息:每个学生的姓名,地址和状态(例如,本科生或研究生),所修课程,以及他们累积的GPA(学分平均)。描述你要选取的结构。该结构的每个成分的作用是什么? 1.4 数据仓库和数据库有何不同?它们有那些相似之处? 1.5简述以下高级数据库系统和应用:面向对象数据库,空间数据库,文本数据库,多媒体数据库和WWW。 1.6 定义以下数据挖掘功能:特征化,区分,关联,分类,预测,聚类和演变分析。使用你熟悉的现实生活中的数据库,给出每种数据挖掘的例子。 1.7 区分和分类的差别是什么?特征化和聚类的差别是什么?分类和预测呢?对于每一对任务,它们有何相似之处? 1.8 根据你的观察,描述一种可能的知识类型,它需要由数据挖掘方法发现,但未在本章中列出。它需要一种不同于本章列举的数据挖掘技术吗? 1. 9 描述关于数据挖掘方法和用户交互问题的三个数据挖掘的挑战。 1. 10 描述关于性能问题的两个数据挖掘的挑战。 2.1 试述对于多个异种信息源的集成,为什么许多公司宁愿使用更新驱动的方法(构造使用数据仓库),而不愿使用查询驱动的方法(使用包装程序和集成程序)。描述一些情况,其中查询驱动方法比更新驱动方法更受欢迎。 2.2 简略比较以下概念,可以用例子解释你的观点 (a)雪花模式、事实星座、星型网查询模型 (b)数据清理、数据变换、刷新 (c)发现驱动数据立方体、多特征方、虚拟仓库 2.3 假定数据仓库包含三个维time,doctor和patient,两个度量count 和charge,其中charge 是医生对一位病人的一次诊治的收费。 (a)列举三种流行的数据仓库建模模式。 (b)使用(a)列举的模式之一,画出上面数据仓库的模式图。 (c)由基本方体[day,doctor,patient]开始,为列出2000年每位医生的收费总数,应当执行哪些OLAP操作? (d)为得到同样的结果,写一个SQL查询。假定数据存放在关系数据库中,其模式如下:fee(day,month,year,doctor,hospital,patient,count,charge) 2.4 假定Big_University的数据仓库包含如下4个维student, course, semester和instructor,2个度量count和avg_grade。在最低的概念层(例如对于给定的学生、课程、学期和教师的组合),度量avg_grade存放学生的实际成绩。在较高的概念层,avg_grade存放给定组合的

相关主题
文本预览
相关文档 最新文档