数据仓库逻辑模型试题
- 格式:docx
- 大小:36.80 KB
- 文档页数:2
数据仓库架构师笔试题1、请简述下什么缓慢变化维,以及通过设计怎样解决缓慢变化维的问题。
参考答案:这道题是数据仓库的基础知识题,能答对答全的基本可确定对方有一定的数据仓库开发和设计经验。
1)2、请简述下数据仓库一般有哪两种设计模式,以及这两种设计模式的优缺点。
参考答案:这题属于简单的基础知识题。
其解题思路如下:1)能准确说出雪花模型和星型模型这两个模型的,算及格。
2)能描述出雪花模型和星形模型分别是怎样一种模型,比如星型模型是维度与事实表直接关联,不存在多层维度的结构,而雪花模型层了维度表保持三范式或准三范式设计外其它与星形模型一样的,最好能用图例画出来的,得90分。
3)能够说出雪花模型和星形模型的优缺点的,其中星形模型减少了关联,用空间换时间,性能更优,雪花模型结构更清晰,维护更方便,但性能差一些。
通常的数据仓库建设都是两者的混合模式存在。
得满分。
3、请简述下自己做过的项目中用过那些实体,以及各实体间的关系,并将实体中的一些核心属性列出来。
参考参考:这道题没有标准答案,根据各自项目的情况有不同答案,首先面试者必须将项目中的关键实体、实体属性,以及实体间的关系描述出来。
另外可以通过对方的描述,了解对方在对所做项目的了解程度,在项目中承担的角色和作用,以及对方的语言沟通能力。
4、7、请简述下在实体关系是1对1,1对多,多对多的情况下,怎么去设计表来记录两个实体之间的关系,可举例说明。
参考答案:本题算是一道相对简单的设计基础题,如果这题答不出来,基本确定没什么数据库设计经验,并且作为开发人员对数据库结构的了解也是很有限的。
解题思路如下:1)1对1关系可以将其中一个表的主键带到另一个表中,以便于关联查询。
2)1对多关系只能将前者的主键带在后者的表中,不能反过来。
比如学校和班级表,只能表学校的标识放在班级表中,而不能反过来。
3)多对多关系则必须在两者之间额外创建一张中间表(一般叫交叉表),这个答案才是最关键的答案,没答对这个,基本可以判定不及格。
数据库题库含参考答案一、单选题(共98题,每题1分,共98分)1.在数据库应用系统生命周期模型中,规划与分析阶段的输出结果不包括()。
A、项目计划书B、需求规范说明书C、可行性分析报告D、系统范围与边界正确答案:B2.下列哪些属性不适合建立索引?()。
A、经常岀现在GROUP BY子句中的属性B、经常参与连接操作的属性C、经常出现在WHERE子句中的属性D、经常需要进行更新操作的属性正确答案:D3.下列属于数据仓库特点的是()。
A、一次处理的数据量小B、综合性和提炼性数据C、面向操作人员,支持日常操作D、重复性的、可预测的处理正确答案:B4.下述哪一个SQL语句用于实现数据存取的安全机制()。
A、COMMITB、ROLLBACKC、GRANTD、CREATE TABLE正确答案:C5.有教师表(教师号,姓名,职称.所在系)和授课表(教师号,课程号,授课学年,授课时数),同一门课程可由多个教师讲授,同一个教师也可讲授多门课程,査询从未被“教授”讲授过的课程的课程号,正确的语句是()。
A、SELECT课程号FROM授课表a JOIN教师表bON a 教师号=b.教师号WHERE职称!='教授'B、SELECT课程号FROM授课表a RIGHTOUTTER JOIN教师表bONa.教师号=b.教师号C、SELECT课程号FROM授课表WHERE课程号NOT IN (SELECT课程号FROM授课表a JOIN授课表b ON a 教师号=b.教师号WHERE职称!='教授')D、SELECT课程号FROM授课表WHERE课程号IN (SELECT课程号FROM授课表a JOIN授课表b ON a 教师号=b.教师号WHERE职称!=,教授,)正确答案:D6.下列有关范式的叙述中正确的是()。
A、如果关系模式RG 1NF,且R中主属性完全函数依赖于码,则R是2NFB、如果关系模式RG3NF, X、YCU,若X—Y,则R是BCNFC、如果关系模式ReBCNF,若X一一Y (Y4X)是平凡的多值依赖,则R 是4NFD、—个关系模式如果属于4NF,则一定属于BCNF;反之不成立正确答案:D7.下列说法正确的是( )。
数据模型决策期末考试试题### 数据模型决策期末考试试题#### 一、选择题(每题2分,共20分)1. 以下哪项不是数据模型的组成部分?A. 数据结构B. 数据操作C. 数据存储D. 数据分析2. 在数据库设计中,规范化的目的是什么?A. 提高查询速度B. 减少数据冗余C. 增加数据安全性D. 降低存储成本3. 以下哪个是关系数据库管理系统(RDBMS)的特点?A. 支持非结构化数据B. 支持多用户并发访问C. 只支持单一数据类型D. 数据存储在单一文件中4. 数据仓库与操作型数据库的主要区别是什么?A. 数据仓库主要用于数据存储B. 数据仓库主要用于数据挖掘和分析C. 数据仓库使用关系模型D. 数据仓库不支持SQL查询5. 在数据建模中,实体-关系图(ER图)的主要作用是什么?A. 描述数据的存储方式B. 描述数据的逻辑结构C. 描述数据的物理结构D. 描述数据的访问权限#### 二、简答题(每题10分,共30分)1. 简述数据库的三种主要范式,并说明它们各自的作用。
2. 解释什么是维度建模,并举例说明其在数据仓库中的应用。
3. 描述数据挖掘与数据分析的主要区别,并给出数据挖掘的一个实际应用场景。
#### 三、论述题(每题25分,共50分)1. 论述数据模型在企业决策支持系统中的作用,并举例说明如何通过数据模型辅助决策制定。
2. 论述大数据时代下,数据模型设计面临的挑战及应对策略。
#### 四、案例分析题(共30分)背景材料:某电子商务公司希望利用其庞大的用户数据来优化产品推荐系统。
请分析以下问题:1. 如何构建一个有效的用户行为数据模型来支持个性化推荐?2. 在构建数据模型时,需要考虑哪些关键因素?3. 描述如何通过数据模型来评估推荐系统的效果,并提出改进建议。
#### 五、开放性问题(共20分)请设计一个数据模型,用于支持一个在线教育平台的课程推荐系统。
考虑以下因素:1. 用户特征2. 课程属性3. 用户与课程的交互数据4. 推荐系统的反馈机制请在设计中详细说明数据模型的结构、关键属性以及推荐逻辑。
数据仓库架构与建模考试(答案见尾页)一、选择题1. 数据仓库的架构通常分为哪几个层次?A. 持久层B. 逻辑层C. 物理层D. 应用层2. 在数据仓库中,以下哪个不是常用的数据建模工具?A. Erwin Data ModelerB. IBM Data ArchitectC. Microsoft VisioD. Oracle SQL Developer3. 在数据仓库中,以下哪个不是维度表的特点?A. 通常包含事实表中的度量值B. 包含描述性信息C. 通常是静态的D. 用于支持复杂的查询分析4. 在数据仓库中,以下哪种类型的建模技术最适合于分析型应用?A. 星型模型B. 事实星座模型C. 雪花模型D. 星型雪花模型5. 在数据仓库中,以下哪个不是ETL(提取、转换、加载)过程中的步骤?A. 提取B. 清洗C. 转换D. 压缩6. 在数据仓库中,以下哪个是维度表的设计原则?A. 尽可能少地包含数据B. 尽可能多地包含数据C. 保持数据冗余D. 保持数据一致性7. 在数据仓库中,以下哪个是事实表的设计原则?A. 尽可能少地包含数据B. 尽可能多地包含数据C. 保持数据冗余D. 保持数据一致性8. 在数据仓库中,以下哪个是雪花模型与星型模型的主要区别?A. 维度表的分布方式B. 事实表的分布方式C. 星型模型的中心化程度D. 雪花模型的规范化程度9. 在数据仓库中,以下哪个是主键与外键的主要区别?A. 主键用于唯一标识记录,外键用于建立表之间的关系B. 主键用于建立表之间的关系,外键用于唯一标识记录C. 主键和外键都用于唯一标识记录D. 主键和外键都用于建立表之间的关系10. 在数据仓库中,以下哪个是数据治理的主要目标?A. 确保数据的质量和准确性B. 提高数据处理的效率C. 减少数据冗余和不一致性D. 优化数据存储和备份策略11. 数据仓库的主要目的是什么?A. 存储原始数据B. 提供数据分析和报告功能C. 用于数据挖掘和机器学习D. 所有以上选项12. 在设计数据仓库时,以下哪个层次结构最适合存储历史数据?A. 事实层B. 维度层C. 汇总层D. 应用层13. 在数据仓库中,以下哪个术语描述了用于分析数据的模式?A. 实体B. 属性C. 关系D. 记录14. 在数据仓库中,以下哪个工具不是用于数据分析和报告的?A. 查询语言(如SQL)B. 数据可视化工具C. 数据仓库建模工具D. 数据库管理系统(DBMS)15. 在数据仓库中,以下哪个维度通常与客户相关?A. 时间B. 市场细分C. 产品D. 销售渠道16. 在数据仓库中,以下哪个过程不是数据仓库生命周期的一部分?A. 数据抽取B. 数据清洗C. 数据转换D. 数据删除17. 在数据仓库中,以下哪个步骤不是数据建模过程中的步骤?A. 概念设计B. 逻辑设计C. 物理设计D. 数据加载18. 在数据仓库中,以下哪个技术用于将多个表中的数据组合成一个视图?A. 连接B. 视图C. 索引D. 分区19. 在数据仓库中,以下哪个策略用于确保数据的质量和准确性?A. 数据验证B. 数据清理C. 数据备份D. 数据归档20. 在数据仓库中,以下哪个指标是用于衡量数据仓库性能的?A. 查询响应时间B. 数据存储容量C. 数据传输速度D. 计算资源利用率21. 在数据仓库中,以下哪个层次的结构是从下到上逐渐抽象的?A. 事实层、维度层、业务层B. 业务层、维度层、事实层C. 维度层、事实层、业务层D. 业务层、事实层、维度层22. 在数据仓库的建模过程中,以下哪个术语描述了事实表中的关键属性?A. 主键B. 外键C. 代理键D. 候选键23. 在维度建模中,以下哪个维度通常包含时间信息?A. 时间维B. 地点维C. 产品维D. 客户维24. 在构建数据仓库时,以下哪项不是常用的ETL(抽取、转换、加载)工具?A. Informatica PowerCenterB. Microsoft SQL Server Integration Services (SSIS)C. Apache NiFiD. Oracle Data Integrator25. 在数据仓库中,以下哪种类型的查询通常涉及复杂的聚合和计算?A. 交互式查询B. 批量查询C. 连续查询D. 以上都不是26. 在维度建模中,以下哪个步骤不是必要的?A. 概念设计B. 逻辑模型设计C. 物理模型设计D. 数据仓库实施27. 在数据仓库中,以下哪个选项是维度表的设计原则?A. 尽可能少地包含属性B. 尽可能多地包含属性C. 属性必须是可量化的D. 属性可以是非量化或半量化的28. 在数据仓库中,以下哪个工具通常用于验证数据质量和完整性?A. 数据清洗工具B. 数据验证工具C. 数据转换工具D. 数据存储工具29. 在数据仓库中,以下哪个层次是用于存储实际数据的?A. 物理层B. 逻辑层C. 事实层D. 业务层30. 在数据仓库中,事实表通常包含哪些关键字段?A. 序列号B. 日期/时间戳C. 统计指标(如销售额)D. 实体键31. 以下哪个选项不是数据仓库的分层架构的一部分?A. 物理层B. 服务层C. 汇总层D. 逻辑层32. 在数据仓库建模中,常用的粒度级别有哪些?A. 业务单元B. 细粒度C. 中粒度D. 宽粒度33. 下列哪种类型的数据库常用于数据仓库中?A. 关系型数据库B. 非关系型数据库C. 图数据库D. 列存储数据库34. 在数据仓库中,星型模型和雪花模型有哪些主要区别?A. 星型模型的维度通常直接连接到事实表B. 雪花模型通过多个事实表和维度表进行建模C. 星型模型的维度和事实表是物理上分离的D. 雪花模型更适用于大数据集35. 在数据仓库设计中,平衡事实和维度的重要性意味着什么?A. 确保维度数据的质量和完整性B. 减少事实表中的记录数量C. 平衡查询性能和数据冗余D. 优化数据仓库的扩展性36. 数据仓库中的ETL过程是指什么?A. 数据提取B. 数据转换C. 数据加载D. 数据集成37. 在数据仓库中,索引的主要作用是什么?A. 提高查询性能B. 增加数据冗余C. 降低数据完整性D. 减少数据量38. 在数据仓库中,事实表通常包含哪些维度?A. 时间B. 地点C. 产品39. 数据仓库中的维度表通常包含哪些属性?A. 属性值B. 维度描述C. 维度关键字D. 以上都是40. 在数据仓库中,星型模型和雪花模型有什么区别?A. 星型模型的维度表不包含聚合B. 雪花模型可以减少数据冗余C. 星型模型的事实表包含聚合D. 雪花模型更容易理解41. 在数据仓库中,哪个层次的结构包含了业务需求和数据需求?A. 企业级数据仓库B. 数据集市C. 物理数据仓库D. 以上都不是42. 在数据仓库中,如何确保数据的准确性和完整性?A. 使用主键和外键约束B. 进行数据验证和清洗C. 实施数据备份和恢复策略D. 以上都是43. 数据仓库中的数据冗余是如何产生的?A. 数据在多个地方重复存储B. 数据在不同系统间传输C. 数据从源头处就不一致D. 数据在进行聚合操作时产生44. 在数据仓库中,如何优化查询性能?B. 改变数据分区方式C. 使用更复杂的查询语句D. 以上都是45. 在数据仓库中,如何进行数据安全和隐私保护?A. 加密敏感数据B. 设置严格的访问权限C. 使用数据脱敏技术D. 以上都是二、问答题1. 什么是数据仓库?请简述其核心特点。
常州大学《数据仓库原理与实现》2023-2024学年第一学期期末试卷《数据仓库原理与实现》考试内容:《数据仓库原理与实现》;考试时间:120分钟;满分:100分;姓名:——;班级:——;学号:——一、填空题(每题3分,共30分)1. 数据仓库是一种面向企业级数据分析的数据库系统,其主要目的是整合并存储企业各个业务系统的数据,形成一个统一的数据存储平台,以支持企业各级领导和业务人员的数据分析和决策。
2. 数据仓库系统的体系结构包括_____、ETL、_____、OLAP和前端工具等几个部分。
3. 数据的独立性包括数据的物理独立性和数据的_____。
4. 数据的物理独立性是指当数据的存储结构(或内模式)改变时,通过系统内部的自动映象功能或转换功能,保持了数据的全局逻辑结构(或模式)不变。
5. 数据仓库共有四个特性,分别是面向主题、集成的、_____和随时间变化。
6. 分布式数据库最基本的三个特征是:非集中式管理、_____和本地自治。
7. 关系数据模型的基本数据结构是_____。
8. SQL语言具有对数据的定义、_____、操纵和控制等四个方面的功能。
9. 数据模型由三部分组成:数据结构、数据操作和_____。
10. 在UML中,通信图主要用于描述对象在空间中如何交互,即除了动态交互,它也直接描述了对象是如何链接在一起的。
二、单项选择题(每题2分,共20分)1. 下列哪项是长期存储在计算机内的有组织,可共享的数据集合?A. 数据库管理系统B. 数据库系统C. 数据库D. 文件组织2. SQL语言中授权的操作是通过哪个语句实现的?A. CREATEB. REVOKEC. GRANTD. INSERT3. 下列聚合函数中不忽略空值(null)的是?A. SUM(列名)B. MAX(列名)C. COUNT(*)D. AVG(列名)4. 位于用户与操作系统之间的一层数据管理软件是?A. 数据库管理系统B. 数据库系统C. 数据库D. 数据库应用系统5. 分布式数据库系统中,下列哪个特征表明数据可以在不同地理位置上分布?A. 集中式管理B. 高可用性C. 本地自治D. 非集中式管理6. 关系数据模型的基本数据结构是?A. 索引B. 关系C. 数据项D. 数据源7. 下列哪个选项不属于数据库的特点?A. 数据共享B. 数据独立性高C. 数据冗余很高D. 数据完整性8. 在数据库系统中,元数据是指?A. 数据结构的描述B. 数据的来源C. 基本数据D. 数据项的描述9. 关系数据库实现数据之间联系的方法是?A. 候选码B. 外码C. 超码D. 索引10. 下列哪个阶段的主要任务是调查和分析用户的应用需要,为概念结构设计做好充分准备?A. 需求分析B. 逻辑设计C. 物理设计D. 运行设计三、简答题(每题10分,共30分)1. 解释数据仓库的主要特点和功能。
复习思考题(重点)一、单项选择题(1) 一般信息管理中,采用哪种方式的概念模型最多A. MapReduce模型B. 实体-关系模型C.02O模型D.B/S模型(2)在关系表中,下列哪种属性不能承担主列关键字(Key)?A. 身份证号B.银行卡号C.加密电文D.企业标识码(3)数据仓库的生命周期中,不包含下列哪个阶段?A.规划分析阶段B.设计实施阶段C.使用维护阶段D.反馈提升阶段(4)多维切片是指:A.在多个维度上观察全员操作B.多个成员的操作片段C.旋转数据集的部分维度D.在线分析或联机分析(5) 一般信息管理中,采用哪种方式的分布式物理模型最多A. MapReduce模型B. 实体-关系模型C.02O模型D.B/S模型(6)在关系表中,下列哪种属性可以成为外键(Key)?A. 客户信用程度B.银行卡行号C.加密的身份证号D.实体商户地址(7)数据仓库的生命周期中,不包含下列哪个阶段排在第三阶段?A.规划分析阶段B.设计实施阶段C.使用维护阶段D.反馈提升阶段(8)多维报表是指:A.在多个维度上观察全员操作B.不同维度格式不同叠加展示C.旋转数据集的部分维度D.在线分析或联机分析(9)数据表的多维索引的作用是:A.使数据表更节省存储空间B.加快数据存储速度C. 表格格式美观大方 C. 加快数据查找效率(10)MapRedude结构中的MAP职能是?A.钻取B.汇聚C.分发D.结晶(11)下列哪种客户需求可以直接成为数据仓库的多维报表?A.客户销售业绩清单B.客户基本名册C.客户关系图表D.客户反馈信息(12) 数据仓库开发强调哪种主体特征?A. 信息安全性B.业务流程C.操作事务性D.数据实时性(13)数据仓库与数据库系统相比,更加提倡:A.空间换时间B.数据范式更严格C.冗余度更小 C. 更加适用于分布式结构(14)透视表属于OLAP中的哪种能力范畴?A.存储能力B.展示能力C.稳定性能力D.安全性能力(15)OLAP的系统结构分为:A.胖客户端系统和瘦客户端系统B. OLAP服务器和多维数据存储C. OLAP服务器和传输分析处理后结果 C. 多维数据存储和分析处理后结果(16)MapRedude结构中的Reduce职能是?A.钻取B.汇聚C.分发D.结晶(17)下列哪种信息不能直接成为数据仓库的元数据?A.客户姓名的格式B.客户基本信息C.客户关系图D.客户反馈法则(18) noSQL数据库更强调哪种特征?A. 不兼容SQL命令B.非关系结构C.非事务性D.分布式计算(19)下列哪种关于数据仓库开发的观点是错误的?A.数据仓库开发的初期不能确定客户需求B.数据仓库开发过程是循环往复的C. 数据仓库开发不以客户需求为中心 C. 数据仓库开发是从基础数据出发的(20)客户关系图表属于下列哪种模型的范畴?A.概念模型B.物理模型C.逻辑模型D. Odoo模型(21)C/S网络结构中的C表示:A.瘦客户B.客户C.客户端D.直连线路(22)CRM的含义是:A.企业级数据仓库B.客户关系管理C.客户群D.决策管理系统(23)企业中对含义不一致的信息进行纠正的操作,叫做:A.数据清洗B.数据冗余C.数据降维D.数据转置(24)数据库高级管理员的职责不包括:A.输入业务数据B.设置操作员角色C.设置业务套账 B.系统数据备份(25)数据仓库按照不同的主体进行组织,可形成A.数据聚类B.数据分布C.数据集市D.数据链路(26)数据聚类中的聚簇中心是:A.事先拟定的B.搜索的目标C.动态产生的D.数据主题(27)数据代码要解决的主要问题是:A.节约信息存储空间B.解决名称混乱问题C.信息格式整齐D.方便排序(28)数据仓库中,下列哪种说法错误?A.消灭冗余,才能提高效率B.稳定性比集成性重要C.集成性直接提高系统的冗余度D. 稳定性促进高效率(29)数据粒度是指:A.数据处理的分割单位B.数据采集的单元C.数据抽样的单位D.数据记录的大小二、名词(1)数据仓库(2)SQL(3)OLAP(4)noSQL(5)DSS(6)支持度(7)大数据(8)E_R图(9)逻辑模型(10)O2O(11)MIS(12)关键字索引(13)数据颗粒度(14)元数据(15)数据连接(16)数据颗粒度(17)概念模型(18)数据挖掘(19)聚类(20)事务性(21)B2B(22)B2C(23)DBMS(24)ERP(25)数据粒度与数据分割的区别(26)时标法(27)自顶向下法(28)雪花模型(29)数据表主键三、模型设计1.某航空公司具有如下概念数据模型,请分析出适用的逻辑模型。
1、数据仓库数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。
2、数据挖掘:数据挖掘(Data Mining),又称为数据库中的知识发现(Knowledge Discovery in Database, KDD),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或“挖掘”知识。
3、雪花模型:雪花模式中某些维表是规范化的,因而把数据进一步分解到附加的表中,模式图形成了类似雪花的形状。
通过最大限度地减少数据存储量以及联合较小的维表来改善查询性能。
雪花模型增加了用户必须处理的表数量,增加了某些查询的复杂性,但同时提高了处理的灵活性,可以回答更多的商业问题,特别适合系统的逐步建设要求。
4、OLAP OLAP是联机分析处理,是使分析人员、管理人员或执行人员能够从多角度对信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。
它支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。
5、决策树:决策树是将训练集函数表示成树结构,通过它来近似离散值的目标函数。
这种树结构是一种有向树,它以训练集的一个属性作节点,这个属性所对应的一个值作边。
决策树一般都是自上而下的来生成的。
1、企业面对海量数据,应如何具体实施数据挖掘,使之转换成可行的结果/模型?首先进行数据的预处理,主要进行数据的清洗,数据清洗,处理空缺值,数据的集成,数据的变换和数据规约。
2、请列举您使用过的各种数据仓库工具软件(包括建模工具,ETL工具,前端展现工具,OLAP Server、数据库、数据挖掘工具)和熟悉程度。
ETL工具:AscentialDataStage ,IBM warehouseMANAGER、Informatica公司的PowerCenter、Cognos 公司的DecisionStream市场上的主流数据仓库存储层软件有:SQL SERVER、SYBASE、ORACLE、DB2、TERADATA但是使用过的只有SQLSERVER和数据挖掘工具Analysis Services,而且不大熟悉。
考试时间5月24日,上午9:00-11:00地点:SY207题目来自于收集的照的照片,可能不太准确,还有一些看不清,大家看着复习。
能整理出答案最好了^_^~一、概念题(40分)请将如下概念串起来,描述概念之间的关系,每个概念不必单独解释。
企业信息系统架构、基础业务系统、数据仓库、数据挖掘、机器学习、RDBMS、HADOOP、Oracle、大数据、DB2、关系型数据库、多维分析引擎、数据集成、数据模型、元数据、决策支持系统二、简答题(共5道题,共计60分)1.如下两个图标分别是操纵系统环境与数据仓库环境在一天内的硬件资源典型使用率模式,横坐标是时间,纵坐标是使用率(0-100%)1)请说明为什么这两种环境的硬件资源使用率会有如此不同?(5分)2)请说明这种现象对企业信息系统架构设计的影响?(5分)2.在数据仓库环境的数据体系建设过程中,进行粒度设计时要考虑的因素有哪儿些?粒度分析为什么要与技术环境评估同时进行。
(12分)3.对于企业中常见的孤岛式信息系统架构和蜘蛛网信息系统利用架构,请完成如下要求:1)分别值出这两种架构产生的主要原因;2)指出这两种架构中存在的主要问题;3)给出解决这些问题的常见方案。
(15分)4.设有如下数据仓库的数据模型设计**,请(6)建立企业全局数据视图;(7)确定每个主题包含的实体集以及每个实体集的属性集;(8)确定粒度层次;(9)确定索引结构;(10)确定存储分配;(11)分析确定数据来源。
(11分)5.假设有3年的销售数据,有如下两种存储方案:方案1:在数据库系统中用户看的表只有一个,但是有6个分区,每半年一个物理分区。
方案2:在数据库系统中有6个独立的表,分别存储近三年的数据。
1)这两种方案哪个是数据库系统层分区,哪种是应用层分区?各有什么优缺点。
(8)2)数据分区对数据归档、数据清除有什么影响?(4)。
数据库练习题库(含答案)一、单选题(共98题,每题1分,共98分)1.在需求分析阶段,结构化分析和建模方法是一种较为有效的需求分析方法,下列不属于结构化分析和建模方法优点的是()。
A、可避免过早陷入具体细节B、从局部或子系统开始分析问题,便于建模人员了解业务模型C、图形对象不涉及太多技术术语,便于用户理解模型D、用图形化的模型能直观表示系统功能正确答案:B2.DBMS通过加锁机制允许用户并发访问数据库,这属于DBMS提供的()。
A、数据定义功能B、数据操纵功能C、数据库运行管理与控制功能D、数据库建立与维护功能正确答案:C3.关于数据划分策略,下述说法错误的是()。
A、散列划分釆用某种散列函数,以数据的划分属性作为函数参数,计算数据应存储的磁盘序号B、范围划分根据某个属性的取值,将数据划分为n个部分,分别存储到不同磁盘上C、范围划分有利于范围查询和点查询,但也可能会引起数据分布不均匀及并行处理能力下降问题D、轮转法划分能保证元组在多个磁盘上的平均分配,并具有较高的点查询和范围查询正确答案:D4.存取方法设计属于数据库设计的()阶段的设计任务。
A、逻辑结构设计B、概念结构设计C、系统需求分析D、物理结构设计正确答案:D5.将新插入的记录存储在文件末尾,并使记录随机地分布在文件物理存储空间中的文件结构是()。
A、散列文件B、堆文件C、索引文件D、聚集文件正确答案:B6.关于"死锁”,下列说法中正确的是()。
A、在数据库操作中防止死锁的方法是禁止两个用户同时操作数据库B、只有出现并发操作时,才有可能出现死锁C、当两个用户竞争相同资源时不会发生死锁D、死锁是操作系统中的问题,数据库操作中不存在正确答案:B7.关于数据库应用系统的需求分析工作,下列说法正确的是()。
A、在需求分析阶段,系统需求分析员要与用户充分沟通,并做出各类用户视图B、通过需求分析过程,需要确定出整个应用系统的目标、任务和系统的范围说明C、数据操作响应时间、系统吞吐量、最大并发用户数都是性能需求分析的重要指标D、数据需求分析的主要工作是要辩识出数据处理中的数据处理流程正确答案:C8.如果一个系统定义为关系系统,则它必须( )oA、支持关系数据库B、支持选择、投影和连接运算C、A和B均成立D、A、B都不需要正确答案:C9.联机分析处理包括以下()基本分析功能。
数据逻辑期末考试题及答案一、选择题(每题2分,共20分)1. 在关系数据库中,用于表示实体间关系的是:A. 属性B. 元组C. 关系D. 域2. SQL语言中,用于查询操作的命令是:A. CREATEB. INSERTC. SELECTD. DELETE3. 以下哪个是数据库规范化的目的:A. 提高查询速度B. 减少数据冗余C. 增加用户友好度D. 增加数据安全性4. 数据库事务具有以下哪些特性:A. 原子性B. 一致性C. 隔离性D. 持久性E. 所有选项5. 在关系数据库设计中,删除一个表中的元组,而不影响其他表中的数据,应使用:A. 级联删除B. 非级联删除C. 级联更新D. 非级联更新...(此处省略其他选择题)二、简答题(每题10分,共30分)1. 简述什么是数据库的范式,并列举至少三种常见的范式。
2. 解释什么是SQL注入攻击,并简述如何预防。
3. 描述数据库备份和恢复的重要性及其基本过程。
三、计算题(每题15分,共30分)1. 给定一个关系表R(A, B, C),其中A是主键。
请写出以下SQL查询语句:- 查询所有A值大于5的元组。
- 删除所有B值小于10的元组。
- 更新所有C值等于20的元组,将C值改为30。
2. 假设有一个图书馆数据库,包含以下两个表:- Books(ISBN, Title, Author, Year)- Borrowers(BorrowerID, Name, Address)- Borrow(ISBN, BorrowerID, DateOut, DateDue)请写出一个SQL查询,列出所有借阅了书籍《数据库原理》的借阅者姓名和他们的地址。
四、论述题(每题20分,共20分)1. 论述数据库管理系统(DBMS)的主要功能,并说明它们如何支持企业数据管理。
数据逻辑期末考试题答案一、选择题1. C2. C3. B4. E5. B...(此处省略其他选择题答案)二、简答题1. 数据库的范式是一组规则,用于指导数据库设计,以减少数据冗余并提高数据完整性。
《数据仓库》考试试题姓名陆志鹏得分一、(15分)请解释“数据孤岛”的含义,为什么会引起“数据孤岛”现象,有哪些解决办法?答:数据孤岛可以认为是"数据的污染".之所以产生数据孤岛这样的情况,有这么几个原因:1、对于一些大中企业,数据可能分散于各个分支机构,汇总速度慢、决策速度慢,缺乏实时性管理;数据分散且缺乏标准化,形成信息孤岛;公司与公司之间、部门与部门之间,数据缺乏标准化、有价值资料无法充分利用,信息化系统不具备数据整合功能,对决策支持能力不强。
2、信息部门建设的相对滞后,如果信息部门不能尽快满足业务对数据处理的要求,那业务部门就可能独自开发业务系统,这种情况现在还是普遍存在.3、缺少企业内信息化建设的战略和标准,如果不能做到信息系统建设的统一,由不同部门,不同公司来建设的话,必须有一个标准能够使得日后的互通比较容易实现。
解决数据孤岛的办法:企业数据集成,使用数据仓库。
二、(15分)数据仓库与数据库系统有什么关系?答:数据库一般存储在线交易数据,数据库主要是处理实时性的任务,是面向事务的,因此是做OLTP(联机处理)方面的工作。
数据仓库是决策支持系统和联机分析应用数据源的结构化数据环境,数据仓库研究和解决从数据库中获取信息的问题。
数据仓库是面向主题,集成,随时间变化,数据仓库系统是一个信息提供平台,他从业务处理系统获得数据,主要以星型模型和雪花模型进行数据组织,并为用户提供各种手段从数据中获取信息和知识,一般和数据挖掘结合在一起用于管理者决策,对一段时期内集聚的数据做分析,因此是OLAP(联机分析处理)方面的工作。
数据库是数据仓库的基础。
三、(15分)什么是元数据?元数据在数据仓库中有什么作用?怎样建立元数据才能更好地发挥其作用?对元数据怎么管理?答:1. 元数据就是“关于数据的数据”,是描述数据仓库内数据的结构和建立方法的数据。
在数据仓库中,元数据可对数据仓库中的各种数据进行详细的描述和说明,说明每个数据的上下文关系,是每个数据具有符合现实的真实含义,是最终用户了解这些数据之间的关系。
数据仓库数据模型设计练习题
⼀、数据仓库设计(20分)
假设⼀⾼校的教务管理系统包括成绩录⼊、成绩统计报表、成绩管理三个模块,能满⾜数据信息化管理、数据查询和简单的统计功能,随着学⽣数量的增加和课程数量的增加,以及教学管理要求的提⾼,原来的OLTP系统已不能满⾜⼯作需要。
原有OLTP系统中表如下:
成绩表(学⽣号,课程号,成绩);学⽣表(学号,姓名,性别,出⽣⽇期,籍贯,职务,班级号);班级表(班级号,班级名,系号);系表(系号,系名称,学院号);学院(学院号,学院名称);课程表(课程号,课程名称,课程性质,学期号);学期表(学期号,学年名,学期名);教师表(教师号,教师姓名,性别,职称,出⽣⽇期,籍贯);教师授课表(教师号,课程号,上课教室号);教室表(教室号,教室地址,管理员),
如果要为学⽣成绩分析建⽴⼀数据仓库,
(1)请问什么是数据仓库?(5分)
数据仓库是⾯向主题的、集成的、稳定的和随时间变化的数据集合(4分),⽤以⽀持管理决策(1分)。
(2)设计此数据仓库的星型模型。
(15分)
[此⽂档可⾃⾏编辑修改,如有侵权请告知删除,感谢您的⽀持,我们会努⼒把内容做得更好]
最新可编辑word⽂档。
数据库模考试题及答案一、单选题(共98题,每题1分,共98分)1.给定如下二个关系表:销售明细表(商品标识,销售时间,单价,数量,金额)日销售表(商品标识。
销售日,总数量,总金额)月销售表(商品标识,销售月份,总数量,总金额)下述说法正确的是()。
A、月销售表的数据粒度最大,数据量最小B、销售明细表的数据粒度最大,数据量最大C、月销售表的数据粒度最小,数据量最小D、日销售表的数据粒度最大,数据量最小正确答案:A2.下列关于数据库备份的叙述,错误的是()。
A、如果数据库很稳定就不需要经常做备份,反之要经常做备份B、数据库备份策略选择应该综合考虑各方面因素,并不是备份做得越多越全就越好C、数据库备份是一项复杂的任务,应该有专业的管理人员来完成D、数据库备份也受到数据库恢复模式的制约正确答案:A3.关于UML的各种视图及其分类,下列说法错误的是()。
A、用例图、类图、对象图,组件图和部署图都是静态视图B、类图和对象图都是结构视图C、顺序图、状态图和组件图都是行为视图D、顺序图、交互图、状态图和活动图都是动态视图正确答案:C4.关系R与关系S只有一个公共属性,T1是R与S等值连接的结果,T2是R与S自然连接的结果,下列叙述正确的是( )=A、T1的属性个数大于或等于T2的属性个数B、T1的属性个数等于T2的属性个数C、T1的属性个数大于T2的属性个数D、T1的属性个数小于T2的属性个数正确答案:C5.SQLServer 2000中,如果希望用户ul在DB1数据库中具有查询T1表的权限,正确的授权语句是()。
A、GRANT SELECT ON DB1 (Tl) TOulB、GRANT SELECT TOul ONDB1 (Tl)C、GRANT SELECT TO u 1 ON T1D、GRANT SELECT ON Tl TOul正确答案:D6.事务TO、T1和T2并发访问数据项A、B和C,下列属于冲突操作的是()。
逻辑模型设计实战演练试卷(答案见尾页)一、选择题1. 在数据库逻辑模型设计中,以下哪个不是常用的数据模型?A. 层次模型B. 网状模型C. 关系模型D. 非关系模型2. 在设计逻辑模型时,以下哪项不是需要遵循的基本原则?A. 易于理解B. 易于维护C. 数据冗余最小化D. 可扩展性3. 在逻辑模型设计中,哪种图表通常用于表示实体之间的关系?A. 数据流程图(DFD)B. 程序流程图C. 实体-关系图(ER图)D. 业务流程图4. 在设计逻辑模型时,以下哪个步骤不是首先进行的?A. 概念设计B. 逻辑设计C. 物理设计D. 详细设计5. 在逻辑模型设计中,如何确保数据的完整性和一致性?A. 使用主键和外键约束B. 设置唯一约束C. 使用触发器D. 进行事务处理6. 在设计逻辑模型时,哪种技术可以有效地减少数据冗余?A. 数据规范化B. 数据分片C. 数据加密D. 数据备份7. 在设计逻辑模型时,如何描述现实世界中的实体及其属性和关系?A. 实体-关系图(ER图)B. 数据流程图(DFD)C. 程序流程图D. 业务流程图8. 在设计逻辑模型时,以下哪个工具不是常用的建模工具?A. Microsoft VisioB. MySQL WorkbenchC. Oracle SQL DeveloperD. Photoshop9. 在设计逻辑模型时,如何确保模型的可扩展性和灵活性?A. 使用模块化设计B. 封装数据和功能C. 采用面向对象的方法D. 进行性能优化10. 在设计逻辑模型时,如何平衡数据安全性与可用性?A. 使用访问控制列表(ACL)B. 设置数据加密C. 进行定期备份D. 实施严格的数据访问策略11. 在数据库设计中,哪种图表用于描述数据及其关系?B. 层次模型图C. 关系模型图D. 逻辑模型图12. 在逻辑模型设计阶段,以下哪项不是必要的步骤?A. 确定实体和属性B. 定义主键和外键C. 进行数据流分析D. 概念设计13. 在概念设计阶段,通常使用哪种工具来表示实体及其关系?A. 网状图B. 层次模型图C. 实体-关系图(E-R图)D. 数据流程图14. 在关系模型中,如何表示两个表之间的联系?A. 使用公共字段B. 使用外键C. 使用主键和外键D. 使用连接15. 在逻辑模型设计中,以下哪个选项是确保数据完整性的必要条件?A. 实体完整性B. 引用完整性C. 用户定义的完整性D. 结构完整性16. 在设计数据库时,以下哪个因素通常不是决定数据库性能的关键因素?A. 硬件资源B. 查询复杂性C. 数据库设计风格17. 在逻辑模型设计中,如何确保数据的一致性?A. 使用约束B. 使用索引C. 使用事务D. 使用存储过程18. 在关系数据库中,以下哪个操作属于数据完整性范畴?A. 唯一性约束B. 外键约束C. 非空约束D. 默认值约束19. 在逻辑模型设计中,如何处理多对多关系?A. 使用连接表B. 使用递归查询C. 使用视图D. 使用公共字段20. 在设计数据库模式时,以下哪个原则有助于提高查询效率?A. 选择合适的数据类型B. 合理设计索引C. 尽量减少数据冗余D. 避免使用触发器21. 在设计逻辑模型时,我们首先要明确的是()。
一、选择题1、数据仓库是随时间变化的,下面的描述不正确的是:A、数据仓库随时间变化不断增加新的数据内容。
B、捕捉到的新数据会覆盖原来的快照。
C、数据仓库随时间变化不断删去旧的数据内容。
D、数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合。
答案: B2、关于基本数据的元数据是指:A、基本元数据包括与数据源、数据仓库、数据集市和应用程序等结构相关的信息。
B、基本元数据包括与企业相关的管理方面的数据和信息。
C、基本元数据包括日志文件和建立执行处理的时序调度信息。
D、基本元数据包括关于装载和更新处理、分析处理以及管理方面的信息。
答案: A3、下面有关数据粒度的描述不正确的是:A、粒度是指数据仓库小数据单元的详细程度和级别。
B、数据越详细,粒度就越小,级别也就越高。
C、数据综合度越高,粒度就越大,级别也就越高。
D、粒度的具体划分将直接影响数据仓库中的数据量以及查询质量。
答案: B4、有关数据仓库的开发特点,不正确的描述是:A、数据仓库开发要从数据出发。
B、数据仓库使用的需求在开发出去就要明确。
C、数据仓库的开发是一个不断循环的过程,是启发式的开发。
D、在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据的分析和处理更灵活,且没有固定的模式。
答案: B5、RAID技术具有容错能力,能够满足对存储能力、性能和可靠性不断提高的要求。
其实,实现原理是将数据写入多张磁盘中,如果—张磁盘发生故障,就从其他存放冗余数据的磁盘上访问数据。
有关RAID不同级别的描述不正确的是:A、在RAID 0这一级别上,数据记录通过在多组驱动器的扇区上交错地分布着实现,没有奇偶校验,不提供任何冗余。
B、RAID 1称为镜像。
在这一级别上,数据被冗余地写入成对的驱动器中,可以独立地从每个驱动器提取该数据。
这种方法没有什么缺点,是备份时候经常用到的技术。
C、RAID 3数据记录在成组驱动器上,位交错,只有一个驱动器仍有奇偶校验信息。
第一章概述1.数据挖掘的定义?(书P2,PPT_P8)从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
2。
数据挖掘的源是否必须是数据仓库的数据?可以有哪些来源?(PPT_P14)关系数据库、数据仓库、事务数据库、高级数据等3.数据挖掘的常用方法?(P4、PPT_P29)聚类分析、决策树、人工神经网络、粗糙集、关联规则挖掘、统计分析等4。
数据挖掘的过程包括哪些步骤,每一步具体包括哪些内容?(书P2—3,PPT_P17—19)确定业务对象、数据准备、数据挖掘、结果分析与知识同化。
5.数据挖掘与数据仓库的关系(联系和区别)?书P6—7,PPT_P45—46联系:1,数据仓库为数据挖掘提供了更好的,更广泛的数据源2,数据仓库韦数据挖掘提供了新的支持平台.3,数据仓库为更好地使用数据挖掘工具提供了方便4,数据挖掘对数据仓库提供了更好的决策支持。
5,数据挖掘对数据仓库的数据组织提出了更高的要求6,数据挖掘还为数据仓库提供了广泛的技术支持区别:数据仓库是一种存储技术,它包含大量的历史数据、当前的详细数据以及综合数据,它能为不同用户的不同决策需要提供所需的数据和信息。
~~数据挖掘是从人工智能机器学习中发展起来的,它研究各种方法和技术,从大量的数据中挖掘出有用的信息和知识.第二章数据仓库1。
数据仓库的定义数据仓库——是一个面向主题的、集成的、随时间而变化的、不容易丢失的数据集合,支持管理部门的决策定制过程。
2。
数据仓库数据的四大基本特征:面向主题的、集成的、不可更新的、随时间变化的.3。
数据仓库体系结构有三个独立的数据层次:信息获取层、信息存储层、信息传递层。
4。
粒度的定义?它对数据仓库有什么影响?(1)是指数据仓库的数据单位中保存数据细化或综合程度的级别。
粒度越小,细节程度越高,综合程度越低,回答查询的种类就越多.(2)影响存放在数据仓库中的数据量大小;影响数据仓库所能回答查询问题的细节程度.5。
数据仓库2012年4月16日一.1.解释名称:✓数据仓库:数据仓库是一个按面向决策主题的方式组织的、集成的、相对稳定、随时间变化的,主要用于决策支持的数据集合。
✓元数据:元数据又称中介数据、中继数据,为描述数据的数据,主要是描述数据属性的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。
建立元数据是为了对数据库环境进行监控。
✓ODS:操作型数据存储,是用于支持企业日常的全局应用的数据集合。
是企业信息系统中的一打雷重要的信息系统,这类信息系统以数据基础,通过数据统计、分析、挖掘、展现等手段为各层决策人员提供决策支持服务。
✓ETL:是英文Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。
ETL是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。
✓物化视图:在外观上像视图,在实质上,它是普通数据表,但是具有附加的逻辑,可能可以实现一些有效的计算功能,并提供不同刷新机制。
它是用于预先计算并保存表连接或聚集等耗时较多的操作的结果,这样,在执行查询时,就可以避免进行这些耗时的操作,从而快速的得到结果。
详见PPT5.4✓数据模型:用于指导数据的设计、存储,并作为数据设计结果的检验标准的模型。
✓决策支持系统:DSS是企业信息系统中的一大类重要的信息系统,这类系统以数据为基础,通过数据统计、分析、挖掘、展现等手段为各层次决策人员提供决策支持服务。
✓OLAP:在线分析处理;用于支持复杂的分析操作;侧重对决策人员和高层管理人员的决策支持;快速、灵活地进行大数据量的复杂查询处理,以直观易懂的形式将查询结果提供给决策人员,使用户准确掌握企业的经营状况,了解市场需求,制定正确方案,增加效益。
✓OLTP:联机事务处理系统;也称为面向交易的处理系统,其基本特征是顾客的原始数据可以立即传送到计算中心进行处理,并在很短的时间内给出处理结果。
数据仓库逻辑模型试题
1. 什么是数据仓库逻辑模型?
数据仓库逻辑模型是指在数据仓库设计过程中,用于描述数据仓库中数据结构和数据之间的关系的模型。
它包括了数据实体、数据属性、关系和约束等元素。
2. 数据仓库逻辑模型的主要目的是什么?
数据仓库逻辑模型的主要目的是使数据仓库中的数据可以以一种合理、一致和易于理解的方式进行组织和查询,从而方便用户进行数据分析和决策支持。
3. 数据仓库逻辑模型中常用的建模方法有哪些?
常用的数据仓库逻辑模型建模方法包括维度建模、实体关系模型和标准化模型等。
4. 请描述一下维度建模方法。
维度建模方法是一种面向主题的建模方法,主要用于描述数据仓库中的事实表和维度表之间的关系。
它以事实表为中心,通过将业务过程中涉及的维度进行规范化,形成多个维度表,然后将维度表和事实表进行关联,来实现对数据的多维分析。
5. 数据仓库逻辑模型中的实体关系模型是如何描述的?
实体关系模型主要是用于描述数据实体之间的关系。
它将数据仓库中的实体和实体之间的关系抽象为实体关系图,并使用实体和关系两种类型的实体来表示数据仓库中的数据对象和数据之间的关系。
6. 数据仓库逻辑模型中的标准化模型是如何描述的?
标准化模型是指将数据仓库中的数据表按照关系数据库的设计原理进行规范化。
它通过将数据表中的属性按照功能进行分解,消除冗余数据,确保数据的一致性和完整性,从而提高数据仓库的查询效率和数据的可维护性。
7. 数据仓库逻辑模型中常用的约束有哪些?
常用的约束包括主键约束、外键约束、唯一约束、默认值约束、检查约束和非空约束等。
通过对数据仓库逻辑模型中的数据属性和关系应用这些约束,可以确保数据的有效性和一致性。
8. 数据仓库逻辑模型和数据仓库物理模型之间的关系是什么?数据仓库逻辑模型和数据仓库物理模型之间是一种上下级关系。
数据仓库逻辑模型是对数据仓库中数据的逻辑结构和数据之间关系的描述,而数据仓库物理模型是将逻辑模型转化为具体的存储结构和存储方式的实现。