XXXX-第2次课-新一代数据库系统--数据仓库
- 格式:ppt
- 大小:3.00 MB
- 文档页数:110
XXXXXXXXX项目系统运行报告一、系统建设及使用概况(一)系统基本情况金税三期管理决策分析平台项目(第1包)系统,以下简称XXXX 系统系统。
作为金税三期工程中“四平台”之一,XXXX系统系统建设成为应用集中分散相结合、国地税统一版本、两级部署的数据管理分析基础环境和管理决策类应用环境。
2015年7月,XXXX系统系统在某某省国税进行双轨实施,同月启动双轨运行,进行用户测试和业务功能差异分析;2015年8月底结束双轨运行并开始系统正式上线实施,2015年9月完成系统单轨上线。
(二)系统运行环境XXXX系统系统整体运行于税务局大局域网内,省局优化版主要运行在某某省国税局省局。
各环境的资源配置情况如下:1.省局运行环境数据库服务器为IBM Power780服务器,CPU主频3.86GHz,操作系统AIX 7.1。
数据交互库服务器2节点(每节点6CPU,72GB内存,2*300GBGB内置存储),4TB共享存储;数据仓库/系统库服务器2节点(每节点8CPU ,96GB 内存,2*300GB 内置存储),10TB 共享存储。
应用服务器为DELL M910(B-SRV1) PC 服务器,CPU 主频2GHz,操作系统Oracle Linux 6.3(64位),共12台,每台应用服务器8CPU ,64GB 内存,80GB 内置存储。
(三)系统部署情况XXXX 系统系统部署于某某省国税省局,为某某省国税用户提供应用功能使用。
系统部署如下图:290.12.128.1690.12.128.18ynsthxzg 90.12.72.19690.12.72.197ynstj1dw ynsthxff省局用户对整个XXXX 系统系统功能的访问模式及路径如下图所示:某某省国税用户通过部署于省局的金三统一业务工作门户进行系统访问。
由省局提供统一的报表管理、会计核算、征管状况分析应用功能、查询统计、数据集成平台和数据质量管理平台的应用功能服务。
数据仓库-期末考试复习题复思考题(重点)一、单项选择题1)一般信息管理中,采用哪种方式的概念模型最多A。
ce模型B.实体-关系模型C.02O模型D.B/S模型(2)在关系表中,下列哪种属性不能承担主列关键字(Key)?A.身份证号B.银行卡号C.加密电文D.企业标识码(3)数据仓库的生命周期中,不包含下列哪个阶段?A.规划分析阶段B.设计实施阶段C.使用维护阶段D.反馈提升阶段(4)多维切片是指:A.在多个维度上观察全员操作B.多个成员的操作片段C.旋转数据集的部分维度D.在线分析或联机分析(5)一般信息管理中,采用哪种方式的分布式物理模型最多A。
ce模型 B.实体-关系模型C.02O模型D.B/S模型(6)在关系表中,下列哪种属性可以成为外键(Key)?A.客户信用程度B.银行卡行号C.加密的身份证号D.实体商户地址(7)数据仓库的生命周期中,不包含下列哪个阶段排在第三阶段?A.规划分析阶段 B.设计实施阶段 C.使用维护阶段D.反馈提升阶段(8)多维报表是指:A.在多个维度上观察全员操作B.分歧维度花式分歧叠加展示C.旋转数据集的部分维度D.在线阐发或联机阐发(9)数据表的多维索引的感化是:A.使数据表更节省存储空间B.加快数据存储速率C.表格花式美观大方C.加快数据查找效率10)de布局中的MAP职能是?A.钻取B.汇聚C.分发D.结晶11)下列哪种客户需求能够直接成为数据堆栈的多维报表?A.客户销售业绩清单B.客户根本名册C.客户关系图表D.客户反馈信息(12)数据堆栈开辟强调哪种主体特征?A.信息安全性B.业务流程C.操作事务性D.数据实时性(13)数据仓库与数据库系统相比,更加提倡:A.空间换时间B.数据范式更严格C.冗余度更小C.更加适用于分布式结构(14)透视表属于OLAP中的哪种能力范畴?A.存储本领B.展示本领C.稳定性本领D.安全性本领(15)OLAP的系统布局分为:A.胖客户端系统和瘦客户端系统B。
第四章作业1.数据仓库的需求分析的任务是什么?P67需求分析的任务是通过详细调查现实世界要处理的对象(企业、部门用户等),充分了解源系统工作概况,明确用户的各种需求,为设计数据仓库服务。
概括地说,需求分析要明确用那些数据经过分析来实现用户的决策支持需求。
2.数据仓库系统需要确定的问题有哪些?P67、、(1)确定主题域a)明确对于决策分析最有价值的主题领域有哪些b)每个主题域的商业维度是那些?每个维度的粒度层次有哪些?c)制定决策的商业分区是什么?d)不同地区需要哪些信息来制定决策?e)对那个区域提供特定的商品和服务?(2)支持决策的数据来源a)那些源数据与商品的主题有关?b)在已有的报表和在线查询(OLTP)中得到什么样的信息?c)提供决策支持的细节程度是怎么样的?(3)数据仓库的成功标准和关键性指标a)衡量数据仓库成功的标准是什么?b)有哪些关键的性能指标?如何监控?c)对数据仓库的期望是什么?d)对数据仓库的预期用途有哪些?e)对计划中的数据仓库的考虑要点是什么?(4)数据量与更新频率a)数据仓库的总数据量有多少?b)决策支持所需的数据更新频率是多少?时间间隔是多长?c)每种决策分析与不同时间的标准对比如何?d)数据仓库中的信息需求的时间界限是什么?3.实现决策支持所需要的数据包括哪些内容?P68(1)源数据(2)数据转换(3)数据存储(4)决策分析4.概念:将需求分析过程中得到的用户需求抽象为计算机表示的信息结构,叫做概念模型。
特点:(1)能真实反映现实世界,能满足用户对数据的分析,达到决策支持的要求,它是现实世界的一个真实模型。
(2)易于理解,便利和用户交换意见,在用户的参与下,能有效地完成对数据仓库的成功设计。
(3)易于更改,当用户需求发生变化时,容易对概念模型修改和扩充。
(4)易于向数据仓库的数据模型(星型模型)转换。
5.用长方形表示实体,在数据仓库中就表示主题,椭圆形表示主题的属性,并用无向边把主题与其属性连接起来;用菱形表示主题之间的联系,用无向边把菱形分别与有关的主题连接;若主题之间的联系也具有属性,则把属性和菱形也用无向边连接上。
数据库原理课程教学大纲【课程编号】01048【课程名称】数据库原理Principles of Database System【学时学分】64 学时;4学分【实验和上机学时】8【课程性质】专业课【开课模式】必修【先修课程】离散数学、算法与数据结构、操作系统【开课单位】计算机应用软件教研室【开课学期】6【授课对象】计算机科学与技术专业、计算机科学与技术专业(嵌入式方向)、网络工程专业【考核方式】考试一、本课程的性质、目的与任务本课程以关系数据库的基本理论和技术为重点,系统地介绍数据库系统的基础知识、基本原理、方法和技术。
使学生具备数据库的基础理论知识和实际应用能力。
为今后的学习和应用开发打好扎实的数据库基础。
二、课程的教学内容、基本要求和学时分配1. 数据库系统概论(6学时)①数据库系统的基本概念;(*)②数据模型;(*)③数据库系统的体系结构;(*)④数据库系统的组成;⑤数据库技术的研究领域。
2. 关系数据库(6学时)①关系数据模型;(*)②关系的完整性;(*)③关系代数;(*)④关系演算。
3. 关系数据库语言——SQL(12学时)①SQL语言概述;②数据定义;(*)③查询;(*)④数据更新;(*)⑤视图;(*)⑥数据控制;⑦存储过程;⑧数据库应用程序设计简介。
4. 查询处理与查询优化(4学时)①关系数据库系统的查询处理;②关系数据库系统的查询优化。
5. 关系数据理论(6学时)①关系数据理论的基本概念;②关系规范化理论;(*)③数据依赖的公理系统;④关系模式分解。
(*)6. 数据库设计(8学时)①数据库设计的特点、方法和步骤;②数据库设计的需求分析;③数据库的概念结构设计;(*)④数据库的逻辑结构设计;(*)⑤数据库的物理设计;⑥数据库的实施与维护。
7. 数据库的恢复技术(6学时)①事务的基本概念;(*)②数据库恢复概述;③故障的种类;④恢复的实现技术;(*)⑤恢复的策略;⑥具有检查点的恢复技术。
第三章作业1.联机分析处理(OLAP)的简单定义是什么?它体现的特征是什么。
P40联机分析处理是共享多维信息的快速分析。
它体现在四个特征:(1)快速性(2)可分析性(3)多维性(4)信息性2.OLAP准则中的主要准则有哪些?P41(1)多维概念视图(2)透明性(3)可访问性(4)一直稳定的报表性能(5)客户/服务器体系结构(6)维的等同性(7)动态的系数矩阵处理(8)多用户支持能力(9)非限定的跨维操作(10)直观的数据操作(11)灵活的报表生成(12)不受限制的维和聚集层次3. 什么是维?关系数据库是二维数据吗?如何理解多维数据?P43维是人们观察数据的特定角度。
关系数据库不是二维数据,只是通过二维关系表示了数据的多维概念。
多维数据就是从多个特定角度来观察特定的变量。
4.MDDB(Multi Dimensional Database, 多维数据库)是以多维的方式组织数据,即以维作为坐标系,采用类似于数组的形式存储数据。
RDBMS(relational database management system,关系型数据库管理系统)通过数据、关系和对数据的约束三者组成的数据模型来存放和管理数据MDDB特点:1.数据库中的元素具有相同的数值2.多维数据库表达清晰,3.占用存储少RDBMS的特点:1.数据以表格的形式出现2.每行为各种记录名称3.每列为记录名称所对应的数据域4.许多的行和列组成一张表单5.若干的表单组成database5.1.数据存取速度ROLAP服务器需要将SQL语句转化为多维存储语句,临时“拼合”出多维数据立方体。
因此,ROLAP的响应时间较长。
MOLAP在数据存储速度上性能好,响应速度快。
2.数据存储的容量ROLAP使用的传统关系数据库的存储方法,在存储容量上基本没有限制。
MOLAP通常采用多平面叠加成立体的方式存放数据。
当数据量超过操作系统最大文件长度时,需要进行数据分割。
多维数据库的数据量级难以达到太大的字节级。