XXXX-第2次课-新一代数据库系统--数据仓库
- 格式:ppt
- 大小:3.00 MB
- 文档页数:110
XXXXXXXXX项目系统运行报告一、系统建设及使用概况(一)系统基本情况金税三期管理决策分析平台项目(第1包)系统,以下简称XXXX 系统系统。
作为金税三期工程中“四平台”之一,XXXX系统系统建设成为应用集中分散相结合、国地税统一版本、两级部署的数据管理分析基础环境和管理决策类应用环境。
2015年7月,XXXX系统系统在某某省国税进行双轨实施,同月启动双轨运行,进行用户测试和业务功能差异分析;2015年8月底结束双轨运行并开始系统正式上线实施,2015年9月完成系统单轨上线。
(二)系统运行环境XXXX系统系统整体运行于税务局大局域网内,省局优化版主要运行在某某省国税局省局。
各环境的资源配置情况如下:1.省局运行环境数据库服务器为IBM Power780服务器,CPU主频3.86GHz,操作系统AIX 7.1。
数据交互库服务器2节点(每节点6CPU,72GB内存,2*300GBGB内置存储),4TB共享存储;数据仓库/系统库服务器2节点(每节点8CPU ,96GB 内存,2*300GB 内置存储),10TB 共享存储。
应用服务器为DELL M910(B-SRV1) PC 服务器,CPU 主频2GHz,操作系统Oracle Linux 6.3(64位),共12台,每台应用服务器8CPU ,64GB 内存,80GB 内置存储。
(三)系统部署情况XXXX 系统系统部署于某某省国税省局,为某某省国税用户提供应用功能使用。
系统部署如下图:290.12.128.1690.12.128.18ynsthxzg 90.12.72.19690.12.72.197ynstj1dw ynsthxff省局用户对整个XXXX 系统系统功能的访问模式及路径如下图所示:某某省国税用户通过部署于省局的金三统一业务工作门户进行系统访问。
由省局提供统一的报表管理、会计核算、征管状况分析应用功能、查询统计、数据集成平台和数据质量管理平台的应用功能服务。
数据仓库-期末考试复习题复思考题(重点)一、单项选择题1)一般信息管理中,采用哪种方式的概念模型最多A。
ce模型B.实体-关系模型C.02O模型D.B/S模型(2)在关系表中,下列哪种属性不能承担主列关键字(Key)?A.身份证号B.银行卡号C.加密电文D.企业标识码(3)数据仓库的生命周期中,不包含下列哪个阶段?A.规划分析阶段B.设计实施阶段C.使用维护阶段D.反馈提升阶段(4)多维切片是指:A.在多个维度上观察全员操作B.多个成员的操作片段C.旋转数据集的部分维度D.在线分析或联机分析(5)一般信息管理中,采用哪种方式的分布式物理模型最多A。
ce模型 B.实体-关系模型C.02O模型D.B/S模型(6)在关系表中,下列哪种属性可以成为外键(Key)?A.客户信用程度B.银行卡行号C.加密的身份证号D.实体商户地址(7)数据仓库的生命周期中,不包含下列哪个阶段排在第三阶段?A.规划分析阶段 B.设计实施阶段 C.使用维护阶段D.反馈提升阶段(8)多维报表是指:A.在多个维度上观察全员操作B.分歧维度花式分歧叠加展示C.旋转数据集的部分维度D.在线阐发或联机阐发(9)数据表的多维索引的感化是:A.使数据表更节省存储空间B.加快数据存储速率C.表格花式美观大方C.加快数据查找效率10)de布局中的MAP职能是?A.钻取B.汇聚C.分发D.结晶11)下列哪种客户需求能够直接成为数据堆栈的多维报表?A.客户销售业绩清单B.客户根本名册C.客户关系图表D.客户反馈信息(12)数据堆栈开辟强调哪种主体特征?A.信息安全性B.业务流程C.操作事务性D.数据实时性(13)数据仓库与数据库系统相比,更加提倡:A.空间换时间B.数据范式更严格C.冗余度更小C.更加适用于分布式结构(14)透视表属于OLAP中的哪种能力范畴?A.存储本领B.展示本领C.稳定性本领D.安全性本领(15)OLAP的系统布局分为:A.胖客户端系统和瘦客户端系统B。
第四章作业1.数据仓库的需求分析的任务是什么?P67需求分析的任务是通过详细调查现实世界要处理的对象(企业、部门用户等),充分了解源系统工作概况,明确用户的各种需求,为设计数据仓库服务。
概括地说,需求分析要明确用那些数据经过分析来实现用户的决策支持需求。
2.数据仓库系统需要确定的问题有哪些?P67、、(1)确定主题域a)明确对于决策分析最有价值的主题领域有哪些b)每个主题域的商业维度是那些?每个维度的粒度层次有哪些?c)制定决策的商业分区是什么?d)不同地区需要哪些信息来制定决策?e)对那个区域提供特定的商品和服务?(2)支持决策的数据来源a)那些源数据与商品的主题有关?b)在已有的报表和在线查询(OLTP)中得到什么样的信息?c)提供决策支持的细节程度是怎么样的?(3)数据仓库的成功标准和关键性指标a)衡量数据仓库成功的标准是什么?b)有哪些关键的性能指标?如何监控?c)对数据仓库的期望是什么?d)对数据仓库的预期用途有哪些?e)对计划中的数据仓库的考虑要点是什么?(4)数据量与更新频率a)数据仓库的总数据量有多少?b)决策支持所需的数据更新频率是多少?时间间隔是多长?c)每种决策分析与不同时间的标准对比如何?d)数据仓库中的信息需求的时间界限是什么?3.实现决策支持所需要的数据包括哪些内容?P68(1)源数据(2)数据转换(3)数据存储(4)决策分析4.概念:将需求分析过程中得到的用户需求抽象为计算机表示的信息结构,叫做概念模型。
特点:(1)能真实反映现实世界,能满足用户对数据的分析,达到决策支持的要求,它是现实世界的一个真实模型。
(2)易于理解,便利和用户交换意见,在用户的参与下,能有效地完成对数据仓库的成功设计。
(3)易于更改,当用户需求发生变化时,容易对概念模型修改和扩充。
(4)易于向数据仓库的数据模型(星型模型)转换。
5.用长方形表示实体,在数据仓库中就表示主题,椭圆形表示主题的属性,并用无向边把主题与其属性连接起来;用菱形表示主题之间的联系,用无向边把菱形分别与有关的主题连接;若主题之间的联系也具有属性,则把属性和菱形也用无向边连接上。
数据库原理课程教学大纲【课程编号】01048【课程名称】数据库原理Principles of Database System【学时学分】64 学时;4学分【实验和上机学时】8【课程性质】专业课【开课模式】必修【先修课程】离散数学、算法与数据结构、操作系统【开课单位】计算机应用软件教研室【开课学期】6【授课对象】计算机科学与技术专业、计算机科学与技术专业(嵌入式方向)、网络工程专业【考核方式】考试一、本课程的性质、目的与任务本课程以关系数据库的基本理论和技术为重点,系统地介绍数据库系统的基础知识、基本原理、方法和技术。
使学生具备数据库的基础理论知识和实际应用能力。
为今后的学习和应用开发打好扎实的数据库基础。
二、课程的教学内容、基本要求和学时分配1. 数据库系统概论(6学时)①数据库系统的基本概念;(*)②数据模型;(*)③数据库系统的体系结构;(*)④数据库系统的组成;⑤数据库技术的研究领域。
2. 关系数据库(6学时)①关系数据模型;(*)②关系的完整性;(*)③关系代数;(*)④关系演算。
3. 关系数据库语言——SQL(12学时)①SQL语言概述;②数据定义;(*)③查询;(*)④数据更新;(*)⑤视图;(*)⑥数据控制;⑦存储过程;⑧数据库应用程序设计简介。
4. 查询处理与查询优化(4学时)①关系数据库系统的查询处理;②关系数据库系统的查询优化。
5. 关系数据理论(6学时)①关系数据理论的基本概念;②关系规范化理论;(*)③数据依赖的公理系统;④关系模式分解。
(*)6. 数据库设计(8学时)①数据库设计的特点、方法和步骤;②数据库设计的需求分析;③数据库的概念结构设计;(*)④数据库的逻辑结构设计;(*)⑤数据库的物理设计;⑥数据库的实施与维护。
7. 数据库的恢复技术(6学时)①事务的基本概念;(*)②数据库恢复概述;③故障的种类;④恢复的实现技术;(*)⑤恢复的策略;⑥具有检查点的恢复技术。
第三章作业1.联机分析处理(OLAP)的简单定义是什么?它体现的特征是什么。
P40联机分析处理是共享多维信息的快速分析。
它体现在四个特征:(1)快速性(2)可分析性(3)多维性(4)信息性2.OLAP准则中的主要准则有哪些?P41(1)多维概念视图(2)透明性(3)可访问性(4)一直稳定的报表性能(5)客户/服务器体系结构(6)维的等同性(7)动态的系数矩阵处理(8)多用户支持能力(9)非限定的跨维操作(10)直观的数据操作(11)灵活的报表生成(12)不受限制的维和聚集层次3. 什么是维?关系数据库是二维数据吗?如何理解多维数据?P43维是人们观察数据的特定角度。
关系数据库不是二维数据,只是通过二维关系表示了数据的多维概念。
多维数据就是从多个特定角度来观察特定的变量。
4.MDDB(Multi Dimensional Database, 多维数据库)是以多维的方式组织数据,即以维作为坐标系,采用类似于数组的形式存储数据。
RDBMS(relational database management system,关系型数据库管理系统)通过数据、关系和对数据的约束三者组成的数据模型来存放和管理数据MDDB特点:1.数据库中的元素具有相同的数值2.多维数据库表达清晰,3.占用存储少RDBMS的特点:1.数据以表格的形式出现2.每行为各种记录名称3.每列为记录名称所对应的数据域4.许多的行和列组成一张表单5.若干的表单组成database5.1.数据存取速度ROLAP服务器需要将SQL语句转化为多维存储语句,临时“拼合”出多维数据立方体。
因此,ROLAP的响应时间较长。
MOLAP在数据存储速度上性能好,响应速度快。
2.数据存储的容量ROLAP使用的传统关系数据库的存储方法,在存储容量上基本没有限制。
MOLAP通常采用多平面叠加成立体的方式存放数据。
当数据量超过操作系统最大文件长度时,需要进行数据分割。
多维数据库的数据量级难以达到太大的字节级。
XXXX基金数据中心建设案例2010年6月目录第一章项目背景 (3)1.1行业概述 (3)1.2公司现状 (3)1.2.1业务系统 (3)1.2.2存在的问题 (3)第二章建设目标 (4)2.1初期规划 (4)2.1.1建立数据中心,实现业务系统共享的公共信息及扩展信息统一存储、统一管理、统一服务 (4)2.2中期规划 (5)2.2.1建立企业服务总线(ESB) (5)2.2.2深化商务智能应用 (5)第三章技术方案 (5)3.1方案优势 (5)3.3系统关系图 (6)3.4数据中心逻辑架构 (7)3.5物理部署图 (8)第四章系统功能模块 (8)4.1数据中心模块 (8)4.1.1.业务系统分析 (8)4.1.2.数据中心建模 (9)4.1.3.数据中心开发 (9)4.1.4.统一应用服务 (10)4.1.5.管理控制台 (10)4.1.6.ESB服务模块 (10)4.2 业务系统升级及商务智能应用模块 (11)4.2.1.外围业务系统升级 (11)4.2.2.商务智能应用 (11)第一章项目背景1.1行业概述基金公司的主要业务涵盖投资、营销、运营、服务、风控和内部管理等方面。
高度的信息化使其积累了大量的业务信息,如何更好的组织、管理、利用这些数据资源,以便为客户提供优质高效的服务;降低业务系统建设、升级、维护的成本;方便进行深层次地数据挖掘和分析,使公司的决策者能及时掌握公司的运行情况,并根据这些分析结果制定长远规划,从而提高公司的管理水平和竞争优势;成为基金公司技术部门目前的努力方向。
1.2公司现状1.2.1 业务系统▪TA▪直销▪呼叫中心▪网站▪CRM▪外呼系统等1.2.2 存在的问题▪各个业务系统基本独自建设,数据分散存储,形成一个个信息孤岛,对共有信息的维护易产生数据不一致的问题,系统间的信息共享缺少统一的标准。
▪由于历史原因,各业务系统建设在数据层面很难统一规划,随着业务系统逐渐增多和功能升级导致系统运行效率、性能、容错性、容灾程度越来越不能满足当今信息化建设的要求。
计算机三级(数据库技术)47(总分100,考试时间120分钟)选择题(每题1分,共60分)1. 用计算机进行导弹飞行轨道的计算,属于下列______计算机应用领域。
A. 人工智能B. 过程控制C. 辅助设计D. 科学和工程计算2. 设关系R的度为20,关系S的度为30。
如果关系T是R与S的广义笛卡儿积,即:T=R×S,则关系T的度为()。
A. 10B. 20C. 30D. 503. 下面列出的条目中,哪些是数据仓库的基本特征?Ⅰ.数据仓库是面向主题的Ⅱ.数据仓库的数据是集成的Ⅲ.数据仓库的数据是相对稳定的Ⅳ,数据仓库的数据是反映历史变化的A. Ⅰ,Ⅱ和ⅢB. Ⅰ,Ⅱ和ⅣC. Ⅱ,Ⅲ和ⅣD. 都是4. 下列的权限中,允许删除关系的是( )。
A. UPDATEB. DELETEC. DROPD. ALTERA TION5. 下面列出的条目中,哪些是数据仓库的基本特征?Ⅰ.数据仓库是面向主题的Ⅱ.数据仓库的数据是集成的Ⅲ.数据仓库的数据是相对稳定的Ⅳ.数据仓库的数据是反映历史变化的A. Ⅰ、Ⅱ和ⅢB. Ⅰ、Ⅱ和ⅣC. Ⅱ、Ⅲ和ⅣD. 都是6. 以字符为基本单位进行存储的文件是_______。
A. 流式文件B. 记录式文件C. 顺序文件D. 索引文件7. 下列______运算不是专门的关系运算。
A. 选择B. 投影C. 笛卡尔积D. 连接8. 现在程序设计中使用多道程序设计的目的是______。
A. 增强系统的用户友好性B. 提高系统实时性C. 充分利用处理器资源D. 扩充内存容量9. 由初步E-R图构成基本E-R图,其主要任务是( )。
A. 消除不必要冗余B. 消除属性冲突C. 消除结构冲突和命名冲突D. B)和C)10. 以下关于B树运算的叙述中,哪一条是正确的?A. 若插入过程中根结点发生分裂,则B树的高度加1B. 每当进行插入运算,就在B树的最下面一层增加一个新结点C. 若要删除的关键码出现在根结点中,则不能真正删除,只能做标记D. 删除可能引起B树结点个数减少,但不会造成B树高度减小11. 对现实世界要处理的对象进行详细调查,在了解现行系统的概况,确定新系统功能的过程中,收集支持系统目标的基础数据及其处理方法。
信息环境下的档案管理摘要:中国燃气涡轮研究院的现代档案管理结合了数据库技术、档案管理理论、备份方案,等等。
本文着重阐述了与现代档案管理密切相关的数据库技术,包括数据库系统的发展与作用、数据库设计中的性能优化,等。
关键词:数据库档案信息化1背景中国燃气涡轮研究院档案馆于1992年引入了数据库技术,打开了中国燃气涡轮研究院档案管理的新篇章。
从access数据库技术,到sql-server,从自建源库到pdm,到航空兰台档案资源综合管理系统,中国燃气涡轮研究院的现代档案管理日趋完善、成熟。
数据库技术,无时无刻不在影响着它所容纳数据的安全与使用。
下面就简单阐释在网络环境下的档案管理核心内容。
2 数据库系统的发展数据库系统的核心是数据模型,其发展经历了格式化数据模型、关系数据模型阶段,正在走向面向对象的数据模型等非传统数据模型的新阶段[1]:2.1 第一代数据库系统二十世纪七十年代,以网状模型、层次模型为代表的第一代数据库系统,实现了数据集中控制和共享,支持三级模式的体系结构外模式、模式、内模式。
2.2 第二代数据库系统二十世纪八十年代,以关系模型为代表的关系数据库,由关系数据结构、关系操作集合、关系完整性约束三部分构成。
关系数据库系统的发展促进了数据库系统的小型化。
如:1976年,ibm san jose研究室推出了syatem r和加州大学伯克利分校的ingres关系数据库。
2.3 新一代数据库系统二十世纪八十年代末九十年代初,开发了新一代数据库系统以处理除常规数据外的数据,因而提出了许多新概念、新方法,如:分布式数据库、web数据库、面向对象数据库、并行数据库、多媒体数据库、主动数据库、数据仓库、工程数据库、空间数据库等。
3 数据库系统发展在数字档案馆建设中的作用数据库系统发展在数字档案馆建设中的作用主要有[2]:数据库备份技术加强数字档案馆数据的安全;存储过程可以有效提高应用程序的性能;用户权限设置可以提高数据库应用安全性;建立全文索引和全文存储技术,可以对保存在数据库中的office文件进行全文检索等。
第1章习题参考答案1。
思考题(1)什么是数据库、数据库管理系统、数据库系统?它们之间有什么联系?答:数据库是存贮在计算机内的有结构的数据集合;数据库管理系统是一个软件,用以维护数据库、接受并完成用户对数据库的一切操作;数据库系统指由硬件设备、软件系统、专业领域的数据体和管理人员构成的一个运行系统。
(2)当前,主要有哪几种新型数据库系统?它们各有什么特点?用于什么领域,试举例说明?答:主要有:分布式数据库、面向对象数据库、多媒体数据库、数据仓库技术、空间数据库。
(3)什么是数据模型?目前数据库主要有哪几种数据模型?它们各有什么特点?答:数据模型是一组描述数据库的概念。
这些概念精确地描述数据、数据之间的关系、数据的语义和完整性约束。
很多数据模型还包括一个操作集合。
这些操作用来说明对数据库的存取和更新。
数据模型应满足3方面要求:一是能真实地模拟现实世界;二是容易为人们理解;三是便于在计算机上实现。
目前在数据库领域,常用的数据模型有:层次模型、网络模型、关系模型以及最近兴起的面向对象的模型。
(4)关系数据库中选择、投影、连接运算的含义是什么?答:1)选择运算:从关系中筛选出满足给定条件的元组(记录)。
选择是从行的角度进行运算,选择出的记录是原关系的子集.2)投影运算:从关系中指定若干个属性(字段)组成新的关系.投影是从列的角度进行运算,得到的新关系中的字段个数往往比原关系少.3)连接运算:将两个关系按照给定的条件横向拼接成新的关系。
连接过程是通过两个关系中公有的字段名进行的.(5)关键字段的含义是什么?它的作用是什么?答:一个关系中可以确定一个字段为关键字段,该字段的值在各条记录中不能有相同的值.(如:门牌号码);关键字段的作用主要是为建立多个表的关联和进行快速查询.(6)什么是E-R图?E-R 图是由哪几种基本要素组成?这些要素如何表示?答:E-R图也称实体—联系图(Entity Relationship Diagram),提供了表示实体类型、属性和联系的方法,用来描述现实世界的概念模型。