第一章 从数据库到数据仓库
- 格式:ppt
- 大小:592.50 KB
- 文档页数:56
第一章习题参考答案1.选择题(1)数据库(DB)、数据库系统(DBS)、数据库管理系统(DBMS)三者之间的关系是(A)。
A.DBS包括DB和DBMS B.DBMS包括DB和DBSC.DB包括DBS和DBMS D.DBS就是DB,也就是DBMS (2)设有部门和职员两个实体,每个职员只能属于一个部门,一个部门可以有多名职员,则部门与职员实体之间的联系类型是(B)。
A.m:n B.1:m C.m:k D.1:1(3)对于“关系”的描述,正确的是( D)。
A.同一个关系中允许有完全相同的元组B.同一个关系中元组必须按关键字升序存放C.在一个关系中必须将关键字作为该关系的第一个属性D.同一个关系中不能出现相同的属性名(4)E-R图用于描述数据库的(A)。
A.概念模型B.数据模型C.存储模型D.逻辑模型(5)在关系模型中,一个关键字(C)。
A.可以由多个任意属性组成B.至多由一个属性组成C.可以由一个或者多个其值能够唯一表示该关系模式中任何元组的属性组成D.可以由一个或者多个任意属性组成(6)现有如下关系:患者(患者编号,患者姓名,性别,出生日期,单位)医疗(患者编号,患者姓名,医生编号,医生姓名,诊断日期,诊断结果)其中,医疗关系中的外关键字是(A)。
A.患者编号B.患者姓名C.患者编号和患者姓名D.医生编号和患者编号(7)一个关系只有一个(D)。
A.候选关键字B.外部关键字C.组合关键字D.主关键字(8)下列标识符可以作为局部变量使用的是(C)。
A.[@Myvar] B.My var C.@Myvar D.@My var (9)Transact-SQL支持的一种程序结构语句是(A)。
A.BEGIN…E ND B.IF…T HEN…ELSEC.DO CASE D.DO WHILE(10)字符串常量使用(A)作为定界符。
A.单引号B.双引号C.方括号D.花括号2.填空题(1)数据库是在计算机系统中按照一定的方式组织、存储和应用的(数据集合)。
面向应用领域的数据库新技术数据库技术被应用到特定的领域中,出现了工程数据库,地理数据库,统计数据库、科学数据库、空间数据库等多种数据库,使数据库领域中新的技术内容层出不穷。
一、数据仓库传统的数据库技术是以单一的数据资源为中心,进行各种操作型处理。
操作型处理也叫事务处理,是指对数据库联机地日常操作,通常是对一个或一组记录的查询和修改,主要是为企业的特定应用服务的,人们关心的是响应时间,数据的安全性和完整性。
分析型处理则用于管理人员的决策分析。
例如:DSS,EIS和多维分析等,经常要访问大量的历史数据。
于是,数据库由旧的操作型环境发展为一种新环境:体系化环境。
体系化环境由操作型环境和分析型环境(数据仓库级,部门级,个人级)构成。
数据仓库是体系化环境的核心,它是建立决策支持系统(DSS)的基础。
1.从数据库到数据仓库具体来说,有以下原因使得事务处理环境不适宜DSS应用⑴事务处理和分析处理的性能特性不同在事务处理环境中,用户的行为特点是数据的存取操作频率高而每次操作处理的时间短,因此,系统可以允许多个用户按分时方式使用系统资源,同时保持较短的响应时间,OLTP (联机事务处理)是这种环境下的典型应用。
在分析处理环境中,某个DSS应用程序可能需要连续运行几个小时,从而消耗大量的系统资源。
将具有如此不同处理性能的两种应用放在同一个环境中运行显然是不适当的。
⑵数据集成问题DSS需要集成的数据。
全面而正确的数据是有效的分析和决策的首要前提,相关数据收集得越完整,得到的结果就越可靠。
因此,DSS不仅需要整个企业内部各部门的相关数据,还需要企业外部、竞争对手等处的相关数据。
而事务处理的目的在于使业务处理自动化,一般只需要与本部门业务有关的当前数据,对整个企业范围内的集成应用考虑很少。
当前绝大部分企业内数据的真正状况是分散而非集成的,这些数据不能成为一个统一的整体。
对于需要集成数据的DSS应用来说,必须自己在应用程序中对这些纷杂的数据进行集成。
管理信息系统总结第⼀章信息系统概论●信息技术对市场和企业运作模式的影响经济全球化-导致:全球市场的管理、控制和竞争;全球性⼯作团队、采购、⽣产、供应、技术⽀持和售后服务;–企业渴望:通过ISIS所提供的信息沟通、分析功能进⾏快捷的信息交换和辅助决策;克服地理位置分散、信息共享和协调困难的局⾯,在全球范围内进⾏贸易,在世界市场中进⾏采购,向世界各地⽤户提供服务。
⼯业经济向知识和信息经济的转变–信息和知识劳动者逐渐取代体⼒劳动者–新兴服务业–新的知识与信息密集型组织–新的知识与信息密集产品–知识在传统产品制造中的应⽤得到加强●企业组织的变⾰传统的企业组织:层级式、集权、结构化新型的企业组织:扁平化、分权、弹性●管理模式的变⾰(制造业为例)物料需求计划MRP:⽣产过程中的缺料问题,降低了库存制造资源计划MRPII:物流和资⾦流的集成和统⼀管理准时⽣产制JIT:消除⽆效作业,按需⽣产企业资源计划ERP:对物料、劳⼒、设备资⾦等全⾯计划供应链管理SCM:控制供应商-制造商-销售商建⽴合作伙伴,剥离⾮核⼼业务,抓要害●信息系统的概念从系统的⾓度定义信息系统信息系统是⼀系列相互关联的可以收集(输⼊)、操作和存储(处理)、传播(输出)数据和信息,并提供反馈机制以实现其⽬标的元素或组成部分的集合。
数据:⼀串原始资料,代表组织中或是周遭所发⽣事件的记录,尚未整理成⼈们能了解和使⽤的格式信息:数据已被整理成对⼈⽽⾔有意义且有⽤的格式。
Meaningful知识:被理解、发现、知道的对事物认识的⼀组规则、规律,辅助决策。
Useful从企业的⾓度定义信息系统从企业⾓度看,信息系统是⼀个基于信息技术的,为了应对环境造成的挑战⽽⽣成的组织和管理的解决⽅案。
-为对抗外在环境挑战,基于信息技术⽽建⽴的组织与管理上的解决⽅案。
-企业信息价值链中获取、转换与传播信息等⼀系列增值活动的⼀部分。
●组织的关键要素员⼯: 管理者,知识⼯作者,数据⼯作者,⽣产或服务⼈员结构: 组织结构图,专家组,产品,地理位置作业程序: 标准作业程序 (SOP, ⾏动规则))政治: 不同层级的利益与观点,冲突与妥协⽂化: ⾏为习惯,⾏事风格,价值观商业功能:销售和市场:销售产品或服务⽣产制造:⽣产产品或服务财务:管财(现⾦、股票、债券)会计:记账(收据、退款、⽀票付款等)⼈⼒资源:⼈员招聘、培训和管理等层级:⾼层主管: 负责公司产品与服务的长远战略规划中层管理者: 执⾏⾼层主管计划作业管理者: 负责监控公司的⽇常⼯作●信息系统的社会技术视⾓透视—组织和信息系统如何相互影响、配合、依赖第⼆章信息系统应⽤体系●经营管理活动可以分成3个层次-作业计划与控制层(简称作业层)-管理控制和战术计划层(简称管理层)负责实施组织的⽬标,对组织内部的各种资源进⾏有效的利⽤,计划并控制组织的活动,对计划实施的情况进⾏检查,以确保⽬标的实现-战略计划层(简称战略层)确定组织的⽬标、制定实现该⽬标的长远政策和发展⽅向,并负责与外部环境进⾏联系组织内信息系统—按组织阶层分类注: 这个图特别重要,不同领域不同层次的功能,会出题!!1.TPS(Transaction Processing System)事务:是指组织的基本业务活动。
第一章1,数据挖掘(Data Mining),就是从存放在数据库,数据仓库或其他信息库中的大量的数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。
2,人工智能(Artific ial Intelli gence)它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。
3,机器学习(Machine Learnin g)是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
4,知识工程(Knowled ge Enginee ring)是人工智能的原理和方法,对那些需要专家知识才能解决的应用难题提供求解的手段。
5,信息检索(Informa tion Retriev al)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。
6,数据可视化(Data Visuali zation)是关于数据之视觉表现形式的研究;其中,这种数据的视觉表现形式被定义为一种以某种概要形式抽提出来的信息,包括相应信息单位的各种属性和变量。
7,联机事务处理系统(OLTP)实时地采集处理与事务相连的数据以及共享数据库和其它文件的地位的变化。
在联机事务处理中,事务是被立即执行的,这与批处理相反,一批事务被存储一段时间,然后再被执行。
8, 联机分析处理(OLAP)使分析人员,管理人员或执行人员能够从多角度对信息进行快速一致,交互地存取,从而获得对数据的更深入了解的一类软件技术。
8,决策支持系统(decisio n support)是辅助决策者通过数据、模型和知识,以人机交互方式进行半结构化或非结构化决策的计算机应用系统。
第一章总则第一条为规范数据仓库建设管理工作,确保数据仓库建设质量,提高数据仓库应用效果,促进企业信息化建设,特制定本制度。
第二条本制度适用于企业内部数据仓库建设过程中的组织、规划、实施、维护等各个环节。
第三条数据仓库建设应遵循以下原则:1. 面向业务:以企业业务需求为导向,确保数据仓库满足企业决策分析需求。
2. 集成性:整合企业内外部数据资源,实现数据共享和交换。
3. 可扩展性:适应企业业务发展,满足未来数据增长需求。
4. 安全性:确保数据仓库运行稳定,保障数据安全。
第二章组织与管理第四条企业成立数据仓库建设领导小组,负责数据仓库建设的总体规划和决策。
第五条设立数据仓库管理部门,负责数据仓库建设过程中的日常管理工作,包括:1. 制定数据仓库建设方案;2. 组织项目实施;3. 监督项目进度;4. 确保项目质量;5. 做好数据仓库维护工作。
第六条数据仓库建设应成立项目组,负责具体实施工作,项目组由以下人员组成:1. 项目经理:负责项目整体规划、协调和监督;2. 技术负责人:负责技术选型、系统设计、开发与测试;3. 业务负责人:负责业务需求分析、数据质量监控;4. 运维负责人:负责数据仓库运维保障。
第三章数据仓库规划与设计第七条数据仓库规划应包括以下内容:1. 需求分析:明确企业业务需求,确定数据仓库主题;2. 数据模型设计:根据需求分析,设计数据仓库模型;3. 技术选型:选择合适的数据库、工具和技术;4. 系统架构设计:确定数据仓库系统架构,包括硬件、软件、网络等。
第八条数据仓库设计应遵循以下原则:1. 面向主题:围绕企业业务主题进行数据组织;2. 集成性:确保数据来源的多样性和一致性;3. 可扩展性:适应业务发展,满足未来数据增长需求;4. 易用性:便于用户查询、分析和使用。
第四章数据仓库实施与运维第九条数据仓库实施应包括以下步骤:1. 数据抽取:从源系统中抽取所需数据;2. 数据清洗:对抽取的数据进行清洗,确保数据质量;3. 数据转换:将清洗后的数据进行转换,满足数据仓库需求;4. 数据加载:将转换后的数据加载到数据仓库中;5. 系统测试:对数据仓库进行功能测试、性能测试和安全性测试。
第一章总则第一条为规范银行数据仓库的开发、管理、维护和使用,确保数据仓库的稳定、高效、安全运行,提高数据质量,特制定本制度。
第二条本制度适用于银行内部所有涉及数据仓库的项目、团队和个人。
第三条本制度遵循以下原则:1. 规范化:数据仓库的开发、管理、维护和使用应遵循规范化的流程和标准。
2. 安全性:确保数据仓库的数据安全,防止数据泄露、篡改和丢失。
3. 可靠性:确保数据仓库的稳定运行,提高数据质量,为业务决策提供有力支持。
4. 可扩展性:适应业务发展和技术进步,满足不同业务场景的需求。
第二章数据仓库流程第四条数据仓库流程主要包括以下阶段:1. 需求分析对业务需求进行调研和分析,明确数据仓库的建设目标、数据范围、功能需求等。
2. 数据建模根据需求分析结果,设计数据仓库的数据模型,包括概念模型、逻辑模型和物理模型。
3. 数据抽取从源系统中抽取数据,进行数据清洗、转换和集成。
4. 数据加载将清洗、转换后的数据加载到数据仓库中。
5. 数据维护对数据仓库进行日常维护,包括数据更新、备份、恢复等。
6. 数据查询与分析为用户提供数据查询和分析服务,支持业务决策。
第三章规范与标准第五条数据仓库命名规范1. 数据库、表、字段等命名应遵循统一的命名规则,易于理解和记忆。
2. 命名应避免使用特殊字符和缩写,确保唯一性和可读性。
第六条 ETL开发规范1. ETL开发人员应遵循ETL开发规范,确保ETL过程的正确性和稳定性。
2. ETL脚本应具有良好的可读性和可维护性,便于调试和修改。
第七条数据质量规范1. 数据仓库的数据质量应符合相关标准,确保数据准确、完整、一致。
2. 定期对数据质量进行检查,发现问题及时整改。
第四章管理与维护第八条数据仓库管理1. 数据仓库管理员负责数据仓库的日常管理,包括数据备份、恢复、监控等。
2. 数据仓库管理员应定期对数据仓库进行性能优化,提高数据查询效率。
第九条数据维护1. 数据维护人员负责数据仓库的数据维护工作,包括数据更新、备份、恢复等。