基础数据管理模块建模.ppt
- 格式:ppt
- 大小:238.01 KB
- 文档页数:9
数据建模基础一、什么是数据建模1.1 数据建模的定义数据建模是指在建立信息系统的过程中,对数据进行抽象和规范化的过程。
它通过对数据的组织、描述和关系的建立,将现实中的复杂信息转化为计算机可处理的数据模型。
1.2 数据建模的作用数据建模是信息系统开发的基础工作,它有以下几个作用:1.明确需求:数据建模可以帮助开发人员和用户明确系统的需求,理清需求之间的关系和约束。
2.系统设计:数据建模可以为系统设计提供基础架构,定义业务对象和业务关系,有助于系统的模块化和可扩展性。
3.数据管理:数据建模可以规范数据的存储和管理,提高数据的可靠性和可维护性。
4.决策支持:数据建模可以帮助管理者进行数据分析和决策,提供统一的数据视图和查询接口。
二、数据建模的方法2.1 实体关系模型(ERM)实体关系模型是最基本的数据建模方法之一,它使用实体、属性和关系来描述现实世界中的事物和事物之间的关系。
1.实体(Entity):表示现实世界中具有独立存在和唯一标识的事物,可以是具体的对象或抽象的概念。
2.属性(Attribute):表示实体的特征或属性,用于描述实体的特性和状态。
3.关系(Relationship):表示实体之间的联系或关联,用于描述实体之间的关系和依赖。
2.2 关系模型(RM)关系模型是基于关系代数和集合论的数据建模方法,它使用表格和关系运算符来处理数据的组织、存储和查询。
1.表格(Table):关系模型使用表格来表示数据,每个表格对应一个实体或关系,表格由行和列组成。
2.关系运算符(Relational Operator):关系模型使用关系运算符来实现数据的查询和操作,包括选择、投影、连接和除等操作。
2.3 UML建模UML(Unified Modeling Language)是一种通用的建模语言,可以用于描述系统的静态结构和动态行为。
1.类图(Class Diagram):用于描述系统的静态结构,包括类、对象、属性和关系等。
数据管理知识体系数据架构设计包括对业务数据的描述,数据收集、存储、整合、迁移、分布、验证、增强、链接、脱敏等。
模型:是指结构+规范。
包括数据实体(业务概念)、实体间的关系、业务规则、关键属性、定义、规划、映射、业务规则模型分类:概念模型、逻辑模型、物理模型模型设计方法:自上而下:先设计主题,再设计下层模型自下而上:先分析现有模型,再向上提炼抽象模型:是由各个组件组成,标准化进行管理数据建模和设计数据可以使用多种模式来表示:关系模型、多维模型、面向对象模式、基于实事的模型、时间序列模型、非关系模型;又可通过概念模型、逻辑模型、物理模型来表示。
每种模型包含多个组件。
每个组件又由实体、实体间关系、事实、键、属性等组成。
数据建模和设计语境关系图:定义:目标:确认并记录不同视角对数据需求的理解。
确保应用程序更加符合当前和未来的业务需求。
输入:现有数据模型和数据库、数据标准、数据集、初始需求、原始需求、数据架构、企业分类法;活动:规划数据建模、建立数据模型(概念模型、逻辑模型、物理模型)、审核、维护;输出:概念模型、逻辑模型、物理模型;方法:命名规范、数据库规范设计、数据库类型选择;工具:数据建模工具、数据血缘工具、数据分析工具、元数据资料库、数据模型模式、行业数据模型;度量指标:数据模型校验指标。
确认并记录不同视角对数据需求的理解,有助于:格式化:数据模型是对结构和关系的简单定义,能够评估当前或理想情况上业务规则对数据的影响。
格式化定义赋予了数据规范和结构,减少业务在访问和保存数据时的异常概率;范围定义:数据模型可以解释数据的上下文边界。
1、数据建模:对组织数据理解的过程。
数据模型是现实实物的一个表征或想要创造事件的一个样式;2、建模的数据模型:对主要数据类型建模a)类别信息:对主要数据进行分类或分配事物类型的数据,如按业务部门或按市场分类划分客户、按型号划分产品等;b)资源信息:实施操作流程所需要的基本数据资源,如产品、客户、供应商等;c)业务事件信息:操作过程创建的数据,如订单数据;d)详细的交易信息:泛采集到的原始的明细数据,如传感器采集到的数据。
引言:数据仓库是一个用来存储、整合和管理组织中各种类型数据的集中库,为决策支持和业务分析提供数据基础。
在数据仓库建设过程中,数据建模是一个至关重要的步骤,它决定了数据仓库的架构、数据的组织方式以及数据的查询效率。
本文将介绍数据仓库的常见建模方法,并通过实例演示来加深理解。
概述:数据仓库建模主要包括维度建模和标准化建模两种方法。
维度建模侧重数据的分析和查询,采用星型或雪花型模型,标准化建模侧重数据的存储和管理,采用三范式模型。
下面将对这两种方法进行详细阐述。
正文内容:一、维度建模1. 星型模型- 星型模型是一种常见的维度建模方法,它以一个中心事实表为核心,围绕着多个维度表构建关系。
这种模型简单直观,适用于多维分析和查询操作。
- 实例演示:我们以零售业为例,事实表为销售订单表,维度表包括产品维度、时间维度和地区维度。
通过星型模型,可以方便地进行销售额、销售量等指标的分析和查询。
2. 雪花型模型- 雪花型模型是在星型模型的基础上进行维度表的归一化,并使用多层级的维度表来表示更复杂的关系。
这种模型适用于维度之间有多级关系的情况。
- 实例演示:在健康保险领域,事实表为理赔表,维度表包括疾病分类维度、医院维度和地区维度。
通过雪花型模型,可以灵活地进行疾病的统计分析,如特定疾病在特定地区的就医情况。
3. 硬度建模- 硬度建模是一种将维度直接存储在事实表中的建模方法,它减少了维度表和事实表之间的连接,提高了查询效率。
这种模型适用于维度表较小且不经常发生变化的情况。
- 实例演示:在人力资源管理中,事实表为员工绩效表,维度信息包括员工姓名、所属部门、入职日期等。
通过硬度建模,可以快速地查询某个员工的绩效数据和所属部门的平均绩效数据。
二、标准化建模1. 第一范式- 第一范式是一种最基本的标准化建模方法,要求每个字段的值不可再分,即每个字段都是不可再分的最小单元。
这种模型适用于简单的存储和管理需求。
- 实例演示:在物流管理中,需要存储和管理货物的基本信息,如货物名称、货物数量、货物重量等。