数据架构参考
- 格式:doc
- 大小:410.00 KB
- 文档页数:63
架构设计之数据架构概述:数据架构是指在软件系统中对数据进行组织、存储和管理的结构和方式。
一个良好的数据架构设计能够提高系统的性能、可靠性和可扩展性。
本文将详细介绍数据架构的标准格式,包括数据模型、数据存储和数据管理等方面。
一、数据模型:数据模型是描述数据结构和数据之间关系的一种工具。
常用的数据模型有层次模型、网络模型、关系模型和面向对象模型等。
在进行数据架构设计时,需要选择适合系统需求的数据模型,并根据实际情况进行定制。
1.1 层次模型:层次模型是最早的数据模型之一,它将数据组织成树状结构,每个节点代表一个实体,节点之间通过父子关系进行连接。
层次模型适用于具有明确层次结构的数据,但对于复杂的关系无法很好地表示。
1.2 网络模型:网络模型是在层次模型的基础上进行扩展,引入了多对多的关系。
它通过记录集(record set)和集合(set)之间的连接来表示数据之间的关系。
网络模型适用于具有复杂关系的数据,但对于查询和维护操作较为复杂。
1.3 关系模型:关系模型是目前最常用的数据模型,它将数据组织成二维表格的形式,通过行和列来表示数据和属性。
关系模型具有良好的结构化特性,能够方便地进行查询和维护操作。
在进行数据架构设计时,通常选择关系模型作为基础。
1.4 面向对象模型:面向对象模型是在关系模型的基础上进行扩展,引入了对象、类和继承等概念。
面向对象模型适用于具有复杂对象关系的数据,能够更好地反映现实世界的复杂性。
但在实际应用中,需要考虑面向对象模型的复杂性和性能开销。
二、数据存储:数据存储是指将数据保存在物理介质中的过程。
在进行数据架构设计时,需要选择合适的数据存储方式,并考虑数据的安全性、可靠性和性能等因素。
2.1 关系型数据库:关系型数据库是最常用的数据存储方式,它将数据以表格的形式存储,并通过SQL语言进行查询和操作。
关系型数据库具有良好的结构化特性和事务支持,适用于大部分的数据管理需求。
2.2 非关系型数据库:非关系型数据库是近年来兴起的一种新型数据存储方式,它以键值对、文档、列族和图等形式存储数据。
数据架构设计文档模板## 数据架构设计文档### 1. 引言本文档旨在描述数据架构设计的所有方面,包括各个数据组件的功能和关系,数据模型的设计和维护,以及数据流和数据存储的规划方案。
### 2. 数据需求在本部分中,需要具体描述系统对数据的需求和要求。
包括但不限于以下几个方面:- 数据的类型和格式- 数据的来源和去向- 数据的量级和增长率- 数据的敏感性和安全性要求### 3. 数据模型设计在本部分中,需要详细描述系统的数据模型设计,包括逻辑模型和物理模型的设计。
逻辑模型描述数据的逻辑结构和关系,物理模型描述数据在存储介质上的实际存储结构。
可以使用实体-关系图、UML类图等方式进行描述。
### 4. 数据流设计在本部分中,需要详细描述数据在系统中的流动过程,包括数据的产生、传输、转换和存储等环节。
可以使用流程图、时序图等方式进行描述。
### 5. 数据存储设计在本部分中,需要详细描述系统中的数据存储方案。
包括但不限于以下几个方面:- 数据库设计:包括数据库的选择、表结构设计、索引设计等- 分布式存储设计:如果系统需要支持分布式存储,需要描述分布式存储方案的设计和实施细节- 缓存设计:如果系统需要支持缓存,需要描述缓存的设计和实施细节### 6. 数据维护策略在本部分中,需要描述数据的维护策略,包括数据备份和恢复策略、数据迁移策略、数据清理策略等。
### 7. 数据安全设计在本部分中,需要描述数据的安全设计,包括数据的加密和解密策略、访问控制策略、审计策略等。
### 8. 数据质量保证在本部分中,需要描述数据质量保证的方案和策略,包括数据质量检查和修复策略、数据一致性和完整性保证策略等。
### 9. 数据治理在本部分中,需要描述数据治理的方案和策略,包括数据标准化、数据管理流程、数据所有权和责任等。
### 10. 参考资料在本部分中,可以列出本文档所参考的资料和文献。
### 11. 修订记录在本部分中,记录本文档的修订历史,包括修订日期、修订内容和修订人等信息。
架构设计之数据架构数据架构是指在软件系统中对数据进行组织和管理的方式和结构。
一个良好的数据架构可以提高系统的性能、可靠性和可扩展性。
在架构设计中,数据架构起着至关重要的作用。
本文将详细介绍数据架构的标准格式,包括数据模型、数据存储、数据访问和数据传输等方面。
一、数据模型数据模型是描述数据结构、数据操作和数据约束的概念工具。
常见的数据模型有关系型模型、面向对象模型和文档模型等。
在进行数据架构设计时,需要根据系统需求选择合适的数据模型。
以下是一个示例的数据模型:表名:用户信息表字段:- 用户ID:整型,主键- 用户名:字符串,惟一- 密码:字符串- 邮箱:字符串- 手机号:字符串二、数据存储数据存储是指将数据持久化保存的过程。
在数据架构设计中,需要考虑数据存储的可靠性、性能和扩展性。
常见的数据存储方式包括关系型数据库、NoSQL数据库和分布式文件系统等。
以下是一个示例的数据存储方案:数据库:MySQL表名:用户信息表字段:- 用户ID:整型,主键- 用户名:字符串,惟一索引- 密码:字符串- 邮箱:字符串- 手机号:字符串三、数据访问数据访问是指对数据进行读取、写入和更新的操作。
在数据架构设计中,需要考虑数据访问的效率和安全性。
常见的数据访问方式包括SQL查询、API调用和ORM框架等。
以下是一个示例的数据访问方案:语言:Java框架:Spring Boot接口:- 查询用户信息:- 请求方式:GET- 请求路径:/api/user/{userId}- 返回结果:JSON格式的用户信息- 创建用户信息:- 请求方式:POST- 请求路径:/api/user- 请求参数:JSON格式的用户信息- 返回结果:JSON格式的创建成功信息四、数据传输数据传输是指在不同系统之间传递数据的过程。
在数据架构设计中,需要考虑数据传输的安全性和可靠性。
常见的数据传输方式包括HTTP协议、消息队列和文件传输等。
以下是一个示例的数据传输方案:协议:HTTP接口:- 查询用户信息:- 请求方式:GET- 请求URL:example/api/user/{userId}- 请求头:Content-Type: application/json- 请求体:无- 返回结果:JSON格式的用户信息- 创建用户信息:- 请求方式:POST- 请求URL:example/api/user- 请求头:Content-Type: application/json- 请求体:JSON格式的用户信息- 返回结果:JSON格式的创建成功信息以上是关于架构设计中数据架构的标准格式文本。
引言概述:数据中心是现代企业和组织的核心基础设施,它承载着大量的数据存储和处理任务。
为了能够高效地管理和处理这些数据,一个合理的数据中心架构是必不可少的。
本文将深入探讨数据中心架构的三个基础要素:网络架构、存储架构和计算架构,以帮助读者更好地理解数据中心的设计和运维。
网络架构:1. 网络拓扑结构:数据中心通常采用三层网络架构,包括核心层、汇聚层和接入层,这样可以提供高可用性和可扩展性。
2. 网络设备:常见的网络设备有路由器、交换机和防火墙等,它们通过虚拟局域网(VLAN)和交换虚拟化技术(VXLAN)等实现数据的传输和隔离。
3. SDN技术:软件定义网络(SDN)可以提高网络的灵活性和可编程性,使得数据中心网络的管理更为简便和高效。
4. 高可用性和负载均衡:通过配置冗余设备和使用负载均衡算法,可以避免单点故障,并实现对网络流量的均衡分配。
存储架构:1. 存储设备:数据中心采用不同类型的存储设备,如磁盘阵列、网络存储设备(NAS)和存储区域网络(SAN)等,以满足不同的存储需求。
2. 存储协议:常见的存储协议有网络文件系统协议(NFS)和块存储协议(如iSCSI和FCP),它们用于数据中心中的文件共享和块级存储。
3. 存储虚拟化:通过存储虚拟化技术,可以将物理存储资源抽象成逻辑存储池,并实现数据的动态迁移和资源的动态分配。
4. 数据保护和备份:在数据中心中,数据的安全性和可靠性非常重要。
通过定期备份、快照和复制等手段,可以保护数据免受损坏和丢失的风险。
5. 存储性能优化:通过使用高速存储介质(如固态硬盘)和优化数据访问模式,可以提升数据中心的存储性能和响应速度。
计算架构:1. 服务器硬件:数据中心中常用的服务器硬件包括标准服务器、刀片服务器和高密度服务器等,可以根据实际需求选择适合的硬件平台。
2. 虚拟化技术:利用虚拟化技术,可以将物理服务器划分为多个虚拟机,实现资源的共享和利用率的提升。
3. 容器化技术:容器化技术(如Docker)可以更加轻量级地实现应用的部署和扩展,提供更高的灵活性和效率。
数据架构参考范文数据架构是指用于描述和组织数据的结构和组织方式。
它是数据管理和数据存储的基础,并为数据的收集、存储、处理和分析提供支持。
一个好的数据架构可以提高数据的质量、可靠性和可用性,促进数据的共享和集成,以及支持企业的决策和业务目标。
以下是一些数据架构的参考要点:1.数据模型:数据模型是数据架构的基础。
它描述了数据的实体、属性、关系和约束。
常用的数据模型包括层次模型、网络模型、关系模型和对象模型。
关系模型是最为常用的一种数据模型,它采用表格、行和列来表示数据。
2.数据仓库:数据仓库是一个面向主题的、集成的、稳定的、一致的、可分析的数据集合。
它通常用于支持决策支持系统和数据分析。
数据仓库有多个层次,包括原始数据层、清洗和转换层、集成层和决策支持层。
3. 数据湖:数据湖是一个用于存储和分析大数据的中心存储库。
它可以接收来自多个数据源的原始数据,并以其原始格式保存。
数据湖通常采用分布式文件系统,如Hadoop或Amazon S3、它可以存储结构化数据、半结构化数据和非结构化数据。
4. 数据流程:数据流程描述了数据在不同系统和组件之间的流动和转换。
它包括数据的输入、处理、存储和输出。
数据流程可以通过图表、流程图或文档来表示。
常见的数据流程技术包括ETL(Extract, Transform, Load)和ELT(Extract, Load, Transform)。
5.数据安全:数据安全是数据架构的重要组成部分,它涉及到数据的保密性、完整性和可用性。
数据安全包括身份验证、授权、加密、审计和备份等措施。
数据架构应该考虑到各种威胁和风险,并采取相应的安全措施来保护数据。
6.数据治理:数据治理是一套规范和流程,用于管理和保护数据资源。
它涉及到数据的定义、分类、命名、标准化和文档化等方面。
数据治理还包括数据质量的监控和改进,以确保数据的准确性、一致性和可靠性。
7.数据集成:数据集成是将多个数据源的数据合并为一个一致的数据集合,以支持决策和分析。
架构设计之数据架构数据架构是指在软件系统中,对数据进行组织、存储、管理和访问的结构和规范。
一个良好的数据架构设计能够提高系统的性能、可靠性和可扩展性。
在本文中,将介绍数据架构的基本概念、设计原则和常用技术,以及一个示例数据架构设计的详细说明。
一、数据架构的基本概念1. 数据模型:数据模型是对现实世界中的实体和关系进行抽象和描述的方法。
常用的数据模型有层次模型、网络模型、关系模型和对象模型等。
2. 数据库管理系统(DBMS):DBMS是负责管理和操作数据库的软件系统。
它提供了数据存储、数据访问、数据安全和数据一致性等功能。
3. 数据库:数据库是指存储在物理介质上的数据集合。
它按照一定的数据模型进行组织和管理,可以被DBMS管理和访问。
4. 数据库实例:数据库实例是指在内存中加载数据库,并提供对数据库的访问和操作的运行时环境。
5. 数据库表:数据库表是数据在数据库中的组织形式,由行和列组成。
每一行表示一个记录,每一列表示一个属性。
6. 数据库索引:数据库索引是一种提高数据检索速度的数据结构。
它通过建立索引键和数据之间的映射关系,加快数据的查找和访问速度。
二、数据架构的设计原则1. 数据一致性:数据架构应该保证数据的一致性,即数据在不同的地方和时间访问时,保持一致的值和状态。
2. 数据完整性:数据架构应该保证数据的完整性,即数据的约束条件和业务规则得到满足,不会浮现错误或者不一致的数据。
3. 数据安全性:数据架构应该保证数据的安全性,即数据只能被授权的用户访问和修改,防止未经授权的访问和恶意操作。
4. 数据可扩展性:数据架构应该具备良好的可扩展性,能够适应系统的增长和变化,保持系统的性能和可靠性。
5. 数据性能:数据架构应该优化数据的访问和操作性能,提高系统的响应速度和吞吐量。
三、常用的数据架构技术1. 分布式架构:分布式架构将数据分布在多个节点上,通过网络进行通信和协作,提高系统的可扩展性和性能。
常用的分布式架构有主从架构、集群架构和分布式数据库等。
大数据处理技术参考架构二〇一五年十二月目录1.背景随着大数据时代的到来,数据由海量拓展为多样,在注重计算速度的同时更加关注挖掘有价值的数据。
以IOE体系为核心的数据计算和存储方式越来越不能满足目前大数据处理在性能和成本上的综合要求。
为适应对大数据处理的要求,众多的分布式计算平台随之兴起,在对众多分布式计算平台进行权衡的同时,增强自主创新能力,以满足人民银行对信息技术安全可控的要求。
在核心应用自主研发、核心知识自主掌控的氛围下,保障大数据技术达到灵活可用的目标,确保数据和信息的有效、及时,确保信息系统的可靠、灵活。
同时,充分的利用开源产品透明公开的关键信息,做到对技术细节的掌控和验证,开源产品的特点也更能够激发开发者的热情并推进技术的快速变革。
在“互联网+”的战略布局下,当利用信息通信技术把互联网和包括金融行业在内的相关行业结合起来时,能够更加合理和充分的利用大数据技术促进互联网金融的健康发展。
当前互联网金融的格局中,由传统金融机构和非金融机构组成。
传统金融机构的发展方向主要为传统金融业务的互联网创新以及电商化创新、手机APP服务等;非金融机构的发展方向则主要是指利用互联网技术进行金融运作的电子商务企业、P2P模式的网络借贷平台,众筹模式的网络投资平台或掌上理财服务,以及第三方支付平台等。
在金融行业新兴业态下,为促进互联网金融的健康发展,为全面提升互联网金融服务能力和普惠水平,为有效防范互联网金融风险及其外溢效应而提供技术支撑。
在金融领域,新生业态层出不穷,金融机构日益多样化,金融资产的流动性快速上升,金融体系的关联度、复杂度大幅提高。
金融业的快速发展和创新,使货币政策操作环境、传导渠道发生重大变化。
在数据的处理分析上,对原有的宏观审慎分析框架及其有效性、准确性提出了挑战。
2.技术目标✧获得最优系统价值,满足大数据的处理性能,节约系统建设成本。
✧充分利用开源产品,做到对技术细节的掌控和验证,以保障大数据技术达到灵活可用。
i专题报谬发展中的空间数据系统参考体系架构为了更好更全面地理解空间数据系统咨询委员会(CCSDS)标准的可用特性,以及如何将这辣性有效地配置和部署,以创建可互操作的空间数据系统,CCSDS系统工程领域的系统体系架构工作组(SAWG)于2008年推出了空何数据系统参考架构(RASDS)标准推荐建议书。
在后续的工作中,不断地补充和完善参考体系架构,并结合实际应用的需要开展配套的标准制定工作。
CCSDS目前规划的体系架构分为两个部分:一是针对传输数据的通信服务的空间通信交亘支持(SCCS)架构,描述了在空间链路业务(SLS)、空间网络业务(SIS).交互支持业务(CSS)、系统工程业务(SEA)等四个领域内开发的物噸到传输层标准、逐駆应用层娅和传输月摒之间的关系;二是针对使用这些数据执^5^的应用与支持层(ASL)報,主要包括涵盖地面戲控制、计划和调度系统、航天器之间接口的任务操作标准、功能和服务,阪涵諭天器在轨功能、子网与通信、电子设备与族歸之间接口的航天器在轨的淞、功能和服务。
,fs PECIAL SUBJECT 专•議.适3董百菇云鹹崩強蓝石❹ -空间通信交互支持架构1建立机构间的交互支持,需要了解各机沟空间和 地面通信网络提供的遥测、跟踪和遥控等服务的能力, 协商、管理和提供网络服务,并确定质量、计费、监视等辅助服务。
自主航天器和载人航天器数量及能力 的不断增加推动了由地面和天基部件组成的服务网络 的烦。
2008年,CCSDS 成立了 SCCS 架构工作组,通过 制定sees 架构、服务目录、服务协议等来描述和规 范这些越来越复杂、自动化的机构间互操作与交互支 持。
工作组于2013年和2015年分别发布了 SCCS 架 构说明文件(SCCS-ADD )、SCCS 需求文件(SCCS- ARD )。
这两个文葩出了 SCCS 所眸的服讎口、 交互支持系统单元的节点配置、适当的构建块的说明, 供用户使用。
大数据标准化参考架构I目录1研究背景 (1)2研究目标及意义 (2)3大数据发展现状和趋势分析 (3)4大数据参考架构 (4)4.1参考架构 (4)4.2参考架构中涉及的相关内容 (6)4.2.1系统协调者 (6)4.2.2数据提供者 (6)4.2.3大数据应用提供者 (7)4.2.4大数据框架提供者 (9)4.2.5数据消费者 (11)4.2.6安全和隐私 (11)4.2.6.1针对安全和隐私的考虑 (11)4.2.6.2主要角色安全与隐私的基本要求 (12)4.2.7管理角色 (14)II1研究背景全球已步入大数据时代,互联网上的数据量每两年会翻一番。
截止到 2013 年,全球数据量为 4.3 泽字节,2020 年有望达到 40 泽字节。
如果将数据视为一种生产资料,大数据将是下一个创新、竞争、生产力提高的前沿,是信息时代新的财富,价值堪比石油。
大数据所能带来的巨大商业价值,被认为将引领一场足以与20 世纪计算机革命匹敌的巨大变革。
当前,世界各国政府和国际组织都认识到了大数据的重要作用,将开发利用大数据作为夺取新一轮竞争制高点的重要抓手,世界工业发达国家纷纷制定相关政策,积极推动大数据相关技术的研发与落实。
我国正处于数字经济发展的转型时期,信息的公开、共享与服务成为时代发展的主题。
信息逐渐成为与物质和能源同等重要的资源,以开发和利用信息资源为目的的经济活动迅速扩大,逐渐占据或超越工业活动在国民经济活动中的地位。
大数据的出现是跨学科技术与应用发展的结果。
对于大数据,自然科学家强调在网络虚拟环境下对于密集型数据的研究方法,社会科学家则看重密集型数据后面隐藏的价值与推动社会发展的模式。
目前大数据在支撑履行政府职能、保障公共安全、实施社会治理、支持重大决策和改进公共服务等方面发挥出越来越重要的作用。
党中央、国务院高度重视大数据发展,将大数据上升为我国国家战略之一。
党的十九大明确提出“推动互联网、大数据、人工智能和实体经济深度融合”。
1数据架构设计(数据架构组)1.1 概述1.1.1总体描述相对于业务架构和应用架构,数据架构在总体架构中处于基础和核心地位。
因为信息系统支撑下的海关业务运作状况,是通过信息系统中的数据反映出来的,数据信息系统管理的重要资源。
因此构建海关的IT总体架构时,首先要考虑数据架构对当前业务的支持。
理想的IT总体架构规划逻辑上是数据驱动的,即:首先根据业务架构分析定义数据架构;然后根据数据架构结合业务功能定义应用架构;最后根据应用架构与数据架构的定义,来设计技术架构。
1.1.2数据架构蓝图1.1.2.1 逻辑蓝图图:数据架构总体逻辑蓝图数据架构的六个统一,即统一数据规划、统一存储、统一计算、统一服务、统一接入、统一数据治理。
1.1.2.2 物理蓝图图4-1-1●通过万兆连接核心交换区,实现网络高速交换,确保可靠性●各服务器均双线连接数据区核心交换机,消除单点故障●结构清晰,层次分明1.1.3设计原则1、整体性原则共享服务平台必须根据统一的总体方案的统筹规划,按总署、直属海关、隶属海关的功能划分实行多级部署,同时按照职责分工进行建设和管理,保证三个层级的部署构成一个整体,各部分通信畅顺,信息共享,形成一个全国性的共享服务平台。
2、标准化原则总署统一制定信息资源共享服务的技术标准、通信协议标准、数据交换报文标准,提供数据访问功能、基本业务逻辑处理功能的标准组件。
系统的开发、集成按照规定的标准进行,保证海关共享服务平台的结构一致性和技术规范性。
3、安全与效率并重原则总结和汲取超大业务量海关的成功经验,采取充分足够的技术手段和管理制度,在保证共享服务平台与海关业务应用系统之间高速的数据交换,在保证共享服务平台良好运行效率的同时,保证海关业务运行网和业务管理网的信息安全和运行安全。
系统设计方面要充分考虑共享服务平台数据量大、负荷高等因素,严格控制程序流程设计、严把程序编制质量、同步制定配套的系统运行管理办法,确保共享服务平台运行的高效性和稳定性。
4、系统功能与职责分工相适应原则平台多方共建,发挥各方面的积极性,信息系统、业务系统与业务管理或操作运行的主体之间的关系和分工必须明确。
5、一致性原则共享服务平台在体系架构上必须与金关业务解决方案的框架保持一致,在系统开发建设的设备选型、开发技术、认证授权、门户框架、数据定义、参数管理、通信协议、网络结构、安全运维等方面必须与金关总体技术方案保持一致,保证共享服务平台成为现代海关综合管理系统的有机组成部分。
注:整体统筹原则数据层和应用层解耦数据的高可靠服务的高可用1.1.4设计目标“信息资源体系建设”是一项长期工程,是支撑海关各个业务条线之间实现充分协作信息共享基础架构。
将确保金关工程二期在海关信息资源开发利用方面抓住数据一致性、规范性等数据质量源头建设,形成统一顶层设计,做到海关信息资源一盘棋,数据统一管控,统一开发利用,促进海关信息共享、业务协作效率和科学决策水平的更高提升。
总体目标主要包括以下五个方面内容:1、实现信息资源整合信息资源规划的一项很重要的目标就是要解决目前信息系统建设中的重复建设问题,达到信息系统的整合和集约,信息资源规划是信息系统顶层设计的一部分,能够从整体上对信息资源进行设计,并能够提供信息系统建设的标准和规范,这样信息系统就能够以此为标准,进行适时、适度、逐步整合,最终达到消除冗余,集约良性发展的效果。
2、提高技术响应速度业务需求的变化和技术的响应速度之间一直是一对矛盾,信息资源规划通过对信息系统,尤其是信息资源架构进行科学设计,可以增强信息资源架构的稳定性,当业务需求变化时,可以通过很少的数据结构和程序变动就能够满足业务需求,这样不但提高了技术响应速度,而且能够增强系统的稳定性,降低故障率。
3、实现信息共享信息资源规划通过建设信息共享服务平台,实现了数据的集中存储和计算,并实现了对外统一的服务接口,不论是对于海关内部的信息共享需求,还是外部的数据共享需求;不论是直接面向用户的共享查询,还是面向应用系统的数据服务,都可以通过数据服务共享平台解决。
4、实现大数据分析海关要实现智能海关,必须实现海关信息系统的物联化、互联化、智能化,而最重要的就是智能化,即通过大数据分析,为海关准确决策提供信息支持。
信息资源规划通过设计和实现数据共享服务平台,引入并行数据库、分布式数据库等大数据存储和计算技术,能够解决海关的大数据分析问题,达到数据用得好、决策准的业务目标。
5、提升数据质量信息资源规划通过设定标准规范、业务管理流程,能够规范数据的定义、存储、使用、传输、交换,使得数据采集更加规范、数据传输更加准确高效,数据使用更加安全方便,通过各种管理流程和规范,能够大幅提升数据质量。
1.2 数据定义1.2.1总体描述数据的基本结构分三个层次,反映了观察数据的三种不同角度。
(1)概念数据层。
它是数据的整体逻辑表示。
指出了每个数据的逻辑定义及数据间的逻辑联系,是存贮记录的集合。
它所涉及的是数据所有对象的逻辑关系,而不是它们的物理情况。
(2)物理数据层。
它是物理存贮设备上实际存储的数据的集合。
这些数据是原始数据,是用户加工的对象,由内部模式描述的指令操作处理的位串、字符和字组成。
(3)逻辑数据层。
它是用户所看到和使用的数据,表示了一个或一些特定用户使用的数据集合,即逻辑记录的集合。
数据建模1.2.2业务域根据目前海关不同的网络,运行网、管理网和接入网以及总署和直属的这种物理关系,梳理出每个域中业务情况和相互的关联关系划分出不同的业务域。
海关目前的现状梳理出来的业务域有:公共域、首长决策域、公共办公域、业务管理域、综合保障域和内部监控公共域:1)公共时间域2)公共金融域3)公共位置域4)公共人员域5)公共机构域6)公共参数域首长决策:1)署长办公公共办公:1)办公2)国际事务业务管理:1)政法2)关税3)监管4)物流5)加贸6)稽查7)缉私8)统计综合保障:1)科技2)财务3)关务保障4)人事内部监控1)督查审计2)监察根据业务划分核心数据和非核心数据。
1.2.3概念模型设计概念数据模型是最终用户对数据存储的看法,反映了最终用户综合性的信息需求,它以数据类的方式描述企业级的数据需求,数据类代表了在业务环境中自然聚集成的几个主要类别数据。
概念数据模型的内容包括重要的实体及实体之间的关系。
在概念数据模型中不包括实体的属性,也不用定义实体的主键。
这是概念数据模型和逻辑数据模型的主要区别。
概念数据模型的目标是统一业务概念,作为业务人员和技术人员之间沟通的桥梁,确定不同实体之间的最高层次的关系。
根据业务域的划分,梳理跨业务域的端到端的业务流程,从而梳理出大的对象之间的关系和小的业务流程。
例如,用户(user)E-R图1.2.4逻辑模型设计逻辑数据模型反映的是系统分析设计人员对数据存储的观点,是对概念数据模型进一步的分解和细化。
逻辑数据模型是根据业务规则确定的,关于业务对象、业务对象的数据项及业务对象之间关系的基本蓝图。
逻辑数据模型的内容包括所有的实体和关系,确定每个实体的属性,定义每个实体的主键,指定实体的外键,需要进行范式化处理。
逻辑数据模型的目标是尽可能详细的描述数据,但并不考虑数据在物理上如何来实现。
逻辑数据建模不仅会影响数据库设计的方向,还间接影响最终数据库的性能和管理。
如果在实现逻辑数据模型时投入得足够多,那么在物理数据模型设计时就可以有许多可供选择的方法。
解决端到端的业务流程梳理出大量的小流程和对象关系,进一步梳理出各个业务域的业务对象及其行为和属性。
1.2.5物理模型设计物理数据模型是在逻辑数据模型的基础上,考虑各种具体的技术实现因素,进行数据库体系结构设计,真正实现数据在数据库中的存放。
物理数据模型的内容包括确定所有的表和列,定义外键用于确定表之间的关系,基于用户的需求可能进行发范式化等内容。
在物理实现上的考虑,可能会导致物理数据模型和逻辑数据模型有较大的不同。
物理数据模型的目标是指定如何用数据库模式来实现逻辑数据模型,以及真正的保存数据。
常用的设计范式,以及对于数据量大的业务,在数据模型层面不处理表之间的主外键之间的关系。
主要将逻辑模型的各个业务对象及之间的关系,以表、主外键及关联表的方式表示。
针对各个逻辑模型勾勒出各个域的ER模型。
1.3 数据分布1.3.1总体描述将数据物理分布式处理方式逐步转为集中式处理方式,本节主要描述数据在各个业务子系统之间的逻辑分布,以及数据物理分布。
1.3.2逻辑分布1.3.3物理分布数据存放:集中存放+灾备?分布式主从模式?分布式无中心化?数据:核心交易:商用关系DB+小机集群?分析:newSQL+小机集群?低价值密度的大规模数据:No SQL+大规模普通机器集群据地理分布:交易数据集中存放+灾备;其他管理支持类应用数据可三中心分别存放?1.4 数据分类1.4.1总体描述数据分类是企业数据的组成部分,其目的是为了满足各种数据需求对数据组织的要求,根据数据内容的属性或特征,将信息按一定的原则和方法进行区分和归类,并建立起一定的分类体系,为数据的合理分布提供决策依据,以便管理和使用数据信息。
1.4.2分类原则在数据分类时遵循以下原则:•数据分类需要满足各种数据需求对数据组织的要求,即数据分类应该独立于具体的数据模型;•数据分类应有利于数据的维护和扩充。
1.4.3分类内容金关工程二期综合考虑海关应用系统所产生的数据属性、应用性质、处理方式、使用范围等因素对数据进行分类,同时考虑对数据进行生命周期管理和数据质量管理;海关数据可以从业务、生命周期及数据特点进行分类。
1、按照业务,海关的数据分为数据管理类(N)、业务基础类(Y)、业务处理类(Y)、业务管理类(N)、业务应用类(N)、业务分析类(N)六类数据。
业务数据分类核心和非核心数据与上面业务域数据之间的对应关系•数据管理类数据,此类数据包含动态数据仓库、数据抽取分发、数据质量监控、统一数据加工、数据生命周期管理中的数据。
•业务基础类数据,此类数据包含商品条码、企业信息基础、多维、公安信息资源、案件信息服务资源、自动许可证联网核查、联网核销、原产地证书联网共享、加工贸易多方联网、GIS应用、核心系统参数、海关情报信息采集、海关情报移动支持的数据。
•业务处理类数据,此类数据包含报关单、免税品、行邮、关税电子、外单位信息资源、加贸手册、加贸账册、互联网信息资源、智能卡口、核心系统基本通关、核心系统辅助通关、核心系统备案的数据。
•业务管理类数据,此类数据包含减免税管理、原产地管理、价格管理、业务数据管理、机动巡查、值班、预案、移动应用、海关特殊监控区域、保税监管场所、保税综合管理、批量复审、海关情报业务管理、海关情报境外执法合作、执法规范化业务执法、执法规范化辅助办案、执法规范化职能管理的数据。