Teradata数据仓库产品介绍v1.0

格式：ppt
大小：4.45 MB
文档页数：45

下载文档原格式

Teradata系统架构及特性

Teradata系统架构及特性Teradata基础知识和使用过程中应该注意的问题Teradata系统架构及特性DW项目组赵世辉2010年5月Teradata基础知识和使用过程中应该注意的问题Teradata系列培训基础培训1. 2. 3. Teradata软硬件体系架构原理Teradata数据库对象介绍Teradata工具集介绍中级培训1. Teradata数据库设计规范2. Teradata SQL规范3.数据仓库Teradata平台管理规范高级培训1. 2. 3. 4. 5.| 2Teradata工具使用方法和技巧Teradata程序设计与开发数据库高级管理数据库调优。

内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题目录Teradata软硬件体系结构Teradata数据库原理及特点Teradata 数据保护机制Teradata系统访问配置及连接方式Teradata使用中的一些问题及案例分析| 3内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题Teradata系统的硬件构成BynetBynet线光纤PLine/Sline以太网存储阵列MPP节点AWS| 4备份服务器内部资料请勿外传磁带库Teradata基础知识和使用过程中应该注意的问题Teradata主机结构MPP系统工作站集群模式批量处理优化底层并行线性扩展均衡负载高可用性热备组件RAID技术Clique技术| 5内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题AWS及备份设备收集显示主机、存储、Bynet所有模块运行信息设备管理的统一界面AWS通过TVI进行远程维护和故障通知基于LAN-BASE备份技术由备份服务器处理备份任务，减轻数据库压力备份服务器使用Netvault工具，可在AWS上的客户端操作备份恢复由机械手+磁带驱动器+磁带槽位+磁带组成根据磁带的条码自动实现磁带的拆卸和装填磁带库可远程控制，可多驱动器并行工作和交叉工作| 6内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题扩展知识：Teradata主机产品线55015502550企业入门级数据仓库或部门级的数据集市46节点140 TB5__企业级的数据仓库系统，应用于战略性和操作性的企业智能化的EDW/ADW 1024节点10 PB用途数据集市或开发测试机在极端大量数据环境中的分析扩展性(支持数据量)单节点6 TB1024节点50 PB| 7内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题建行数据仓库生产设备的演变硬件- 18(+1)个TD 5500H节点- *****双核- 144GB内存- 100TB数据库空间软件- OS: Suse Linux 9 - DB: TD V2R6.2硬件- 6个TD 5450H节点- ***** - 24GB内存- 16TB数据库空间硬件- 8个NCR 5251节点- 32C@733MHZ - 32GB内存- 4TB数据库空间软件- OS: MP-RAS 4 - DB: TD V2R5 软件- OS: MP-RAS 4 - DB: TD V2R52008年设备更新2007年设备更新2006年DW上线| 8内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题目录Teradata软硬件体系结构Teradata数据库原理及特点Teradata 数据保护机制Teradata系统访问配置及连接方式Teradata使用中的一些问题及案例分析| 9内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题Teradata数据库底层结构VPROC虚处理软件并行控制软件系统软件Applications/ Utilities (TPA)主机直连Channel Drivers Gateway Software局域网硬件| 10内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题Teradata数据库工作原理SQL请求结果返回基本读写过程解析器解析引擎PE将SQL请求拆分成各AMP的请求以便并行处理PE优化器解析器分解接收到的SQL交易请求，验证语法、权限等分发器优化器产生最优的查询方案信息传递层(MPL)分发所优化的方案到AMP数据通过表PI的HASH值均匀分布到各AMP管理的磁盘(写)AMPAMPAMPAMP信息传递层可汇总各AMP数据，将最终结果返回客户端(读)数据数据数据数据| 11内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题PE( Parsing Engine )一种VPROC,用于解释SQL请求、接收输入记录、审查数据、发送信息到AMP每个节点2个PE,每个PE能并发操作120条会话，每个会话能处理多个请求当多个用户同时访问系统时，Teradata能够通过PE在各节点间自动平衡负载，不需要人工干预可以由工具(TDQM、TDWM)控制查询的执行过程| 12内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题AMP( Access Module Processor )一种VPROC,拥有内存和CPU资源，与一个VDISK连接，管理数据库/表的部分数据每节点根据需求可划分多个AMP控制所有磁盘交互及部分数据库的操作，如读、写、转换、格式化等一个请求可以分发到所有AMP一起共同工作，每个AMP也可以同步工作于多个请求各个AMP并行处理，互不干扰，交易处理结果在信息传递层汇总后，直接返回给应用程序内部资料请勿外传| 13Teradata基础知识和使用过程中应该注意的问题Teradata数据库特点专为海量数据仓库等OLAP应用设计多节点的单一数据库系统跨多代设备线性扩展自动数据分配机制可实现多维并行内嵌分析决策功能采用SPOOL技术易于管理| 14内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题专为数据仓库等OLAP系统设计OLAP数据库VS OLTP数据库OLAP 数据库(Teradata) OLTP数据库(Oracle)数据来源典型业务数据量响应速度用户数量本身不产生数据，来源于生产系统数据在系统中产生中的操作数据基于查询的分析系统基于交易的处理系统复杂查询，经常使用多表连结、全每次交易涉及的数据量小表扫描等，涉及的数据量庞大响应时间与具体查询有很大关系对响应时间要求非常高操作特性用户数量相对较小，其用户主要是用户数量非常庞大，主要是操业务人员与管理人员作人员由于业务问题的不固定，数据库的数据库的各种操作主要基于索各种操作不能完全基于索引进行引进行内部资料请勿外传| 15Teradata基础知识和使用过程中应该注意的问题多节点的单一数据库系统可运行于单个或多个节点多个节点组成一个整体的数据库系统，每个结点有单独的IP地址，都连入系统网络各结点之间自动进行负载平衡并提供结点互为备份的高可靠性客户端可以从不同渠道以不同方式连接，连接时可自动实现负载均衡客户端访问的不是某个具体结点，而是整个数据库数据库资源无法从物理上实现完全的分割| 16内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题不同代设备的线性扩展设备型号5500H 30÷ AMP数量22 5555H 50÷30 42 5600H 80÷单节点TPerf性能每AMP性能1.41.61.9TPerf值是衡量Teradata设备性能的指标，以第一代型号设备5100性能为基准1,后续型号Tperf是与5100的性能比值AMP数量可以根据要求进行增减，但受到磁盘数、背板带宽、接口数量、CPU、内存等限制多代混存会产生资源浪费，一般最多4-5代共存| 17内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题自动数据分配机制通过对PI的哈希运算将数据记录均匀分布到各AMP; 记录RowID由行哈希值和一个32位的UV组成；AMP根据数据记录的RowID确定物理存储位置；最新TD R13提供了Non-PI表解决了传统数据库的“数据重组”问题| 18内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题Teradata的多维并行技术查询并行多个VPROC并行最终结果最终结果查询并行各AMP处理自己的数据步内并行每个VPROC中多进程求和求和多步并行SQL语句的并行任务分解JOIN JOINJOIN JOINjoin表C表C表D步内并行1. Select C 2. Select D 3. C join D表A表A多步并行| 19表B表B内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题内嵌的数据分析功能提供多种OLAP函数累计和CSUM、移动平均MAVG、移动和MSUM、移动差分MDIFF、采样SAMPLE、限定*****等所有函数在Teradata内部以并行方式来工作可以自定义函数UDF可嵌入外部厂商的产品功能SAS、MicroStrategy等BI功能SilkRoute、SAP等企业管理功能| 20内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题SPOOL技术SPOOL是未使用的且连续的数据库空间(类似虚拟内存),与Perm、Temp空间一起以AMP为单位分配，且使用不同Cylinder适合大数据量、并行处理的特点(与传统数据库在内存中处理相比)在工作量适中、无Fallback的系统中，SPOOL最少占总数据库空间的25%―30%好的调优策略可减少对SPOOL空间的占用每个用户的SPOOL的在建立时设置SPOOL的类型Volatile。

Teradata携手中国邮政动态数据仓库打造优质速递服务

ＩＭ公司Ｂ，ＢＭ公司日前Ｉ推出了新的储存平台和增强储存产品，ＩＭ称这是 “ 司储存Ｂ公产品一次最大的全面扩展 ” 。ＩＭ发布的ＩＭ系统储存ＢＢ
标是降低储存系统的总体成
本。
等级保护、信息安全风险评估
等领域。
此外，届亚洲ＣＢＴ的通本ｅＩ
即可查询积分，务必保留该信要
息、
信展区将汇聚固定电话、动通移信、网络、车载与导航等领域的
电话支付这一新型电子支付方
式，帮助银行拓展电话银行业
月９日上市销售，品起价分别产
为２．４万美元和１．６万美１３０２
兀。
决方案，聚焦行业的前进方向
和技术趋势。针对越来越受重
都基于ＩＭ的Ｐｗｒ５＋处理Ｂｏｅ器。原来的ＤＳ００平台相比，与８０新产品处理负荷环境的性能改善了１％。５
注ＩＴ市场的最新动态，示厂Ｃ展商的发展方向及技术突破。最在炙手可热的数字家庭领域，届本展会将特别开辟数字家庭体验展区，致力于为不同阶层、不同需求的家庭提供相应的解决方

Teradata大数据一体化平台介绍

产品说明
动态数据仓库产品，支持SSD 动态数据仓库产品，不支持SSD 数据仓库一体机数据集市一体机，SMP节点海量数据分析一体机 Hadoop一体机 Aster一体机 Aster数据库软件（仅限部分客户） Hadoop软件 Teradata提供企业云部署环境双/多系统管理解决方案虚拟存储/多级存储解决方案 Teradata平台互联互通解决方案基本功能已集成在Teradata一体机中，数据实验室等额外功能需付费整合营销解决方案 Teradata-SAS高性能分析一体机 Teradata-SAP分析解决方案 TD提供免费的ABU备份软件，由客户提供网络备份环境 TD提供备份插件，由客户提供带机、带库等备份架构 TD提供完整备份解决方案，包括NBU备份软件，以及Quantum，Da ta Domain等备份设备包含元数据、数据质量、数据标准等 ETL调度工具门户产品管理驾驶舱前端工具，数据挖掘分析工具
teradatagca可销售产品一览表产品类型产品定位最新产品型号产品说明teradata6750h6750hx动态数据仓库产品支持ssdteradata6700c动态数据仓库产品丌支持ssdteradata2800数据仓库一体机teradata670h670c数据集市一体机smp节点teradata1700海量数据分析一体机haddopappliancehadoop一体机探索平台asterapplianceaster一体机astersoftwareonlyaster数据库软件仅限部分客户hadoopsoftwareonlyhadoop软件teradatadatalabteradata提供企业云部署环境unity双多系统管理解决方案tvs虚拟存储多级存储解决方案querygridteradata平台互联互通解决方案viewpoint基本功能已集成在teradata一体机中数据实验室等额外功能需付费applicationcim整合营销解决方案teradataappliancesasteradatasas高性能分析一体机teradataanalyticssapteradatasap分析解决方案abuappliancebackuputilitytd提供免费的abu备份软件由客户提供网络备份环境tdeteradataextensiontd提供备份插件由客户提供带机带库等备份架构advocatedbartd提供完整备份解决方案包括nbu备份软件以及quantumdatadomain等备份设备数据管控teradata数据管控平台包含元数据数据质量数据标准等etlautomationetl调度工具teradataportal门户产品tetadatadashboard管理驾驶舱合作伙伴产品qlikviewspotfiretableaumicrostrategycelebrus前端工具数据挖掘分析工具其它工具其它产品数据库系统管理软件产品硬件产品数据平台数据仓库数据备份合作产品datamartapplianceintegratedbigdataplatformdatawarehouseapplianceactiveenterprisedatawarehouseappliancehadoopasterbiganalyticsappliancesashighperformanceanalytics规模up8tbup234pbup54p

Teradata案例分析

话费流失预防系统 5.报表管理子系统(FraudSentry*Reporter) 提供一些预定义的统计和管理报表，提供欺诈记录及客户信息。这些表报是用OLAP动态报表工具实现的。如主叫号码通话报警统计、最可疑的前100个通话、按通话类型分析报警情况、可疑事件详细报表、可疑事件分析与处理、欺诈事件统计表、反欺诈小组处理事件统计等等。
话费流失预防系统介绍
话费流失预防系统(FraudSENTRY)是通过对大量的客户档案和通话历史数据的分析从而获取客户的通话行为信息，采用传统的基于规则的侦测方法和现代先进的神经网络智能技术为综合分析手段，建立一个通话行为智能库，可以侦测漫游、客户欺诈、代理商欺诈、利用盗窃手机通话等几类欺诈行为，当通话记录或交易出现在正常模式以外时，系统能马上识别，实时地现场侦测、追踪潜在的恶意盗打电话者，和预测可能会恶意盗打电话的客户，防盗打小组在电信公司的经营政策为指导的原则下，对违反规定的客户采取必要的措施，以追回损失、降低电信公司经营风险和防止资产流失的决策支持系统。
7.预测模型子系统(FraudSentry*Predictor)
8.客户分析子系统(CustomerBI)
话费流失预防系统
1.维护界面子系统(FraudSentry*Profiler)
结构
是客户端的交互窗口。Profiler主要用于设置和修改报警和界限。报警设置将侦测识别所有通话记录中的各类欺诈行为，知道侦测什么和如何侦测。正常情况下，报警参数仅在第一次安装时设置一次。
案例：远传电信(FarEasTone)
降低经营成本相互矛相盾互矛盾
提高客户满意度案例分析解决？如何解决？
案例：远传电信(FarEasTone) 降低经营成本

Teradata数据库介绍

SMP 体系架构
Multi-Node MPP
NCR Rack-Based Cabinets
NCR MPP系统的一些特性
Teradata数据库软件:它允许多个SMP运行在Teradata数据库上，并扮演单个实例角色．
可升级的BYNET连接:当增加节点时，相应的增加了带宽．并行可升级性：通过安装/升级多个SMPs 实现软件的并行安装和升级． AWS（Administration Workstation） :单点操作控制及升级服务管理． SMP：SMP只需要负责管理各自资源还有一些冗余的组件：两个BYNET,在一个磁盘组中有两个磁盘控制器,又模
Network-Attached client software Overview
CLI提供对Teradata最大限度的连接和访问性，ODBC作为业内标准是更多的应用程序可以连接到Teradata
Micro Teradata Director Program (MTDP) 是Teradata 提供的网络连接环境下的TDP实现，它和渠道连接下的TDP功能基本一致，唯一的区别是它不负责session在多个PEs之间的分配，此功能由运行在Teradata系统上的Connect and Assign Servers 实现
据集成的企业范围的数据库，保证数据的一致性高可用性并行装载及卸数处理
强大的并行装载，load与unload工具可升级性，这些工具如：Fastload、 Multiload、TPump、and FastExport
主题
What is Teradata? Teradata数据库竞争优势 Teradata RDBMS 架构 Teradata 系统架构 Teradata 数据库与数据库用户的比较数据存储和访问

释放数据的能量——Teradata天睿公司大中华区首席执行官辛儿伦访谈

执行官辛儿伦数据的能量 ”主题？
大会的主题是 “ 释放数据的能
量 ” ，强调了两个要点，一是数据潜藏巨大的能量、数据当中拥有更大的洞察力，这表明数据已成为最
辛儿伦：此次大会是由
２０１３年Ｔｅｒａｄａｔａ全球用户大会Ｔｅｒａｄａｔａ全球客户委员会主办、
＆Ｅｘｐｏ）于当地时间ｌ０月２０～２４
日在美国德克萨斯州达拉斯市召开。大需求。数据的核心是发现价值，
大会以 “ 释放数据的能量 ” 为主题，驾驭数据的核心就是分析。在数据
来自全球领先数据驱动企业的行业分析这个领域，有各种形态的数据，
分析领域最前沿的发展方向，能否
具体介绍一下？
行官辛儿伦（ＡａｒｏｎＨｓｉｎ），清他解析
本届大会举行了近４００场专
辛儿伦：本次大会上，Ｔｅｒａｄａｔａ
７４ＦｌＮＡＮｃＡｌＬｃ。ＭＰｕＴＥＲＯＦｃＨＩＮＡ
要有整合数据的能力；挖掘、探索
大数据体系和信息化银行建设作为
是客户营销和客户服务。在具备了
大数据体系建设等话题。
ห้องสมุดไป่ตู้
们探索、挖掘数据价值的实践。需要强调的是， “ 大数据 ”作为

teradata automation使用手册

teradata automation使用手册# Teradata Automation 使用手册## 1. 引言Teradata Automation 是一个用于管理和优化 Teradata 数据库的工具，它可以帮助用户自动化日常任务，提高工作效率。

本使用手册将详细介绍 Teradata Automation 的功能和使用方法。

## 2. 安装与配置在开始使用 Teradata Automation 之前，首先需要进行安装和配置。

请参考官方文档或联系技术支持以获取详细的安装和配置指南。

## 3. 功能介绍### 3.1 自动化任务调度Teradata Automation 允许用户创建、编辑和删除自动化任务，并设置执行时间。

通过这种方式，可以确保关键任务在规定的时间内自动运行。

### 3.2 数据库监控Teradata Automation 提供实时数据库监控功能，用户可以查看数据库性能指标，如 CPU 利用率、内存使用情况等。

### 3.3 数据备份与恢复Teradata Automation 支持数据备份和恢复操作，用户可以根据需求设置备份计划，并在需要时恢复数据。

### 3.4 错误处理与报警当系统出现错误时，Teradata Automation 可以立即发送警报，并提供错误处理建议。

## 4. 使用教程### 4.1 创建自动化任务打开 Teradata Automation，点击“新建任务”，输入任务名称和描述，选择执行时间，然后保存。

### 4.2 监控数据库性能在主界面中，选择“监控”选项卡，可以看到当前数据库的各项性能指标。

### 4.3 设置数据备份计划在主界面中，选择“备份”选项卡，点击“新建备份计划”，输入计划名称和描述，选择备份频率和保留期限，然后保存。

### 4.4 处理错误与警报当系统出现错误时，Teradata Automation 将在主界面上显示警报信息。

点击警报，可以查看详细信息和处理建议。

teradata like语句

一、Teradata数据库简介Teradata是一种用于大规模数据仓库和分析的关系型数据库管理系统。

它是世界上最大的并行处理数据库之一，被许多大型企业和组织用于数据存储和分析。

Teradata数据库以其高性能、可扩展性和并行处理能力而闻名，是大数据分析和数据驱动型决策的理想选择。

二、Teradata Like语句概述在Teradata数据库中，Like语句是用于在查询数据时进行模糊匹配的关键字。

它使得用户可以在匹配模式中使用通配符来查找满足特定条件的数据。

Like语句通常与SELECT语句一起使用，用于从表中检索符合特定模式的数据行。

三、Like语句的语法在Teradata数据库中，Like语句的基本语法如下所示：SELECT column1, column2, ...FROM table_nameWHERE column_name LIKE pattern;在这个语法中，column1, column2等表示需要检索的列，table_name表示需要检索的表，column_name表示需要进行匹配的列，而pattern则表示匹配模式。

在pattern中，通配符表示零个或多个字符，而_表示一个字符。

四、Like语句的应用实例1. 简单模糊匹配假设我们有一个名为employees的表，其中包含雇员的尊称信息。

我们可以使用Like语句来查找以字母“A”开头的员工尊称：SELECT *FROM employeesWHERE employee_name LIKE 'A';2. 复杂模糊匹配如果我们想要查找以字母“J”开头，且长度为5个字符的员工尊称，可以使用如下查询：SELECT *FROM employeesWHERE employee_name LIKE 'J____';3. 结合通配符我们还可以使用多个通配符结合来进行模糊匹配。

我们可以使用作为通配符，来查找包含字母“S”和“th”之间有0个或多个字符的员工尊称：SELECT *FROM employeesWHERE employee_name LIKE 'Sth';五、Like语句的性能和注意事项虽然Like语句在数据查询中非常灵活，但是它也可能导致性能问题，特别是在对大型表进行模糊匹配时。

Teradata基础教程(中文)

Teradata SQL基础教程第一章关系数据库基础1.1关系数据库模型关系数据库理论最早是由Codd博士提出的，一个关系的数学描述其实就是一个二维表，这些二维表按照业务运行的规律组合起来，就是关系数据库模型。

这种模型可以简洁地表达出企业或机构的业务运作规律，抓住事物本质，因此非常实用。

每个二维表被称为一个实体(Entity)，它可以是人、地点或者某种事物等。

表中的每个列被称为属性(Attribute)或者字段(Field)，表中的每一行代表了该实体的一个特定实例，称为记录(Record)。

表1-1、1-2和1-3分别给出了一个雇员表、部门表和工作表的实例。

表1-1 雇员表(Employee Table)EMPLOYEE NUMBER MANAGEREMPLOYEENUMBERDEPARTMENT NUMBERJOBCODELASTNAMEFIRSTNAMEHIREDATEBIRTHDATESALARYAMOUNTPK FK FK FK1018 1017 501 512101RatzlaffLarry1978-07-151954-05-3154000.00 1022 1003 401 412102MachadoAlbert1979-03-011957-07-1432300.00 1014 1011 402 422101CraneRobert1978-01-151960-07-0424500.00 1003 801 401 411100TraderJames1976-07-311947-06-1937850.00 1007 1005 403 432101VillegasArnando1977-01-021937-01-3149700.00 1010 1003 401 412101RogersFrank1977-03-011935-04-2346000.00 表1-2 部门表(Department Table). 1 .department_number department_name budget_amount manager_employee_number PK FK308000.001011support402 software982300.001003support401 customer1025293800.00201 technicaloperations801100 president 400000.001017308000.00501 marketingsales1005403 education 932000.00表1-3 工作表(Job Table)job_code description hourly_billing_rate hourly_cost_rate PK421100 Manager - Software Support 0.00 0.00Rep 0.00 0.00512101 Sales511100 Manager - Marketing Sales 0.00 0.00Engineer 0.00 0.00312101 Software411100 Manager - Customer Support 0.00 0.00431100 Manager - Education 0.00 0.00413201 Dispatcher 0.00 0.00432101 Instructor 0.00 0.00Analyst 0.00 0.00422101 Software321100 Manager - Product Planning 0.00 0.00在一个关系数据库模型中，表和表之间是有关联的，这种关联常用所谓的E-R 图(Entity-Relationship Diagram)来表示。

Teradata数据仓库介绍

– I/O, Buffers, Locking, Logging, Dictionary – Nothing centralized – Nothing in the way of linear scalability
Logs
AMPs
Locks
Buffers
I/O
23 > 4/2/2021
Shared Nothing Software
Disk Storage
Cache Memory
Disk Storage
CPU(s)
Cache
Large SMP/NUMA
• 专为事务处理应用设计 • 对小型系统或小数据量的系统性能会比较有优势 • 随CPU的增加，会由于对资源的争夺而使性能增加幅度大
幅降低
BYNET Fabrics
CPU(s) Cache Memory Disk Storage
22 > 4/2/2021
Shared Nothing Software
• Basis of Teradata scalability
> Divide the work evenly among many processing units > No single point of control for any operation
• 存储
> 独立的 I/O 通道 > 每节点单独管理
• 节点间连通性
> 充分可扩展 > 通道 – ESCON/FICON > 连接方式:以太网、光纤等
• 管理服务器
> 监控整个系统的控制台 > 通过AWS统一管理
SMP 节点1
CPU1 CPU2 Memory

沃趣数据库全栈产品解决方案介绍

存储节点:
①12台两路服务器 ②2 x Intel Xeon Silver 4108 CPU ③32GB Memory (4 x 8 GB) ④2 x 1.2TB 10K SAS硬盘 ⑤板载4 x 1GbE 以太网卡 ⑥2 x 56 Gb Single-Port IB FDR HCA卡 ⑦22 x 1.6TB NVMe SSD
存储节点介质输出
QLink实现设备远程IO访问的无损输出
NVMeoF协议，未来兼容以太 iSer协议
计算节点设备映射
8
平衡的硬件组合提升IO带宽，降低IO延迟
计算
网络
存储
Intel Xeon Scalable CPU 提供极致运算能力
56/100Gb Infiniband网络提供高速网络通道
新一代NVMe闪存介质提供高速IO能力
稳定性极好性能极强
软硬件、数据库深度监控扩展性好兼容性好
三层分离架构产品线完整
中
QData一体机架构拓扑图
开放式
①采用标准 x86 Server ②架构开放, 性价比高, 可维护性高
分布式
①计算 & 存储 ②消除单点故障 ③性能 & 容量水平扩展
高性能
①Infiniband，RDMA，NVMe，SSD , RDMA , Flash
QPlus备份方案
实时同步对主库性能几乎无影响差异备份、节约空间
日志记录
09:00 10:00 11:00
36
QPlus自动化管理：一键搭建备库
向导式搭建
1 标准化的操作过程
2 高度自动化
37
一键主备切换
应用层
一键主备切换
1 日常主备切换演练

Teradata数据库配置说明

1．Teradata Client安装说明1、安装程序地址：ftp://10.3.7.141/2、点击Setup.exe，开始运行安装程序3、出现如下安装启动画面：4、选择Custom安装方式（请不要选择Typical）5、选择安装组件请依次选择以下程序：6、点击Next直至完成2．Teradata数据库配置说明1）测试数据库说明2）配置ODBC1、打开odbc数据源管理器、选择系统dsn页点击【添加】按钮2、选择T eradata驱动程序，点击【Finish】按钮3、填DB Source、T eradata Info、Uername、Password等选项点击【ok】按钮完成。

说明：●Data Source：odbc的名称●Teradata Server Info Name(s)：Teradata数据库的IP地址●Username：用户名●Password：密码●Default Database：默认数据库3）配置HOST文件1、打开系统目录－system32－Drivers－etc（如XP系统：C:\Windows\system32\drivers\etc）下的hosts文件2、填写T eradata数据库的CLI接口地址：如127.0.0.1 localhost10.3.7.9 cpcimtcop1说明：第一部分为Teradata的ip地址，后面为任意名字和cop1、cop2的组合3．Teradata客户端配置1） Teradata Administrator配置选择菜单T ools/Options修改General选项，选中用SQL Assistant代替查询窗口选项。

完成OK后可以选择查询按钮进入T eradata SQL Assistant2） Teradata SQL Assistant配置选择菜单T ools/Options修改查询选项卡，选中只提交选中的查询语句选项。

teradata数据仓库简介

案例二：某电商公司的数据仓库应用
总结词
智能的数据分析
详细描述
某电商公司利用Teradata数据仓库进行智能的数据分析。通过数据仓库，电商公司能够全面了解用户行为、产品趋势和市场动态。基于数据分析结果，电商公司优化了产品推荐、库存管理和物流配送，提升了用户体验和业务效益。
案例三：某政府机构的数据仓库实践
数据仓库优化
为了平衡大规模数据处理和查询性能，出现了新型数据仓库技术，如列式存储、向量化计算等，以提高数据处理和查询效率。
03
CATALOGUE
Teradata数据仓库简介
Teradata公司简介
成立时间
Teradata成立于1979年，是全球领先的数据仓库和数据分析解决方案提供商。
总部位置
Teradata总部位于美国，在全球范围内拥有广泛的客户和合作伙伴。
产品与服务
Teradata提供数据仓库、大数据解决方案、云计算和人工智能等服务，帮助企业实现数据驱动的决策。
Teradata数据仓库的特点
高效性能
Teradata数据仓库采用高性能的硬件和软件架构，支持大规模数据的快速查询
和处理。
模块化架构
Teradata数据仓库采用模块化架构，将数据仓库划分为多个模块，包括数据集成模块、数据存储模块、数据查询模块等。这种设计可以提高系统的可扩展性和灵活性。
数据存储技术
列式存储
Teradata采用列式存储技术，将数据按照列进行存储，而不是传统的行式存储。列式存储可以提高数据压缩比和查询效率，尤其适用于大量数据的分析查询。
阐述本报告的目的和主要内容，为后续章节提供概述。
分析企业对于数据仓库的需求，以及 Teradata数据仓库如何满足这些需求。

Teradata分析

1、 Teradata 优势，能否打数据并发 1）优势以下是部分Teradata 客户数据仓库管理的内容，可说明Teradata 系统的强大处理能力： •多达千亿行数据的数据库表格 •每天数据加载超过30亿条记录 •每天捕获3000万笔客户交易 •每天为消费者在线提供150万种个性化产品和服务 •每小时处理100万次数据库查询 •每天响应1万个并发数据仓库用户 • 业务查询响应时间仅为40-50毫秒2）并发问题：机制：Teradata 巨表数据存放机制好像是每个节点均匀分布表中一部分数据，当查询的时候每个节点并行查询，结果汇总到某个节点反馈给查询者。

这个复杂查询的实例形象地说明了Teradata 的多维并行处理机制。

Multi-Step 并行并行作2. 搜索 Orders3. 联接 Lineitem & Orders 并行同时与各自相关据图8-16 Teradata 内部并行处理机制说明这里假设系统配置有4个虚拟处理器(VPROC)，某个复杂查询被优化器分解成了7个步骤，图中SUPPLIERS、PARTS、PARTSUPP等为数据库中表的名字。

在每个步骤执行时，4个VPROC 同时处理与各自相关的数据块，例如搜索SUPPLIERS表，该表的记录是通过HASH算法均匀分布在四个VPROC各自负责的磁盘中的，搜索时4个VPROC将同时进行，把相关的记录搜索出来，这就是所谓的查询并行。

例子：例如：使用NCR 5300服务器，2个节点，存储为2TB，RAID1，在业务高峰期，系统并发查询用户在300个以上，最高到1000个，此时系统响应速度有些缓慢大概业务查询响应时间30秒，峰值过后速度就加快了。

主要进行的操作就是表之间的关联查询，4张表，每张6-7千万条记录，ETL加载的数据量不算太大。

2、Teradata内外部集建立原则针对实际的应用，采用内外部集市可以有效的发挥起各自的优势：1）松耦合原则介于要将整个系统划分为数据和应用层，相互存在很多密切关联，在设计库表时要充分考虑数据和应用的相互影响，做到应用不影响到数据的处理，数据处理不直接针对应用的松耦合技术架构2）任务明确原则数据处理层和应用层在处理具体业务时，必然存在既可以在数据层处理有可以在应用层处理的问题，需要在设计时充分讨论业务需求，做到责任明确，任务单一，各负其责。

数据仓库(Teradata)

服务被销售给客户 / 参与人使用和管理服务
服务使用的财务信息 / 财务记录产品的成本和付款
OFFER （服务）
产品产生事件 / 事件包括产品类
定位网络/ 网络支持的位置
NETWORK （网络）
服务通过网络实现 / 网络支持服务
网络产生事件 / 事件包括网络类
广告针对特定产品 /
产品通过广告实现营销
cLDM – 核心主题
ETL服务器
AT&T
中央数据库
Fload Mload Fexport TPump Access Module
End Users
Teradata电信业cLDM的商业价值
使你能够轻松回答下列业务问题…
▪ 谁是我们最有价值的客户… ▪ 按在网时间、消费金额、收入、年龄、地域、业务规模... ▪ 按产品使用情况 (国内、国际、接线员服务、呼叫卡、全部)
▪ 在我们最好的客户中，谁最有可能流失？ ▪ 我们的基站有问题吗？我们可以将流失模式与用户的家庭关系或一个呼叫
Teradata数据仓库
Dr. Zhang Jian Senior Technical Consultant TD China, Apr., 2009
公司介绍
NCR公司介绍
▪ 创建于1884年，120年历史 ▪ 包括三大部门
– 数据仓库事业部 / Teradata – 金融服务 / ATM – 零售服务 / POS
•LDM逻辑数据模型 •详细交易数据 •面向主题 •3NF
•数据清洗／转换／加载 •文本文件
结算
•数据转换／压缩/传输 •文本文件 •标准数据接口
•面向业务流程其他 •3NF
Teradata电信业cLDM
ADVERTISEMENT （广告）

TERADATA数据库操作

TERADATA数据库操作1、创建⼀个数据库的命令举例：Create database testbase as perm=200000000,spool=100000000;注释：该命令创建了⼀个测试数据库testbase，其永久表空间为200mb，spool空间不能超过100mb。

在teradata数据库系统的缺省⽅式下，是不区分⼤⼩写字母的。

2、修改数据库的命令举例：Modify database testbase as perm=300000000;注释：该命令将testbase的永久表空间修改为300mb，spool空间定义不变。

3、创建⽤户的命令实例：Create user testuser as perm=200000000，spool=100000000，password=testpassword；4、修改⼀个⽤户的命令实例：Modify user testuser as password=newpassword；5、转让拥有权的命令实例：Give appl1 to admin2；注释：通过DBC或ADMIN登录系统，可以将appl1的拥有权从admin1转让给admin2。

拥有权可以转让，创建者是不可以改变的，⼀旦⼀个⽤户A创建了⼀个⽤户B或者数据库B，那么A就永远是B的创建者。

6、检查⼀个⽤户或数据库具有哪些⽗辈或后代的命令实例：Select parent from dbc.children where child=’APPL1’;注释：检查⽤户APPL1的所有⽗辈。

Select child from dbc.children where parent=’USERADMIN’;注释：检查⽤户USERADMIN的所有后代。

7、Grant select on usera to userb with grant option;注释：表⽰将usera中对象的select权限授予给userb，这样userb就可以读usera中的表、视图等对象了。

NCR Teradata数据仓库

灵活的,可扩展的
+
Teradata CLDM包括:7 个主题域, 328个主实体,905 个属性和460个业务关系
公司主要产品
基于CLDM建立集中的业务模型,使业务人员能够轻松分析:
谁是我们最有价值的客户… 按在网时间,消费金额,收入,年龄,地域,业务规模... 按产品使用情况 (国内,国际,接线员服务,呼叫卡,全部) 在我们最好的客户中,谁最有可能流失? 我们的基站有问题吗? 我们可以将流失模式与用户的家庭关系或一个呼叫频繁的基站对应起来吗? 按欺诈类型划分的欺诈模式? 我们的网络使用峰值占总使用的百分比? 我们应该向谁推销新产品或服务? 那些客户我们应该让给我们的竞争对手? 针对一个选定的用户群体,最赢利的产品/服务组合是什么? 吸引某一类用户的最恰当的消息,媒体,和渠道是什么? ……
在移动信息化领域提供完整的数据仓库解决方案h增值应用和服务基本应用基础设施系统集成项目实施客户分析收入分析高级应用opensystemwindow2000mppsmpdwplatformteradatardbms客户流失模型commldm欺诈管理fraud50产品服务分析市场份额分析服务质量分析市场促销分析etl业务系统源系统cdrtapdecode客户价值模型营销计划预演rps20客户关系管理crm40客户信用模型价格敏感度模型产品亲和度模型绩效管理pmm30催收管理collection40olapmdsdiskarrayopensystemncrunixbardatamining数据仓库在移动行业的基本应用基本应用客户分析收入分析产品服务分析市场份额分析服务质量分析市场促销分析客户分析收入分析产品服务分析?客户分群?客户总量多维分析?新增流失客户多维分析?客户通话行为多维分析?客户缴费行为多维分析?高风险高额客户多维分析?客户转网多维分析?各网元客户数及通信情况多维分析?特定时段通信时长最大前100名客户报表?特定时段通信费用最高前100名客户报表?互转客户统计报表?大客户特征多维分析?大客户业务量多维分析?前100名集团大客户报表?前100名个人大客户报表?高额客户前100名客户报表?各网元客户数及通信情况同期比较报表?收入总量多维分析?arpu多维分析?收入结构多维分析?网络多维分析?预付费多维分析?客户缴费多维分析?客户欠费多维分析?新增客户缴费欠费多维分析?业务量多维分析?业务资源使用特征多维分析?网络流向和流量特征多维分析?热点小区多维分析?业务量报表依业务种类?各类卡资源统计报表?号码资源统计报表?各基站交换机负载统计报表?各网元通信情况同期比较比报表数据仓库在移动行业的基本应用客户分析收入分析产品服务分析市场份额分析服务质量分析市场促销分析市场份额分析服务质量分析市场促销分析?市场占有率多维分析?竞争对手发展情况多维分析?供应商市场行为特征多维分析?合作商市场行为特征多维分析?各竞争对手市场占有率报表?同类设备供应商对比报表?合作商代收费报表?客户服务质量多维分析?客户服务时限多维分析?客户咨询查询焦点多维分析?客户投诉焦点多维分析?客户满意度多维分析?客户投诉状况报表?营销渠道多维分析?代理商客户发展多维分析?代理商业务发展多维分析?宣传促销多维分析?营销人员素质多维分析?最佳促销活动报表基本

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

最优性能 = CPU 和 I/O 带宽的平衡
只增加CPU: 没有足够的磁盘保证 CPU得到充分利用
CPU处理能力增强
当前系统
只增加磁盘: 没有足够的 CPU来充分利用这些磁盘
磁盘个数
Teradata 的推荐配置
Balanced Price/Performance Configuration
• 推荐配置需要找到节点CPU和内存、磁盘阵列的I/O（磁盘的多少）之间一种平衡
• 目标就是为系统提供一种性价比合理的配置
CPU Utilization
100%
I/O
Constrained
80%
60%
Balanced System
Super Saturated
40%
20%
Increase in number of drives
I/O = Number Disk Drives and Controllers
F
SOLARIS
ORACLE DBMS
8
10
15
13
10
8
17
14
11.9
4
5 IBM BLADECENTER
B
AIX
DB2
11
9
11
12
10
9
17
14
11.6
5
6 IBM SYSTEM z9
F
ZOS
DB2
11
14
10
8
10
9
17
14
11.5
6
7 HP BLADESYSTEM
B
HP-UX
ORACLE DBMS
数据仓库系统不是简单的主机、存储、数据库的堆积
• 数据仓库系统不是简单的主机、存储、数据库的堆积
> 数据仓库是：处理器/内存、存储、I/O性能的平衡优化
• 数据仓库要看整体性能，尤其是：
> I/O性能 > 系统可扩展性 > 并行处理能力 > 数据库性能 > 混合负载管理能力
• 一船沙丁鱼 ≠ 一条鲸鱼
> 强调并行处理能力，能够把一个请求切分为若干子任务，并将各个子任务分担到所有的硬件上来并行执行。
> 请求非常多，每次预定都需要访问
> 每个请求非常短小，只访问几条或者几十条记录
> 能够将数以百万级的请求均衡的分担到所有的硬件上
> 强调并发能力，能够把尽量多的请求分散到不同的硬件上来完成。
11
9
12
12
10
7
17
15
11.5
7
8 IBM SYSTEM x
R
WINDOWS
DB2
11
8
11
12
9
6
17
14
10.9
8
9 HP PROLIANT
R
WINDOWS
SQL/SERVE R
11
8
11
13
8
5
17
15
10.9
9
10 HP 9000
R
HP-UX
ORACLE DBMS
6
7
13
12
10
7
17
主动触发
Teradata是目前全球唯一能全面实数施据5复个杂阶度段的数据仓库厂家
综合衡量数据仓库整体性能的十六个维度：
多温度数据管理多代共存
可扩展性
易用易管理
Monitor & Mgmt
Portal
智能扫描
Set & Go Optimization
Basic
Auto
数据模型灵活度查询自由度
高可用性
FORM FACTOR PLATFORM & RELATED TOOLS PLATFORM SERVICES WINDOWS
LINUX UNIX MAINFRAME/LEGACY OS & TOOLS BEST RESULT WINDOWS LINUX UNIX MAINFRAME/LEGACY OS SERVICES BEST RESULT DB2 ORACLE SQL/SERVER TERADATA OTHER DBMS BEST RESULT CORPORATE/ SALES & MARKETING LOCAL/ GO-TO-MARKET AVERAGE SCORE RANK BEST OPTION RANK
> 并行磁盘访问 > 高速互联网络 > 采用Shared-nothing MPP
平台架构 > 专用配置：Appliance
扩展能力是数据仓库系统的重要衡量指标：数据仓库平台的两种设计方式SMP和MPP
数据仓库的5个发展阶段
数据仓库5阶段演进模型
第五阶段第四阶段
• 查询复杂度增加 • 负载混合度增加 • 数据量规模增加 • 数据模型复杂度增加 • 数据历史深度增加 • 用户数量增加 • 系统期望值增加
10 50 50
30 10
6 40 20
15 6
9 40 20
18 8
9 45 40
18 8
10 45 40
18 8
8 50 40
24 8
8 30 10
12 5
8 40 10
18 7
9 40 20
24 9
W orkload Management OS Partitioning Manageability
• 要充分考虑实施风险
> 已经充分经过验证的成功案例，尤其是同行业企业级的成功案例
• 可扩展性非常重要
> 要充分考虑未来业务的发展，不仅需要满足当前的处理要求，还能够线性扩展至未来分析处理的需要，充分保护投资
议程
•如何衡量数据仓库性能 •Teradata产品特点 •Teradata产品家族介绍 •Teradata优势总结
工作负载复杂度
第三阶段第二阶段
报表
发生了什么情况？
分析
为何发生了这种情况？
主动事件
我希望发生什么情况！
一线运营支撑
正在发生什么情况？
预测
将要发生什么情况？
基于事件的触发
分析建模
连续更新和流程互动
第一阶段
主要是批处理和预定义的查询
即席查询和并发查询
批处理即席查询
分析持续的更新/简短的战术性查询
BEST RESULT OS SERVICES BEST RESULT
Stack Technology Best Result Stack Delivery Best Result CORPORATE
SALES & MARKETING LOCAL GO-TO-
MARKET AVERAGE
SCORE RANK
10 3
50
16 7
35
12 6
45
16 6
40
Availability of Skills
2
7
7
8
4
9
6
4
2
Application Choice
8
32
32
40
16
40
32
32
12
LOCAL CATEGORIES
User Definable User Definable User Definable
5 全表扫描 5%
0%
5%
10%
15%
20%
25
权重
30%
35%
数据仓库与一般业务系统的区别
面向用户
数据仓库 > 面向管理人员，用户数少
OLTP > 面向业务人员，用户数多
请求个数
> 请求相对较少
每个请求所需资源
技术要求
对平台的要求
> 每个请求巨大，往往需要扫描百万或千万条的记录
> 能够调集所有的资源完成一个访问请求
1999 年
2000 年
2003 年
2004年
2007年
GENERIC VIEW DW DBMS SERVER
RELEASE 3
Server SEM (Scorecard Evaluation Model) Lite
Top Ten DW DBMS SERVER by average score
1 NCR TERADATA
2
6
6
6
4
3
9
7
4
Gartner Client "RADAR" Delivers On Promises
10 15
40 9
30 15
45 18
15 12
45 18
50 18
40 18
20 24
BUSINESS PRACTICE
Ease of Doing Business Support
4 50
6 30
15
10.9
10
2001年
Data Warehousing Comparisons
* WEIGHTED SCORES * WEIGHTED SCORES * WEIGHTED
SCORES * WEIGHTED SCORES *
IBM
Sun
HP
IBM
Comp
NCR
SHV 8- Unisys IBM
aq
F
MP/RAS TERADATA
11
10
13
14
14
13