Informatica元数据管理..
- 格式:ppt
- 大小:2.80 MB
- 文档页数:34
白皮书主数据管理和数据迁移本文档含有 Informatica Corporation 的保密、专有信息和商业秘密信息(“机密信息”),事先未经Informatica 的书面同意,不得进行拷贝、散发、复印或以任何其它方式复制。
尽管我们尽最大努力确保本文档中信息的准确性和完整性,但仍可能存在一些印刷错误或技术误差。
如因使用本文档所含信息而造成任何损失,Informatica 概不负责。
本文档中包含的信息随时可能更改,恕不另行通知。
Informatica 自行决定将这些材料中讨论的产品属性纳入其任何软件产品的发布或升级中,并自行决定任何此类发布或升级的时间安排。
受下列一项或多项美国专利保护:6,032,158;5,794,246;6,014,670;6,339,775;6,044,374;6,208,990;6,850,947;6,895,471;或受下列正在申请的美国专利保护:09/644,280;10/966,046;10/727,700。
此版本发布于 2014 年 11 月白皮书目录MDM 对数据迁移为何至关重要 (2)第 1 个问题:进行苹果与苹果的比较 (2)按时启动:中间步骤 (3)案例:若干产品 (4)第 2 个问题:质量至关重要 (4)案例:整合公司总部系统和本地系统 (5)数据迁移是提升 MDM 价值的途径 (5)主数据管理和数据迁移1本白皮书描述主数据管理对数据迁移项目日益增长的重要性、有用之处和最佳部署选项,其中包括相关案例研究。
MDM 对数据迁移为何至关重要每个新系统均需要数据来促进活动的启动。
大多数新系统需要若干数据。
如今,除了通过邮局地址文件等外部源丰富新系统以外,我们正在将大量遗留源中的数据迁移至新系统。
Informatica 数据迁移工具套件将部署一整套技术和最佳实践流程,旨在解决当今数据迁移场景中涌现的一系列挑战。
但首先,我们一起来看看市场背景。
尽管目标系统可能会涵盖各种功能,但数据源就好比是烟囱式解决方案,每一款解决方案均围绕不同的业务流程、不同的业务领域而设计。
Informatica总结rmatica中关键词:(一)源表:即源表来自于数据库的表,例如在job100下面的源表是一些PRPCmain、CD码表、ODS表等一些表主要是来自于核心生产库中的表;job200下面的源表是些CD、ODS、MID表;job300下面的源表主要是CD、ODS、MID、olap表。
(二)元数据:元数据就是来自于数据库的基本表,起初的表(三)目标表:在执行完一个job后最终将数据存储在的表即目标表。
(四)映射:简单来讲将源表的数据导入目标表的过程就是一个映射。
(五)工作集:在一个job中执行的转化其中的每一个过程就相当于一个工作集。
(六)工作流:相当于在kettle中执行一个job的过程。
2.designer界面主要是定义源表和目标表生成映射的过程。
3.workflow界面编辑工作集执行工作流的过程。
4.monitor界面主要是为了执行完工作流之后查看工作日志的过程。
关于数据库方面(1).在Informatica中创建源和目标表的时候:在designer中创建源:来自于核心生产库在本地的配置文件中进行配置创建目标表:来自MIS生产库或者是测试库在本地的配置文件中进行配置根据这个路径E:\oracle\product\10.2.0\db_1\network\admin\tnsnames.ora找出.ora文件(2)创建工作流和工作集的时候:在workflow中,在进行启动的时候:在进行刷数参数配置在C:\Windows\System32\drivers\etc添加88.22.34.188 zj-misetl路径:/home/info_param data_param_test.txt文件是在windows32相对应的文件夹的下面在启动工作流的时候:配置数据库的文件不在本地文件中而是在Linux系统下面所以需要和Linux系统相连,通过xftp连接Linux系统,找到配置数据库的时候需要的文件。
Key Benefits• Protection and monitoring of personal and sensitive data to fuel data-driven digital transformation and support for privacy and compliance efforts• Centralized visibility across data platforms and types, providing the support needed for today’s complex environments• Continuous risk analysis of personal and sensitive data,to prioritize resources and investments across functional, geographic, and line of business views• AI-driven detection to uncover high-risk, anomalous data usage • A single view of data subjects’ information to provide identity capabilities (rights and consents requests) required for GDPR, CCPA and other privacy legislation• Automated orchestration and protection with sensitive data intelligence remediates privacy and security risks Metadata-driven Intelligence and Automation to Operationalize PrivacyInformatica® Data Privacy Management helps you discover, classify, analyze, protect and monitor personal and sensitive data across your organization. It leverages artificial intelligence (AI) to deliver actionable data discovery and classification, risk scoring, data subject identity capabilities, behavioral analytics, and automated protection in a single solution. It supports structured, semi-structured and unstructured data in the cloud, on premises, in big data stores, and in relational and mainframe systems.Informatica Data Privacy Management helps you prioritize data protection and privacy investments, policies, processes, and programs:• Discover and classify your sensitive data: Gain global visibility into personal and sensitive data across the enterprise with data classification, discovery, proliferation and process analysis, user access, and activity correlation.• Map individual identities to sensitive data: Understand sensitive data by individual identities and quickly locate an individual’s sensitive data to support privacy requests.• Analyze and monitor privacy risk: Track data risk and remediation of misuse and privacy violations based on multiple factors, customize to your organization’s needs, and identify top risk areas based on privacy regulation requirements. Risk simulation helps you understand the impact of data controls before implementation.• Continuously monitor data movement, access, and user activity: Leverage analytics to detect suspicious or unauthorized data access by continuously correlating, baselining, analyzing, and alerting on high-risk conditions and potential anomalous behaviors that threaten sensitive data.• Protect personal and sensitive data and remediate risk: Automate the orchestration of data security controls to protect data at rest and in use, prevent unauthorized access, and de-identify/anonymize/pseudonymize sensitive data. Initiate remediation workflows with custom scripting, automated email notifications of security policy violations, ServiceNow integration, andout-of-the-box third-party protection integration.Data SheetKey FeaturesDiscover and Classify Sensitive Data• Discover, classify and analyze the risk of sensitive and personal data across the enterprise—in structured data across traditional relational databases, including mainframes; semi-structured and unstructured data in environments such as Hadoop repositories, Amazon S3; file mounts (e.g., CIFS); and SharePoint.• Attain complete sensitive data visibility with dashboards and drill-downs to identify functional and organizational information such as department, application, user, and data storage types.• Gain a complete understanding of data, its movement, and its usage in business processes with proliferation tracking and interactive visualizations—both inside and outside the enterprise and between partner and client organizations.Figure 1. Informatica Data Privacy Management provides 360-degree visibility of sensitive data through its dashboard.Support Regulatory Compliance• Accelerate and continuously measure regulated privacy data compliance with risk scoring based on customizable factors, including data sensitivity, volume, protection, proliferation, location, and user activity.• Apply a combination of data domains to define GDPR, CCPA, PII, PHI, and PCI risks relevantto policies, laws, and regulations.• Leverage subject registry for a single view of data subjects across structured and unstructured data. Provide automated matching and linking of data subjects’ records for privacy legislation compliance and to support the execution and management of subject rights and consent requests.• Enforce compliance with automated remediation, stakeholder notification, continuous monitoring of user behavior and sensitive data proliferation across data stores and geographic locations.About InformaticaDigital transformationchanges expectations: betterservice, faster delivery, withless cost. Businesses musttransform to stay relevantand data holds the answers.As the world’s leader inEnterprise Cloud DataManagement, we’re preparedto help you intelligently lead—in any sector, category, orniche. Informatica providesyou with the foresight tobecome more agile, realizenew growth opportunities, orcreate new inventions. With100% focus on everythingdata, we offer the versatilityneeded to succeed.We invite you to exploreall that Informatica hasto offer—and unleash thepower of data to drive your next intelligent disruption.Worldwide Headquarters 2100 Seaport Blvd., Redwood City, CA 94063, USA Phone: 650.385.5000, Toll-free in the US: 1.800.653.3871IN06_1120_03836© Copyright Informatica LLC 2020. Informatica and the Informatica logo are trademarks or registered trademarks of Informatica LLC in the United States and other countries. A current list of Informatica Protect Personal and Sensitive Data • Identify critical data protection priorities and create plans to support privacy by design objectives.• Protect sensitive data with automated remediation that leverages integrated Informatica Dynamic Data Masking, Persistent Data Masking, and third-party protection methods such as Hortonworks Ranger and Cloudera Sentry.• Integrate with custom scripts, email notifications, system log messages, or ServiceNow tickets. Configure these actions to run when triggered by security policy violations or run them manually when potential risks are detected.For more information, visit the Data Privacy Management Product Page。
INFORMATICA关于WORKFLOWManager系统的元数据解析INFORMATICA关于WORKFLOW Manager系统的元数据解析关键词:INFORMATICA,WOR Manager,元数据informaica是一个很强大的ETL工具。
其WORKFLOW MANAGER负责对ETL调度流程进行设计与管理和执行!informatica在在资料库中提供以下表来存储调动流程的相关信息。
以便WORKFLOW MANAGER对用户所设计的调动流程进行管理和执行。
opb_wflow_dep:描述workflow执行步骤相关信息和每个步骤执行的条件信息opb_wflow_dep_run:描述workflow执行步骤运行时相关信息opb_wflow_expr :描述workflow中相关的表达式或条件的相关信息opb_wflow_perval:描述workflow可持续性变量相关信息opb_wflow_run:描述workflow运行日志相关信息opb_wflow_var:描述workflow变量相关信息opb_task:描述任务对象的基本信息opb_task_attr:描述任务对象相关的属性的信息opb_task_inst:描述任务对象实例的基本信息opb_task_inst_run:描述任务对象实例运行日志相关信息opb_task_val_list:描述任务对象实例中command信息WORKFLOW MANAGER系统中常用的有这几个模块,Command模块,Session模块,Waiting_Event模块,Raising_Event模块,Assignment模块,Worklet模块WORKFLOW MANAGER系统中上述的这些模块统称为任务(Task).如果你对一个模块进行了复制后新的模块就称作该任务的任务实例(Task_Inst).WORKFLOW MANAGER系统中Worklet模块可以有其他非Worklet模块组成。
informatica工作原理-回复Informatica工作原理: 实现数据集成、数据质量和数据管理的关键技术引言:在当今数字化时代,数据成为了企业决策和战略规划的问题。
然而,大量分散在不同系统和数据源中的数据给企业数据分析和管理带来了很大挑战。
为了解决这些问题,许多组织都转向了数据集成和数据管理解决方案。
而其中的佼佼者就是Informatica。
在本文中,我们将深入探讨Informatica工作原理,了解它如何实现高效的数据集成、数据质量和数据管理。
第一部分:数据集成数据集成是将分散在不同数据源中的数据整合在一起,以获得一致、可信的数据视图的过程。
Informatica通过以下步骤实现数据集成:1. 数据源连接:Informatica可以连接到各种数据源,包括数据库、文件、应用程序和云端存储。
它使用统一的接口和驱动程序来实现连接,并建立与数据源之间的通信。
2. 数据提取:Informatica从不同的数据源中提取数据。
这可以通过读取数据库表、文件或执行Web服务调用来实现。
数据提取是通过查询或API 调用来完成的,并将数据保存在Informatica的数据集成引擎中。
3. 数据转换:在数据提取后,Informatica对数据进行转换和清洗,以确保数据的一致性和准确性。
数据转换可以包括数据格式转换、数据清洗、数据合并、数据筛选等操作。
4. 数据加载:一旦数据经过转换和清洗,Informatica将数据加载到目标系统中。
这可以是目标数据库、文件、数据仓库或其他应用程序。
第二部分:数据质量数据质量是确保数据准确性、一致性和完整性的一项关键任务。
Informatica通过以下方式确保数据质量:1. 数据校验:Informatica对数据进行校验,以确保数据的准确性和一致性。
它可以检查数据的完整性、有效性和规范性,并根据预定义的规则和逻辑对数据进行验证。
2. 数据清洗:Informatica清洗数据以去除重复项、缺失值和错误数据。
informatica工作原理Informatica是一家全球知名的数据集成和数据管理公司,其工作原理涉及到多个关键组件和技术。
本篇文章将详细介绍Informatica 的工作原理,包括其核心组件、数据处理流程、数据传输方式以及安全机制等方面。
一、核心组件Informatica的核心组件包括PowerCenter、PowerExchange和PowerDesigner等。
这些组件共同构成了Informatica的数据集成平台,提供了数据抽取、转换、清洗、加载等功能。
1.PowerCenter:作为Informatica的核心数据集成引擎,PowerCenter负责执行数据抽取、转换和加载等操作。
它支持多种数据源和目标,包括关系型数据库、非关系型数据库、文件系统等。
PowerCenter通过使用流处理引擎和批量处理引擎,实现了高效的数据处理能力。
2.PowerExchange:PowerExchange是Informatica的数据传输组件,负责在不同的数据源和目标之间进行数据传输。
它支持多种传输协议,如TCP、HTTP、JMS等,可以保证数据传输的可靠性和稳定性。
3.PowerDesigner:PowerDesigner是Informatica的数据模型设计工具,用于创建和编辑数据模型。
它提供了丰富的图形化界面,方便用户设计数据模型并生成相应的元数据。
二、数据处理流程Informatica的数据处理流程主要包括数据抽取、转换、清洗、加载和验证等步骤。
具体流程如下:1.数据抽取:从源数据存储中提取所需的数据,并将其加载到Informatica的数据仓库中。
2.数据转换:将抽取的数据进行转换和清洗,以满足目标系统的要求。
这一步骤可能包括数据类型转换、格式转换、去除重复数据等操作。
3.数据加载:将清洗后的数据加载到目标系统中,完成数据的最终传输。
4.验证:对加载的数据进行验证,确保数据的准确性和完整性。
Informatica主数据管理解决方案精品课件(一)Informatica主数据管理解决方案是一个全面的数据治理解决方案,可以帮助企业更好地管理其不同应用程序中的数据,并提高数据质量。
本课件将向您详细介绍Informatica主数据管理解决方案的基本组成部分,以及如何使用该解决方案来解决数字化转型的挑战。
第一部分:解决方案概述1.1 Informatica主数据管理解决方案的基本概念1.2 该解决方案如何帮助企业处理数据问题1.3 解决方案的主要好处第二部分:解决方案组成2.1 数据模型2.2 数据集成2.3 数据质量2.4 数据分析和报告2.5 安全和合规性第三部分:数据模型3.1 模型的构建3.2 属性定义和管理3.3 数据元素和数据域3.4 属性视图和观点3.5 数据管理第四部分:数据集成4.1 数据同步4.2 数据转换和规范化4.3 数据协调4.4 数据质量表现第五部分:数据质量5.1 数据质量度量和指标5.2 数据质量规则和验证5.3 数据质量监控和报告5.4 数据清理和修正第六部分:数据分析和报告6.1 数据仪表盘和报表6.2 数据可视化和探索6.3 高级数据分析6.4 数据敏感性和保护第七部分:安全和合规性7.1 数据访问和控制7.2 数据保护和加密7.3 合规性和审计7.4 政策管理和执行第八部分:解决方案实现8.1 解决方案建设8.2 项目规划和管理8.3 解决方案评估和验证8.4 解决方案部署和维护结论:通过这个课件,您可以了解Informatica主数据管理解决方案的主要组成部分、优势和应用场景。
这个解决方案可以帮助您改善您的数据管理,提高数据质量,优化数据利用,设立数据规则,并保证数据的安全性和合规性,最终实现企业的数字化转型。
六步法:Informatica数据质量控制方法第一篇:六步法:Informatica 数据质量控制方法Informatica 数据质量控制方法一个战略性和系统性的方法能帮助企业正确研究企业的数据质量项目,业务部门与IT 部门的相关人员将各自具有明确角色和责任,配备正确的技术和工具,以应对数据质量控制的挑战。
Informatica 的六步法为帮助指导数据质量控制而设计,从初始的数据探查到持续监测以及持续进行的数据优化。
业务部门与IT 部门的数据使用者—业务分析师、数据管理员、IT 开发人员和管理员,能够在六个步骤的每一步中协同使用Informatica 数据质量解决方案;并在整个扩展型企业的所有数据领域和应用程序中嵌入数据质量控制。
步骤一:探查数据内容、结构和异常第一步是探查数据以发现和评估数据的内容、结构和异常。
通过探查,可以识别数据的优势和弱势,帮助企业确定项目计划。
一个关键目标就是明确指出数据错误和问题,例如将会给业务流程带来威胁的不一致和冗余。
步骤二:建立数据质量度量并明确目标Informatica的数据质量解决方案为业务人员和IT人员提供了一个共同的平台建立和完善度量标准,用户可以在数据质量记分卡中跟踪度量标准的达标情况,并通过电子邮件发送URL来与相关人员随时进行共享。
步骤三:设计和实施数据质量业务规则明确企业的数据质量规则,即,可重复使用的业务逻辑,管理如何清洗数据和解析用于支持目标应用字段和数据。
业务部门和IT部门通过使用基于角色的功能,一同设计、测试、完善和实施数据质量业务规则,以达成最好的结果。
步骤四:将数据质量规则构建到数据集成过程中Informatica Data Quality支持普遍深入的数据质量控制,使用户可以从扩展型企业中的任何位置跨任何数量的应用程序、在一个基于服务的架构中作为一项服务来执行业务规则。
数据质量服务由可集中管理、独立于应用程序并可重复使用的业务规则构成,可用来执行探查、清洗、标准化、名称与地址匹配以及监测。
Informatica主数据管理建设方案一、引言主数据管理(MDM)是一种重要的信息管理方法,旨在通过集中管理和维护核心业务数据,提高数据质量、一致性和可信度。
在当今信息化的时代,企业对于数据的管理和利用变得日益重要和复杂。
本文将探讨使用Informatica主数据管理来建立一个有效的数据管理方案。
二、背景随着企业规模和业务的不断扩展,数据的新增和更新速度快,数据质量问题也日益显现。
在此背景下,建立一个可靠的主数据管理系统是企业提高数据质量、强化数据治理的关键一环。
Informatica主数据管理软件为企业提供了集成数据管理、数据质量和数据治理的平台,具备高度可扩展性和灵活性,为企业的主数据管理需求提供了综合的解决方案。
三、方案概述1. 系统架构基于Informatica主数据管理的建设方案主要分为以下几个关键组成部分:- 数据集成层:负责将主数据集成到各个业务系统中,确保数据的实时性和一致性。
- 数据存储层:用于存储和管理企业的主数据,包括客户、产品、供应商等核心数据。
- 数据质量层:通过数据质量规则和验证流程,提高数据质量和准确性。
- 数据治理层:确保数据的规范性和合规性,设立数据管理的流程和权限控制。
2. 数据模型设计与实施为了有效管理企业的主数据,建立一个合理的数据模型是至关重要的。
通过Informatica主数据管理软件,可以根据各个业务需求进行数据模型的设计和定制。
根据企业的需求,可以定义不同类型的主数据实体,如客户、产品、供应商等,并在层级结构中进行组织和管理。
3. 数据集成与同步通过Informatica主数据管理的数据集成层,将主数据与各个业务系统进行集成和同步,确保各个系统的数据一致性和准确性。
可以利用Informatica的强大的ETL工具,构建数据集成和同步的工作流程,实现数据的实时同步和更新。
4. 数据质量管理Informatica主数据管理软件提供了强大的数据质量管理功能。
Informatica所有的元数据信息均以数据库表的方式存到了元数据库中。
当然Infa本身工具提供了很多的人性化的功能,使我们在开发时可以很方便的进行操作,但人们的需求总是万变的,需要方便的取到自己需要的信息,那就需要我们对他的元数据库有很深的了解。
Informatica所有的元数据信息均以数据库表的方式存到了元数据库中。
当然Infa本身工具提供了很多的人性化的功能,使我们在开发时可以很方便的进行操作,但人们的需求总是万变的,需要方便的取到自己需要的信息,那就需要我们对他的元数据库有很深的了解。
Informatica通过表和视图给我们提供着所有的信息,在此将通过一个系列的帖子,将大部分常见的,且非常有用的表及视图介绍一下。
基于这些东西,我们即可以根据不同的需求查出自己需要的数据,也可以开发一些辅助的Infa应用程序。
....FIRST_ERROR_MSG: No errors encountered.用途:这是在查Session运行情况的最终要的表之一,可以最简便的得到Session是否运行正常及当初错时的首个错误简要信息,以及日志文件的位置OPB_SRC:INFORMATICA DESIGNER中所定义的所有源例如:SRC_ID: 12SUBJ_ID: 27FILE_NAME: AM_EQP_ASSESSSOURCE_NAME: AM_EQP_ASSESS用途:通过Subj_Id的关联,可以查出每个Folder中所有定义了的源OPB_SRC_FLD:INFORMATICA中源表的所有字段的定义例如:FLDID: 82SRC_ID: 12SRC_NAME: FLAG_ID用途:关联上表,得出该源表的所有字段,及其定义和相关属性值OPB_SRV_LOC_VARS:INFORMATICA系统服务器配置中,所有的系统变量及变量的当前值例如:VAR_ID: 13VAR_NAME: $PMRootDirVAR_VALUE: D:Program FilesInformatica PowerCenter用途:查看当前服务器的所有系统变量及其当前值OPB_SUBJECT:INFORMATICA中所有主题定义,即所有Folder的定义及相关属性例如:SUBJ_NAME: OAMSUBJ_ID: 2GROUP_ID: 3用途:Folder的ID是其他很多表的外键,作为其他表的关联,可以查看该Folder下的所有相关对象信息OPB_SWIDGET_INST:记录一个Session中所用到的Mapping引用到的所有对象及其相关属性,即细到每个转化模块一条记录例如:SESSION_ID: 11MAPPING_ID: 3INSTANCE_NAME: LKP_OTHER_CHECK11PARTITION_TYPE: 1用途:查看每个Session所引用到的所有对象,及其当前的属性值OPB_SWIDGINST_LOG:INFORMATICA运行后,所有运行了的Session中相关源及目标对象的运行日志,即运行的时间,抽取的数据成功条数等例如:TASK_INSTANCE_ID: 92PARTITION_ID: 1PARTITION_NAME: Partition #1WIDGET_NAME: SQ_SHIFT_CODEAPPLIED_ROWS: 723START_TIME: 2004-11-4 8:48:12END_TIME: 2004-11-4 8:48:31用途:这是INFORMATICA运行后,对每个对象的运行情况的最详细的日志记录,对于数据正确性的检查,性能的调优等有着很重要的参考价值OPB_SWIDG_GROUP:在INFORMATICA DESIGNER 中Union_Transformation模块上的所有Group的定义表例如:SESSION_ID: 1410GROUP_NAME: PM_GROUP1用途:该表单独记录了Union_Transformation模块上所有设置了的Group,可以通过关联查出一个Session上所有的Union Group定义OPB_TABLE_GROUP:在INFORMATICA DESIGNER 中Router Transformation模块上的所有Group的定义表.例如:OBJECT_ID: 3409ATTR_VALUE: FROM_ID = 'xx'用途:该表单独记录了Router Transformation模块上所有设置了的Group,以及Group的分组条件,可以通过关联查处出一个Mapping中Route r的所有分组设置及其分组条件OPB_TARG:在INFORMATICA DESIGNER 中所有目标表的定义OPB_TABLE_GROUP:在INFORMATICA DESIGNER 中Router Transformation模块上的所有Group的定义表.例如:OBJECT_ID: 3409ATTR_VALUE: FROM_ID = 'xx'用途:该表单独记录了Router Transformation模块上所有设置了的Group,以及Group的分组条件,可以通过关联查处出一个Mapping中Route r的所有分组设置及其分组条件OPB_TARG:在INFORMATICA DESIGNER 中所有目标表的定义例如:TARGET_ID: 3SUBJ_ID: 2TARGET_NAME: HAM_DEPT用途:该表存储了所有的目标表定义,通过关联可以查出某个Folder下所有的目标表定义OPB_TARGINDEX:在INFORMATICA中对目标表,可进行Index的定义,该表存储了所有目标表Index的定义例如:TARGET_ID: 1626INDEXNAME: IDX_AUDIT用途:查出所有在INFORMATICA中进行的Index定义,及相关目标表信息OPB_TARGINDEXFLD:INFORMATICA中目标表上进行了Index定义的相关的所有字段例如:INDEXID: 6FLDNAME: AREC_BILL_ID用途:进行关联查出在INFORMATICA中进行了Index定义的表及其字段OPB_TARG_FLD:INFORMATICA中所有目标表的字段信息例如:TARGET_ID: 131TARGET_NAME: CHECK_PROPERTY用途:查看目标表的所有字段信息,或给出字段名,查找该字段在那些目标表中出现过OPB_TASK:WORKFLOW中所有Task的记录,包括Session,Worklet,WorkFlow等例如:TASK_ID: 1717TASK_NAME: s_OAM_LOG_ARR用途:该表是Workflow关于Task的记录的主表,通过关联可以查出某个folder下所包含的所有Workflow、Worklet、Task等,以及查出一个Workflow下的所有TaskOPB_TASK_ATTR:该表记录了Task的所有属性值,每个属性一条记录例如:ATTR_ID: 2ATTR_VALUE:用途:查看相关Task的属性设置,查找系统中同一属性设置的所有TaskOPB_TASK_INST:Task实例表,与OPB_TASK表信息类似,但该表主要突出的是Workflow与Task的关系,而OPB_TASK表是Task的基表例如:WORKFLOW_ID: 9INSTANCE_NAME: s_USED_KIND用途:查找一个Workflow下的所有Task信息OPB_TASK_INST_RUN:该表记录了所有Task每次运行的日志信息,包括当前的运行起始时间,服务名等例如:INSTANCE_NAME: s_ASSET_ACCOUNTSTART_TIME: 2004-11-3 15:20:01END_TIME: 2004-11-3 15:20:08SERVER_NAME: ETL-SVR用途:该表记录了Task每次运行的日志信息,其中关于时间的信息对于性能调优有着极其重要的作用,也可以观察同一个Task,一段时间的运行效果,评估服务器的运行情况等OPB_TASK_VAL_LIST:该表记录了某些Task中的属性值,例如Command Task中的Command值例如:TASK_ID: 2990PM_VALUE: DEL “D:”VAL_NAME: DELETE用途:可以查看当前系统中设置的任务属性值,也可查看所有的Command的命令值OPB_USERS:该表记录了Rep Manager中所设置的所有用户,及其相关属性例如:USER_ID: 5USER_NAME: DEMOUSER_PASSWD: hG63"4.`USER_PRIVILEGES1: 79用途:可以查看系统中INFORMATICA所定义了的所有用户及相关属性OPB_USER_GROUPS:该表记录了Rep Manager中用户与组的关系例如:USER_ID: 2GROUP_ID: 3用途:查看一个组中存在哪些用户,或关联出每个用户到底属于哪个组。
InformaticaVSIBM-DataStage化和扩展上,均有一定的限制。
项目实施的支持➢Informatica结合15多年的数据集成领域的经验,总结出一套针对Informatica产品实施数据仓库、数据管理等项目的最佳方法论Velocity 2008。
该成熟的开发方法论,是指导客户实现快速、高质量项目实施的最佳武器。
➢现在全国拥有众多的名高级技术专家与顾问,与国内如大唐,联创、神州数码、东软,中软等多家知名集成商成立战略合作伙伴,Informatica产品开发人员全国上千人规模。
➢Informatica支持服务中心是有非常熟练的技术支持工程师充当的,这些工程师具备你需要的、成功的专家知识。
在中国有专门的售后服务工程师。
➢无专业/成熟,基于产品的项目最佳开发方法论➢很难找到熟悉类Basic开发语言的Datastage开发工程师➢IBM是以服务为主的公司,如果客户采用了其DataStage产品,将要支付大笔的IBM咨询服务费。
产品安装完全图形化安装,无需额外安装平台软件,且不需修改系统内核参数➢需耗用时间安装和准备C编译环境,不同平台软件安装的C编译器也不尽相同➢需修改系统内核参数,对其他应用影响较大,有潜在的危险。
产品升级➢平滑升级,完全图形化,不需修改已设计完作业。
➢主要是升级资料库,工作量很小。
➢需重新编译已有作业➢大版本之间以及跨平台的升级,很多作业需重新编写/编译代码,重复操作和维护工作量大。
产品移植➢PowerCenter支持逻辑和物理设计分离的开发模式,有一个Mapping(逻辑的)和Session(物理的或者可运行)的概念,Mapping是逻辑上的ETL规则,而Session才是真正可以实例化运行的任务。
➢可以跨平台、跨不同数据库进行作业的单个、整体移植。
不需改变作业设计等,原有的任务可以直接在新环境下运行,并且只要更改Session的数据库联接串,则使用原有的Session任务访问不同的数据库类型数据,大大简化项目移植的工作。