用友主数据规划与方法论V2
- 格式:docx
- 大小:2.33 MB
- 文档页数:15
用友软件
实施方法论
1.前言
用友实施方法论3.0指出ERP项目实施中有一个成功等式:企业ERP系统的成功应用= 有准备的企业+ 合适的软件+ 成功实施,三个条件缺一不可。
那么在这个等式里,作为项目销售后实施的我们,占据着是否成功实施这一重要的环节。
因此制定一个规范的实施方法不仅让项目经理在项目实施的过程中有依可询、有据可查,也能够增强项目经理对项目管理和规范实施的意识,提高项目成功实施的机率!
本实施方法参考用友实施方法论3.0,结合安易公司在多个AnyiHis5.0项目实施过程中的经验和体会依照用友实施方法论框架整理而成。
对项目实施过程的各阶段、各项任务的工作内容、策略、角色和责任、交付成果、潜在风险逐一进行了介绍,稍后再整理一套模板供大家参考,希望本实施方法论编制完成后对大家以后在项目现场有所帮助。
同时也欢迎各位提供意见,共同完善这一套实施方法论。
2.标准实施路线图
注:模板文档见《模板参考》文件夹,后续将继续完善发给大家共同优化。
以下为用友实施方法论原版,供参考,未整理4、用友项目组织职责和任务明细
5、客户项目组职责和任务明细。
一、背景随着信息技术的飞速发展,数据已成为企业的重要资产。
为了更好地管理和利用数据,提高企业竞争力,我国许多企业开始关注主数据管理。
主数据是指在企业内部共享并用于支持企业运营的核心数据,包括客户、供应商、产品、组织等。
为了确保主数据的准确性和一致性,特制定本工作规划。
二、工作目标1. 建立完善的主数据管理体系,确保主数据的准确性、一致性和完整性。
2. 提高数据质量,降低数据错误率,减少数据重复和冗余。
3. 优化业务流程,提高工作效率,降低运营成本。
4. 提升企业信息化水平,增强企业核心竞争力。
三、工作内容1. 主数据管理体系建设(1)制定主数据管理政策,明确主数据管理的范围、职责和流程。
(2)建立主数据标准体系,包括主数据定义、分类、属性、编码等。
(3)制定主数据质量标准,确保主数据准确、一致、完整。
2. 主数据质量管理(1)开展主数据质量评估,识别数据质量问题,制定改进措施。
(2)建立主数据质量监控机制,定期对主数据进行质量检查。
(3)加强数据清洗和治理,提高数据质量。
3. 主数据共享与应用(1)搭建主数据平台,实现主数据集中管理和共享。
(2)推动主数据在各业务系统中的应用,提高数据利用率。
(3)开展主数据培训,提高员工数据素养。
4. 保障措施(1)加强组织领导,成立主数据管理领导小组,统筹协调各项工作。
(2)加大投入,确保主数据管理工作的顺利开展。
(3)建立激励机制,鼓励员工积极参与主数据管理工作。
四、实施步骤1. 项目启动:成立项目组,明确项目目标、范围、进度等。
2. 规划设计:制定主数据管理体系、标准体系、质量标准等。
3. 建设实施:搭建主数据平台,开展主数据质量管理、共享与应用等工作。
4. 检查评估:对项目实施情况进行检查评估,总结经验教训。
5. 持续改进:根据检查评估结果,不断优化主数据管理工作。
五、预期效果通过实施本工作规划,预计达到以下效果:1. 主数据质量得到显著提高,降低数据错误率。
U9实施方法论2.1创建日期:2009年4月当前版本:V2.1起草部门:咨询实施事业部─U9咨询实施与支持总部修订日期:2011年04月<说明:该文件属于用友股份公司内部控制文件,请大家注意保密>文档控制更改记录审阅审批目录文档控制 (2)1 前言 (4)1.1提出背景 (4)1.2SMART实施方法论的定义理念 (4)1.3SMART实施方法论的路线图 (5)1.4SMART实施方法论的特点 (6)1.5 U9产品总体介绍 (10)1.6使用UAP-U9进行定制开发 (12)2 U9项目实施路线图总览 (14)3 U9项目实施主要内容 (15)3.1 项目规划 (15)3.2方案设计 (20)3.3 系统构建 (26)3.4 上线切换 (30)3.5 持续支持 (33)4 工具模板清单 (35)1前言1.1提出背景在ERP项目实施中有一个成功等式即:企业ERP系统的成功应用 = 有准备的企业 + 合适的软件+ 成功的实施方法,三个条件缺一不可。
对于用友来说,在前两个条件既定的情况下,项目能否成功,则取决于咨询实施顾问的实施能力和对实施方法的灵活运用。
在2001年初用友公司发布了第一套用友项目实施方法论并向规范化实施迈出了第一步之后,这套方法论如今已经发展为5.0版本,通过广大咨询实施顾问在项目中的贯彻执行,有效地控制了项目实施的风险,提高了项目实施的成功率。
U9是用友继U8和NC产品之后推出的又一款全新的商业应用套件,其功能十分强大,而且在实施方面也提供了组件化预配置等技术从而使实施过程变得更为轻松和快速。
上述特点要求我们必须对原有的实施方法进行调整以更为有效地适合U9产品的专业化、快速化、规模化实施。
为此我们根据原有用友实施方法论,综合借鉴U9产品的特点和实施过程,对项目实施各阶段、各项任务的工作内容、策略、角色和责任、交付成果、使用文档、潜在风险逐一进行了介绍,并整理了一套工具、模板,力求流程清晰、简练实用,形成了U9的SMART实施方法论。
用友软件上线计划及方案清晨的阳光透过窗帘,洒在键盘上,指尖跳动着,大脑开始飞速运转。
经过十年的磨砺,我已经对方案写作驾轻就熟。
今天,就让我以“用友软件上线计划及方案”为主题,为大家展示一下我的思考过程。
一、项目背景用友软件作为我国企业管理软件的领军企业,其产品覆盖了企业管理的方方面面。
为了满足客户日益增长的需求,提高企业竞争力,用友公司决定推出一款全新的企业管理软件。
这款软件集成了财务管理、人力资源、供应链管理等多个模块,旨在帮助企业实现信息化管理,提高工作效率。
二、上线目标1.确保软件系统稳定、安全、可靠,满足企业级应用需求。
2.提高企业内部管理水平,降低管理成本。
3.提升客户满意度,增强市场竞争力。
4.为企业未来发展奠定基础。
三、上线计划1.项目筹备阶段(1)成立项目组,明确各成员职责。
(2)与用友公司沟通,了解软件功能和特点。
(3)调研企业需求,确定上线模块。
(4)制定上线计划,明确时间节点。
2.系统部署阶段(1)搭建服务器,配置网络环境。
(2)安装软件,进行系统配置。
(3)数据迁移,确保数据准确性。
(4)系统测试,确保稳定运行。
3.培训与推广阶段(1)制定培训计划,组织员工培训。
(2)编写操作手册,方便员工查阅。
(3)开展内部宣传,提高员工认识度。
(4)实施激励机制,鼓励员工使用软件。
4.运维与优化阶段(1)建立运维团队,负责软件维护。
(2)定期进行系统升级,优化功能。
(3)收集用户反馈,持续改进软件。
(4)开展数据分析,为企业决策提供依据。
四、上线方案1.技术保障(1)采用成熟的技术框架,确保系统稳定性。
(2)实施严格的代码审查和测试流程,提高软件质量。
(3)搭建灾备系统,确保数据安全。
(4)采用加密技术,保护用户隐私。
2.数据迁移(1)制定详细的数据迁移方案,确保数据完整性。
(2)开展数据清洗,提高数据准确性。
(3)实施数据备份,防止数据丢失。
(4)与用友公司技术团队密切配合,确保迁移顺利进行。
用友实施方法论V M S V 项目实施主计划书集团档案编码:[YTTR-YTPT28-YTNTL98-UYTYNN08]_______ERP项目实施主计划建立日期: 2007-9-1修改日期: 2007-9-10文控编号: UF_XX(NC/U8)_XX(项目名称)- PMS1.4.01_V1.0实施顾问:日期:用友客户经理:日期:文档控制修改记录:调研记录:目录1内容概述主要是描述《项目实施主计划书》的用途,1、项目实施主计划是项目开始实施前的整体规划;2、项目实施的进度控制的依据;3、指导双方项目实施小组进行项目实施的关键资料;项目实施主计划主要在工作任务书基础上内容的补充,并且是经过实施双方多次沟通后,并结合企业现状制定出来的项目整体规划书,明确项目实施的具体时间、阶段任务、负责人等相关内容。
通过项目前期的规划指导项目实施双方的项目组成员完成不同的任务,并且让项目成员清楚的知道在不同的阶段,应投入不同资源,实施工作的重点不同,最终可以保证项目的质量和进度。
2项目范围双方项目小组将遵守以下确定的实施范围,任何范围的调整都必须执行本计划书第7章节规定的变更控制程序。
2.1实施企业范围(企业范围描述系统实施的主体,对于集团型企业,应将需要实施的下级单位一一列举,避免使用“客户集团及下属单位”这样的语句)企业范围是指本系统实施的主体,本实施主计划书所指项目实施的主体包括且仅限于下表所列内容:2.2(功能范围描述用户购买的系统产品模块)项目实施的系统模块包括用友ERP-NC的以下模块:2.3业务流程范围(业务流程范围描述客户需要通过系统实现的日常业务处理,在这里列举的业务不可能很详细,但要基本覆盖系统可以实现的客户的业务,由于所列内容意味着将来就要通过系统或变通实现,咨询顾问在此一定要有充分的把握,才可以将客户的业务列入下表。
对同一业务顾问和用户在初始阶段可能理解不一样,为了避免将来的纠纷,需要注明:项目实施以系统现有功能为基础,不包括外延的专项开发,如需要,应单独协商。
主数据和业务数据建模方法论一、引言随着企业信息化程度不断提升,数据已经成为企业运营和决策中不可或缺的重要资源。
而在大多数企业中,数据来自多个不同的业务系统和数据源,导致了数据的分散和冗余,使得数据不一致、不可信、难以共享。
面对这一挑战,主数据管理和业务数据建模成为企业数据管理的重要手段。
本文将着重介绍主数据和业务数据建模的方法论和实践,探讨如何有效地管理和利用企业数据资源。
二、主数据建模方法论主数据是企业中对业务运营、决策以及业务流程具有重要影响的数据,例如客户数据、产品数据、供应商数据等。
主数据管理的核心在于对这些数据进行统一、集中的管理,并确保数据的一致性和准确性。
主数据建模是主数据管理的重要一环,其方法论包括以下几个方面:1. 识别主数据:首先需要识别出企业中的主数据对象,包括客户、产品、供应商等。
这需要与业务部门充分沟通,了解业务流程,找出对业务流程影响最大的数据对象。
2. 建立主数据模型:在识别主数据对象的基础上,需要建立主数据模型,明确主数据对象之间的关系,定义数据属性和业务规则,以确保数据的一致性和准确性。
3. 制定数据标准:为了实现主数据的一致性管理,需要制定数据标准,包括命名规范、数据格式、数据唯一性要求等,确保各业务系统中使用的数据保持一致。
4. 建立数据治理机制:建立数据治理委员会,明确数据所有权、数据维护责任,制定数据治理政策和规范,确保主数据的质量和完整性。
5. 主数据集成:将各个业务系统中的分散主数据集成到一个集中的主数据存储库中,实现数据的统一管理和共享,提高数据可用性和准确性。
三、业务数据建模方法论除了主数据,企业还有大量的业务数据,如交易数据、报表数据、日志数据等。
业务数据建模是对这些数据进行整理和归纳,找出其内在的业务规则和关系,以支持企业的决策和业务运营。
业务数据建模的方法论包括以下几个方面:1. 业务需求分析:需与业务部门充分交流,了解业务需求,找出需要分析和建模的业务数据对象,明确数据的用途和价值。
主数据运营方案一、概述主数据是组织中最重要、最关键的数据,它是其他数据类型的基础。
主数据管理是指企业集中、一致地管理和维护所有部门共享的重要业务数据的一种方法。
主数据运营方案是指企业为了更好地管理和利用主数据资源,制定的一系列管理流程和技术方案。
主数据包括客户数据、产品数据、供应商数据等,它们在企业的决策、运营和管理活动中起着至关重要的作用。
因此,建立一套完善的主数据运营方案对于企业的发展至关重要。
二、主数据运营方案的目的主数据运营方案的目的是为了确保企业能够从主数据中获得准确、一致、高质量的数据,以支持企业的决策和运营活动。
具体来说,主数据运营方案的目标包括:1. 确保主数据的准确性和一致性。
主数据的准确性和一致性是基础,如果主数据存在错误和不一致,将会影响企业的决策和运营活动。
2. 提高主数据的质量。
提高主数据的质量,包括数据完整性、数据精确性和数据时效性等方面,以提高数据的可信度。
3. 改善数据管理流程。
通过设计合理的数据管理流程,确保主数据的管理和维护能够有效地运作。
4. 提高对主数据的利用率。
利用先进的技术手段和工具,提高对主数据的利用率,以支持企业的业务活动。
5. 降低主数据管理成本。
通过规范的管理流程和技术手段,降低主数据管理的成本,提高管理的效率。
三、主数据运营方案的要素为了实现以上的目标,主数据运营方案需要包括以下的要素:1. 主数据治理主数据治理是保证主数据准确性和一致性的基础。
它包括建立数据所有权、定义数据标准、制定数据访问规则等,以确保主数据得到有效的管理。
2. 主数据质量管理主数据质量管理是确保主数据质量的关键。
它包括识别数据质量问题、建立数据质量指标、采取数据质量改进措施等,以提高数据的质量。
3. 主数据管理流程主数据管理流程是确保主数据管理工作能够有效运作的基础。
它包括数据采集、数据标准化、数据存储、数据维护等,以确保主数据的管理工作得以有效执行。
4. 技术支持技术支持是实现主数据运营方案的重要保障。
用友软件实施方法论2009-03目录一)项目规划阶段 (3)1、项目内部交接 (3)2、项目启动 (3)3、项目计划 (4)二)系统建设阶段 (4)1、产品安装测试 (4)2、基础数据准备 (5)3、实施方案 (5)4、产品培训和方案培训 (6)5、数据录(导)入 (6)三)上线支持阶段 (7)1、系统上线 (7)2、运行维护 (7)一)项目规划阶段1、项目内部交接(一)工作目标和任务:1、实施与销售完成内部项目交接,让客户感到用友方部门之间的衔接与过渡;2、了解客户的基本状况、销售阶段的重要人和事;3、完成或完善《销售实施项目交接单》等内容的填写。
(二)关键活动人天:2小时1、实施经理收到销售人员的《销售实施项目交接单》后,指派该项目的实施项目经理;2、实施项目经理主动找销售代表进行沟通,了解前期售前的情况;2、项目启动(一)工作目标和任务1.成立项目组织,与客户沟通实施方法,双方就后续实施工作达成共识。
2.召集项目组成员,进行问答式的需求调研;(二)关键活动:人天:1天-1.5天1.在接到《销售实施交接单》后,给客户项目负责人电话联系,在2-3天内确定首次拜访时间,要求客户提前通知其他项目组成员到公司现场;2.首次拜访客户,跟项目负责人进行项目简单沟通;3.要求客户项目负责人将项目组成员组织到一起,给他们讲解实施方法,主要让客户了解用友的实施方法和过程,大约需要用1小时。
4.跟项目小组成员调研各部门的需求,了解企业现行的业务流程,工作量大小,重点了解是否存在特殊需求。
5.在客户现场工作结束后,准备离开客户公司时,再次拜访客户的高层沟通已完成的工作和下阶段工作。
6.将企业的调研需求整理成文档,将差异部分单独进行分析。
3、项目计划(一)工作目标和任务:1.双方项目组共同拟定一份项目实施主计划书,规划出整个项目的实施进程。
2.根据与客户沟通的结果,编制一份《项目实施主计划表》。
(二)关键活动1.根据调研情况,编制《项目实施主计划表》;2.跟客户项目经理沟通《项目实施主计划》的具体的时间安排,工作内容,让客户项目成员对计划时间和工作内容进行沟通并确认。
用友主数据规划与方法论用友软件中央大客户2013年9月目录1.1 用友主数据规划与方法论 (3)1.1.1 主数据标准化确定 (4)1.1.2 主数据流程梳理 (6)1.1.3 主数据服务规范 (6)1.1.4 主数据数据清洗规范 (9)1.1.5 主数据应用考核办法 (12)1.1.6 主数据系统接入规范 (13)1.2 主数据项目需要注意问题 (14)1.2.1 甲方项目组织保证 (14)1.2.2 数据范围确定 (15)1.2.3 系统集成 (15)1.1 用友主数据规划与方法论主数据建设首先是标准化的规划,规划就需要有方法论支撑。
用友公司主数据方法论一般按照下图步骤:1.方案制定:➢需求调研与分析➢主数据范围与标准制定➢主数据服务规范制定➢主数据集成方案制定2.平台建设➢搭建主数据平台➢数据清洗初始化➢主数据服务发布3.集成改造➢系统改造方案➢系统对接➢系统调试4.系统扩展➢主数据范围扩大➢新系统加入主数据信息资源规划强调将需求分析与系统建模紧密结合,需求分析是系统建模的基础,而业务调研又是需求分析的前提。
在进行规划的时候,首先要根据业务工作内容(而不是按照现行的机构部门)划分出一些“职能域”;然后由业务人员和分析人员组成的一些小组,分别对各个职能域进行业务个数据的调研分析,进而建立主数据信息标准和管理流程,作为整个系统建设的基础。
在做业务分析时,要注意识别主要的业务过程和核心数据,研究新的管理模式,即与管理创新相结合。
在做数据分析时,要调研分析职能域之间、职能域内部间的数据流向,只有这样细致的调研分析,才能进行科学的综合,获取相应的模型。
模型驱动的主数据规划方法,可以概括为:两条主线、三种模型、一套标准、三个阶段。
两条主线:以业务和数据为主线,分别进行业务梳理、优化、数据分析、建模工作。
业务主线强调的是职能域和业务域的划分,并以此对数据主线的分析工作进行分类。
三种模型:在系统建模阶段完成功能模型、信息模型和关联模型的建模,模型是用户需求的综合反映和规范化表达。
一套标准:即主数据信息资源标准,包括主数据的元数据定义标准、分类标准、编码规范、管理流程、共享服务标准等。
三个阶段:即基于业务主线的应用调研和业务分析阶段、基于数据主线的标准制定阶段、基于三种模型基础上的系统实施规划阶段。
1.1.1 主数据标准化确定工作目标:信息资源分类编码作为一类重要的数据资源,在信息化建设中具有重要的地位和作用,是保证现有信息系统和未来新系统建设成功的关键因素,决定着系统中的信息一致性。
分类编码原则:分类采用信息用途与业务主题相结合的分类方法,使分类体系具有业务主题的直接性和信息用途的系统性。
主数据类别的选取标准为,需要多个系统使用的,并对于系统展现效果或BI经营分析的准确度产生影响的数据列表。
主数据属性的选择标准为,根据类别实体的使用特征,选择能够确定唯一一个数据实体的属性作为唯一性属性;选择唯一性属性之外的,对实体特征进行扩展性描述的属性作为共享分类属性。
系统通过唯一性属性定位数据记录,并完成编码的分配。
本项目的信息分类将遵循下面的原则:实用性原则:从建筑业务特点出发,在保证分类系统的科学性、逻辑性的同时,将一些建筑施工业务涉及的公共信息跨越业务逻辑层次,作为公用基础信息大类列出,以期达到重点突出、降低分类难度和分类设置相对平衡的目的。
稳定性原则:在进行信息分类过程中,充分考虑到未来信息变化可能影响到信息分类结构以及编码结构的可变因素,建立的分类体系和编码结构不受新增信息的分类编码影响,以保证分类及编码具有稳定性。
可扩展性原则:考虑到航天科技庞大的业务体系,各个单位在信息分类粗细等方面存在一定的差异,本项目中分类标准在信息分类类目扩展上预留充足的空间,以保证出现新增信息时,不打乱已经建立的分类体系。
分类编码方法:在对航天科技主数据规划过程中,要依据上述原则建立企业的信息分类编码标准。
可以按照A、B、C三类编码对象来建立企业信息分类编码标准。
A类编码对象:这类编码对象具有一定的分类方法和编码规则,其码表内容一般随信息的增加而逐步扩充,很难一次编完。
这类编码对象一般在具体的应用系统中有较多的使用,如省份证号码、客户编码、员工编码、物资编码等。
B类编码对象:这类编码码表内容具有相对的稳定性,可以组织力量一次编完。
这类码表数量一般都较大,往往被多个应用系统共享,作为单独的库表管理是方便的,如国家行政区划、职称编码、生产统计项目编码等。
C类编码对象:在应用系统中有一些码表短而使用频率很大的编码对象,如人性别代码、文化程度代码、婚姻状况代码等,把这类对象统一设在一个编码库管理就可以了。
工作内容:本项目中将重点规划A类编码对象,因其贯穿于航天科技主要业务价值链中,随着业务变化而扩展,同时具有很强的流程特性,未来的主要数据分析将依据此类对象。
示例及模板:采用层次分类法,来描述具体的编码结构,如下图所示:1.1.2 主数据流程梳理工作目标:结合现有的组织架构和业务职能分工,分析现有主数据管理流程的不足之处,提出优化改进方案。
流程优化原则:在本项目中,将遵循以下的流程优化原则:⏹ 要从主数据管理的目标而非工作的过程出发,定义岗位职责;⏹ 让使用流程输出结果的人来执行流程;⏹ 将地理上分散的资源视为集中的资源来处理;⏹ 对并行活动进行连接,而不是仅仅集成其结果;⏹ 将决策点下放到基层单位活动中,并对执行过程进行控制;⏹ 尽量在信息产生的源头,一次性获取信息,并保持信息的一致性。
管理流程梳理优化方法与步骤:的主数据管理流程优化的最终目的应该是为了提升客户在价值链上的价值分配,是为了以一种新的方式为客户提供价值增加,并提升这种价值增加的程度,反映到具体的流程设计上,就是利用ESIA的原则来尽可能减少流程中非增值活动以及调整流程的核心增值活动,解决流程问题。
ESIA的具体含义如下:E-Eliminate,清除,即清除流程中非增值部分;S-Simplify,简化,即简化流程,使流程得到改进;I- Integrate,整合,即对企业流程进行整合,提升效率;A- Automate,自动化,即通过自动化手段执行流程,提升效率。
1.1.3 主数据服务规范工作目标:为了实现航天科技各级单位间的人员信息、组织信息、物资信息、项目信息等主要数据的共享使用,制定一套数据的交换标准。
工作内容:结合上述的分类编码规范以及流程规范,遵循业界标准的XML、WebService标准,定义各类主数据的数据传输格式、服务接口命名、接口参数、接口描述等。
WebService的主要目标是跨平台的可互操作性,完全基于XML(可扩展标记语言)、XSD(XMLSchema)等独立于平台、独立于软件供应商的标准,是创建可互操作的、分布式应用程序的新平台。
扩展标记语言XML是一种简单的数据存储语言,使用一系列简单的标记描述数据,而这些标记可以用方便的方式建立,虽然XML占用的空间比二进制数据要占用更多的空间,但XML极其简单易于掌握和使用。
主数据服务,大多情况下,需具备下面几点:主数据同步服务:用于接收主数据来源系统发来的创建主数据的请求。
主数据查询服务:用于根据主数据编码查询主数据信息。
主数据推送服务:用于接收主数据来源系统发来的主数据推送信息,将其放到每个接收系统对应的消息队列中,等待各接收系统来取。
主数据通知服务:主数据接收通知方法,企业服务总线调用该方法来通知接收系统。
示例及模板:可以参考下面的图表来描述服务标准。
➢服务列表:➢主数据同步服务方法列表➢主数据查询服务方法列表➢主数据推送服务方法列表➢主数据通知服务方法列表➢增加主数据方法服务名称:MdSyncService方法名称:增加主数据信息(AddMdmInfo)方法描述:增加主数据信息。
该方法用于接收主数据来源系统发来的创建主数据的请求。
如:项目系统在增加新项目时,需要调用该服务来创建项目主数据信息。
该方法会处理多种类型的主数据,所有非主数据系统直接维护的主数据,都需要调用该方法来创建主数据。
发布方:主数据系统调用方:主数据来源系统输入:注:新增主数据的格式描述详见“主数据标准格式”部分。
输出:➢企业服务总线服务规范错误代码表➢交易合同主数据报文样例<?xml version='1.0' encoding='GBK'?><root><data type=” MD_CONTRACT”>--主数据类型<ContractCode>C01120002</ContractCodeLaw><ProjectCode>01120003</ProjectCode><ContractName>测试合同</ContractName><CustomerCode>EP00000012</CustomerCode><ContractMoney>30000</ContractMoney><SignDate>2012-03-15</SignDate><StartDate>2012-03-18</StartDate><EndDate>2013-03-18</EndDate><ContractCodeLaw>LAW01120102</ContractCodeLaw></data></root>1.1.4 主数据数据清洗规范工作目标:制定一套针对航天科技相关系统的基础数据的汇总整理排重纠错的方案,保证主数据平台的初始化数据的准确性和权威性。
工作方法:数据清理是将数据库精简以除去重复记录,并使剩余部分转换成标准可接收格式的过程,从数据的准确性、完整性、一致性、惟一性、适时性、有效性几个方面来处理数据的丢失值、越界值、不一致代码、重复数据等问题。
数据清理一般针对具体应用,因而难以归纳统一的方法和步骤,但是根据数据不同可以给出相应的数据清理方法。
1:解决不完整数据(即值缺失)的方法大多数情况下,缺失的值必须手工填入(即手工清理)。
当然,某些缺失值可以从本数据源或其它数据源推导出来,这就可以用平均值、最大值、最小值或更为复杂的概率估计代替缺失的值,从而达到清理的目的。
2:错误值的检测及解决方法用统计分析的方法识别可能的错误值或异常值,如偏差分析、识别不遵守分布或回归方程的值,也可以用简单规则库(常识性规则、业务特定规则等)检查数据值,或使用不同属性间的约束、外部的数据来检测和清理数据。
3:重复记录的检测及消除方法数据库中属性值相同的记录被认为是重复记录,通过判断记录间的属性值是否相等来检测记录是否相等,相等的记录合并为一条记录(即合并/清除)。