基于航空公司数据仓库系统的测试方法分析与实现
- 格式:docx
- 大小:21.89 MB
- 文档页数:81
航空公司运行管理系统(FOC)解决方案航空公司运行管理系统(FOC)解决方案1.方案简述1.1 FOC的定义FOC(Flight Operations Control)是一个对航空公司进行运行管理的系统,它囊括了公司运行所涉及到的各部门的职能,同时还应与公司进行机务、商务管理的系统建立接口,以及与机场和空管局等相关单位的生产系统建立接口。
1.2 FOC总体结构目前,各航空公司FOC系统根据其特点会有所不同,但从总体上包括的内容基本上是一致的,下图描述了航空公司FOC系统的总体结构。
1.3 建设目标航空公司通过FOC系统的建设,基本上可以实现运行管理的自动化、规范化和信息化,具体体现在:1. 建立整个航空公司的数据仓库,对历年的航班时刻数据、飞机的性能数据、全球的导航数据、各航班的运营数据等等进行有效的管理。
一方面可以为本系统所用,同时也可以为其它系统提供数据上的有力支持。
2. 对航班运行计划进行有效的管理,确保各部门是按照同一份航班计划来工作,避免产生工作脱节现象。
3. 有效及时地监控公司航班的执行情况,并根据实际情况(如天气、延误、旅客人数等)对航班进行合理有效地调整。
4. 根据各方面汇总的信息(如油量、机组、飞机、气象、NOTAM等)对飞机进行放行评估,保障飞机飞行的安全性。
5. 建立ACARS、SITA、AFTN等报文系统的接口,提高获取信息及发送信息的效率。
6. 制作计算机飞行计划,在最大程度上节约燃油成本,保障飞行安全。
7. 对本公司飞机的飞行进行全程监控,保障飞行安全。
8. 提供多种信息的网上查询手段,为旅客提供方便;同时也为相关人员的航前准备提供方便。
1.4 系统特点安全性:通过对用户的有效管理,可有效防止非法用户登录和修改数据;通过应急系统的的设计,使主系统出现故障时仍能开展基本的工作。
可扩展性:完全按照IATA AHM和SSIM标准对系统数据结构进行设计,保证系统在今后的建设中可以基本不对目前系统进行修改;通过接口的方式,提供与其它系统的数据交换,可在必要的情况下对系统体系不做修改而增加数据的来源。
赢用辩拳Ⅵ删器■一》l基于数据仓库技术的航空公司战略决策支持系统方芳黄芳(中国国际航空股份有限公司信息管理部北京101312)[擅要]主要介绍数据仓库的定义及关键技术,结合航空公司战略决策支持系统。
描述数据仓库技术的具体实现。
[关键词]数据仓库数据集成O L A P数据集市中围分类号:G35文献标识码:^文章编号:1671--7597(2008)1110100--02一、鼍l奢在机遇与挑战并存,市场竞争日渐激烈和扩大化的今天,如何提高管理水平、减少运营成本、保持和争取客源、实现航空公司营运收益的最大化等问题已经不仅仅是各航空公司急需解决的企业竞争和发展问题,现在已变成企业市场生存的战略问题。
战略管理具有根本性、长效性,对企业可持续发展具有决定性的意义。
而任何战略的制定和战略规划的实施都需要准确、高效、全面的决策支持平台,这个平台建立的成功与否。
很大程度上决定着企业战略管理的成败。
令人欣慰的足,日新月异的信息技术为这个平台的建立提供了强有力的支持。
数据仓库技术则是其中较为有效的一种.本文着重论述了数据仓库技术在航窄公司决策支持平台上的应用。
=、数据仓库技术(一)数据仓库数据仓库(D a t a W ar ehou se,D W)是一种管理技术。
它能够将分布在企业网络中不同站点的商业数据集成到一起,为决策者提供各种类型的、有效的数据分析,起到决策支持的作用。
美国著名信息上程学家W.H.I nm on在‘建立数据仓库》一书中对数据仓库做了如F定义:“数据仓库(D at a W a r ehouse)是一个面向主题的、集成的、稳定的、包含历史数据的数据集合,它用于支持管理中的决策制定过程。
”所谓主题,它是数据归类的标准,每个主题对应一个客观分析领域,如销售状况、人事状况、整个企业的利润状况等。
它可以辅助决策集成多个部门不同系统的大量数据。
所谓面向主题,是指数据仓库内的信息是按主题进行组织的,为按-丰题进行决策的过程提供信息.所谓集成,是指数据仓库中的信息不是从各个业务处理系统中简单抽取出来的,而是经过系统加工、汇总和整理,以确保数据仓库内的信息是关于整个企业的一致的全局信息。
数据仓库中的多维模型设计与实现研究数据仓库在现代企业中扮演着重要的角色,它可以帮助企业从海量的数据中提取有价值的信息,为决策提供支持。
而多维模型作为数据仓库架构的核心组成部分,为数据分析与查询提供了有效的方式。
本文将探讨数据仓库中的多维模型设计与实现的研究。
一、多维模型概述多维模型是一种以多维思维方式组织数据的模型,它将数据组织成各种维度(Dimensions)和度量(Measures),并通过事实表(Fact Table)和维度表(Dimension Table)来建立关系。
多维模型的核心思想是以用户需要的方式组织数据,提供一种直观、灵活且高效的数据分析与查询方式。
二、多维模型的设计原则1. 精确建模:在进行多维模型设计时,要确保模型可以准确地反映业务需求。
这需要与业务人员密切合作,理解业务过程和数据要求,避免冗余和不必要的数据项。
2. 简单易用:多维模型应该具有直观的层次结构和易于理解的数据组织方式,以便用户可以轻松地进行数据分析和查询操作。
简化模型设计可以提高用户的可操作性和效率。
3. 可扩展性:多维模型应具备良好的可扩展性,能够适应企业数据规模和业务变化的需求。
当业务增长或更改时,应该能够方便地调整模型结构,以满足新的需求。
4. 性能优化:在多维模型设计时,考虑查询性能是至关重要的。
通过设计合适的索引、分区和聚合,可以提高查询的速度和效率,减少用户等待时间。
三、多维模型的实现步骤1. 数据源准备:在进行多维模型实现之前,首先需要对数据源进行准备。
这包括数据清洗、数据集成和数据转换等过程,以确保数据的质量和一致性。
2. 维度建模:在维度建模过程中,需要确定事实表和维度表的关系,并定义维度表中的维度属性。
同时,还需要确定事实表中的度量和细节级别,并定义度量的计算规则。
3. 模型设计:根据维度建模的结果,设计多维模型的结构。
这包括确定维度的层次结构、计算度量聚合和定义多维数据的面板结构等。
4. 模型实现:将设计好的多维模型实现到数据仓库中。
数据仓库中的多维数据模型设计与实现教程在数据仓库中,多维数据模型设计与实现是一项关键任务。
它不仅可以帮助企业组织和分析庞大的数据量,还能提供决策支持和洞察力。
本文将介绍数据仓库中多维数据模型的概念、设计原则以及实现方法,帮助读者全面了解和掌握这一重要主题。
一、多维数据模型的概念多维数据模型是基于数据的特征和关联性来组织数据的一种模型。
它通过将数据按照不同的业务维度进行分组和分类,将数据以多维方式呈现,从而提供了更加直观和灵活的数据分析能力。
多维数据模型主要由维度、度量和层次结构组成。
1. 维度:维度是描述业务问题的属性,它可以是时间、地理位置、产品、客户等。
维度用来描述数据的特征,例如销售额可以按照时间、地理位置和产品维度进行分析。
2. 度量:度量是可以进行数值计算和分析的数据,例如销售额、利润、数量等。
度量用来描述数据的量度,便于进行各种统计分析。
3. 层次结构:层次结构是维度之间的关系,它描述了维度之间的层次结构和上下级关系。
例如时间维度可以由年、月、日等层次结构组成。
二、多维数据模型的设计原则在设计多维数据模型时,需要遵循一些原则,以确保模型的合理性和有效性。
1. 简单性:多维数据模型应该尽可能简单,避免过于复杂的维度和层次结构。
简单的模型易于理解和维护,提高数据分析效率。
2. 一致性:多维数据模型中的维度和度量应该保持一致性,避免冗余和重复。
一致的模型有助于提高查询效率和数据一致性。
3. 可扩展性:多维数据模型应该具有良好的扩展性,能够容纳未来的需求变化和数据增长。
设计时需要考虑到未来可能发生的维度扩展和度量变化。
4. 性能优化:多维数据模型的设计也要考虑到查询性能的优化。
根据实际需求和查询模式,合理设计维度的层次结构、聚集表和索引等,以提高查询效率。
三、多维数据模型的实现方法在实现多维数据模型时,需要选择合适的工具和技术来支持模型的构建和数据的加载。
1. 数据抽取和转换:多维数据模型的实现通常需要进行数据抽取和转换,将源系统的数据转化为可用于多维模型的格式。
航空公司运行管理系统(FOC)解决方案航空公司运行管理系统(FOC)解决方案1.方案简述1.1 FOC的定义FOC(Flight Operations Control)是一个对航空公司进行运行管理的系统,它囊括了公司运行所涉及到的各部门的职能,同时还应与公司进行机务、商务管理的系统建立接口,以及与机场和空管局等相关单位的生产系统建立接口。
1.2 FOC总体结构目前,各航空公司FOC系统根据其特点会有所不同,但从总体上包括的内容基本上是一致的,下图描述了航空公司FOC系统的总体结构。
1.3 建设目标航空公司通过FOC系统的建设,基本上可以实现运行管理的自动化、规范化和信息化,具体体现在:1. 建立整个航空公司的数据仓库,对历年的航班时刻数据、飞机的性能数据、全球的导航数据、各航班的运营数据等等进行有效的管理。
一方面可以为本系统所用,同时也可以为其它系统提供数据上的有力支持。
2. 对航班运行计划进行有效的管理,确保各部门是按照同一份航班计划来工作,避免产生工作脱节现象。
3. 有效及时地监控公司航班的执行情况,并根据实际情况(如天气、延误、旅客人数等)对航班进行合理有效地调整。
4. 根据各方面汇总的信息(如油量、机组、飞机、气象、NOTAM等)对飞机进行放行评估,保障飞机飞行的安全性。
5. 建立ACARS、SITA、AFTN等报文系统的接口,提高获取信息及发送信息的效率。
6. 制作计算机飞行计划,在最大程度上节约燃油成本,保障飞行安全。
7. 对本公司飞机的飞行进行全程监控,保障飞行安全。
8. 提供多种信息的网上查询手段,为旅客提供方便;同时也为相关人员的航前准备提供方便。
1.4 系统特点安全性:通过对用户的有效管理,可有效防止非法用户登录和修改数据;通过应急系统的的设计,使主系统出现故障时仍能开展基本的工作。
可扩展性:完全按照IATA AHM和SSIM标准对系统数据结构进行设计,保证系统在今后的建设中可以基本不对目前系统进行修改;通过接口的方式,提供与其它系统的数据交换,可在必要的情况下对系统体系不做修改而增加数据的来源。
计算机科学与技术毕业设计题目基于大数据的农产品质量安全溯源系统设计基于机器视觉的H公司MES系统设计与应用研究基于RFID的工具管理系统设计基于FPGA的制冷型红外成像系统电路设计与实现数字乡村三维虚拟地理信息系统设计与实现基于射频识别的刀具信息采集与管理系统设计面向云系统性能优化的学习增强设计研究基于Niagara的HRT-120型工业机器人物联网监控系统研发基于STM32的密闭空间PM2.5检测和控制系统设计基于UBC大数据对PVC涂胶膜检测技术研究智慧城市大数据可视化云平台的设计与实现物联网环境下电梯节点状态信息的图像采集与识别系统设计物联网环境下基于安全防控的智能锁系统的设计煤矿井下高压防越级保护系统设计与实现基于嵌入式的湖羊产前行为特征分析及其监测系统研发工程文档管理信息系统设计与实现——以S建筑公司为例全自动智能洗车机控制系统设计与研究基于区域似大地水准面格网模型的高程异常插值系统开发研究建筑配电动态无功补偿装置设计基于迁移学习的草莓果实白粉病识别研究与应用基于Web技术的金川公司三矿区通风管理系统研究基于微信小程序的智能推荐点餐系统的设计与实现智慧景区旅游应急指挥中心设计面向目标跟踪的物联网时空数据处理技术研究与实现基于云服务的智能语音技术在智能家居中的应用基于深度学习的烟雾视频检测系统研究与开发基于姿势引导生成对抗网络的行人再识别系统设计与实现无线可充电传感器网络充电调度算法研究与应用分布式级联长周期光纤光栅解调复用的系统设计实现云环境下微服务发现及降级优化技术研究基于RSSI和相位的RFID室内定位技术研究与应用容器化关系型数据库I/O消耗性能优化研究无人驾驶中行人检测算法及其安全性研究面向步态变化场景的智能终端身份认证研究基于高速公路违章检测的无人机地面站的设计实现基于群组认证的RFID安全协议研究基于MMTD的虹膜图像处理基于大数据的用户行为日志系统设计与实现面向物联网终端设备的蜜罐捕获系统设计与实现文档共享转换服务器的设计与实现基于网络编码的D2D视频传输技术研究面向智慧城市的基站网络流量预测方法与系统实现基于UWB的室内测距与定位系统10千伏配网环网柜消缺辅助系统的研究基于改进随机森林算法的P2P贷前信用风险评估方法研究基于移动支付软件党费收缴管理系统的研究基于云计算的电商商品查询推荐系统设计与实现基于时空轨迹大数据的路线规划机制的研究与系统构建基于云U8的面向化工行业的ERP系统设计与实现基于Spark的物流园区拥堵预测系统设计与实现基于Web GIS的H市矿山信息管理系统设计与实现四川移动公司党组织信息管理系统的设计与实现规约驱动的片上系统一致性检测研究触发脉冲采集式三维超声成像系统设计与实验研究基于ZigBee的无线传感器网络定位技术研究基于ZigBee技术的共享社区智能控制系统的设计与实现信安集团集采管理系统的设计与实现油气试采设备动态管理系统研究能投股份公司电力物资管理系统设计与实现基于Web的心理测评系统设计与实现可穿戴设备的太阳能微能量采集与管理研究出入境涉外信息管理系统的设计与实现科技词条库建立方法研究与实现金融产品销售系统设计与实现嵌入式机房环境监控系统的设计与实现YOLOv4网络辅助的四足机器人森林盲区巡检技术研究基于单目视觉的前车碰撞预警系统设计与实现基于Hive的购销数据仓库系统的设计与实现基于半物理仿真驱动的客运车辆关键性能虚拟测试技术研究药品招标采购系统设计与实现基于LabVIEW与PLC的液压缸试验台控制系统设计网络媒体舆情检测与分析系统设计与实现基于MVC架构的公文流转系统的设计与实现基于工作流的会议和督办管理系统的设计与实现移动医疗APP的设计与实现基站测试数据分析系统设计与实现基于高速公路复合通行卡智能管理系统的研究与实现电力公司非现场审计系统的设计与实现电力工程建设监理公司财务信息审计系统的设计与实现税务局查账系统的设计与实现95598电力客户服务辅助系统的设计与实现基于的配网项目管理系统的设计与实现电网运营监测系统设计与实现基于Java的图形化配网调度运行管理系统设计与实现国网四川管培中心物资管理系统的设计与实现基于B/S模式的教务管理系统的设计与实现变电站电力设备运行管理系统的设计与实现基于北斗的全域旅游景区综合管理平台设计与实现基于泛渠道拓展线上线下协同系统的设计与实现航空企业信息编码系统设计与实现航空发动机维修过程数据自动化采集系统设计与实现行波管机械加工工艺资料管理系统设计与实现行波管零部件生产管理系统设计与实现基于Spring技术的政府机关文档管理系统的设计与实现会展参展商管理系统设计与实现自动小车存取系统优化运行关键问题研究面向通信企业的新闻信息聚合平台设计与实现基于对抗网络的跨领域关系抽取研究与实现应用驱动的虚拟网络切片计算与维护关键技术研究基于无线传感器技术的水环境监测系统设计与开发基于贝叶斯网络和支持向量机的网络安全态势评估和预测方法研究面向自动驾驶场景的高效实时语义分割方法研究基于机器学习的算法设计以及在智能系统中的应用基于神经网络的大规模MIMO混合波束赋形研究基于卷积神经网络的动态手势识别研究基于深度学习的发票识别研究基于深度学习算法的室内可见光通信系统光源布局的动态优化基于上下文信息聚合的语义分割与目标检测算法研究基于双流神经网络的光谱反卷积算法研究基于深度学习的光学字符识别技术研究边缘计算设备中神经网络适配及其手写体识别基于加密神经网络的脑电分类控制研究及实现基于膨胀卷积和视觉注意的目标检测及应用基于DBN与ELM算法的入侵检测研究无线传感网络中GEAR路由协议的研究与改进基于深度学习的行人自遮挡检测及应用基于机器学习的搜索排序算法的研究名址分离网络中映射系统的研究基于轻量级深度学习框架的IP骨干网络流量实时预测研究基于深度学习的稀疏角CT重建研究基于深度学习的图像去雾算法研究面向配体虚拟筛选的深度迁移学习方法研究基于深度学习的高铁移动通信信道预测和信号检测研究基于深度学习的视频人脸表情识别研究深度神经网络测试用例选择技术基于卷积神经网络的视频密集群体行为识别基于卷积神经网络的CT图像金属伪影研究基于RFID技术的室内定位方法研究基于RSSI的无线传感器网络的节点与目标定位优化算法研究基于深度学习的人体姿态估计关键技术研发基于深度学习的非完备信息博弈局面信息自动获取系统基于数据挖掘的入侵检测方法的研究基于自动编码器的入侵检测系统研究与实现基于内容识别的P2P视频流检测系统基于Tesseract-OCR的古代汉语文字识别方法的设计与实现基于私有信息的跨领域场景识别基于自动编码器的健身方案推荐系统及应用基于人脸识别的乒乓球智能训练平台设计面向家居场景的跌倒行为分析技术研究与实现基于在线社会网络的用户情感分析研究与实现在线学习中视频交互行为的影响因素研究基于概念抽象水平的文本推荐区块链共识机制的研究与改进面向指静脉识别系统的ROI提取算法研究基于“互联网+”的无车承运人平台设计与实现面向物联网终端设备的蜜罐捕获系统设计与实现基于离散事件模型的Tile体系结构指令集研究5G-NR高速移动场景下多普勒频偏估计方法研究基于能量采集的D2D通信资源分配算法研究基于SDN的网络资源管理方法研究。
一、需求分析:一、应用背景:运输业是国家经济的一个重要的组成部分,其发展水平已经成为一个国家和地区综合实力的重要体现。
随着经济全球化,我国对物流的需求将大幅度的增加,物流将呈现跳跃式发展趋势。
企业开始改变那种以商品为导向的观念,开始注重发掘,通过收集整理繁多的信息,量化分析需求,提供优质的售后服务,保持稳定的关系等措施,来加强对客户关系的管理。
CRM的主要含义就是通过对详细资料的深入分析,来提高满意程度,从而提高企业的竞争力的一种手段,CRM最大程度地改善、提高了整个关系生命周期的绩效。
CRM整合了、公司、员工等资源,对资源有效地、结构化地进行分配和重组,便于在整个关系生命周期及时了解、使用有关资源和知识;简化、优化了各项业务流程,使得公司和员工在销售、服务、市场营销活动中,能够把注意力集中到改善关系、提升绩效的重要方面与核心业务上,提高员工对的快速反应和反馈能力;也为带来了便利,能够根据需求迅速获得个性化的商品、方案和服务。
要在激烈的市场竞争中获得主动,越来越多的民航企业把保持客户作为企业的重要任务,谁能留住那些能给企业带来丰厚利润的关键客户,并获得他们长久的信任和支持,谁就能获得满意的回报,进而赢得持续的竞争优势。
在航空业,客户关系管理的应用有其特别的原因。
面对航空公司的管理需求,急需引入先进的客户关系管理理念。
在航空公司引入电子商务后,公司关注的重点由提高部效率向尊重外部转移。
而CRM理念正是基于对客户的尊重,要求公司完整地认识整个客户生命周期,提供与客户沟通的统一平台,提高员工与接触的效率和反馈率。
随着“以客户为中心"的客户关系管理技术在航空业的不断应用和发展,航空服务质量的改善提高的同时,产生了大量的客户数据,充分挖掘这些数据中隐藏的有用信息可以为航空公司的经营决策带来极大的帮助。
二、应用价值与意义:概括来讲,数据仓库与数据挖掘在航空公司CRM中的商业价值主要体现在以下三个方面:1、有助于航空公司提高收益一个成功的CRM系统可以给航空公司带来明显的收益增长,在客户的整个生命周期,最大化利润贡献。
基于航空公司数据仓库系统的测试方法分析与实现基于航空公司数据仓库系统的测试方法研究与实现摘要摘要在航空公司的信息化建设过程中,先后实施了多个应用系统,覆盖业务、办公、管理、决策支持等领域。
随着航空公司的高速发展,单一的以支持某一种业务运作为目的的计算机系统已经不能够满足其数据需要。
因此需要一套数据仓库系统帮助航空公司有效地组织和存储数据,并将信息转化为知识。
如何确保这套数据仓库系统的数据正确性,成了数据仓库测试需要完成的重要任务。
首先简要分析了数据仓库系统测试的现状,以及数据仓库系统测试目前存在的问题。
接着,从数据仓库系统与其他系统的不同点出发,分析出数据仓库测试的内容与特殊性。
将数据仓库测试的内容分为ETL测试、界面功能测试和性能测试三部分。
在此基础之上,针对航空公司数据仓库系统的需求和设计,通过对各种测试方法的分析制定出适合的测试方法及测试策略。
以常旅客数量分析这一领域为例,针对数据仓库系统测试的三部分内容介绍了测试用例设计及实现的过程。
与此同时,介绍了缺陷的处理过程,特别是针对数据质量问题及ETL编码问题的分析处理。
最终总结了测试结果及展望。
关键词数据仓库,联机分析处理,ETL,MappingABSTRACTofDuring the informationizationconstruction of Airline Company ,a lotapplications havebeen used , suchas business application ,OA(Officethe Automation),MIS(Management Information System)and SO on·But with1s not enougnhigh speed of the company’ s development ,this kind of systemS needed .Itfor data use any more .So a systembased on data warehouse I and it alsocan help the company to organizeand store data effiently , 1t’ S a Verycan help to transfer the informationto knowledge·Then1simportant thing to make surethe data the application suPPnedcorrect .That’S the responsibility for the testing·Firstlv ,the recent situat ion and the the problems of data warehouseof datasvstem test ingare introduced .Secondly ,the features and contentswarehouse test ingare anal ized based on the statements of the differences lcatlon Justbetween the application based on data warehouse and the applfunctionbased on database .Thecontents of the testing are ETL testing ,UIandtesting and performance testing .Focus on the business requlrementstest strategythe svstem design of the application ,thetest method andmethods·The wholeprocess are decided via comparing manykinds of testIS introduced of test cases designing and executing for the three contentshv taking the field aboutanalisis of customer’ s number 士or example·Meantime ,the process of dealingwith defects is introduced ,especlaliyresult and thefor data quality and ETL coding problems 。
Finally ,thefuture of the testing are summarized .Keywords Data Warehouse ;OLAP ;ETL ;MappingIV基于航空公司数据仓库系统的测试方法研究与实现第一章引言第一章引言随着信息技术的广泛应用,企业的运营变得更加高效和灵活,但同时也带来了“数据爆炸”的问题,许多遗留下来的历史数据被束之高阁,人们面对浩如烟海的数据显得手足无措,如何有效地组织和存储数据,把其内部隐藏的信息转化为商业价值,为企业效益提供服务成为决策者们迫切关心的问题。
而数据仓库作为高效集成、管理数据的技术,为各级决策者洞察企业的经营管理状况,及时发现问题,为提高决策水平提供了基础,因此,数据仓库逐渐被越来越多的企业应用。
经过多年的发展,航空公司在信息化建设上取得了很大的成绩,除了网络等基础设施建设之外,先后实施了多个应用系统,覆盖业务、办公、管理、决策支持等领域,较好地支持了航空公司的生产经营和管理。
随着航空公司的高速发展,日常运作和经营管理对企业信息化建设的要求也越来越高,因管理提升而迅速出现的相关需求越来越多。
单一的以支持某一种业务运作为目的的计算机系统已经不能够满足公司内部横向的数据需求,跨业务数据需求逐渐出现越来越强烈的趋势。
同时,不断提升的企业管理和市场竞争、安全管理等管理领域对获得具备综合分析和决策支持能力的应用系统的需求也越来越强烈。
在这种背景下,航空公司启动了公司数据仓库建设,希望通过利用先进的信息技术来解决目前公司信息化中的一些问题,提高公司的核心竞争能力。
因此,通过对数据仓库系统测试方法的研究与实现,能够帮助航空公司数据仓库系统在满足需求的同时保证数据的质量,这是非常有实际意义的。
1.1数据仓库系统测试现状数据仓库的测试是确保基于数据仓库的系统满足客户需求的至关重要的环节。
而就目前而言,大多数数据仓库系统面临的最突出问题是数据质量问题,例如数据不一致、数据不完整、数据错误等。
因此研究如何通过测试在最大程度上保证数据仓库系统的数据质量是非常有意义的。
但是,业界目前对数据仓库系统测试并没有统一的标准和流程。
面对复杂的数据仓库系统,常常使测试人员手足无措。
而目前已经涉足数据仓库测试的案例中,测试的结果与效果并不尽如人意。
对于这一较新的领域,如何做好其测试乃至如何高效的做好其测试,还是需要投入更多时间和人力进行研究。
1.2数据仓库系统测试存在的问题借鉴其他数据仓库测试的案例,这里总结了一些目前数据仓库测试存在的问题:1.测试策略的制定不够完善在测试进行前,需要制定完备的测试策略,选择适合数据仓库系统的测试方法,但是由于对于数据仓库系统测试方面的经验并不多,导致在制定测试策略时并不能考虑的十分周到。
测试策略会对整个测试过程起到指导性的作用,如果测试策略制定的不好,势必会影响到测试的效果。
2.详细设计文件分析不够透彻在分析详细设计时,经常会缺少一些关于ETL的详细设计资料,导致测试人员无法全面的分析源文件,对以后的测试策略制定及测试设计工作造成不好的影响。
3.缺陷分类不够科学测试执行时,准确的状态报告过程是经常被忽略的一个方面。
目前,对于缺陷的跟踪过程已经有了很完整的体系,而如何准确的将缺陷分类却是让人头疼的一件事情。
学术界已经对缺陷的分类有了较全面的分析,但是如何选择却成了难点‘¨。
4.数据质量问题带来困扰数据质量问题对于数据仓库系统来说是一个不可避免的问题。
由于数据仓库的数据可能来自不同的系统,客户提供的数据来源中,两个系统的数据就很可能存在不一致的情况,比如同样是乘机人数,某个航班的数据在他们的乘机系统里和结算系统里就可能不一样;或者我们需要用作分析的某个字段它的数据不全,比如常旅客分析里可能会需要常旅客的居住地做分析,但是以前的系统里可能觉得这个因素不必要,就没有设成必选选项等等。
5.生产环境的不同步导致测试误差通常测试数据库并非正式运行环境的数据库,所难免会存在一些误差;同时,ETL工具如Informatica中针对测试数据库和正式环境数据库也有可能是分开的两套环境,因此也会产生误差。
6.后期的变动导致测试前期工作的无效从生命周期和质量的角度来看,增量测试是测试数据仓库的最好办法。
这从本质上意味着丌发团队会从开发过程的早期开始,将各种小组件交付给测试团队。
但是如果情况变动比较频繁,早期进行的测试开发可能大部分都会被废弃乜1。
本文后面的章节将会对这些问题提供较好的解决方案。
21.3本文的主要内容本文以数据仓库系统测试现状展开,总结了数据仓库系统测试在现阶段存在的各种问题,引出本论文的意义,即本论文将对这些问题提供解决方案。
数据仓库系统的测试之所以有难度归根到底还是因为数据仓库系统的特殊性。
因此在分析了数据仓库系统的特殊性之后,发现其中最关键的部分是在ETL 部分。
而数据仓库测试的重点及难点也就在于ETL部分的测试。
分析出了测试重点与难点后,如何在实际应用中做好测试,还是要从具体的系统中得到验证。
因此,对于航空公司数据仓库系统的需求与设计的分析还是必须的,在此基础之上制定出可行的测试策略和测试计划,即需要对核心层、多维层的Mapping以及界面功能点进行重点测试,性能测试相对而言就不是特别重要的。
对于Mapping设计文档的分析是重中之重,有了Mapping设计文档做指导,才能写出测试用例中的SQL语句用于测试ETL运行前后数据是否一致。
有了测试策略和计划后,再进行功能测试和性能测试用例的编写,然后进行测试用例的执行。
这一系列过程中,都是以航空公司数据仓库系统市场分析部分的常旅客数量分析领域为例进行叙述的。
最后总结了整个航空公司数据仓库系统的测试结果、遗留问题及展望。
总体上航空公司数据仓库系统测试的结果是令人满意的。
1.4本文的篇章结构本文共分七章,首先简要介绍了论文的背景情况,引出了本文所作的主要工作内容。