基于数据仓库的决策支持系统框架
- 格式:pdf
- 大小:123.85 KB
- 文档页数:4
本 科 生 毕 业 论 文(设计)题目 数据仓库和数据****************************与学号 某310********00指导教师 某年级与专业 2011级行政管理所在学院 公共管理学院大学本科生毕业论文(设计)诚信承诺书姓名只有两个字的,中间空出一个汉字符,e.g. 李 某“姓名、学号、指导教师、年级与专业、年月日”均用四号宋体打印,不得手写,各栏目下划线需统一长度题目采用宋体三号加粗打印,不得手写封面统一用白色铜板纸1.本人重地承诺所呈交的毕业论文(设计),是在指导教师的指导下严格按照学校和学院有关规定完成的。
2.本人在毕业论文(设计)中引用他人的观点和参考资料均加以注释和说明。
3. 本人承诺在毕业论文(设计)选题和研究容过程中没有抄袭他人研究成果和伪造相关数据等行为。
4. 在毕业论文(设计)中对侵犯任何方面知识产权的行为,由本人承担相应的法律责任。
毕业论文(设计)作者签名:年月日一、毕业论文二、文献综述三、开题报告四、外文翻译摘 要本文总结了数据仓库和数据挖掘技术的研究及其在企业管理决策支持系统中的应用,在此基础上提出了市自来水公司生产和销售两大主题的数据仓库概要设计。
为了解决自来水公司的供销差异和客户服务问题,研究中结合地理信息系统提出了管网计算模型和求解方法,*****************************************研究中得到的结论有:1.数据仓库和数据挖掘技术正在被越来越多的需要处理海量数据的企业所应用,数据仓库尤其是数据挖掘技术成了支持企业决策分析和改善企业管理的重要工具。
2.***********************************************。
3.*******************************************。
4.******************************************。
第一章引言1.1 问题的提出我国的电信业,尤其是移动通信业,起步比较晚,但发展非常快,对许多业务的决策和方向的把握都是在摸索中进行的,某些立项缺乏统一意见和充足的科学依据,带有一定程度的盲目性。
另一方面,经过多年运营,积累了庞大的业务数据,如计费中心的计费数据、客服中心的用户信息数据等,这些海量数据中包含着宝贵的经验和商业信息,可以很好地拿来借鉴今后的业务运作。
但是这些数据信息隐藏在庞大、复杂的数据库里面,许多有价值的信息并没有直接表现出来,而是掩盖在无聊的数据后面。
多数情况下,我们不得不用到某些分析工具,以期取得丰富而又客观翔实的商业信息,用于开发更大的市场和提供更完善的服务。
到目前为止,电信业尚无比较完备的分析工具,然而另一方面,电信业又面临着许多急于解决的问题,如:话费流失问题、新业务开展问题、基站分配问题、批价问题等等。
以话费流失为例,我国电信业每年仅此项损失就达数亿元人民币之巨,基本上无法追回。
如何尽快避免或尽量减免这一损失,就显得极为迫切和必须。
在这种背景下,数据仓库技术以及其上的一些分析挖掘工具就应运而生了,如联机分析处理、数据挖掘等等。
决策支持系统(DSS-Decision Support System)是70 年代由美国M.S.Scott Morton 提出,迅速发展起来的新型学科。
决策支持系统是综合利用大量数据,有机组合众多模型(数学模型与数据处理模型等),通过人机交互,辅助各级决策者实现科学决策的系统。
数据仓库DW(Data Warehouse)建立在传统事务型数据库的基础之上,为企业DSS 及数据挖掘系统提供数据源。
它从原事务数据库中将分析型数据与事务型数据相分离,单独存放而形成数据集合。
数据仓库就是要把分散存放在企业各个地方的数据集中到一起,并利用这些数据制定出更好的决策。
联机分析处理 OLAP(On Line Analysis Processing)是数据仓库上的分析应用工具。
构建基于数据仓库的医院辅助决策支持系统目前,多数医院对于医院信息系统数据的后期处理基本处在基于数据库技术的查询、统计的事务性操作上,这些统计查询分析并不能对医院的业务流程优化、成本控制乃至医院的长期发展提供数据支持,更不能为医院决策者提供数据支持。
兰州大学第二医院构建了基于医院信息系统数据仓库为基础的辅助决策支持系统,为医院管理决策者提供了数据支持.【关键词】数据仓库决策支持医院信息化1 概述医院决策支持系统不应该是单纯的事后统计,它必须与医院管理紧密相连,做到事前评估、事中监控、事后分析。
医院决策支持系统必须和医院业务环环相扣,其所分析的数据必须能够为医院的实际发展提供支持和导向。
下述实例,列举了医院决策支持系统在实际运行中应该为医院提供的数据支持和医院管理层的实际需求指标: 1。
1 医院门诊综合需求医院门诊新大楼完工并投入使用,预计每天可增加500—800门诊量,那么该医院每天应该产生放号信息有多少,应该安排多少医生出诊、应该设置多少个挂号和收费窗口,门诊药房的配药发药压力是否会大幅度上升等等。
1.2 医院平均住院日分析平均住院日是评价医院效率和效益、医疗质量、技术水平及管理水平的硬性综合指标,医院应该在确保医疗质量和医疗安全的前提下尽量缩短平均住院日。
1.3 医院就诊流分析患者仅挂号,医生无诊断、无医嘱或者医生下过医嘱,患者并未按照医嘱缴费并接受治疗。
以上两种人群是医院病人流失的主要原因,如何及时分析原因并采取正确的措施,减少医院损失。
1.4 医院高值耗材相关分析通过数据挖掘,找到每种高值耗材在医院的使用情况,各科室使用分布、人群使用分布,针对使用高值耗材病人往往医疗费用较高,通过监控该病人的医保支付情况,及时与病人沟通,减少欠费及医患纠纷的风险。
1.5 医院大处方及合理用药通过对大处方的处方类型(一般情况下,抗菌类处方占大多数)、病人诊断、开单医生进行汇总分析,控制医药合谋以及医患合谋;基于处方点评子系统,分析各科室处方点评率、处方合格率,对问题处方的原因进行分析,并采取有效整改措施,减少由于医疗质量问题带来的医患纠纷。
基于数据仓库的宏观经济决策支持系统的设计与实现的开题报告一、选题背景随着信息技术的飞速发展,数据量呈现爆发式增长,企业和政府等机构需要从大量的数据中提炼出有价值的信息,作为制定决策的依据。
宏观经济决策是指国家及地方政府对全国或区域经济走势、发展方向和政策等方面的制定和实施。
宏观调控需要有相应的数据支撑,这其中包含了宏观经济基础数据和各行业/领域的具体数据,主要内容包括宏观观测数据、产业数据、社会数据等。
因此,数据仓库作为一个大型、集成、组织的数据存储系统,可以强有力地支持宏观经济决策的制定和实施,在提高经济管理水平和效率方面具有重要的作用。
二、选题意义数据仓库可以提供高质量的数据来源,并且可以将各部门的数据进行整合,以支持政策制定者更好地管理和分析政策影响。
在设计和实现一个基于数据仓库的宏观经济决策支持系统时,考虑到机构或部门之间的协作和信息共享,可以弥补传统业务系统的缺陷。
三、研究目标和内容本研究的目标是设计和实现一个基于数据仓库的宏观经济决策支持系统,以为政策制定者提供更具洞察力和预见性的数据,以帮助决策者作出更准确、更可靠的宏观经济决策。
本研究的具体内容包括:1. 分析宏观经济决策支持系统的需求。
在对宏观经济决策过程进行深入了解后,确定该系统的功能、组成和要求。
2. 设计基于数据仓库的宏观经济决策支持系统模型。
在分析需求的基础上,设计该系统的模型,包括系统结构、数据处理流程等。
3. 实现宏观经济决策支持系统。
实现系统的各项功能和模块,包括数据提取、转换、加载(ETL)、数据清洗、数据挖掘和分析等。
4. 验证系统的性能和效果。
对系统进行全面测试和评估,确定系统的性能和效果,并提出改进措施。
四、研究难点和挑战1. 数据来源、数据清洗和数据质量问题。
数据的准确性、完整性和一致性对系统性能和效果具有重要影响。
2. 业务逻辑和方法的设计问题。
系统的功能、组成和要求需要进一步明确,以确定系统的业务逻辑和方法。
2000年4月系统工程理论与实践第4期 文章编号:100026788(2000)0420027204基于数据仓库的决策支持系统框架谢 榕(武汉测绘科技大学城市建设学院,湖北武汉430070)摘要: 数据仓库技术是在充分地开发信息资源的迫切要求下产生并迅速发展起来的一个国际前沿研究新领域Λ本文分析传统决策支持系统开发中存在的问题,探讨数据仓库技术在决策支持系统建立中的应用,提出基于决策支持系统的基本结构框架,并讨论系统建立中数据仓库的数据组织与设计、数据挖掘层次空间的建立、知识发现方法等技术关键,最后进一步阐述系统的建立方法Λ关键词: 数据仓库;数据挖掘;知识发现;决策支持系统中图分类号: T P391 αA F ram ew o rk of D ecisi on Suppo rt SystemBased on D ata W arehou seX IE Rong(Schoo l of U rban Studies,W uhan T echn ical U n iversity of Su rveying and M app ing,W uhan430070) Abstract: T he paper analyzes som e p rob lem s in traditi onal decisi on suppo rt system.Itdiscu sses how to app ly data w arehou se to decisi on suppo rt.T he paper p resen ts systemarch itectu re of decisi on suppo rt system.It also p resen ts som e key p rob lem s such aso rgan izati on and design of data w arehou se,level space of data m in ing,and m ethods ofknow ledge discovery.F inally,it summ arizes estab lishm en t m ethods of the system.Keywords: data w arehou se;data m in ing;know ledge discovery;decisi on suppo rtsystem1 引言自从1954年计算机用于工资处理以后,信息处理得到快速发展Λ一般认为,信息处理大致经历了三个发展阶段,即数据处理系统、管理信息系统和决策支持系统Λ信息处理逐步从集中式走向分布式,由孤立系统转向集成系统,由部门职能管理发展为企业决策支持Λ1971年,美国Go rry、M o rton等人首次提出“决策支持系统D SS(D ecisi on Suppo rt System)”术语[1],标志着决策支持理论研究开始Λ80年代初期,关系数据库技术日益成熟,决策支持研究得到进一步深化,出现了基于关系数据库的“三库”和“四库”结构的决策支持系统Λ80年代后期,决策支持系统与专家系统结合,出现了智能决策支持系统的研究热潮Λ然而,决策支持系统也面临着其发展上的巨大障碍,投入应用的成功实例并不多Λ分析原因主要有以下几个方面:1)决策支持涉及大量历史数据和半结构化问题Λ在传统数据库管理系统基础上建立决策支持系统只能提供辅助决策过程中的数据级支持,难以求解复杂的半结构化决策问题Λ2)决策支持系统以集成数据为基础Λ然而现实中的数据往往分散管理且大多分布于异构的数据平台,数据集成不易Λ3)决策支持系统的建立需要对数据、模型、知识和接口进行集成Λ数据库语言数值计算能力较低,因而采用数据库管理技术建立决策支持系统知识表达和知识综合能力比较薄弱,难以满足人们日益提高的决策要求Λα收稿日期:1998212204资助项目:中荷D SO项目资助(9831)90年代初,数据仓库(D ata W arehou se )技术的发展给以上问题的解决带来了新的契机Λ数据仓库将来自各个数据库的信息进行集成,从事物的历史和发展的角度来组织和存储数据,供用户进行数据分析,并辅助决策支持[2,8],成为决策支持的新型应用领域Λ由于数据仓库理论与技术的研究与开发尚处于起步阶段,用于决策支持还有许多特殊的问题急待解决,下面本文着重探讨数据仓库技术在建立决策支持系统中的理论框架Λ2 系统基本结构框架图1 决策支持系统的基本结构框架我们提出一种基于数据仓库的决策支持系统基本结构框架如图1所示Λ它由数据库、数据仓库、数据仓库管理模块、数据挖掘工具、知识库、知识发现模块、人机交互模块组成Λ系统的主要输入是数据库中的数据以及知识库中的知识和经验Λ数据仓库管理模块完成数据仓库的创建以及数据仓库中数据的综合、提取等各种操作,负责整个系统的运转Λ数据挖掘工具用于完成实际决策问题中的各种查询、多维数据分析和数据开采等Λ知识发现模块控制并管理知识发现过程,将数据的输入和知识库中的信息用于驱动数据选择过程、知识发现引擎过程和发现的评价过程Λ人机交互模块则通过自然语言处理和语义查询在用户和系统之间提供相互联系的集成界面Λ在图1中箭头方向为控制流Λ决策支持同数据仓库管理是密切联系的Λ用户发出决策请求命令后,通过数据挖掘工具触发数据仓库管理模块从数据仓库中获取与任务相关的数据Λ被选择的数据经过知识发现模块中知识发现引擎抽取算法处理,生成辅助模式和关系Λ这些模式和关系被评价后,它们中的一些被认为感兴趣的数据将提供给决策部门应用,有些发现则加入到知识库中,用于后继的知识发现和知识评价Λ因此,建立决策支持系统关键性的问题在于如何创建数据仓库、如何从数据仓库中发现知识以及如何向用户解释和表达知识Λ图2 数据仓库的基本逻辑结构3 数据仓库的数据组织与设计数据仓库为决策支持系统提供了可取的数据组织方式Λ信息系统中涉及的数据主要来自部门内部具体的日常业务数据,一般数据库可对其进行处理,这类数据又称为基本数据Λ而决策所需信息是通过基本数据所体现的整体趋向或随时间变化而表现出来的变化趋势,必须对基本数据进行分类、析取、归纳、加工等处理才能得到这些信息Λ基本数据在时间控制机制下生成历史数据,在综合机制下生成综合数据Λ此外决策支持还需要运用部门外部数据Λ以上数据与外部数据共同构成数据仓库的信息源Λ通过建立提取器(Ex tracto r ),将来自信息源的、影响数据仓库的数据转化为数据仓库模式Λ当信息源中数据发生变化时,集成器(In tegrato r )对信息进行过滤、总结,并和其它信息合并,把新的信息集成到数据仓库中Λ数据仓库的基本逻辑结构如图2所示Λ逻辑上,一个完整的数据仓库由以下四部分定义:1)仓库设计部分Λ它负责数据仓库环境的定义和设置Λ2)数据获取部分Λ它从外部数据源析取和变换数据,使它们以数据仓库的方式组织和存储Λ3)数据管理部分Λ它完成数据更新、仓库例行维护以及分布数据的管理Λ4)数据访问部分Λ它面向最终用户,在决策支持系统中,向决策者提供决策信息及分析报告Λ82系统工程理论与实践2000年4月4 数据挖掘与知识发现4.1 数据挖掘(Da ta M i n i ng )的基本特点从信息源获取信息,并将它们组织集成到数据仓库,其目的在于对数据仓库中的数据进行分析和综合,数据挖掘是一种有效的工具Λ它从数据库中提取人们感兴趣的数据模式、数据的普遍关系及其一些潜在的、事先未知的数据特征[3,4,9]Λ概括地说,数据挖掘是在数据仓库的基础上进行知识发现(Know ledgeD iscovery ),因此这一技术在决策支持方面具有广泛的应用[7]Λ概括起来,它具有以下特点:1)数据挖掘需要对大量数据进行处理;2)对用户不能形成精确的查询要求,依靠数据挖掘寻找用户可能感兴趣的信息;3)它把大量的原始数据转换成有价值的知识,用于描述过去的趋势和预测未来的趋势;4)数据量增长快速,数据挖掘能快速地作出响应,提供决策支持信息Λ4.2 数据挖掘的层次空间的建立图3 数据挖掘的层次空间从应用深度上,将数据挖掘划分为三个层次空间(如图3所示):1)数据空间Λ它利用现有数据库管理系统的查询检索功能,进行基于关键字的信息查询,实现联机事务处理OL T P Λ2)聚合空间Λ利用聚集运算(Sum 、A ve 、M ax 、M in ),结合多维分析和统计分析,实现在线分析处理OLA P Λ3)影响空间Λ按照相似性的聚类、差异性的分类方法,发现关联性、相似时序、结构模式,从数据库或大量数据记录中发现隐含的有用信息,这是在更深层次上的知识发现,是数据挖掘实质性内涵Λ以上数据挖掘的各个层次空间反映了不同级别的查询请求,这种划分有利于知识的逐步提取,建立知识层,知识的提取过程即为决策支持过程Λ在传统决策支持系统中,知识库中的知识和规则由专家或程序人员建立的,从外部输入,而数据挖掘是从系统内部自动获取知识的过程Λ同数据库管理系统查询检索的信息相比,数据挖掘的知识是隐含的、精练的和高水平的Λ5 知识发现方法研究数据挖掘的知识通常表现为概念、规则、规律、模式、约束和可视化等形式Λ这些知识经过解释后可以直接在实际系统中应用,用以辅助决策过程,或者提供给领域专家,修正专家已有的知识体系,也可以作为新的知识转存到应用系统的知识库中Λ发现的过程是使数据挖掘利用各种知识发现算法从数据库中发现、表达、更新和解释有关知识Λ5.1 基于关联规则(A ssoc i a tion Rules )的知识发现数据关联是数据库中存在的一类重要的可被发现的知识[5]Ζ若两个或多个变量的取值之间存在某种规律性,则称为关联Ζ数据间的关联通过关联规则表示,其形式为:A 1∧A 2∧…∧A i →B 1∧B 2∧…∧B j Ζ如果B 1,B 2,…,B j 出现,则A 1,A 2,…,A i 一定出现,这表明数据A 1,A 2,…,A i 和数据B 1,B 2,…,B j 之间存在某种联系Ζ关联分析采用关联规则归纳技术找出数据库中数据项(属性,变量)之间内在隐藏的关联网Ζ5.2 不确定性知识的表达人们对事物的判断、预测和决策是在问题域的信息不完全、不精确或者模糊的条件下进行的Ζ粗集理论作为一种智能数据决策分析工具,被研究并应用于这种不确定性的知识获取和知识表达中Ζ它通过构造描述领域知识的概念集A ={a 1,a 2,…,a n },a i ∈A ,由系统的事实库形成对象集E ={e 1,e 2,…,e m },e j ∈E ,基于分类集P 和对象集E ,对E 经过一定的操作产生核t c (P ,E )和包络t e (P ,E ),从而形成该问题的一个粗集[t c (P ,E ),t e (P ,E )],构成不确定性区间,这样使用上限和下限两个量作为不确定性的测度Ζ粗集方法与其它知识发现方法,如模糊集理论相结合,可以在数据库中数据不确定情况下获取多种知识Ζ5.3 知识的更新和完善在人工智能和机器学习研究领域,神经网络(N eu ral N etw o rk )通过对大量样本模式学习,得到从n 维92第4期基于数据仓库的决策支持系统框架03系统工程理论与实践2000年4月输入向量空间到m维输出向量空间的非线性映射F,F:R n→R mΖ利用神经网络输出结果经专家认可后,将其作为新的样本实例存入系统中,不断地从样本模式中学习专家用于决策的、定性的、经验性的知识,可以保证系统不断地更新知识和获取新知识Ζ5.4 知识的表达和解释系统中最重要的应用是用户能够理解所发现的知识,这要求知识的展现不限于传统的数字或符号,而是更容易理解的方式,如表格、直方图、散点图或自然语言等Ζ数据可视化采用直观的方式将信息模式、数据关联或趋势多维地呈现给决策人员,使决策人员交互地分析复杂的数据关系,并能深入地了解数据的状况、内在本质及规律Ζ6 决策支持系统的建立基于以上讨论,建立该决策支持系统的过程可描述如下:1)分析决策需求,确定决策主题,描述和表示决策的问题Ζ2)确定数据来源,对异构环境下可操作的数据记录、数据库或文件系统中的数据重新进行组织,建立数据仓库Ζ3)针对所要发现任务的所属类别,设计或选择有效的数据挖掘算法并加以实现Ζ4)调用数据挖掘功能,从平凡的历史数据中提炼出综合数据,并与最终用户交互、协同,得到宏观性数据和趋势性知识Ζ5)测试与评价所发现的知识,对知识进行一致性、效用性处理Ζ6)根据最终用户的要求,建立适用于决策支持的集成界面和应用程序,使用户能在决策支持中运用所发现的知识Ζ以上过程不是简单的线性流程,而是一个学习、发现和修改的过程,步骤之间包含了循环和反复,这样可以对所发现的知识不断求精、深化,并使其易于理解Ζ7 结语决策支持系统的建立是一项复杂的系统工程Λ本文对数据仓库技术在该系统建立中的应用作了较深入的探讨,提出了建立该系统的理论框架Λ数据仓库技术不是一种单一的技术或软件,它融合了数据库理论、统计学、数据可视化和人工智能技术等多项研究领域,在大量数据中发现有价值的知识,用于决策支持和预测未来Λ因此基于这一技术的决策支持系统为决策人员提供了强有力的支持工具,能有力地推动决策的现代化进程Λ参考文献[1] Go rry G A,Sco tt M o rton M S.A F ram ew o rk fo r M anagem en t Info rm ati on System s.SloanM anagem en t R eview,1971.[2] A graw al R et al.D atabase M in ing:A Perfo rm ance Perspective.IEEE T ran s.on Know ledge andD ata Eng.,1993,5(6):914~925.[3] Sarab j ob S A nand,B ryan W Sco tney.D esign ing a Kernel fo r D ata M in ing.IEEE Expert In telligen tSystem s and T heir A pp licati on s,1997,M arch-A p ril.[4] T erry M o riarty.M odeling D ata W arehou se.D atabase P rogramm ing and D esign,1996.[5] M atheu s C,Chan P K,P iatesky2Shap iro G.System fo r Know ledge D iscovery in D atabase.IEEET ran s.on Know ledge and D ata Eng.,1993,5(6):903~913.[6] Jeffery D.U ll m an.P rinci p les of D atabase and Know ledge2base System s(V o l.1).N ew Yo rk:Compu ter Science P ress,1988.[7] Edw in M Kno rr,R aymond T N g.F inding A ggregate P rox i m ity R elati on sh i p s and Commonalities inSpatial D ata M in ing.IEEE T ran s.on Know ledge and D ata Eng.,1996.[8] 姚卿达,黄晓春,刘向民.数据仓库和数据采掘应用研究.计算机科学,1996,23(6):63~65.[9] 胡侃,夏绍玮.基于大型数据仓库的数据采掘:研究综述.软件学报,1998,9(1):53~61.[10] 王清毅,陈恩红,蔡庆生.知识发现的若干问题及应用研究.计算机科学,1997,24(5):73~77.。