当前位置:文档之家› 【最新版】基于数据挖掘的EDP-CRM系统设计及实现毕业论文

【最新版】基于数据挖掘的EDP-CRM系统设计及实现毕业论文

毕业设计论文

基于数据挖掘的EDP-CRM系统设计及实现

摘要

CRM ( Customer Relationship Management)系统的目的在于建立一个整合客户服务、市场竞争、销售以及技术支持的系统,为企业带来长久的竞争优势。作为一种典型的交互式系统,CRM系统是企业管理中信息技术和应用解决方案的集成。它既是管理客户关系的一系列信息技术、方法和措施,又是运用信息技术将企业涉及的销售、客户服务、内部管理等业务流程自动化的软件及硬件系统。

而随着企业对CRM系统的长期使用,会积累大量的数据,他们迫切需要从现有大量数据中提取出数据中潜在的知识,因此对CRM系统进行数据挖掘的需求已经必不可少。

本文以某高校EDP-CRM项目为背景,介绍了CRM系统中客户管理模块和数据挖掘模块的设计与实现。通过该EDP-CRM系统,既可以方便地对客户开展基本的客户管理、产品管理、售后管理等客户管理功能,又可以在此基础上对现有数据进行聚类、分类、关联、时间序列分析等数据挖掘操作。

本文主要研究在数据挖掘的基础上构建CRM系统的技术。围绕某高校EDP-CRM系统的客户关系管理和数据挖掘两大功能模块进行了详细的研究分析。文中详细介绍了客户关系管理系统和数据挖掘技术。首先,客户管理模块着重介绍了模块的软硬件架构,流程设计和功能实现,从而保证CRM系统的基本功能的实现。而数据挖掘模块描述了模块实现的流程和技术,并在系统现有功能情况基础上,作者研究了数据挖掘的建模方案,主要重点讨论了数据仓库的构建模型和构建过程,从操作型环境抽取数据并导入数据仓库方法,对数据进行综合处理的实现技术,以及后期数据如何追加到数据仓库的机制,并详细介绍了关联规则挖掘模型,聚类挖掘模型和分类挖掘模型的实现技术。在确定了系统的关键技术后,完成了其CRM的系统的设计和实现。最后作者总结全文,并提出了进一步工作的方向。

第一章绪论

一、研究背景及研究意义

随着市场对知识要求的提高,越来越多的企业高层对知识在企业竞争发挥的作用有了深刻认识,EDP教育也逐步发展起来。但是,当前EDP教育产业在国内由于发展时间较短,也存在一些问题影响EDP教育的进一步发展,其中,如何在激烈的市场竞争环境下开发和占领市场以使EDP教育产业获得生存和发展是决定一个EDP教育产业能否良性发展的关键问题。

为了解决这个问题,客户资源的有效利用是一个关键。对于现代企业来说,客户资源正成为最具价值的资产,建立客户信息数据库,对这些最有价值的资产进行有效管理,成为企业的核心任务之一。EDP教育产业也是如此。因此,在解决客户资源管理环节,EDP教育产业也可以借鉴其他产业的经验,将CRM(Customer Relationship Management,客户关系管理)引入到EDP教育的客户资源管理之中。

CRM是90年代西方发展起来的新型的管理策略,它在国外的应用己经取得了极大的成功,而我国对它的认识和应用才刚刚起步。当今许多企业的CRM 数据库或数据仓库中都搜集和存储大量关于客户的宝贵数据,这些数据涵盖了从客户基本数据、购买记录及客户反馈的个个环节。充分利用这些数据,深入分析、挖掘隐含在这些数据中的有用信息,将有助于企业更好地管理客户关系,实现CRM的功能和目标。然而,由于缺乏在大量数据中发现深层次信息的能力,许多企业对于这些数据的利用还只是停留在基础层的浏览、检索、查询和应用层的继承、组合、整理等方面,而无法将这些数据转化为更加有用的知识。因此,如何更加有效地管理企业数据库中快速增长的海量数据,将数据资源的利用提高到知识创新的高级阶段,己经成为企业当前需要迫切解决的问题,数据挖掘(Data Mining,简称DM)技术的运用就可以帮助企业很好地解决这个问题。

所谓数据挖掘,简单地说,就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘作为一门交叉学科,受到多门学科的影响,

包括数据库系统、统计学、机器学习、可视化和信息科学。需要特别指出的是,数据挖掘从一开始就是面向应用的,因此如何利用数据挖掘技术解决特定领域的问题,是研究数据挖掘应用的核心问题[1][2][3][4]。近年来,该技术已经在商务管理,生产控制,市场分析,工程设计和科学探索等领域得到广泛的应用。

综上所述,为了解决EDP教育中存在的客户关系管理混乱无序的现状,本文将根数EDP教育的特点设计EDP-CRM系统并将其实现,并为了进一步开发客户关系中的潜在的价值,将数据挖掘技术引入到EDP-CRM系统之后,通过对客户资源进一步进行细分,提高客户开发的效率,并对客户资源进行进一步的有效开发,从而达到有效利用客户的价值目的。

二、国内外研究综述

(一)国外研究现状

1、数据挖掘研究现状

随着信息技术的迅猛发展,数据库的规模不断扩大,从而产生了大量的数据。这些数据背后隐藏着许多重要的信息,人们希望通过对这些信息进行更高层次的分析,以便更好地利用这些数据。但大量复杂的数据往往使人们无法辨别隐藏在其中的能对决策提供支持的信息,而传统的查询、报表工具无法满足挖掘这些信息的需求。因此,需要一种新的数据分析技术处理大量数据,并从中抽取有价值的潜在知识,数据挖掘(Data Mining)技术由此应运而生。数据挖掘技术也正是伴随着数据仓库技术的发展而逐步完善起来的[5,6]。

数据挖掘最早出现在20世纪80年代后期,它是在计算机信息技术的基础上发展而来的,而数据挖掘的概念是1989年在美国底特律召开的第十一届国际联合人工智能学术会议上最早被正式提出来。此次会议首次正式提出了KDD (Knowledge Discovery in Database)这个术语。并且在后来的1991年、1993年和1994年都举行了关于KDD的专题讨论会,汇集来自各个领域的研究人员和应用开发者,集中讨论数据统计、海量数据分析算法、知识表示、知识运用等问题。随着与会人员的不断增多,KDD国际会议发展成为年会。1998年在美

国纽约举行的第四届知识发现与数据挖掘国际学术会议21不仅进行了学术讨论,并且有30多家软件公司展示了他们的数据挖掘软件产品,不少软件已在北美、欧洲等国得到应用。经历十多年的发展,数据挖掘已经成为一个自成体系的应用学科。

目前,国外数据挖掘的发展趋势及其研究主要有以下方面:Berry和Linoff[7]主要侧重于基于数据挖掘的商务应用对数据挖掘进行了介绍;Fayyad等[8]介绍了数据挖掘以及如何将数据挖掘与整个知识发现过程协调;Lambert[9]考察统计学在大型数据集上的应用,并对数据挖掘与统计学各自的角色提出一些评论;Glymour等[10]考虑统计学可能为数据挖掘提供的教训;Smyth等[11]讨论诸如数据流、图形和文本等新的数据类型和应用如何推动数据挖掘演变。

在数据挖掘的应用方面,数据挖掘技术使得KDD商业软件工具不断完善和发展,使得KDD更注重建立解决问题的整体系统,而不是孤立的过程。数据挖掘的用户主要集中在大型银行、保险公司、电信公司和销售业。国外很多计算机公司非常重视数据挖掘的开发应用,IBM和微软都成立了相应的研究中心进行这方面的工作,此外,一些公司的相关软件也开始在国内销售,如Platinum、BO以及IBM[12]。

2、CRM研究现状

客户关系管理(CRM)的理论基础来源于西方的市场营销理论,它是在关系营销和数据库营销基础上诞生的一种全新的管理模式。和客户关系管理相关联最早的理论应该算是20世纪80年代初的“接触管理”(Contact Management),即专门收集整理客户与公司联系的所有信息。到20世纪90年代初期这一理论则演变成为包括电话服务中心与支持资料分析的客户关怀(Customer Care),后来又从重视赢得新客户和处理基础营销工作逐渐转移到对客户关系进行有效管理的客户保持工作上来[13]。

客户关系管理这个名词首先从北美传出,但是一般认为把客户关系管理理论最早概念化的是美国的计算机咨询集团——Gartner Group,该机构在1997年提出:客户关系管理就是为企业提供全方位的管理视角,赋予企业更完善的客户交流能力,最大化客户的收益率[14]。

在“客户关系管理”被正式提出之后,国外涌现出了很多关于实施客户关系管理的研究著作。如Stanley A.Brown[15]《Customer relationship management:a strategic in the world of e-business》一书,对客户忠诚、客户关怀、客户获得等客户战略问题,网络、工作流管理、数据仓库、数据挖掘等技术问题进行论述。Jill Dyche[16]所著的《The CRM handbook:a business guide to customer relationship management》是一本涉及到客户关系管理各个层面的著作。Joe Peppard[17]等提出了基于企业电子商务、渠道管理、关系管理和前后端办公室整合的客户关系管理框架,对金融服务业的客户关系管理进行了研究。

国外很多学者根据实际的经验,针对实施客户关系管理的一些问题提出了自己的观点。这些研究成果对于成功地实施客户关系管理提供了很好的借鉴经验。商业战略家和演讲家弗列德·威尔斯马在《客户联盟》中通过对大量国际上享有盛名的企业进行调查和细致研究,全面阐述了被这些成功企业大量运用并被证明是行之有效的新型商业运作模式—客户联盟,同时对客户关系管理及客户联盟的概念及关系做了深入的阐述。Lawrence认为客户关系管理并不只是收集、存储、处理客户信息,它应该对客户服务进行根本性的改变。客户关系管理需要的是由技术支持的商业战略,而不仅仅是削减营销成本或与客户更有效地进行交互。实施客户关系管理需要围绕关系战略重新设计和分配相关流程、技术和人力资源。Pauline A.Wilcox提出,一个高效的客户关系管理战略需要引入以客户为中心的企业文化。

3、数据挖掘在CRM中的研究现状

目前,学者们已经意识到客户是极为重要的商业资源,随着数据挖掘技术的发展并引入到CRM之中,大大提高了企业CRM系统的运作效率。国外一些学者对数据挖掘在CRM系统中的应用作了重要阐述。

Tillett.L.Scott [18]认为数据挖掘优化了CRM的服务功能,可以为客户服务提供准确的参考信息,提高对客户事务处理的能力。Adam Rombe [19]认为客户关系管理为客户与银行之间创建了一个沟通渠道,数据挖掘技术进一步优化银行内部的业务流程,使这一渠道变得更加高效与快捷,并且通过分析客户得交易行为,更好的了解客户和保留客户,挖掘客户的爱好和兴趣,从而以最快的

速度响应客户的需求,为客户提供最优质的服务,极大地提高客户的忠诚度。Groth R [20]认为集成有数据挖掘技术的营销辅助工具可以提供高精确度的模式识别和预测功能,使商业人员有效地策划和开展营销活动。

除了研究数据挖掘在CRM领域的应用之外,外国学者还研究了数据挖掘中的各种规则(如分类规则、聚类规则、关联规则等)在不同领域的CRM系统中的应用。Zengyou He [21]向我们介绍了数据挖掘的概念、算法和应用,并将其应用到客户关系管理之中。接下来Iraj Mahdavi [22]对用一种带自主机制的聚类算法对e-CRM上的文档数据进行分析,从而设计了一种客户利益导向型的客户关系管理模式,然后,Iraj Mahdavi [23]进一步研究,着重研究一种自适应的遗传算法,通过遗传算法,将客户数据引导到以客户为中心上来进行客户关系管理。Beomsoo Shim [24]研究了关联规则和序列分析在小规模电子购物网站的客户关系管理中的策略,通过关联规则对客户进行分类从而实施不同的营销策略。

(二)国内研究现状

1、数据挖掘研究现状

与国外相比,国内对数据挖掘的研究起步稍晚且不成熟。1993年国家自然科学基金首次支持我国在该领域的研究项目。目前,国内的许多科研单位和高等院校纷纷开展知识发现的基础理论及其应用研究,这些单位包括清华大学、中科院计算技术研究所、空军第三研究所、海军装备论证中心等。其中,北京系统工程研究所对模糊方法在知识发现中的应用进行了较深入的研究,北京大学也在开展对数据立方体代数的研究,华中理工大学、复旦大学、浙江大学、中国科技大学、中科院数学研究所、吉林大学等单位开展了对关联规则开采算法的优化和改造;南京大学、四川联合大学和上海交通大学等单位探讨、研究了非结构化数据的知识发现以及Web数据挖掘。除了这些学校和科研机构之外,我国的一些研究者也对数据仓库和数据挖掘的展开了研究。

王毅凯、张大雷[32]描述了数据挖掘技术的概念,然后对数据挖掘系统的构成和数据挖掘的流程进行了介绍,最后详细分析了数据挖掘的常用方法。蔡雅琳[33]对数据库中数据挖掘技术包括数据挖掘技术的产生背景、应用领域、

分类及主要挖掘技术作了概述,还从模式识别的角度讨论了数据挖掘技术的重要任务,包括分类、回归、聚类和关联等4种模式的识别;列举了当前数据挖掘技术的实际应用并指出今后的发展趋势。唐笑林[34]论述了数据挖掘的概念、算法、实际的挖掘过程,分析了C5.0决策树算法。张雪松、毛云龙、檀竹南[35]总结并评价了国内外数据挖掘技术的发展现状,对各个领域的数据挖掘技术应用进行了系统的评价与综述。刘明亮、李雄飞、孙涛、许晓晴[36]在将数据挖掘标准划分为过程标准、接口标准、语言标准和Web标准等四类进行分析介绍后,给出一个综合多种标准的应用程序框架,最后总结出数据挖掘标准化领域面临的问题和挑战,并对发展趋势予以展望。王锐、马德涛、陈晨[37]论述了数据挖掘的主要方法以及对数据挖掘在国民经济和军事领域的应用作了介绍。

2、CRM研究现状

我国最初客户关系管理(CRM)是由国外的IT厂商基于软件的使用而引入的。1999年8月6日,朗讯科技公司商业通讯系统部在北京举办了以“营造完美电信呼叫中心”为主题的研讨会,介绍了其全新的客户关系管理解决方案,并强调指出,商业部门必须着眼于客户关系,提供独具特色的个性化服务,才能在网络时代中立于不败之地。

国外先进管理理念的传入和信息时代的到来,为我国客户关系管理研究奠定了理论基础和技术支持。客户关系管理是在关系营销等理论基础上进一步发展起来的,它综合运用数据库、网络、图形图像、媒体、人工智能等技术,整合先进的管理思想、业务流程及信息技术于一体,构筑出现实信息平台的一种管理系统。

我国的一些研究者也对客户关系管理展开了研究。陈旭[25]研究了客户关系管理的内涵和管理思想,分析了客户关系管理的主要功能,辨析了客户关系管理与SCM和ERP的关系,讨论了客户关系管理的发展趋势。成栋、宋远方[26]在研究当前各种客户关系管理的管理理论的基础上提出了客户关系管理的理论框架体系,以澄清客户关系管理与其他管理理论的关系。周权[27]认为传统企业的销售、市场、客户服务及技术支持等部门的工作很多都是独立和垂立进行的,各部门的沟通存在障碍,客户关系管理能够解决上述的问砚。他主要介绍

客户关系管理的概念、体系以及分析型客户关系管理的概念、特点、利弊问题的研究,重点立足于其业内一般性定义的分析型客户关系管理的利弊问题进行探讨。谢良安[28]提出实施客户关系管理的策略包括以客户为中心的商业战略、企业文化建设、利用信息技术对企业的业务流程进行重组。黄中实[29]认为实施客户关系管理的主要步骤包括拟定客户关系管理目标和实施路线,构建客户智能平台,构建客户交互平台,重新设计工作流程,绩效的分析与衡量。鲁江、熊燕[30]认为实施客户关系管理的关键因素包括:企业全体员工的营销理念的更新,企业高层管理的大力支持,组织的再造和业务流程的重构。孙国辉[31]提出,客户关系管理项目应该是由业务驱动,选择合适的中国软件企业实施客户关系管理需要解决信息流、货币流、物流、服务、产品、组织机构等几个方面的问题。

3、数据挖掘在CRM中的研究现状

在中国,将数据挖掘引入到CRM中进行研究并不久,但是,却在这个领域出来了很多的研究成果。魏晓云[38]将数据挖掘技术引入到CRM系统中,充分阐述了数据挖掘的原理以及具体聚类和分类算法的应用的思路。易珺[39]将数据挖掘技术应用于酒店的CRM系统之中,来提高酒店的竞争力。陈建辉[40]具体的提出了一种基于数据挖掘的CRM系统的框架,并将其实现。滕蕾[41]则具体的就聚类规则在CRM系统中的应用进行了阐述。

三、论文的研究目标、内容及框架

(一)研究内容

本文的组织结构是按照CRM系统的客户关系管理和数据挖掘两大功能模块的分析,设计和实现的顺序进行,并对每个步骤按照提出问题,解决问题,进行验证的方法组织内容。阐述了项目中遇到的问题以及解决问题的具体方法和所采用的新技术。

(二)论文结构

本论文的总体结构如下:

1.介绍了研究背景,课题来源,CRM的发展现状,数据挖掘的发展现状,课题完成的工作以及本论文的组织结构。

2.介绍了CRM和数据挖掘的理论,并简单介绍了EDP教育的内容以及当前的发展现状。

3.详细介绍了福州大学管理学院EDP教育中心CRM系统的总体分析以及进一步的设计。包括CRM系统应用,系统架构,客户关系管理模块的需求分析和核心功能分析,数据挖掘模块的基本介绍和核心功能介绍。

4.详细阐述了CRM客户关系管理数据挖掘的设计和实现,包括模块功能结构,模块流程设计,以及实现技术。

5.详细阐述了CRM数据挖掘模块的设计和实现,介绍了模块的实现描述,包括模块的实现流程,采用技术,并对销售分析模块的应用进行分析,研究了如何进行销售分析建模,来更好地指导市场营销活动方案。

6.总结本论文并展望未来CRM的发展。

第二章相关理论综述

一、客户关系管理理论

(一)CRM的产生发展

随着信息技术的发展和网络化经济的快速进步,传统的商业模式发生了根本性的变化。在很多行业,所提供的产品和服务日益商品化,产品的同质化倾向越来越强,独特的竞争优势越来越难以获得,业务比以前更具竞争性。与此同时,客户的期望也在快速变化。由于计算机、通讯技术和网络的飞速发展,客户完全可以控制要选择谁、何时选择和如何选择,客户选择摆脱了传统地理关系的限制,变成了“点击鼠标的一瞬间”;客户对随时随地得到服务的要求更高,对质量、个性化和价值的要求更挑剔。在这种环境下,客户的亲和力和忠

诚度是取得成功的重要因素,建立和维持客户关系成为企业取得竞争优势的最重要的基础。据统计,93%的CEO认为客户关系管理是企业成功和更有竞争能力的重要因素,2/3的客户离开其供应商是因为客户关怀不够,一个非常满意的客户其购买意愿将六倍于一个满意的客户,在客户满意度方而的5%的提高将使企业利润加倍。

为了提高客户满意度,企业必须完整掌握客户信息,准确把握客户要求,快速响应个性化需求,提供便捷的购买渠道、良好的售后服务与经常性的客户关怀等。而在传统的客户关系管理(Customer Relationship Management,简称CRM)中,来自销售、客户服务、市场、制造、库存等部门的信息分散在企业内,客户信息的分散性和片段性使得无法对客户有全而的了解,就是在同一个企业内部对客户的定义和理解也极不相同,各部门难以在统一的信息的基础上面对客户。这种客户信息的分散性和片段性对企业的经营活动造成了极大的困扰,浪费了很多的资源,失去了很多的机会,在市场竞争中处于不利的地位。加强对客户关系管理的研究具有重要意义。

在我国,许多企业的内部管理混乱和随意,有的企业脱胎于过去的“计划经济”,连市场营销、公共关系、细分市场等都是新名词,如何在客户数据中分析购买习惯,针对不同的客户进行不同的营销策略,企业没有积累经验;自动销售系统在我国还没有普及,我国企业中真正运用CTI而不仅仅是电话交换系统的呼叫中心屈指可数,网上商城则尚在萌芽阶段。要在手工操作的基础上一步达到多渠道和客户进行友好持续交流的目的,非常有挑战性。另一方面,我国企业的这种跨越式的发展和飞跃也能少走弯路,充分发挥我国企业的后发优势,在CRM整体设计、多系统兼容和接口问题等方面我国会比比国外企业容易。

技术发展与现实需要的反差,是我国企业发展的现状与竞争环境的挑战,使加强CRM研究成为具有重要的理论、现实意义和紧迫性的课题

(二)CRM的定义

目前对CRM的定义有很多,但总的来说,CRM实际上是一种以客户为中心的管理机制和经营战略,它以信息技术为手段,对业务功能进行重新设计,并且对工作流程进行重组,提高客户满意度,从而最终达到企业利润最大化。

它所强调的是客户价值,要充分利用以客户为中心的各种资源,采用先进的数据库和其他信息技术来获取客户数据,从而有针对性地为顾客提供产品或服务。

由此可知,客户关系管理实际上包含了3个方面的含义:

a. CRM首先是一种管理理念。其核心思想是将企业的客户(最终客户、分销商、和合作伙伴)作为最重要的企业资源,通过完善的客户服务和深人的客户分析来满足客户的需求。

b. CRM也是一种旨在改善企业和客户之间关系的新型管理机制。是企业战略的一种,它实施于企业的市场营销、销售、客户与技术支持等与客户相关的领域,以使企业更好地围绕顾客行为来有效地管理自己的经营。

c. CRM又是一种管理软件和技术。它将最佳的商业实践与数据挖掘、数据仓库、一对一营销、销售自动化以及其他信息技术紧密结合在一起,为企业的销售、客户服务和决策支持等领域提供一个业务自动化的解决方案。

(三)CRM的分类

目前的CRM产品按照功能可分为3类:操作型、分析型和协作型。

1、操作型

操作型CRM主要设计目的是让销售、营销、客户服务、技术支持等部门的业务人员在日常工作中能够共享客户资源,减少信息流动滞留点,同时具有一定的分析能力。很容易通过多个渠道快速、全面的获得客户的信息,以及相关的联系等,使得与客户的联系变得连续,呈现给客户的信息一致。

2、分析型

分析型CRM主要利用大量的客户数据,从中提取有用的信息进行分析,以及对将来的趋势做出预测,协助企业制定市场计划和发展方向。

3、协作型

协作型CRM是指能够让企业销售、客户服务人员同客户一起完成某项活

动。协作型目前主要应用于呼叫中心(Call Center)、多渠道联络中心、帮助台、以及自助服务帮助导航等。

二、数据挖掘理论

(一)数据挖掘的定义

数据挖掘(Data Mining),也叫数据开采,数据采掘等,是按照既定的业务目标从海量数据中提取出潜在、有效并能被人理解的模式的高级处理过程。

在较浅的层次上,它利用现有数据库管理系统的查询、检索及报表功能,与多维分析、统计分析方法相结合,进行联机分析处理(OLAP ),从而得出可供决策参考的统计分析数据。在深层次上,则是从数据库中发现前所未有的、隐含的知识,OLAP的出现早于数据挖掘,它们都是从数据库中抽取有用信息的方法,就决策支持的需要而言两者是相辅相成的。OLAP可以看作一种广义的数据挖掘方法,它旨在简化和支持联机分析,而数据挖掘的目的是便这一过程尽可能自动化。

数据挖掘基于的数据库类型主要有:关系型数据库、面向对象数据库、事务数据库、演绎数据库、时态数据库、多媒体数据库、主动数据库、空间数据库、

遗留数据库、异质数据库、文本型、Internet信息库以及新兴的数据仓库(Date Warehouse)等。而挖掘后获得的知识包括关联规则、特征规则、区分规则、分类规则、总结规则、偏差规则、聚类规则、模式分析及趋势分析等。

(二)数据挖掘的模式

1、分类模式(Classification)

分类就是构造一个分类函数(分类模型),把具有某些特征的数据项映射到某个给定的类别上。该过程由两步构成:模型创建和模型使用.模型创建是指通过对训练数据集的学习来建立分类模型;模型使用是指使用分类模型对测试数据和新的数据进行分类。其中的训练数据集是带有类标号的,也就是说在分类之

前,要划分的类别是己经确定的。通常分类模型是以分类规则、决策树或数学表达式的形式给出的。

2、聚类模式(Clustering)

聚类就是将数据项分组成多个类或簇,类之间的数据差别应尽可能大,类内的数据差别应尽可能小,即为“最小化类间的相似性,最大化类内的相似性”,原则。与分类模式不同的是,聚类中要划分的类别是未知的,它是一种不依赖于预先定义的类和带类标号的训练数据集的非监督学习(unsupervised learning),无需背景知识,其中类的数量由系统按照某种性能指标自动确定。

3、回归模式(Regression)

回归模式的函数定义与分类模式相似,主要差别在于分类模式采用离散预测值(例如类标号),而回归模式采用连续的预测值。在这种观点下,分类和回归都是预测问题,但在数据挖掘业界,大家普遍认为:用预测法预测类标号为分类,预测连续值(例如使用回归方法)为预测。许多问题可以用线性回归解决,对于许多非线性问题可以通过对变量进行变换,从而转换为线性问题来解决。

4、关联模式(Association)

关联分析用于发现大量数据中项集之间有意义的关联或相互关系,寻找给定数据集中数据项之间的有趣联系。关联规则的支持度和置信度是两个规则兴趣度的度量标准,它们分别反映发现规则的有用性和确定性。

5、序列模式(Sequential)

实时状态数据的存在需要在数据挖掘过程中加入时间因素。序列模式分析主要是通过对历史事件中频繁发生的事件序列进行分析,形成预测模式.来对未来行为进行预测。

6、偏差模式(Deviation)

数据库中可能包含一些数据对象与大部分数据对象的一般行为或模式不一致,这些不一致的数据就成为孤立点。大部分数据挖掘方法将孤立点视为噪声或异常数据丢掉,然而在一些应用中,罕见的事件可能比正常的事件包含更多潜在有用的知识。由此可见,从数据集合中检测这些孤立点并加以分析是十分有意义的。数据演变分析描述行为随时间变化的对象的规律或趋势。它包括趋势分析、相似性查找和周期性模式分析等方面。

(三)数据挖掘的过程

数据挖掘是一个完整的、反复的人机交互处理过程,该过程需要经历多个相互联系的步骤。而且因为应用领域的分析目标需求不同,以及数据来源和含义的不同,其中的步骤也不会完全一样。一般来说,数据挖掘的过程主要包含五个阶段:数据准备、数据选择、数据预处理、数据挖掘、转换模型及模式评价。

1、数据准备

数据是数据挖掘工作成功与否的基础。要进行数据挖掘,数据准备阶段必不可少。因为数据挖掘要处理的数据来自不同的数据源,数据量庞大,数据结构复杂,还有大量数据重复,并且里面夹杂着空缺数据、噪声数据、冗余数据等对数据挖掘有负面影响的数据。因此,数据准备在数据挖掘过程中起着至关重要作用,是数据挖掘工作的基础。数据准备主要包含以下三个方面:1)确定项目目标,制定挖掘计划、2)数据收集和获取、3)数据集成。

2、数据选择

数据挖掘通常并不需要使用一个部门或者用户所拥有的全部数据,有些数据对于建立模型和发掘模式是没有任何意义的,而且如果数据与此挖掘项目的目标有所偏差,则还有可能给数据挖掘带来负面影响,造成挖掘结果不准确,模式不可用。数据选择就是在相关领域专家的指导下,数据挖掘人员从经过集

成后的数据库或数据仓库中检索出与此次挖掘项目任务相关的数据集合,从而缩小范围,保证数据正确性和语义完整性,避免盲目搜索,从而提高数据挖掘的质量和效率。

3、数据预处理

数据预处理可以保证数据挖掘所需数据集合的质量。对于数据挖掘来说,数据质量是一个关键的问题,因为如果数据挖掘基于的数据不准确,那么挖掘出来的结果也会是不准确的。挖掘基于的原始数据是从各个实际应用系统中获取的,由于各应用系统的数据缺乏统一的标准定义,数据结构也有较大的差异,因此各系统间的数据存在较大的不一致性,往往不能直接拿来使用。面对这些问题数据,需要对收集好数据进行清理,以使其适用于以后的数据处理。

4、数据挖掘

数据挖掘就是建立模型解决问题的过程。这是一个反复的过程。需要分别考察不同的模型以判断模型对相关问题有效性。先用一部分数据建立模型,然后再用剩下的数据来测试和验证这个模型。有时还有第三个数据集,称为验证集,因为测试集可能受模型的特性的影响,这时需要一个独立的数据集来验证模型的准确性。训练和测试数据挖掘模型需要把数据至少分成两个部分:一个用于模型训练,另一个用于模型测试。

5、转换模型及模式评价

数据挖掘完成之后,必须评价得到结果、解释模型的价值。从测试集中得到的准确率只对用于建立模型的数据有意义。在实际应用中,需要进一步了解错误的类型和由此带来的相关成本。经验证有效的模型并不一定是正确的模型。造成这一点的直接原因就是模型建立中隐含的各种假定。因此直接在现实世界中测试模型很重要。先在小范围内应用,取得测试数据以及测试结果,对模式评价通过之后再将模式推广应用。

三、EDP教育介绍

第三章EDP-CRM系统分析

一、背景介绍

作者在撰写硕士论文期间,参加了福州大学EDP中心CRM系统的研究、设计和开发工作。通过对系统的设计、分析和开发,使我对CRM系统的总体结构有了一个较为全面的认识。在系统设计和开发过程中,还将数据挖掘技术与企业的具体情况相结合,对数据挖掘在CRM系统实际应用进行了的尝试和探索性的研究。

因此,在论文中,我以福州大学EDP中心的CRM系统为背景,以系统设计开发的具体过程为线索,依次介绍客户管理管理、数据仓库和数据挖掘技术的理论发展及其它们在系统中的实际应用情况。最后在此基础上,论述了基于数据挖掘的EDP-CRM系统的框架体系及实现。

二、EDP-CRM系统可行性分析

(一)EDP-CRM客户信息管理模块可行性分析

1、经济可行性

EDP中心的服务都是针对特定领域的客户,而中心能否良好发展的关键在于客户需要的满足。而实施CRM系统,能够保证为客户提供良好的服务,能够及时准确的向客户提供产品服务的信息,在发掘新客户、保持老客户、防止老客户流失等方面都有明显的效果,而由于EDP中心的特点,每增加一名客户,能够获得非常大的经济效益,因此实施CRM系统能够明显提高企业的经济效益。与之相比,虽然实施CRM系统需要在前期投入一笔软件开发与运行维护的成本,但与提高客户满意度从而增加的利润相比只是九牛一毛。因此,福州大学管理学院EDP中心实施客户关系管理系统在经济上完全是可行的。

2、技术可行性

进入21世纪,信息技术的不断进步,也进一步推进了CRM的发展。计算机技术、通讯技术、网络应用技术使得CRM系统的实施与应用不在仅仅停留在想象阶段。而伴随着企业信息化水平的提升,办公自动化程度、员工计算机应用能力也不断提高,同时企业管理方式也相应转变,这些都有利于客户关系管理的实施。

3、管理可行性

福州大学管理学院EDP中心由于受所处高校影响,管理理念非常先进。中心的管理思想早已成功完成从以产品为中心向以客户为中心的转变,而管理思想的转变也影响了管理方式的转变。而先进的思想将有利于中心工作人员轻松适应CRM系统的应用。因此发展CRM的时机己经成熟,通过CRM对该企业的客户资源进行有效的管理,不但会提高企业收益,也将进一步改变企业运行的战略思维。

(二)EDP-CRM数据挖掘模块可行性分析

数据挖掘可以从大量数据中挖掘隐藏的知识,为决策人员和客户经理提供决策和工作的依据。对EDP中心而言,对中心客户进行数据挖掘是可行的,因为福州大学管理学院EDP中心的客户资料已达到了数据挖掘所需要的海量;而公司的经营者也希望获得更大的利润,所以都支持数据挖掘,希望充分利用现有的数据,挖掘数据背后的知识,提高中心效益;而且公司的信息化建设比较好,数据比较完备,网络设置和员工的计算机水平都比较好。

三、EDP-CRM系统需求分析

需求分析是软件开发中的一个重要的阶段,他就是描述系统的需求的过程。分析的根本目的是在系统开发者与用户之间建立一种理解和沟通的机制。

(一)主要业务分析

一个企业业务流程是系统设计的关键,要实施开发CRM系统,必须确定系统的功能需求,这就必须先了解企业的业务流程,从业务流程中分析系统的需求。而EDP-CRM系统的主要业务流程如下图:

(二)、业务用例

业务用例是在调研阶段得到的信息基础上提取的,是从用户和业务的角度

来描述系统提供需要执行的功能。福州大学管理学院EDP中心客户管理管理系统主要实现五大功能,其用例图如下:

1、基本信息管理

基本信息管理功能是整个CRM系统的核心模块,它将所有基础信息作为连接其余各个系统模块的主线,也是CRM系统的主要数据来源。主要包括客户信息管理、产品信息管理、员工信息管理。

客户信息管理是对EDP中心的客户信息进行详细的管理,主要实现对个人客户信息管理和对集团客户信息管理的两个子功能。

产品信息管理是对EDP中心的产品信息进行详细的管理,主要实现对集团产品和对个人产品两个子功能。但是这两个子功能又可以进一步细分,具体的就是将集团产品管理功能继续细分为企业优化咨询信息管理和集团培训信息管理。而个人产品管理功能又可以继续细分为包括学位教育信息管理和讲座公开课信息管理。

员工信息管理是对EDP中心的员工信息进行详细的管理,主要实现对营销人员信息管理、对教师信息进行管理和对教务人员进行管理三个子功能。

基本信息管理的需求图如下所示:

相关主题
文本预览
相关文档 最新文档