基于数据仓库的信用卡客户规则获取
- 格式:pdf
- 大小:212.00 KB
- 文档页数:3
深圳大学研究生课程论文题目基于信用卡及其消费记录的数据挖掘成绩专业计算机科学与技术课程名称、代码数据仓库一、摘要随着国民经济的快速发展,互联网技术和信息技术日益成熟。
在信息化过程中,居民消费方式也逐渐由传统的现金交易转变为银行卡或网银等快捷交易,这使得信用卡作为一种快捷便利的消费方式应用而生,并且得到越来越广泛的使用。
信用卡是一种非现金交易付款的交易方式,是简单的信贷服务。
由信用卡公司依据用户的信用度与财力发给持卡人,持卡人使用信用卡消费时无需支付现金,待结账日再行还款。
影响信用卡消费金额的因素很多,并且多种因素相互交叉,对信用卡消费金额产生影响。
随着信用卡用卡环境的不断改善,以及各商业银行服务的改进,人们越来越多地接受并习惯于使用信用卡,各商业银行也积累了大量与使用信用卡相关的数据。
过去这些数据仅用来核对账务和打印留作凭证,数据内部包含的各种信息对银行经营工作的作用没有得到重视,或者由于技术条件限制难以对其进行分析。
近年来,随着数据挖掘技术的发展,如何对这些数据进行有效利用,挖掘用卡消费行为中潜在的对银行经营管理有益的信息,已引起各家银行的高度重视。
银行信息的数据挖掘也因此成为非常活跃的应用领域之一。
二、需求分析在信用卡消费系统中,信用卡额度、信用卡消费情况都会产生大量的业务数据,以信用卡消费记录分析为主题的数据仓库主要涉及到信用卡客户的年龄、性别、职业、月收入、月支出以及与银行的业务关系等信息。
信用卡消费数据仓库的维度主要有5个:持卡人信息、商品信息、商店信息、消费时间、信用卡信息。
根据信用卡消费系统业务范围和决策分析的需要,设计出星型模式的信用卡消费模型。
三、数据源分析随着市场的竞争越来越激烈,商业环境中的信息越来越密集,企业必须能够深入灵活利用积累的大量数据挖掘潜在的规律,提高决策质量,把握和发现市场机遇,提升企业的竞争力。
通过分析信用卡消费数据,可以了解持卡人的消费情况,如购买的商品种类、消费金额、消费时间、消费的区域等。
工商银行大数据驱动的经营管理体系建设中国工商银行业务研发中心副总经理敦宏程中国工商银行业务研发中心副总经理 敦宏程经营管理是指银行为了自身的生存发展,对整体生产经营活动进行计划、组织、指挥、协调和控制,其目的是充分利用各种资源,最大程度满足用户需要,取得良好的社会效益和经济效益。
良好的经营管理体系可以聚合企业资源、提升运作效率、提高产品质量、优化客户体验、激发员工积极性和凝聚力、提升社会价值。
在数字经济时代下,银行业如何夯实数据基础设施,打造高效研发体系,促进金融产品创新,形成互联互通的综合化、数字化金融服务生态系统,是提升经营管理能力的关键。
工商银行坚决落实党中央决策部署,坚持“48字”工作思路,以客户为中心,积极推动数据与业务相结合,持续积淀数据要素,充分释放数据生产力,确立迭代优化的数据驱动机制。
工商银行通过智慧银行生态建设工程(ECOS)构建企业级大数据服务能力和数字化业务研发能力,围绕产品、服务、运营、风险四大领域形成“AI+”服务新生态,打造专业化、体验化、集约化、自动化的智慧经营管理体系。
一、大数据服务体系为经营管理提供技术、数据双要素数字时代的大型商业银行面对多样化的客户需求、复杂多变的业务场景,需盘活用精数据资产,形成数据编者按:智慧银行生态建设工程(ECOS)是工商银行坚决贯彻落实党中央关于金融服务实体经济、做大做优做强数字经济、加快实现高水平科技自立自强等战略决策部署,举全行之力、历经数载实施的一项系统性工程,创新提出了一整套国际领先的分布式开放生态银行系统建设方案,依托企业级业务架构建设,实现了大型银行全分布式系统架构、大型银行主机下移、银行系统生态化转型、大规模交易型分布式数据库等多个领域“从0到1”的突破。
近日,工商银行智慧银行生态建设工程(ECOS)荣获人民银行“2020年度金融科技发展奖特等奖”。
为此,本刊特推出“ECOS工程”专题,邀请多位参与ECOS工程建设的相关负责人及专家撰稿,分享工商银行ECOS工程建设取得的创新成果与成功经验,以期为商业银行数字化转型提供有益借鉴。
数据仓库、数据挖掘在银行中的应用标题:数据仓库、数据挖掘在银行中的应用引言概述:在当今信息时代,数据成为了银行业务运营和决策的重要支撑。
数据仓库和数据挖掘技术的应用为银行提供了更准确、高效的数据分析和决策支持。
本文将从数据仓库的概念、数据挖掘的应用以及在银行中的具体应用场景等方面进行阐述。
正文内容:1. 数据仓库的概念和特点1.1 数据仓库的定义和基本特点1.2 数据仓库的架构和组成要素1.3 数据仓库与传统数据库的区别2. 数据挖掘的基本概念和技术2.1 数据挖掘的定义和基本任务2.2 数据挖掘的技术分类2.3 数据挖掘的流程和方法3. 数据仓库在银行中的应用3.1 风险管理3.1.1 通过数据仓库进行风险评估和监控3.1.2 利用数据挖掘技术进行风险预测和分析3.2 客户关系管理3.2.1 基于数据仓库的客户画像和分析3.2.2 利用数据挖掘技术进行客户细分和推荐3.3 营销策略优化3.3.1 基于数据仓库的市场分析和竞争情报3.3.2 利用数据挖掘技术进行产品定价和促销策略优化4. 数据挖掘在银行中的应用4.1 反欺诈分析4.1.1 利用数据挖掘技术进行欺诈检测和预防4.1.2 基于数据仓库的异常行为分析和模型建立4.2 信用评估4.2.1 利用数据挖掘技术进行信用评分和风险预测4.2.2 基于数据仓库的信用历史分析和模型验证4.3 交易分析4.3.1 基于数据仓库的交易行为分析和模式挖掘4.3.2 利用数据挖掘技术进行交易异常检测和预测5. 数据仓库、数据挖掘的优势与挑战5.1 优势5.1.1 提供全面、一致的数据视图5.1.2 支持复杂的数据分析和决策需求5.2 挑战5.2.1 数据质量和一致性的保证5.2.2 数据隐私和安全的保护总结:数据仓库和数据挖掘技术的应用在银行业中发挥着重要作用。
通过数据仓库的构建和数据挖掘的技术应用,银行可以更好地进行风险管理、客户关系管理和营销策略优化。
一个基于Cognos的商业银行信用卡数据仓库的设计、构建和应用的开题报告一、研究背景及意义随着金融市场的发展和竞争的加剧,各家商业银行越来越重视信用卡业务的开展和发展。
信用卡业务是商业银行的重要业务之一,对于提高商业银行的服务水平、扩大营业规模、增加收益等方面都具有重要的影响。
然而,商业银行的信用卡业务在管理上存在着诸多难题。
例如,客户复杂多样的需求、信用卡活动的管理难度、数据质量的难保证等,这些问题都需要借助部署信用卡数据仓库来解决。
确定和部署基于Cognos平台的商业银行信用卡数据仓库是解决上述问题的一种重要方式。
Cognos 平台是一种成熟的商业智能分析和报告工具,可以帮助商业银行有效地分析和管理信用卡业务数据。
构建基于Cognos的商业银行信用卡数据仓库,可以对信用卡业务的客户群体进行细分、对信用卡产品的使用规律进行挖掘,为商业银行提供重大决策参考,同时可以方便银行工作人员提前预知客户需求,提高服务质量,为客户提供更多元化的金融产品,从而实现更高效快捷地满足客户需求的目的。
因此,本文将介绍一个基于Cognos的商业银行信用卡数据仓库的设计、构建和应用,探讨如何通过构建信用卡数据仓库实现商业银行经营管理的数据化、个性化和智能化,以及如何利用Cognos平台提供的分析和报告功能帮助商业银行有效地对信用卡业务数据进行分析和管理。
二、主要研究内容本文主要研究以下内容:1. 商业银行信用卡数据仓库的概念及相关技术2. 基于Cognos平台的商业银行信用卡数据仓库设计与构建3. 商业银行信用卡业务分析与报告应用4. 基于商业银行信用卡数据仓库的智能化管理与营销应用5. 商业银行信用卡数据质量保证和安全性管理三、研究方法和实施过程本文采用文献研究法和案例分析法进行研究。
首先,通过收集相关文献,了解商业银行信用卡数据仓库概念、业务功能和相关技术;进而,结合商业银行信用卡业务实际情况,设计和构建基于Cognos平台的商业银行信用卡数据仓库,实现商业银行经营管理的数据化、个性化和智能化;接着,利用数据仓库中的数据进行商业银行信用卡业务分析与报告应用,帮助商业银行制定更有效的业务策略;最后,对商业银行信用卡数据仓库的数据质量保证和安全性管理进行分析。
中国建设银行信用卡数据仓库的设计与实现作者:董捷来源:《消费电子·理论版》2013年第03期摘要:随着我国经济高速的增长以及消费转型的加快,国内信用卡业务始终保持良好的快速发展态势。
本文分析建设银行信用卡业务及数据挖掘的基本理论以及数据仓库中的客户特征分布情况进行分析,通过了解每个客户特征变量在不同的取值情况下属于好客户或是坏客户的概率大小,利用SAS数据挖掘工具的决策树模型进一步挖掘,得出影響客户信用状况的各因素及每个因素的重要程度。
关键词:信用卡;数据仓库;数据挖掘;个人信用评分中图分类号:TP399 文献标识码:A 文章编号:1674-7712 (2013) 06-0099-01对于建设银行来说,首先需要建立可以全面、完整地适应与涵盖个人信用信息数据的信用卡数据仓库,信息涵盖个人基本信息、结算账户开立信息、银行信贷信息和住房公积金缴存信息等,基本实现为每一个有经济活动的个人建立一套信用档案的目标。
在建立数据仓库的基础上,通过数据挖掘分析、数据探索、数据挖掘和分类,得到建行的个人信用评分模型。
一、数据挖掘技术概述(一)数据仓库。
所谓数据仓库[1],就是一个面向主题的、集成的、稳定的、不同时期的数据集合,用以支持银行经营管理中的决策过程。
它提供集成化的和历史化的数据;它集成种类不同的应用系统;数据仓库从发展和历史的角度来组织和存储数据,以供信息化和分析化处理之用。
(二)数据挖掘技术。
数据挖掘(Data Mining)[2]就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
这个定义包括好几层含义:数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅支持特定的发现问题。
二、银行数据仓库的建设方法(一)银行建立数据仓库的必要性。
数据仓库、数据挖掘在银行中的应用标题:数据仓库、数据挖掘在银行中的应用引言概述:数据仓库和数据挖掘技术在银行业中的应用已经成为了一种趋势。
通过建立数据仓库和应用数据挖掘技术,银行可以更好地管理和分析海量数据,从而提高业务效率、降低风险、提升客户满意度。
本文将从数据仓库和数据挖掘的概念入手,详细介绍在银行中的应用。
一、数据仓库在银行中的应用1.1 数据仓库概念及作用数据仓库是一个集成的、面向主题的、非易失的数据集合,用于支持管理决策。
在银行中,数据仓库可以整合各个业务系统产生的数据,提供一站式数据查询和分析服务,帮助银行管理层更好地了解业务状况和制定战略决策。
1.2 数据仓库架构数据仓库架构包括数据源层、数据集成层、数据存储层、数据访问层等组成部分。
在银行中,数据仓库架构需要充分考虑业务需求和数据安全性,确保数据的完整性和一致性。
1.3 数据仓库应用案例许多银行已经建立了完善的数据仓库系统,通过数据仓库分析客户行为、风险管理、产品推荐等方面取得了显著的成效。
例如,某银行通过数据仓库系统对客户信用评分进行建模,提高了信贷审批效率和准确性。
二、数据挖掘在银行中的应用2.1 数据挖掘概念及技术数据挖掘是从大量数据中发现隐藏信息和关系的过程,包括分类、聚类、关联规则挖掘等技术。
在银行中,数据挖掘可以帮助银行发现潜在的商机和风险,提高业务决策的准确性。
2.2 数据挖掘在客户关系管理中的应用通过数据挖掘技术,银行可以分析客户的消费习惯、偏好和价值,实现个性化营销和客户关系管理。
例如,银行可以通过数据挖掘技术实现客户分群,精准推送产品和服务,提升客户满意度。
2.3 数据挖掘在风险管理中的应用数据挖掘技术可以帮助银行识别潜在的信用风险和欺诈行为,提高风险管理的效率和准确性。
例如,银行可以通过数据挖掘技术建立风险模型,实现对不良贷款的及时识别和处理。
三、数据仓库与数据挖掘的结合应用3.1 数据仓库与数据挖掘的关系数据仓库提供了数据挖掘所需的数据基础,数据挖掘则通过分析数据仓库中的数据,发现隐藏的规律和关系。
数据挖掘技术在信用卡业务中的应用案例分享信用卡业务具有透支笔数巨大、单笔金额小的特点,这使得数据挖掘技术在信用卡业务中的应用成为必然。
国外信用卡发卡机构已经广泛应用数据挖掘技术促进信用卡业务的发展,实现全面的绩效管理。
我国自1985年发行第一张信用卡以来,信用卡业务得到了长足的发展,积累了巨量的数据,数据挖掘在信用卡业务中的重要性日益显现。
一、数据挖掘技术在信用卡业务中的应用1.分析型CRM分析型CRM应用包括市场细分、客户获取、交叉销售和客户流失。
信用卡分析人员搜集和处理大量数据,对这些数据进行分析,发现其数据模式及特征,分析某个客户群体的特性、消费习惯、消费倾向和消费需求,进而推断出相应消费群体下一步的消费行为,然后以此为2.风险管理数据挖掘在信用卡业务中的另一个重要应用就是风险管理。
在风险管理中运用数据挖掘技术可建立各类信用评分模型。
模型类型主要有三种:申请信用卡评分卡、行为信用评分卡和催收信用评分卡,分别为信用卡业务提供事前、事中、和事后的信用风险控制。
申请评分模型专门用于对新申请客户的信用评估,它应用于信用卡征信审核阶段,通过申请人填写的有关个人信息,即可有效、快速地辨别和划分客户质量,决定是否审批通过并对审批通过的申请人核定初始信用额度,帮助发卡行从源头上控制风险。
申请评分模型不依赖于人们的主观判断或经验,有利于发卡行推行统一规范的授信政策。
行为评分模型是针对已有持卡人,通过对持卡客户的行为进行监控和预测,从而评估持卡客户的信用风险,并根据模型结果,智能化地决定是否调整客户信用额度,在授权时决定是否授权通过,到期换卡时是否进行续卡操作,对可能出现的使其提前进行预警。
催收评分模型是申请评分模型和行为评分模型的补充,是在持卡人产生了逾期或坏账的情况下建立的。
催收评分卡被用于预测和评估对某一笔坏账所采取措施的有效性,诸如客户对警告信件反应的可能性。
这样,发卡行就可以根据模型的预测,对不同程度的逾期客户采取相应措施进行处理。
招商银行吴颖:招行大数据应用经验分享该文为招商银行信息技术部数据仓库开发团队负责人吴颖在第六届中国(深圳)金融信息服务发展论坛银行保险业分论坛上的发言。
很高兴今天能够有机会,跟大家分享招商银行在大数据应用体系建设方面的一些思考与实践。
我们今天的分享会围绕着大数据技术应用这样一个主题,谈一谈招商银行在当今时代背景下面所面临的挑战,我们对此的一些思考和实践,以及我们对未来的展望。
互联网特别是移动互联网对银行的冲击,我想大家都是深有体会的。
以招商银行为例,今天我们手机银行的登录次数已经是我们网点访问量的10倍,是我们网上银行专业版的2 倍,同时这个数字仍以每个月10%的速度持续增长。
移动互联网的流量竞争和经营,我们认为会是未来竞争的一个主战场。
最近招商银行发布的手机银行3.0版,它的整个设计思路与以前的版本有了非常大的变化。
我们做这样一个变化的目的,实际上就是通过打造极简金融、极致体验去抢占移动互联网的制高点。
从表面上看,手机银行和移动互联网,它们是银行与客户在交互渠道上面的一个革新,但是我想更为本质的,应该是数据驱动对银行服务的一种颠覆。
这里有一组企业对大数据的投资意愿及大数据领域相关市场增长率预测的数字。
它进一步可以佐证大数据的火热程度以及它受关注的程度。
我想跟两年前相比,现在已经很少会有人再去质疑大数据在影响未来人类生活方面的巨大作用。
从前面的介绍中我们可以看到,互联网和移动互联网给银行业带来的变革需求。
互联网思维正在影响我们整个社会的方方面面,包括像普惠、开放、极致体验等一些概念,已经对传统银行业提出了巨大的挑战。
我想,既然这个挑战已经不可避免,作为其中一个主要的数据拥有者——银行,我们是不是可以直面挑战、抓住机遇、争取逆袭?我想,这是需要我们思考的。
大数据应用体系的建设,它包含了技术上和管理上的一系列措施和政策,是一个系统性的工程。
尽管大数据的热度很高,但是在具体的实践上面,我们还是需要避免出现头脑发热、一哄而上的情况,需要我们能够有理性的分析,以一个全局性的视角去思考,正视过去、立足现在、放眼未来。
数据仓库在银行信息化中的应用摘要:随着我国金融行业的快速发展,传统的金融信息系统已经无法满足银行在经营过程中的各种需求。
因此众多银行开始构建数据仓库,并基于此技术进行业务运作、经营管理、客户关系管理、银行产品推广等各种分析,在激烈的竞争中掌握主动、获得更大的发展空间。
关键词:数据仓库;银行信息化;应用中图分类号:tp311.13 文献标识码:a 文章编号:1007-9599 (2012)17-0000-021 引言近些年我国经济取得了快速的发展,金融信息化程度也随之得以大幅的提升。
金融行业是我国国民经济的重要组成部分之一,也是市场经济的核心行业,因此重点发展金融信息化、提高金融信息化水平是我国信息化战略中一项不能或缺的内容。
金融信息化的发展促进金融市场逐步联合成一个整体,大大提高了各类相关信息的收集、处理和发布从而提高金融企业的竞争能力。
2 数据仓库的设计要求传统的金融信息管理系统大多采用c/s结构,客户直接访问生产数据库,完成信息的查询、更新、管理。
但这就存在很多缺陷,例如系统安全性不够、系统仅仅是信息的存储容器而无法达到分析预测的高度等等。
随着数据库的发展以及数据仓库技术的出现,越来越多的金融企业开始构建自己的数据仓库。
与传统的金融信息管理系统不同的是,基于数据仓库技术构建的系统不仅保留了原有系统的各种业务功能,同时在金融结构多年累积的数据的基础上,进一步加强信息查询分析预测以及报表的功能,使用户数据得以最大的利用。
数据仓库的设计应满足如下一些要求:3 建立数据仓库的基础目前投入使用的金融信息管理系统大部分是基于关系数据库(relational database service,rds)技术,因为关系数据库起步较早,发展较成熟,使用复杂性较低。
关系型数据库是构建数据仓库的基础,但仅仅是使用关系数据库也不能完全构建符合用户需求的数据仓库,还需要使用其他的数据库技术,例如,优化查询、位图索引、动态分区等,在大型数据仓库应用环境中,通过上述几项技术使关系数据库管理系统的性能极大的优化和提升。
!""#年$月%"日第$期&’()(*’)+*,-./012,&3/)()(4华南金融电脑).24%",!""#(,4$!"!"基于数据仓库的信用卡客户规则获取!滨州职业学院计算机信息科学系赵林明姜华一、引言随着信用卡业务的发展,银行积累了大量的客户交易数据,如何利用客户的特征数据和行为数据来获得客户的行为模式,从而更好地为客户服务,是信用卡分析需要迫切解决的问题。
二、数据仓库的定义著名的数据仓库专家5434’6786在其著作《9:;<=;6>?@A BC?C 5CDA@8:EA 》一书中是这样定义的:数据仓库(BC?C 5CDA@8:EA ,简称B5)是一个面向主题的(F:GHAI?,D;A6?A=)、集成的(’6?A>DC?A )、相对稳定的((86J K8<C?;<A )、反映历史变化的(0;7A KCD;C6?)数据集合,用于支持管理决策L %M 。
三、信用卡数据仓库的体系结构信用卡数据仓库的应用模型图如图%所示。
图%信用卡数据仓库应用模型图其组成包括以下四部分:第一部分是银行信用卡部门客户的特征数据和交易数据(包括历史数据、业务数据和其他数据),是信用卡现有业务系统数据源,其数据特点是分散的和难以再次利用的。
第二部分是中心数据仓库,由数据仓库和多维数据库组成,源数据经过抽取、清洗和转换之后装载到信用卡数据仓库中,数据仓库中的数据是集中的、经过了清洗和转换的,便于进行分析;存储于多维数据库中的数据是经过再次加工的,为信用卡分析与决策提供了必要的分析基础。
第三部分是应用服务层,以中心数据仓库为基础,以数据挖掘技术为核心,负责连接用户对数据仓库、多维数据库的查询访问。
第四部分是信息展示层,负责为用户展示分析后的结果,并可对展示的数据进行再次分析利用,形成最后的分析报表。
四、信用卡数据仓库的构建N 一O 、确定信用卡数据仓库主题根据信用卡系统的特点、业务需求以及建立主题的基本原则,把信用卡资信分析作为主题建立信用卡数据仓库。
N 二O 、信用卡数据仓库数据粒度层次划分数据仓库逻辑设计中要解决的一个重要问题摘要:分类器是数据挖掘的一种基本方法。
本文首先介绍了数据仓库的概念,然后讲述了信用卡数据仓库的建立过程,讨论了如何用判定树提取客户的分类规则,并对规则的正确度进行了评估。
关键词:信用卡数据仓库;客户规则获取系统技术!""#年$月%"日第$期&’()(*’)+*,-./012,&3/)()(4华南金融电脑).24%",!""#(,4$!!!!表%信用卡数据仓库年龄婚姻学历客户类型住宅性质职业职务职称月收入透支次数透支金额担保人%56!7未婚中专亏损租用其它员工其它8""6%"""%67$9%499无………………………………是确定数据仓库粒度层次划分,粒度层次划分适当与否直接影响到数据仓库的数据量和所适合的查询类型。
对于信用卡资信分析主题来说,将从前端得来的交易数据经过转换作为基础数据,按照时间进行综合,分别形成月数据、季数据。
按时间粒度层次划分如图!所示。
图!按时间粒度层次划分:三;、维表及事实表设计数据仓库的主题是由多个表来实现的,这些表是依靠主题的公共码键联系在一起的,从而形成一个完整的主题。
在信用卡系统中,以信用卡资信分析为主题的数据仓库主要涉及到信用卡客户的个人信息、职业、消费行为、家庭以及与银行的业务关系等情况,因此,信用卡数据仓库的维主要有:年龄、性别、学历、职业、职称、职务、婚姻状况、住宅性质、月收入、交易额等。
根据信用卡系统业务范围和决策分析的需要,可设计信用卡资信的星型模式。
:四;、信用卡数据仓库的实现一般而言,可以采用两种通用技术实现数据仓库。
一是将数据仓库模型构造为多维数组;另一种更常用的方法是用关系模型存放数据仓库数据,并调用关系数据库引擎将数据以多维格式展现给用户,信用卡数据仓库就是用关系模型来存放数据的。
五、信用卡客户规则获取:一;、判定树归纳算法<!=输入:训练样本>?@ABC>,由离散值属性表示;候选属性的集合?DDEFGHDCI BF>D 。
输出:一棵判定树。
算法:%4创建节点(;!4’J >?@ABC>都在同一个类*DKCL 84返回(作为叶节点,以类*标记;$4’J ?DDEFGHDI BF>D 为空DKCL74返回(节点为叶节点,标记为>?@ABC>中最普通的类;"多数表决#4选择?DDEFGHDI BF>D 中具有最高信息增益的属性DC>DI ?DDEFGHD ;94标记节点(为DC>DI ?DDEFGHD ;54&ME C?NK DC>DI ?DDEFGHD 中的已知值?F O "划分>?@ABC>P4由节点(长出一个条件为DC>DI ?DDEFGHD Q ?F的分枝;%"4设>F 是>?@ABC>中DC>DI ?DDEFGHD Q ?F 的样本集合;"一个划分%%4’J >F 为空DKCL%!4加上一个树叶,标记为>?@ABC>中最普通的类;%841B>C 加上一个由RCLCE?DCI SCNF>FMLI DECC 返回的节点。
说明:在第#步中的最高信息增益属性选取时,我们采用计算属性优度<8=的方法。
:二;、由信用卡数据构造的判定树从信用卡数据仓库中:见表%;随机提取一部分数据,经过属性删除、面向属性的归纳处理后形成!$个训练数据,其数据结构如下表,然后用判定树归纳算法进行数据挖掘构造出的判定树如图8所示。
:三;、由判定树提取客户规则我们可以提取判定树表示的知识,并以’&6031(形式的分类规则表示。
对从根到树叶的每条系统技术!""#年$月%"日第$期&’()(*’)+*,-./012,&3/)()(4华南金融电脑).24%",!""#(,4$!"!"路径创建一个规则,沿着给定路径上的每个属性5值对6形成规则前件5“’&”部分6的一个合取项。
叶结点包含类预测,形成规则后件5“031(”部分6。
由图7我们可以发现以下规则:图7判定树5%689职业:公务员;<=>类型:潜力客户正确度:%""?,覆盖度:##4#@?5!689职业:国企职员A>B 年龄:!#C 7D ;<=>类型:盈利客户正确度:%""?,覆盖度:D"?57689职业:国企职员A>B 年龄:7#C D"A>B 职称:高级;<=>类型:潜力客户正确度:%""?,覆盖度:!!4!!?5$689职业:国企职员A>B 年龄:7#C D"A>B 职称:中级;<=>类型:盈利客户正确度:E"?,覆盖度:$"?5D 689职业:其它A>B 住宅:租用;<=>类型:亏损客户正确度:@D?,覆盖度:%""?5#689职业:其它A>B 住宅:自置;<=>类型:恶意客户正确度:%""?,覆盖度:%""?我们用保留法对随机抽取的部分测试数据进行测试,规则的正确度达ED4@?。
参考文献F G %HI434’>JK>L4ML8NB8>O ;<=PA;A IAQ=R<KLS=G -H 4TK<>I8N=U7V WK>S ,’>X4%YY7G !H 5加6T8AZ=83A>等著4数据挖掘概念与技术G -H 4范明[孟小峰等译4北京:机械工业出版社,!""%G 7H5美628X<AQB T42K8O=Q 等著4数据挖掘教程G -H 4翁敬农译4北京:清华大学出版社,!""75责任编辑F 黄剑丰65上接第D7页65六6、准贷记卡透支风险分析模块其功能主要是按级别统计并汇总准贷记卡存款余额、透支余额,将透支按正常、逾期、呆滞、呆帐进行分类,统计其金额及户数,并与年初数进行对比,同时能计算各行透支率、恶意透支率、透支损失率、户均透支额。
三、系统实现系统采用数据仓库技术,每月月底从银行卡数据库中抽取相关的数据,经过清理、转换、加工后导入数据仓库,生成有规律的报表信息后,供管理人员通过浏览器在内部网中进行访问,从而方便决策支持。
系统基于M \W 模式,采用WU]AS=数据库作为服务器。
四、系统架构银行卡报表系统的结构如下图所示。
图%银行卡报表系统结构图系统目前已经投入使用,实践表明,系统的运行能够对业务数据进行规范、整理和挖掘,提升原有数据的价值,提高数据利用部门的工作效率,为银行卡科学、全面、智能的管理提供了全面的解决方案。
5责任编辑F 黄剑丰6。