当前位置:文档之家› 基于数据挖掘的电信客户细分模型研究课题分析

基于数据挖掘的电信客户细分模型研究课题分析

广东时代网络电子有限公司

电信运营商话务圈客户细分研究

课题分析

广东时代网络电子有限公司

·2011年5月

前言

国内外电信市场竞争的加剧和电信业务的发展,要求国内电信企业的运营模式,逐步向以客户为中心、以数据为中心、以信息为基础的国际先进模式转变,客户细分成为这种科学经营模式的前提和基础。目前中国电信企业对客户进行细分的方法还是基于经验或基于统计的简单划分方法,没有使客户与企业之间发生交互的信息,无法满足业务发展的复杂分析需求。随着数据挖掘技术在电信企业管理中应用的深入,采用数据挖掘方法进行多层次,多维度、有针对性客户细分交得十分重要和紧迫。国内、外业内公司在完成了信息网络和业务系统建设之后,都必然会面临如何有效采集、保管、分发和利用业务流程产生的大量原始业务信息的问题。传统的人工管理效率低、易忽略重要信息、检索和查询不便。从国外公司信息系统建设的规律和实践情况看,在行业公司建立一套电子化的业务信息采集、存储、分发、查询和利用系统,并基于该系统保存的海量信息资源衍生出与信息流转、信息提取、客户服务管理、决策支持等相关的高端应用,这已经成了一种能够切实提高行业公司信息系统管理水平、降低管理成本、挖掘信息潜在价值的先进运营模式。

本课题针对面向客户关系管理中客户细分问题,设计一个系统的基于数据挖掘的客户细分功能结构模型,探索电信企业数据的组织、处理和存储,应用数据挖掘技术和方法,实现准确、有效的客户细分,为解决电信客户细分问题提供系统的理论、技术和方法。在理论上,本文分析电信客户的特征,结合市场营销实践,提出如何在电信客户生命周期的不同阶段进行不同目的、不同内容的客户细分的理论,并对客户细分在电信市场营销中的具体功能进行了详细设计。在实践中,聚类分析是数据挖掘中的一个重要研究领域,也向来极具就战性,普遍存在一系列典型的闯题,如难以发现数据集中的形状、大小、密度不同的簇,对噪费数据敏感等,本文针对经典的K-means算法作了细致全面的分析,根据电信数据特点,指出该算法的缺点和改进方法,通过设计一个基于该算法的数据挖掘模型,将其应用到菜市公司小灵逶短信业务的客户绍分中,经过反复试验褥到了比较理想的细分结果,最后以此为基础针对不同客户群制定了有效的营销策略,建立了一个稳定的决策支持系统模型,对小灵通短信业务的推广具有缀高的实用价值;

据的获取和预处理对于数据挖掘的优劣是一个极其重要的基础性工作,本论文为此付出了大量的时闯和精力,通过对电信客户行为的分析,建立了一套完夔的短信客户细分指标体系,经过数据清洗、转换等一系列数据预处理过程,形成了数据挖掘所用的变量“宽表”,保证了模型的合理性、有效性和实用性。

目录

课题分析

2.1课题背景

伴随经济增长和社会对电信事业的巨大需求,中国电信经历了二十年的高速发展,截止到2004年底固定用户数突破6亿,手机用户达到3.1亿,排名世界第一但随着电信应用的不断普及,基础业务领域的收入已经趋于稳定和饱和,而每用户平均收入ARPU值被逐渐摊薄并出现明显下滑,电信用户的忠诚度不断降低,电信市场已经从增量竞争转向存量竞争。为提高ARPU值,各运营商纷纷致力于开发增值业务,希望其成为新的利润增长点。增值业务是针对由不同消费层次、不同用户群体所引发的多样化、个性化的市场需求展开的,业务种类丰富,单个业务用户群有明显的特征和区别,只有对用户群的属性进行详细的分析和定位,才能针对他们的特点,有的放矢地开展业务,获得高的投资回报。

在这种情况下,一种新的企业经营模式一一客户关系管理(Customer Relationship Management,简称为CRM)应运而生,近年来已经成为电信企业持续发展的重要战略之一。它是围绕“客户”开展企业的各项业务,充分与信息技术相结合,经过深入的研究和分析客户行为,针对不同客户制定出相应的营销、销售和服务策略,从而提高客户满意度,改善客户关系,在实现客户价值最大化的前提下,实现企业和客户的双赢。CRM通过对客户数据的深入分析,更加全面准确地理解客户,从而为涉及客户的商务决策提供信息支持。于是,区分不同类型客户,更好地保持和发展有价值的客户对企业来说就显得尤为重要,而这一目标便是通过客户关系管理基本功能之——客户细分来实现。

客户细分研究中的一个重要研究方向是“客户话务圈细分”,即对客户的通话对象行为做细分,而用户最重要的话务圈有两个----工作圈和家庭圈。本文拟通过数据挖掘方法针对这两个话务圈做详细的研究。以针对运营商有的放矢的开展业务,获得高的投资回报。

2.2需求概述

根据话务圈得研究目标,本文研究的系统需达到一下需求目标:

●明确话务圈得界限,区分话务圈得界限,提出话务圈的挖掘方法和挖掘技术;

●针对以挖掘的话务圈信息,进行话务圈针对性精准营销,提高营销效率;

●应用已挖掘的话务圈信息,对预离网用户进行维系挽留,并针对潜在发展客户进行

准对性精准营销;

●应用已挖掘的话务圈信息,增强圈子对客户的粘合度,提高圈子价值;

●提供统计、分析等附加功能。

方案概述

3.1系统名称

电信行业运营商“客户话务圈”分析系统。

3.2处理对象

湖北移动公司全球通、动感地带、神州行等品牌业务用户话务圈分析。

●格式化的电子信息:如计费数据库中的通话时间、通话时长、主叫号码、被叫号码、

同号码拨打次数等信息。导出的XML格式数据等。

●非格式化的电子信息:如Word文档、PDF文件、电子邮件正文、HTML页面等分

析文档。

●纸质信息:如手填表格、打印单据、签字凭证等。

3.3研究思路

首先,进行“话务圈”的需求分析,根据电信客户的特征,结合市场营销理论,提出如何在电信客户生命周期的不同阶段进行不同目的、不同内容的话务圈分群的理论,对在电信市场营销中的具体功能进行了详细设计。并通过设计一个话务圈的功能结构模型,将挖掘中会涉及的功能设计问题、方法选择问题、数据准备问题集中在一起,便于理解和比较,为选择何种方法解决话务圈细分提供了一个概括性的解决方案。

3.4技术优势

方案详解

3.5场景分析

目前电信运营商(以中国电信为例)的主要集中话务圈有以下两种。

●政企客户:通过在政企客户内部构建集群网,建立企业话务圈,收取集

群网月租费,实现企业内部固话、员工手机互打免费,降低企业沟通费

用,增强通信产品粘附力。

●家庭与个人客户:通过全家E等业务套餐,实现固话、手机本地(省内)

互打免费。降低家庭话务圈通信成本,增加家庭成员通信产品粘附力。下面分别就上述场景提供两个实例:

1、广州移动集群网服务方案:

集群网内(简称群内)通话:指主被叫为同一集群网的客户,且通话地点在广州市(含番禺、花都、从化、增城)范围内。

包月费:指集群网客户之间在广州市(含番禺、花都、从化、增城)范围内产生的全球通基本通话费总额将以固定的费用形式分别向每一集群网客户收取,统称包月费。

1、定期或不定期地检查贵单位范围内的网络信号质量,及时解决问题,充分保

障“全球通”网络信号的稳定及有效覆盖;

2、定期或不定期举行新业务“座谈会”,向贵单位介绍移动公司推出的各种新业

务,增进交流与沟通,及时高效解决贵单位提出的问题,并根据贵单位的移动需求提供移动解决方案;

3、提供基于短信应用智能化的移动办公平台,该平台具有用户信息管理、信息

发送、资料查询等功能,集团客户可以通过电脑同时向大量拥有手机的员工传送通知、信息,员工可以利用手机获取企业最新信息,以提高单位通知及

达率,进而提高工作效率、节约办公成本、推动贵单位的“移动电子商务”

办公进程。

为答谢广大客户对我公司的支持和厚爱,我公司特别对集群网客户提供一系列优惠方案:

优惠方案一

集团内部通话20元包月

1、每月只需20元包月费,集团客户之间可在广州市八区四郊市内互相通话任

打。

2、集团客户在市内使用手机拨打IP电话(17951)时,国内IP长途话费享受

50%的优惠

例如:

●某集团客户共100人,每人每天集群网内互相通话10分钟,则集团每月共

节约话费1万元,平均每人每月节约100元。

每分钟基本话费每月分钟数每月总话费按正常计

费0.4元/分钟100人×10分钟/天×30天12000元包月话费0元20元×100人2000元

可节省话

费10000元

●某集团客户在广东省内拨打17951全球通IP电话,享受IP话费5折优惠。

某集团客户共100人,每人每天拨打17951全球通IP电话10分钟,则集团每月共节约话费4500元,平均每人每月节约45元。

每分钟IP长途费用每月分钟数每月总话费按正常计费0.3元/分钟(国内)100人×10分钟/天×30天9000元按集群网计

费0.15元/分钟100人×10分钟/天×30天4500元可节省话费0.15元/分钟100人×10分钟/天×30天4500元

优惠方案二

集团内部通话40元包月

1、每月只需40元包月费,集团客户之间即可在广东省内所有城市间任打手机,所有基本通话费、长途费、漫游费全免。

2、集团客户在省内使用手机拨打IP电话(17951)时,国内IP长途话费享受50%的优惠

附加优惠

1、包月集群客户可同时办理“轻松接”套餐,无需预存120元话费,即可享受包月费5折优惠(10元/每月),在广东省内不限时免费接听中国移动网内电话(包括全球通、动感地带、神州行、神州大众卡品牌)。

例如:某集团客户共100人,每人每天接听中国移动网内电话30分钟,则集团每月共节约话费35000元,平均每人每月节约350元。

每分钟基本话

费每月分钟数每月总话费

按正常计

费0.4元/分钟100人×30分钟/天×30

天36000元

包月话费0元10元×100人1000元

可节省话

费35000元

2、包月集群客户可同时办理“亲情网”套餐,享受本人包月费全免的优惠(即

无需每月缴交10元包月费),在广州市(包括番禺、花都、增城、从化)不限时免费与亲情网内电话通话。

例如:某集团客户共100人,每人每天与亲情网内电话通话10分钟,则集团每月共节约话费12000元,平均每人每月节约120元。

每分钟基本话

费每月分钟数每月总话费

按正常计

费0.4元/分钟100人×10分钟/天×30

天12000元

包月话费0元0元×100人0元

可节省话

费12000元

2、广州电信全家E全业务套餐。

产品名称

全家e9(4M)3G版套餐(市区版)

套餐资费

宽带4M包月

套餐包含内容

套餐月费299元329元

宽带数量1条

固话数量1部

套餐内手机数量2部3-5部

固话、手机拨打国内

电话通话时长

400分钟600分钟

固话独享本地通话

时长(分钟)

不限时

手机共享上网流量每月500M手机上网流量,所有套餐内手机共享手机免费接听范围国内

超值赠

送1、全部手机和固话免月租、送来电显示,所有固话送七彩铃音功能费;

2、全部手机、固话本地互打免费;

3、每部手机每月赠送30M上网流量(手机独享);

4、赠送手机报、移动号百(基础包)、天翼Live;

5、赠送e家邮箱、e家硬盘、e家音乐。

套餐外资费固话、手机本地拨打

本地

0.11 元/分钟

固话、手机拨打国内

长途及

国内漫游拨打国内

电话

0.29元/分钟(全包)

手机上网

超出赠送流量后按0.0003元/KB收费,500元/月封顶,每月流量限

20G

国际长途优惠

国家及地区

单次通话10分

钟以内单价

(全包)

单次通话超过10分钟后单价

(全包)

香港、美国、新加坡、

泰国

0.29 元/分钟0.19 元/分钟

加拿大、韩国、马来

西亚、澳门

0.79 元/分钟0.39 元/分钟

日本、澳大利亚、台

湾、法国、德国

(仅限拨打对方固定

电话)

英国(仅限拨打对方

固话)

0.99元/分钟0.79元/分钟

台湾(仅限拨打对方

移动电话)

从上述两个场景可以看出,运营商针对客户话务圈的区分是比较粗的,仅仅针对话务圈设计了相应的套餐和优惠,是先做套餐,后寻找客户的行为,虽然捆绑IVPN,可以为企业节省话费,但是最大的风险在于他网竞争,有可能导致全体成员退网。而针对家庭客户推出的全家E套餐,虽然维系挽留功能较好,但是每个群得周边效应小。

3.6工作话务圈的识别与界限划分

实现电信客户细分,首先要对电信客户的话务圈做出识别。对一般客户来言,通常拥有工作话务圈、家庭话务圈和社交话务圈三个主要话务圈。其中,工作话务圈是指在工作时间内因工作需要,与公司内外人员进行话务沟通的线性回归圈子。家庭话务圈是指在八小时以外与家人、亲戚进行话务沟通的线性回归圈子。社交话务圈则是指工作之外的朋友或其他一些不属于工作话务圈和家庭话务圈之外的话务圈的总称。其中,工作话务圈是日常交流中话务量最对,涉及面最广,业务量最大的话务圈,是电信运营企业重点进行营销导购的主要对象,识别工作话务圈和构建界限相对明确的工作话务圈群,对电信运营商开展针对性精确营销,提高营销准确性具有非常重大的意义,本节将就本问题提供集中识别的方法并进行论证。

3.6.1电信运营商采用的客户分群理论及局限性

目前电信企业的客户一般是这样划分的:固定电话客户主要按住宅和单位进行划分,客户简单地划分为大客户、商业客户、公众客户;移动电话用户则按ARPU值被分为钻石、金、银、贵宾、普通级别。还有按照区域、年龄等变量进行的细分,或是两三个变量组合分类。这样的划分只能够回答一些客户年龄分布如何?、客户主要来自哪个区域?这类简单的问题。因为多选择单一变量、或是两三个变量组合,虽然这些划分比较容易理解,对企业的客户管理也是很有意义的,但却无法满足诸如对哪些客户的潜在价值更高、哪些客户的资信程度更高等复杂

分析需求。不能满足电信业务的作出预测。

这种客户细分方法采集自然属性为细分变量,没有与客户的消费行为特征相结合,很难进行准确的市场推广活动。而且客户自然属性数据难以获得,采用市场调查、市场抽样数据分析等方法,数据质量不可靠、客户自然属性是不断变化的,必须对客户进行长期的跟踪、如客户收入、学历、职业的变化等。加之此类细分方法多采用经验描述法和传统统计法,随着管理信息系统的广泛应用和电子商务的深入发展,企业将积累越来越多的客户数据,面对海量的客户数据,这些传统的细分方法更将显得力不从心。又由于缺乏一个动态的客户化的信息管理系统及对客户需求缺乏了解,以客户人口统计特征、心理特征、购买行为、客户忠诚度等变量进行细分还难以做到,真正为不同目标市场推出差异化策略并不多见,更多还是停留在形式上,远远不能达到为电信业务的发展提供决策支持的作用。

3.6.2话务圈的识别技术和识别工具

基于目前电信运营商采用的客户分群理论及局限性,现提出一种新的电信运营商营销理论——基于客户话务圈的针对营销技术。本技术采用数据挖掘(KDD 理论,数据库中的知识发现)技术,,并结合SPSS工具,借助大量的知识和方法,把表面的、无序的信息整合,揭示出潜在的关联性和规律,从中挖掘出潜在的模式,并对未来情况进行预测,以辅助决策者评估风险、做出正确的决策。

1)基于话务圈的识别技术输入

基于工作话务圈的识别技术输入主要包括:客户属性、客户行为、客户需求。通过对以上三个采集项信息的收集。进行如下采集分析,请见表3.1

表3.1 工作话务圈信息采集分析

目采集属性优势劣势算法应用

客户属性帐单域采集属性:

ARPU、市话张数、长话张数、

通话时长、短信张数、上网流量、

上网时长。

可计量的、可获得

难以和使用

行为联系起

可为客户推荐合适的

电信套餐。

清单域采集属性:

主叫频繁号码(5个)

被叫频繁号码(5个)

主叫通话时长最长号码(3个)

被叫通话时长最长号码(3个)

拨打最多市话号码(5个)

拨打最多长话号码(5个)

短信交互最多号码(5个)

可计量的、可获得

的、容易统计的,

易分析的

单月采集具

有偶然性,多

月采集可避

免此类偶然

通过单个用户3个月

的清单分析(可使用

简单的EXCLE工

具),基本圈定用户话

务圈(10-15个号码)

客户域采集属性:

客户收入、学历、职业的变化,

他网联系电话信息等

可计量,可获得,

不易分析

变动较为频

繁,不易统计

仅作为算法匹配参考

客户行为手机型号偏好可调查获取部分客户喜

好不定

重点的财务分析

使用增值产品可计量,可获得不可前瞻数据库可为公司增值

业务影响提供数据

拨打他网/本网服务电话张数可计量,可获得,

可统计

他网服务信

息获取难

用户忠诚度信息提供

是否有恶意欠费行为可计量,可获得,

可统计

判断恶意不

是很准

用户忠诚度信息提供

客户需求价格敏感度

可了解客户态度难以评、估确

目标客户获取及保留对促销的敏感度可了解客户态度难以获得新产品开发

品牌忠诚度

可了解客户态度难以评、估确

品牌战略

整体满意度

一定范围内可实施难以评、估确

客户需求的确认

满意的程度

一定范围内可实施难以评、估确

认识改善的机会

2)基于K-means聚类算法的工作话务圈识别技术分析工具及过程

基于数据挖掘的工作话务圈识别技术,是数据挖掘任务的应用开发基础环节。数据挖掘任务有大有小、问题及其要达到的目标各异、数据挖掘算法对数据集规模的要求、结果的表现和应用形式也不尽相同,所以一定要结合特定的业务需求,设计有效实用的话务圈模型,有针对性的进行挖掘和分析,才能取得好的效果。

主要的聚类算法可以划分为5大类:基于划分的方法(Partitioning Method),基于层次的方法(Hierarchical methods)、基于密度的方法(Density—based methods)、基于网格的方法(Grid—based methods)和基于模型的方法(Model—based methods)。

营销策略的5个组成要素为:

(1)客户细分和经营分析。即通过日常信息收集和针对性调研了解电信客户市场信息,进行有效的客户群细分,针对不同客户群制定相应的营销组合措施。

(2)产品组合和定价。明确产品组合与定价原则,不进行摧毁价值或目标不明确的产品定价,系统化、计划性地进行产品组合和定价。

(3)渠道组合。优化渠道结构,发挥渠道组合优势。

(4)针对性广告和促销。针对一定客户群进行产品和资费宣传,应用针对性渠道进行产品和资费宣传。

(5)忠诚度管理。通过高危预警、忠诚度计划等方法延长用户在网生命周期;通过离网用户跟踪与离网赢回方法赢回己离网用户。

电信客户话务圈识别、生命周期管理和营销方案制定是立体交叉的关系,如图3.1所示。营销方案如果能针对不同分类客户的生命周期不同阶段,按照营销策略的5要素来详细制定,一定能有的放矢,更有效、更成功。

图3.1 基于客户细分的营销方案模型

下面就K-means聚类算法在识别话务圈方面做具体说明:

本文档隐去K-means聚类算法的具体过程,仅就算法做简要说明,如欲详细了解算法,请查看本文附件文档。本文将以中国电信天翼手机工作话务圈为例说明这种方法。

K-means聚类算法简介:

算法过程如下:

1)从N个主叫频繁号码中随机选取K个联系人(K<=N)作为质心

2)对剩余的主叫号码测量其到每个质心的距离,并把它归到最近的质心的类

3)重新计算已经得到的各个类的质心

4)迭代2~3步直至新的质心与原质心相等或小于指定阀值,算法结束

具体如下:

输入:k, call[n];

(1)选择k个主叫号码,例如c[0]=call[0],…c[k-1]=call[k-1];

(2)对于call[0]….call[n],分别与c[0]…c[n-1]比较,假定与

c[i]差值最少,就标记为i;

(3)对于所有标记为i点,重新计算c[i]={ 所有标记为i的call[j]之和}/标记为i的个数;

(4)重复(2)(3),直到所有c[i]值的变化小于给定阈值。

例子:

例如对于号码:133********进行K-means聚类算法分析,识别出133********的工作话务圈及家庭话务圈。

1)先将133********的20110201-20110228全月清单导出,具体见附件。1)从N个主叫频繁号码中随机选取3个联系人(K<=N)作为质心。

选取:189********,通话次数:39次 132********,通话次数:7次,134********,通话次数:12次。每次通话记1分,得到三个主要联系人的话务质心为:(189********,16)

然后优选高于16的对端号码,对端189********的质心统计(133********,12),则可初步将133********与189********识别为一个话务圈。

2)依次类推:将于133********,189********,重叠率第二的质心做对端验证,可扩充为4个号码,话务圈增加。

3)依次迭代10次,可以找到1024个号码的关联关系。

4)对这1024个号码进行号码筛选,筛选出现频率最多的50%的号码,初步得到500规模的话务圈,集成话务圈得到识别。

相关主题
文本预览
相关文档 最新文档