航空公司客户价值分析PPT课件
- 格式:ppt
- 大小:1.29 MB
- 文档页数:19
大数据分析技术-航空公司客户价值分析(一)实验内容:1.复习第一节课讲述的数据挖掘建模总体流程2.对航空公司客户数据进行分析,了解航空公司现状和客户情况3.完成航空公司客户价值分析总体流程步骤的构建4.对数据中存在的缺失值和异常值进行处理5.结合RFM模型进行特征筛选6.对筛选后的数据进行标准化7.练习使用python选取构建LRFMC模型所需的特征实验过程(请用简单的文字描述):1.复习第一节课讲述的数据挖掘建模总体流程2.对航空公司客户数据进行分析,了解航空公司现状和客户情况3.完成航空公司客户价值分析总体流程步骤的构建4.对数据中存在的缺失值和异常值进行处理5.结合RFM模型进行特征筛选6.对筛选后的数据进行标准化7.练习使用python选取构建LRFMC模型所需的特征# 这里简单的说明一下数据挖掘建模总体流程# 1.问题定义# 2.数据获取# 3.数据清洗# 4.缺失值处理# 5.特征选择# 6.数据集划分# 7.模型建立# 8.模型性能检测与分析# 9.预测结果实验详细操作步骤或程序清单:# 该程序主要用于实现练习使用python选取构建LRFMC模型所需的特征import numpy as npimport pandas as pdfrom sklearn.cluster import KMeans #导入kmeans算法airline_scale = np.load('F:\火线时刻\\airline_scale.npz')['arr_0']k = 5 ## 确定聚类中心数#构建模型kmeans_model = KMeans(n_clusters = k,n_jobs=4,random_state=123)fit_kmeans = kmeans_model.fit(airline_scale) #模型训练kmeans_model.cluster_centers_ #查看聚类中心kmeans_bels_ #查看样本的类别标签#统计不同类别样本的数目r1 = pd.Series(kmeans_bels_).value_counts()print('最终每个类别的数目为:\n',r1)# 该程序主要用于实现结合RFM模型进行特征筛选import pandas as pdimport numpy as np# 1.读取数据集data = pd.read_csv('F:\火线时刻\\air_data.csv',encoding='gb18030')# 2.数据清洗# 2.1缺失值处理data1 = data['SUM_YR_1'].notnull()data2 = data['SUM_YR_2'].notnull()data3 = data1 & data2env_data = data.loc[data3,:]# 2.2异常值处理index1 = env_data['SUM_YR_1'] != 0idnex2 = env_data['SUM_YR_2'] != 0index3 = (env_data['SEG_KM_SUM'] > 0) & (env_data['avg_discount'] != 0)airline = env_data[(index1 | idnex2) & index3]# 3.选取需求特征airline_selection = airline[["FFP_DATE","LOAD_TIME","FLIGHT_COUNT","LAST_TO_END","avg_discount" ,"SEG_KM_SUM"]]# 4.构建L特征L = pd.to_datetime(airline_selection["LOAD_TIME"]) - pd.to_datetime(airline_selection["FFP_DATE"])L = L.astype("str").str.split().str[0]L = L.astype("int")/30# 5.合并特征airline_features = pd.concat([L,airline_selection.iloc[:,2:]],axis = 1)print('构建的LRFMC特征前5行为:\n',airline_features.head())# 该程序主要用于实现对航空公司客户数据进行分析,了解航空公司现状和客户情况# 主要分析数据中的一些最大值,最小值,均值等这些数据特征,其中由于数据中的很多列没有分析的必要,所以我们只对一些列数据进行分析# 对于数据分析的具体操作,这里采用sklearn进行import pandas as pdimport numpy as npfrom sklearn.preprocessing import StandardScaler # 用于对数据进行标准差标准化from sklearn.model_selection import train_test_split # 用于划分数据集# 1.读取数据集data = pd.read_csv('F:\火线时刻\\air_data.csv',encoding='gb18030')# 2.分析数据# 2.1分析数据的基本信息print('air_data数据集的长度为:', len(data))print('air_data数据集的类型为:', type(data))# 2.2分析数据的数值特征信息# a.先获取数据,此时获取EP_SUM_YR_2air_data = np.array(data[['EP_SUM_YR_2']])print('EP_SUM_YR_2列列数据的最大值为:', np.max(air_data))print('EP_SUM_YR_2列列数据的最小值为:', np.min(air_data))print('EP_SUM_YR_2列列数据的平均值为:',np.mean(air_data))# b.然后获取数据,此时获取Points_Sumair_data = np.array(data[['Points_Sum']])print('Points_Sum列数据的最大值为:', np.max(air_data))print('Points_Sum列数据的最小值为:', np.min(air_data))print('Points_Sum列数据的平均值为:',np.mean(air_data))# c.然后获取数据,此时获取PPoint_NotFlightair_data = np.array(data[['Point_NotFlight']])print('PPoint_NotFlight列数据的最大值为:', np.max(air_data))print('PPoint_NotFlight列数据的最小值为:', np.min(air_data))print('PPoint_NotFlight列数据的平均值为:',np.mean(air_data))# 该程序主要用于实现对数据中存在的缺失值和异常值进行处理import pandas as pdimport numpy as np# 1.读取数据data = pd.read_csv('F:\火线时刻\\air_data.csv',encoding='gb18030')# print(data.shape)# print(data)# 2.数据清洗(在读取完数据之后,我们开始进行数据的清洗)# 在分析完数据集之后,发现数据集中存在票价为空的数据,显然这些数据是一些缺失值# 发现此时的数据集中存在两个数据列是关于票价的SUM_YR_1,SUM_YR_2,所以我们要分别进行处理# 2.1缺失值处理data1 = data['SUM_YR_1'].notnull()data2 = data['SUM_YR_2'].notnull()data3 = data1 & data2env_data = data.loc[data3,:]# print(env_data)print('删除缺失记录之后数据集的形状为:',env_data.shape)# 2.2异常值处理# 进行对数据集的观察,发现此时的数据集中存在票价为零的,和平均折扣率为0且总飞行公里数等于0的记录# 所以此时我们要对这些数据进行处理,即进行删除index1 = env_data['SUM_YR_1'] != 0idnex2 = env_data['SUM_YR_2'] != 0index3 = (env_data['SEG_KM_SUM'] > 0) & (env_data['avg_discount'] != 0)airline = env_data[(index1 | idnex2) & index3]print('删除异常记录之后的数据集的形状为:',airline.shape)# 该程序主要用于实现对筛选后的数据进行标准化import pandas as pdimport numpy as npfrom sklearn.preprocessing import StandardScaler# 1.读取数据集data = pd.read_csv('F:\火线时刻\\air_data.csv',encoding='gb18030')# 2.数据清洗# 2.1缺失值处理data1 = data['SUM_YR_1'].notnull()data2 = data['SUM_YR_2'].notnull()data3 = data1 & data2env_data = data.loc[data3,:]# 2.2异常值处理index1 = env_data['SUM_YR_1'] != 0idnex2 = env_data['SUM_YR_2'] != 0index3 = (env_data['SEG_KM_SUM'] > 0) & (env_data['avg_discount'] != 0)airline = env_data[(index1 | idnex2) & index3]# 3.选取需求特征airline_selection = airline[["FFP_DATE","LOAD_TIME","FLIGHT_COUNT","LAST_TO_END","avg_discount" ,"SEG_KM_SUM"]]# 4.构建L特征L = pd.to_datetime(airline_selection["LOAD_TIME"]) - pd.to_datetime(airline_selection["FFP_DATE"])L = L.astype("str").str.split().str[0]L = L.astype("int")/30# 5.合并特征airline_features = pd.concat([L,airline_selection.iloc[:,2:]],axis = 1)# 6.对数据进行标准化data = StandardScaler().fit_transform(airline_features)np.savez('F:\火线时刻\\airline_scale.npz',data)print('标准化后LRFMC五个特征为:\n',data[:5,:])实验环境:pycharm Python实验结果(上传实验结果截图或者简单文字描述):疑难小结(总结个人在实验中遇到的问题或者心得体会):心得体会:明白了对航空公司客户价值分析总体流程步骤的构建1.从数据源中获取数据1.1选择性获取(历史数据)1.2新增信息提取(增量数据)2.读数据进行预处理2.1数据清洗2.2特征构建2.3数据标准化3.分析与建模3.1建模数据基于客户LRFMC的分群3.2预处理后的增量数据模型分析客户价值排名模型应用4.结果反馈应用结果。
航空公司客户价值分析作者:柳睿来源:《财讯》2018年第09期航空市场竞争的加煎和航空业的发展,要求国内航空公司必须利用大量数据中隐含的知识才能抓住时机。
如此,客户是企业至关重要的成功因素和利润来源。
将数据挖掘、机器学习技术应用于客户关系管理,能够为企业提供经营和决策的量化依据,使企业能够把握重点,分轻重急缓,有效利用有限资源,拓展利润上升空间。
针对客户关系管理中客户价值这一问题,通过对航空公司现有数据仓库中客户信息的分析,本文采用RFM模型得到必要指标变量,再运用Kmeans算法对RFM所褥出的指标进行聚类,将客户群逊分为价值不同的五类客户群,并对每个客户群进行分析和总结,提出了针对每类客户群的营销策略。
RMF模型客户价值分析 Kmeans背景介绍航空公司同样也面临这样的何如划分客户群的问题,而客户细分就是能够解决这种问题的关键。
国内某航空公司市场面临旅客流失、资源为充分利用等经营危机。
因此本文的日标足利用某航空公司的会员档案信息和其航班乘坐记录,通过建市合理的客户价值评估模型,对客户进行分群,分析比较不同客户群的客户价值,并制定相应的个性化营销策略。
本文运用RFM 模型对客户分类。
数据描述与预处理(1)数据统计分析原始数据含有44个变量属性,我们对原始数据有个初步的描述理解。
由数据可知男性在观测窗几内飞行次数远超与女性。
会员级别为4的客户飞行次数最多,其次足会员级别为5的客户,会员级别为6的客户飞行次数最少,可以知道级别越高(4级最高,6级最低)飞行次数越多,可能是由于级别越高,得到的折扣率相对较高。
(2)数据预处理在本案例中,以2014年3月31日为结束时间,选取宽度为两年的时间段作为分析观测窗口(也就是时间间隔为2012年4月1H至2014年3月31日),抽取观测窗几以内有乘机记录的所有客户的详细数据形成历史数据,并将数据分为三个维度,分别是客户基本信息、乘机信息和积分信息,总共包含会员卡号、入会时间、年龄、工作地所在省份、观测窗口的结束时间、乘机积分、飞行公里数等44个变量属性。
python数据分析与挖掘实战---航空公司客户价值分析航空公司客户价值分析⼀、背景与挖掘⽬标客户关系管理是企业的核⼼问题,关键在于客户的分类:区别⽆价值客户,⾼价值客户,针对不同客户群体有的放⽮投放具体服务⽅案,实现企业利润最⼤化的⽬标。
各⼤航空公司采取优惠措施喜迎更多客户,国内航司⾯对客户流失和资源未完全利⽤等危机,因此建⽴⼀个客户价值评估模型来实现对客户的分类。
⼆、分析⽅法与过程本次的分析⽬的在于客户价值识别,客户价值识别最常⽤的模型是RFM模型:R(最近消费时间间隔)F(消费频率)M(消费⾦额)。
飞机票价取决于飞⾏距离和仓位等级,消费同等⾦额票价的旅客对航司的价值不⼀定相同:购买短程头等舱的旅客和购买长途经济舱的旅客,明显前者对航司的贡献更⼤。
所以对M(消费⾦额)建模时要进⾏修改:⽤⾥程数平均值M和仓位折扣系数平均值C来代替消费的⾦额。
同时,考虑旅客中,加⼊会员的时间越长,客户的潜在价值⼀般越⾼,所以定义⼀个客户关系长度L,作为区分客户的另⼀指标。
接下来针对LRFMC模型,对客户进⾏区分。
LRFMC模型:(1)客户关系长度L:航空公司会员时间的长短。
(2)是消费时间间隔R。
(3)消费频率F。
(4) 飞⾏⾥程M。
(5) 折扣系数的平均值C。
LRFMC模型指标含义:(1) L:会员⼊会时间距观测窗⼝结束的⽉数。
(2) R:客户最近⼀次乘坐公司飞机距离观测窗⼝结束的⽉数。
(3) F:客户在观测窗⼝内乘坐公司飞机的次数。
(4) M:客户在观测窗⼝内累计的飞⾏⾥程碑。
(5) C:客户在观测窗⼝内乘坐仓位所对应的折扣系数的平均值。
⽅法:本案例采⽤聚类的⽅法,通过对航空公司客户价值的LRFMC模型的五个指标进⾏K-Means聚类,识别客户价值。
三、数据描述给出所有属性的基本信息,共25个属性,均⽆⼤量缺失现象或缺失现象很少。
四、建模1、数据探索分析对数据进⾏缺失值分析与异常值分析,分析出数据的规律以及异常值查找每列属性观测值个数,最⼤值,最⼩值。
航空公司工作人员的客户心理分析和服务方法航空公司的工作人员扮演着至关重要的角色,他们面对着来自世界各地的乘客,需要处理各种不同的情绪和需求。
本文将分析航空公司工作人员需要了解的客户心理,并提供一些有效的服务方法。
第一部分:客户心理分析1. 了解乘客的情绪状态航空旅行可能会引发乘客的焦虑、压力或兴奋等情绪。
工作人员应该学会观察和倾听乘客的言谈举止,从而了解他们的情绪状态。
例如,有些乘客可能因为紧张而显得急躁,而另一些乘客可能在旅行前感到兴奋。
了解他们的情绪状态将有助于工作人员更好地应对并提供相应的服务。
2. 处理不同需求的能力乘客的需求各不相同,从订餐到座位调整,以及航班延误的处理等。
工作人员应该具备灵活的处理能力,能够快速判断乘客的需求,并提供适当的帮助。
在解决问题时,工作人员需要以友好和专业的态度与乘客进行沟通,以确保他们感到被重视和满足。
3. 理解不同文化差异航空公司服务的乘客来自世界各地,拥有不同的文化背景和价值观。
工作人员需要了解并尊重这些差异。
他们应该具备跨文化交流的能力,善于倾听和理解乘客的文化需求,并以尊重和包容的态度对待每一位乘客。
第二部分:服务方法1. 提供友好和专业的服务航空公司工作人员应该始终以友好和专业的态度对待乘客。
无论面对何种情况,他们应展示出耐心和尊重,并通过亲切的笑容和礼貌的言辞让乘客感到受到重视和尊重。
在提供服务的过程中,工作人员需要保持高度的专业水准以确保乘客的舒适和满意。
2. 主动解决问题当乘客遇到问题或面临困难时,航空公司工作人员应该主动提供帮助和解决方案。
他们应尽可能地满足乘客的需求,并热情地回答各种问题。
同时,工作人员应提供实时的信息更新,例如航班延误或取消的通知,以帮助乘客及时做出调整。
3. 提供个性化的服务航空公司工作人员可以通过提供个性化的服务来赢得乘客的好感。
比如,记录乘客的偏好,例如喜欢的饮料或餐点,下次再次乘坐时主动提供。
此外,工作人员可以积极关注乘客的特殊需求,例如小孩或老年人的照顾,以提供更贴心的服务体验。
数据挖掘大作业题目:航空公司客户价值分析目录一、任务背景 (2)二、数据挖掘目标 (2)三、数据探索与预处理 (3)构建航空客户价值分析的关键特征 (3)数据抽取 (5)探索性分析 (5)数据处理 (6)四、模型构建与评价 (12)1.模型构建K-Means聚类算法 (12)客户价值分析 (13)五、总结 (16)一、任务背景高铁、动车等铁路的不断兴建,出行方式的多元化让航空公司受到很大的冲击。
航空公司之间竞争也很激烈,除了四大航空公司之间的竞争之外,还有新兴产业的各类小型航空公司、民营航空公司,旅游等。
甚至国外航线出现高速度增长。
随着时代的发展,客户问题越来越受到关注,客户流失对利润增长造成了非常大的负面影响。
客户与航空公司的关系越长,航空公司的利润就越高。
一个客户使用了几次这次服务,感觉服务不错,那下次还会倾向于这个服务,但是要获得新客户,不仅需要在广告和人员工资上花费很多,去吸引顾客,在销售、市场也会花费很多,并且大多数新客户产生的利润不如那些流失的老客户多。
很明显,失去一个客户对公司来说比得到一个新客户更昂贵。
另外老用户也可以带来新用户。
因此,在这一背景下,分析航空公司客户数据,对客户进行分类,提高客户流失率是当务之急。
航空公司应针对不同类型的客户制定相应的营销模式,以实现利润最大化。
二、数据挖掘目标按航空公司客户数据进行分类。
分析了不同类型顾客的特点,比较不同类型顾客的顾客价值。
可以为不同价值客户类别提供个性化服务,并采用相应的营销策略。
分类客户的目的,就是要更精确地说明谁是我们的客户,了解客户到底有哪些实际需要,企业应该去吸引哪些客户,哪些客户应该被重点保留,以及应该如何迎合重点客户的需求等重要问题,进而使客户关系管理真正成为业务获得成功、扩大产品销量的催化剂。
客户分类是客户关系管理的核心。
帕累托定律(2/8定律):就是20%的顾客给企业带来80%的销售利润。
20%的客户其利润率达到100%。
航空客户忠诚度与航空客户忠诚度与价值分析价值分析价值分析摘 要:根据对客户保持的研究表明“顾客忠诚度提高5%,企业利润将增加25.125%”,建立新客户的难度是保持老客户的5-10倍,维系老客户的营销成本远远低于获取新客户的成本。
本文基于国内某航空公司超过60000个会员数据,结合现有成熟的客户管理模型,在对数据样本集进行预处理后通过数理统计的方法对样本属性进行相关性分析,挑选出对构建行为忠诚度模型高影响的因子,构建客户的忠诚度价值模型。
同时基于客户价值区分RFM 分析法,建立基于均值的RFM 模型、基于聚类的RFM 模型和基于PCA 处理后的RFM 模型对客户价值水平分类,且评估三种不同的方法在客户分类上的侧重点。
关键词关键词::客户管理;忠诚度;RFM;相关性分析;聚类;PCA;价值分类Aviation customer loyalty and value analysisAbstract: According to customers's research suggests that "the customer loyalty increase 5%, corporate profits will increase by 25.125%", set up the difficulty of the new customer is 5 to 10 times to keep old customers, maintain old customers marketing costs well below the cost to acquire new customers. This article is based on a domestic airline by more than 60000 members, combined with the existing mature customer management model, after preprocessing the data set by mathematical statistics method, correlation analysis was carried out on the sample properties, pick out the high influence factor for the construction of behavior loyalty model, build the loyalty of the customer value model. Based on the customer value to distinguish the RFM analysis at the same time, based on the mean of the RFM model, the RFM model based on clustering and the RFM model based on PCA after processing level of customer value classification, and evaluation of three different methods to focus on customer classification.Key words: Customer management; Loyalty; RFM; Correlation analysis; Clustering; PCA; Value of classification目 录1.研究目标 (4)2.分析方法与过程 (4)2.1.总体流程 (4)2.2.具体步骤 (7)2.3.结果分析 (8)3.结论 (13)4.参考文献 (14)1.挖掘目标挖掘目标本次建模目标是利用太普公司提供的62988个航空公司的样本数据,其中包括有63个属性,共8个季度用户飞行的真实数据[1]。
基于机器学习的航空客户价值分析研究近年来,随着机器学习技术的迅速发展与普及,基于机器学习技术的航空客户价值分析逐渐成为了航空公司关注的热点问题。
通过挖掘海量的客户数据,运用机器学习算法分析这些数据,航空公司不仅可以深入了解客户的兴趣、需求、行为等方面的信息,还能够找到客户的潜在价值并加以挖掘,从而提高客户忠诚度和订单量,实现差异化竞争优势。
一、机器学习在航空客户价值分析中的应用随着“大数据”时代的到来,航空公司不仅拥有了海量的客户数据,还拥有了处理这些数据的更先进的技术手段。
在传统的分析方法中,一般通过客户满意度调查、问卷调查等手段来了解客户需求和行为,但这种方法存在一定的主观性和局限性。
而基于机器学习的方法则通过挖掘海量的客户数据,分析这些数据中的规律和潜在关联,进而发现客户的兴趣、需求、行为等方面的信息,从而实现更精准、更客观、更全面的客户价值分析。
机器学习通常包括监督学习、非监督学习、半监督学习、强化学习等几种技术手段。
其中,监督学习通常应用于分类、预测等方面;非监督学习则用于数据聚类、降维等方面;半监督学习则结合了监督和非监督学习的优点,更加灵活;强化学习则是一种在交互式环境中,通过对行为反馈的观察和学习,来实现智能决策的方法。
在航空客户价值分析中,机器学习技术可以应用于如下几个方面:1.航空客户分类客户分类是航空客户价值分析中的一个重要环节,可以将客户分为不同的类别,进而针对不同的客户类别实施不同的营销策略。
机器学习算法可以根据客户的历史行为、消费记录、航班偏好等多种因素,建立客户分类模型,并将客户分为潜在高价值客户、普通客户、潜在低价值客户等不同类别,以此为基础制定不同的客户服务和营销策略。
2.预测客户需求和行为预测客户未来的需求和行为对航空公司来说具有重要意义。
通过机器学习算法对客户历史数据进行分析,可以有效预测客户未来的出行需求、购买偏好、航班选择等行为,航空公司可以根据这些预测结果,提高客户体验,加强客户关系维护。
RFM模型是衡量客户价值和客户创利能力的重要工具和手段,它通过一个客户的近期购买行为、购买的总体频次以及购买的总体金额三个指标来描述客户的价值状况。
分别为:最近消费时间间隔(Recently)、消费频率(Frequency)、消费金额(Money)。
在RFM模型的基础上,结合具体的业务背景,来对航空公司进行客户价值分析。
我们选择在一定时间内累积的飞行里程数(M)和客户在一定时间内乘坐舱位对应的折扣系数的平均值C来代替消费金额指标。
此外,航空公司会员入会时间的长短在一定时间内会影响客户价值,模型中增加了客户关系长度指标L。
利用客户入会时长L、消费时间间隔R、消费频率F、飞行里程数M以及折扣系数的平均值C来作为航空公司识别客户价值指标,见表1,记为LRFMC模型。
采用聚类分析的方法识别客户价值。
通过对航空公司客户价值LRFMC五个指标进行K-Means聚类,识别最有价值客户。
1、数据抽取以2014年3月31日为结束时间,选取宽度为两年的时间段作为分析观测窗口,抽取观测窗口内有乘机记录的所有客户的详细数据形成历史数据。
对于后续新增的客户详细信息,以后续新增数据中最新的时间点作为结束时间,采用上述同样的方法进行抽取,形成增量数据。
2、数据探索分析主要是进行缺失值分析和异常值分析,通过对数据的观察,发现原始数据中存在票价为空值,票价最小值为0、折扣率最小值为0、总飞行公里数大于0的记录,这个都是属于缺失值和异常值的范畴。
# 设置工作空间# 把“数据及程序”文件夹拷贝到F盘下,再用setwd设置工作空间setwd("F:/数据及程序/chapter7/示例程序")# 数据读取datafile <- read.csv('./data/air_data.csv', header = TRUE)# 确定要探索分析的变量col <- c(15:18, 20:29) # 去掉日期型变量# 输出变量最值、缺失情况summary(datafile[, col])#探索缺失数据的模式md.pattern(datafile[,col])#以图形方式描述缺失数据aggr(datafile[,col],number=T)3、数据预处理由于原始数据量比较大,上述被定义为缺失值和异常值的样本量很小,对问题的分学习影响不大,因此选择的是剔除缺失值和异常值。