航空公司客户价值分析PPT课件

合集下载

大数据分析技术-航空公司客户价值分析(一)

大数据分析技术-航空公司客户价值分析(一)

大数据分析技术-航空公司客户价值分析(一)实验内容:1.复习第一节课讲述的数据挖掘建模总体流程2.对航空公司客户数据进行分析,了解航空公司现状和客户情况3.完成航空公司客户价值分析总体流程步骤的构建4.对数据中存在的缺失值和异常值进行处理5.结合RFM模型进行特征筛选6.对筛选后的数据进行标准化7.练习使用python选取构建LRFMC模型所需的特征实验过程(请用简单的文字描述):1.复习第一节课讲述的数据挖掘建模总体流程2.对航空公司客户数据进行分析,了解航空公司现状和客户情况3.完成航空公司客户价值分析总体流程步骤的构建4.对数据中存在的缺失值和异常值进行处理5.结合RFM模型进行特征筛选6.对筛选后的数据进行标准化7.练习使用python选取构建LRFMC模型所需的特征# 这里简单的说明一下数据挖掘建模总体流程# 1.问题定义# 2.数据获取# 3.数据清洗# 4.缺失值处理# 5.特征选择# 6.数据集划分# 7.模型建立# 8.模型性能检测与分析# 9.预测结果实验详细操作步骤或程序清单:# 该程序主要用于实现练习使用python选取构建LRFMC模型所需的特征import numpy as npimport pandas as pdfrom sklearn.cluster import KMeans #导入kmeans算法airline_scale = np.load('F:\火线时刻\\airline_scale.npz')['arr_0']k = 5 ## 确定聚类中心数#构建模型kmeans_model = KMeans(n_clusters = k,n_jobs=4,random_state=123)fit_kmeans = kmeans_model.fit(airline_scale) #模型训练kmeans_model.cluster_centers_ #查看聚类中心kmeans_bels_ #查看样本的类别标签#统计不同类别样本的数目r1 = pd.Series(kmeans_bels_).value_counts()print('最终每个类别的数目为:\n',r1)# 该程序主要用于实现结合RFM模型进行特征筛选import pandas as pdimport numpy as np# 1.读取数据集data = pd.read_csv('F:\火线时刻\\air_data.csv',encoding='gb18030')# 2.数据清洗# 2.1缺失值处理data1 = data['SUM_YR_1'].notnull()data2 = data['SUM_YR_2'].notnull()data3 = data1 & data2env_data = data.loc[data3,:]# 2.2异常值处理index1 = env_data['SUM_YR_1'] != 0idnex2 = env_data['SUM_YR_2'] != 0index3 = (env_data['SEG_KM_SUM'] > 0) & (env_data['avg_discount'] != 0)airline = env_data[(index1 | idnex2) & index3]# 3.选取需求特征airline_selection = airline[["FFP_DATE","LOAD_TIME","FLIGHT_COUNT","LAST_TO_END","avg_discount" ,"SEG_KM_SUM"]]# 4.构建L特征L = pd.to_datetime(airline_selection["LOAD_TIME"]) - pd.to_datetime(airline_selection["FFP_DATE"])L = L.astype("str").str.split().str[0]L = L.astype("int")/30# 5.合并特征airline_features = pd.concat([L,airline_selection.iloc[:,2:]],axis = 1)print('构建的LRFMC特征前5行为:\n',airline_features.head())# 该程序主要用于实现对航空公司客户数据进行分析,了解航空公司现状和客户情况# 主要分析数据中的一些最大值,最小值,均值等这些数据特征,其中由于数据中的很多列没有分析的必要,所以我们只对一些列数据进行分析# 对于数据分析的具体操作,这里采用sklearn进行import pandas as pdimport numpy as npfrom sklearn.preprocessing import StandardScaler # 用于对数据进行标准差标准化from sklearn.model_selection import train_test_split # 用于划分数据集# 1.读取数据集data = pd.read_csv('F:\火线时刻\\air_data.csv',encoding='gb18030')# 2.分析数据# 2.1分析数据的基本信息print('air_data数据集的长度为:', len(data))print('air_data数据集的类型为:', type(data))# 2.2分析数据的数值特征信息# a.先获取数据,此时获取EP_SUM_YR_2air_data = np.array(data[['EP_SUM_YR_2']])print('EP_SUM_YR_2列列数据的最大值为:', np.max(air_data))print('EP_SUM_YR_2列列数据的最小值为:', np.min(air_data))print('EP_SUM_YR_2列列数据的平均值为:',np.mean(air_data))# b.然后获取数据,此时获取Points_Sumair_data = np.array(data[['Points_Sum']])print('Points_Sum列数据的最大值为:', np.max(air_data))print('Points_Sum列数据的最小值为:', np.min(air_data))print('Points_Sum列数据的平均值为:',np.mean(air_data))# c.然后获取数据,此时获取PPoint_NotFlightair_data = np.array(data[['Point_NotFlight']])print('PPoint_NotFlight列数据的最大值为:', np.max(air_data))print('PPoint_NotFlight列数据的最小值为:', np.min(air_data))print('PPoint_NotFlight列数据的平均值为:',np.mean(air_data))# 该程序主要用于实现对数据中存在的缺失值和异常值进行处理import pandas as pdimport numpy as np# 1.读取数据data = pd.read_csv('F:\火线时刻\\air_data.csv',encoding='gb18030')# print(data.shape)# print(data)# 2.数据清洗(在读取完数据之后,我们开始进行数据的清洗)# 在分析完数据集之后,发现数据集中存在票价为空的数据,显然这些数据是一些缺失值# 发现此时的数据集中存在两个数据列是关于票价的SUM_YR_1,SUM_YR_2,所以我们要分别进行处理# 2.1缺失值处理data1 = data['SUM_YR_1'].notnull()data2 = data['SUM_YR_2'].notnull()data3 = data1 & data2env_data = data.loc[data3,:]# print(env_data)print('删除缺失记录之后数据集的形状为:',env_data.shape)# 2.2异常值处理# 进行对数据集的观察,发现此时的数据集中存在票价为零的,和平均折扣率为0且总飞行公里数等于0的记录# 所以此时我们要对这些数据进行处理,即进行删除index1 = env_data['SUM_YR_1'] != 0idnex2 = env_data['SUM_YR_2'] != 0index3 = (env_data['SEG_KM_SUM'] > 0) & (env_data['avg_discount'] != 0)airline = env_data[(index1 | idnex2) & index3]print('删除异常记录之后的数据集的形状为:',airline.shape)# 该程序主要用于实现对筛选后的数据进行标准化import pandas as pdimport numpy as npfrom sklearn.preprocessing import StandardScaler# 1.读取数据集data = pd.read_csv('F:\火线时刻\\air_data.csv',encoding='gb18030')# 2.数据清洗# 2.1缺失值处理data1 = data['SUM_YR_1'].notnull()data2 = data['SUM_YR_2'].notnull()data3 = data1 & data2env_data = data.loc[data3,:]# 2.2异常值处理index1 = env_data['SUM_YR_1'] != 0idnex2 = env_data['SUM_YR_2'] != 0index3 = (env_data['SEG_KM_SUM'] > 0) & (env_data['avg_discount'] != 0)airline = env_data[(index1 | idnex2) & index3]# 3.选取需求特征airline_selection = airline[["FFP_DATE","LOAD_TIME","FLIGHT_COUNT","LAST_TO_END","avg_discount" ,"SEG_KM_SUM"]]# 4.构建L特征L = pd.to_datetime(airline_selection["LOAD_TIME"]) - pd.to_datetime(airline_selection["FFP_DATE"])L = L.astype("str").str.split().str[0]L = L.astype("int")/30# 5.合并特征airline_features = pd.concat([L,airline_selection.iloc[:,2:]],axis = 1)# 6.对数据进行标准化data = StandardScaler().fit_transform(airline_features)np.savez('F:\火线时刻\\airline_scale.npz',data)print('标准化后LRFMC五个特征为:\n',data[:5,:])实验环境:pycharm Python实验结果(上传实验结果截图或者简单文字描述):疑难小结(总结个人在实验中遇到的问题或者心得体会):心得体会:明白了对航空公司客户价值分析总体流程步骤的构建1.从数据源中获取数据1.1选择性获取(历史数据)1.2新增信息提取(增量数据)2.读数据进行预处理2.1数据清洗2.2特征构建2.3数据标准化3.分析与建模3.1建模数据基于客户LRFMC的分群3.2预处理后的增量数据模型分析客户价值排名模型应用4.结果反馈应用结果。

航空公司客户价值分析-航空公司客户价值分析实战

航空公司客户价值分析-航空公司客户价值分析实战

航空公司客户价值分析作者:柳睿来源:《财讯》2018年第09期航空市场竞争的加煎和航空业的发展,要求国内航空公司必须利用大量数据中隐含的知识才能抓住时机。

如此,客户是企业至关重要的成功因素和利润来源。

将数据挖掘、机器学习技术应用于客户关系管理,能够为企业提供经营和决策的量化依据,使企业能够把握重点,分轻重急缓,有效利用有限资源,拓展利润上升空间。

针对客户关系管理中客户价值这一问题,通过对航空公司现有数据仓库中客户信息的分析,本文采用RFM模型得到必要指标变量,再运用Kmeans算法对RFM所褥出的指标进行聚类,将客户群逊分为价值不同的五类客户群,并对每个客户群进行分析和总结,提出了针对每类客户群的营销策略。

RMF模型客户价值分析 Kmeans背景介绍航空公司同样也面临这样的何如划分客户群的问题,而客户细分就是能够解决这种问题的关键。

国内某航空公司市场面临旅客流失、资源为充分利用等经营危机。

因此本文的日标足利用某航空公司的会员档案信息和其航班乘坐记录,通过建市合理的客户价值评估模型,对客户进行分群,分析比较不同客户群的客户价值,并制定相应的个性化营销策略。

本文运用RFM 模型对客户分类。

数据描述与预处理(1)数据统计分析原始数据含有44个变量属性,我们对原始数据有个初步的描述理解。

由数据可知男性在观测窗几内飞行次数远超与女性。

会员级别为4的客户飞行次数最多,其次足会员级别为5的客户,会员级别为6的客户飞行次数最少,可以知道级别越高(4级最高,6级最低)飞行次数越多,可能是由于级别越高,得到的折扣率相对较高。

(2)数据预处理在本案例中,以2014年3月31日为结束时间,选取宽度为两年的时间段作为分析观测窗口(也就是时间间隔为2012年4月1H至2014年3月31日),抽取观测窗几以内有乘机记录的所有客户的详细数据形成历史数据,并将数据分为三个维度,分别是客户基本信息、乘机信息和积分信息,总共包含会员卡号、入会时间、年龄、工作地所在省份、观测窗口的结束时间、乘机积分、飞行公里数等44个变量属性。

python数据分析与挖掘实战---航空公司客户价值分析

python数据分析与挖掘实战---航空公司客户价值分析

python数据分析与挖掘实战---航空公司客户价值分析航空公司客户价值分析⼀、背景与挖掘⽬标客户关系管理是企业的核⼼问题,关键在于客户的分类:区别⽆价值客户,⾼价值客户,针对不同客户群体有的放⽮投放具体服务⽅案,实现企业利润最⼤化的⽬标。

各⼤航空公司采取优惠措施喜迎更多客户,国内航司⾯对客户流失和资源未完全利⽤等危机,因此建⽴⼀个客户价值评估模型来实现对客户的分类。

⼆、分析⽅法与过程本次的分析⽬的在于客户价值识别,客户价值识别最常⽤的模型是RFM模型:R(最近消费时间间隔)F(消费频率)M(消费⾦额)。

飞机票价取决于飞⾏距离和仓位等级,消费同等⾦额票价的旅客对航司的价值不⼀定相同:购买短程头等舱的旅客和购买长途经济舱的旅客,明显前者对航司的贡献更⼤。

所以对M(消费⾦额)建模时要进⾏修改:⽤⾥程数平均值M和仓位折扣系数平均值C来代替消费的⾦额。

同时,考虑旅客中,加⼊会员的时间越长,客户的潜在价值⼀般越⾼,所以定义⼀个客户关系长度L,作为区分客户的另⼀指标。

接下来针对LRFMC模型,对客户进⾏区分。

LRFMC模型:(1)客户关系长度L:航空公司会员时间的长短。

(2)是消费时间间隔R。

(3)消费频率F。

(4) 飞⾏⾥程M。

(5) 折扣系数的平均值C。

LRFMC模型指标含义:(1) L:会员⼊会时间距观测窗⼝结束的⽉数。

(2) R:客户最近⼀次乘坐公司飞机距离观测窗⼝结束的⽉数。

(3) F:客户在观测窗⼝内乘坐公司飞机的次数。

(4) M:客户在观测窗⼝内累计的飞⾏⾥程碑。

(5) C:客户在观测窗⼝内乘坐仓位所对应的折扣系数的平均值。

⽅法:本案例采⽤聚类的⽅法,通过对航空公司客户价值的LRFMC模型的五个指标进⾏K-Means聚类,识别客户价值。

三、数据描述给出所有属性的基本信息,共25个属性,均⽆⼤量缺失现象或缺失现象很少。

四、建模1、数据探索分析对数据进⾏缺失值分析与异常值分析,分析出数据的规律以及异常值查找每列属性观测值个数,最⼤值,最⼩值。

航空公司工作人员的客户心理分析和服务方法

航空公司工作人员的客户心理分析和服务方法

航空公司工作人员的客户心理分析和服务方法航空公司的工作人员扮演着至关重要的角色,他们面对着来自世界各地的乘客,需要处理各种不同的情绪和需求。

本文将分析航空公司工作人员需要了解的客户心理,并提供一些有效的服务方法。

第一部分:客户心理分析1. 了解乘客的情绪状态航空旅行可能会引发乘客的焦虑、压力或兴奋等情绪。

工作人员应该学会观察和倾听乘客的言谈举止,从而了解他们的情绪状态。

例如,有些乘客可能因为紧张而显得急躁,而另一些乘客可能在旅行前感到兴奋。

了解他们的情绪状态将有助于工作人员更好地应对并提供相应的服务。

2. 处理不同需求的能力乘客的需求各不相同,从订餐到座位调整,以及航班延误的处理等。

工作人员应该具备灵活的处理能力,能够快速判断乘客的需求,并提供适当的帮助。

在解决问题时,工作人员需要以友好和专业的态度与乘客进行沟通,以确保他们感到被重视和满足。

3. 理解不同文化差异航空公司服务的乘客来自世界各地,拥有不同的文化背景和价值观。

工作人员需要了解并尊重这些差异。

他们应该具备跨文化交流的能力,善于倾听和理解乘客的文化需求,并以尊重和包容的态度对待每一位乘客。

第二部分:服务方法1. 提供友好和专业的服务航空公司工作人员应该始终以友好和专业的态度对待乘客。

无论面对何种情况,他们应展示出耐心和尊重,并通过亲切的笑容和礼貌的言辞让乘客感到受到重视和尊重。

在提供服务的过程中,工作人员需要保持高度的专业水准以确保乘客的舒适和满意。

2. 主动解决问题当乘客遇到问题或面临困难时,航空公司工作人员应该主动提供帮助和解决方案。

他们应尽可能地满足乘客的需求,并热情地回答各种问题。

同时,工作人员应提供实时的信息更新,例如航班延误或取消的通知,以帮助乘客及时做出调整。

3. 提供个性化的服务航空公司工作人员可以通过提供个性化的服务来赢得乘客的好感。

比如,记录乘客的偏好,例如喜欢的饮料或餐点,下次再次乘坐时主动提供。

此外,工作人员可以积极关注乘客的特殊需求,例如小孩或老年人的照顾,以提供更贴心的服务体验。

航空公司客户价值分析PPT课件

航空公司客户价值分析PPT课件

模型
L
R
F
M
C
航空公司 LRFMC模型
会员入会时 客户最近一次乘 客户在观测 客户在观测 客户在观测窗口内 间距观测窗口 坐公司飞机距观测 窗口内乘坐公 窗口内累积的 乘坐舱位所对应的折 结束的月数 窗口结束的月数 司飞机的次数 飞行里程 扣系数的平均值
.
5
02 业务分析及数据预处理
1.数据探索
对数据进行缺失值分析与异 常值分析
2013/04/28 2013/05/16 2010/02/05 2010/10/19 2011/08/25 2013/06/01 2010/12/27 2009/10/21 2013/06/02 2013/04/24 2013/04/17 2011/08/20
GENDE
男 男 男 男 男 男 男 男 女 男 女 男
数据预处理步骤
3.属性规约
选择与LRFMC模型相关的六 组数据
.
2.数据清洗
丢弃票价、平均折扣、总飞行 公里为空或为0的记录
4.数据变换
将数据转换成“适当的”格式, 以适应挖掘任务及算法需要
6
02 业务分析及数据预处理
数据探索结果
属性规约结果 (部分数据)
属性名称 SUM_YR_1 SUM_YR_2
02 业务分析及数据预处理
LRFMC取值范围
属性名称 最小值 最大值
L 12.23 114.63
R 0.03 24.37
F
M
2
368
213
580717
C 0.14 1.5
LRFMC数据标准化 (部分数据)
ZL 1.69 1.69 1.682 1.534 0.89 -0.497 -0.869

客户关系管理-第8讲 如何看待“客户价值”这件事?

客户关系管理-第8讲 如何看待“客户价值”这件事?
前次课程回顾
客户的分类
按客户与企业的关系(消费者、B2B、渠道、内部) 按客户的重要性程度(贵宾型、重要型、普通型) 按客户的忠诚程度分类(忠诚客户、老客户、新客户和
潜在客户) 按客户能提供的价值(灯塔型、跟随型、理性、逐利)
客户分类的意义
区分不同价值的客户 对不同客户,采用不同的营销策略 最大效率利用企业有限资源
A380虽然提供了新的设计,但同时保持了运营通用性 的优点。A380具备与空中客车公司其它电传操纵系统 飞机相同的驾驶舱布局、程序和操作特性,从而大大减 少了飞行员从一种空中客车飞机转换到另一种空中客车 飞机所需的培训时间。
A380的缺点是其体积太过庞大,不少大型机场必须更 换设施方能应付A380着陆。波音指出,747可直飞全球 210个机场,A380到2009年也只可直飞29个机场,这表 示乘坐A380的旅客可能要转机才能到达目的地。
讨论:顾客的价值怎么计算和比较?
第8讲 如何看待“客户价值”这件事?
一、客户价值的涵义
从客户角度:是客户对产品属性、 属性效能以及使用结果的感知、 偏好和评价。
从企业角度:是客户对企业销售 额的影响、对未来收益率的贡献 与企业为客户保持所需投入之间 的比较。
案例分享:A380 的客户价值
座位数 航程 客舱布局 机身长度 机身宽度 翼展 油耗 舱内设施
555座 14 800 公里(8 000 海里) 双通道双层客舱 73米 239英尺3英寸 5.58米 21英尺 7英寸 79.8米 261英尺 10英寸 每人百公里3升 豪华包间 吧台、小商店
思考:
A380给客户带来的价值是 什么?
对于航空公司:
A380由四个引擎推动,标准航程为1.5万公里,足够由纽约飞到 罗马再回航,比波音747更省油、飞行时更宁静、营利能力更高, 运载每位乘客的成本较747低两成,载客量达五成八便可达收支 平衡,747则至少要七成载客量才能保本。若把A380机舱划分 为头等、商务和经济3个级别,并加添睡房、健身室和酒吧等设 施,其载客量为555人,波音747为416人;但若以包机规格(所 有座位为经济级别)计算,载客量则达840人,还有十多名机员。

A001_C-蔡健威_航空公司客户价值评估

A001_C-蔡健威_航空公司客户价值评估

第 2 页,共 14 页
太普华南杯数据挖掘竞赛论文报告


1. 2.
挖掘目标 .................................................................................................. 4 分析方法与过程 ....................................................................................... 4
The Evaluation of the Airlines` Customer Value
Abstract: In this report, in order to determine the indicators which are used to evaluate and analyse the value of the airlines` customers and build customer-value-assessment model ,we used SAS as a analysis platform , made use of the correlation analysis and principal component analysis methods. With the help of quantitative analysis ,we calculated the value of each customer score , which help airlines staff to develop appropriate marketing strategies for different value customer groups . Key words: data mining ; principal component analysis ; customer value

航空公司客户价值分析数据挖掘设计文档

航空公司客户价值分析数据挖掘设计文档

数据挖掘大作业题目:航空公司客户价值分析目录一、任务背景 (2)二、数据挖掘目标 (2)三、数据探索与预处理 (3)构建航空客户价值分析的关键特征 (3)数据抽取 (5)探索性分析 (5)数据处理 (6)四、模型构建与评价 (12)1.模型构建K-Means聚类算法 (12)客户价值分析 (13)五、总结 (16)一、任务背景高铁、动车等铁路的不断兴建,出行方式的多元化让航空公司受到很大的冲击。

航空公司之间竞争也很激烈,除了四大航空公司之间的竞争之外,还有新兴产业的各类小型航空公司、民营航空公司,旅游等。

甚至国外航线出现高速度增长。

随着时代的发展,客户问题越来越受到关注,客户流失对利润增长造成了非常大的负面影响。

客户与航空公司的关系越长,航空公司的利润就越高。

一个客户使用了几次这次服务,感觉服务不错,那下次还会倾向于这个服务,但是要获得新客户,不仅需要在广告和人员工资上花费很多,去吸引顾客,在销售、市场也会花费很多,并且大多数新客户产生的利润不如那些流失的老客户多。

很明显,失去一个客户对公司来说比得到一个新客户更昂贵。

另外老用户也可以带来新用户。

因此,在这一背景下,分析航空公司客户数据,对客户进行分类,提高客户流失率是当务之急。

航空公司应针对不同类型的客户制定相应的营销模式,以实现利润最大化。

二、数据挖掘目标按航空公司客户数据进行分类。

分析了不同类型顾客的特点,比较不同类型顾客的顾客价值。

可以为不同价值客户类别提供个性化服务,并采用相应的营销策略。

分类客户的目的,就是要更精确地说明谁是我们的客户,了解客户到底有哪些实际需要,企业应该去吸引哪些客户,哪些客户应该被重点保留,以及应该如何迎合重点客户的需求等重要问题,进而使客户关系管理真正成为业务获得成功、扩大产品销量的催化剂。

客户分类是客户关系管理的核心。

帕累托定律(2/8定律):就是20%的顾客给企业带来80%的销售利润。

20%的客户其利润率达到100%。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

ZF -0.636 0.852 -0.211 0.002 -0.636 -0.636 -0.707
ZM 0.069 0.844 0.159 0.273 -0.685 -0.604 -0.662
02 业务分析及数据预处理
LRFMC取值范围
属性名称 最小值 最大值
L 12.23 114.63
R 0.03 24.37
F
M
2
368
213
580717
C 0.14 1.5
LRFMC数据标准化 (部分数据)
ZL 1.69 1.69 1.682 1.534 0.89 -0.497 -0.869
ZR 0.14 -0.322 -0.488 -0.785 -0.427 -0.691 1.996
模型
L
R
F
M
C
航空公司 LRFMC模型
会员入会时 客户最近一次乘 客户在观测 客户在观测 客户在观测窗口内 间距观测窗口 坐公司飞机距观测 窗口内乘坐公 窗口内累积的 乘坐舱位所对应的折 结束的月数 窗口结束的月数 司飞机的次数 飞行里程 扣系数的平均值
.
5
02 业务分析及数据预处理
1.数据探索
对数据进行缺失值分析与异 常值分析
2013/04/28 2013/05/16 2010/02/05 2010/10/19 2011/08/25 2013/06/01 2010/12/27 2009/10/21 2013/06/02 2013/04/24 2013/04/17 2011/08/20
GENDE
男 男 男 男 男 男 男 男 女 男 女 男
FFP_DATE 2013/03/16 2012/06/26 2009/12/08 2009/12/10 2011/08/25 2012/09/26 2010/12/27 2009/10/21 2010/04/15 2007/01/26 2006/12/26
LAST_TO_END FLIGHT_COUNT SEG_KM_SUM AVG_DISCOUNT
FIGHT_C OUNT 14 65 33 6 22 26 5 4 25 36 49 51
BP_SUM
147158 112582 77475 76027 70142 63498 62810 60484 59357 55562 54255 53926
.
4
02 业务分析及数据预处理
根据传统RFM模型的三个指标即(最近消费时间间隔(Recency)、消费频 率(Frequency)和消费金额(Monetary))进一步改进,制定出客户关 系长度L、消费时间间隔R、消费频率F、飞行里程M和折扣系数均值C五个指 标最为航空公司识别客户价值指标,简称LRFMC模型
航空公司客户价值分析
1
目录 CONTENTS
01
数据挖掘目标
02
业务分析及数据预处理
03
模型构建及业务分析
04
代码展示
.
2
01 数据挖掘目标
0
1
借助航空公司客户数据,对客户进行分类
0
2
对不同客户类别进行特征分析,比较不同类客户的客户价值
0
对不同价值的客户类别提供个性化服务,制定相应的营销策略
3
.
数据预处理步骤
3.属性规约
选择与LRFMC模型相关的六 组数据
.
2.数据清洗
丢弃票价、平均折扣、总飞行 公里为空或为0的记录
4.数据变换
将数据转换成“适当的”格式, 以适应挖掘任务及算法需要
6
02 业务分析及数据预处理
数据探索结果
属性规约结果 (部分数据)
属性名称 SUM_YR_1 SUM_YR_2
3
02 业务分析及数据预处理
航空信息原始数据(部分数据)
MEMBER_NO 289047040 289053451 289022508 289004181 289026513 289027500 289058898 289037374 289036013 289046087 289062045 289022276
FFP_TIER
WORK_C ITY
WORK_P ROVIN
6
6 乌鲁木齐 新疆
5
北京
4 S.P.S CORTES
6 乌鲁木齐 新疆
5 北京
北京
4 ARCADIA CA
4 广州
广东
6 广州
广东
6.
天津
5 长春市 吉林省
6 沈阳
辽宁
WORK
US CN CN HN CN CN US CN CN CN CN CN
FFP_DATE
2013/03/16 2012/06/26 2009/12/08 2009/12/10 2011/08/25 2013/06/01 2010/12/17 2009/10/12 2013/06/02 2007/01/26 2006/12/26 2011/08/15
FIRST_FLIGI
L
R
数据变换
F
从原始数据中提取
LRFMC五个指标
M
C
LOAD_TIME-FFP_DATE 观测窗口结束时间-入会时间
LAST_TO_END 最后一次乘坐时间至观测窗口结束时长
FLIGHT_COUNT 观测窗口内的飞行次数
SEG_KM_SUM 观测窗口内的飞行里程
AVG_DISCOUNT 平均折扣
.
8
23
14
126850
1.02
6
65
184730
0.76
2
33
60387
1.27
123
6
62259
1.02
15
22
54730
1.36
23
26
50024
1.29
77
5
61160
0.94
67
4
48928
பைடு நூலகம்
1.05
11
25
43499
1.33
22
36
68760
0.88
4
49
64070
0.91
.
7
02 业务分析及数据预处理
… SEG_KM_SUM AVG_DISCOUNT
空值记录数 551 138 … 0 0
最大值 239560 234188
… 580717
1.5
最小值 0 0 …
368 0
LOAD_TIME 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31
AGE
56 50 34 45 47 36 35 34 54 47 55 41
LOAD_TIME
2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31
相关文档
最新文档