Python数据分析与应用 第7章 航空公司客户价值分析

合集下载

航空公司客户价值分析Kmeans

航空公司客户价值分析Kmeans

数据变换由于原始数据没有直接给出LRFMC五个指标,需要自己计算,具体的计算方式为:(1)L=LOAD_TIME-FFP_DATE(2)R=LAST_TO_END(3)F=FLIGHT_COUNT(4) M=SEG_KM_SUM(5)C=avg_discount数据变换的Python代码如下:1.def reduction_data(datafile,reoutfile):2. data=(cleanoutfile,encoding='utf-8')3.data=data[['LOAD_TIME','FFP_DATE','LAST_TO_END','FLIGHT_COUNT','SEG _KM_SUM','avg_discount']]4.# data['L']=(data['LOAD_TIME'])(data['FFP_DATE'])5.#data['L']=int(((parse(data['LOAD_TIME'])-parse(data['FFP_ADTE'])).d ays)/30)6.####这四行代码费了我3个小时7. d_ffp=(data['FFP_DATE'])8. d_load=(data['LOAD_TIME'])9. res=d_load-d_ffp10. data['L']=(lambda x:x/(30*24*60,'m'))11.12. data['R']=data['LAST_TO_END']13. data['F']=data['FLIGHT_COUNT']14. data['M']=data['SEG_KM_SUM']15. data['C']=data['avg_discount']16. data=data[['L','R','F','M','C']]17.(reoutfile)变换结果如下:客户聚类采纳kMeans聚类算法对客户数据进行客户分组,聚成5组,Python代码如下:1.import pandas as pd2.from import KMeans3.import as plt4.from itertools import cycle5.6.datafile='./tmp/'7.k=58.classoutfile='./tmp/'9.resoutfile='./tmp/'10.data=(datafile)11.12.kmodel=KMeans(n_clusters=k,max_iter=1000)13.(data)14.15.# print16.r1=.value_counts()17.r2=18.r=([r2,r1],axis=1)19.=list+['类别数量']20.# print(r)21.# (classoutfile,index=False)22.23.r=([data,,index=],axis=1)24.=list+['聚类类别']25.# (resoutfile,index=False)对数据进行聚类分群的结果如下表所示:。

航空公司客户价值分析(二)

航空公司客户价值分析(二)

航空公司客户价值分析(二)一、实验内容:1.复习如何使用python选取构建LRFMC模型需要的特征2.使用sklearn相关功能模块标准化LRFMC模型的特征3.使用sklearn的cluster模块提供的kmeans函数对不同客户群体LRMFC模型的5个特征进行聚类运算4.分析聚类结果,明确不同特征在不同客户群体中的作用。

5.根据分析结果,对客户进行分类,分别制定对应的营销策略。

二、程序清单及过程及截图:1.复习如何使用python选取构建LRFMC模型需要的特征本项目选择客户在一定时间内累积的飞行里程M和客户在一定时间内乘坐舱位所对应的折扣系数的平均值C两个特征代替消费金额。

此外,航空公司会员入会时间的长短在一定程度上能够影响客户价值,所以在模型中增加客户关系长度L,作为区分客户的另一特征。

然后将客户关系长度L,消费时间间隔R,消费频率F,飞行里程M和折扣系数的平均值C作为航空公司识别客户价值的关键特征, 记为LRFMC模型。

L=LOAD_TIME-FFP_DATE,R=LAST_TO_END,F=FLIGHT_COUNT,M=SEG_KM_SUM,C=AVG_DISCOUNT。

## 选取需求特征airline_selection = airline[["FFP_DATE","LOAD_TIME","FLIGHT_COUNT","LAST_TO_END","avg_discount","SEG_KM_SUM"]]## 构建L特征L = pd.to_datetime(airline_selection["LOAD_TIME"]) - \pd.to_datetime(airline_selection["FFP_DATE"])L = L.astype("str").str.split().str[0]L = L.astype("int")/30## 合并特征airline_features = pd.concat([L,airline_selection.iloc[:,2:]],axis = 1)print('构建的LRFMC特征前5行为:\n',airline_features.head())2.使用sklearn相关功能模块标准化LRFMC模型的特征完成五个特征的构建以后,对每个特征数据分布情况进行分析,发现五个特征的取值范围数据差异较大,为了消除数量级数据带来的影响,需要对数据做标准化处理。

航空公司客户价值分析-航空公司客户价值分析实战

航空公司客户价值分析-航空公司客户价值分析实战

航空公司客户价值分析作者:柳睿来源:《财讯》2018年第09期航空市场竞争的加煎和航空业的发展,要求国内航空公司必须利用大量数据中隐含的知识才能抓住时机。

如此,客户是企业至关重要的成功因素和利润来源。

将数据挖掘、机器学习技术应用于客户关系管理,能够为企业提供经营和决策的量化依据,使企业能够把握重点,分轻重急缓,有效利用有限资源,拓展利润上升空间。

针对客户关系管理中客户价值这一问题,通过对航空公司现有数据仓库中客户信息的分析,本文采用RFM模型得到必要指标变量,再运用Kmeans算法对RFM所褥出的指标进行聚类,将客户群逊分为价值不同的五类客户群,并对每个客户群进行分析和总结,提出了针对每类客户群的营销策略。

RMF模型客户价值分析 Kmeans背景介绍航空公司同样也面临这样的何如划分客户群的问题,而客户细分就是能够解决这种问题的关键。

国内某航空公司市场面临旅客流失、资源为充分利用等经营危机。

因此本文的日标足利用某航空公司的会员档案信息和其航班乘坐记录,通过建市合理的客户价值评估模型,对客户进行分群,分析比较不同客户群的客户价值,并制定相应的个性化营销策略。

本文运用RFM 模型对客户分类。

数据描述与预处理(1)数据统计分析原始数据含有44个变量属性,我们对原始数据有个初步的描述理解。

由数据可知男性在观测窗几内飞行次数远超与女性。

会员级别为4的客户飞行次数最多,其次足会员级别为5的客户,会员级别为6的客户飞行次数最少,可以知道级别越高(4级最高,6级最低)飞行次数越多,可能是由于级别越高,得到的折扣率相对较高。

(2)数据预处理在本案例中,以2014年3月31日为结束时间,选取宽度为两年的时间段作为分析观测窗口(也就是时间间隔为2012年4月1H至2014年3月31日),抽取观测窗几以内有乘机记录的所有客户的详细数据形成历史数据,并将数据分为三个维度,分别是客户基本信息、乘机信息和积分信息,总共包含会员卡号、入会时间、年龄、工作地所在省份、观测窗口的结束时间、乘机积分、飞行公里数等44个变量属性。

Python数据分析与应用- 客户价值分析.doc

Python数据分析与应用- 客户价值分析.doc

Python数据分析与应用- 客户价值分析航空公司客户价值分析目录;航空公司现状分析;民航行业的竞争;除了三大航空公司之间的竞争,它还将加入各种新兴的小型航空公司、私人航空公司,甚至外国航空巨头。

航空产品生产过剩的同质性越来越明显,航空公司逐渐从价格、服务的竞争转向客户的竞争。

航空公司现状分析;行业外的竞争;随着高铁、子弹头列车等铁路运输的建设,航空公司受到了极大的冲击。

目前,航空公司已经积累了大量的会员档案信息和航班记录。

对于结束时间,选择宽度为两年的时间段作为分析观察窗口,以提取所有客户的详细数据,这些客户利用观察窗口中的记录机会,形成总共4个历史数据特征。

右表显示了数据特征及其描述。

分析航空公司的现状、航空公司数据、特征、描述、特征、名称、特征、客户基本信息、会员编号、会员时间、首飞日期、首飞日期、性别、会员卡级别、工作城市、工作国家的工作提供情况,年龄年份年龄航空公司客户数据描述表名称特征名称特征描述航班信息飞行时间计数观察窗结束时间装货时间观察窗结束时间最后一次飞行时间观察窗结束时间A VGDISCOUNT平均折扣率票价收入SUMYR观察窗SEGMSUM总飞行公里数SEGMSUM观察窗最后一次飞行日期A VGINTERV AL平均飞行时间间隔MAXINTERV AL最大飞行间隔点信息交换点交换点交换号EPSUM总精英点PROMOPTIVESUM PARTNERSUM总累积点不飞行非飞行点改变号BPSUM总基本点连续表原始我们应该如何处理这些特性?我们应该从什么开始?考虑用航空公司客户数据对客户进行分类。

分析不同类型客户的特征,比较不同类型客户的客户价值。

为不同价值的客户类别提供个性化服务,并制定相应的营销策略。

项目目标可以结合当前的航空公司数据实现以下目标。

该公司的收入来自顶级客户。

我们客户的利润率。

上述收入来自现有客户。

大部分营销预算通常花在不存在的客户身上。

客户金字塔中有升级潜力的客户。

Python数据分析与应用教案Python数据分析实例航空公司客户价值分析教案

Python数据分析与应用教案Python数据分析实例航空公司客户价值分析教案

Python数据分析与应用教案Python数据分析实例航空公司客户价值分析教案第一章:Python数据分析概述1.1 Python数据分析背景及意义1.2 Python数据分析常用库介绍1.3 数据分析的一般流程第二章:航空公司客户价值分析简介2.1 航空公司客户价值分析背景2.2 航空公司客户价值分析目标2.3 航空公司客户价值分析方法第三章:数据收集与预处理3.1 数据来源及收集方法3.2 数据预处理方法3.3 数据清洗与转换第四章:航空公司客户价值指标体系构建4.1 客户价值指标构建原则4.2 客户价值指标体系构建方法4.3 航空公司客户价值指标体系示例第五章:Python数据分析实例:航空公司客户价值分析5.1 实例背景及目标5.2 数据处理与分析方法5.3 分析结果展示与解读本教案以航空公司客户价值分析为例,旨在帮助学员了解并掌握Python数据分析的方法和技巧。

通过五个章节的学习,学员可以对Python数据分析有一个全面的了解,并能够运用Python进行简单的数据分析。

我们将进一步学习如何利用Python进行更深入的数据分析,以实现航空公司客户价值分析的目标。

第六章:数据可视化与报表制作6.1 数据可视化概述6.2 Python可视化库介绍6.3 航空公司客户价值分析数据可视化实例第七章:描述性统计分析7.1 描述性统计分析概念7.2 Python描述性统计分析方法7.3 航空公司客户价值分析中的描述性统计实例第八章:推断性统计分析与假设检验8.1 推断性统计分析概述8.2 假设检验方法介绍8.3 航空公司客户价值分析中的假设检验实例第九章:Python数据分析进阶技巧9.1 数据聚类分析9.2 关联规则挖掘9.3 机器学习与预测分析10.2 分析报告结构与内容第十一章:Python数据分析实战案例解析11.1 实战案例介绍11.2 实战案例数据处理与分析11.3 实战案例结果解读与应用第十二章:航空公司客户价值分析的策略与应用12.1 航空公司客户价值分析策略12.2 客户价值分析在航空公司的应用12.3 案例研究:航空公司客户价值分析策略与应用第十三章:大数据分析与云计算13.1 大数据概念与技术13.2 云计算与大数据分析13.3 航空公司客户价值分析在大数据与云计算环境下的应用第十四章:数据安全与隐私保护14.1 数据安全与隐私概述14.2 数据安全与隐私保护技术14.3 航空公司客户价值分析中的数据安全与隐私保护实践第十五章:航空公司客户价值分析的未来趋势15.1 在客户价值分析中的应用15.2 分布式分析与边缘计算15.3 航空公司客户价值分析的发展前景重点和难点解析难点内容包括:Python数据分析方法的深入理解与应用、航空公司客户价值指标体系构建、数据清洗与转换、假设检验方法的运用、数据聚类分析、关联规则挖掘、机器学习与预测分析等。

Python数据分析与应用教案Python数据分析实例航空公司客户价值分析教案

Python数据分析与应用教案Python数据分析实例航空公司客户价值分析教案

Python数据分析与应用教案Python数据分析实例航空公司客户价值分析教案教案章节一:Python数据分析概述1.1 教学目标了解Python在数据分析领域的应用掌握Python数据分析的基本流程理解航空公司客户价值分析的意义1.2 教学内容Python数据分析的应用领域Python数据分析的基本流程航空公司客户价值分析的定义和重要性1.3 教学方法讲解和案例展示学生互动讨论实践操作练习1.4 教学资源Python数据分析相关资料航空公司客户价值分析案例教案章节二:Python数据分析环境搭建2.1 教学目标学会安装和配置Python数据分析环境掌握Python数据分析相关库的基本使用方法2.2 教学内容Python数据分析环境的安装和配置Python数据分析相关库的基本使用方法2.3 教学方法讲解和演示学生实践操作问题解答和讨论2.4 教学资源Python数据分析环境的安装和配置指南Python数据分析相关库的文档和教程教案章节三:航空公司客户数据处理3.1 教学目标学会处理航空公司客户数据掌握数据清洗和数据转换的方法3.2 教学内容航空公司客户数据的获取和导入数据清洗和数据转换的方法3.3 教学方法讲解和演示学生实践操作问题解答和讨论3.4 教学资源航空公司客户数据集数据清洗和数据转换的相关工具和库教案章节四:航空公司客户价值分析方法4.1 教学目标学会使用Python进行航空公司客户价值分析掌握客户价值分析的方法和模型4.2 教学内容客户价值分析的定义和重要性客户价值分析的方法和模型4.3 教学方法讲解和演示学生实践操作问题解答和讨论4.4 教学资源Python客户价值分析相关库和工具航空公司客户价值分析案例和数据集教案章节五:航空公司客户价值分析实践5.1 教学目标学会应用Python进行航空公司客户价值分析的实践5.2 教学内容航空公司客户价值分析实践案例5.3 教学方法讲解和演示学生实践操作问题解答和讨论5.4 教学资源航空公司客户价值分析实践案例和数据集教案章节六:Python数据分析可视化6.1 教学目标学会使用Python进行数据分析的可视化掌握常用的数据可视化库和工具6.2 教学内容Python数据分析可视化的概念和重要性常用的数据可视化库和工具(如Matplotlib、Seaborn等)6.3 教学方法讲解和演示学生实践操作问题解答和讨论6.4 教学资源Python数据可视化库和工具的文档和教程实际案例和数据集教案章节七:航空公司客户价值分析案例研究7.1 教学目标学会应用Python进行航空公司客户价值分析的案例研究掌握案例研究的方法和技巧航空公司客户价值分析的案例研究流程案例研究的方法和技巧7.3 教学方法讲解和演示学生实践操作问题解答和讨论7.4 教学资源航空公司客户价值分析的案例研究资料实际案例数据集8.1 教学目标8.2 教学内容8.3 教学方法讲解和演示学生实践操作问题解答和讨论8.4 教学资源实际案例报告模板教案章节九:项目实践与讨论9.1 教学目标学生能够独立完成一个航空公司客户价值分析项目学会在团队中协作和交流学生独立完成航空公司客户价值分析项目团队协作和交流的技巧9.3 教学方法学生独立完成项目团队协作和讨论问题解答和指导9.4 教学资源航空公司客户价值分析项目案例团队协作工具和指南教案章节十:总结与展望10.1 教学目标总结所学内容,巩固知识展望未来航空公司客户价值分析的发展趋势10.2 教学内容回顾整个课程的重点内容展望航空公司客户价值分析的未来发展趋势10.3 教学方法讲解和总结学生互动讨论实践操作练习10.4 教学资源课程回顾资料航空公司客户价值分析的未来发展趋势相关资料重点解析重点在于:1. Python数据分析的基本流程和应用领域。

python数据分析与挖掘实战---航空公司客户价值分析

python数据分析与挖掘实战---航空公司客户价值分析

python数据分析与挖掘实战---航空公司客户价值分析航空公司客户价值分析⼀、背景与挖掘⽬标客户关系管理是企业的核⼼问题,关键在于客户的分类:区别⽆价值客户,⾼价值客户,针对不同客户群体有的放⽮投放具体服务⽅案,实现企业利润最⼤化的⽬标。

各⼤航空公司采取优惠措施喜迎更多客户,国内航司⾯对客户流失和资源未完全利⽤等危机,因此建⽴⼀个客户价值评估模型来实现对客户的分类。

⼆、分析⽅法与过程本次的分析⽬的在于客户价值识别,客户价值识别最常⽤的模型是RFM模型:R(最近消费时间间隔)F(消费频率)M(消费⾦额)。

飞机票价取决于飞⾏距离和仓位等级,消费同等⾦额票价的旅客对航司的价值不⼀定相同:购买短程头等舱的旅客和购买长途经济舱的旅客,明显前者对航司的贡献更⼤。

所以对M(消费⾦额)建模时要进⾏修改:⽤⾥程数平均值M和仓位折扣系数平均值C来代替消费的⾦额。

同时,考虑旅客中,加⼊会员的时间越长,客户的潜在价值⼀般越⾼,所以定义⼀个客户关系长度L,作为区分客户的另⼀指标。

接下来针对LRFMC模型,对客户进⾏区分。

LRFMC模型:(1)客户关系长度L:航空公司会员时间的长短。

(2)是消费时间间隔R。

(3)消费频率F。

(4) 飞⾏⾥程M。

(5) 折扣系数的平均值C。

LRFMC模型指标含义:(1) L:会员⼊会时间距观测窗⼝结束的⽉数。

(2) R:客户最近⼀次乘坐公司飞机距离观测窗⼝结束的⽉数。

(3) F:客户在观测窗⼝内乘坐公司飞机的次数。

(4) M:客户在观测窗⼝内累计的飞⾏⾥程碑。

(5) C:客户在观测窗⼝内乘坐仓位所对应的折扣系数的平均值。

⽅法:本案例采⽤聚类的⽅法,通过对航空公司客户价值的LRFMC模型的五个指标进⾏K-Means聚类,识别客户价值。

三、数据描述给出所有属性的基本信息,共25个属性,均⽆⼤量缺失现象或缺失现象很少。

四、建模1、数据探索分析对数据进⾏缺失值分析与异常值分析,分析出数据的规律以及异常值查找每列属性观测值个数,最⼤值,最⼩值。

Python数据分析与应用-教学大纲

Python数据分析与应用-教学大纲

《Python数据分析与应用》教学大纲课程名称:Python数据分析与应用课程类别:必修适用专业:大数据技术类相关专业总学时:64学时(其中理论36学时,实验28学时)总学分:4.0学分一、课程的性质大数据时代已经到来,在商业、经济及其他领域中基于数据和分析去发现问题并做出科学、客观的决策越来越重要。

数据分析技术将帮助企业用户在合理时间内获取、管理、处理以及整理海量数据,为企业经营决策提供积极的帮助。

数据分析作为一门前沿技术,广泛应用于物联网、云计算、移动互联网等战略新兴产业。

有实践经验的数据分析人才已经成为了各企业争夺的热门。

为了推动我国大数据,云计算,人工智能行业的发展,满足日益增长的数据分析人才需求,特开设Python数据分析与应用课程。

二、课程的任务通过本课程的学习,使学生学会使用Python进行科学计算、可视化绘图、数据处理,分析与建模,并详细拆解学习聚类、回归、分类三个企业案例,将理论与实践相结合,为将来从事数据分析挖掘研究、工作奠定基础。

三、课程学时分配四、教学内容及学时安排1.理论教学2.实验教学五、考核方式突出学生解决实际问题的能力,加强过程性考核。

课程考核的成绩构成= 平时作业(10%)+ 课堂参与(20%)+ 期末考核(70%),期末考试建议采用开卷形式,试题应包括基本概念、绘图、分组聚合、数据合并、数据清洗、数据变换、模型构建等部分,题型可采用判断题、选择、简答、应用题等方式。

六、教材与参考资料1.教材黄红梅,张良均.Python数据分析与应用[M].北京:人民邮电出版社.2018.2.参考资料[1]张良均.Python数据分析与挖掘实战[M].北京:机械工业出版社.2015.[2]张良均.Python与数据挖掘实战[M].北京:机械工业出版社.2016.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

最大值
114.57
24.37
213
580717
1.5
大数据挖掘专家
17
标准化LRFMC五个特征
L、R、F、M和C五个特征的数据示例,上图为原始数据,下图为标准差标准化处理后的数据。
LOAD_TIME 2014/3/31 2014/3/31 FFP_DATE 2013/3/16 2012/6/26 LAST_ TO_END 23 6 FLIGHT_ COUNT 14 65 SEG_K M_SUM 126850 184730 AVG_DIS COUNT 1.02 0.76
大数据挖掘专家
8
了解客户价值分析
客户营销战略倡导者Jay & Adam Curry从国外数百家公司进行了客户营销实施的经验中提炼了如下经验。 公司收入的80%来自顶端的20%的客户。 20%的客户其利润率100%。 90%以上的收入来自现有客户。 大部分的营销预算经常被用在非现有客户上。 5%至30%的客户在客户金字塔中具有升级潜力。 客户金字塔中客户升级2%,意味着销售收入增加10%,利润增加50%。 这些经验也许并不完全准确,但是它揭示了新时代客户分化的趋势,也说明了对客户价值分析的迫切性和必 要性。
大数据挖掘专家
20
了解K-Means聚类算法
2. 数据类型
K-Means聚类算法是在数值类型数据的基础上进行研究,然而数据分析的样本复杂多样,因此要求不仅能够对 特征为数值类型的数据进行分析,还要适应数据类型的变化,对不同特征做不同变换,以满足算法的要求。
大数据挖掘专家
21
了解K-Means聚类算法
航空公司客户数据说明
续表
表 名 特征名称 FLIGHT_COUNT LOAD_TIME LAST_TO_END AVG_DISCOUNT SUM_YR SEG_KM_SUM LAST_FLIGHT_DATE AVG_INTERVAL MAX_INTERVAL EXCHANGE_COUNT EP_SUM PROMOPTIVE_SUM PARTNER_SUM POINTS_SUM POINT_NOTFLIGHT BP_SUM
3. 传统RFM模型在航空行业的缺陷
在RFM模型中,消费金额表示在一段 时间内,客户购买该企业产品金额的总和 ,由于航空票价受到运输距离,舱位等级 等多种因素影响,同样消费金额的不同旅 客对航空公司的价值是不同的,因此这个
特征并不适合用于航空公司的客户价值分
析。
大数据挖掘专家
15
构建航空客户价值分析的关键特征
6
思考
原始数据中包含40多个特征,利用这些特征做些什么呢?我们又该 从哪些角度出发呢?
大数据挖掘专家
7
项目目标
结合目前航空公司的数据情况,可以实现以下目标。 借助航空公司客户数据,对客户进行分类。 对不同的客户类别进行特征分析,比较不同类别客户的客户价值。 对不同价值的客户类别提供个性化服务,制定相应的营销策略。
大数据挖掘专家
24
分析聚类结果
针对聚类结果进行特征分析,如图所示。
大数据挖掘专家
25
分析聚类结果
结合业务分析,通过比较各个特征在群间的大小对某一个群的特征进行评价分析,从而总结出每个群的优势 和弱势特征,具体结果如表所示。
说明 返回int。表示每个点被分配到的簇。 返回num。表示聚类中心矩阵。 返回int。表示所生成簇的总体距离平方和。
withinss
betweenss size
返回num。表示每个簇内的距离平方和。
返回num。表示每个簇之间的距离平方和。 返回int。表示每个簇内的数量。
大数据挖掘专家
23
分析聚类结果
62259 54730
1.27
1.02 1.36 C 1.30 2.87 2.88
0.66
0.39
大数据挖掘专家
-0.42
-0.92
0.78
9.92
12.54
13.90
1.99
1.34
18
目录
1
2 3 4
了解航空公司现状与客户价值分析 预处理航空客户数据 使用K-Means算法进行客户分群 小结
大数据挖掘专家
4. 航空客户价值分析的LRFMC模型
本项目选择客户在一定时间内累积的飞行里程M和客户在一定时间内乘坐舱位所对应的折扣系数的平均 值C两个特征代替消费金额。此外,航空公司会员入会时间的长短在一定程度上能够影响客户价值,所以在模 型中增加客户关系长度L,作为区分客户的另一特征。 本项目将客户关系长度L,消费时间间隔R,消费频率F,飞行里程M和折扣系数的平均值C作为航空公司 识别客户价值的关键特征(如表 3 2所示),记为LRFMC模型。 模型 航空公司 LRFMC模型 L R F M C
MEMBER_NO
FFP_DATE FIRST_FLIGHT_DATE GENDER FFP_TIER WORK_CITY WORK_PROVINCE WORK_COUNTRY AGE
会员卡号
入会时间 第一次飞行日期 性别 会员卡级别 工作地城市 工作地所在省份 工作地所在国家 年龄
5
大数据挖掘专家
客户最近一次乘 客户在观测窗口 会员入会时间距 客户在观测窗口 客户在观测窗口 坐公司飞机距观 内乘坐舱位所对 观测窗口结束的 内乘坐公司飞机 内累计的飞行里 测窗口结束的月 应的折扣系数的 月数 的次数 程 数 平均值
大数据挖掘专家
16
标准化LRFMC五个特征
完成五个特征的构建以后,对每个特征数据分布情况进行分析,其数据的取值范围如表所示。从表中数 据可以发现,五个特征的取值范围数据差异较大,为了消除数量级数据带来的影响,需要对数据做标准化处 理。 特征名称 最小值 L 12.17 R 0.03 F 2 M 368 C 0.14
常用参数及其说明如表所示。 参数名称 x centers iter.max nstart algorithm
大数据挖掘专家
说 明 接收matrix或dataframe。表示进行聚类分析的数据集。无默认。 接收int。表示初始类的个数或者初始类的中心。无默认。 接收int。表示最大迭代次数。默认为10。 接收int。表示选择随机起始中心点的次数。默认为1。
3. kmeans函数及其参数介绍
K-Means算法在R语言中实现的核心函数为kmeans,来源于stats软件包,其基本语法如下。
kmeans(x, centers, iter.max = 10, nstart = 1, algorithm = c("Hartigan-Wong", "Lloyd", "Forgy","MacQueen")
2014/3/31
2014/3/31 2014/3/31 L 1.44 1.31 1.33
2009/12/8
2009/12/10 2011/8/25 R -0.95 -0.91 -0.89
2
123 14 F 14.03 9.07 8.72
33
6 22 M 26.76 13.13 12.65
60387
大数据挖掘专家
乘机信息
积分信息
特征说明 观测窗口内的飞行次数 观测窗口的结束时间 最后一次乘机时间至观测窗口结束时长 平均折扣率 观测窗口的票价收入 观测窗口的总飞行公里数 末次飞行日期 平均乘机时间间隔 最大乘机间隔 积分兑换次数 总精英积分 促销积分 合作伙伴积分 总累计积分 非乘机的积分变动次数 总基本积分
大数据挖掘专家
3
分析航空公司现状
2. 行业外竞争
随着高铁、动车等铁路运输的兴建,航空公司受到巨大冲击。
大数据挖掘专家
4
分析航空公司现状
航空公司数据特征说明
目前航空公司已积累了大量的会员档 案信息和其乘坐航班记录。 以2014-03-31为结束时间,选取宽度 为两年的时间段作为分析观测窗口, 抽取观测窗口内有乘机记录的所有客 户的详细数据形成历史数据,44个特 征,总共62988条记录。数据特征及其 说明如右表所示。 客户基本信息 特征名称 特征说明
19
了解K-Means聚类算法
1. 基本概念
K-Means聚类算法是一种基于质心的划分方法,输入聚类个数k,以及包含n个数据对象的数据库,输出满足 误差平方和最小标准的k个聚类。算法步骤如下。 从n个样本数据中随机选取k个对象作为初始的聚类中心。 分别计算每个样本到各个聚类质心的距离,将样本分配到距离最近的那个聚类中心类别中。 所有样本分配完成后,重新计算k个聚类的中心。 与前一次计算得到的k个聚类中心比较,如果聚类中心发生变化,转(2),否则转(5)。 当质心不发生变化时停止并输出聚类结果。
大数据挖掘专家
12
构建航空客户价值分析的关键特征
1. RFM模型介绍
本项目的目标是客户价值分析,即通过航空公司客户数据识别不同价值的客户,识别客户价值应用最广泛的 模型是RFM模型。 R(Recency)指的是最近一次消费时间与截止时间的间隔。通常情况下,最近一次消费时间与截止时间的间 隔越短,对即时提供的商品或是服务也最有可能感兴趣。 F(Frequency)指顾客在某段时间内所消费的次数。可以说消费频率越高的顾客,也是满意度越高的顾客, 其忠诚度也就越高,顾客价值也就越大。 M(Monetary)指顾客在某段时间内所消费的金额。消费金额越大的顾客,他们的消费能力自然也就越大, 这就是所谓“20%的顾客贡献了80%的销售额”的二八法则。
客户价值排名 模型应用 应 用 结 果
新增信息抽取
大数据挖掘专家
10
目录
1
2 3 4
了解航空公司现状与客户价值分析 预处理航空客户数据 使用K-Means算法进行客户分群 小结
相关文档
最新文档