电信客户流失和七项经济指标聚类题

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1、电信公司为分析客户流失状况,为客户是否流失提供参考依据,随机选取了600名客户进行研究,得到了如附表所示一系列数据,收集到的数据包含下列字段:在网月数截止数据收集时间为止的在网月数

年龄客户实际年龄

婚姻状况客户婚姻状况,0代表未婚,1代表已婚

现地址居住时间现在地址的居住月份

教育程度1:专科以下;2:本科;3:硕士;4:研究生;5:

博士

工作状态0:待业;1:在职

性别0:女;1:男

租设备0:不租;1:租

IP电话0:无;1:有

无线电话0:有;1:无

本月话费话费具体金额

语音信箱0:无;1:有

网络0:无;1:有

来电显示0:无;1:有

呼叫等待0:无;1:有

呼叫转移0:无;1:有

流失状态0:未流失;1:流失

根据这些客户数据,进行数据预处理,之后分别用逻辑回归和SVM算法进行分析,对比两种算法的拟合优度,从而选择两者中更加适合的算法模型。写出分析思路和过程,并为电信公司提供客户运营的相关建议。

数据分析应用1电信客户流失数据.xlsx

2、选取7项经济指标作为决定经济类型的影响因素,对全国31个省、直辖市、自治区(浙江、湖南、甘肃除外)进行聚类分析(各项数据均来自2010年国家统计年鉴)。

数据分析应用2省市分类.xlsx

对数据进行预处理(创建新的变量等),比较说明聚成几类时聚类效果最好,写出分析思路和过程,并分析每一类的实际意义。

相关文档
最新文档