电信业核心客户健康度评估建模研究_赵黎明

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
i =1
标 AHP 权重 Q i 每半年或一年根据实际情况进行 调整 。 b. 计算指标熵值权重 w i 。 熵值法是根据各指标所含信息有序度的差异 性 , 也就是信息的效用价值来确定该指标的权重 。 在信息论中 , 熵是系统无序程度的度量 , 某指标携 带和传输的信息越大 , 表明该指标对决策的作用较 之其他携带和传输较少信息的要大 。 ( 1) 计算指标熵值 H i 。
·企业管理与信息化· 赵黎明 余开朝 电信业核心客户健康度评估建模研究
11
电信业核心客户健康度评估建模研究
赵黎明 , 余开朝 ( 昆明理工大学 机电工程学院工业工程系 , 云南 昆明 650093) 摘要 : 针对电信业客户流失问题 , 讨论了核心客户健康度评估模型的构建与应用 。 对模型的建立 过程及评价进行了描述 , 运用定性归纳 、 聚类分析实现模型指标的确定 ; 运用归一法 、熵权系数法 实现健康度评价 ; 运用决策树法实现健康度等级的划分 。 关键词 : 电信 ; 核心客户 ; 健康度 ; 评估模型 中图分类号 : TP399 文献标识码 : A 文章编号 : 1672 -1616( 2011) 19 0011 -03
[ 1 -2]
为了确定策略实施的目标客户群 , 对潜在的流失客 户进行预测具有十分重要的作用 。
2 模型设计思路和研究方法
2. 1 商业理解和宽表设计
商业理解和宽表设计[ 3] 过程是模型构建的第 一步 , 主要完成对客户需求的理解和确认 , 并展开 相关的模型指标变量的设计工作 。 商业理解阶段一般通过定性归纳来实现 。 定 性归纳是最简单的描述型数据挖掘 , 常常也称为概 念描述 。 宽表设计阶段是将商业理解得出的定性 概念数据泛化 , 确定客户需要采用的变量 。 其中所 得变量包括可直接获得的变量及各类因模型支撑 需要而设计的衍生变量 。 根据对客户需求的理解和确认 , 将该阶段得出 模型需求变量分为 4 类 : 收入类 、 业务类 、服务类 、 社交网络类 。 指标体系构建如图 1 所示 。
12
2011 年 10 月 中国制造业信息化 第 40 卷 第 19 期 ( 2) 对指标 变换 后的值 Y 计算 其概 率密 度 f( y) : f( y )=
理 。 数据预处理主要包括 : 数据清洗 、 数据集成 、 数 据转换和数据消减 。 数据预处理过程工作量大而复杂 。 其工作约 占数据挖掘整体过程工作量的 60 %左右 。 该模型 构建的数据预处理主要是指三级指标的预处理工 作 。 通过数据清洗和数据集成进行变量值的获取 , 变量准备的结构如图 2 所示 。
∑ scoreij W ij ,
i =1,2, …, n 式中 : score j 为第 j 个核心客户的得分 ; score ij 为第 j 个核心客户第 i 个指标的得分 ; W ij 为第 j 个核心 客户第 i 个指标的权重 。 通过以上模型可以得出三级指标的标准分值 和二级指标各分类健康度得分 。 因为得出的二级 指标值已为标准分 , 由二级指标计算出一级指标只 需进行上述模型算法的第二步和第三步即可 。
式中 : X max 是指标值最大值 ; b 是标准值 。 第二步 , 对三级指标赋权重 。 a. 计算指标 AH P 权重 Q i 。 采用专家打分法 , 由专家按业务指标重要性进 行指标 AHP 权重 Q i 的指定 。 所有 业务 指标 的
n
[ 5]
AHP 权重 Q i 的总和为 100 分 (∑ Q i = 100) , 指
2. 4 数据探索和特征细分
通过核心客户健康度模型探索和应用得出核 心客户健康度得分后 , 筛选出已离网的核心客户 ,
18
2011 年 10 月 中国制造业信息化 第 40 卷 第 19 期 参考文献 :
( 3) 计算指标组合权重 Ci 。 将指标调整权重 B i 转换为指标组合权重 Ci : Ci = Bi
i =1
∑Bi
n
×100
d. 计算指标使用权重 W i 。 取该核心客户某 2 个月的指标组合权重 Ci 和 Cj 的算术平均 , 四舍五入取整 , 作为目前使用的指 标权重 W i : Wi =
1 研究背景和研究意义
随着中国电信企业的不断发展 , 各电信企业的 市场份额进一步拆分 , 市场竞争日趋激烈 。 客户选 择电信产品及电信企业的空间越来越大 , 电信企业 之间对客户的争夺也越来越激烈 , 客户流失已经成 为电信企业普遍存在的问题 。 为了更有效地减少 客户流失带来的损失 , 基于数据挖掘技术 , 国内针 对电信业的客户流失管理进行了大量的研究 。 很 多顾问公司和软件厂商也提出了自己的解决方案 , 有的企业对电信业的客户流失管理有了自己的产 品 。 但是 , 在具体如何实 施客户流 失管理的 技术细节上 , 目前尚没有统一的定论 。 在电信行业 , 所谓核心客户即是对企业做出巨 大贡献的用户 , 识别核心客户并保有核心客户是企 业经营管理的重点工作之一 , 对于企业发展具有至 关重要的战略意义 。 核心客户健康度评估是核心 客户保有功能实现的重要组成部分 , 是对核心客户 保有效果的深度挖掘 。 它通过对核心客户保有后 的在网状态及效果的分析展现 , 实现对客户流失的 预测分析功能 。 就有效地实施客户保有策略而言 ,
2. 2 数据预处理
为提高数据挖掘对象的质量 , 并最终达到提高 数据挖掘所获模式知识质量 , 需要进行数据的预处
图 1 核心健康度评估指标体系
收稿日期 : 2011 -04 -25 作者简介 : 赵黎明( 1986 ) , 男 , 河南新乡人 , 昆明理工大学硕士研究生 , 主要研究方向为企业制造业信息化管理和数据挖掘 。
∑ sij
式中 : sij 表示该健康因子第 j 个核心客户 、第 i 个 指标标准得分 ; m 为核心客户总数目 ; n 为该健康 因子考核指标数目 。 ( 2) 利用指标熵值 H i , 计算指标熵权 w i 。 1 -Hi wi = n ×100 ( 1 H i ) ∑
i =1
c . 计算指标组合权重 C i 。 ( 1) 计算指标平均权重 A i 。 取指标熵值权重和 AHP 权重的算术平均 : Ai = Qi +W i 2
图 2 核心客户 健康度变量准备的结构
2. 3 模型设计和研究
为了使该模型设计完成后能够进行更好的细 化分析应用 , 在模型建立的初步阶段将相关指标进 行聚类 , 分成 3 个等级指标 。 该模型中三级指标数 据为基础数据 , 通过模型设定的算法得出二级指标 的数据 , 再由二级指标数据通过模型算法得出最终 目标值 , 即一级指标值 。 因为该模型功能为多指标 评价 , 使用熵权系数法构建初步模型 。 熵权系数法[ 4] 是 根据熵的概 念与性质 , 把多 指标决策评价中各待选方案的固有信息和决策者 的经验判断的主观信息进行量化综合 , 建立基于熵 的多指标决策评价模型 。 其特点是能够将系统中 各评价指标与目前状况下相应评价指标的理想值 进行比较 , 通过定量与定性相结合的一种较为理想 的评价模型 。 根据熵的性质建立多指标决策评价模型 , 由三 级指标计算出二级指标的模型算法设计如下 : 第一步 , 对三级指标值进行归一化处理 , 转换 为标准评分 。 a. 因为各指标单位不一 , 评价标准不一 , 不满 足多指标决策评价模 型的方法使用 的假设前提 。 为满足假设 , 首先采用归一法 , 将保有后核心客户 健康度各指标值转换为标准正态分布的概率密度 : ( 1) 将指标值 X 进行归一变换 , 变换后的值 Y 服从标准正态分布 : Y = X -μ σ

y
-∞
1 -t2 e dt 2π
2
b . 采用标准分的计算方法 , 对各指标值标准正 态分布概率密度进行线形变换 , 转换为标准评分 : ( 1) 根据业务规则和指标的正向/ 逆向性 , 确定 每个 指 标 标 准 评 分 最 高 分 score max 和 最 低 分 score m in 。 ( 2) 采用标准分的计算方法 , 将指标值标准正 态分布概率密度转换为标准评分 score 。 计算公式 : score = score min ×( 1 -f ( y) )+score max × f ( y) 。 c. 异常值评分 。 一般来说 , 对服从正态分布的随机变量 X 来 说 , 异常值可定义为 : X < μ-2 σ或 X > μ+2 σ。 对异常值的评分方法 : 以标准值为基础 , 超过 1 倍 , 分数开始减少 , 最低为标准值 。 考 核指标超 过标准值越多( 超过 1 倍以上) , 评分反而越低 。 其计算公式为 : score = score min ×( 1 - f( g( x) ) )+ score max × f ( g( x) ) g( x )= x -b x ≤ 2 b σ ( X max - x )×b x > 2b ( X m ax -2b )×σ
n
通过计算得到 : 2010 年 9 月 、 10 月预测覆盖率 分别为 74 . 05 %, 77 . 66 %。 检验结果表明 , 模型的覆盖率结果稍差 , 但依 然保持了较好的评估性能 。
Ci + Cj 2
第三步 , 计算得出二级指标分数 。 scorej =
i =1
3 结束语
核心客户健康度的应用分析主要用于健康度评 估结果的多维度全方位展示 , 对健康度结果进行关联 和趋势分析 , 最终输出核心客户健康度的分析数据 。 同时 , 实现对影响健康度的指标的监控 。 通过相关分 析发现影响目标客户健康度的问题 , 解析问题产生的 原因 , 及时发现影响核心客户价值的短板 。 为核心客 户健康度提升 , 分层分级管理 , 提高营销服务针对性 、 准确性和高效性等工作提供信息分析支撑 , 为省公司 制定核心客户保有策略和价值提升策略提供决策依 据 。同时 , 将分析的数据传递给营销服务支撑模块 , 通过营销服务支撑完成核心客户保有 、 健康度提升等 工作 。 因此 , 在电信行业进行核心客户健康度建模具 有广泛的应用前景 。 ( 下转第 18 页)
表 1 检验结果
评估 不健康 2010 年 9 月实际不健康 2010 年 10 月实际不健康 2 406 2 218 评估健康 / 较健康 843 638 合计 3 249 2 856
( 2) 计算指标调整权重 B i 。 利用指标熵值权重 w i , 对指标平均权重 A i 进 行调整 。 Bi = 0 , 当 w i =0 时 Ai , 当 w i > 0 时
2. 5 模Байду номын сангаас评估和应用
对核心客户健康度评估模型的评价主要从覆 盖率 着手 。 对于健 康度评估而言 , 业务人员 最
[ 6]
关注的是尽可能多地获取不健康客户的信息 , 这就 要求预测模型的覆盖率尽可能高 。 本模型中覆盖 率是指实际健康度为不健康的预测正确的比例 。 将本模型应用于某移动通信公司的核心客户 健康度评估 , 从 2010 年 9 月 、10 月的历 史数据中 分别随机抽取了 50 000 条客户记录进行建模 , 对 比 2010 年 11 月和 12 月数据 , 观测实际健康度情 况 , 数据检验结果见表 1 。
m
Hi =
- ∑ p ij ln pij
j =1
ln m
, i =1 , 2 , … , n
·企业管理与信息化· 赵黎明 余开朝 电信业核心客户健康度评估建模研究 p ij = sij
m j =1
13
分析离网的核心客户健康度得分特征 , 并以此为标 准判断核心客户 的健康度状况 。 具体步骤如下 : ( 1) 使用数据挖掘的方法分析当前已处于衰退期或 直接进入离网期的核心客户在进入衰退期之前 2 个月的各种关键业务类健康度特征 ; ( 2) 根据得出 的健康度特征运用决策树法建立预测模型 , 将核心 客户健康状况分为健康 、 比较健康 、 不健康 3 类 , 为 每个核心客户的健康度进行分级 , 评估当前核心客 户的健康度状况 。
相关文档
最新文档