电信市场客户分群
中国电信政企客户分群和业务需求分析共45页文档

▪
26、要使整个人生都过得舒适、愉快,这是不可能的,因为人类必须具备一种能应付逆境的态度。——卢梭
▪Байду номын сангаас
27、只有把抱怨环境的心情,化为上进的力量,才是成功的保证。——罗曼·罗兰
▪
28、知之者不如好之者,好之者不如乐之者。——孔子
▪
29、勇猛、大胆和坚定的决心能够抵得上武器的精良。——达·芬奇
▪
30、意志是一个强壮的盲人,倚靠在明眼的跛子肩上。——叔本华
谢谢!
45
中国电信政企客户分群和业务需求分 析
16、自己选择的路、跪着也要把它走 完。 17、一般情况下)不想三年以后的事, 只想现 在的事 。现在 有成就 ,以后 才能更 辉煌。
18、敢于向黑暗宣战的人,心里必须 充满光 明。 19、学习的关键--重复。
20、懦弱的人只会裹足不前,莽撞的 人只能 引为烧 身,只 有真正 勇敢的 人才能 所向披 靡。
中国电信政企客户分群和业务需求分析

8 7 6 5 4 3
-4-
评估企业自身能力适应度
能力评估 衡量标准 销售
0 难以获得
得分
1
2
容易获得 已经具备
设计能力
难以获得 容易获得 已经具备
供应链能力 难以获得 容易获得 已经具备
制造技术与 设备
制造可塑性
难以获得 容易获得 已经具备 难以获得 容易获得 已经具备
最终用户细 吸引力得分
分市场
(0-10分)
示例
细分市场1 细分市场2 细分市场3 细分市场4 细分市场5 细分市场6
8 7 4 6 6
9
-5-
选择谁是最适应的目标市场
高 细分市场6
细分市场2
能力适应度
细分市场4 细分市场5
细分市场1
细分市场3
示例
主要目标用户细分市场 • 细分市场2 • 细分市场1 • 细分市场4
维度二
6
3
1 4
8
5
维度二
- 13 -
不同细分维度解决不同的问题
根据不同细分维度,采用不同计算方法的细分模型都有其独特的应用领域
细分 标准 和方 法
ARPU值
依据企业客 户的价值/ (利润率)贡 献程度进行分 类
应用 价值
准确识别出 对中国电信有 真正价值的企 业客户群体
简单
关键购买因素
沟通方式
客户价值
价值观/生 活方式 宏观的价值 取向和态度
收入 获取成本 服务成本
-9-
对不同细分维度的评估
实施 难度
价值观/态度
需求 购买因素
这些是推动独特的产品和服务的独特客户需求么? –客户需要/想要什么服务? –他们愿意为之支付多少钱? –目标客户希望怎样的接触方式?
分群运营方案

分群运营方案一、前言随着互联网的迅猛发展,各行各业都在探索如何利用大数据和人工智能技术来提高业务效率和服务质量。
在营销领域,分群运营正逐渐成为行业的热点话题。
分群运营是指根据客户的特征和行为习惯,将客户分为不同的群体,并根据不同群体的特点制定相应的营销策略和服务方案,从而提高客户满意度和促进销售增长。
分群运营能够帮助企业更好地了解客户需求,提供个性化的服务,提高客户忠诚度,减少营销成本,提高营销效果。
本文将从分群运营的概念、意义、实施步骤和具体方案等方面进行详细探讨,以期为企业实施分群运营提供指导和参考。
二、分群运营的概念和意义1. 分群运营的概念分群运营是一种基于大数据和人工智能技术的营销策略,通过对客户的特征和行为进行分析,将客户分为不同的群体,然后针对不同的群体制定相应的营销策略和服务方案。
分群运营的核心思想是在客户的细分上细分,以实现更精准的营销和更个性化的服务。
2. 分群运营的意义(1)提高客户满意度:通过分群运营,企业可以更好地了解客户的需求和偏好,从而提供更贴近客户需求的产品和服务,提高客户满意度。
(2)促进销售增长:通过对不同群体的精准营销,可以更好地满足客户需求,提高销售转化率,增加销售额。
(3)减少营销成本:通过分群运营,企业可以更有效地利用营销资源,避免盲目投放广告费用,减少营销成本。
(4)提高营销效果:通过对不同群体的精准营销,可以提高广告的触达率和转化率,提高营销效果。
(5)提高客户忠诚度:通过提供个性化的产品和服务,可以提高客户忠诚度,增加客户的复购率。
三、分群运营的实施步骤和方法1. 数据采集和整合分群运营的第一步是数据采集和整合,企业需要收集客户的基本信息、消费习惯、行为轨迹等数据,然后将这些数据进行整合,建立客户数据库。
数据采集和整合的方法主要包括以下几种:(1)线上数据采集:通过网站、APP等线上渠道收集客户的基本信息和行为数据。
(2)线下数据采集:通过门店销售数据、会员系统等线下渠道收集客户的基本信息和行为数据。
电信运营商部门组织架构

电信运营商部门组织架构电信运营商部门组织架构一、市场部职责及岗位设置市场部主要职责:1.负责某分公司市场研究分析~包括竞争动态、市场情报收集和全市市场经营分析等。
2.负责营销计划、经营策略及全市营销方案的策划和制定。
3.统筹品牌的宣传和推广。
4.统筹渠道的规划和协调。
5.统筹新产品的开发和推广。
6.营收管理。
一、市场规划1.市场调研、分析、研究及预测。
2.收集市场信息~制定市场规划~提出实施方案。
3.制定经营目标和计划~做出分析。
4.制定市场发展策略、客户分群策略。
最大限度创造企业利润~提高经营管理水平~创造最佳经营业绩。
二、经营分析及预算1.利用会计核算、统计核算以及其他方面提供的资料~按地域、产品、业务、存增量、客户群、时间纬度对经营过程和结果进行分析。
2.根据市场规划~分析经营状况和行业情况~发现问题~找出原因~提出方案。
3.负责各类报表的统计上报工作。
4.负责风险管理、滚动规划、成本预算、预算管控等经营预算管理工作。
5.制定经营目标考核制度,并组织实施和提供支撑。
,三,业务流程管理1.制定及优化市场前端业务处理流程~指导实施,定期检查~实时分析~组织例会~督办相关工作~提出考核意见。
2.统筹业务系统和前端业务支撑系统的需求。
3.制定业务流程规划、标准和提升目标。
4.制定业务支撑系统业务规范。
5.承接省公司流程管理各项工作任务。
协调、解决前后端各部门在流程实施过程中的各种问题。
,四,服务管理1.制定服务标准和规范、投诉管理制度。
深入领会集团公司、省公司服务政策。
2.负责客户满意度管理、本地服务和客户能力提升工作。
3.负责服务规划、服务策略研究工作,做好服务问题的事前、事中控制措施和管控办法。
4.负责服务质量监督管理,分析、检查、考核、投诉督办、整改,工作,做好越级投诉管理。
,五,品牌与宣传管理1.制定各类产品分客户群广告策划方案和宣传设计~编制费用预算~根据批复组织实施~并做好方案的评估和宣传的检查~提出考核意见。
中国电信市场细分.doc

中国电信市场细分这篇文章的主要内容讲的是对中国电信的手机市场的市场细分,企业的市场细分指的是按照消费者的欲望和需求把因规模过大导致企业难以服务的总体市场划分成为若干个具有共同特征的子市场,处于同一细分市场的消费群被称为目标消费群。
以下这篇是中国电信市场细分的文章分享,感兴趣的朋友一起来看看这篇由资料站为您提供的文章。
中国电信市场细分目录(一)低端细分市场2009年中国电信做得较为出色的一个细分市场是校园,“中国电信为学生量身定制的几款套餐如音乐套餐、聊天套餐、上网套餐等,令人耳目一新。
无疑这一策略为电信手机在占领校园市场上赢得了不错的机会。
它将需求顾客群体定位在年青一代并对手机娱乐有较大需求的校园学生群体上。
准确的顾客群体定位是其制定市场营销组合策略的好的开端,进而抢占了优的市场机遇,提高了企业的竞争力。
(二)高端细分市场对于日前传出的中国电信高端旗舰手机战略,知情人士透露,中国电信主要是希望推出一系列以“心系天下”命名的高端手机吸引企业、事业单位的中高层等社会精英,专门打造一种高品质的手机,拼抢与iPhone不同的高端商务用户市场。
(三)大力出击细分市场中国电信对细分市场的重视是显而易见的。
2012年是中国CDMA市场大发展的一年。
中国电信董事长王晓初预计2012年天翼终端将发展8000万部,其中3G智能手机将发展4500万部。
下面我们对电信作了SWOT分析:(一)竞争优势(1)固网领域的巨大优势。
中国电信依托早期的垄断地位,在固话业务上拥有其他竞争者无可比拟的巨大优势。
虽然目前的基础固话网络用户逐年萎缩,但该业务作为中国电信利润的重要来源,是当之无愧的金牛业务。
且中国电信开发出许多基于固话的促销策略,对于其他业务单元的建设功不可没。
(二)竞争劣势(1)在个人业务市场上的不足。
中国电信在个人业务市场建设上,一直未有大的竞争突破。
在营销上,中国电信的问题可以从市场定位、品牌建设两个方面论述。
在市场定位上,CDMA的市场定位是发展中高端用户,然而调查显示,无线互联网用户主要是学生群体和中低收入的群体。
电信客户细分方法与维系行动方案

高
ARPU较前三个月ARPU突降30%,或时长较前三个月突降30%
中
(降离网倾向为高或低以外的其它用户)
低
对公托收 ,或全业务融合套餐(含紧密融合和自主融合)
手机加装 G
已加装
已加装电信手机
未加装
未加装电信手机
高
4M及以上
中
2M-3M
低
2M以下
ITV捆绑I
电信客户细分方法与维系行动方案
1
22 案总体 路
11 方案背景与目标
4 客户分层应用
3 客户分层方法
方案总体思路
2
各分公司客户维系工作开展进度和程度差别较大,亟需在全省范围内,建立统一的客户维系执行方案
终端类型: 2G 终端时长:一年~一年 半 流量需求:高或中
活动2移动分层维系_协议捆绑预警用户_存费送费活动
高
捆绑度:捆绑预 警 价值:拍照 离网倾向:所有
已捆绑
已加装ITV
未捆绑
未加装ITV
宽带客户分层维度指标说明
宽带客户
11
宽带用户分层前剔除: 公免、公纳、专线、非正常态、入网3个月内用户、红黑名单、免打扰用户
客户价值 B
宽带速率 H
低
22 案总体 路
11 方案背景与目标
H1、高
H2、中
H3、低
I1、已捆绑
I2、未捆绑
3×4×3=36种组合
3×3×3=27种子类
2×3×2=12种子类
需求分层:按客户需求对客户进行细分,为制定维系策略提供参考
省公司:基于客户稳定度、结合客户需求开展客户分层
稳定度分层
需求分层
移动
宽带
客户分群技术在电信市场经营中的应用研究

1客户属性的描述
户帐 户属 性 、客 户行 为 属性 、客 户服务 属性 留客 户与 服 务中 心联 系 的 历史 记录 。
的月平均 普通长话 次数 + 月平均 I P长话次
数 = 客户的 月平均 长话次 数 。数运算 中的 17 扩展属 性 . 和客户扩展属性。 乘 客 户 扩 展 属 性 是 指 根 据 客 户 的 背 景 资 “ ”可 以 用 于 不 同 度 量 单位 的 属 性 之 间 , 1 1 背景属性 . 客 户 背 景属 性 是 指客 户 的姓 名 、年龄 、 料 、消 费及 交费 历史 、呼 叫记 录等 资料 ,经 计算 之后的 属性 具有 新的 度量单 位 ,可 以表 客 客 户性 别等人 I统计 信 息 ,这 些信 息是 由客 过 更加 深入 的计算 和分 析得 到的 用 于对 客户 示 新 的属性 。例 如 :“ 户月平 均消 费额 x = 1 户在 首次 申请服 务时 填 写或大客 户 经理走访 进 行评价 的指标 。评价 标准 可根 据 分析需 要 客户信 用度 ”可 以在 一定 程度上 表示 客 户的
除 客 户时获 得的 ,可 以用于 识 别和描 述客 户群 进 行 自定义 。客 户扩 展属性 是 对客 户进行 评 价 值 或 重 要 程 度 。数 学 运 算 中的 “ ” 用 比 价 的一 个重 要组成 部分 ,一项扩 展 属性 往往 于相 同度量 单位 的属 性之 间时可 以得 到 “ 的特 征 。要保证 这些 信 息的准 确 ,就必 须持 续不 断的收 集和 维护 这些信 息 ,对 信息 变更 结 合 了多项 因素 ,能够 综 合地 对客 户进行 描 例 ”属 性 ;用 于 某 种 度 量 单 位 与 无单 位的 “ 个数 ” 类 属 性保留历史记录 。 类的属 性 。例如 :“ 户每月 主叫 电话数 / 客 12 联 系属性 .
什么是个人客户?

什么是个⼈客户?
当前的电信⾏业,运营商都强调客户分群,实施精确化营销,提供专业化的服务。
运营商⽬前最流⾏的客户分群类别是将客户分为政企、家庭和个⼈三⼤客户群。
随着3G的来临,个⼈客户群逐渐的变得重要。
但是,运营商内部却对什么是个⼈客户没有⼀个明确的定义。
什么是个⼈客户?
在社会⾥,每个⼈都是⼀个个独⽴的实体,但⼈⼜是社会的动物,绝⼤多数的⼈都属于某⼀个特定的组织,依靠为这个组织做出贡献⽽获得在社会⽣存的资源;同时,社会⼜是由⼀个⼀个的家庭所组成的,每个⼈都会有属于⾃⼰的家。
因此,每个⼈除了有⾃⼰的个性外,他/她还会和⾄少⼀个特定组织和家庭发⽣千丝万缕的关系。
移动业务具有天然的个⼈性。
能通过业务来确定个⼈客户的范畴吗?⽬前通信的发展逐渐强调业务的融合。
⼀个既使⽤移动业务,也使⽤家庭固话和宽带的客户,究竟应该归⼊个⼈客户还是家庭客户呢?如果这个客户⼜使⽤了政企的业务,他的移动终端与他的公司发⽣着紧密的联系,⼜应该归⼊何类客户?
但是,我们是否可以不从企业的⾓度去观察,⽽是从客户的⾓度去思考呢?客户⾃⼰想被归⼊何类业务,享受怎样的服务,⽀付怎么样的代价?。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
采用聚类分析的数据挖掘技术进行电信市场客户分群引言随着国内电信市场竞争的日趋激烈,电信运营商的经营模式逐渐从“技术驱动”向“市场驱动”、“客户驱动”转化。
面对客户的多样化、层次化、个性化的需求,大众化营销已经失去了其优势,基于客户信息、客户价值和行为,深入数据分析的洞察力营销、精确化营销的理念逐渐被各大电信运营商所接受,并渴望通过从数据中挖掘价值来减少营销成本、提高营销效益。
近几年迅速崛起的数据挖掘技术成为实现这些目标的必要手段。
数据挖掘是从海量数据中提取隐含在其中的有用信息和知识的过程。
电信各运营支撑系统所积累的海量历史数据是企业的一笔宝贵财富,谁能正确地挖掘与分析隐含在数据中的知识,谁就能更好地向用户提供产品与服务,从而在竞争中脱颖而出。
数据挖掘提供了从数据到价值的解决方案:“数据 + 工具+方法+目标+行动=价值”。
数据挖掘目前已有一系列应用:分类分析、聚类分析、预测分析、偏差分析、关联分析和时序模式等,这些应用涉及到的技术和工具各不相同,然而却可以依据统一的方法论来实行,并可以协同作战,解决许多有价值的商业问题。
由SPSS、NCR和Daimler-Benzd在1996年提出的CRISP-DM方法论是国际上数据挖掘行业流行的标准,其成功之处在于源于实践,是实际数据挖掘项目的智慧和经验的结晶。
CRISP-DM定义了数据挖掘项目的标准化流程,如图1所示。
图1 CRISP-DM方法论准确的细分市场和差异化的营销策略是目前电信企业市场营销所必须面对的难题。
所谓市场细分是指营销者根据顾客之间需求的差异性,把一个整体市场划分为若干个消费者群的市场分类过程。
由于顾客对电信产品需求的多样性、变动性以及电信企业资源的有限性,电信企业在进行市场营销过程中,必须进行市场分析,选择目标市场,做出市场定位,并结合目标市场的特点和结构制定有针对性的市场营销策略。
客户分群是了解客户进行市场细分和目标市场营销的前提。
数据挖掘的分类和聚类的方法都可应用于客户分群。
下面我们将对用聚类方法进行客户分群的实现模式进行详细阐述,为电信目标市场营销的客户分群提供完整的解决方案,并以实际案例验证其可行性。
基于聚类分析的客户分群聚类(clustering)是指把一组个体按照相似性归成若干类别,即“物以类聚”,其目的是使得属于同一类别的个体之间的相似度尽可能大,而不同类别的个体之间的相似度尽可能小。
相似度是根据描述对象的属性来测算的,距离是经常采用的度量方式。
聚类和分类有着很大的区别:分类时,我们总是事先知道哪些属性是重要的,运营商总是将重要的、有影响力的属性作为分类的依据;而聚类时,运营商事先根本不知道哪些属性起作用,任务之一就是要找到那些起关键作用的属性。
聚类分析能够帮助我们发现特征迥异的不同客户群,和对客户分群起关健作用的指标变量,并辅助运营商对各客户群的特征进行深刻洞察。
1.客户分群的商业理解依据CRISP-DM流程首先要进行客户分群的“商业理解”,这一初始阶段集中在从商业角度理解项目的目标和要求,然后把理解转化为数据挖掘问题的定义和一个旨在实现目标的初步计划。
我们必须明确项目的商业目标,这个目标应该是适于用基于聚类分析的客户分群方法去达到的。
比如某电信运营商定义的客户分群的商业目标是“对某市数十万公众客户,从价值和行为的分析维度进行客户分群,以了解不同客户群的消费行为特征,为发展新业务、流失客户保有、他网用户争夺的针对性营销策略的制订提供分析依据,并实现企业保存量、激增量的战略目标”。
电信客户从营销属性分为三类:公众客户、商业客户和大客户,其中公众客户消费行为有较大的随机性,客户分布难有规律可寻,比较适于聚类分析。
我们可以将此商业目标转化为数据挖掘的可行性方案:从价值和行为维度,考察客户业务拥有与使用、消费行为变化、他网业务渗透等方面属性,采用聚类分析的数据挖掘技术对研究的目标客户(公众客户、入网时长、地域属性、产品拥有类型等方面限定)进行客户分群,对各客户群进行特征刻画和属性分析,为针对性营销确定目标客户群,并根据客户群属性和营销目标量体裁衣制订恰当的营销方案。
由于客户的特性是不断变化的,数据挖掘的分析结果具有一定时效性,因此数据挖掘必须以项目来实施,在目标、进度和资源安排上明确要求。
2.2 客户分群的数据理解“巧妇难为无米之炊”,数据是挖掘的基础,在确定目标和方案后需要进行“数据理解”,以确定要支持我们的分析目标需要哪些方面的数据,数据基础是否已经具备,数据质量是否能满足要求,如果不能得到肯定的答复,我们建议推迟项目实施直至条件成熟,因为“进去的是垃圾出来的仍是垃圾”,错误的分析结果可能会给我们带来重大的损失。
比如在上述案例中,我们分析了各业务系统及企业数据仓库中客户信息、客户消费及购买使用行为三个方面最近六个月的历史数据。
电信企业拥有业务受理开通的CRM系统,进行计费、帐务及欠费处理的计费系统,卡类业务的智能网系统,客户服务的10000号系统,营销服务的渠道系统,还有结算系统、宽带、窄带及小灵通系统等等,这些业务系统储蓄了企业运营的海量客户数据。
有些电信企业还建立了数据仓库系统,对这些数据进行了清洗、整合和集中,建立了企业统一数据视图,并确保了数据来源的广泛性、完整性和准确性,为数据挖掘创造了更好的条件。
我们从企业数据仓库中确定了以下数据的来源:∙客户基本资料∙用户基本资料∙帐单信息∙本地通话信息∙长话通话信息∙卡通话信息∙结算信息∙窄带使用信息∙宽带使用信息∙客服交互行为∙缴费信息∙欠费信息∙服务使用信息∙…除了数据源分析,数据理解阶段的另一些重要任务是进行数据探索和检验数据质量。
我们可以借助一些可视化工具或统计分析进行数据探索,以明确数据的分布状况和重要的属性及其关系。
比如通过值分析对数据进行基本的探查,包括空值、唯一值、空字符串、零值、正值、负值的统计;统计分析计算各数值型变量的最小值、最大值、均值、标准差、众数等,有利于发现一些异常值,便于更好地理解数据;频次分析、直方图分析有助于更准确地了解数据的分布,从中发现有价值的点,其中频次分析主要面向离散型变量,而直方图分析主要面向连续型变量。
数据探索有助于提炼数据描述和质量报告,还能发现数据异常,并为进一步的数据转换和数据准备打基础,甚至可能直接指向数据挖掘的目标。
数据探索的同时可以全面检验数据质量,对数据的完整性、正确性、一致性有更细致的认识。
除了统计分析,抽样核查比较也是数据检验常用的方法,在进行数据质量核查时,需要有对数据意义和取值范围敏感的业务人员参与。
2.3 客户分群的数据准备“数据准备”包括所有从原始的未加工的数据构造最终分析数据集的活动,是数据挖掘过程中最耗时的环节,甚至要占据整个数据挖掘项目一半以上的工作量。
数据准备工作的流程如图2所示。
图2. 数据准备流程选择数据决定用来分析的数据。
选择标准包括与数据挖掘目标的相关性,数据质量和工具技术的限制,如对数据容量或数据类型的限制。
数据选择包括数据表格中属性(列)和记录(行)的选择。
我们可以分主题在企业数据仓库中选择我们需要的各类数据,并进行按月汇总,生成月粒度数据基础表。
基础表中每个用户每个帐务月的信息汇总成一条记录。
如在我们的案例中基础表涵盖了以下数据:用户及客户的基本信息包括客户身份信息、联系方式、产品拥有情况,用户竣工时间、入网时长、服务开通情况、优惠套餐信息、客户服务信息(投诉、咨询、催缴情况)等价值信息包括话音、宽窄带业务的月租费、使用费、优惠费用及增值业务、新业务、信息费和卡类、结算费用,还包括了缴欠费信息行为信息包括时长、次数、跳次、发话不同号码数、时长集中度(拨打时长最多的三个号码拨打时长在总时长中占比)、次数集中度基础表中数据属性粒度要求尽量细,以便于在后期灵活构建数据。
我们将以上价值和行为变量从专业(区内、区间、本地移动、本地异商固网、传统国内长途、传统国际长途、传统港澳台长途、传统异地行动、IP国内长途、IP国际长途、IP港澳台长途、IP异地行动)和时段(白天:7:00-18:0、晚上:18:00-7:00、特殊时段:0:00-7:00)两个维度进行了划分。
清洗数据将数据质量提高到所选分析技术和分析目标要求的水平。
这包括选择需要进行数据清洗的子集,插入适当的默认值或者通过更加复杂的技术如建模来估计缺失值,比如某月份的数据缺失我们可以用前后月份数据的平均值来填充,我们将拥有产品较多(可能不是公众客户)及公免的客户数据剔除。
此阶段需要对基础表的数据进一步探索和检验。
构建数据该任务包括构建数据的准备操作,如进行变量设计生成派生属性、生成完整的新记录或者已存属性的转换值(将字符型字段转化为数值型字段)。
在基础表基础上通过抽取、合并、衍生得到分主题汇集的价值变量和行为变量形成的中间表,中间表中每个用户6个月的信息汇总成一条记录。
抽取指直接从基础表中选择变量进行汇总;合并指将基础表中多个字段合并成一个字段汇总,如将区内通话时长和区间通话时长合并成本地通话时长;衍生指根据各种逻辑关系派生出新的变量,如均值变量、占比变量、趋势变量、波动变量等。
在进行变量设计时建议技术人员和业务人员密切配合讨论,根据业务需要、挖掘目标及数据源的实际状况确定数据选择,确定基础变量和数据源的映射关系,确定衍生变量的数据转换逻辑。
中间表变量命名的规范化有助于用户理解、记忆和应用,便利于将来数据挖掘的应用分析。
变量命名采用对变量属性进行描述的分段的英文缩写(首字母大字)用下划线连接来实现,字段按属性意义从大到小的范围排列,从而在对变量进行排序时可以把同一类型的变量聚集在一起,便于分析,如“价值/行为(v/b)_业务专业(Inner/Inter/Tol)_地域(Dms/Int/Gat)_拨打方式(Trd/IP)_ 值类型(Amt/Fee/Dur/Cnt/Dstn)_衍生值类型(Trd/Rat)”。
中间表可以按模块化原则来设计实现,可随着应用和业务发展的需要不断进行扩充。
整合数据对各中间表的数据进行联合,生成最终的分析数据集也称宽表。
我们以客户标识为主键,串联起客户相关的所有信息数据,建立起统一客户视图。
在整合数据时,我们要回顾商业理解阶段对数据挖掘目标的定义,以使我们的分析数据集能满足需求。
有些电信企业由于历史数据以用户为中心,难以建立起统一客户数据视图;这时可使数据挖掘的目标限定于对某类用户进行分析;或以分析某类用户为主,通过企业数据库中用户之关的关系数据,去关联其它产品信息辅助分析。
在完成数据整合后,我们需要再次对数据质量进行核查。
格式数据格式化转换是指根据建模的要求,对数据表现形式进行变换,如用K均值算法做聚类分析时,需要先将数据进行标准化处理,对数据进行Z变换,以消除量纲不同可能引起的数据差异。