crm数据挖掘电信应用案例
数据挖掘在电信行业客户关系管理中的应用

数据挖掘在电信行业客户关系管理中的应用随着电信行业的发展,客户关系管理(CRM)已经成为电信行业营销团队必不可少的支柱。
学术界对电信行业CRM的研究也在不断增加,而数据挖掘技术正被认为可以加强CRM效率。
因此,为了更好地理解数据挖掘在电信行业CRM中的应用,本文将以具体的实例来探讨其使用的价值。
以电信行业的客户分类为例,数据挖掘可以根据客户的历史行为数据和客户属性数据对客户进行分类。
这种分类可以根据客户的价值,以实现不同客户群体的针对性营销。
例如,一家电信企业可以根据数据挖掘技术对客户进行分类,以确定哪些客户有潜力成为他们的忠实客户,从而采取更有针对性的营销活动,以最大限度地提升客户价值。
另外,数据挖掘技术也可以以不同的维度建立客户关系模型,帮助企业了解客户的需求,并根据客户的喜好来提供更佳的服务。
例如,一家电信企业可以采用数据挖掘技术,分析客户在使用特定服务时所表现出的行为及其趋势,然后根据客户的需求提供更优质的服务。
此外,数据挖掘还可以帮助企业实现客户流失预测和客户保持预测。
例如,一家电信企业可以根据客户的使用情况,行为特征,以及更新的其他信息,应用数据挖掘技术预测客户的流失状况,以便更好地预测客户的流失概率,从而提前采取措施,有效地维护客户的忠实度。
此外,在客户满意度评估中,数据挖掘技术也可以给CRM团队提供极大的帮助。
电信企业可以使用数据挖掘技术,分析客户的满意度指数(CSI),以更好地了解客户的满意程度,以便对CRM团队提出合理的建议,提高客户满意度并增强客户忠诚度。
综上所述,数据挖掘技术在电信行业的CRM中可以发挥重要的作用,包括客户分类,客户关系建模,客户流失预测,客户保持预测,客户满意度评估等。
数据挖掘技术可以为电信企业提供宝贵的帮助,有效地提升客户价值,提高客户满意度,并有效维护客户的忠实度。
因此,随着电信行业CRM技术的不断发展,数据挖掘技术将逐渐成为客户关系管理及提升客户价值的关键工具。
数据挖掘技术在客户关系管理中的应用案例研究

数据挖掘技术在客户关系管理中的应用案例研究随着信息时代的发展,数据成为了企业发展和决策的重要依据。
客户关系管理(CRM)作为一种关注客户、提供最佳服务和保持客户关系的战略,对企业的长期发展至关重要。
为了更好地理解和满足客户需求,企业越来越多地采用了数据挖掘技术来分析和利用海量的客户数据。
本文将探讨数据挖掘技术在客户关系管理中的应用,并通过案例研究来展示其实际效果。
一、客户细分与个性化营销通过数据挖掘技术,企业可以将大量的客户数据按照一定的规则进行分类和细分,进而实现个性化营销的目标。
例如,某电商企业使用数据挖掘技术对客户进行聚类分析,发现不同族群的客户在购买偏好、消费金额等方面存在差异。
基于这些差异,企业可以将不同客户群体进行个性化推荐,提供更符合其需求的产品和服务,从而增加消费者的忠诚度和购买频次。
二、客户流失预测与挽回对于客户流失问题,企业需要提前发现客户流失的迹象,并采取相应的挽回措施。
数据挖掘技术可以帮助企业从大量的客户数据中挖掘出流失的潜在特征,提供对流失客户的预测和识别。
一家电信公司使用数据挖掘技术,发现了流失客户在通话时长、上网流量等方面与其他客户存在显著差异。
通过对这些特征的分析,该公司可以提前预测到哪些客户可能会流失,并制定相应的挽回措施,如提供个性化优惠、增加客户服务等,以留住客户。
三、交叉销售与推荐系统通过数据挖掘技术,企业可以发现客户之间的关联信息,并实现交叉销售和推荐系统的运作。
例如,一家电商企业利用数据挖掘技术对客户的历史购买记录进行分析,发现了一些商品之间的关联性。
通过将这些关联商品进行捆绑销售或者在购买某一商品后推荐相关商品,企业可以进一步增加销售额和客户满意度。
四、客户情感分析了解客户的情感和意见对于企业改进产品和服务、维护客户关系具有重要意义。
数据挖掘技术可以帮助企业对海量的客户评价和留言进行情感分析,提取其中的正面和负面情感信息。
例如,一家餐饮企业使用数据挖掘技术对客户留言进行情感分析,发现了客户对菜品口味和服务态度存在不满意的情况。
基于数据仓库的CRM在电信业中的应用

根据 客 户行 为分析 ,金 业可以准
确地 制定市场策略和市场活动 。 然而 ,
客户行为分 析可以分为整体行为 这些 市场 活动是否能够达到预定的 目
展并趋 向成熟 , 最终形成 了 一 套完整 分 析和群体行为分析 整体 行为分 析 标 ,是改 进市场策略和评价客户行为
的管理 理论体 系。 眭能 用来发现 企 业所有 客户的行 为规 律 , 分组’ 的重要 依据 。同样 ,重点客
竞争 中最有利 可图的客 户群 , 定 目 户、交叉销售 、增 量销售 客户保 持 管凰 与此同时 . 确 销售 管理,E Mal - i 等
维普资讯
渠道将 客户的反馈 信息传递给数据 仓 老客 户 、长期或临时客户的优惠条件
需求和偏好也 会变得 更详细 明了,
技术 , 分析现有 客户和潜 在客户相 关 可以使企业 发现 客户群 体间的变化规 絮 构如图 1 所示 企业 的其 他系统 如电
的需求 . 模式 , 会 . 险和成本 . 机 风 最 律 。
子 商务、E P, A和财务 等系统通过 R O 企 业 应 用系 统集 成 ,为数 据 仓库 和
维普资讯 ;;
客 户 荚 系 管 理 ( s om e 杯市场 、目标 客户群 ,并整合所有 资 等。重点客 户发现过程 ,通 常是有 一 Cu t r
R lt n hpMa ae n .C M)起 料 .将 客户通过 多种指标 进行分 类 , 系列数据处理和转换过程以 及数据 挖 ea o si ng me t R i
1 数据仓库在 C M 中的作用 R
理解和 客户行为规律的发现 , 企业可
2 C M的组成结I稚 电信业 R 5 |
中的应用
大数据分析技术在客户关系管理中的应用案例

大数据分析技术在客户关系管理中的应用案例随着时代的进步和科技的发展,大数据分析技术在企业管理和市场营销中扮演着越来越重要的角色。
客户关系管理(Customer Relationship Management,CRM)作为一种重要的战略和管理方法,利用大数据分析技术可以更好地理解客户需求,建立和维护良好的客户关系。
本文将介绍几个大数据分析技术在客户关系管理中的成功应用案例。
首先,大数据分析技术可以帮助企业追踪和分析客户行为,从而更好地了解客户需求和偏好。
例如,某电子商务平台使用大数据分析技术对客户购买行为进行追踪和分析,根据客户的购买历史和浏览记录,可以准确地预测客户的购买意向,并且向客户提供个性化的商品推荐。
通过这种方式,企业可以更好地满足客户需求,提高客户满意度和忠诚度。
其次,大数据分析技术可以帮助企业识别和分析客户群体,制定精准的市场营销策略。
例如,一家零售企业通过大数据分析技术对客户购买数据进行挖掘,发现了一部分客户具有一定的品牌忠诚度,并且在一定时间内会购买大量商品。
针对这部分客户,企业可以制定相应的促销活动,提供更多的优惠和折扣,从而吸引客户持续购买。
通过这种方式,企业可以提高市场份额和销售额,增加利润。
再次,大数据分析技术可以帮助企业预测客户流失和挽回流失客户。
通过分析客户的消费行为和互动记录,企业可以识别出潜在的流失客户,并采取相应的措施来挽回这部分客户。
例如,一家电信公司利用大数据分析技术对用户流失数据进行挖掘,发现用户在遇到网络问题或客服不及时响应时更容易流失。
为了挽回这部分客户,企业增加了售后服务团队的人员和培训投入,同时加强了网络服务和客户互动平台的建设。
通过这些举措,企业成功挽回了大量流失客户,并提高了客户满意度。
此外,大数据分析技术还可以帮助企业实时监测和预测客户满意度。
通过对客户反馈和评价数据的分析,企业可以及时了解客户对产品或服务的满意度,并针对问题进行改进。
例如,一家在线旅游平台通过大数据分析技术对用户评价数据进行实时监测,发现用户普遍对某些景点的服务质量不满意。
电信行业-成功案例

电信行业-成功案例江苏移动经营分析系统项目为实现客户保持和客户拓展,提高信用和投资管理水平,以数据挖掘提升经营分析系统,江苏移动采用了我们的专业服务方案,应用专业的数据挖掘软件Clementine,初步建立了大客户异动分析、潜在大客户预测、分类业务套餐测算和消费模型分析等四个专题模型,从而实现了进一步了解客户,获取决策信息的目的。
内蒙古移动市场细分项目为准确定位目标客户,并制订具有针对性的营销活动,内蒙古移动采用我们提供的市场细分专业服务方案,应用数据挖掘软件Clementine,优化配置营销费用,提高营销活动的市场回应率,使营销活动更具有针对性,提高赢得新客户的能力。
曲靖联通客户流失分析项目存在问题中国联通在中国移动通信市场上有着举足轻重的地位,随着竞争的加剧,如何挽留客户,减少客户流失已成为是联通面临的重要课题之一。
曲靖联通面临着来自曲靖移动、小灵通等多方面的竞争,近10%的客户流失--尤其是高端客户流失给曲靖联通带来了巨额的收入损失。
如何在客户即将流失之前,发现他们,以便市场部门进行针对性的挽留是曲靖联通关注的问题。
解决方案为了更好的发现哪些客户更可能流失以及将要流失客户的行为特征,曲靖联通采用了SPSS公司的应用解决方案。
通过对用户通话行为数据、用户资料数据和用户使用曲靖联通服务的情况等数据的深入分析,对影响流失各个因素进行了探索性分析并建立预测客户流失的Logistic回归模型。
应用效果通过建立分析模型,曲靖联通达到了这样的目的:①得出了未来两个月内流失可能性大的名单,并将名单提交市场部,市场部可以对其中的高价值客户进行"一对一"的挽留工作;②找出流失可能性大的客户通话行为特征描述,为制定有针对性的"套餐"或者市场营销策略服务;③分析比较不同种类"套餐"的流失情况,对"套餐"的有效性进行评估。
英国电信存在问题为了从市场营销预算中获得最大的价值,英国电信需要建立模型来确定潜在客户的购买倾向和他们变为用户之后可能的价值。
数据挖掘技术在电信客户流失预警中的应用

数据挖掘技术在电信客户流失预警中的应用【摘要】本文主要从数据挖掘技术的重要性、应用以及仿真分析三个方面针对数据挖掘技术在电信客户流失预警中的应用进行了简单分析。
【关键词】数据挖掘技术;电信客户流失预警;应用随着电信企业的发展,企业之间的竞争不断加剧,电信运营商也在不断地推出新的业务与套餐,以此来在占领市场竞争高地。
但是,与此同时,也大大增加了客户的不稳定性,而数据挖掘技术的应用,有效地降低了客户离网率。
因此,对数据挖掘技术在电信客户流失预警中应用的探讨有其必要性。
一、数据挖掘技术应用的重要性伴随着经济全球化,市场的国际化,目前我国国内市场的竞争也变得日加激烈,因此,电信企业传统的经营模式已经不能够完全适应市场的需要。
为此,电信企业的市场战略定位需要从传统的生产型企业向利润型企业进行转化,从而来求更好的生存与发展。
为此,这就要求电信企业必须围绕客户展开市场分析,全面了解客户的实际需求,做到服务的层次化、多样化以及全面化,并且提出个性化的解决方案。
但是,在市场发展的过程中,由于市场的饱和以及客户发展的减速,这使得电信企业客户的维系成为一个热点问题。
因此,在这样的竞争环境下,企业极需完善业务管理系统以及生产系统,引进数据挖掘系统,加强系统构建,如渠道系统、BOSS系统以及综合结算系统等,通过这些系统,收集大量的数据,对企业的运营情况作出具体性的分析,既可以加强对客户消费行为的了解,而且针对企业某项业务在市场中的运行情况进行预测分析和运行情况分析,以指导企业做出更好的解决方案,为企业创造更大的利润。
另外,集成客户数据是电信企业发展最为宝贵的资源,而数据挖掘技术的应用可以将大量的客户数据提取出来,包括现有的客户数据、流失数据、增加数据等,在此基础上,根据客户行为、客户属性以及服务属性,构建相关数学模型,计算与分析客户流失概率,同时,根据这些数据之间的相互关系,得出相关的数学公式,从而来改善企业的促销手段,提高服务质量以及客户忠诚度,预防客户的流失,更为重要的是解决了电信企业传统运营模式上无法监控客户流失、无法实现客户关怀的难题。
CRM模式在电信企业应用分析

CRM模式在电信企业应用分析2011-05-02 00:00出处:CIO时代作者:佚名【我要评论】[导读]良好的社会信用是建立规范的社会主义市场经济的重要保证,是有效防范行业风险的重要条件,是现代电信企业正常运行的根基。
在我国现阶段市场经济体制尚不完善、信用制度发育尚不健全的情况下,要想解决好电信企业目前出现的信用消费中的风险问题,可以在不影响企业正常利润收入的前提下,采用对客户信用进行征信的模式,即按照不同的客户信用状况和交易价值,实行不同的信用政策,从而支持有价值、有潜力的客户,控制和减少高风险客户,让电信企业的销售建立在一个健康、合理的客户结构上,保证电信业的持续和良性发展。
一、电信企业CRM和征信现状1.客户关系管理成就电信经营之梦对于电信企业来讲,在网络发展初期,可以更多地依靠投资来取胜,谁的投资快、谁的网络容量大、谁的规模大,谁就能吸引更多的用户。
然而随着市场发展、电信业重组和WTO 带来的国际化,电信企业已经很难通过规模来维持竞争优势。
电信企业的核心竞争力必然要从规模投资转向市场营销能力,CRM正是帮助电信企业提高管理水平和营销能力的利器。
电信企业可以通过建立数据仓库,运用数据挖掘、商业智能等技术手段,对大量的客户信息进行分析,更好地了解客户的消费模式,并对客户进行价值与贡献坐标分类,从而能针对客户的实际需求,制订相应的营销战略,开发出相应的产品或服务,来更好地满足客户需求。
CRM形成的管理系统和信息系统可以保证电信业务的高效运行,提升电信企业的信息化、电子化建设水平和员工的知识技术及工作能力。
CRM的建立可以深入改革电信企业内部的结构组织形式,整合电信企业生存的资源体系,优化电信企业市场价值链,开拓电信企业所特有的核心竞争力,同时对发展健康的企业文化起到十分重要的作用。
CRM技术中的数据仓库与数据挖掘能成功实现对客户关系管理的保障。
2.我国电信企业亟需弥补征信管理上的空白在过渡到市场经济体制以后,企业已经变成了具有独立法人资格、能独立自主经营的经济主体,此时征信管理和风险控制能力欠缺的弊病就逐渐显露出来。
数据挖掘技术在电信行业中的应用

数据挖掘技术在电信行业中的应用针对当前电信市场“三足鼎立”经营管理过程中存在的新情况、新问题,特别是客户流失率、恶意欠费、固话业务用户增长缓慢甚至下滑、经济效益下降的矛盾日益突出等问题进行深入分析,引入当前流行的数据挖掘技术建立电信客户风险预警系统,该系统主要包括离网概率预测模型和欠费欺诈预警模型等两个功能模块。
该系统的实施将为电信企业实现管理智能化、降低坏账损失、提高风险预警机制、挖掘优质客户、实行差别策略等带来新的竞争优势。
标签:数据挖掘;客户关系管理;风险管理引言2008年,中国电信业又经历了一次市场变革,由此中国电信业由中国电信一家垄断,到今天的三足鼎立,经历了沧海巨变,电信市场的竞争不再局限于原有的业务范围运营。
重组后,中国移动、中国联通、中国电信三大运营商都取得了全业务运营牌照,市场竞争格局会重新洗牌,一家独大的局面不会再出现,今后的电信市场竞争将更加激烈。
近年来,全球范围内移动通信发展迅速,电信市场竞争日益加剧,人们对通讯产品的认知水平和消费能力不断提高,行业发展面临着新的机遇和挑战。
我国电信业在竞争架构、资源配置和发展趋势等方面出现了一些新情况、新问题,特别是客户流失率、恶意欠费、固话业务用户增长缓慢甚至下滑、经济效益下降的矛盾日益突出、企业发展差距逐步扩大、竞争架构严重失衡等情况,使得各家电信企业都不得不直接面对以下几个方面的问题:(一)客户流失率不断增大随着电信行业的迅速发展,客户选择电信产品及电信企业的余地越来越大,市场竞争不断加剧,电信企业之间对客户的争夺将越来越激烈。
而在竞争中受益的客户对服务的要求也越来越高,但传统的网络和技术等优势难以在电信企业之间拉开差距,无法形成差异化的竞争优势。
据调查显示,用户保持率增加5%,就能为运营商带来85%的利润增长。
(二)恶意欠费比例偏高由于我国电信企业提供的是电话通话等信息类服务,所以多数采取先消费后付款的营销方式。
在没有适当监管、控制措施的情况下,时常发生恶意欠费等行为。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
crm数据挖掘电信应用案例个人收集了温度哦精品文档供大家学习==============================专业收集精品文档================================================================================================= =======利用数据挖掘实现电信行业客户流失分析随着世界经济的全球化、市场的国际化和我国加入WTO步伐的加速,国际化的市场环境要求国内的公众电信运营企业在经营管理上向国外先进的电信运营企业看齐,以迎接电信运营业的国际化竞争。
同时随着国家改革的深化,国内电信业的市场环境已渐趋合理且竞争将日益加剧。
国内、国际电信业的如此态势,对公众电信运营企业的服务内容、服务方式、服务质量、经营管理以及服务意识提出了严峻的挑战。
企业的经营模式和服务体系正以客户的价值取向和消费心理为导向,真正体现“创造需求”、“引导消费”的现代客户服务意识与理念。
在电信企业面向市场、面向国内外众多的竞争者、努力创造更高价值的同时,客户流失的不断增加,客户平均生命周期的不断缩短严重影响了电信企业的发展。
那么,在激烈的市场竞争和不断变化的市场需求面前,如何最大程度的降低客户的流失率呢,常用的方法之一就是利用数据挖掘技术。
数据挖掘技术是目前数据仓库领域最强大的数据分析手段。
它的分析方法是利用已知的数据通过建立数学模型的方法找出隐含的业务规则,在很多行业已经具有成功的应用。
在电信行业的应用领域主要有客户关系管理,客户欺诈分析,客户流失分析,客户消费模式分析,市场推广分析等。
在客户流失分析系统中,如何应用数据挖掘技术,主要方式是根据以前拥有的客户流失数据建立客户属性、服务属性和客户消费数据与客户流失可能性关联的数学模型,找出客户属性、服务属性和客户消费数据与客户流失的最终状态的关系,并给出明确的数学公式。
只要知道客户属性、服务属性和客户消费数据,我们就可以计算出客户流失的可能性。
市场/销售部门可以根据得到的数学模型随时监控客户流失的可能性。
如果客户流失的可能性过==============================专业收集精品文档=============================个人收集了温度哦精品文档供大家学习==============================专业收集精品文档================================================================================================= =======高,高于事先划定的一个限度,就可以通过多种促销手段提高客户的忠诚度,防止客户流失的发生,从而可以大大降低客户的流失率。
基于严格数学计算的数据挖掘技术能够彻底改变以往电信企业在成功获得客户以后无法监控客户的流失,无法实现客户关怀的状况,把基于科学决策的客户关系管理全面引入到电信企业的市场/销售工作中来。
通常一个完整的数据挖掘过程由业务问题定义,数据选择,数据清洗和预处理,模型选择与预建立,模型建立与调整,模型的评估与检验,模型解释与应用等多个步骤组成。
这里我们以个人客户流失为例说明各个步骤的功能。
1. 业务问题的定义业务问题的定义要求非常明确。
任何不明确的定义都会严重影响模型的准确和应用时的效果。
例如,在客户流失分析系统中,需要明确客户流失的定义。
在客户流失分析中,主要有两个核心的变量,1.财务原因/非财务原因,2.主动流失/被动流失。
客户的流失类别根据这两个核心变量可以分为四种。
其中自愿的、非财务原因的流失客户往往是高价值的、稳定的客户。
他们会正常支付自己的服务费用,并对市场活动有所响应。
所以这种客户才是我们真正想保持的客户。
而真正在分析客户流失的状况时,我们还必须区分公司客户与个人客户,不同服务的贡献率,或者是不同客户消费水平流失标准的不同。
举例来说,对于用一种新服务替代原有服务的客户,是否作为流失客户,又或者,平均月消费额为2000元左右的客户,当连续几个月消费额降低到500元以下,我们就可以认为客户发生流失了,而这个流失标准就不能适用于原本平均月消费额就为500元左右的客户。
实际上,在国外成熟的电信行业客户流失分析系统中,经常是根据相对指标判别客户流失。
市场调查表明,通常大众的个人通信费用约占总收入的1%-3%,当客户的个人通信费用降低到远远低于此比例时,就可==============================专业收集精品文档=============================个人收集了温度哦精品文档供大家学习==============================专业收集精品文档================================================================================================= =======以认为客户流失发生。
所以,客户流失分析系统必须针对各种不同的种类分别定义业务问题,进而分别进行处理。
2. 数据选择数据选择包括目标变量的选择,输入变量的选择和建模数据的选择等多个方面。
目标变量的选择目标变量表示了数据挖掘的目标。
在客户流失分析应用目标变量通常为客户流失状态。
依据业务问题的定义,我们可以选择一个已知量或多个已知量的明确组合作为目标变量。
目标变量的值应该能够直接回答前面定义的业务问题。
在客户流失分析系统中,我们实际面对的流失形式主要有两种,账户取消发生的流失和账户休眠发生的流失。
对于不同的流失形式,我们需要选取不同的目标变量。
对于账户取消发生的流失,目标变量直接就可以选取客户的状态,流失或正常。
对于账户休眠发生的流失,情况就较为复杂。
通常的定义是持续休眠超过给定时间长度的客户被认为是发生了流失。
但是,这个给定时间长度定义为多长合适呢,另外一方面,每月的通话金额低于多少就可以认为是客户处于休眠状态,或者要综合考虑通话金额,通话时长和通话次数来划定流失标准,实际上,目标变量的选择是和业务问题的定义紧密关联在一起的。
选择目标变量所要面对的这些问题,都需要业务人员给予明确的回答。
输入变量的选择输入变量用于在建模时作为自变量寻找与目标变量之间的关联。
在选择输入变量时,我们通常选择两类数据,静态数据和动态数据。
静态数据指的是通常不会经常改变的数据,包括服务合同属性,如服务类型,服务时间,交费类型等等,和客户的基本状态,如性别,年龄,收入,婚姻状况,受教育年限/学历,职业,居住地区等等。
动态数据指的是经常或定期改变的数据,如每月消费金额,交费纪录,消费特征等等。
输入变量的选择应该在业务人==============================专业收集精品文档=============================个人收集了温度哦精品文档供大家学习==============================专业收集精品文档================================================================================================= =======员帮助下进行,这样才能选择出真正与客户流失可能性具有潜在关联的输入变量。
业务人员经常在实际业务活动中深深感觉到输入变量与目标变量的内在联系,但是却无法以量化表示出来。
在这种情况下,数据挖掘的工作往往能够得到良好的回报。
在一时无法确定某种数据是否与信用卡流失可能性有关联时,应该选取,在后续步骤考察各变量分布情况和相关性时再决定取舍。
建模数据的选择通常电信行业客户流失的方向有两种。
第一种是客户的自然消亡。
例如由于客户的身故,破产,迁徙,移民等原因,导致客户不再存在。
或者是由于客户的升级,如GSM 升级为CDMA,造成特定服务的目标客户消失。
第二种是客户的转移流失。
通常指客户转移到竞争对手享受服务。
显然第二种流失的客户才是电信企业真正关心的,对企业具有挽留价值的客户。
因此,我们在选择建模数据时必须选择第二种流失的客户数据参与建模,才能建立出较精确的模型。
3. 数据清洗和预处理数据清洗和预处理是建模前的数据准备工作。
数据清洗和预处理的目的一方面保证建模的数据是正确和有效的,另一方面,通过对数据格式和内容的调整,使建立的模型更加准确和有效。
数据整理的主要工作包括对数据的转换和整合,抽样,随机化,缺失值的处理等等。
数据转换和整合的工作目的就是为了保证数据的质量和可用性。
例如,样本数据中客户最终流失的数据比例较低,只占全部数据的8%。
用这样的数据建模不容易找出流失了的客户的特征,建立精确的模型。
我们可以按比例抽取未流失客户和流失了的客户,把两者合并构成建模的数据源。
还有,在建模之前,我们建议把样本数据分为两到三部分。
一部分用来建模,其他数据用来对模型进行修正和检验。
一个模型在建立以后,需要用大量的数据对它进行检==============================专业收集精品文档=============================个人收集了温度哦精品文档供大家学习==============================专业收集精品文档================================================================================================= =======验。
只有经过实际数据检验并被证明正确的模型才能得到充分的相信。
如果一个未经检验的模型被贸然推广使用,就有可能由于模型的不精确带来应用的损失。
所以我们通常会把数据分为两部分,2/3的数据用来建模,1/3的数据用来检验。
4. 模型选择与预建立到底哪些变量和客户流失概率有密切关系呢,我们需要利用数据挖掘工具中的相关性比较功能找出每一个输入变量和客户流失概率的相关性。
通过这样的比较选择,我们可以删除那些和客户流失概率相关性不大的变量,减少建模变量的数量。
这样不仅可以缩短建立模型的时间,减小模型的复杂程度,而且有时还能够使建立的模型更精确。
Oracle的数据挖掘工具能够提供包括决策树,神经网络,近邻学习,回归,关联,聚类,贝叶斯判别等多种建模方法。
但是哪种方法最适合用于信用卡流失分析呢,我们可以使用多种建模方法,预建立多个模型,再比较这些模型的优劣,从而选择出最适合客户流失分析的建模方法。
Oracle的数据挖掘工具提供了建模方法选择的功能,它能够预建立决策树,神经网络,近邻学习,回归等多种方法,十个模型供使用者选择。