客户期望寿命的乘积限估计
生存分析论文

《生存分析论文》题目:基于非参数分析法研究改进手术对患者生存时间的影响专业:班级:姓名:2015年6月25日摘要生存分析(survival analysis)是将事件的结果(终点事件)和出现这一结果所经历的时间结合起来分析的一种统计分析方法。
生存分析不同于其它多因素分析的主要区别点就是生存分析考虑了每个观测出现某一结局的时间长短。
临床随访,又称为前瞻性研究(prospective study),本文采用此方法进行两组肾移植的病人手术后的生存时间和结局的研究。
研究过程中主要面临的问题有:(1)结局及生存时间据需要考虑—经典的统计分析方法不能同时分析结局和生存时间;(2)随访研究中研究对象可能会失访或死于其他疾病;或因研究经费和时间的限制不可能等到所有的对象都出现结局---截尾(censoring)或终检。
生存分析能解决以上问题。
本文通过比较A组和B组两组实验数据来探究改进手术对患者生存时间的影响,通过最后结果可以看出,改进手术组会大大提高患者生存率,因此,今后医生应致力于手术改良,以多加提高患者的生存率。
关键词 Kaplan-Meier估计 Nelson-Aalen估计 Cox模型 SAS软件一、估计原理1.乘积极限法(Kaplan-Meier )Kaplan-Meier 分析方法,又称乘法极限估计、PL 法或最大似然估计法,是由Kaplan 和Meier 在1958年提出的一种求生存函数的非参数方法。
寿命表分析适用于大样本情况,在处理小样本时,为充分利用每个数据所包含的信息,Kaplan-Meier 分析便成为首选的分析工具。
乘积极限法(Kaplan-Meier )适用于离散数据,它用于建立时刻t 上的生存函数。
Kaplan-Meier 法是根据t 时刻及其之前各时间点上的条件生存率的乘积,来估计时刻t 的生存函数S(t)和它的标准误SE(S(t))。
设12t t tk ≤≤≤代表k 个观察对象的生存时间,设i n 为i t 时刻开始之前生存的个体数目,即危险集的大小(i=1,2,…,k ),再设i d 表示生存时间的截尾性质,i=1,2,…,k 。
产品寿命期望值MTTF及L10之计算

產品壽命期望值MTTF及L10之計算1.產品壽命期望值MTTF是指產品發生63.2%不良時之預期時間,或稱信賴度36.8%之時間。
產品壽命期望值L10是指產品發生10%不良時之預期時間,或稱信賴度90%之時間。
MTTF=t1+(t2-t1)*0.632L10=t1+(t2-t1)*0.1t1:達不良率值最短時間t2:達不良率值最長時間2.所請不良之定義並無一定之規範,譬如:(1)可以用一批產品作測試,經2000,3000,5000,10000,18000小時後測試其轉速、消耗電流是否超出規格做為不良之定義。
(2)或以精密測量儀器測量軸心潤滑油料殘餘量剩多少為不良之定義。
3.測試之樣品數越多則數據越可靠,最少三個。
4.測試時間可以2000,3000,5000,10000,18000小時做為規範。
也就是說測試時間點5.假設現有一風扇產品,以軸心油料消耗至50%時即視為不良,因油料耗至50%時間相當長,故必需以外差法求其時間。
若油料損耗曲線趨近線性,油耗公式可寫為Y=Ax+bY:經過i時間後油指殘餘量X:時間(單位:小時)a:曲線斜率。
等於Σ(Xi-X)*(Yi-Y)/ Σ(Xi-X)2b:常數(單位:%)等於Y-[Σ(Xi-X)*(Yi-Y)/ Σ(Xi-X)2]*X=Y-Ax註:計算時,若b>100%以100%計算X:=各測試時間點之平均值=(2000+3000+5000+10000+18000)/5=7600小時Y:各測試時間點油脂殘餘量平均值,假設有三個樣品S1、S2、S3經過i時間其油脂殘餘量如下:(1) S1樣品X=7600,Y=(99.9+99.8+99.6+99.1+98)/5=99.28%a=[(2000-7600)(99.9-99.28)+(3000-7600)(99.8-99.28)+(5000-7600)(99.6-99.28)+(10000-7600)(9931-99.28)+(18000-7600)(98-99.28)]/[(2000-7600)2+(3000-7600)2+(5000-7600)2 +(10000-7600)2+(18000-7600)2]=[(-3472)+(-2392)+(-832)+(-432)+(-13312)]/[(31360000) +(21160000)+(6760000)+(108160000)]=-20440/167440000=-0.000122b=Y-aX=99.28-(-0.000122*7600)=99.28+0.927=100.2(%),以100(%)計算依據油耗公式Y=aX+b,得知S1風扇在潤滑油量(Y)剩50%之時間X;X=(Y-b)/a=(50-100)/(-0.000122)=-50/(-0.000122)=409836小時(2) S2樣品X=7600,Y=(99.5+99.2+97+93+87)/5=95.14%a=[(2000-7600)(99.5-95.14)+(3000-7600)(99.2-95.14)+(5000-7600)(97-95.14)+(10000-7 600)(9.-95.14)+(18000-7600)(87-95.14)]/[(2000-7600)2+(3000-7600)2+(5000-7600)2+(10000-7600)2+(18000-7600)2]=[(-24420)+ (-18680)+(-4840)+(-5140)+(-84660)]/[(31360000)+(21160000)+(6760000)+(108160000)] =-137740/167440000=-0.0008226b=Y-aX=95.14-(-0.0008226*7600)=95.14+6.25=101.39(%),以100%計算依據油耗公式Y=aX+b,得知S2風扇在潤滑油量(Y)剩50%之時間X:X=(Y-b)/a=(50-100)/(-0.0008226)=-50/(-0.0008226)=60782小時(3) S3樣品X=7600,Y=(99.5+99.3+98+96+93)/5=97.16%a=[(2000-7600)(99.5-97.16)+(3000-7600)(99.3-97.16)+(5000-7600)(98-97.16)+(10000-7 600)(96-97.16)+(18000-7600)(93-97.16)]/[(2000-7600)2+(3000-7600)2+(5000-7600)2+(10000-7600)2+(18000-7600)2]=[(-13104)+ (-9844)+(-2184)+(-2784)+(-43264)]/[(31360000)+(21160000)+(6760000)+(108160000)]=-71180/167440000=-0.0004251b=Y-aX=0.90-(-0.0004251*7600)=97.14+3.23=100.37(%),以100%計算依據油耗公式Y=aX+b,得知S3風扇在潤滑油量(Y)剩50%之時間X:X=(Y-b)/a=(50-100)/(-0.0004251)=-50/(-0.0004251)=117619小時6.由以上三樣品得知:油料最先消耗50%的風扇為S2,時間為60782小時最慢者為S1,時間409836小時所以得知t1=60782小時,t2=409836小時7.MTTF=t1+(t2-t1)*0.632=60782+(409836-60782)*0.632=60782+220602=281 384小時L10=t1+(t2-t1)*0.1=60782+(409836-60782)*0.1=60782+34905=95687小時平均故障间隔期(MTBF)MTBF分析法是指可以修理的设备从故障起到下一次故障为止,若干次的时间平均值。
预期寿命测算方案

预期寿命测算方案引言预期寿命是指一个个体、系统或产品的预计寿命,它是衡量其使用寿命或功能期限的指标。
预期寿命测算方案是为了评估个体、系统或产品的预期寿命而制定的一套方法和步骤。
在现代生活中,预期寿命测算方案在多个领域都得到了广泛应用,如工程项目、机械设备、电子产品等。
目的本文旨在介绍一种常用的预期寿命测算方案,以帮助读者了解如何评估个体、系统或产品的预期寿命。
通过合理的寿命测算方案,可以更好地制定出使用计划、维护策略和更换计划,以提高资源利用效率和降低成本。
测算方法预期寿命的测算通常基于统计数据和理论模型,下面将介绍一种常用的方法:1.数据采集:收集相关的数据,例如设备的运行时间、故障次数、维修记录等。
这些数据可以通过日志、记录表、传感器等方式获取。
2.数据清洗:对采集到的数据进行清洗,排除异常值和错误数据,确保数据的准确性和可靠性。
3.统计分析:对清洗后的数据进行统计分析,计算出关键指标,如平均寿命、故障率、维修间隔等。
这些指标可以帮助评估设备的健康状况和使用寿命。
4.寿命模型拟合:根据统计分析的结果,选择合适的寿命模型进行拟合。
常用的寿命模型有指数分布、Weibull分布等。
拟合的目标是找到最佳的模型参数,以描述寿命分布的特征。
5.预测计算:根据寿命模型,对未来的寿命进行预测计算。
可以基于当前状态和使用情况,估计个体、系统或产品将来的寿命。
这有助于制定维护计划、更换计划和预算规划等。
注意事项在进行预期寿命测算时,需要注意以下几点:1.数据质量:保证采集到的数据的质量和准确性,避免错误数据对结果的影响。
2.样本量:样本量足够大时,才能获得可靠的统计结果。
增加样本量可以提高测算的准确性。
3.模型选择:选择合适的寿命模型是至关重要的,不同的模型适用于不同的情况。
对于某些特殊情况,可能需要使用非传统的寿命模型。
4.假设条件:预期寿命测算常常依赖于一些假设条件,如独立故障、恒定故障率等。
在测算过程中,需要明确假设条件,并检验其是否满足。
乘积极限法公式

乘积极限法公式乘积极限法(Product-Limit Method)公式是一种在生存分析中常用的方法,用于估计生存函数。
咱先来说说啥是生存分析哈。
比如说研究某种疾病患者的生存时间,或者某个产品的使用寿命,这时候就会用到生存分析。
而乘积极限法公式就是其中一个重要的工具。
这个公式看起来可能有点复杂,但其实理解起来也不是那么难。
它主要是通过对每个时间点上还存活的个体数量进行计算,逐步累积得到生存函数的估计值。
我给您举个例子吧。
假设咱们在研究一群癌症患者经过某种治疗后的生存情况。
一开始有 100 个患者,第 1 年结束,有 10 个人去世了,那第 1 年末的生存概率就是 90/100 = 0.9。
到了第 2 年结束,又有 5 个人去世,这时候第 2 年末的生存概率就是 (90 - 5) / 90 = 0.9444。
然后咱们就这么依次计算下去,把每个时间点的生存概率相乘,就能得到乘积极限法估计的生存函数啦。
就像我之前带过的一个学生,他一开始对这个公式也是一头雾水。
我就给他一步一步地讲解,还带着他一起用实际的数据来计算。
那孩子特别认真,眼睛紧紧盯着我在黑板上写的每一个数字和符号,还不停地问问题。
后来经过几次练习,他终于搞明白了,那种成就感,从他脸上的笑容就能看出来。
再来说说乘积极限法公式的优点。
它对数据的利用比较充分,特别是在处理有删失数据的时候表现得很不错。
啥叫删失数据呢?比如说有些患者在研究结束的时候还活着,或者中途因为其他原因退出了研究,这些数据就是删失数据。
乘积极限法能比较好地处理这种情况,给出相对准确的生存函数估计。
不过呢,这个公式也不是完美的。
在样本量比较小的时候,估计的结果可能不太稳定。
而且计算起来有时候也会比较繁琐。
总之啊,乘积极限法公式在生存分析中有着重要的地位,但咱们也要根据具体的情况选择合适的方法来进行分析。
就像咱们解决生活中的问题一样,没有一种方法是万能的,得灵活运用,才能达到最好的效果。
平均预期寿命及常用的计算法

平均预期寿命及常用的计算法人口平均预期寿命(Life expectancy)是指假若当前的分年龄死亡率保持不变,同一时期出生的人预期能继续生存的平均年数。
它以当前分年龄死亡率为基础计算,但实际上,死亡率是持续变化的,所以,平均预期寿命是一个假定的指标。
这个指标与性别、年龄、种族有着紧密的联系,所以常常需要分别计算。
平均预期寿命是我们最常用的预期寿命指标,它表明了新出生人口平均预期可存活的年数,是度量人口健康状况的一个重要的指标。
寿命的长短受两方面的制约。
一方面,社会经济条件、卫生医疗水平限制着人们的寿命,所以不同的社会,不同的时期,寿命的长短有着很大的差别;另一方面,因为体质、遗传因素、生活条件等个人差异,也使每个人的寿命长短相差悬殊。
所以,虽然难以预测具体某个人的寿命有多长,但能够通过科学的方法计算并告知在一定的死亡水平下,预期每个人出生时平均可存活的年数。
这就是人口平均预期寿命。
人口平均预期寿命的计算要用到一连串的数学公式。
如果用文字来描述,则计算人口平均预期寿命的方法就是:对同时出生的一批人实行追踪调查,分别记下他们在各年龄段的死亡人数直至最后一个人的寿命结束,然后根据这个批人活到各种不同年龄的人数来计算人口的平均寿命。
用这批人的平均寿命来假设一代人的平均寿命即为平均预期寿命。
因为事实上要跟踪同时出生的一批人的整个完整的生命过程有很大的困难,在实际计算时,往往能够利用同一年各年龄人口的死亡率水平,来代替同一代人在不同年龄的死亡率水平,然后计算出各年龄人口的平均生存人数,由此推算出这个年的人口平均预期寿命。
所以,人口的平均预期寿命与同时代的死亡率水平相关。
1、人口老龄化指标反证法:我们能够通过人口老龄化指标(65岁以上的人口在7%以上)反证法,来推断一个国家或地区的平均寿命。
设平均寿命为“L”,总人口为单位“1” ,每一岁所占总人口比例为“x”, x= (1 / L) X100o这样,我们每给定一个L的值,就可计算出一个对应的x值、60和65岁以上人群所占的比例(%)。
期望寿命的概念及计算方法

期望寿命的概念及计算方法一、期望寿命的概念及相关期望寿命(life expectancy)又称平均预期寿命,或预期寿命。
X岁时平均预期寿命表示X岁尚存者预期平均尚能存活的年数。
刚满X岁者的平均预期寿命受X岁以后各年龄组死亡率的综合影响。
出生时的期望寿命简称平均寿命,它是各年龄死亡率的综合,综合反映了居民的健康状况,是反映人群健康状况的综合指标,但是,它只综合了有关死亡的信息,未包含疾病和伤残的情况,更未反映疾病伤残结果的严重性.期望寿命是评价居民健康状况、社会经济发展和人群生存质量的重要指标,它不受人口年龄构成的影响,因此各地区平均期望寿命可以直接比较。
对一个地区人口学特征、期望寿命及影响因素进行研究,可为制定科学、切合实际的卫生工作计划提供科学依据.而另一个概念“健康期望寿命"(active life expectancy,ALE),它是指人们能维持良好日常生活活动(ADL)功能的年限,健康期望寿命与普通的期望寿命的差别是:普通的期望寿命是以死亡为终点,而健康期望寿命以丧失日常生活能力为终点,它不仅能客观反映人群生存质量,亦有助于卫生政策与卫生规划的制定。
因此2000年世界卫生组织推荐用“健康期望寿命”来反映居民健康综合情况。
二、期望寿命的计算我区期望寿命是由统计分析软件DeathReg 2005计算而来,原理是编制我区居民简略寿命表。
寿命表又称为生命表(life table)是根据特定人群的年龄组死亡率编制出来的一种统计表。
寿命表有两种主要形式,队列寿命表和现时寿命表。
应用较广的是现时寿命表。
它反映一定时期某地区实际人口的死亡经历.是从一个断面来看当年一定时间段内人口的死亡和生存经历,它完全取决于制表这一年的人口年龄别死亡率。
现时寿命表计算所得的预期寿命是假定一批婴儿在其一生中都遵从当年资料所呈现的年龄别死亡率而死亡、生存的平均预期寿命,即该预期寿命是该人群的平均水平.并不是每一个人的实际存活年龄。
期望寿命计算模板

期望寿命计算模板期望寿命是指一个人在出生时可以预期活到的年龄。
它是由多种因素影响的,包括遗传、生活方式、环境等。
下面是一个期望寿命计算模板,用于估计个人的期望寿命。
第一步:收集个人信息首先,需要收集一些个人信息,包括年龄、性别、身高、体重、是否吸烟、是否有慢性疾病等。
这些信息将用于计算您的期望寿命。
第二步:确定基础寿命基础寿命是指在没有任何干扰因素的情况下,一个人可以预期活到的年龄。
它是根据统计数据所得出的平均值。
您可以根据您的年龄和性别查找相关的统计数据来确定您的基础寿命。
第三步:调整基础寿命接下来,您需要考虑一些因素来调整您的基础寿命。
这些因素包括遗传基因、生活方式和环境等。
以下是一些常见的因素调整:1.遗传基因:如果您的家族有长寿的历史,那么您可能会有更长的寿命。
反之,如果您的家族有一些遗传疾病,如心脏病或癌症,那么您的寿命可能会受到影响。
2.生活方式:一种健康的生活方式可以延长您的寿命。
这包括健康饮食、经常锻炼、不吸烟、适度饮酒、保持良好的身体健康等。
3.环境:生活在环境污染严重、健康卫生条件差的地区可能会缩短寿命。
相反,生活在清洁、安全的环境中可能会延长寿命。
根据这些因素,您可以调整您的基础寿命。
例如,如果您的家族有长寿的历史,并且您有健康的生活方式和良好的环境条件,您的寿命可能会超过基础寿命。
第四步:计算期望寿命最后,根据调整后的基础寿命,您可以计算出您的期望寿命。
公式如下:期望寿命=基础寿命+调整因素例如,如果您的基础寿命为80岁,并且调整因素为5年,那么您的期望寿命将是85岁。
需要注意的是,期望寿命只是一个估计值,并不能准确地预测个人的寿命。
每个人的情况都不同,还有许多其他因素可能影响寿命,如遗传基因突变、突发疾病等。
期望寿命只是一个提醒您注意健康和生活方式的指标,它并不能代表您的实际寿命。
综上所述,期望寿命计算模板可以帮助您估计自己的寿命。
通过收集个人信息、确定基础寿命、调整因素并计算期望寿命,您可以更好地了解如何改善自己的寿命,并采取适当的措施来保持健康和提高寿命。
生存时间统计学方法

生存时间统计学方法
生存时间统计学方法主要包括以下几种:
1. 描述性分析:根据样本生存资料估计总体生存率及其他有关指标(如中位生存时间等)。
常采用Kaplan-Meier法(乘积极限法)进行分析。
对于频数表资料则采用寿命表法进行分析。
计算生存率需要考虑时间顺序。
2. 非参数检验:检验分组变量各水平所对应的生存曲线是否一致,对生存时间的分布没有要求,并且检验危险因素对生存时间的影响。
3. 半参数横型回归分析:在特定的假设之下,建立生存时间随多个危险因素变化的回归方程,这种方法的代表是Cox比例风险回归分析法。
4. 参数模型回归分析:已知生存时间服从特定的参数横型时,拟合相应的参数模型,更准确地分析确定变量之间的变化规律。
5. 典型相关分析:相关分析一般分析两个变量之间的关系,而典型相关分析是分析两组变量(如3个学术能力指标与5个在校成绩表现指标)之间相关性的一种统计分析方法。
以上信息仅供参考,具体使用哪种方法需要根据研究目的和数据类型来决定。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ISSN 1000-0054CN 11-2223/N 清华大学学报(自然科学版)J T singh ua Un iv (Sci &Tech ),2005年第45卷第12期2005,V o l.45,N o.1232/321704-1707客户期望寿命的乘积限估计周生炳1, 成 栋2(1.空军指挥学院,北京100089;2.中国人民大学商学院,北京100872)收稿日期:2004-11-17基金项目:教育部人文社会科学“十五”规划课题(01JD 630005)作者简介:周生炳(1962-),男(汉),湖南,副教授。
E-mail:ab ing88@摘 要:采用生存分析中的非参数方法估计客户在其每个交易期内的维系概率、客户的期望寿命和客户终生价值。
在将客户采购“日历”记录转变成“年龄”记录后,针对数据删失导致的流失、未流失和部分流失等3种客户生存状态,应用K aplan -M eier 乘积限方法估计其生存概率,进而计算客户的期望寿命。
在此基础上,提出结合净收益时间序列或加权平均计算客户终生价值。
借助主流统计软件包(如SAS 系统)进行乘积限估计,可以有效地实现该文提出的模型。
关键词:客户终生价值;生存分析;乘积限估计中图分类号:F 27;O 21文献标识码:A文章编号:1000-0054(2005)12-1704-04Product limit estimator for the expectedduration of a customer lifetimeZH OU Shengbing 1,CHE NG Don g 2(1.Air Force Command College ,Beijing 100089,China ;2.Bus iness School ,Renmin University of China ,Beij ing 100872,China )Abstract :Nonparametric es timation in the sur vival analys is were used to estimate the retention probability of customers at every tran saction period,and the ex pected dur ation of the cu stomer lifetim e,i.e.,the exp ected value of th e n umber of cu stomer tran saction periods ,and the customer lifetime value.Pur chase data in the “calendar ”time extracted from cus tom er datab as es was tran sformed into recor ds in the “age ”time.Th e s urvival prob ability of the customers (and ,con sequently,each customer's expected lifetim e)w as estim ated b y th e Product Limit estimator for three sur vival states-los t,non-los t,and partly lost-caus ed by censorin g of the data.T he cu stomer lifetime value w as calculated by integrating the expected duration of a customer's lifetime with the tim e s eries or w eigh ted average of the net revenue from the customer in each per iod.Th is model can b e efficiently implemented us ing a Product Limit es timators in popular statis tical softw are packages.Key words :cus tom er lifetim e value;su rvival analys is;produ ct lim ites timator随着客户终生价值(custo mer lifetim e value,CLV )成为营销科学研究热点,研究者提出了众多CLV 模型[1]。
这些CLV 模型大致分为两类:确定型模型和随机型模型。
为便于客户数据的数学处理,这些模型大多对客户采购历史及未来采购倾向作了过分简化,忽略了数据中隐含的大量信息,没有充分利用客户的历史数据资料。
例如,确定型模型假定客户每个时间周期有相同的维系率或迁移率,有相同的收入或支出[2];随机型模型则假定客户采购模式的无记忆性(Markov 链模型[3])或客户采购率、流失率等服从某种概率分布[4,5]。
笔者认为,对客户终生价值的估计应建立在客户历史采购数据分析基础上。
本文从客户过去的采购行为和细分市场分析出发,把客户的维系和流失分别对应“生存”和“死亡”状态,推断如下几个方面:1)客户在其每个交易期内的维系(或流失)概率;2)客户的期望寿命,即客户交易期数量的期望值;3)客户终生价值。
评估客户终生价值时,一个至关重要的问题是,客户的“终生”——即客户的交易期或生存期或寿命——究竟有多长?通常的作法是指定一个时间周期上限或假定客户具有无限长的“生命”。
从生存分析的角度看,客户关系(维系或流失)与生存状态(生存或死亡)非常相似,因此,如果能为客户关系建立一个生存模型,则可估计客户的期望寿命,进而计算客户的期望寿命。
1 流失客户首先建立流失客户的概念。
假设客户数据库中保存某客户群一段时间的采购记录,这段时间就是观测周期。
设定一个时间周期,如日、周、月等,可以从记录中提取每个客户在各周期是否采购、采购额度、采购频率(次数)等数据。
假设共有n个周期,即从周期d1至周期d n。
客户生存与否的惟一依据是其采购记录。
客户寿命是从初次采购到流失(如果观测到流失的话)之间的周期数。
因为流失的客户一般不明确通知公司,所以,流失的客户不可直接观测到。
那么,如何得知哪些客户流失了呢?这里,本文遵循CLV研究者通行的作法,以最近连续缺席周期数(recency)r作为衡量客户流失的参数。
所谓最近连续缺席周期数,是指上次采购以后到目前未采购的周期数。
例如,如果观测结束周期是d n,客户上次采购周期是d i(i≤n),则r=n-i就是最近连续缺席周期数。
指定一个数k> 0,当r≥k时,认为该客户从周期d i+1开始流失了。
如果客户连续缺席r(≥k)周期后又回来采购,此时认为他是一个新客户。
2 删失数据客户进入观测(即首次采购)时间不一定相同。
到观测结束(周期d n)时,未流失客户的生存时间至少是从进入观测到周期d n那段时间,这种观测构成广义I型右删失[6]。
例如,假设5个客户的采购情况如表1所示(假设k=5)。
表1 5个客户的采购情况周期客户采购情况客户1客户2客户3客户4客户51●2●3⊙●⊙4⊙5◎⊙⊙●6◎7⊙⊙8⊙●910⊙⊙ 注:●表示该客户在相应周期首次采购(新客户);⊙表示客户在该周期有采购活动;◎表示客户在此周期流失。
客户1和客户3虽然不同时进入观测,但其寿命相同(均为4个周期)。
客户2、客户4和客户5在退出观测(观测结束)时删失,则客户2至少生存8个周期,客户5至少生存3个周期,客户4生存周期不确定。
对这种删失,将所有观测对象的开始时间重新调节为0,即将客户采购的“日历”时间转换为客户生存的“年龄”时间。
这样,流失时间(周期)就是他的寿命。
转换后,表1的客户生存状态如表2所示。
表2 5个客户的生存状态年龄客户生存状态客户1客户2客户3客户4客户5 0√√√√√1√√√√√2√√√√√3√√√√×4◎√◎?5√?6√×7√8× 注:√表示生存状态,◎表示流失状态,×表示删失,?表示状态不确定。
从表2可见,客户有3种生存情况:1)流失 观测终止前已确定流失(r≥k),如客户1;2)未流失 观测终止前未确定流失,且r=0,如客户2;3)部分流失 观测终止前未确定流失,但r> 0,因此可能“部分”流失,如客户4。
对流失客户,年龄是确定的,即客户流失前的周期数。
对未流失客户,至少生存到观测终止时的年龄。
对部分流失客户,不能确定其生存年龄。
因为如果延长观测,该客户可能生存,也可能流失。
这种情况有赖于对缺席采购的理解,将在估计生存概率时提出不同的处理方法。
3 客户生存概率的乘积限估计设T表示客户从t=0到他流失的时间,这是一个随机变量。
如果T是流失时间,那么在时间t,该客户仍然生存(即维系)的概率等于流失时间不迟于t的概率,这个概率记为S(t)=P(T>t).其中P表示概率。
称S(t)为生存函数。
若已知生存时间T服从某种概率分布,则可应用参数估计方法建立生存模型(SM C模型[5]可归入这类方法),否则必须使用非参数方法。
典型的非参数估计方法是Kaplan-Meier的乘积限(pro duct lim it)方法。
对客户关系而言,目前只有少数文献采用参数估计方法[4,5]。
本文拟采用一种变通的乘积限1705周生炳,等: 客户期望寿命的乘积限估计(PL)方法估计客户的生存函数,在此基础上,计算不同“年龄”客户的期望寿命。
假设客户日历采购数据已经转换成年龄数据。
下面,将在年龄数据基础上估计客户在每个年龄t 的生存概率S(t)。
令p x表示在年龄x时生存,到年龄x+1仍生存的条件概率,q x是相应的流失概率,显然p x=1-q x。
由p x的定义,有S(t)=p0p1…p t-1. 于是,若估计出i(0≤i<t),则S(t)的一个自然估计是S(t)=01…t-1. 但更方便的是估计q i(0≤i<t)。
若设年龄i生存、流失和删失的客户数分别为n i、l i、c i,则n0= N n,l0=0(假设在周期d n终止观测),c0=0。
n i为进入年龄i时尚生存的客户数,l i为在年龄i-1最后一次采购的客户数,c i为在年龄i-1退出观测的客户数(这些客户的年龄最多为i-1)。
因此,各年龄生存客户数有递推关系为n i+1=n i-l i-c i, i≥0.于是q⌒i=l i/n i, i≥0. 可见,估计条件概率q⌒i的关键是确定每个年龄生存和流失的客户数。