基尼系数的计算方法

合集下载

决策树基尼系数的计算公式

决策树基尼系数的计算公式

决策树基尼系数的计算公式决策树的基尼系数(Gini Index)是一个用来衡量一个节点的纯度(purity)或者不确定性(impurity)的指标。

它衡量的是当前节点中每个类别的频率的平方和的差值,并且基尼系数是一个介于0和1之间的值,其中0表示纯度最高,1表示纯度最低。

基尼系数的计算公式如下:Gini Index = 1 - Σ(p^2p)假设有一个节点中有k个不同的类别,那么基尼系数的计算步骤如下:1.对于每个类别p,计算该类别在节点中出现的频率pp。

2.对于每个类别p,计算p^2p。

3.将所有的p^2p相加得到p^2的和。

4.使用1减去p^2的和,得到基尼系数。

下面我们将使用一个简单的例子来说明基尼系数的计算过程。

假设有一个节点,其中有6个样本,分别属于两个不同的类别:3个属于类别A,2个属于类别B,1个属于类别C。

首先计算每个类别在节点中的频率pp:pp=3/6=0.5pp=2/6≈0.333pp=1/6≈0.167然后计算每个类别的p^2p:p^2p=(0.5)^2=0.25p^2p=(0.333)^2≈0.111p^2p=(0.167)^2≈0.028接下来将所有的p^2p相加:p^2的和=0.25+0.111+0.028≈0.389最后使用1减去p^2的和,得到基尼系数:Gini Index = 1 - 0.389 ≈ 0.611因此,该节点的基尼系数为0.611基尼系数的值越高,表示节点中的样本分布越不均匀,纯度越低。

在决策树算法中,我们可以使用基尼系数来进行特征选择,选择那些使得基尼系数减小最多的特征作为划分节点。

cart算法之基尼系数

cart算法之基尼系数

cart算法之基尼系数基尼系数是决策树算法中常用的评估指标之一,它用于测量一个数据集的纯度或者不确定性。

在分类问题中,我们希望找到一个最优的决策边界,将数据集划分为不同的类别。

而基尼系数就是用来衡量这种划分的质量。

让我们了解一下基尼系数的定义。

对于一个数据集,假设有K个类别,每个类别的概率分别为p1, p2, ..., pk。

那么基尼系数可以通过以下公式计算得到:Gini = 1 - (p1^2 + p2^2 + ... + pk^2)基尼系数的取值范围在0到1之间,数值越小表示数据集的纯度越高,分类效果越好。

当基尼系数为0时,表示数据集中的样本全部属于同一个类别;当基尼系数为1时,表示数据集中的样本均匀分布在各个类别中。

接下来,我们来看一下基尼系数在决策树算法中的应用。

在决策树的构建过程中,我们需要选择一个最优的划分特征来构建决策节点。

而基尼系数就是用来评估每个可能的划分特征的质量的。

具体来说,我们可以计算每个特征的基尼系数,选择基尼系数最小的特征作为划分特征。

这样,我们就可以通过构建决策树来将数据集划分为不同的类别。

通过不断地重复这个过程,直到每个叶子节点上的样本都属于同一个类别,我们就得到了一个完整的决策树模型。

基尼系数的优势在于它不仅可以用于二分类问题,还可以用于多分类问题。

在二分类问题中,基尼系数的计算比较简单,只需要计算两个类别的概率即可。

而在多分类问题中,基尼系数可以通过对所有类别的概率进行求和来计算,具有很好的拓展性。

基尼系数还可以用于评估决策树模型的复杂度。

在决策树的构建过程中,我们可以限制决策树的最大深度或者叶子节点的最小样本数,从而控制决策树的复杂度。

基尼系数可以帮助我们评估不同复杂度的决策树模型的分类性能,找到一个最优的复杂度参数。

基尼系数是决策树算法中非常重要的评估指标之一。

它可以帮助我们选择最优的划分特征,构建高效的决策树模型。

同时,基尼系数还可以用于评估决策树模型的复杂度,控制模型的泛化能力。

信用评分中的基尼系数

信用评分中的基尼系数

信用评分中的基尼系数信用评分是衡量个人或企业信用状况的一种评估标准,它通过收集、整理和分析个人或企业的信用信息,对其信用风险进行量化衡量。

而在信用评分中,基尼系数被广泛应用于衡量信用评分模型的预测能力和区分度。

基尼系数是一种衡量不平等程度的统计指标,它的取值范围在0到1之间,数值越接近1,表示信用评分模型的预测能力越强。

在信用评分中,基尼系数被用来分析模型对不同信用水平的个人或企业进行分类的能力,通过计算基尼系数可以判断模型是否具有良好的预测能力和较高的区分度。

基尼系数的计算基于模型对个人或企业进行分类的准确性和区分度。

首先,将个人或企业按照信用评分从高到低进行排序。

然后,根据实际违约情况,将个人或企业划分为违约和非违约两个类别。

接下来,根据模型对个人或企业的分类情况,将其划分为预测违约和预测非违约两个类别。

最后,根据这四个类别的比例,计算基尼系数。

基尼系数的计算公式如下:Gini = 1 - (p1^2 + p2^2)其中,p1表示违约个人或企业在总样本中的比例,p2表示非违约个人或企业在总样本中的比例。

通过基尼系数的计算,可以评估信用评分模型对个人或企业的分类能力。

如果基尼系数接近1,说明模型能够准确地预测个人或企业的信用水平,并且具有较高的区分度。

相反,如果基尼系数接近0,说明模型的预测能力较差,无法有效地区分个人或企业的信用水平。

在实际应用中,基尼系数是衡量信用评分模型性能的重要指标之一。

较高的基尼系数意味着模型更可靠,并能够为金融机构等提供准确的信用评估结果,从而降低信用风险和损失。

因此,对于信用评分模型的开发和改进来说,基尼系数是一个重要的参考指标,可以帮助优化模型并提高其预测能力和区分度。

不平衡量计算公式

不平衡量计算公式

不平衡量计算公式
不平衡量计算公式一般有多种,具体使用哪一种公式取决于所研究的问题或领域。

以下列举几种常见的不平衡量计算公式:
1. 基尼系数(Gini coefficient):基尼系数是一种用于衡量分布不平衡程度的统计方法,通常用于经济学和社会科学领域。

基尼系数的计算公式如下:
G = 1 - ∑(Pi)^2
其中,G表示基尼系数,Pi表示第i个类别的比例(或占比)。

2. 熵值(Entropy):熵值是一种信息论中用于衡量信息不确定性的指标,也可以用于衡量分布的不平衡程度。

熵值的计算公式如下:
E = - ∑(Pi * log(Pi))
其中,E表示熵值,Pi表示第i个类别的比例(或占比)。

3. 方差(Variance):方差是一种用于衡量数据集中值的离散程度的统计指标,也可以用于衡量分布的不平衡程度。

方差的计算公式如下:
V = ∑(Pi - Pmean)^2 / N
其中,V表示方差,Pi表示第i个类别的比例(或占比),
Pmean表示所有类别的平均比例,N表示类别的数量。

这些公式只是不平衡量计算公式的几种常见示例,实际应用中可能还会有其他具体问题或领域的定制公式。

在具体应用中,选择合适的不平衡量计算公式需要根据具体的目标和问题来确定。

基尼系数及其计算方法

基尼系数及其计算方法

基尼系数及其计算方法居民收入分配的差异程度,是当前人们所普遍关心的一个问题。

收入分配差异的合理与否,一方面可以反映按劳分配原则的实现情况;另一方面是保障居民生活和社会稳定的重要条件。

衡量收入差异状况最重要、最常用的指标是基尼系数(即吉尼系数)。

基尼系数(Ginicoefficient)是20世纪初意大利经济学家基尼根据洛伦茨曲线提出的判断分配平等程度的指标(如下图),设实际收入分配曲线和收入分配绝对平等曲线之间的面积为A,实际收入分配曲线右下方的面积为B。

并以A除以(A+B)的商表示不平等程度。

这个数值被称为基尼系数或称洛伦茨系数。

如果A为零,基尼系数为零,表示收入分配完全平等;如果B为零则系数为1,收入分配绝对不平等。

该系数可在零和1之间取任何值。

收入分配越是趋向平等,洛伦茨曲线的弧度越小,基尼系数也越小,反之,收入分配越是趋向不平等,洛伦茨曲线的弧度越大,那么基尼系数也越大。

洛伦茨曲线图中,0M为45度线,在这条线上,每10%的人得到10%的收入,表明收入分配完全平等,称为绝对平等线。

OPM表明收入分配极度不平等,全部收入集中在1个人手中,称为绝对不平等线。

介于二线之间的实际收入分配曲线就是洛伦茨曲线。

它表明:洛伦茨曲线与绝对平等线OM越接近,收入分配越平等;与绝对不平等线OPM越接近,收入分配越不平等。

实际应用中的计算公式是:公式中:是按收入分组后各组的人口数占总人口数的比重;是按收入分组后,各组人口所拥有的收入占收入总额的比重;是从i=1到i的累计数,如,=Y1+Y2+Y3….+Yi。

计算基尼系数,可以用收入分组数据计算,也可用分户数据计算。

但要注意的是,无论分组还是分户计算,均应先对数据按收入从低到高排序,分组计算时,一般应使分组的组距相等。

用分组数据计算的基尼系数要明显小于分户数据的计算值,特别是当分组的组数不多时,差距更大。

用分户数据计算基尼系数时,采用的计算指标不同,也会出现不同的结果。

基尼系数的四种计算方法

基尼系数的四种计算方法

基尼系数的计算方法及数学推导2001金融三班 袁源摘要:本文归纳了基尼系数的四种计算方法:直接计算法、拟合曲线法、分组计算法和分解法,并进行了数学推导和证明。

在此基础上,文章比较了各种算法优缺点,分析了误差可能产生的环节。

关键词:洛伦茨曲线 基尼系数一、洛伦茨曲线和基尼系数1905年,统计学家洛伦茨提出了洛伦茨曲线,如图一。

将社会总人口按收入由低到高的顺序平均分为10个等级组,每个等级组均占10%的人口,再计算每个组的收入占总收入的比重。

然后以人口累计百分比为横轴,以收入累计百分比为纵轴,绘出一条反映居民收入分配差距状况的曲线,即为洛伦茨曲线。

为了用指数来更好的反映社会收入分配的平等状况,1912年,意大利经济学家基尼根据洛伦茨曲线计算出一个反映收入分配平等程度的指标,称为基尼系数(G )。

在上图中,基尼系数定义为:G= S A S A+B式(1) 当A 为0时,基尼系数为0,表示收入分配绝对平等;当B 为0时,基尼系数为1,表示收入分配绝对不平等。

基尼系数在0~1之间,系数越大,表示越不均等,系数越小,表示越均等。

二、基尼系数的计算方法式(1)虽然是一个极为简明的数学表达式,但它并不具有实际的可操作性。

为了寻求具有可操作性的估算方法,自基尼提出基尼比率以来,许多经济学家和统计学家都进行了这方面的探索。

在已有的研究成果中,主要有四种有代表性的估算方法,结合自己的计算,笔者将它们归纳为直接计算法、拟合曲线法、分组计算法和分解法。

图一1、直接计算法直接计算法在基尼提出收入不平等的一种度量时,就已经给出了具体算法,而且这种算法并不依赖于洛伦茨曲线,它直接度量收入不平等的程度。

定义△=n n∑∑∣j=1 i=1Y j-Y i∣/n2, 0≤△≤2u 式(2)式中,△是基尼平均差,∣Y j-Y i∣是任何一对收入样本差的绝对值,n是样本容量,u是收入均值。

定义G=△/2u, 0≤G≤1 式(3)可以证明:G=△/2u=2S A(证明过程见附录一),而由式(1)G= S A/ S A+B,S A+B=1/2,G=2S A,因此,式(2)中定义的G即为基尼系数,综合式(2)、(3),基尼系数的计算方法为:G= 12n2 u n n∑∑∣j=1 i=1Y j-Y i∣式(4)直接计算法只涉及居民收入样本数据的算术运算,很多学者认为理论上看,只要不存在来源于样本数据方面的误差,就不存在产生误差的环节。

基尼系数的计算

基尼系数的计算

1、直接计算法G= S A/ S A+B 式(1)△=n n∑∑∣j=1 i=1Y j-Y i∣/n2, 0≤△≤2u 式(2)式中,△是基尼平均差,∣Y j-Y i∣是任何一对收入样本差的绝对值,n是样本容量,u是收入均值。

定义G=△/2u, 0≤G≤1 式(3)可以证明:G=△/2u=2S A,而由式(1)G= S A/ S A+B,S A+B=1/2,G=2S A,因此,式(2)中定义的G即为基尼系数,综合式(2)、(3),基尼系数的计算方法为:G= 12n u n n∑∑∣j=1 i=1Y j-Y i∣式(4)证明:G=△/2u=2S A第一步,分解n n∑∑∣j=1 i=1Y j-Y i∣设将收入按从低到高排列Y、Y、……Y,则上式可以分解为矩阵A:2〔(n-1)Y n+(n-2)Y n-1+……+Y2—(n-1)Y1-(n-2)Y2-……-Y n-1〕=2〔(n-1)Y n+(n-3)Y n-1+(n-5)Y n-2……-(1-n)Y2-(n-1)Y1〕第二步,计算 12n2u取样本均值u=Y1+Y2+……Y nn =n ∑Y in1 2n u = 12n n∑Yi综上,第一步、第二步,得到G = 1 n n∑Y i〔(n -1)Y n +(n -3)Y n -1+(n -5)Y n -2……-(1-n )Y 2-(n -1)Y 1〕 式(14) 第三步,如下图计算S B 如下图 如图四,计算每一部分面积S PS P= 1 2 AB (AC +BD )= 1 ∑i-1Y i +∑ iY i 2n n ∑Y iS B = n∑1 ∑i-1Y i +∑ iY i 2n n ∑Y i第四步,计算S AS A =S A +B -S B = 1 2 - n∑1 ∑i-1Y i +∑ i Y i 2n n ∑Y i= 1 2n n n ∑Y i - n∑ ∑i-1Y i +∑ iY i n ∑Y i分解n n ∑Y i - n∑ ∑i-1Y i +∑ iY i 得到矩阵B加总最后一行,得到:n n ∑Y i - n ∑ ∑i-1Y i +∑ iY i =(n -1)Y n +(n -2)Y n -1+……+Y 2—(n -1)Y 1-(n -2)Y 2-……-Y n -1=(n -1)Y n +(n -3)Y n -1+(n -5)Y n -2……-(1-n )Y 2-(n -1)Y 1S A = 1 2n n n ∑Y i -n ∑ ∑i-1Y i +∑ iY i n∑Y i= 1 2n n ∑Y i〔(n -1)Y n +(n -3)Y n -1+(n -5)Y n -2……-(1-n )Y 2-(n -1)Y 1〕 式(15)比较式(14)和式(15)可得G=△/2u =2S A 。

基尼系数及计算方法

基尼系数及计算方法

基尼系数及计算方法基尼系数是国际上用来测量收入分配差距的指标,是一个与收入分配直接相关的统计指标。

基尼系数是收入分配中的一个重要指标,它反映了收入分配之间的相对差距大小。

基尼系数计算方法:基尼系数=1-1,基尼系数越小,收入分配差距越小;基尼系数越大,收入分配差距越大。

基尼系数按经济社会条件分为收入分配基尼系数、中低收入基尼系数、高收入基尼系数和中等收入基尼系数等五个系数。

收入和消费是人们生活的基本需求,是人们赖以生存和发展的基本条件之一。

因此,建立一个公平合理、符合社会发展规律和群众利益需求的分配制度是社会发展的必然要求。

要把“以增长为中心”转变为“以提高人民生活水平为中心”,使人们有更多的收入成为可能。

一、基尼系数的含义基尼系数,是一种用来衡量居民之间收入分配合理性的指标。

该系数在0至0.50之间表示收入分配不公;在0.50至0.70之间表示收入分配差距过大;在0.70以上表示收入分配严重不平等。

中国的基尼系数是0.4,比世界平均水平0.345低5个百分点。

基尼系数反映了居民收入来源不均的程度。

它反映了居民收入分配情况,是收入分配公平状况的重要判断标准。

它是一个重要评价指标。

基尼系数是由美国心理学家基尼提出。

他认为,中国城乡之间、阶层之间的收入分配不平等程度太高、太严重。

二、居民收入分配现状改革开放以来,我国居民收入持续增长,对经济增长作出了巨大贡献。

同时也存在一些问题。

首先,居民收入快速增长并没有带来整个社会财富的大幅度增加。

中国人均 GDP从1978年的649美元增加到2010年的6.79万美元。

然而,随着中国经济进入新常态后,人们收入不断提高,消费不断增长,投资不断增加。

然而,与世界主要国家相比,中国贫富差距仍然很大。

根据国家统计局发布的数据显示:在2000年国内生产总值(GDP)中,城镇居民和农村居民收入分别占国民收入的69.1%和59.4%。

三、基尼系数对中国的影响从国际上看,大多数国家都是按照基尼系数来衡量收入差距的。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

SB=∫10 mpndp= m n+1
式(6)
计算
G= SA = SA+B-SB =1- 2m
SA+B
SA+B
n+1
式(7)
拟合曲线法的在两个环节容易产生谬误:一是拟合洛伦茨曲线,得出函数表达式的过 程中,可能产生误差;二是拟合出来的函数应该是可积的,否则就无法计算。
3、分组计算法 这种方法的思路有点类似用几何定义计算积分的方法,在 X 轴上寻找 n 个分点,将洛 伦茨曲线下方的区域分成 n 部分,每部分用以直代曲的方法计算面积,然后加总求出面积。 分点越多,就越准确,当分点达到无穷大时,则为精确计算。
n
∑Yi
这是精确计算基尼系数的表达式,当分点 n 个数有限时,定义:
yi=
Yi
n
∑Yi
得到近似表达式:
式(9) 式(10)
G=2SA=
2 n
(y1+2y2+···+nyn)-(
n+1 ) n
式(11)
(证明过程见附录二)
分组计算法不依赖于洛伦茨曲线的函数形式,但在以直代曲的环节会出现误差,增加
分点的个数可以减少这种误差。
式(12)地意义在于形式化地表述了对总体基尼系数进行分解的思路和框架,但由于没
3
发展经济学论文
有给出 Wi、Ib 和ε(fi)的具体计算方法,还不能用于基尼系数的计算。 经济学家 Sundrum(1990)在他的《欠发达国家的收入分配》一书中介绍了一种对一国
或地区基尼系数进行分解的方法,其数学公式为:
n
∑Yi
SP=21
AB(AC+BD)= 1 2n
i-1
i
∑ Yi+∑ Yi
n
∑Yi
i
=1 2n

∑Yi
n
∑Yi

i-1
∑ Yi
n

∑Yi
n
SB=∑
1 2n
i-1
i
∑ Yi+∑ Yi
n
∑Yi
SA=SA+B-SB=21
n
-∑
1
2n
i-1
i
∑ Yi+∑ Yi
n
∑Yi
=1 2n
n
n i-1
i
n∑Yi-(∑ ∑ Yi+∑ Yi)
这种方法会在可能在两个环节产生误差:一是用其他方法估计城乡各自的基尼系数 G1 和 G2 时,可能产生误差;二是城乡收入分布一般会在不同程度上重叠。
附录一: 证明:G=△/2u=2SA第一步,分解Fra biblioteknn ∑∑
Yj-Yi∣
j=1 i=1∣
设将收入按从低到高排列 Y1、Y2、……Yn,则上式可以分解为矩阵 A:
n
n i-1
i
n∑Yi-∑ ∑ Yi+∑ Yi
n
∑Yi
n
n i-1
i
分解n∑Yi-∑ ∑ Yi+∑ Yi 得到矩阵 B
n
n∑Yi Y1+Y2+…Yn Y1+Y2+…Yn

n i-1
i
∑ ∑ Yi+∑ Yi
+Y1 Y1+Y1+Y2
Y1+Y2+Y1+Y2+Y3

n
n i-1
i
n∑Yi-∑ ∑ Yi+∑ Yi
P
O
Xi-1 Xi
Xn X
图三
P
A
B
i-1
i
图四
如图四,计算每一部分面积 SP
SP=21
AB(AC+BD)= 1 2n
i-1
i
∑ Yi+∑ Yi
n
∑Yi
n
SB=∑
1 2n
i-1
i
∑ Yi+∑ Yi
n
∑Yi
第四步,计算 SA
SA=SA+B-SB=21
n
-∑
1
2n
i-1
i
∑ Yi+∑ Yi
n
∑Yi
=1 2n
了样本数据的基尼系数值。
2、拟合曲线法
拟合曲线法计算基尼系数的思路是采用数学方法拟合出洛伦茨曲线,得出曲线的函数
表达式,然后用积分法求出 B 的面积,计算基尼系数。通常是通过设定洛伦茨曲线方程,
用回归的方法求出参数,再计算积分。例如,设定洛伦茨曲线的函数关系式为幂函数:
I=αPβ
式(5)
根据选定的样本数据,用回归法求出洛伦seo茨曲线,例如,α=m,β=n.求积分
4、分解法
上述的计算方法的最终目的都在于求出基尼系数的值,而分解法则是在求出上述值的
基础上,力图研究基尼系数的构成因素,除了得出总的基尼系数的信息之外,在计算过程中
还能够获得分解部分内部的基尼系数值。另外,分解法求出基尼系数的过程一般都依赖于已
有部分的基尼系数的值,从这个意义上说,分解法并不是独立计算基尼系数的方法,它更重
2
Y E
发展经济学论文
C
A B
P
O
X
图二
假设分为 n 组,每组的收入为 Yi,则每个部分 P 的面积为:
SP=
1 2n
i-1
i
∑ Yi+∑ Yi
n
∑Yi
加总得到:
式(8)
G= SA SA+B
= SA+B-SB SA+B
n
=1-2lim ∑ 1 k→∞ 2n
i-1
i
∑ Yi+∑ Yi
ni
n
(2n-2 ∑∑yi+2∑yi)-
n+1 2n
=1 n
(y1+2y2+···+nyn)-
n+1 2n
G=2SA=
2 n
(y1+2y2+···+nyn)-(
n+1 ) n
参考资料: 1、 Sundrum.R.M,1990,Incom Distribution in Less Developed Counties, London and New
j=1 i=1∣
式(4)
直接计算法只涉及居民收入样本数据的算术运算,很多学者认为理论上看,只要不存
在来源于样本数据方面的误差,就不存在产生误差的环节。实际上,在附录一证明过程当中
将看到,直接计算法依然采用了以直代曲法计算面积,只不过这个过程在样本数据范围内达
到了最小近似,其精确度直接取决于样本数据本身。因此,可以认为它不带任何误差的计算
York:Routledge 2、 Cowell.F.A,2000,Measurement of Inequality, in Handbook of Income Distribution,
eds. By A.Atkirrson and F.Bourguignon, Northholland 3、 熊俊:《基尼系数估算方法的比较研究》;《财经问题研究》2003 年 1 月第 1 期 4、 王文森:《基尼系数及推广应用》;《统计与预测》;2003 年 1 月第 1 期
Y
E
C
A B
O
X
图一
为了用指数来更好的反映社会收入分配的平等状况,1912 年,意大利经济学家基尼根 据洛伦茨曲线计算出一个反映收入分配平等程度的指标,称为基尼系数(G)。在上图中, 基尼系数定义为:
G= SA SA+B
式(1)
当 A 为 0 时,基尼系数为 0,表示收入分配绝对平等;当 B 为 0 时,基尼系数为 1,表
发展经济学论文
基尼系数的计算方法及数学推导
2001 金融三班 袁源
摘要:本文归纳了基尼系数的四种计算方法:直接计算法、拟合曲线法、分组计算法和分解 法,并进行了数学推导和证明。在此基础上,文章比较了各种算法优缺点,分析了误 差可能产生的环节。
关键词:洛伦茨曲线 基尼系数
一、洛伦茨曲线和基尼系数
1905 年,统计学家洛伦茨提出了洛伦茨曲线,如图一。将社会总人口按收入由低到高 的顺序平均分为 10 个等级组,每个等级组均占 10%的人口,再计算每个组的收入占总收入 的比重。然后以人口累计百分比为横轴,以收入累计百分比为纵轴,绘出一条反映居民收入 分配差距状况的曲线,即为洛伦茨曲线。
Yn+Yn-1+…Y2
Yn+Yn-1+…Y3-Y1 Yn+Yn-1+…Y4-Y1-Y2

Y1+Y2+…Yn Y1+Y2+…Yn-2+Y1+Y2+…Yn-1 Y1+Y2+…Yn Y1+Y2+…Yn-1+Y1+Y2+…Yn
Yn-Y1-Y2-…Yn-2 -Y1-Y2-…Yn-1
5
发展经济学论文
加总最后一行,得到:
P22 u2 u
G2 可以作为以P12
u1 u
和P22 u2 u
k
为权重的∑WiGi,P1P2︱
u1-u2 u
︱则为组间差距指
数Ib。值得注意的是式中没有ε(fi)项,意味着ε(fi)=0 成立,因此这种算法隐含的假
设条件是农村与城镇的收入分布完全不重叠。此外,采用这种计算方法还必须满足条件:在
估算城乡内部的基尼系数时所用的居民收入数据的口径是相同或相近的。
n
∑Yi
n
n
i
n
n
i
=1 2n
n∑Yi-∑(2
∑ Yi-Yi)
n
∑Yi
=1 2n
n∑Yi-∑(2 ∑ Yi-Yi)
n
∑Yi
=1
ni
n
(2n-2 ∑∑yi+2∑yi)-
n+1
2n
2n
ni
分解 n- ∑∑yi 得到矩阵 C:
n
y1+y2+……yn y1+y2+……yn
ni
∑∑yi
y1 y1+y2 y1+y2+y3
第二步,计算
相关文档
最新文档