比率估计回归估

合集下载

第五章比率估计与回归估计

第五章比率估计与回归估计
比率估计量是有偏估计量,但当样本量增大时其偏倚 将趋于零 。
理论上可以证明,R?, yR ,Y?R 分别为 R,Y ,Y 的近似无
偏估计量,而且对于比率估计量,其方差主要取决于 Yi 与 RX i 之间的差异,当 Yi ? RX i 时,估计量方差将很小。 换言之,比率估计量将有很高的精度。这告诉我们,只 有当两个变量大致成正比例关系时,应用比率 估计量才能使估计精度有较大改进。
5
? 三、 比率估计量方差的估计与置信区间
对于一般的n,比率估计量呈右偏分布,只有
当n>30,
C
<0.1,
x
C
y
<0.1这些条件同时满足时才
能直接用正态分布构造置信区间。 R 的置信区间为
[
]
[ R? ? u? se(R?), R? ? u? se(R?)]
2
2
其中 u? 是标准正态分布的上α /2分位点,0<α <
? 基于这种考虑利用已知的辅助变量信息构造比率估计量就 可使估计精度加以改进。
3
第二节 比率估计
?
一、比率估计量
设对有两个调查变量Y 和X 的总体进行简单随机抽样 ,分别以y,
x表示样本总值 ,以
y , x表示样本均值,以 R? ? y ? y 为样 xx
本比率 ,用 作R? 为总体比率R的估计称为的比率估计 。
精度有较大提高。若
CY

C
,则只需当ρ
2
第一节 问题的提出
? 在许多实际问题中常常涉及两个调查变量(指标) Y 和X 。 对于包含个抽样单元的总体除了对总体信息进行估计外,常 常要估计总体比率R。总体比率在形式上总是表现为两个变 量总值或均值之比。 在涉及两个变量的抽样调查中,有两种情况需要应用比率 估计量。一种情况是利用双变量样本对总体比率进行估计需 应用比率估计量,此时两个变量均为调查变量。另一种情况 是一个变量为调查变量,另一个变量表现为与调查变量有密 切关系的辅助变量,在对调查变量总体总值、总体均值等目 标量进行估计时,利用已知的辅助变量信息构造比率估计量 可以改进估计的精度。

抽样调查理论与方法 金勇进(第二版)-第2章-简单随机抽样

抽样调查理论与方法 金勇进(第二版)-第2章-简单随机抽样
N
X
2
n
N
1
i 1
(Y i R X i )
2
定理 的方差为:

Y 2.7:对于简单随机抽样,n较大时, R N y R
N 1 2 1 f 2 V (Y R ) N (Yi R X i ) n N 1 i 1

推论 2.12:对于简单随机抽样,n较大时, Y y 的方差为:
n N
n N
【例2.1】

设总体有5个单元(1、2、3、4、5), 按不放回简单随机抽样的方式抽取2个单 元,则所有可能的样本为个:
1,2
1,3 1,4 1,5
2,3
2,4 2,5
3,4
3,5
4,5
【例2.2】

设总体有5个单元(1、2、3、4、5),按放回 简单随机抽样的方式抽取2个单元,则所有可 能的样本为25个(考虑样本单元的顺序):
i
Y X

Y X
r

n
yi xi
i 1
y x
i 1

i 1
简单估计量
1 Y y n

n
yi
y1 y 2 y n n
i 1
N Y Ny n

n
yi
i 1
a 1 P p n n

n
yi y Y
i 1
ˆ R

【例2.5】

根据例【2.4】的数据和结果,比较两种思路下对应的 方差估计结果。
2.4 回归估计量及其性质
属于简单估计量,不属于比率估计量。

引理 的期望为:
2.3:对于简单随机抽样,n较大时, R r

抽样知识点

抽样知识点

1. 抽样调查广义的抽样调查:是从研究对象的全体(总体) 中抽取一部分单位作为样本,根据对所抽取的样本进行调查,获得有关总体目标量的了解。

从总体中抽取样本的方法看,抽取方法可以分为两类:一类是非随机抽样(非概率抽样);一类是随机抽样(概率抽样),狭义上的抽样就是随机抽样。

2. 随机抽样(概率抽样)随机抽样是从总体中按随机原则抽取样本,并依据样本观察值对总体的数量特征取得具有一定可靠性的推断,从而达到对总体的认识。

随机抽样的特点:1.所谓随机原则就是在抽取样本时排除主观上有意识地抽取调查单元,使每个单元都以一个事先已知的非零概率有机会被抽中。

2.每个单元被抽中的概率是已知的,或是可以计算出来的,按照给定的入样概率通过一定的随机化程序进行抽样。

3.估计量不仅与样本单元的观测值有关,也与其入样概率有关。

随机抽样的主要优点是:随机抽样比非随机抽样更具有客观性,而且随机抽样可以依据调查结果计算抽样误差,从而得到对总体目标量进行推断的可靠程度。

3. 非随机抽样(非概率抽样)非随机抽样是相对于随机抽样而言的。

非随机抽样的共同特点是:抽取样本时,是依据主观判断有目的、有意识地进行,或根据方便的原则进行。

⎪⎪⎪⎪⎪⎪⎪⎪⎩⎪⎪⎪⎪⎪⎪⎪⎪⎨⎧⎪⎪⎪⎪⎪⎪⎪⎩⎪⎪⎪⎪⎪⎪⎪⎨⎧⎪⎪⎩⎪⎪⎨⎧⎪⎪⎪⎪⎩⎪⎪⎪⎪⎨⎧滚雪球抽样判断抽样定额抽样便利抽样)随意调查非随机调查系统抽样不等概率抽样多阶抽样整群抽样分层抽样简单随机抽样随机调查非全面调查全面调查统计调查(4. 抽样调查的基本程序 一、确定调研问题——二、抽样调查设计(抽样设计、问卷设计)——三、实施调查过程——四、数据处理分析——五、撰写调查报告——六、总结评估5. 总体、目标总体与抽样总体、抽样框、样本(包含第十章抽样框误差定义)所要研究对象的全体称为总体,组成这个总体的每个个别对象就称为总体单元或总体单位。

总体又有目标总体与抽样总体之分。

目标总体就是抽样调查预先确定的所要认识的对象的全体,也就是从样本中得到信息对之进行说明的总体。

第四章比估计与回归估计

第四章比估计与回归估计

6、相对方差、相对协方差
1 2 2 2 2 (Yi RXi ) SY R S X 2RSxy N 1 2 2 2 Y (CY C X 2C XY )
ˆ ) V (Y ˆ ˆ V ( Y ) V ( R ) 2 R R (cv) 2 2 2 Y Y R 1 f 2 2 (CY C X 2C XY ) n
二、方差估计及置信区间
1、方差估计
1 f 2 ˆ ˆ 2 s 2 2R ˆs ) v1 ( R ) ( s R y x xy 2 nX 1 f 2 ˆ ˆ 2 s 2 2R ˆs ) v2 ( R ) ( s R y x xy 2 nx
两者均是有偏估计量
很难比较两者优劣
y 109.19455 x 100.96622 2 2 s y 8896.8663 s x 7673.0140 s yx 8259.3624
已知上一年全系统工资总额(X)为 70523.16万元。试估计当年全系统的工资 总额及估计的近似标准差(P132) 。
第三节 回归估计
一、定义
2、置信区间
当 n 30, cv( x ) 0.1, cv( y ) 0.1 时,
R ˆ u ˆ), R ˆ u v( R ˆ) v( R
当上述条件不满足时,
ˆ [(1 u 2 c ) u (c 2 c 2 2c ) u 2 (c 2 c 2 c 2 ) ] R yx y x xy y x xy
2 W ˆ 2 h (1 f h ) v(Ylrs ) (nh 1)s yh (1 rh2 ) nh (nh 2)
联合回归估计:在分层随机抽样中,先 对 Y 及 X 作分层简单估计,再 Y 与 Y 作联合回归估计。

比率估计量

比率估计量

y ˆ Rr x
y x
i 1 i 1 n
n
i
i
抽样误差的评判标准

ˆ) E ˆ E ( ˆ) 估计量方差: V (
偏差: 均方误差:
ˆ) [ E( ˆ) ] B(


2
随机性 误差


ˆ) B(
MSE ( )
2 ˆ ˆ MSE( ) E ( ) 2 ˆ ˆ V ( ) B ( ) ˆ
R
2 1 f 2 ˆ ˆs R ˆ 2s2 ) v(YR ) N (s y 2R x xy n 0.96215 2 687 (8896 .8663 2 1.0818150 7673 .0140) 114343 .42 ˆ ) 338.1470 s(Y (万元) R
很难判定两种估 计方式的优劣 (P42例2.4)

例1:某系统共有N=687个单位,为预估当年全系统
的工资总额,用简单随机抽样抽取一个n=26个单位的 样本,对样本的资料统计如下:
y 109.19455 x 100.96622 2 2 sy 8896.8663 s x 7673.0140 s yx 8259.3624

(3)
当 n 相当大时, x 与 X 相当接近,而 X 是常数,又 y 是Y 的 ˆ) R 。 ˆ y X ,所以 E( R 无偏估计,因此,实质上 R
ˆ ) R 这一事实,而且告 (3) 式的好处不单单告诉我们E( R ˆ 可以表示成 ˆ y X ,表明 R 诉了我们,当 n 相当大时, R ˆ 的分布可近似正态分布 yi X (i 1,2, , n) 的平均数,因此 R ˆ R R 因此,可利用 近似标准正态分布获得 R 的置信区间 ˆ) Var ( R

应用抽样技术答案

应用抽样技术答案

3.5解:已知
PQ (1) 由 n0 得: V ( p)
1 0
P1= 0.08, Q1= 1-P1 = 0.92; P2= 0.05, Q2 = 1– P2 = 0.95; V(p) = 0.05*0.05

0.08 0.92 n 30 2 0.05 Q 得: (2) 由 n0 2 Cv ( p) P
(2)事后分层
Ppst=ΣhWhph=0.7*1/43+0.3*2/57=0.0268 V(Ppst) =ΣhWh2[(1—fh)/(nh—1)]phqh =0.72*[1/42](1/43)(42/43)+0.32*[1/56](2/57)(55/57) =0.00031942
第五章 比率估计与回归估计
N1 的95%的置信区间为: (159,776)
(3)N=1750,n=30,n1=8, t=1.96, p=0.267, q=1-0.267=0.733 由此可计算得: t 2 q 1.962 0.733 n0 2 1054.64 r p 0.01 0.267
n = n0/[1+(n0—1)/N] = 1054.64/[1+1053.64/1750]=658.2942 = 659
21 22 23 24 25 26 27 28 29 30
49 45 95 36 25 45 128 45 数据,有:
1682 2 56.07(元), s y (118266 16822 / 30) / 30 798.73 yi 1682, y 30
回归系数 b = Sxy/Sxx2= 370.5965 ylr=x—b(x—X)=1260—370.5965*(2.97—460/140)=1377.089

抽样技术练习题及答案

抽样技术练习题及答案

习题一1.请列举一些你所了解的以及被接受的抽样调查。

2.抽样调查基础理论及其意义;3.抽样调查的特点。

4.样本可能数目及其意义;5.影响抽样误差的因素;6.某个总体抽取一个n=50的独立同分布样本,样本数据如下:567 601 665 732 366 937 462 619 279 287690 520 502 312 452 562 557 574 350 875834 203 593 980 172 287 753 259 276 876692 371 887 641 399 442 927 442 918 11178 416 405 210 58 797 746 153 644 4761)计算样本均值y与样本方差s2;2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式;3)根据上述样本数据,如何估计v(y)?4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。

习题二一判断题1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。

2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。

3 抽样单元与总体单元是一致的。

4 偏倚是由于系统性因素产生的。

5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。

6 偏倚与抽样误差一样都是由于抽样的随机性产生的。

7 偏倚与抽样误差一样都随样本量的增大而减小。

8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。

9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。

10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。

11 一个抽样设计方案比另一个抽样设计方案好,是因为它的估计量方差小。

12 抽样误差在概率抽样中可以对其进行计量并加以控制,随着样本量的增大抽样误差会越来越小,随着n越来越接近N,抽样误差几乎可以消除。

简单随机抽样

简单随机抽样

2.2.2简单估计量 方差与协方

y
1、简单估计量y 的方差
证明: 方法一: 根据方差的定义和性质,
显然有
V ( y) E( y Y )2 1 Eny Y 2
n2
1 n2
n E i1
( yi
2
Y )
=
1
n2
E
n i 1
( yi
Y
)2
2E
n i j
( yi
Y
)( y j
N i1
Yi
E(y)
y CnN
1 n
Cn1 N1
N i1
CnN
Yi
1 N
N i1
Yi
Y
证明2:(对称性论证法)
y
1 n
n i1
yi
E(y)
1 n
E(
n i1
yi
)
1 n
n N
N i1
Yi
1 N
N i1
Yi
Y
证明3:从总体规模为N的总体中抽取一个 容量为n的简单随机样本。若对总体中每个 单元,如引理2.2引进随机变量即可完成证 明。参见34页。
2、随机数骰子及其使用方法
随机数骰子是由均匀材料制成的正二十面体(通常的骰子是正 六面体,即正方体),面上刻有0-9的数字各2个。每盒骰子 由盒体、盒盖、泡沫塑料垫及若干个(通常是3-6个)不同颜色 的骰子组成。使用随机数骰子时可以像普通骰子那样用投掷 的方法。但正规的方法是将一个或n个骰子放在盒中,拿去泡 沫塑料垫,水平地摇动盒子,使骰子充分旋转,最后打开盒 子,读出骰子表示的数字。一个骰子一次产生一个0-9的随 机数。要产生一个m位数字的随机数,就需要同时使用m个骰 子(事先规定好每种颜色所代表的位数,例如红色表示百位数 ,蓝色表示十位数,黄色表示个位数等),或将一个骰子使用 m次(规定第一次产生的数字为最高位数,最后一次产生的数 字为最末位即个位数字等)。特别规定m个骰子的数字(或一个 骰子m次产生的数字)都为0时,表示10m。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Ratio and Regression Estimator引例:1802年,拉普拉斯想要估计法国的人口数目。

他获得了一个遍布全国范围的30个社区(commune )的样本,截至1802年9月23日总共有2037615居民。

在包括1802年9月23日以前的三年中,215599个新生儿在30个commune 。

拉普拉斯认为30个commune 的每年注册的新生儿数为215599/3=71866.33。

把2037615按照71866.33 来分,拉普拉斯估计每年每28.35人里有一个注册新生儿。

具有众多人口的乡镇也就可能有同样众多的注册新生儿,通过用28.35乘以全法国年度新生儿总数来估计得出法国人口总数。

调查中都有辅助信息,抽样框也通常有每个单元额外的信息,这些信息能被用来提高我们的估计精度。

一、为什么要使用比率估计/回归估计利用总体的辅助信息提高估计的精度。

辅助指标的选择:第一,辅助指标应该与调查指标有较好的正的相关关系。

第二,xy的抽样分布较u x y 的抽样分布变动性要小得多。

第三,辅助指标的总体总量或总体均值已知。

比率估计、回归估计需要有足够的样本量才能保证估计的有效。

有偏估计:当样本量足够大时,估计的偏倚趋于0。

简单地想要估计一个比率:假定总体由面积不同农业用地构成,i y i =地谷物的产量,i x i =地的面积,B=每亩谷物的平均产量。

想要估计一个总体总数,但总体大小N 是未知的。

但是我们知道,于是可以通过y N ty =ˆ来估计N,由此我们可以使用不同于总数N 的方法而是采用辅助变量来进行测量。

要估计渔网中长度长于12cm 的鱼的总数,抽取一个鱼的随机样本,估计长度长于12cm 的鱼所占的比例,用鱼的总数N 乘以这个比例即可得到,但如果N 未知不能使用。

能称量渔网中鱼的总重量。

鱼的长度与其重量相关。

xt y tx yr =ˆ 调整来自样本的估计量以便它们反映人口统计学的总量。

在一所具有4000名学生的大学提取一个400个学生的简单随机样本,此样本可能包含240个女性,160个男性,且其中被抽中的84名女性和40名男性计划以教学为毕业后的职业。

以教学为职业的总量估计:12401244004000=⨯调整后的总量估计:1270130016040270024084=⨯+⨯比率估计量被用来对无回答进行调整。

设抽取一个行业的样本:令i y 为i 行业花费在健康保险上的金额,i x 为i 行业的雇员数。

假定对总体中的每个行业i x 均已知.我们希望一个行业花费在健康保险上的金额与雇员数相关。

某些行业在调查中可能涉及不到。

估计保险费用的总花销时调整无回答的方法之一是用总体数X 乘以比率 xy 。

二、Ratio Estimator在SRS 条件下,辅助指标x ,其总体均值(总量)已知,则有:1)(1)ˆ(ˆˆ22---=======∑∑∑∑∑N RX Y X n f R V x y R y N X xy X xy Y X xy X xy y i i RRR例1,对以下假设总体(N=6),用简单随机抽样抽取的样本,比较简单随机抽样比估总共抽取1526=C 个样本,简单估计为:i i i y =2,比率估计:X x y y i i Ri =。

686.17151)(151≈=∑=i Ri R y y E ;18151)(151==∑=i i y y E[]82.2)(151)(1512≈-=∑=i R Ri R y E y y V ;[]87.97)(151)(1512=-=∑=i i y E y y V31356.0)()(-≈-=Y y E y B R R (偏倚程度);92.2)()()(2≈+=R R R y B y V y MSE评价:简单估计是无偏的,而比估计是有偏的。

简单估计量的方差远远大于比估计量的方差,比估计的偏差不大,其均方误差也比简单估计的小得多。

因此对这个总体,比估计比简单估计的效率高。

三、比率估计的性质)(1)(22x y x RS S S Xn f R r E --≈-ρ偏倚量会小,如果:样本量n 很大;抽样比N n 很大;X 很大;x S 很小;相关系数R 接近于1。

比率估计的近似方差:)ˆ()ˆ()ˆ()ˆ()(222R V X N Y V R V X R X V y V RR === ∑=---=-≈-=Ni i i RX Y N X n f X R y E X R R E R V 1222221)(111)(1)ˆ()ˆ( ∑=---≈ni ii x R y n X n f R v 1221)ˆ(111)ˆ( )ˆ2(1)ˆ(22222x xy y S R RS S Xn f R V +--≈;)ˆˆ2(1)ˆ(22222x xy y s R s R s x n f R v +--≈ 四、比率估计的效率 1、与简单估计的比较简单估计量无偏,而比率估计量渐近无偏。

因此这里只比较当n比较大的情形。

21)(y S nf y V -=)2(1)2(1)(222222x y x y yx x y R S S R S R S nf RS S R S n f y V ρ-+-=-+-≈比率估计量优于简单估计量的条件是:y x y x x y x C C Y S X S S S R S R 2210)2(22=>⇒<-ρρ(正高度相关)2、比率估计成为最优线性无偏估计的条件(1)i y 与i x 的关系是过原点的直线。

(2)i y 对这条直线的方差与i x 成比例。

则比率估计是最优线性无偏估计(BLUE)。

例2,某县在对船舶调查月完成的货运量进行调查时,对运管部门登记的船舶台帐进行整理后获得注册船舶2860艘,载重吨位154626吨,从2860艘船舶中抽取了一个的简单随机样本,调查得到样本船舶调查月完成的货运量及其载重吨位如下表2671937154626652.1123ˆ=⨯==X x y Y R1122221010617.2)ˆ2ˆ()1()ˆ(⨯=-+-≈yx x y R s R s R s nf N Y v ;458930)ˆ()ˆ(≈=RR Y v Y s用简单估计对货运量进行估计: 32123522.11232860ˆ=⨯==y N Y11221043303.3)1()ˆ(⨯=-≈y s n f N Y v ;585921)ˆ()ˆ(≈=Y v Ys 6135.0)ˆ()ˆ(ˆ≈=Y v Y v f def R (注!实际中对于样本量较小的情形,使用比率估计量时不能忽视其偏倚。

)四、分层随机抽样下的比率估计1、separate ratio estimator如果各层的样本量不小的话,则可以采用各层分别进行比率估计,将各层加权汇总得到总体指标的估计,这种方式称为分别比率估计量。

,111∑∑=x y r ,222∑∑=x y r ∑∑=LL L x y r ,Λ(h=1,2,…..L) h h h h Rh h RS X x y W y W y ∑∑==;∑∑===Rh h h h RS RS Y X x y y N Y ˆˆ bined Ratio estimator分别比率估计量要求每一层的样本量都比较大,如果达不到这个要求,则它的偏倚可能比较大,这时使用联合比率估计量。

X R X x y y Cst st RC ˆ==;X R y N X x y Y C RC st st RC ˆˆ=== 方差的比较:)2()ˆ(22222yxh h xh h yh hh RSS R S R S n W N Y V -+=∑ )2()ˆ(22222yxh c xh c yh hh RCS R S R S n W N Y V -+=∑ 如果每一层样本量都比较大,各层R 相差较大,则分别比率估计量的方差小于联合比率估计量的方差。

但当每层的样本量不太大时,还是采用联合比率估计量更可靠些,因为这时分别比率估计量的偏倚很大,从而使总的均方误差增大。

五、Regression EstimatorLrLr Lr y N Y X x y x X y y =--=-+=ˆ)()(ββ ,0=β )(srs yy Lr =,R =β R Lr y x X xyy y =-+=)( (比估计)回归估计应用的两种情况: 1、β事先确定设β的确定值为0β,0β是一常数,则:)(0x X y y Lr -+=β (1))2(1)]()[(111)(02202201yx x y iN i i Lr S S S nf X X Y Y N n f y V βββ-+-=-----=∑= (2) 因为Y x X E y E y E lr =-+=)()()(0β而lr y 又可以表示为)(0i i x X y -+β的样本均值,后者的总体均值为Y 故(2)式成立,其样本估计量:)2(1)(02202yx x y Lr s s s nf y ββν-+-= (3)性质:A:Lr y 是Y 的无偏估计;B:)(Lr y ν是)(Lr y V 的无偏估计;C:0β的最佳值是ββ==20xyxS S (总体回归系数))1(1)(22min ρ--=y Lr S nf y V2、β由样本估计∑∑---=2)())((x x x x y y b i i i 此时:(大样本条件下)222)]()[()2(1)()1(1)()(x x b y y n n f y S n f y V x X b y y i ni Lr y Lr Lr -----=--≈-+=∑νρ残差方差:22)]()[()2(1x x b y y n S i ni e----=∑ n S N n y SE e reg 2)1()ˆ(-= 3、分层抽样中的回归估计(1)分别回归估计)]([ˆ)]([hh h h h Lrs lrs h h h h h Lrh Ln Lrs x X y N y N Y x X y W y W y -+==-+==∑∑∑ββ若h β可以事先确定时,Lrs y 与LrsY ˆ都是无偏的,且 )2()1()(2222xh h yxh h yh hh h Lrs S S S n f W y V ββ+--=∑在)...2,1(2L h S S xhyxhh ==β时达到极小值,)1()1()(222min h yh hh h Lrs S n f W y V ρ--=∑ 若h β不能事先确定,∑∑---=hhn h hin h hi h hih x xx x y yb 2)())((,当h n 较大时,)1()1()(222h yh hh h Lrs S n f W y V ρ--≈∑)1()1()2()1(])()([)2()1()(2222222h yh h h h h h n h hi h h n hi h h h h Lrs r S n n n f W x x b y y n n f W y hh ----=-----=∑∑∑∑ν(2)联合回归估计)ˆ(ˆˆ)(,stst Lrc Lrc st st Lrc hh st h h st X X Y y N Y x X y y x W x y W y -+==-+===∑∑ββ当β事先设定时,)2()1()(2222xh yxh yh hh h Lrc S S S n f W y V ββ+--=∑(无偏)当β无法事先设定时,(渐近无偏))2()1()]()[()1()1()(222222xh c yxh c yh hh h h hi c h hi h h h h Lrc S b S b S n f W x x b y y n n f W y +--=-----≈∑∑∑ν其中,∑∑∑∑-------=222)()1()1()])([()1()1(h hi hh h h h hi h hi hh h h c x x n n f W x x y y n n f W b 例3,某市对中央直属单位和市属单位专业技术人员总数进行了分层随机调查,已有98年各层人员总数,135个中央直属单位有75650专业技术人员,1228个市属单位有315612专业技术人员。

相关文档
最新文档