《抽样技术》第四版习题答案

合集下载

抽样技术课后习题答案

抽样技术课后习题答案
1700
12
160
1700
3
170
2000
13
180
2000
4
150
1500
14
130
1400
5
160
1700
15
150
1600
6
130
1400
16
100
1200
7
140
1500
17
180
1900
8
100
1200
18
100
1100
9
110
1200
19
170
1800
10
140
1500
20
120
1300
20
试估计平均每户家庭订报份数及总的订报份数,以及估计量的方差。
解:由题意得到 , , ,
故 (份)
(份)
(份)
于是由以上的计算结果得到平均每户的订报份数为1.875,估计量方差为0.00391875。该辖区总的订阅份数为7500,估计量方差为62700。
4.2
某工业系统准备实行一项改革措施。该系统共有87个单位,现采用整群抽样,用简单随机抽样抽取15个单位做样本,征求入选单位中每个工人对政策改革措施的意见,结果如下:
1
42
6.2
11
60
6.3
2
51
5.8
12
52
6.7
3
49
6.7
13
61
5.9
4
55
4.9
14
49
6.1
5
47
5.2
15
57
6.0

抽样技术课后习题答案

抽样技术课后习题答案

抽样技术课后习题答案第⼆章习题2.1判断下列抽样⽅法是否是等概的:(1)总体编号1~64,在0~99中产⽣随机数r ,若0或r>64则舍弃重抽。

(2)总体编号1~64,在0~99中产⽣随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产⽣随机数r 。

然后⽤19999作为被抽选的数。

解析:等概抽样属于概率抽样,概率抽样具有⼀些⼏个特点:第⼀,按照⼀定的概率以随机原则抽取样本。

第⼆,每个单元被抽中的概率是已知的,或者是可以计算的。

第三,当⽤样本对总体⽬标进⾏估计时,要考虑到该样本被抽中的概率。

因此(1)中只有1~64是可能被抽中的,故不是等概的。

(2)不是等概的【原因】(3)是等概的。

2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?解析:抽样理论和数理统计中关于样本均值的定义和性质的不同抽样理论概率统计定义 ∑==ni i y n y 11∑==ni iy n y 11性质1.期望()()()()Y C P E NN C N C ===∑∑==n n1i n i 1i i i 1y y y2.⽅差()()()[]()iiP y E y y V n N21∑=-==()()[]n NC i iiC y E y n N121∑=- ()21S nf -=1.期望()??=∑=n i i y n E y E 11()∑==ni y E 1i n 1[]µµ==n n12.⽅差()[]2µ-=i y E y V211-=∑=n i i y n E µ()ny n 122i σµ=-=E2.3为了合理调配电⼒资源,某市欲了解50000户居民的⽇⽤电量,从中简单随机抽取了300户进⾏,现得到其⽇⽤电平均值=y 9.5(千⽡时),=2s 206.试估计该市居民⽤电量的95%置信区间。

抽样技术课后习题_参考答案_金勇进

抽样技术课后习题_参考答案_金勇进

第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。

(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。

然后用r+19999作为被抽选的数。

解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。

第二,每个单元被抽中的概率是已知的,或者是可以计算的。

第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。

因此(1)中只有1~64是可能被抽中的,故不是等概的。

(2)不是等概的【原因】(3)是等概的。

2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。

如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。

随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。

解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。

[实用参考]《抽样技术》第四版习题答案

[实用参考]《抽样技术》第四版习题答案

第2章2.1解:()1这种抽样方法是等概率的。

在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是1100。

()2这种抽样方法不是等概率的。

利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2100,而尚未被抽中的编号为36~63的每个单元的入样概率都是1100。

()3这种抽样方法是等概率的。

在每次抽取样本单元时,尚未被抽中的编号为20PP0~21000中的每个单元的入样概率都是11000,所以这种抽样是等概率的。

2.2解:2.3解:首先估计该市居民日用电量的95%的置信区间。

根据中心极限定理可知,在大样本的条件下,_y E y y -=近似服从标准正态分布,_Y 的195%α-=的区间为y z y z y y αα⎡⎡-+=-+⎣⎣。

而()21f V y S n -=中总体的方差2S是未知的,用样本方差2s 来代替,置信区间为,y y ⎡⎤-+⎢⎥⎣⎦。

由题意知道,_29.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得_21130050000()2060.6825300f v y s n --==⨯=。

将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。

下一步计算样本量。

绝对误差限d 和相对误差限r 的关系为_d rY =。

根据置信区间的求解方法可知____11P y Y r Y P αα⎫⎪⎧⎫-≤≥-⇒≥-⎨⎬⎩⎭⎪⎭ 根据正态分布的分位数可21α⎫⎪⎪≥-⎬⎪⎪⎭,所以()2_r Y V yz α⎛⎫ ⎪= ⎪⎝⎭。

也就是2_2_222/2211r Y r Y S n z S n N z αα⎤⎛⎫⎥⎛⎫ ⎪⎛⎫⎝⎭ ⎪⎥-=⇒ ⎪ ⎪⎥⎝⎭⎝⎭⎥⎦。

把_29.5,206,10%,50000y s r N ====861.75862≈。

抽样技术课后习题_参考答案_金勇进

抽样技术课后习题_参考答案_金勇进

第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。

(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。

然后用r+19999作为被抽选的数。

解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。

第二,每个单元被抽中的概率是已知的,或者是可以计算的。

第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。

因此(1)中只有1~64是可能被抽中的,故不是等概的。

(2)不是等概的【原因】(3)是等概的。

2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。

如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。

随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。

解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。

抽样技术习题参考答案(第一章)

抽样技术习题参考答案(第一章)

第一章1.1 答:理论上,若要根据调查数据进行统计推断,则需使用概率抽样。

在实际情形中,对概率抽样与非概率抽样的选择基于对调查目的与调查条件的权衡。

按照L. Kish 的说法,适用概率抽样的场合:(1)“当随机化〖即概率抽样〗既简单又重要时,忽视它就等于轻率和无知”;(2)“只有在某一具体研究领域中由于观察到抽选偏差,发现随机性的假设系错误后〖即随机性假设不成立〗,某些研究人员才显示出对概率抽样发生兴趣……在大多数物理学和化学实验中,样本的选择看来并不需要特别注意,在生物学里,随机与不随机兼而有之。

另一个极端是社会科学,事物特征的分布往往与随机分布相去甚远,也正是在这些领域,概率抽样最为需要,也是最为发展的”;(3)“随机化的概率抽样并不是一个教条而是一种策略,特别是对抽样数目大的场合更是如此”。

〖请再次注意由个人随意写下一些数字的例子〗适用非概率抽样的场合:(1)“比较大的挑战是在很多场合实行随机化的花费很大,这时它的价值必须与它的高费用相权衡,而且常常还要与减少对测量和实验变量的控制相权衡〖指调查方法与试验方法的选择〗。

因此,在很多现场操作中作业人员在下列三种情况下,尽量避免使用概率抽样: 第一,如果元素是一致的,那抽样就不重要了,例如,所有重量为一个单位的氢原子都可以认为是一样的;第二,虽然缺乏一致性,但如果预测的变量是可以度量且能够控制的话,抽样仍然可以避免,例如,在对个人进行抽选时对性别的控制是容易的;第三,如果不能控制的变量在总体中是随机分布的,那么对于任何选样设计,都可以提供一个随机样本。

”(2)“很多卓有成就的科学(天文学、物理学和化学)的巨大进步过去和现在都没有用概率抽样,在这些科学的研究里,统计推断是根据对总体有着适当的、自动的和自然的随机化这一主观判断而作出的……科学研究里充满了根据总体天然随机化的假定而获得成功的例子。

”1.2 答(1)(2)(3)皆否。

理由:判断一抽样是否为概率抽样,乃判断其是否为一给定之(),,S P U ,即:是否有确定之有限总体U ,所有可能样本的集合{}S s =是否确定,每个样本的选取概率{}P p =是否确定。

抽样技术课后习题_参考答案_金勇进

抽样技术课后习题_参考答案_金勇进

第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。

(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。

然后用r+19999作为被抽选的数。

解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。

第二,每个单元被抽中的概率是已知的,或者是可以计算的。

第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。

因此(1)中只有1~64是可能被抽中的,故不是等概的。

(2)不是等概的【原因】(3)是等概的。

2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。

如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。

随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。

解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。

《抽样技术》第四版习题答案

《抽样技术》第四版习题答案

第2章2.1解:()1这种抽样方法是等概率的。

在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是1 100。

()2这种抽样方法不是等概率的。

利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2100,而尚未被抽中的编号为36~63的每个单元的入样概率都是1 100。

()3这种抽样方法是等概率的。

在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是11000,所以这种抽样是等概率的。

2.2解:2.3 解:首先估计该市居民日用电量的95%的置信区间。

根据中心极限定理可知,在大样本的条件下_y E yy -=近似服从标准正态分布, _Y 的195%α-=的置信区间为2y z y z y y αα⎡⎡-+=-+⎣⎣。

而()21f V y S n-=中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间为,y y ⎡⎤-+⎢⎥⎣⎦。

由题意知道,_29.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得 _21130050000()2060.6825300f v y s n --==⨯=。

将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。

下一步计算样本量。

绝对误差限d 和相对误差限r的关系为_d rY =。

根据置信区间的求解方法可知____11P y Y r Y P αα⎫⎪⎧⎫-≤≥-⇒≤≥-⎨⎬⎩⎭根据正态分布的分位数可以知道1P Z αα⎫⎪⎪≤≥-⎬⎪⎪⎭,所以()2_r Y V y z α⎛⎫⎪= ⎪⎝⎭。

也就是2_2_222/21111r Y r Y S n N z S n N z αα⎡⎤⎛⎫⎢⎥⎛⎫ ⎪⎛⎫⎝⎭ ⎪⎢⎥-=⇒=+ ⎪ ⎪⎢⎥⎝⎭⎝⎭⎢⎥⎣⎦。

把_29.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第2章2.1 解:()1 这种抽样方法是等概率的。

在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是1100。

()2这种抽样方法不是等概率的。

利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2100,而尚未被抽中的编号为36~63的每个单元的入样概率都是1100。

()3这种抽样方法是等概率的。

在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是11000,所以这种抽样是等概率的。

2.3 解:首先估计该市居民日用电量的95%的置信区间。

根据中心极限定理可知,在_y E y y -=近似服从标准正态分布, _Y 的195%α-=的置信区间为y z y z y y αα⎡⎡-+=-+⎣⎣。

而()21f V y S n-=中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间为,y y ⎡⎤-+⎢⎥⎣⎦。

由题意知道,_29.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得 _21130050000()2060.6825300f v y s n --==⨯=。

将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。

下一步计算样本量。

绝对误差限d 和相对误差限r 的关系为_d rY =。

根据置信区间的求解方法可知____11P y Y r Y P αα⎫⎪⎧⎫-≤≥-⇒≤≥-⎨⎬⎩⎭根据正态分布的分位数可以知道1P Z αα⎫⎪⎪≤≥-⎬⎪⎪⎭,所以()2_2r Y V y z α⎛⎫⎪= ⎪⎝⎭。

也就是2_2_222/221111r Y r Y S n N z S n N z αα⎡⎤⎛⎫⎢⎥⎛⎫⎪⎛⎫⎝⎭⎪⎢⎥-=⇒=+ ⎪ ⎪⎢⎥⎝⎭⎝⎭⎢⎥⎣⎦。

把_29.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。

所以样本量至少为862。

2.4 解:总体中参加培训班的比例为P ,那么这次简单随机抽样得到的P 的估计值p 的方差()()111f NV p P P n N -=--,在大样本的条件下近似服从标准正态分布。

在本题中,样本量足够大,从而可得P 的195%α-=的置信区间为2p z p z αα⎡-+⎣。

而这里的()V p 是未知的,我们使用它的估计值()()()^5119.652101fV p v p p p n --==-=⨯-。

所以总体比例P 的195%α-=的置信区间可以写为p z p z αα⎡-+⎣,将0.35,200,10000p n N ===代入可得置信区间为0.2844,0.4156⎡⎤⎣⎦。

2.5 解:利用得到的样本,计算得到样本均值为2890/20144.5y ==,从而估计小区的平均文化支出为144.5元。

总体均值_Y 的195%α-=的置信区间为y z y z αα⎡-+⎣,用()21f v y s n-=来估计样本均值的方差()V y 。

计算得到2826.0256s =,则()2110.1826.025637.17220f v y s n --==⨯=,2 1.9611.95z α==,代入数值后计算可得总体均值的95%的置信区间为[]132.55,156.45。

2.6 解:根据样本信息估计可得每个乡的平均产量为1 120吨,该地区今年的粮食总产量Y 的估计值为_^53503501120 3.9210Y y ==⨯=⨯(吨)。

总体总值估计值的方差为()2^21N f V Y S n -⎛⎫= ⎪⎝⎭,总体总值的195%α-=的置信区间为^^Y z Y z αα⎡-+⎢⎢⎣,把^523.9210,25600,50,350,Y S n N =⨯===, 1.96nf z Nα==代入,可得粮食总产量的195%α-=的置信区间为377629,406371⎡⎤⎣⎦。

2.7 解:首先计算简单随机抽样条件下所需要的样本量,把21000,2,195%,68N d S α==-==带入公式2022/211d n N z S α⎫=+ ⎪⎝⎭,最后可得061.362n =≈。

如果考虑到有效回答率的问题,在有效回答率为70%时,样本量应该最终确定为070%88.5789n n ==≈。

2.8 解:去年的化肥总产量和今年的总产量之间存在较强的相关性,而且这种相关关系较为稳定,所以引入去年的化肥产量作为辅助变量。

于是我们采用比率估计量的形式来估计今年的化肥总产量。

去年化肥总产量为2135X =。

利用去年的化肥总产量,今年的化肥总产量的估计值为_^^_2426.14R y Y R X X x===吨。

2.9 解:本题中,简单估计量的方差的估计值为()21f v y s n-==37.17。

利用比率估计量进行估计时,我们引入了家庭的总支出作为辅助变量,记为X 。

文化支出属于总支出的一部分,这个主要变量与辅助变量之间存在较强的相关关系,而且它们之间的关系是比较稳定的,且全部家庭的总支出是已知的量。

文化支出的比率估计量为_____^_R y y R X X x==,通过计算得到2890/20144.5y ==,而_1580x =,则_^_144.50.09151580yR x ===,文化支出的比率估计量的值为_146.3R y =(元)。

现在考虑比率估计量的方差,在样本量较大的条件下,()()()22212R R x x f V y MSE y S R S S R S nρ-≈≈-⋅+,通过计算可以得到两个变量的样本方差为224826,9.95810xs s ==⨯,Y X 和之间的相关系数的估计值为^0.974ρ=,代入上面的公式,可以得到比率估计量的方差的估计值为_ 1.94R v y ⎛⎫= ⎪⎝⎭。

这个数值比简单估计量的方差估计值要小很多。

全部家庭的平均文化支出的195%α-=的置信区间为R R R R y z y z y y αα⎡⎡-+=-+⎣⎣,把具体的数值代入可得置信区间为[]143.57,149.03。

接下来比较比估计和简单估计的效率,()()__ 1.940.05237.17R R V y v y V y v y ⎛⎫⎛⎫ ⎪ ⎪⎝⎭⎝⎭≈==,这是比估计的设计效应值,从这里可以看出比估计量比简单估计量的效率更高。

2.10 解:利用简单估计量可得1630/10163i y y n ===∑,样本方差为2212.222s =,120N =,样本均值的方差估计值为()21110/120212.22219.453710f v y s n --==⨯=。

利用回归估计的方法,在这里选取肉牛的原重量为辅助变量。

选择原重量为辅助变量是合理的,因为肉牛的原重量在很大程度上影响着肉牛的现在的重量,二者之间存在较强的相关性,相关系数的估计值为^0.971ρ=,而且这种相关关系是稳定的,这里肉牛的原重量的数值已经得到,所以选择肉牛的原重量为辅助变量。

回归估计量的精度最高的回归系数β的估计值为^^14.5680.971 1.36810.341x s s βρ==⨯=。

现在可以得到肉牛现重量的回归估计量为___^lr y y X x β⎛⎫=+- ⎪⎝⎭,代入数值可以得到_159.44lr y =。

回归估计量_lr y 的方差为()__2211lr lr f V y MSE y S n ρ-⎛⎫⎛⎫≈≈- ⎪ ⎪⎝⎭⎝⎭,方差的估计值为2_^211lr f v y s n ρ⎛⎫-⎛⎫=- ⎪ ⎪⎝⎭⎝⎭,代入相应的数值,2_^211 1.112lr f v y s n ρ⎛⎫-⎛⎫=-= ⎪ ⎪⎝⎭⎝⎭,显然有()_lr v y v y ⎛⎫< ⎪⎝⎭。

在本题中,因为存在肉牛原重量这个较好的辅助变量,所以回归估计量的精度要好于简单估计量。

第3章3.1 解:在分层随机抽样中,层标志的选择很重要。

划分层的指标应该与抽样调查中最关心的调查变量存在较强的相关性,而且把总体划分为几个层之后,层应该满足:层内之间的差异尽可能小,层间差异尽可能大。

这样才能使得最后获得的样本有很好的代表性。

对几种分层方法的判断如下:(1)选择性别作为分层变量,是不合适的。

首先,性别这个变量与研究最关心的变量(不同职务,职称的人对分配制度改革的态度)没有很大的相关性;其次,用性别作为分层变量后,层内之间的差异仍然很大,相反,层之间的差异不是很大,因为男性和女性各自内部的职务,职称也存在很大的差别;最后,选择性别作为分层变量后,需要首先得到男性和女性的抽样框,这样会更加麻烦,也会使抽样会变得更加复杂。

(2)按照教师、行政管理人员和职工进行分层,是合适的。

这种分层的指标与抽样调查研究中最关心的变量高度相关,而且按照这种方法分层后,可以看出层内对于分配制度改革的态度差异比较小,因为他们属于相同的阶层,而层之间的态度的差异是比较大的。

这样选取出来的样本具有很好的代表性。

(3)按照职称(正高、副高、中级、初级和其他)分层,也是合理的。

理由与(2)相同,这样进行分层的变量选择与调查最关心的变量是高度相关的,分层后的层满足分层的要求。

所以,按照职称进行分层是合理的。

(4)按照部门进行分层,是合理的。

因为学校有很多院、系或者所,直接进行简单随机抽样,有可能样本不能很好地代表各个院系,最关心的变量与部门也存在一定的相关性。

这样分层后,每个层的总体数目和抽取的样本量都较小,最终的样本的分布比较均匀,比简单随机抽样更加方便实施。

3.2 解:设计的方案如下:第一种方案:可以按照不同的专业进行分层,但是考虑到如果在每层都抽取,不能保证每个新生的入样概率相等,因为每个专业的人数比例未知,8个人的样本量无法在每个层之间进行分配。

所以采取如下方法:对所有的新生按照专业的先后顺序进行编号,使得每个专业的人的编号在一起,然后随机选取出一个号码,然后选取出这个号码所在的专业,选取出这个专业,再在这个专业的所有新生中按照简单随机抽样的方法选取出8个人。

这样就可以保证每个人入选的概率是相等的。

第二种方案:也可以按照性别进行分类,对他们进行编号,为1~800,使得男生的编号都在一起,女生的编号也都在一起,然后随机选取出一个号码,然后看这个号码所对应的性别,然后从这个性别的所有人中按照简单随机抽样的方法选取出8个新生。

这样就可以保证所有的新生的入样概率是相同的。

第三种方案:随机地把所有的人分成8组,而且使得每组的人都是100个人,这样分组完成后,每个组的新生进行编号为1~100,然后随机抽取出一个号码,再从所有的小组中抽取出号码所对应的新生,从而抽取出8个人。

相关文档
最新文档