抽样技术 第三版 第二章课后部分答案 R语言

合集下载

抽样技术课后习题_参考答案_金勇进

抽样技术课后习题_参考答案_金勇进

第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。

(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。

然后用r+19999作为被抽选的数。

解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。

第二,每个单元被抽中的概率是已知的,或者是可以计算的。

第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。

因此(1)中只有1~64是可能被抽中的,故不是等概的。

(2)不是等概的【原因】(3)是等概的。

2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。

如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。

随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。

解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。

抽样技术:第2章课后答案

抽样技术:第2章课后答案

第2章2.1 M: (I)这种抽样方法是等機率的・在毎次抽取川本敢尤时.冊未被抽中的编号为1〜64的这兰单元中毎一个m兀被抽刮的槪率都足亠.100(2)这种抽杆方法不艮等嵐略的.利用这种方法.任每次抽収样本恥尤时.尚未被抽中的編号为1-35 U及编号为64的这36个嘏元中毎个敏元的入—.而尚木被捕中的编号为36~63的毎100个唯元的入样執丰祁足丄•100(3)这艸抽样方法是零怨率的.在邰次抽取样木单元时.尚未被抽中的编号为20 000〜21 000中的毎个服元的入样駅率都是詁亦・所以这种抽祥是等槪率的・2.2 W:2.3解:许先(Ail i^iUKKH用电凰的95%的KWK何.根撫中心极RI定理可知.在大样本的条件卜.[升和讣卩药]=[升1・96 皿灯+ 1・96风可•向叫亍)=上上$2中总体的方差S ,是未知的.用样本方差 /来代fh ?¥(SkM 为由聽盘知道.y = 9.5,52= 206 •而且样木址为“ = 300,N = 50 000・代入对以求刁严6)= 乎/二上驾铲°°°x206 = 0.682 5 •将它幻代入上面的式「町能该山居民日用电虽的95%置信区何为[7.880 8,11.119 2].下一步汁舒样木址.绝対谋船Bid和郴対的关系为d = Fp ・ 根区何的求解方注町卸把y = 9.5,s 2= 206.r = 10%,AT = 50 000 代入上式町阳.H = 861.75 ^862 .所以杆木 18至少为2.4 解:总体中套加培训班的比例为P.强么这次简眾閤机抽样紂到的P 的估计ffip 的方溢 1-f N “、 n-PP(l-P)・利用中心极国迷理可得+—在人杆木的条件F 近似眼从标准正念分布.V 的l-a=95%的B!怙区何为v-r> 1 —a根据正念分布的分位数町以知适P庄和g中.样木盘足够大.从m何typ的1-0=95%的置伉区何为]卩・讣卩莎P+Z^JF⑹卜丽这眼的叫P)是未妹的.我们便用它的估计(ftr(p)=v(p)=^p(l-p)=9.652xl0-\所以总体比例P的l-a = 95%的置仃区何可以写为["-二呻庶门“ +兀喘応孑}将p = O.35^ = 2OO.y = IOOOO代入町得K信区何为〔0.284 4.0.4156].2.5解:利用衍到的样木.计ma样本均值为歹=2 890/20 = 144.5.从ifiH占计小区的平均文化支出为144.5 7U.总体均(ftV的l-a = 95%的迓仃区何为卩-二皿灰冰歹匕曲丁^药]用二乎,来估计样本均值的方筮卩@)・计算斜到F =826.025 6,则卩(刃=匕上T =匕巴丄只826・025 6 = 37」72 •n20£/:丿卩(刃=1 %xj37.172 71.95 •代入数W可紂总体肉值的95%的置佰区何为[132.55J 56.45].2.6M:根据样木位息估计对衍毎个乡的平均产诫为1120吨.该地区今年的粮伐总产虽丫的佔计值为X = 350> = 350xl 120 =3.92xl05(吨)•)S2.总体总(ft 的I・a = 95%的盘伉区何为总体总(ft估计值的方差为rM= W•把y = 3.92X10\S2 = 25 600,n = 50,^ = 350,= 1.96代入.可須粮伏总产虽的l-a=95%的置信区何为[377 629.406 371]./ = ^.za/:解:泞先计外简腋皈机抽样条什下所需耍的祥本虽・把N = l 000,d = 2」-a = 95%S'=68 帯入公式%如果彩电到仃效河猝率的问題・亦仃效冋??率为70%时・样本虽应该加终确定为/70% = 88.57 *89./i = no2.8 M:去年的化肥总产虽和今邻的总产量Z何存在较強的WXfte iliifl这种相关关系较为楼定.所以引入去年的化肥产址作为辅助变虽・「•建我的采用比申估计址的形式*估计今年的化肥总产虽•去年化肥总广虽为X = 2I35・利用£年的化肥总严虽・今年的化肥总产虽的估计(ft为y/?X=^X = 2 426.14< =■X2.9駢:木JS中.简險估计址的方羞的估计(ft为v(y)=^L S2 =37.17.n利用比率估itfit进行估计时.我们引入了家庭的总支出作为辅助变fit.记为X・文化支出届F总支岀的一部分.这个上箜变st与辅助变st之何存在较強的相关关系.面11它m之何的关系是比较住定的.11全部家庭的总支出是已知的虽・文化支出的比率估计就为y^RX^X.通过if■算彻到y = 2 890/20 = 144.5・ifijx = l 580.則' V 144 5 ・/? = 1 = 2_£O,O915.文化支岀的比率佔计址的值为儿= 146.3 (元人=•I现在考Jg比率佔计fit的方差.在样木足牧大的条件几卩(耳片MSE(耳片乎(S j2RpS・S,+用S:)・通过计件吋以得到两个变fit的样本方羞为A?=826,.<=9.958xl0\『和X之何的相关系数的佔计值为p = 0.974.代入上面的公式.可U得到比半估计虽的方差的佔计備为v耳=1.94・这个数值比简的方羌佔计值耍小很个部家庭的平均文化支出的l-a = 95%的盘估X何为[斤・%应订•齐+ %応「卜“96^面•齐+1 %応J]・把具体的敌值代入可得置仃区何为[143.57.149.03].y[yA彳元)接下来比较比佔汁和简腋佔计的效札亠亠2 = :^ = 0・052・这是比佔计的设计效应v(y)呛)37.17值,从这里可以看岀比佔计駅比简乐佔计虽的效率史高.2.10 利用简爪佔计址町紂戸=》比/” = 1 630/10二163・样本方澄为? =212.222, AT = 120・样本均值的方左佔计值为v(y)=52 = ^1^120 x212.222 = 19.453 7.利用回贮估计的方注.在这里选取肉牛的KiRfi为辅助变址.迭擇原電虽为緬助矢St是合理的.因为肉牛的很大程皮上彩响荷肉牛的现任的車虽・二折Z何“庄牧冬的相关性.郴关系数的估计血为2 = 0.971 •临II 这种相关关瑕是稳定的.这觇肉牛的原載虽的8(值已经衍到.所以选好肉牛的廉載ft为辅助妞.* * |4 CAQ何粉估计SMM度加高的冋•垠敌“的伕计ffi为/7 = p—= 0.971x^^- = 1.368.现在何以衍到$. 10.341肉牛fltiF.fi 的回归佔计fit 为无=戸+ 0 X^x .代入数值町以月到畀=159.44.囚为恋在肉牛股秋fit 这个牧好的辅助变足,所以冋$1佔计虽的箱度耍好「简冋归估计fit 入的方差为打兀)=MSE (人方差的佔计位为仏卜•代入柿应的敷值・单估计就・。

抽样技术课后习题参考答案金勇进

抽样技术课后习题参考答案金勇进

抽样技术课后习题参考答案金勇进YUKI was compiled on the morning of December 16, 2020第二章习题判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。

(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。

然后用r+19999作为被抽选的数。

解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。

第二,每个单元被抽中的概率是已知的,或者是可以计算的。

第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。

因此(1)中只有1~64是可能被抽中的,故不是等概的。

(2)不是等概的【原因】(3)是等概的。

抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?解析:抽样理论和数理统计中关于样本均值的定义和性质的不同为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y (千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。

如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±*]即为(,) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为862某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。

随机抽取了两百名学生进行调查,得到P=,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。

抽样技术课后习题_参考答案_金勇进

抽样技术课后习题_参考答案_金勇进

第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。

(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。

然后用r+19999作为被抽选的数。

解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。

第二,每个单元被抽中的概率是已知的,或者是可以计算的。

第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。

因此(1)中只有1~64是可能被抽中的,故不是等概的。

(2)不是等概的【原因】(3)是等概的。

2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。

如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。

随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。

解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。

抽样技术课后习题_参考答案_金勇进

抽样技术课后习题_参考答案_金勇进

第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。

(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。

然后用r+19999作为被抽选的数。

解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。

第二,每个单元被抽中的概率是已知的,或者是可以计算的。

第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。

因此(1)中只有1~64是可能被抽中的,故不是等概的。

(2)不是等概的【原因】(3)是等概的。

2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。

如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。

随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。

解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。

抽样技术第三版第2、3章习题答案

抽样技术第三版第2、3章习题答案

第2章2.1 解:()1 这种抽样方法是等概率的。

在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是1100。

()2这种抽样方法不是等概率的。

利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2100,而尚未被抽中的编号为36~63的每个单元的入样概率都是1100。

()3这种抽样方法是等概率的。

在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是11000,所以这种抽样是等概率的。

2.3 解:首先估计该市居民日用电量的95%的置信区间。

根据中心极限定理可知,在大_y E y y -=近似服从标准正态分布, _Y 的195%α-=的置信区间为y z y z y y αα⎡⎡-+=-+⎣⎣。

而()21f V y S n-=中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间为,y y ⎡⎤-+⎢⎥⎣⎦。

由题意知道,_29.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得 _21130050000()2060.6825300f v y s n --==⨯=。

将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。

下一步计算样本量。

绝对误差限d 和相对误差限r 的关系为_d rY =。

根据置信区间的求解方法可知____11P y Y r Y P αα⎫⎪⎧⎫-≤≥-⇒≤≥-⎨⎬⎩⎭根据正态分布的分位数可以知道1P Z αα⎫⎪⎪≤≥-⎬⎪⎪⎭,所以()2_2r Y V y z α⎛⎫⎪= ⎪⎝⎭。

也就是2_2_222/221111r Y r Y S n N z S n N z αα⎡⎤⎛⎫⎢⎥⎛⎫⎪⎛⎫⎝⎭⎪⎢⎥-=⇒=+ ⎪ ⎪⎢⎥⎝⎭⎝⎭⎢⎥⎣⎦。

把_29.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。

抽样技术课后习题_参考答案_金勇进

抽样技术课后习题_参考答案_金勇进

第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。

(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。

然后用r+19999作为被抽选的数。

解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。

第二,每个单元被抽中的概率是已知的,或者是可以计算的。

第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。

因此(1)中只有1~64是可能被抽中的,故不是等概的。

(2)不是等概的【原因】(3)是等概的。

2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。

如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。

随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。

解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。

应用抽样技术第三版课后习题答案

应用抽样技术第三版课后习题答案

应用抽样技术第三版课后习题答案应用抽样技术第三版课后习题答案抽样技术是统计学中重要的一部分,它用于从总体中选择一部分样本,以便对总体进行推断。

在应用抽样技术的过程中,我们常常会遇到一些难题和疑惑。

为了帮助读者更好地理解和应用抽样技术,本文将为大家提供《应用抽样技术第三版》课后习题的详细解答。

第一章:抽样方法的基本概念1. 抽样方法的基本概念抽样方法是指从总体中选取一部分样本,以代表整个总体。

常用的抽样方法包括简单随机抽样、分层抽样、整群抽样等。

在选择抽样方法时,需要根据具体问题和研究目的来确定最适合的方法。

2. 简单随机抽样简单随机抽样是指从总体中随机选择样本,使每个样本都有相等的机会被选中。

这种抽样方法适用于总体规模较小且分布均匀的情况。

3. 分层抽样分层抽样是将总体划分为若干个层次,然后从每个层次中随机选择样本。

这种抽样方法适用于总体具有明显层次结构的情况,可以提高样本的代表性。

4. 整群抽样整群抽样是将总体划分为若干个群组,然后从每个群组中随机选择样本。

这种抽样方法适用于总体群组之间差异较大的情况,可以减少抽样误差。

第二章:简单随机抽样1. 简单随机抽样的步骤简单随机抽样的步骤包括确定总体、确定样本容量、编制总体名单、进行随机抽样和分析样本数据。

在确定样本容量时,需要考虑总体的大小、抽样误差和置信水平等因素。

2. 简单随机抽样的应用简单随机抽样广泛应用于各个领域的调查和研究中。

例如,在市场调查中,可以使用简单随机抽样来获取消费者的意见和反馈;在医学研究中,可以使用简单随机抽样来选择研究对象。

第三章:分层抽样1. 分层抽样的步骤分层抽样的步骤包括确定总体、划分层次、确定每层样本容量、进行随机抽样和分析样本数据。

在确定每层样本容量时,需要根据每个层次的重要性和变异程度来确定。

2. 分层抽样的应用分层抽样适用于总体具有明显层次结构的情况。

例如,在教育调查中,可以将学校划分为不同的层次,然后从每个层次中随机选择样本;在人口统计调查中,可以将人口按照年龄、性别等因素划分为不同的层次,然后进行抽样。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

抽样技术作业一(2.5——2.10)袁闪闪2120502119 2.5解:这里N=200,n=20,由表中的数据可得:201122111144.5201(826.052616.097ni ii iniiy y yns y yn=======-=-==∑∑∑因而该小区平均的文化支出Y的95%的近似置信区间为:[[144.5 1.96 6.097][132.5503,156.4497]y z y zαα-+=±⨯=所以该小区平均的文化支出Y的估计为144.5元,其95%的置信区间为(132.55元,156.45元)。

2.6解:有题意可得:N=350,n=50,y=1120,2s=25600,所以粮食总产量为:3501120392000()Y N y∧==⨯=元代入数据得:/2/2[[392000 1.967332.12][377629,406371]y z N y z Nαα-+=±⨯=所以总产值的95%的置信区间为:(377629吨,406371吨)。

2.7解:由题意可得:N=1000,d=2,α=0.05,2S=68,r=70%,带入公式,可得初始样本量:222/2022222/2/21161.362Nz SdnN z S Nd z Sααα⎛⎫=+==≈⎪+⎝⎭由于有效回答率为r=70%,,对样本容量进行再调整:70%87.5788nn nr===≈所以样本最终确定为88。

2.8解:由题意已知:N =100,n =10,X =2135,y =25,x =22,方法一:简单随机估计:100252500()Y N y ∧==⨯=吨方法二:比估计:由经验可知去年的化肥总产量和今年的总产量之间存在较强的相关性,引入去年的化肥总产量作为辅助变量。

于是我们采用比率估计量的形式来估计今年的化肥总产量。

总产量的估计值为:_^^_2426.14R yY R X X x ===(吨)2.9解:这里N =200,n =20。

由2.5可得简单估计量的均值和标准差估计:201122111144.5201(826.05261 6.097n i i i i n i i y y y n s y y n =======-=-==∑∑∑引入了家庭的总支出(X )作为辅助变量,进行比率估计。

由于文化支出属于总支出的一部分,主要变量与辅助变量之间存在较强的相关关系,而且它们之间的关系是比较稳定的。

由题意可得:全部家庭的总支出的平均:=1600X 样本家庭总支出的平均为:201111158020n i i i i x x x n =====∑∑文化支出的比率估计量为:_____^_146.33R yy R X X x ===在样本量较大的条件:()()()22212R R x x f V y MSE y S R S S R S n ρ-≈≈-⋅+,由计算可得两个变量的样本方差为:2212211(826.052611(99378.951n i i n x i i s y y n s x x n ===-=-=-=-∑∑Y X和之间的相关系数的估计值:^0.974ρ=,代入比率估计量的方差的估计公式,可得:1.40≈≈这个数值比简单估计量的标准差估计值要小很多。

所以全部家庭的平均文化支出的195%α-=的置信区间为__[[146.33 1.96 1.40][143.59,149.07] R Ry z y zαα-+=±⨯=。

0.229≈=,可以看出比估计量比简单估计量的效率更高。

2.10解:这里N=120,n=10。

由表中数据可得简单估计量的均值和标准差估计:1011221211163101(212.2211(-19.4537ni ii iniiy y yns y ynnv y sn N=======-=-=⨯=∑∑∑(1因为肉牛的原重量在很大程度上影响着肉牛的现在的重量,二者之间存在较强的相关性,而且这种相关关系是稳定的,所以利用回归估计的方法,对牛肉现在的重量进行估计。

由题意可得:肉牛的原重量的平均数值为:=100X样本肉牛的原质量平均估计为:101111102.610ni ii ix x xn=====∑∑两个随机变量相关系数的估计值为:^0.971ρ=,样本肉牛的原质量方差估计为:2211()106.9331nx iis x xn==-=-∑回归估计量精度最高的回归系数β的估计值为:^^14.5680.971 1.36810.341xssβρ==⨯=到肉牛现重量的回归估计量为:___^159.44lry y X xβ⎛⎫=+-=⎪⎝⎭。

回归估计量_lr y 的方差估计为:2_^211 1.097lr f v y s n ρ⎛⎫-⎛⎫=-= ⎪ ⎪⎝⎭⎝⎭。

比较回归估计和简单估计的效率,()()__0.056R R V y v y V y v y ⎛⎫⎛⎫ ⎪ ⎪⎝⎭⎝⎭≈=。

因为在本题中,存在肉牛原重量这个较好的辅助变量,所以不难理解回归估计量的精度要好于简单估计量,即回归估计量比简单估计量的效率更高。

Code:#######抽样技术作业第二章2.5library(survey)income<-read.delim("income2.5.txt")#读入数据N<-200n<-20mean<-mean(income[,1]);mean #求均值s<-var(income);s #求样本方差c<-sqrt(s*(1-n/N)/n);c #求估计量的方差估计d<-qnorm(1-0.025);d1<-mean-c*d;d1d2<-mean+c*d;d2#做置信区间#######抽样技术作业第二章2.6N<-350n<-50s<-25600c<-N*sqrt(s*(1-n/N)/n);c d<-qnorm(1-0.025);d1<-392000-c*d;d1d2<-392000+c*d;d2#######抽样技术作业第二章2.7N<-1000d<-2s<-68r<-0.7z<-qnorm(1-0.025);n1<-(N*z^2*s)/(N*d^2+z^2*s);n1#求样本量n<-n1/r;n #######抽样技术作业第二章2.8y<-25x<-22X<-2135Y<-X*y/x;Y #######抽样技术作业第二章2.9income<-read.delim("income2.5.txt");incomeincome1<-read.delim("income2.9.txt");income1N<-200n<-20mean_X<-1600mean_y<-mean(income[,1]);mean_ymean_x<-mean(income1[,1]);mean_xR<-mean_y/mean_x;R#求比率估计mean_yr<-R*mean_X;mean_yr#利用比估计估计均值s_y<-var(income);s_ys_x<-var(income1);s_xp<-cor(income,income1);p#求相关系数f<-(1-n/N)/n;c_yr<-sqrt(f*(s_y-2*R*p*sqrt(s_y)*sqrt(s_x)+R^2*s_x));c_yr#求比估计的方差估计c_y<-sqrt(s_y*(1-n/N)/n);ct<-c_yr/c_y;td<-qnorm(1-0.025);d1<-mean_yr-c*d;d1d2<-mean_yr+c*d;d2#做置信区间#######抽样技术作业第二章2.10回归估计weight1<-read.delim("weight2.10.txt");weight1weight2<-read.delim("weight2.11.txt");weight2N<-120n<-10X<-100mean_y<-mean(weight2);mean_ymean_x<-mean(weight1);mean_xs_y<-var(weight2);s_ys_x<-var(weight1);s_xp<-cor(weight1,weight2);pb<-p*sqrt(s_y/s_x);b#求回归系数估计mean_ylr<-mean_y+b*(X-mean_x);mean_ylr#求回归估计量fn<-(1-n/N)/n;v_y<-s_y*fn;v_yv_ylr<-fn*s_y*(1-p^2);v_ylrt<-v_ylr/v_y;t#比较回归估计和简单估计的效率。

相关文档
最新文档