统计抽样计算题(有计算过程)

合集下载

高中数学统计抽样方法精选题目(附答案)

高中数学统计抽样方法精选题目(附答案)

高中数学统计抽样方法精选题目(附答案)一、抽样方法1.简单随机抽样(1)特征:①一个一个不放回的抽取;②每个个体被抽到可能性相等.(2)常用方法:①抽签法;②随机数表法.2.系统抽样(1)适用环境:当总体中个数较多时,可用系统抽样.(2)操作步骤:将总体平均分成几个部分,再按照一定方法从每个部分抽取一个个体作为样本.3.分层抽样(1)适用范围:当总体由差异明显的几个部分组成时可用分层抽样.(2)操作步骤:将总体中的个体按不同特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样.1.(1)采用系统抽样方法从960人中抽取32人做问卷调查.为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为()A.7B.9C.10 D.15(2)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取________所学校,中学中抽取________所学校.[解析](1)从960人中用系统抽样方法抽取32人,则每30人抽取一人,因为第一组抽到的号码为9,则第二组抽到的号码为39,第n组抽到的号码为a n=9+30(n-1)=30n-21,由451≤30n-21≤750,得23615≤n≤25710,所以n=16,17,…,25,共有25-16+1=10人.(2)小学中抽取30×150150+75+25=18所学校;从中学中抽取30×75150+75+25=9所学校.[答案](1)C(2)189注:1.系统抽样的特点(1)适用于元素个数很多且均衡的总体. (2)各个个体被抽到的机会均等.(3)总体分组后,在起始部分抽样时采用的是简单随机抽样. (4)如果总体容量N 能被样本容量n 整除,则抽样间隔为k =Nn . 2.与分层抽样有关问题的常见类型及解题策略(1)确定抽样比.可依据各层总数与样本数之比,确定抽样比.(2)求某一层的样本数或总体个数.可依据题意求出抽样比,再由某层总体个数(或样本数)确定该层的样本(或总体)数.(3)求各层的样本数.可依据题意,求出各层的抽样比,再求出各层样本数. 2.某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )A .抽签法B .系统抽样法C .分层抽样法D .随机数法解析:选C 根据年级不同产生差异及按人数比例抽取易知应为分层抽样法. 3.某学校高一、高二、高三3个年级共有430名学生,其中高一年级学生160名,高二年级学生180名,为了解学生身体状况,现采用分层抽样方法进行调查,在抽取的样本中高二学生有32人,则该样本中高三学生人数为________.解析:高三年级学生人数为430-160-180=90,设高三年级抽取x 人,由分层抽样可得32180=x90,解得x =16. 答案:164.某单位有职工960人,其中青年职工420人,中年职工300人,老年职工240人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为14人,则样本容量为________.解析:因为分层抽样的抽样比应相等,所以420960=14样本容量,样本容量=960×14420=32.答案:32二、用样本的频率分布估计总体的频率分布1.频率分布直方图2.茎叶图5.(1)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5].样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.(2)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].①求图中a的值;②根据频率分布直方图,估计这100名学生语文成绩的平均分;③若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.分数段[50,60)[60,70)[70,80)[80,90)x∶y 1∶12∶13∶44∶5 [为50×0.18=9.答案:9(2)解:①由频率分布直方图可知(0.04+0.03+0.02+2a)×10=1.所以a=0.005.②该100名学生的语文成绩的平均分约为x=0.05×55+0.4×65+0.3×75+0.2×85+0.05×95=73.③由频率分布直方图及已知的语文成绩、数学成绩分布在各分数段的人数比,可得下表:分数段[50,60)[60,70)[70,80)[80,90)x 5403020x∶y 1∶12∶13∶44∶5y 5204025100-(5+20+40+25)=10.注:与频率分布直方图有关问题的常见类型及解题策略(1)已知频率分布直方图中的部分数据,求其他数据,可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据.(2)已知频率分布直方图,求某种范围内的数据,可利用图形及某范围结合求解.6.如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为()A.0.2 B.0.4C.0.5 D.0.6解析:选B由茎叶图可知数据落在区间[22,30)内的频数为4,所以数据落在区间[22,30)内的频率为410=0.4,故选B.7.为了了解某学校学生的身体发育情况,抽查了该校100名高中男生的体重情况,根据所得数据画出样本的频率分布直方图如图所示.根据此图,估计该校2 000名高中男生中体重大于70.5公斤的人数为()A .300B .360C .420D .450解析:选B 样本中体重大于70.5公斤的频率为: (0.04+0.034+0.016)×2=0.090×2=0.18.故可估计该校2 000名高中男生中体重大于70.5公斤的人数为:2 000×0.18=360(人). 8.某商场在庆元宵节促销活动中,对元宵节9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为________万元.解析:总销售额为2.50.1=25(万元),故11时至12时的销售额为0.4×25=10(万元).答案:10三、用样本的数字特征估计总体的数字特征有关数据的数字特征9.(1)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A .46,45,56B .46,45,53C .47,45,56D .45,47,53(2)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差(3)由正整数组成的一组数据x 1,x 2,x 3,x 4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)[解析] (1)从茎叶图中可以看出样本数据的中位数为中间两个数的平均数,即45+472=46,众数为45,极差为68-12=56,故选择A.(2)由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 对;甲、乙的成绩的极差均为4,D 错.故选C.(3)假设这组数据按从小到大的顺序排列为x 1,x 2,x 3,x 4,则⎩⎨⎧x 1+x 2+x 3+x44=2,x 2+x32=2,∴⎩⎪⎨⎪⎧x 1+x 4=4,x 2+x 3=4, 又s = 14[(x 1-2)2+(x 2-2)2+(x 3-2)2+(x 4-2)2] =12(x 1-2)2+(x 2-2)2+(x 3-2)2+(x 4-2)2=122[(x 1-2)2+(x 2-2)2]=1, ∴(x 1-2)2+(x 2-2)2=2. 同理可求得(x 3-2)2+(x 4-2)2=2.由x 1,x 2,x 3,x 4均为正整数,且(x 1,x 2),(x 3,x 4)均为圆(x -2)2+(y -2)2=2上的点,分析知x 1,x 2,x 3,x 4应为1,1,3,3.[答案] (1)A (2)C (3)1,1,3,3 注:平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.10.为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) A .①③ B .①④ C .②③D .②④解析:选B 法一:∵x 甲=26+28+29+31+315=29,x 乙=28+29+30+31+325=30,∴x 甲<x 乙,又s 2甲=9+1+0+4+45=185,s 2乙=4+1+0+1+45=2,∴s 甲>s 乙.故可判断结论①④正确.法二:甲地该月14时的气温数据分布在26和31之间,且数据波动较大,而乙地该月14时的气温数据分布在28和32之间,且数据波动较小,可以判断结论①④正确,故选B.11.甲和乙两个城市去年上半年每月的平均气温(单位:℃)用茎叶图记录如图所示,根据茎叶图可知,两城市中平均温度较高的城市是__________,气温波动较大的城市是__________.解析:根据题中所给的茎叶图可知,甲城市上半年的平均温度为9+13+17×2+18+226=16,乙城市上半年的平均温度为12+14+17+20+24+276=19,故两城市中平均温度较高的是乙城市,观察茎叶图可知,甲城市的温度更加集中在峰值附近,故乙城市的温度波动较大.答案:乙 乙12.甲、乙两台机床同时加工直径为100 mm 的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位:mm):甲:99,100,98,100,100,103; 乙:99,100,102,99,100,100.(1)分别计算上述两组数据的平均数和方差;(2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求. 解:(1)x 甲=99+100+98+100+100+1036=100(mm),x 乙=99+100+102+99+100+1006=100(mm),s 2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73(mm 2), s 2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1(mm 2).(2)因为s 2甲>s 2乙,说明甲机床加工零件波动比较大,因此乙机床加工零件更符合要求.四、线性回归1.两个变量的线性相关(1)散点图:将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形.(2)正相关与负相关:①正相关:散点图中的点散布在从左下角到右上角的区域. ②负相关:散点图中的点散布在从左上角到右下角的区域. 2.回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)线性回归方程:方程y ^=b ^x +a ^是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的线性回归方程,其中a ,b 是待定参数.⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n(x i-x )2=∑i =1nx i y i-n x y ∑i =1nx 2i-n x 2,a ^=y -b x .13.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)[解] (1)由于x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y =16(90+84+83+80+75+68)=80.所以a ^=y -b ^x =80+20×8.5=250,从而回归直线方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得 L =x (-20x +250)-4(-20x +250) =-20x 2+330x -1 000 =-20(x -8.25)2+361.25.当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润. 注:(1)线性回归分析就是研究两组变量间线性相关关系的一种方法,通过对统计数据的分析,可以预测可能的结果,这就是线性回归方程的基本应用,因此利用最小二乘法求线性回归方程是关键,必须熟练掌握线性回归方程中两个重要估计量的计算.(2)回归直线方程恒过点(x ,y ).14.某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:回归方程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻两个月的概率;(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?解:(1)将6组数据按月份顺序编号为1,2,3,4,5,6,从中任取两组数据,基本事件构成的集合为Ω={(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)}共15个基本事件,设抽到相邻两个月的事件为A ,则A ={(1,2),(2,3),(3,4),(4,5),(5,6)}共5个基本事件,∴P (A )=515=13.(2)由表中数据求得x =11,y =24,∑i =14x i y i =1 092,∑i =14x 2i =498.代入公式可得b ^=187.再由a ^=y -b ^x ,求得a ^=-307,所以y 关于x 的线性回归方程为 y ^=187x -307.(3)当x =10时,y ^=1507,⎪⎪⎪⎪1507-22=47<2; 同样,当x =6时,y ^=787,⎪⎪⎪⎪787-12=67<2. 所以该小组所得线性回归方程是理想的.。

统计学原理计算题及参考答案

统计学原理计算题及参考答案

1、某生产车间30名工人日加工零件数(件)如下: 30 26 42 41 36 44 40 37 37 25 45 29 43 31 36 36 49 3447 33 43 38 42 32 34 38 46 43 39 35 要求:(1)根据以上资料分成如下几组:25—30,30—35,35—40,40—45,45—50,计算各组的频数和频率,编制次数分布表;(2) 根据整理表计算工人平均日产零件数。

(20分)则工人平均劳动生产率为:17.38301145===∑∑fxf x(2)当产量为10000件时,预测单位成本为多少元?(15分)xbx a y n x b n y a x x n y x xy n b c 5.2808010703125.232105.26151441502520250512503210128353)(222-=+==+=⨯+=-=-=-=--=-⨯⨯-⨯=--=∑∑∑∑∑∑∑因为,5.2-=b ,所以产量每增加1000件时,即x 增加1单位时,单位成本的平均变动是:平均减少2.5元 (2)当产量为10000件时,即10=x 时,单位成本为55105.280=⨯-=c y 元>课程的测试,甲班平均成绩为81分,标准差为9.5分;乙班的成绩分组资料如下: 计算乙班学生的平均成绩,并比较甲.乙两班哪个班的平均成绩更有代表性? 解:乙班学生的平均成绩∑∑=fxf x ,所需的计算数据见下表:75554125===∑∑fxf x (比较甲.乙两班哪个班的平均成绩更有代表性,要用变异系数σν的大小比较。

)甲班%65.207549.1549.152405513200)(2======-=∑∑xff x x σνσσ%73.11815.9===xσνσ 从计算结果知道,甲班的变异系数σν小,所以甲班的平均成绩更有代表性。

计算(1)产品产量总指数及由于产量增长而增加的总成本.(2)总成本指数及总成本增减绝对额. 解;(1)产品产量总指数为: %42.1112102342106351120605010060%10550%102100%12000==++=++⨯+⨯+⨯=∑∑qp qkp 由于产量增长而增加的总成本:∑∑=-=-242102340000qp q kp(2)总成本指数为:%62.10721022660501006046120011==++++=∑∑qp qp总成本增减绝对额:∑∑=-=-162102260011qp q p. 解:商品流转次数c=商品销售额a/库存额bba c =商品销售额构成的是时期数列,所以67.23837163276240200==++==∑na a 库存额b 构成的是间隔相等的时点数列,所以33.533160327545552453224321==+++=+++=b b b b b 第二季度平均每月商品流转次数475.433.5367.238===ba c 第二季度商品流转次数3*4.475=13.4251. 2008年某月份甲、乙两市场某商品价格和销售量、销售额资料如下:试分别计算该商品在两个市场上的平均价格. 解:甲市场的平均价格为:04.123270033220027001507001080007350011009007001100137900120700105==++=++⨯+⨯+⨯==∑∑fxf x乙市场的平均价格为74.1172700317900700800120031790013795900120960001051260009590096000126000==++=++++==∑∑xM M x。

初三数学统计抽样方法练习题

初三数学统计抽样方法练习题

初三数学统计抽样方法练习题一、选择题1. 下列哪个不属于概率抽样的方法?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 方便抽样2. 在全年级500名学生中进行调查,为了保证数据的真实性和代表性,最好采用下列哪种抽样方法?A. 方便抽样B. 分层抽样C. 多阶段抽样D. 简单随机抽样3. 为了调查某学校学生的学习习惯,将该校分为文科和理科两个分层,然后分别从两个分层中随机抽取部分学生进行调查,这是采用了哪种抽样方法?A. 分层抽样B. 系统抽样C. 简单随机抽样D. 方便抽样4. 用数字0、1、2等表示某城市居民的收入等级,调查时采用随机数表,将表中的数字与居民住址相对应,这是采用了哪种抽样方法?A. 方便抽样B. 简单随机抽样C. 系统抽样D. 多阶段抽样5. 在某企业中,每隔5个职工抽取一个作为样本,这是属于哪种抽样方法?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 多阶段抽样二、计算题1. 某学校全体学生共1000人,想要进行班级的名字调查,随机抽取了其中10个班级进行调查。

试问,这属于哪种抽样方法?并计算每个班级的抽样概率。

(题目部分参考内容)答:这属于多阶段抽样方法。

每个班级的抽样概率为 1/100。

2. 某市区有100个居民小区,希望了解居民对社区环境的评价,抽取其中5个小区进行调查。

试问,这属于哪种抽样方法?并计算每个小区的抽样概率。

(题目部分参考内容)答:这属于简单随机抽样方法。

每个小区的抽样概率为 1/20。

三、解答题1. 为了调查某中学初三学生的学习时间分配情况,先在全校300名学生中随机抽取了30名学生作为样本,接着从这30名学生中随机抽取了15名男生和15名女生。

请问,这属于哪种抽样方法?并从样本中得到学习时间的数据结果。

(题目部分参考内容)答:这属于两阶段抽样方法,第一阶段为简单随机抽样,第二阶段为分层抽样。

学习时间数据结果应该从这30名学生中随机选择样本进行调查和统计。

统计计算练习

统计计算练习

统计计算练习标志变异指标⼯资更具有代表性。

2.某⼯⼚⽣产⼀批零件共10万件,为了解这批产品的质量,采取不重复抽均合格率、标准差及标准差系数。

3.某车间有两个⼩组,每组都是7名⼯⼈每⼈⽇产零件数如下:第⼀组:20 40 60 70 80 100 120 第⼆组:67 68 69 70 71 72 73试计算两个⼩组每⼈平均⽇产量、全距、平均差、标准差,并⽐较哪⼀组的平均数代表性⼤?性和推⼴价值。

5.根据平均数和标准差的关系。

(1)(1)设%25,600==σV x ,则标准差为多少?(2)(2)设450,202==x x ,则标准差系数为多少?(3)(3)设360,3622==x σ,则平均数为多少?(4)(4)设174%,2.172==x V σ,则平均数为多少?第七章时间数列计算题1.某仓库1⽉1⽇某产品库为1800吨,3⽉1⽇为2000吨,6⽉1⽇为2100吨,6⽉30⽇为1940吨。

问该产品上半年平均库存是多少?4.根据下表中已知资料,运⽤时间数列指标的相互关系,推算发展⽔平、累计增长量、定基发展速度和定基增长速度指标。

年翻两翻,达到28000亿元,则平均发展速度应为多少?如果按年平均增长速度为7.2%计算,到1990年我国⼯农业总产值可达多少亿元?6.已知某地区2000年各⽉⽉初⼈⼝资料如下:1⽉初230万⼈,2⽉初230万⼈,3⽉初240万⼈,4⽉初250万⼈,6⽉初250万⼈,8⽉初260万⼈,12⽉初260万⼈,次年1⽉初260万⼈。

试计算该地区全年平均⼈⼝数。

第⼋章统计指数计算题1.1.某百货公司2000年商品销售额为5600万元,2001年⽐2000年增加500万元,零售价格指数上涨3.6%。

试计算该百货公司零售额变动中由于零售价格和零售量变动的影响程度和影响绝对额。

2.2.某企业⽣产三种产品有关数据如下表所⽰:3.3.下⾯是某家计调查得到的数据,试利⽤可变构成指数体系进⾏因素分析。

《统计学原》课程考题解析(3)

《统计学原》课程考题解析(3)

《统计学原理》课程考题解析(3)典型考题:区间估计1.考题回顾抽样估计是运用数理统计原理,在抽样调查的基础上,利用样本的实际计算样本指标,对全体研究对象的数量特征作出具有一定可靠程度的估计,以达到对现象总体的认识。

由于总体指标是表明总体数量特征的参数,所以也称参数估计。

总体参数估计是教材第5章的内容,同时也是本门课程的重点和难点内容,总体参数估计有点估计和区间估计两种,考核的重点是区间估计。

在历年的考试每次均会围绕这个内容来出题,其题型主要是计算题。

2.考题(1)2005年1月计算第3题:从某年级学生中按简单随机抽样方式抽取50名学生,对会计学课的考试成绩进行检查,得知其平均分数为75.6分,样本标准差10分,试以95.45%的概率保证程度推断全年级学生考试成绩的区间范围。

如果其它条件不变,将允许误差缩小一半,应抽取多少名学生?(2)2005年7月计算第5题(2007年1月计算第2题):某工厂有2000个工人,用简单随机不重复方法抽出100个工人作为样本,计算出平均工资560元,标准差32.45元。

要求:(1)计算抽样平均误差;(2)以95.45%(t=2)的可靠性估计该工人的月平均工资区间。

(3)2006年1月计算第3题:某企业生产一批日光灯管,随机重复抽取400只作使用寿命试验。

测试结果,平均寿命为5000小时,样本标准差为300小时,400只中发现10只不合格。

求平均数的抽样平均误差和成数的抽样平均误差。

(4)2006年7月计算第2题(2007年7月计算第2题):采用简单重复抽样的方法,抽取一批产品中的200件作为样本,其中合格品为188件。

要求:(1)计算样本的抽样平均误差;(2)以95.45%的概率保证程度对该产品的合格品率进行区间估计(t=2)。

3.考题解析总体参数的区间估计是根据给定的概率保证程度的要求,利用实际抽样资料,指出被估计值的上限和下限,即指出总体参数可能存在的区间范围。

医学统计学分析计算题-答案 (1)

医学统计学分析计算题-答案 (1)

第二单元 计量资料的统计推断分析计算题2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4:表4 某年某地健康成年人的红细胞数和血红蛋白含量指 标性 别 例 数 均 数 标准差 标准值* 红细胞数/1012·L -1 男 360 4.66 0.58 4.84女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2女255117.610.2124.7请就上表资料:(1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。

(3) 试估计该地健康成年男、女红细胞数的均数。

(4) 该地健康成年男、女血红蛋白含量有无差别?(5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解:(1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV )比较二者的变异程度。

女性红细胞数的变异系数0.29100%100% 6.94%4.18S CV X =⨯=⨯= 女性血红蛋白含量的变异系数10.2100%100%8.67%117.6S CV X =⨯=⨯=由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。

(2) 抽样误差的大小用标准误X S 来表示,由表4计算各项指标的标准误。

男性红细胞数的标准误0.031X S ===(1210/L ) 男性血红蛋白含量的标准误0.374X S ===(g/L )女性红细胞数的标准误0.018X S ===(1210/L )女性血红蛋白含量的标准误0.639X S ===(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。

样本含量均超过100,可视为大样本。

σ未知,但n 足够大 ,故总体均数的区间估计按(/2/2X X X u S X u S αα-+, )计算。

统计学第五章抽样习题

统计学第五章抽样习题
E、大小是可以控制的
11.用抽样指标估计总体指标应满足的要求是( )
A、一致性 B、准确性 C、客观性
D、无偏性 E、有效性
12.在其他条件不变的情况下,下列关于抽样平均误差、总体变 异程度及样本容量之间关系的陈述,正确的有( )
A、总体变异程度一定时,样本容量越大,抽样平均误差越大
B、总体变异程度一定时,样本容量越大,抽样平均误差越小
B、抽样单位数占总体单位数的比重很大时
C、抽样单位数目很少时
D、抽样单位数目很多时
2020/3/17
7
10、在其他条件不变的情况下,抽样单位数目和抽样误差的关系 是( ) A、抽样单位数目越大,抽样误差越大 B、抽样单位数目越大,抽样误差越小 C、抽样单位数目的变化与抽样误差的数值无关 D、抽样误差变化程度是抽样单位数变动程度的1/2
19、随着样本单位数的无限增大,样本指标和未知的总体
指标之差的绝对值小于任意小的正整数的可能性趋于
必然性,称为抽样估计的( )
A、无偏性
B、一致性
C、有效性
D、 充足性
20、能够事先加以计算和控制的误差是( )
A、抽样误差
B、登记误差
C、标准差
D、标准差系数
2020/3/17
13
21、在一定抽样平均误差的条件下,要提高推断的可靠




10.对于简单随机重复抽样,若其他条件不变,则当误差范围
缩小一半,抽样单位数必须
倍,若误差范围扩大一
倍,则抽样单位数为原来的

11.点估计是直接用
估计不考虑

估计总体指标的推断方法。点 。
2020/3/17
29
14. 抽样法的基本特点是( )

概率与统计的抽样练习题

概率与统计的抽样练习题

概率与统计的抽样练习题1. 在一所高中的600名学生中,有300名男生和300名女生。

从学生总体中,随机选择100名学生。

问以下问题的概率分别是多少?a) 选中的学生中,有60名男生和40名女生;b) 选中的学生中,男生人数少于女生人数;c) 选中的学生中,男生和女生人数相等;d) 选中的学生中,男生和女生人数的差异在10名以内。

2. 某电子设备制造公司生产的电池产品有两个型号:A型和B型。

从批次中抽取10个产品进行质量检查。

已知A型产品占批次的60%,B型产品占40%。

问以下问题的概率分别是多少?a) 抽取的10个产品中,恰好有6个是A型产品;b) 抽取的10个产品中,至少有2个是A型产品;c) 抽取的10个产品中,A型产品比B型产品少2个以上。

3. 某快递公司共有200个包裹,其中有60个损坏的。

从这些包裹中随机选取20个进行检查。

问以下问题的概率分别是多少?a) 抽取的20个包裹中,有3个是损坏的;b) 抽取的20个包裹中,至少有一个是损坏的;c) 抽取的20个包裹中,损坏的包裹占比不超过15%。

4. 某市场调查公司想要估计某种新产品的销售量。

他们在该地区随机选择了160个家庭进行调查。

问以下问题的概率分别是多少?a) 抽取的160个家庭中,有50个家庭购买了该产品;b) 抽取的160个家庭中,至少有10个家庭购买了该产品;c) 抽取的160个家庭中,购买该产品的家庭占比不低于30%。

5. 某银行客户的信用评级情况如下:优秀(10%),良好(30%),合格(40%),差(20%)。

从1000名客户中,随机选择200名进行调查。

问以下问题的概率分别是多少?a) 抽取的200名客户中,有20名优秀客户;b) 抽取的200名客户中,良好客户的人数多于合格客户的人数;c) 抽取的200名客户中,差评级客户的人数在40名以内。

这些抽样练习题可以帮助巩固概率与统计的基本知识,并提供实际应用的情境。

通过计算概率,我们可以更好地理解随机事件的发生规律,为决策提供科学依据。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

抽样计算题:1、某乡水稻总面积20000亩,以不重复抽样方法从中随机抽取400亩实割实测得样本平均亩产645公斤,标准差72.6公斤。

要求极限误差不超过7.2公斤。

试对该乡水稻的亩产量和总产量作出估计。

(1))亩产量的上、下限:(公斤)98.63702.7645=-=∆-x x(公斤)652.0202.7645=+=∆+x x总产量的上下限:(万公斤)96.12752000098.637=⨯(万公斤)1304.0420000652.02=⨯(2)计算该区间下的概率()t F : 抽样平均误差 ()(公斤)3.592000040014006.72122=⎪⎭⎫⎝⎛-=⎪⎭⎫⎝⎛-=N n n x σμ 因为抽样极限误差x x z μ=∆ 96.159.302.7所以≈=∆=μz 可知概率保证程度()t F =95%2.某地有8家银行,从它们所有的全体职工中随机性抽取600人进行调查,得知其中的486人在银行里有个人储蓄存款,存款金额平均每人3400元,标准差500元,试以95.45%的可靠性推断: (1)全体职工中有储蓄存款者所占比率的区间范围;(2)平均每人存款金额的区间范围。

(1)全体职工中有储蓄存款者所占比率的区间范围:%816004861===n n p ()()%23.39%811%811=-⨯=-=p p p σ抽样平均误差 %6.16003923.0===nP p σμ根据给定的概率保证程度()t F ,得到概率度z()%45.95=t F ⇒ 2=z则抽样极限误差%2.3%6.12=⨯==∆p p t μ 估计区间的上、下限%8.77%2.3%81=-=∆-p p%2.84%2.3%81=+=∆+p p(2)平均每人存款金额的区间范围:抽样平均误差()(元)41.0260050022===nx σμ概率度z=2则抽样极限误差 (元)82.4041.202=⨯==∆x x z μ平均每人存款额的上、下限:(元)18.335982.403400=-=∆-x x(元)82.440382.403400=+=∆+x x3..某企业生产某种产品的工人有1000人,采用不重复抽样从中随机抽取100人调查当日产量,得到他们的人均日产量为126件,标准差为6.47件,要求在95﹪的概率保证程度下,估计该厂全部工人的日平均产量和日总产量。

(F (t )=95%,t=1.96)抽样平均误差 ()(件)61.010*********47.6122=⎪⎪⎭⎫⎝⎛-=⎪⎪⎭⎫ ⎝⎛-=N n nx σμ 概率度z 或t=1.96则抽样极限误差 (件)20.161.096.1=⨯==∆x x z μ全部工人的日平均产量的上、下限:件)2.1278.124()2.1126(-=±=∆±x x日总产量的上、下限:(件)124800)2.1126(1000)(N =-=∆-x x(件)127200)2.1126(1000)N(=+=∆+x x4.某高校由5000名学生,随机抽取250名调查每周看电视的时间,分组资料如下:要求:按不重复抽样的方法,在95.45%的概率下,估计全部学生每周平均看电视时间的可能范围。

(计算结果保留2位小数)()()()()小时26.5~74.4x X 小时)(26.013.02z 13.0500025012504.544N n 1n 小时)(544.4f f x x s 小时)(52501250f xf x x x x 2x 222=∆±==⨯==∆=⎪⎪⎭⎫ ⎝⎛-=⎪⎪⎭⎫ ⎝⎛-===-====∑∑∑∑μσμσσx5.对某鱼塘的鱼进行抽样调查,从鱼塘的不同部位同时撒网,捕到鱼200条,其中草鱼180条。

试按99.73%的概率保证程度:对该鱼塘草鱼所占比重作区间估计。

草鱼比重(成数):%902001801===n n p ()()%30%9.01%9.01=-⨯=-=p p p σ 抽样平均误差 %12.22003.0===nP p σμ()%73.99=t F ⇒ 3=z则抽样极限误差%36.6%12.23=⨯==∆p p z μ 该鱼塘草鱼所占比重作估计区间的上、下限%64.83%36.6%90=-=∆-p p%36.96%36.6%90=+=∆+p p6.对某鱼塘的鱼进行抽样调查,从鱼塘的不同部位同时撒网捕到鱼150条,其中草鱼123条,草鱼平均每条重2千克,标准差0.75千克,试以99.73%的保证程度:(1)对该鱼塘草鱼平均每条重量做区间估计(2)对该鱼塘草鱼所占比重做区间估计第一问:第二问:30.06660.2029(千克)xx z μ∆==⨯=0.0676(千克)x μ===()0.75(千克),3s z σ==2(千克)x =()()20.2029 1.797~2.20(3千克)x X x =±∆=±=()()()12P P n 1230.82n 150p 1-p 0.820.180.14760.03143*0.03140.09410.820.094172.59%~91.41%p P z P p σμμ=====⨯====∆====±∆=±=7.某电子产品使用寿命在1000小时以上为合格品,现在用简单随机重复抽样方法,从10000个产品中抽取100个对其使用寿命进行测试。

其结果如下:根据以上资料,以68.27%的概率(t=1)保证程度,对该产品的合格率进行区间估计。

合格率(成数):%95100951===n n p ()()%79.21%95.01%95.01=-⨯=-=p p p σ 抽样平均误差 %2.21002179.0===nP p σμ则抽样极限误差%2.2%2.21=⨯==∆p p t μ该产品合格率的区间:%2.97_%8.92%2.2%95=±=∆±p p8.某校进行一项英语测验,为了解学生的考试情况,随机抽选部分学生进行调查,所得资料如下:试以95.45%的可靠性估计该校学生英语考试的平均成绩的范围。

(假定采用重复抽样)(计算结果保留2位小数)()()()()()分88.78-74.332.27676.6x X 分)(276.2138.12z (分)138.1100129.44n 分)(44.129f f x x s 分)(6.76100/7660fxf x x xx 2x 222=±=∆±==⨯==∆=====-====∑∑∑∑μσμσσx9.随机抽取某市400户家庭作为样本,调查结果是:80户家庭有一台及一台以上机动车。

试确定以99.73%(t=3)的概率保证估计该市有一台及一台以上机动车的家庭的比率区间。

样本成数:%20400801===n n p ()()%40%201%201=-⨯=-=p p p σ 抽样平均误差 %0.24004.0===nP p σμ则抽样极限误差%0.6%0.23=⨯==∆p p t μ该市有一台及一台以上机动车的家庭的比率区间:%26_%14%6%20=±=∆±p p10.一企业研制了某种新型电子集成电路,根据设计的生产工艺试生产了100片 该集成电路泡,通过寿命测试试验得知这100片该集成电路的平均使用寿命为60000个小时,标准差为500个小时,要求以95.45%的概率保证程度(t=2)估计该集成电路平均使用寿命的区间范围。

()()()()小时00506-599500500006x X 小时100502z (小时)50100500n 小时500s 小时,60000x x x x22x =±=∆±==⨯==∆======μσμσσx11.某食品厂要检验本月生产的10000袋某产品的重量,根据上月资料,这种产品每袋重量的标准差为25克。

要求在95.45﹪的概率保证程度下,平均每袋重量的误差范围不超过5克,应抽查多少袋产品?说明:如果题目中无特别要求,使用重复抽样即可。

袋)(1005252222222=⨯=∆=σz n12.某市场调研公司想估计某地区有彩电的家庭所占比例50%,该公司希望估计误差不超过0.05,若置信度(概率)为95%,该公司应抽取多大样本?户)(38516.38405.05.05.01.96p)-p(1t =n 2222==⨯⨯=∆试按不重复抽样方法,以95%的把握程度估计(1)该企业全部职工平 均文化程度;(2)估计受教育程度在10年以上的职工的比重。

(1)该企业全部职工平均文化程度()()()()()年99.7-7.5124.075.7x X 年)(24.012.096.1z (年)12.0)30002001(2001.78)-1(n 年)(78.1f f x x s 年)(75.7f x x x x22x 2=±=∆±==⨯==∆=-====-===∑∑∑∑μσμσσNn f x x(2)样本成数:%22200441===n n p ()()%42.41%221%221=-⨯=-=p p p σ抽样平均误差 %8.230020012004142.0122=⎪⎪⎭⎫ ⎝⎛-=⎪⎪⎭⎫ ⎝⎛-=N n nP p σμ 则抽样极限误差%54.5%8.296.1=⨯==∆p p z μ受教育程度在10年以上的职工的比重区间:%54.27_%46.16%54.5%22)(=±=∆±=p p P。

相关文档
最新文档