样本与总体练习题及答案
应用统计学练习题(含答案)

应用统计学练习题第一章绪论一、填空题1.统计工作与统计学的关系是__统计实践____和___统计理论__的关系。
2.总体是由许多具有_共同性质_的个别事物组成的整体;总体单位是__总体_的组成单位。
3.统计单体具有3个基本特征,即__同质性_、__变异性_、和__大量性__。
4.要了解一个企业的产品质量情况,总体是_企业全部产品__,个体是__每一件产品__。
5.样本是从__总体__中抽出来的,作为代表_这一总体_的部分单位组成的集合体。
6.标志是说明单体单位特征的名称,按表现形式不同分为__数量标志_和_品质标志_两种。
7.8.统计指标按其数值表现形式不同可分为__总量指标__、__相对指标_和__平均指标__。
9.指标与标志的主要区别在于:10.(1)指标是说明__总体__特征的,而标志则是说明__总体单位__特征的。
11.(2)标志有不能用__数量__表示的_品质标志_与能用_数量_表示的_数量标志_,而指标都是能用_数量_表示的。
12.一个完整的统计工作过程可以划分为_统计设计_、_统计调查_、_统计整理_和__统计分析__4个阶段。
二、单项选择题1.统计总体的同质性是指(A)。
A.总体各单位具有某一共同的品质标志或数量标志B.总体各单位具有某一共同的品质标志属性或数量标志值C.总体各单位具有若干互不相同的品质标志或数量标志D.总体各单位具有若干互不相同的品质标志属性或数量标志值2.设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体是( D)。
A.全部工业企业B.800家工业企业C.每一件产品D.800家工业企业的全部工业产品3.有200家公司每位职工的工资资料,如果要调查这200家公司的工资水平情况,则统计总体为(A)。
A.200家公司的全部职工B.200家公司C.200家公司职工的全部工资D.200家公司每个职工的工资4.一个统计总体( D)。
A.只能有一个标志B.可以有多个标志C.只能有一个指标D.可以有多个指标5.以产品等级来反映某种产品的质量,则该产品等级是(C)。
高中数学必修二 9 2 用样本估计总体(精讲)(含答案)

9.2 用样本估计总体(精讲)考法一总体取值规律的估计【例1】(2021·全国高一课时练习)某市2020年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,(1)完成频率分布表;(2)作出频率分布直方图;(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,空间质量为良;在101~150之间时,空间质量为轻微污染;在151~200之间时,空间质量为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.【答案】(1)频率分布表见解析;(2)频率分布直方图见解析;(3)该市空气质量有待进一步改善.【解析】(1)频率分布表(2)频率分布直方图(3)答对下述两条中的一条即可:①该市一个月中空气污染指数有2天处于优的水平,占当月天数的1 15;有26天处于良的水平,占当月天数的13 15;处于优或良的天数共有28天,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115.污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的1730,超过50%.说明该市空气质量有待进一步改善.【一隅三反】1.(2020·全国高一单元测试)某市为提倡节约用水,准备实行自来水“阶梯计费”方式,用户用水不超出基本用水量的部分享受基本价格,超出基本用水量的部分实行超价收费,为更好地决策,自来水公司随机抽取了部分用户的用水量数据,并绘制了如图不完整的统计图(每组数据包括右端点但不包括左端点),请你根据统计图解答下列问题:用户用水量频数直方图用户用水量扇形统计图(1)此次抽样调查的样本容量是________;(2)补全频数分布直方图,求扇形图中“15吨~20吨”部分的圆心角的度数;(3)如果自来水公司将基本用水量定为每户25吨,那么该地区6万用户中约有多少用户的用水全部享受基本价格.【答案】(1)答案见解析;(2)答案见解析,79.2°;(3)4.08万户.【解析】(1)1010%100÷=;(2)用水15~20吨的户数为100-10-36-24-8=22(户),“15~20吨”部分的圆心角的度数为22 36079.2100︒⨯=︒(3)1022366 4.08100++⨯=(万户)所以该地区6万用户中约有4.08万户的用水全部享受基本价格.2.(2020·全国高一单元测试)对某校高一年级学生参加社区服务次数进行统计,随机抽取M名学生作为样本,得到这M名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:(1)求出表中M,p及图中a的值;(2)若该校高一学生有360人,试估计该校高一学生参加社区服务的次数在区间[10,15)内的人数. 【答案】(1)M =40,0.075p =,0.125a =;(2)90人. 【解析】(1)由[10,15)内的频数是10,频率是0.25知,100.25M=,所以M =40. 因为频数之和为40,所以10+25+m +2=40,m =3.330.07540p M ===. 因为a 是对应分组[15,20)的频率与组距的商,所以250.125405a ==⨯. (2)因为该校高一学生有360人,分组[10,15)内的频率是0.25,所以估计该校高一学生参加社区服务的次数在此区间内的人数为3600.25⨯=90人.3.(2021·北京丰台区)为了解某市家庭用电量的情况,该市统计局调查了100户居民去年一年的月均用电量,发现他们的用电量都在50kW ·h 至350kW ·h 之间,进行适当分组后,画出频率分布直方图如图所示.(I )求a 的值;(Ⅱ)求被调查用户中,用电量大于250kW ·h 的户数;(III )为了既满足居民的基本用电需求,又提高能源的利用效率,市政府计划采用阶梯定价,希望使80%的居民缴费在第一档(费用最低),请给出第一档用电标准(单位:kW ·h )的建议,并简要说明理由. 【答案】(I )0.006;(Ⅱ)18;(III )245.5 kW ·h.【解析】(1)因为()0.00240.00360.00440.00240.0012501a +++++⨯=,所以0.006a =; (2)根据频率分布直方图可知:“用电量大于250kW ·h ”的频率为()0.00240.0012500.18+⨯=, 所以用电量大于250kW ·h 的户数为:1000.1818⨯=, 故用电量大于250kW ·h 有18户;(3)因为前三组的频率和为:()0.00240.00360.006500.60.8++⨯=<,前四组的频率之和为()0.00240.00360.0060.0044500.820.8+++⨯=>, 所以频率为0.8时对应的数据在第四组, 所以第一档用电标准为:0.80.620050245.50.22-+⨯≈kW ·h.故第一档用电标准为245.5 kW ·h.4.(2021·陕西咸阳市)某微商对某种产品每天的销售量(单位:件)进行为期一个月(按30天计算)的数据统计分析,并得出了这种产品该月销售量的频率分布直方图(如图).假设用直方图中所得的频率来估计相应事件发生的概率.(Ⅰ)求频率分布直方图中a 的值;(Ⅱ)若微商在一天的销售量不低于25件,则上级商企会给微商赠送100元的礼金,估计该微商在一年内获得的礼金数.【答案】(Ⅰ)0.02;(Ⅱ)10800元. 【解析】(Ⅰ)由题意可得1[1(0.010.060.070.04)5]0.025a =-+++⨯=. (Ⅱ)根据频率分布直方图知,日销售量不低于25件的天数为: ()0.040.025309+⨯⨯=(天), 一个月可获得的礼金数为9100900⨯=(元),依此可以估计该微商一年内获得的礼金数为9001210800⨯=元. 【点睛】本题考查频率的求法,考查频率分布直方图的性质等基础知识,考查样本估计总体以及运算求解能力、数形结合思想的应用,是基础题.考法二 总体百分数的估计【例2】(2020·天津和平区)已知一组数据为4,5,67,8,8,,第40百分位数是( ) A .8 B .7C .6D .5【答案】C【解析】因为有6位数,所以640 2.4⨯=%,所以第40百分位数是第三个数6.故选:C 【一隅三反】1.(2020·山东菏泽市·高一期末)数据1,2,3,4,5,6的60%分位数为( ) A .3 B .3.5C .3.6D .4【答案】D【解析】由6⨯60%=3.6,所以数据1,2,3,4,5,6的60%分位数是第四个数,故选:D2.(2021·山东高一期末)已知从某中学高一年级随机抽取20名女生,测量她们的身高(单位:cm ),把这20名同学的身高数据从小到大排序:148.0 149.0 150.0 152.0 154.0 154.0 155.0 155.5 157.0 157.0 158.0 159.0 161.0 162.0 163.0 164.0 165.0 170.0 171.0 172.0 则这组数据的第75百分位数是( ) A .163.0 B .164.0C .163.5D .164.5【答案】A【解析】因为这组数据从小到大已排序,所以这组数据的第75百分位数为第200.7515⨯=个数,即为163.0故选:A3.(2020·山东滨州市·高一期末)“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[]0,10内的一个数来表示,该数越接近10表示满意程度越高,现随机抽取6位小区居号,他们的幸福感指数分别为5,6,7,8,9,5,则这组数据的第80百分位数是( ) A .7 B .7.5C .8D .9【答案】C【解析】该组数据从小到大排列为:5,5,6,7,8,9,且680% 4.8⨯=,故选:C.考法三 总体集中趋势的估计【例3】(2021·湖北荆州市)因受新冠疫情的影响,某企业的产品销售面临困难.为了改变现状,该企业欲借助电商和“网红”直播带货扩大销售.受网红效应的影响,产品销售取得了较好的效果.现将该企业一段时间内网上销售的日销售额统计整理后绘制成如下图所示的频率分布直方图:请根据图中所给数据,求: (1)实数a 的值;(2)该企业网上销售日销售额的众数和中位数; (3)该企业在统计时间段内网上销售日销售额的平均数. 【答案】(1)0.012;(2)55万元,57万元;(3)57.4万元. 【解析】(1)由频率分布直方图知:(0.0080.0160.0200.0180.0100.0042)101a ++++++⨯=,解得:0.012a =;(2)用频率分布直方图中最高矩形所在区间的中点值作为众数的近似值,得众数为55万元;因为第一个小矩形的面积为0.08,第二个小矩形的面积为0.12, 第三个小矩形的面积为0.16,0.080.120.160.36++=,设第四个小矩形中底边的一部分长为x ,则0.0200.50.36x ⨯=-,解得7x =, 所以中位数为50757+=万元; (3)依题意,日销售额的平均值为:250.08350.12450.16550.20650.18750.12850.10950.0457.4⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=所以该企业在统计时间段内网上销售日销售额的平均数为57.4万元. 【一隅三反】1.(2020·定边县第四中学高一期末)如图,从参加数学竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如图,观察图形,回答下列问题:(Ⅰ)79.5-89.5这一组的频数、频率分别是多少? (Ⅱ)估计这次数学竞赛的平均成绩是多少?(Ⅲ)估计这次数学竞赛的及格率(60分及以上为及格). 【答案】(Ⅰ)15;0.25;(Ⅱ)70.5;(Ⅲ)75%. 【解析】(Ⅰ)79.589.5这一组的频率为0.025100.25⨯=,79.589.5这一组的频数为600.2515⨯=;(Ⅱ)估计这次数学竞赛的平均成绩是:44.50.154.50.1564.50.1574.50.384.50.2594.50.0570.5⨯+⨯+⨯+⨯+⨯+⨯=.故估计这次数学竞赛的平均成绩是70.5.(Ⅲ)估计这次环保知识竞赛的及格率(60分及以上为及格)()10.010.0151075%P =-+⨯=. 2.(2021·河北唐山市·开滦第一中学高一期末)某校从参加高一年级期末考试的学生中抽出60名学生,将其物理成绩(均为整数)分成六段[)[)[]40,50,50,60,,90,100⋯后画出如下频率分布直方图.观察图形的信息,回答下列问题:(1)估计这次考试的众数m 与中位数n (结果保留一位小数); (2)估计这次考试的优秀率(80分及以上为及格)和平均分. 【答案】(1)75m =,73.3n =;(2)优秀率30%,平均分71分. 【解析】(1)众数是最高小矩形中点的横坐标,所以众数为75m =(分)前三个小矩形面积为0.01100.015100.015100.4⨯+⨯+⨯=, ∵中位数要平分直方图的面积, ∴0.50.47073.30.03n -=+=.(2)依题意,80及以上的分数所在的第五、六组, 频率和为 ()0.0250.005100.3+⨯=, 所以,抽样学生成绩的合格率是30%, 利用组中值估算抽样学生的平均分:450.1550.15650.15750.3850.25950.0571⨯+⨯+⨯+⨯+⨯+⨯=,估计这次考试的平均分是71分.3.(2021·吉林市)某城市100户居民的月平均用水量(单位:吨),以[0,2)[2,4)[4,6)[6,8)[8,10)[10,12)[12,14)分组的频率分布直方图如图.(1)求直方图中x 的值;并估计出月平均用水量的众数. (2)求月平均用水量的中位数及平均数;(3)在月平均用水量为[6,8),[8,10),[10,12),[12,14)的四组用户中,用分层抽样的方法抽取22户居民,则应在[10,12)这一组的用户中抽取多少户?(4)在第(3)问抽取的样本中,从[10,12)[12,14)这两组中再随机抽取2户,深入调查,则所抽取的两户不是来自同一个组的概率是多少?【答案】(1) x =0.075,7;(2) 6.4,5.36;(3) 2;(4)23. 【解析】(1)根据频率和为1,得2×(0.02+0.095+0.11+0.125+x +0.05+0.025)=1, 解得x =0.075;由图可知,最高矩形的数据组为[6,8),所以众数为()16872+=; (2) [2,6)内的频率之和为(0.02+0.095+0.11)×2=0.45;设中位数为y ,则0.45+(y −6)×0.125=0.5,解得y =6.4,∴中位数为6.4;平均数为()210.0230.09550.1170.12590.075110.025 5.36⨯+⨯+⨯+⨯+⨯+⨯=(3)月平均用电量为[10,12)的用户在四组用户中所占的比例为0.0520.1250.0750.050.02511=+++, ∴月平均用电量在[10,12)的用户中应抽取11×211=2(户). (4)月平均用电量在[12,14)的用户中应抽取11×111=1(户), 月平均用电量在[10,12)的用户设为A 、B , 月平均用电量在[12,14)的用户设为C ,从[10,12),[12,14)这两组中随机抽取2户共有 ,,AB AC BC ,3种情况,其中,抽取的两户不是来自同一个组的有,,AC BC ,2种情况, 所以,抽取的两户不是来自同一个组的概率为23. 考点四 总体离散程度的估计【例4】(2021·山东威海市·高一期末)如图所示的四组数据,标准差最小的是( )A .B .C .D .【答案】A【解析】对A ,()12106206302402516x =⨯+⨯+⨯+⨯=,s == 对B ,()16102202306402516x =⨯+⨯+⨯+⨯=,s == 对C ,()13105205303402516x =⨯+⨯+⨯+⨯=,10s ==, 对D ,()15103203305402516x =⨯+⨯+⨯+⨯=,s == 所以标准差最小的是A.故选:A.【一隅三反】1.(2020·全国高一)已知数据12,,,n x x x 的平均数为x ,方差为2s ,则123x +,223x +,…,23n x +的平均数和方差分别为( )A .x 和2sB .23x +和24sC .23x +和2sD .23x +和24129s s ++ 【答案】B【解析】因为数据12,,,n x x x 的平均数为x ,方差为2s ,所以123x +,223x +,…,23n x +的平均数和方差分别为23x +和24s故选:B2.(2020·安徽蚌埠市·蚌埠二中高一月考)一组数据中的每一个数据都乘以3,再减去50,得到一组新数据,若求得新的数据的平均数是1.6,方差是3.6,则原来数据的平均数和方差分别是( )A .17.2,3.6B .54.8,3.6C .17.2,0.4D .54.8,0.4 【答案】C【解析】设一组数据为i x (1,2,3,,)i n =,平均数为x ,方差为21s ,所得一组新数据为i y (1,2,3,,)i n =,平均数为y ,方差为22s ,则350i i y x =-(1,2,3,,)i n =,12 1.6n y y y y n +++==, 所以123503503501.6n x x x n -+-++-=, 所以350 1.6x -=,所以51.617.23x ==, 由题意得22222121()()() 3.6n s y y y y y y n ⎡⎤=-+-++-=⎣⎦, 所以222121(350 1.6)(350 1.6)(350 1.6) 3.6n x x x n⎡⎤--+--++--=⎣⎦, 所以2221219(17.2)(17.2)(17.2) 3.6n x x x n ⎡⎤⨯-+-++-=⎣⎦ 所以2221219()()() 3.6n x x x x x x n⎡⎤⨯-+-++-=⎣⎦, 所以219 3.6s =,所以210.4s =.故选:C.3.(2020·唐山市第十一中学)已知样本数据由小到大依次为2,3,3,7,a ,b ,12,13.7,18.3,20,且样本的中位数为10.5,若使该样本的方差最小,则a ,b 的值分别为( ).A .10,11B .10.5,9.5C .10.4,10.6D .10.5,10.5 【答案】D【解析】由于样本共有10个值,且中间两个数为a ,b ,依题意,得10.52a b +=,即21b a =-. 因为平均数为23371213.718.320101()0a b +++++++++÷=,所以要使该样本的方差最小,只需()()221010a b -+-最小.又()()()()222221010102110242221a b a a a a -+-=-+--=-+, 所以当4210.522a -=-=⨯时,()()221010a b -+-最小,此时10.5b =. 故选:D4.(2021·合肥市第六中学=)为了测试小班教学的实践效果,刘老师对A 、B 两班的学生进行了阶段测试,并将所得成绩统计如图所示;记本次测试中,A 、B 两班学生的平均成绩分别为A x ,B x ,A 、B 两班学生成绩的方差分别为2A s ,2B s ,则观察茎叶图可知( )A .AB x x <,22A B s s < B .A B x x >,22A B s s <C .A B x x <,22A B s s >D .A B x x >,22A B s s >【答案】B【解析】根据茎叶图中数据的分布可得,A 班学生的分数多集中在[]70,80之间, B 班学生的分数集中在[]50,70 之间,所以A B x x >.相对两个班级的成绩分布来说,A 班学生的分数更加集中,B 班学生的分数更加离散,所以22A B s s <.故选:B。
第02讲 用样本估计总体 (精讲)(教师版)

,nx +)标准差与方差据1x ,nx +,标22()(n x x x x +-++-2(n x x ++-知识点三:在频率分布直方图中,众数,中位数,平均数的估计值最高的小矩形底边中点的横坐标即是众数中位数左边和右边的所有小矩形的面积和是相等的“重心”,等于频率分布直方图中每个小矩形的面积乘小矩形底边中点的横坐标3,b ,3,b ,【答案】45 45.85379⨯=975%∴+=25m故选:B.例题4.(PM2.5的浓度(单位:知这组数据的极差为A.73 B.75 C.77 D.79,,n x 的平均数个分数分别为18,,,x x ,6,8,,x 的平均数为228361001081210++++-=x ,28624++=x 8610++++x ,即12864+++=x x x 2624888-⨯=故答案为:14..(2022·全国55%分位数,②众数这两个条件中任选一个,补充在下面问题中的横线上,并解答问题抗坏血酸,是一种水溶性维生素,是高等灵长类动物与其他少数2,3,,)n ,则下列结论正确的是(2,3,,)n ,则它们的众数也满足该关系,12(21)(21)(21)nn y x x x nn++-+-++-=1nx n++- 121b =-,故B 正确;由方差的性质可得2c =C 正确;23,x x ,…,,假设其第80百分位数为1d , 是整数时,x 21,2x x --30,,x 的平均数为10,,x 这10个数的平均数为8,方差为30,,x ___________. 【详解】由题意得12306x x x +++=2309x ++=⨯1081080x ++=⨯=,222121058690x x x =⨯+=++,所以剩余的20个数的平均数为18080520-=, 30221350690660x +=-=+,所以剩余的20个数的方差为66020258-=,故答案为:82022·全国·高一单元测试)敢于冒险奋进精神的载体,A.这组数据的极差为50 B.这组数据的众数为76(0.005+0.75800.3-+故选:CD例题2.(学生人数比例、[(1)估计总体400名学生中分数小于60的人数;分数小于60的频率为()10.020.040.02100.2-++⨯=,所以[)60,70x ∈,即()0.2600.010.25x +-⨯=,解得65x =,则本次考试的及格分数线为65分.例题3.(2022·全国·高一单元测试)中秋佳节来临之际,小李准备销售一种农特产,这段时间内,每售出1箱该特产获利50元,未售出的,每箱亏损30元.经调查,市场需求量的频率分布直方图如图所示.小李购进了160箱该特产,以x (单位:箱,100200x ≤≤)表示市场需求量,y (单位:元)表示经销该特产的利润.(1)根据频率分布直方图估计市场需求量的众数和平均数;(2)将y 表示为x 的函数;(3)根据频率分布直方图求利润不少于4800元的频率.【答案】(1)150,153(2)804800,1001608000,160200x x y x -≤<⎧=⎨≤≤⎩(3)0.9(1)由频率分布直方图,得市场需求量的众数的估计值是150,需求量为[100,120)的频率为0.005×20=0.1,需求量为[120,140)的频率为0.01×20=0.2,需求量为[140,160)的频率为0.015×20=0.3,需求量为[160,180)的频率为0.0125×20=0.25,需求量为[180,200]的频率为0.0075×20=0.15,则市场需求量的平均数约为110×0.1+130×0.2+150×0.3+170×0.25+190×0.15=153.(2)因为每售出1箱该特产获利50元,未售出的,每箱亏损30元,所以当100160≤<x 时,5030(160)804800y x x x =-⨯-=-,当160200x ≤≤时,160508000y =⨯=,所以804800,1001608000,160200x x y x -≤<⎧=⎨≤≤⎩. (3)当100160≤<x 时,由8048004800x -≥,得120160x ≤<;当160200x ≤≤时,80004800y =>,所以当120200x ≤≤时,利润不少于4800元,所以由(1)知利润不少于4800元的频率为10.10.9-=.同类题型归类练A.此次测试众数的估计值为85(1)求频率分布直方图中a的值;(1)求本次初赛成绩的平均数;(每组数据以区间中点值为代表)(1)求出表中m,p的值;(1)分别计算甲、乙两厂提供的10个轮胎宽度的平均数;(1)请你估计该地区所有用户评分的25%,95%分位数;(1)求频率分布直方图中x的值以及样本中身高不低于175cm的学生人数;(1m ii x x =-∑同理可得21s m ∴=+1⎡、、A .20B .40C .64D .80根据此频率分布直方图,下面结论中不正确的是( ) A .该地农户家庭年收入低于4.5万元的农户比率估计为6% B .该地农户家庭年收入不低于10.5万元的农户比率估计为10% C .估计该地农户家庭年收入的平均值不超过6.5万元D .估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间 【答案】C【详解】因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于4.5万元的农户的比率估计值为0.020.040.066%+==,故A 正确; 该地农户家庭年收入不低于10.5万元的农户比率估计值为0.040.0230.1010%+⨯==,故B 正确; 该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为0.100.140.2020.6464%50%++⨯==>,故D 正确;该地农户家庭年收入的平均值的估计值为30.0240.0450.1060.1470.2080.2090.10100.10110.04120.02130.02140.027.68⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=(万元),超过6.5万元,故C 错误.综上,给出结论中不正确的是C. 故选:C.3.(多选)(2021·全国·高考真题)下列统计量中,能度量样本12,,,n x x x 的离散程度的是( )A .样本12,,,n x x x 的标准差B .样本12,,,n x x x 的中位数C .样本12,,,n x x x 的极差D .样本12,,,n x x x 的平均数【答案】AC【详解】由标准差的定义可知,标准差考查的是数据的离散程度; 由中位数的定义可知,中位数考查的是数据的集中趋势; 由极差的定义可知,极差考查的是数据的离散程度;。
抽样调查练习题

第四章习题抽样调查一、填空题1. 抽样调查是遵循随机的原则抽选样本,通过对样本单位的调查来对研究对象的总体数量特征作出推断的。
2. 采用不重复抽样方法,从总体为N的单位中,抽取样本容量为n的可能样本个数为N(N-1)(N-2)……(N-N+1)。
3. 只要使用非全面调查的方法,即使遵守随机原则,抽样误差也不可避免会产生。
4. 参数估计有两种形式:一是点估计,二是区间估计。
5. 判别估计量优良性的三个准则是:无偏性、一致性和有效性。
6. 我们采用“抽样指标的标准差”,即所有抽样估计值的标准差,作为衡量抽样估计的抽样误差大小的尺度。
7. 常用的抽样方法有简单随机抽样、类型(分组)抽样、等距抽样、整群抽样和分阶段抽样。
8. 对于简单随机重复抽样,若其他条件不变,则当极限误差范围Δ缩小一半,抽样单位数必须为原来的4倍。
若Δ扩大一倍,则抽样单位数为原来的1/4。
9. 如果总体平均数落在区间960~1040内的概率是95%,则抽样平均数是1000,极限抽样误差是40.82,抽样平均误差是20.41。
10. 在同样的精度要求下,不重复抽样比重复抽样需要的样本容量少,整群抽样比个体抽样需要的样本容量多。
二、判断题1. 抽样误差是抽样调查中无法避免的误差。
(√)2. 抽样误差的产生是由于破坏了随机原则所造成的。
(×)3. 重复抽样条件下的抽样平均误差总是大于不重复抽样条件下的抽样平均误差。
(√)4. 在其他条件不变的情况下,抽样平均误差要减少为原来的1/3,则样本容量必须增大到9倍。
(√)5. 抽样调查所遵循的基本原则是可靠性原则。
(×)6. 样本指标是一个客观存在的常数。
(×)7. 全面调查只有登记性误差而没有代表性误差,抽样调查只有代表性误差而没有登记性误差。
(×)8. 抽样平均误差就是抽样平均数的标准差。
(×)三、单项选择题1. 用简单随机抽样(重复)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大为原来的(C)A. 2倍B. 3倍C. 4倍D. 5倍2. 事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织方式叫做(D)A. 分层抽样B. 简单随机抽样C. 整群抽样D. 等距抽样3. 计算抽样平均误差时,若有多个样本标准差的资料,应选哪个来计算(B)A. 最小一个B. 最大一个C. 中间一个D. 平均值4. 抽样误差是指(D)A. 计算过程中产生的误差B. 调查中产生的登记性误差C. 调查中产生的系统性误差D. 随机性的代表性误差5. 抽样成数是一个(A)A. 结构相对数B. 比例相对数C. 比较相对数D. 强度相对数6. 成数和成数方差的关系是(C)A.成数越接近于0,成数方差越大B.成数越接近于1,成数方差越大C.成数越接近于0.5,成数方差越大D.成数越接近于0.25,成数方差越大7. 整群抽样是对被抽中的群作全面调查,所以整群抽样是(B)A. 全面调查B. 非全面调查C. 一次性调查D. 经常性调查8. 对400名大学生抽取19%进行不重复抽样调查,其中优等生比重为20%,概率保证程度为95.45%,则优等生比重的极限抽样误差为(40%)A. 4%B. 4.13%C. 9.18%D. 8.26%9. 根据5%抽样资料表明,甲产品合格率为60%,乙产品合格率为80%,在抽样产品数相等的条件下,合格率的抽样误差是(B)A. 甲产品大B. 乙产品大C. 相等D. 无法判断10. 抽样调查结果表明,甲企业职工平均工资方差为25,乙企业为100,又知乙企业工人数比甲企业工人数多3倍,则随机抽样误差(B)A. 甲企业较大B. 乙企业较大C. 不能作出结论D. 相同四、多项选择题抽样调查中的抽样误差是(ABCDE)A. 是不可避免要产生的B. 是可以通过改进调查方法来避免的C. 是可以计算出来的D. 只能在调查结果之后才能计算E. 其大小是可以控制的2. 重复抽样的特点是(AC)A. 各次抽选相互影响B. 各次抽选互不影响C. 每次抽选时,总体单位数始终不变D 每次抽选时,总体单位数逐渐减少E. 各单位被抽中的机会在各次抽选中相等3. 抽样调查所需的样本容量取决于(ABE)A. 总体中各单位标志间的变异程度B. 允许误差C. 样本个数D. 置信度E. 抽样方法4. 分层抽样误差的大小取决于(BCD)A. 各组样本容量占总体比重的分配状况B. 各组间的标志变异程度C. 样本容量的大小D. 各组内标志值的变异程度E. 总体标志值的变异程度5. 在抽样调查中(ACD)A. 全及指标是唯一确定的B. 样本指标是唯一确定的C. 全及总体是唯一确定的D. 样本指标是随机变量E. 全及指标是随机变量五、名词解释1.抽样推断2.抽样误差3.重复抽样与不重复抽样4.区间估计六、计算题1.某公司有职工3000人,现从中随机抽取60人调查其工资收入情况,得到有关资料如下:(1)试以0.95的置信度估计该公司工人的月平均工资所在范围。
2022年华东师大版九年级数学下册第28章 样本与总体同步练习练习题(含详解)

华东师大版九年级数学下册第28章样本与总体同步练习考试时间:90分钟;命题人:数学教研组考生注意:1、本卷分第I卷(选择题)和第Ⅱ卷(非选择题)两部分,满分100分,考试时间90分钟2、答卷前,考生务必用0.5毫米黑色签字笔将自己的姓名、班级填写在试卷规定位置上3、答案必须写在试卷各个题目指定区域内相应的位置,如需改动,先划掉原来的答案,然后再写上新的答案;不准使用涂改液、胶带纸、修正带,不按以上要求作答的答案无效。
第I卷(选择题 30分)一、单选题(10小题,每小题3分,共计30分)1、某班在开展“节约每一滴水”的活动中,从全班40名同学中选出10名同学汇报了各自家庭一个月的节水情况,发现节水0.5m3的有2人,水1m3的有3人,节水1.5m3的有2人,节水2m3的有3人,用所学的统计知识估计全班同学的家庭一个月节约用水的总量是()A.20m3B.52m3C.60m3D.100m32、下列调查中,适合用普查方式的是()A.了解某班学生“立信一小时”情况B.了解一批灯泡的使用寿命C.了解一批炮弹的杀伤半径D.调查湘江流域的水污染情况3、下列调查最适合用普查的是()A.了解七年级1班每位学生身高情况B.检测一款新手机的待机时长C.了解全国中学生最喜爱的图书种类D.调查全市人民对政府服务的满意程度4、下列问题不适合用全面调查的是()A.旅客上飞机前的安检B.企业招聘,对应试人员进行面试C.了解全班同学每周体育锻炼的时间D.调查市场上某种食品的色素含量是否符合国家标准5、某企业对其生产的产品进行抽检,抽检结果如表:若该企业生产该产品10000件,估计不合格产品的件数为()A.80 B.100 C.150 D.2006、如图反映的是某中学九(3)班学生外出方式(乘车、步行、骑车)人数的条形统计图(部分)和扇形分布图,那么下列说法正确的是()A.九(3)班外出的学生共有42人B.九(3)班外出步行的学生有8人C.在扇形图中,步行的学生人数所占的圆心角为82°D.如果该校九年级外出的学生共有500人,那么估计全年级外出骑车的学生约有140人7、下面调查统计中,适合采用普查方式的是()A.华为手机的市场占有率B.“现代”汽车每百公里的耗油量C.“国家宝藏”专栏电视节目的收视率D.乘坐飞机的旅客是否携带了违禁物品8、下列适合于抽样调查的是()A.某班学生男女比例B.铅笔使用寿命C.飞机乘客安全检查D.载人航天飞船零部件检查9、为了完成下列任务,你认为最适合采用普查的是()A.了解某品牌电视的使用寿命B.了解一批西瓜是否甜C.了解某批次烟花爆竹的燃放效果D.了解某隔离小区居民新冠核酸检查结果10、下列调查中,最适合采用全面调查(普查)方式的是()A.检测生产的鞋底能承受的弯折次数B.了解某批扫地机器人平均使用时长C.选出短跑最快的学生参加全市比赛D.了解某省初一学生周体育锻炼时长第Ⅱ卷(非选择题 70分)二、填空题(10小题,每小题3分,共计30分)1、质检部门从2000件电子元件中随机抽取100件进行检测,其中有3件是次品.试据此估计这批电子元件中大约有______件次品.2、某校有600名七年级学生共同参加每分钟跳绳次数测试,并随机抽取若干名学生成绩统计成频数分布直方图(如图).若每分钟跳绳次数达到100次以上(包括100次)的学生成绩为“合格”,则参加测试的学生成绩为“合格”的人数约为.3、数学兴趣小组随机调查了“幸福小区”10户家庭一周内使用环保袋的数量,数据如下(单位:个):6,5,7,8,7,5,8,10,5,9.利用上述数据估计该小区800户家庭一周内需要环保袋共_______个.4、某学习小组为了解本城市100万成年人中大约有多少人吸烟,随机调查了50个成年人,结果其中有10个成年人吸烟,对于这个数据收集与处理的问题,有下列说法:①该调查的方式是全面调查;②本城市只有40个成年人不吸烟;③本城市一定有20万人吸烟;④样本容量是50.其说法正确的有____(填序号).5、为了解某市参加中考的25000名学生的身高情况,抽查了其中1200名学生的身高进行统计分析.则总体是_______.6、某校有2400名九年级学生,随机调查了其中的400名学生,结果有150名学生会游泳,估计该校会游泳的九年级学生人数约为 _______.7、小张所在的公司共有600名员工,他为了解公司员工所使用的手机品牌情况,随机调查了部分员工,并将调查得到的数据绘制成如图所示的统计图,那么小张所在公司使用“华为”品牌手机的人数约是_____人.8、为了解某校七年级学生的视力情况,从中抽取了100名学生进行了检查,发现只有30名学生的视力在5.0及以上,则该问题中的样本容量是______.9、检查一箱装有2500件包装食品的质量,按2%的抽查率抽查其中一部分的质量,在这个问题中,总体是________,样本是________.10、为了了解某校七年级400名学生的期中数学成绩的情况,从中抽取了50名学生的数学成绩进行分析.在这个过程中,样本容量是________.三、解答题(5小题,每小题8分,共计40分)1、为了迎接即将到来的生物会考,我校对八年级学生进行了一次生物摸底考试,并将这些学生的测试成绩(测试成绩在0~100范围内)分段后给出相应等级,具体为:测试成绩低于60的记为差,60~70(不含70)的记为中,70~80(不含80)的记为良,80以上的记为优,并随机抽取了部分学生的测试成绩作为样本进行分析,将调查得到的数据进行整理,绘制成如下统计图.请根据图中所给出的信息,解答下列问题:(1)在这次调查中被抽取学生的总人数为 人;(2)请补全条形统计图并计算出a 、b ;(3)在扇形统计图中,求表示成绩分组为优的扇形所对应的圆心角的度数;(4)若学校八年级共有500人参加了这次生物考试,请你估计生物成绩为优的人数.2、近几年,中学体育课程改革受到全社会的广泛关注,《体育与健康课程标准》中明确指出:“健康体魄是青少年为祖国和人民服务的基本前提”.某校为了解九年级学生的锻炼情况,随机抽取一班与二班各10名学生进行一分钟跳绳测试,若一分钟跳绳个数为m ,规定0160m <<“不合格”,160185m ≤<“及格”,185200m ≤<“良好”,200m ≥“优秀”.对于学生一分钟跳绳个数相关数据收集、整理如下:一分钟跳绳次数(单位:个)一班:204 198 190 190 188 198 180 173 163 198 二班:203 200 190 186 200 183 169 200 159 190 数据分析:两组样本数据的平均数、众数、中位数如下表所示:二班学生一分钟跳绳成绩扇形统计图应用数据:+=______.(1)根据图表提供的信息,2a b(2)根据以上数据,你认为该年级一班与二班哪个班的学生一分钟跳绳成绩更好?请说明理由(写出一条理由即可);(3)该校九年级共有学生2000人,请估计一分钟跳绳成绩为“优秀”的共有多少人?3、学校组织开展了社团活动,分别设置了体育类、艺术类、文学类及其它类社团(要求人人参与社团,每人只能选择一项).为了解学生喜爱哪种社团活动,学校做了一次抽样调查.根据收集到的数据,绘制成如下两幅不完整的统计图:(1)此次共调查了多少人?(2)通过计算将条形统计图补充完整;(3)若该校有1500名学生,请估计喜欢体育类社团的学生有多少人?4、虎林市各中小学正在加快推进特色课后服务的实施,某校为进一步增强教育的服务能力,初步组建了四种社团:A.体育、B.音乐、C.美术、D.科技.为了解学生最喜欢哪一种活动,并将调查结果绘制成了两幅不完整的统计图(如图①,图②),请回答下列问题:(1)这次被调查的学生共有多少人?(2)请你将条形统计图补充完整;(3)若该校共有学生1900人,请你估计该校喜欢科技项目的人数.5、安岳县教育和体育局在全县中小学开展群文阅读活动,要求每人暑假假期阅读3-6本图书.活动结束后随机抽查了40名学生每人的阅读图书量,并将其分为四类:A:三本,B:四本,C:五本,D:六本,将各类的人数绘制成扇形统计图(图1)和条形统计图(图2),经确定扇形统计图是正确的,而条形统计图存在错误.(1)请指出条形统计图中存在的错误,并说明理由;(2)若该校有3000名学生,请估计全校共有多少名学生阅读量为B 类.(3)请计算D 类学生在扇形统计图中的圆心角.-参考答案-一、单选题1、B【解析】【分析】利用加权平均数求出选出的10名同学每家的平均节水量.再利用用样本估计总体,即由平均节水量乘以总人数即可求出最后结果.【详解】30.5213 1.5223 1.310m ⨯+⨯+⨯+⨯=, 由此可估计全班同学的家庭一个月节约用水的总量是340 1.352m ⨯=.故选:B .【点睛】本题考查加权平均数和由样本估计总体.正确的求出样本的平均值是解答本题的关键.2、A【解析】【分析】对每个对象的调查叫全面调查也叫普查,根据定义解答【详解】解:A、了解某班学生“立信一小时”情况属于普查;B、了解一批灯泡的使用寿命应是抽样调查;C、了解一批炮弹的杀伤半径应是抽样调查;D、调查湘江流域的水污染情况应是抽样调查;故选:A.【点睛】此题考查全面调查的定义,熟记定义是解题的关键.3、A【解析】【分析】由普查得到的调查结果比较准确,但所费人力、物力和时间较多,而抽样调查得到的调查结果比较近似.【详解】A.了解七年级1班每位学生身高情况,适合全面调查,故本选项符合题意;B.检测一款新手机的待机时长,适合抽样调查,故本选项不符合题意;C.了解全国中学生最喜爱的图书种类,适合抽样调查,故本选项不符合题意;D.调查全市人民对政府服务的满意程度,适合抽样调查,故本选项不符合题意.故选:A.【点睛】本题考查了抽样调查和全面调查的区别,选择普查还是抽样调查要根据所要考查的对象的特征灵活选用,一般来说,对于具有破坏性的调查、无法进行普查、普查的意义或价值不大,应选择抽样调查,对于精确度要求高的调查,事关重大的调查往往选用普查.4、D【解析】【分析】由普查得到的调查结果比较准确,但所费人力、物力和时间较多,而抽样调查得到的调查结果比较近似,根据以上逐项分析可知.【详解】解:A. 旅客上飞机前的安检,人员不多,且这个调查很重要不可漏掉任何人,适合全面调查,不符合题意,B. 企业招聘,对应试人员进行面试,人员不多,且这个调查很重要不可漏掉任何人,适合全面调查,不符合题意,C. 了解全班同学每周体育锻炼的时间,人员不多,适合全面调查,不符合题意,D. 调查市场上某种食品的色素含量是否符合国家标准,调查具有破坏性,不适合全面调查,符合题意故选D【点睛】本题考查的是全面调查与抽样调查,在调查实际生活中的相关问题时,要灵活处理,既要考虑问题本身的需要,又要考虑实现的可能性和所付出代价的大小.理解全面调查与抽样调查的适用范围是解题的关键.5、D【解析】【分析】求出抽取件数不合格的概率,用样本估计总体即可得出10000件产品不合格的件数.【详解】抽查总体数为:10401002003005001150+++++=(件),不合格的件数为:012361022+++++=(件),22()0.021150P ∴=≈抽到不合格的产品, 100000.02200∴⨯=(件).故选:D【点睛】本题考查用样本估计总体,求出样本的不合格率来估计总体的不合格率是解题的关键.6、B【解析】【分析】A 、由乘车的人数除以占的百分比求出该班的学生数即可;B 、由该班的总人数减去乘车和骑车人数可得步行的学生数即可判断;C 、根据步行占的百分比,乘以360即可得到结果;D 、由骑车的占总人数比例乘以500即可得到结果.【详解】解:A 、由题意知乘车的人数是20人,占总人数的50%,所以九(3)班有2050%40÷=人,故此选项错误;B 、步行人数为:4012208--=人,故此选项正确;C 、步行学生所占的圆心角度数为83607240⨯︒=︒,故此选项错误; D 、如果该中学九年级外出的学生共有500人,那么估计全年级外出骑车的学生约为1250015040⨯=人,故此选项错误;故选:B .【点睛】此题考查了条形统计图,扇形统计图,以及用样本估计总体,弄清题中图表中的数据是解本题的关键.7、D【解析】【分析】根据普查得到的调查结果比较准确,但所费人力、物力和时间较多,而抽样调查得到的调查结果比较近似判断即可.【详解】解:A、对华为手机的市场占有率的调查范围广,适合抽样调查,故此选项不符合题意;B、对“现代”汽车每百公里的耗油量的调查范围广适合抽样调查,故此选项不符合题意;C、对“国家宝藏”专栏电视节目的收视率的调查范围广,适合抽样调查,故此选项不符合题意;D、对乘坐飞机的旅客是否携带了违禁物品的调查情况适合普查,故此选项符合题意;故选:D.【点睛】本题考查的是抽样调查和全面调查的区别,选择普查还是抽样调查要根据所要考查的对象的特征灵活选用,一般来说,对于具有破坏性的调查、无法进行普查、普查的意义或价值不大,应选择抽样调查,对于精确度要求高的调查,事关重大的调查往往选用普查.8、B【解析】【分析】由普查得到的调查结果比较准确,但所费人力、物力和时间较多,而抽样调查得到的调查结果比较近似,但所费人力、物力和时间较少分析解答即可.【详解】解:A.某班学生男女比例工作量比较小,适合采用全面调查方式,故本选项不合题意;B.铅笔使用寿命,调查具有破坏性,适合采用抽样调查,故本选项符合题意;C.飞机乘客安全检查非常重要,适合采用全面调查方式,故本选项不合题意;D.载人航天飞船零部件检查非常重要,适合采用全面调查方式,故本选项不合题意.故选:B.【点睛】本题考查了抽样调查和全面调查,选择普查还是抽样调查要根据所要考查的对象的特征灵活选用,一般来说,对于具有破坏性的调查、无法进行普查、普查的意义或价值不大,应选择抽样调查,对于精确度要求高的调查,事关重大的调查往往选用普查.9、D【解析】【分析】普查和抽样调查的选择,需要将普查的局限性和抽样调查的必要性结合起来,具体问题具体分析,普查结果准确,所以在要求精确、难度相对不大,实验无破坏性的情况下应选择普查方式,当考查的对象很多或考查会给被调查对象带来损伤破坏,以及考查经费和时间都非常有限时,普查就受到限制,这时就应选择抽样调查.【详解】解:A、了解某品牌电视的使用寿命,调查带有破坏性,应用抽样调查方式,故此选项不合题意;B、了解一批西瓜是否甜,调查带有破坏性,应用抽样调查方式,故此选项不合题意;C、了解某批次烟花爆竹的燃放效果,调查带有破坏性,适合选择抽样调查,故此选项不符合题意;D、了解某隔离小区居民新冠核酸检查结果,对结果的要求高,结果必须准确,应用全面调查方式,故此选项符合题意.故选:D.【点睛】本题考查了抽样调查和全面调查,由普查得到的调查结果比较准确,但所费人力、物力和时间较多,而抽样调查得到的调查结果比较近似.10、C【分析】根据普查得到的调查结果比较准确,但所费人力、物力和时间较多,而抽样调查得到的调查结果比较近似解答.【详解】解:A、检测生产的鞋底能承受的弯折次数,具有破坏性,适合采用抽样调查;B、了解某批扫地机器人平均使用时长,具有破坏性,适合采用抽样调查;C、选出短跑最快的学生参加全市比赛,精确度要求高,适合采用全面调查;D、了解某省初一学生周体育锻炼时长,调查数量较大且调查结果要求准确度不高,适合采用抽样调查;故选:C.【点睛】本题考查的是抽样调查和全面调查,选择普查还是抽样调查要根据所要考查的对象的特征灵活选用,一般来说,对于具有破坏性的调查、无法进行普查、普查的意义或价值不大,应选择抽样调查,对于精确度要求高的调查,事关重大的调查往往选用普查.二、填空题1、60【解析】【分析】用总数量乘以所抽样本中次品数量所占比例即可.【详解】解:估计这批电子元件中次品大约有2000×3100=60(件),故答案为:60.本题主要考查了用样本频数估计总体的频数,解题的关键在于能够准确读懂题意.2、400【解析】【分析】根据跳绳次数分组的中间值,确定分组的临界值,进而得出每分钟跳绳次数达到100次以上人数即可.【详解】解:根据频数分布直方图中每分钟跳绳次数的中间值,可得各组的临界值及其频数分布如下:所以样本中,每分钟跳绳次数达到100次以上(包括100次)的学生占调查人数的1262 281262++++++=23,因此全校600名七年级学生中每分钟跳绳次数达到100次以上(包括100次)的学生有600×23=400(人),故答案为:400.【点睛】本题考查频数分布表,频数分布直方图,以及用样本估计总体,样本估计总体是统计中常用的方法.3、5600【解析】根据题目中的10户一周内使用环保袋的数量,可以计算出这10户一共使用环保袋的数量,然后即可计算出800户家庭一周内需要环保袋的数量.【详解】解:(6+5+7+8+7+5+8+10+5+9)×(800÷10)=70×80=5600(个)即估计该小区800户家庭一周内需要环保袋共5600个,故答案为:5600.【点睛】本题考查用样本估计总体,是基础考点,掌握相关知识是解题关键.4、④【解析】【分析】总体是指考查的对象的全体,个体是总体中的每一个考查的对象,样本是总体中所抽取的一部分个体,而样本容量则是指样本中个体的数目.我们在区分总体、个体、样本、样本容量,这四个概念时,首先找出考查的对象.从而找出总体、个体.再根据被收集数据的这一部分对象找出样本,最后再根据样本确定出样本容量.【详解】解:①该调查的方式是抽样调查,此选项说法错误;②本城市成年人不吸烟的有1001050⨯=20(万人),此项说法错误;③本城市大约有20万成年人吸烟,此项说法错误;④样本容量是50,此项说法正确;其中正确的是④.故答案为:④.【点睛】本题考查用样本估计总体及抽样调查的有关概念,解题要分清具体问题中的总体、个体与样本,关键是明确考查的对象.总体、个体与样本的考查对象是相同的,所不同的是范围的大小.样本容量是样本中包含的个体的数目,不能带单位.5、某市参加中考的25000名学生的身高情况.【解析】【分析】总体是指考查的对象的全体,个体是总体中的每一个考查的对象,样本是总体中所抽取的一部分个体,而样本容量则是指样本中个体的数目.【详解】解:为了解某市参加中考的25000名学生的身高情况,抽查了其中1200名学生的身高进行统计分析.则总体是:某市参加中考的25000名学生的身高情况;故答案为:某市参加中考的25000名学生的身高情况.【点睛】此题考查了总体、个体、样本、样本容量,解题要分清具体问题中的总体、个体与样本,关键是明确考查的对象.总体、个体与样本的考查对象是相同的,所不同的是范围的大小.样本容量是样本中包含的个体的数目,不能带单位.6、900名【解析】【分析】用总人数乘以样本中会游泳的学生人数所占比例即可.【详解】解:估计该校会游泳的九年级学生人数约为2400×150400=900(名),故答案为:900名.【点睛】本题主要考查用样本估计总体,一般来说,用样本去估计总体时,样本越具有代表性、容量越大,这时对总体的估计也就越精确.7、210【解析】【分析】用样本中使用华为品牌的人数所占比例乘以总人数即可得出答案.【详解】解:小张所在公司使用“华为”品牌手机的人数约是600×3535152051015+++++=210(人),故答案为:210.【点睛】本题考查用样本估计总体,从一个总体得到一个包含大量数据的样本,我们很难从一个个数字中直接看出样本所包含的信息.这时,我们用频率分布直方图来表示相应样本的频率分布,从而去估计总体的分布情况.8、100【解析】【分析】样本容量则是指样本中个体的数目.【详解】解:从中抽取了100名学生进行了检查,发现只有30名学生的视力在5.0及以上,则该问题中的样本容量是100,故答案为:100.【点睛】考查了总体、个体、样本、样本容量,解题要分清具体问题中的总体、个体与样本,关键是明确考查的对象.总体、个体与样本的考查对象是相同的,所不同的是范围的大小.样本容量是样本中包含的个体的数目,不能带单位.9、 2500件包装食品的质量所抽取的50件包装食品的质量【解析】【分析】根据总体是指考查的对象的全体,样本是总体中所抽取的一部分个体即可解答.【详解】解:检查一箱装有2500件包装食品的质量,按2%的抽查率抽查其中一部分的质量,在这个问题中,%=50件包装食品的质量,总体是2500件包装食品的质量,样本是抽取的25002故答案为:2500件包装食品的质量;所抽取的50件包装食品的质量.【点睛】本题考查了总体、样本的概念,解题要分清具体问题中的总体与样本,关键是明确考查的对象.总体与样本的考查对象是相同的,所不同的是范围的大小.掌握总体、样本的概念是解题关键.10、50【解析】【分析】根据样本容量:一个样本包括的个体数量叫做样本容量即可得.【详解】解:为了了解某校七年级400名学生的期中数学成绩的情况,从中抽取了50名学生的数学成绩进行分析,这个问题中的样本容量是50,故答案为:50.【点睛】本题主要考查总体、个体、样本、样本容量,解题要分清具体问题中的总体、个体与样本,关键是明确考查的对象.总体、个体与样本的考查对象是相同的,所不同的是范围的大小.样本容量是样本中包含的个体的数目,不能带单位.三、解答题1、 (1)50(2)补全统计图见解析;a=26,b=14(3)158.4°(4)220名【解析】【分析】(1)根据统计图中的数据可以求得本次抽取的学生数;(2)用被抽取学生的总人数减去其它三个等级的人数,得出“中”级人数,补全条形统计图,共了”良“的人数除以总人数即可得出a的值,用”中“的人数除以总人数即可得出b的值;(3)根据统计图中的数据可以求得“优”所占扇形的圆心角为2250×360°=158.4°;(4)由500×2250=220(名)即可.(1)解:在这次调查中被抽取学生的总人数为:8÷16%=50(人),故答案为:50;(2)“中”级人数为:50-22-13-8=7(人),补全条形统计图如下:a%=1350×100%=26%,b%=750×100%=14%;(3)“优”所占扇形的圆心角为2250×360°=158.4°;(4)生物成绩为优的人数为:500×2250=220(名).【点睛】本题考查条形统计图、扇形统计图、用样本估计总体,解答本题的关键是明确题意,找出所求问题需要的条件,利用数形结合的思想解答.2、 (1)270(2)我认为一班学生一分钟跳绳成绩更好,理由见解析(3)500人【解析】【分析】(1)根据优秀率的计算公式及中位数的定义分别求出a、b的值再计算即可;(2)利用表格中的平均数比较得到一班成绩较好;。
用样本估计总体练习题含答案

用样本估计总体练习题(1)1. 张先生去某城市参加学术会议,拟选择在会议中心附近的A、B两酒店中的一个人住.两酒店条件和价格相当,张先生在网上查看了最近入住两个酒店的客人对两酒店的综合评分,并将评分数据记录为如图的茎叶图.记A、B两酒店的宗合评分数据的均值为,,方差为S A2,S B2,若以此为依据,下述判断较合理的是()A.因为,S A2>S B2,应选择A酒店B.因为,S A2<S B2,应选择A酒店C.因为,S A2>S B2,应选择B酒店D.因为,S A2<S B2,应选择B酒店2. 根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关3. 某市为调查学生的学习负担,在某一所学校门口随机抽取一部分学生进行询问调查,这种抽样方法是()A.简单随机抽样B.系统抽样C.分层抽样D.以上都不是4. (5分)如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.5.(5分) 2020年,面对突如其来的新冠肺炎疫情冲击,在党中央领导下,各地区各部门统筹疫情防控和经济社会发展取得显著成效,商业模式创新发展,消费结构升级持续发展.某主打线上零售产品的企业随机抽取了50名销售员,统计了其2020年的月均销售额(单位:万元),将数据按照[12,14),[14,16),⋯,[22,24]分成6组,制成了如图所示的频率分布直方图.已知[14,16)组的频数比[12,14)组多4.(1)求频率分布直方图中a和b的值;(2)该企业为了挖掘销售员的工作潜力,对销售员实行冲刺目标管理,即给销售员确定一个具体的冲刺目标,完成这个冲刺目标,则给予额外的奖励.若公司希望恰有20%的销售人员能够获得额外奖励,求该企业应该制定的月销售冲刺目标值.参考答案与试题解析用样本估计总体练习题(1)一、选择题(本题共计 3 小题,每题 5 分,共计15分)1.【答案】B【考点】茎叶图【解析】此题暂无解析【解答】此题暂无解答2.【答案】D【考点】频率分布直方图【解析】此题暂无解析【解答】解:从图中明显看出2008年二氧化硫排放量比2007年的二氧化硫排放量明显减少,且减少的最多,故A正确;2004−2006年二氧化硫排放量越来越多,从2007年开始二氧化硫排放量变少,故B正确;从图中看出,2006年以来我国二氧化硫年排放量呈减少趋势,故C正确;2006年以来我国二氧化硫年排放量呈减少趋势,而不是与年份正相关,故D错误.故选D.3.【答案】D【考点】收集数据的方法【解析】利用排除法,本题既不是系统抽样,又不是分层抽样,它的形式类似于简单随机抽样,但它不符合简单随机抽样的两种形式抽签法和随机数表法,不属于三种抽样方法的任一种.【解答】解:由题意知,本题既不是系统抽样,也不是分层抽样,它的形式类似于简单随机抽样,但是它不符合简单随机抽样的两种形式,即抽签法和随机数表法;∴排除系统抽样,分层抽样和简单随机抽样三种方法.故选:D.二、填空题(本题共计 1 小题,共计5分)4.【答案】6.8【考点】茎叶图极差、方差与标准差【解析】根据茎叶图所给的数据,做出这组数据的平均数,把所给的数据和平均数代入求方差的个数,求出五个数据与平均数的差的平方的平均数就是这组数据的方差.【解答】∵ 根据茎叶图可知这组数据是8,9,10,13,15这组数据的平均数是8+9+10+13+155=11 ∴ 这组数据的方差是15[(8−11)2+(9−11)2+(10−11)2+(13−11)2+(15−11)2]=15[9+4+1+4+16]=6.8三、 解答题 (本题共计 1 小题 ,共计5分 )5.【答案】解:(1)由题意得{(a +b +0.12+0.14+0.10+0.04)×2=1,50×b ×2−50×a ×2=4,解得a =0.03,b =0.07.(2)设应该制定的月销售冲刺目标值为x 万元,则在频率分布直方图中x 右边的面积为1−0.8=0.2.最后一组的面积是0.04×2=0.08,最后两组的面积之和为0.10×2+0.04×2=0.28.因为0.08<0.2<0.28,所以x 位于倒数第二组,则(22−x )×0.10+0.08=0.2,解得x =20.8.所以该企业的月销售冲刺目标值应该定为20.8万元.【考点】频率分布直方图【解析】无无【解答】解:(1)由题意得{(a +b +0.12+0.14+0.10+0.04)×2=1,50×b ×2−50×a ×2=4,解得a =0.03,b =0.07.(2)设应该制定的月销售冲刺目标值为x 万元,则在频率分布直方图中x 右边的面积为1−0.8=0.2.最后一组的面积是0.04×2=0.08,最后两组的面积之和为0.10×2+0.04×2=0.28.因为0.08<0.2<0.28,所以x位于倒数第二组,则(22−x)×0.10+0.08=0.2,解得x=20.8.所以该企业的月销售冲刺目标值应该定为20.8万元.。
第7章 抽样调查及答案

第七章 抽样调查一、本章重点1.抽样调查也叫做抽样推断或参数估计,必须坚持随机抽样的原则。
它是一种非全面调查,其意义在于对总体的推断上,存在可控制性误差。
是一种灵活快捷的调查方式。
2.抽样调查有全及总体与样本总体之区分。
样本容量小于30时一般称为小样本。
对于抽样调查来讲全及总体的指标叫做母体参数,是唯一确定的未知的量,样本指标是根据样本总体各单位标志值计算的综合性指标,是样本的一个函数,是一个随机变量,抽样调查就是要用样本指标去估计相应的总体指标。
样本可能数目与样本容量有关也与抽样的方法有关。
抽样方法可以分为考虑顺序的抽样与不考虑顺序的抽样;重复抽样与不重复抽样。
3.大数定律、正态分布理论、中心极限定理是抽样调查的数理基础。
正态分布的密度函数有两个重要的参数(σ;x )。
它有对称性、非负性等特点。
中心极限定理证明了所有样本指标的平均数等于总体指标如X x E =)(。
推出了样本分布的标准差为:1--=N n N n x σμ。
4.抽样推断在逻辑上使用的是归纳推理的方法、在方法上使用的是概率估计的方法、存在着一定误差。
无偏性、一致性和有效性是抽样估计的优良标准。
抽样调查既有登记性误差,也有代表性误差,抽样误差是一个随机变量,而抽样的平均误差是一个确定的值。
抽样误差受总体标志值的差异程度、样本容量、抽样方法、抽样组织形式的影响。
在重复抽样下抽样的平均误差与总体标志值的差异程度成正比,与样本容量的平方根成反比即n x σμ=,不重复抽样的抽样平均误差仅与重复抽样的平均误差相差一个修正因子即N nn x -=1σμ。
在通常情况下总体的方差是未知的,一般要用样本的方差来代替。
把抽样调查中允许的误差范围称作抽样的极限误差x ∆或p ∆。
μt =∆,用抽样的平均误差来度量抽样的极限误差。
把抽样估计的把握程度称为抽样估计的置信度。
抽样的极限误差越大,抽样估计的置信度也越大。
抽样估计又可区分为点估计和区间估计。
医学统计学练习题及答案

一、单向选择题1。
医学统计学研究的对象是 E。
有变异的医学事件2。
用样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体3。
下列观测结果属于等级资料的是 D.病情程度4。
随机误差指的是 E。
由偶然因素引起的误差5. 收集资料不可避免的误差是 A。
随机误差1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是A。
中位数2。
算术均数与中位数相比,其特点是 B.能充分利用数据的信息3. 一组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较小一侧4。
将一组计量资料整理成频数表的主要目的是E。
提供数据和描述数据的分布特征1. 变异系数主要用于 A.比较不同计量指标的变异程度2。
对于近似正态分布的资料,描述其变异程度应选用的指标是E. 标准差3。
某项指标95%医学参考值范围表示的是D。
在“正常”总体中有95%的人在此范围4.应用百分位数法估计参考值范围的条件是B.数据服从偏态分布5.已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用 E.四分位数间距1。
样本均数的标准误越小说明 E。
由样本均数估计总体均数的可靠性越大2。
抽样误差产生的原因是D.个体差异3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C。
正态分布4。
假设检验的目的是 D.检验总体参数是否不同5。
根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L~9。
1×109/L,其含义是 E。
该区间包含总体均数的可能性为95%1。
两样本均数比较,检验结果说明 D。
不支持两总体有差别的结论2. 由两样本均数的差别推断两总体均数的差别,其差别有统计学意义是指E。
有理由认为两总体均数有差别3。
两样本均数比较,差别具有统计学意义时,P值越小说明 D。
越有理由认为两总体均数不同4. 减少假设检验的Ⅱ类误差,应该使用的方法是 E。