北师大版数学高一必修3优化练习1.5用样本估计总体

合集下载

高中数学第一章统计1.5用样本估计总体知识导航北师大版必修3201703080357

高中数学第一章统计1.5用样本估计总体知识导航北师大版必修3201703080357

§5用样本估计总体知识梳理1.在实际问题中,直接得到总体的全部数字信息往往比较困难,而常常进行抽样调查,即从总体中抽取一部分作为样本,并用样本的各种信息来估计总体的情况,主要包括样本数据的频率分布和基本数字特征.2.要估计总体频率分布情况,我们常用频率分布直方图和频率折线图来表达.3.在频率分布直方图中,纵轴表示各组的宽度,数据落在各小组内的频率用小矩形表示.各个小矩形的面积总和为1.4.连接频率分布直方图中各小矩形上端的中点,就得到频率分布折线图.随着样本容量的不断增加,所分的区间数也不断增加,而区间的长度在不断减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线.知识导学在前面我们学习的三种不同的抽样方法,目的是为了从总体中获得一个易得、有代表性的样本,这是统计的任务之一;统计的第二任务是用样本来估计总体,这也是统计的基本思想.用样本的情况估计总体的相应情况,大体上有两类,其中之一就是本节要学的“用样本的频率分布估计总体分布”.所以在学本节前,需系统回顾抽样方法.学习时可结合图形的变化,即由样本数据的频率分布直方图→折线图→总体密度曲线,理解样本数据的重要性和用样本估计总体的可行性.对于总体中个体取值较少的情况,我们常用条形图表示其样本分布;而对于个体取值较多或无限的总体,我们则常用频率分布直方图、频率分布表、频率分布折线图等图表形式表示样本分布.一般样本容量越大,这种估计越精确.特别注意:列(画)频率分布表(直方图)时的求解顺序,并明确频率分布直方图中,每个小矩形的面积等于相应各组的频率,而各组频率的和等于1(即各个小矩形面积之和为1),体会当样本容量无限增大时,组数也相应无限增多,此时频率分布折线图就无限接近一条光滑的曲线——总体密度曲线.本节的重点是在表示样本数据的过程中,学会列频率分布表、画频率分布直方图和频率折线图,体会它们各自的特点.本节的难点是对总体分布概念的理解和统计思想的建立.疑难突破1.在统计中,经常用数据的频率分布直方图来估计总体的分布情况.直方图中样本的分布和总体分布的关系是什么?剖析:当样本容量较大时,样本中落在每个区间内的样本数的频率会稳定于总体在相应区间内取值的概率.因此,我们可以用样本的频率分布直方图来估计总体在任意区间内取值的频率,也即总体的分布情况.由刚才分析可知,在样本的频率分布中,随着样本容量的不断扩大,其分布越来越接近总体分布,当样本容量无限加大,而组距无限缩小时,频率分布直方图的上方将演变成一条光滑的曲线.在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连结各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图,有时也用它来估计总体的分布情况.下面就作上面产品尺寸那个例子的频率折线图1-5-1,注意观察它与前几个图的不同点.图1-5-1由前面我们已经知道:频率分布直方图的面积为 1.同样,我们不难证明:折线与横轴所围成的面积也是1,因此,当样本容量比较大时,我们还可以用频率折线图来估计总体的分布情况.2.用样本估计总体是统计的基本思想.那么在对总体分布的估计中是怎样体现这一思想的? 剖析:用样本估计总体的某一指标的时候,由于样本毕竟不是总体,所以用样本来估计总体一般来说是有误差的,只是误差的大小而已.当样本的选取合理,具有代表性的时候误差就很小.例如,在全国范围内的测验中,如果民意测验者走进大学校园里去访问1 000名大学生,对他们进行民意调查,他们所组成的样本将不会公平地代表全国的民意,这是因为大学生选民的比例很小,而且是一个有倾向性的团体,不能代表全体选民,这样的不公平就使得样本估计总体的误差比较大,这就是样本的选取不合理造成的.典题精讲例1 某公司对已制造出售的洗衣机安全无故障运行时间进行抽样调查,以便制定技术更新计划,调查情况如下表所示:已购时间(h) 1 500~3 000 3 000~4 500 4 500~6 000 6 000~7 500 7 500~9 000 台数300 450 1 200 600 450(1)列出频率分布表;(2)画出频率分布直方图;(3)估计机器无故障时间7 500 h以内的可能性.思路分析:从所给的数据表格我们知道总样本数为300+450+1 200+600+450=3 000,区间组数已经给划分好了,直接就可列出频率分布表,进而画出频率分布直方图,回答问题.解:(1)样本频率分布表如下表:无故障时间(h) 频数频率累积频率1 500~3 000 300 0.10 0.13 000~4 500 450 0.15 0.254 500~6 000 1 200 0.40 0.656 000~7 500 600 0.20 0.857 500~9 000 450 0.15 1合计 3 000 1(2)频率分布直方图如图1-5-2所示.图1-5-2(3)由题意可知机器无故障时间7 500 h 以内的可能性就是机器无故障时间1 500~3 000 h,3 000~4 500 h,4 500~6 000 h,6 000~7 500 h 的频率之和,即0.10+0.15+0.40+0.20=0.85. 绿色通道:频率=样本容量频数,某数值对应的累积频率=该数值的所有区间对应的频率的和(如果有的话).该行的累积频率=该行和该行前面的所有行(如果有的话)的频率的总和=前一行累积频率+该行的频率;频率分布直方图中每个矩形的面积就等于相应组的频率,即组距频率×组距=频率,各组频率的和等于1,因此,各小矩形的面积的和等于1. 变式训练 为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17.5~18岁的男生的体重情况,结果如下(单位:kg).56.5 69.5 65 61.5 64.5 66.5 64 64.5 76 58.572 73.5 56 67 70 57.5 65.5 68 71 7562 68.5 62.5 66 59.5 63.5 64.5 67.5 73 6855 72 66.5 74 63 60 55.5 70 64.5 5864 70.5 57 62.5 65 69 71.5 73 62 5876 71 66 63.5 56 59.5 63.5 65 70 74.568.5 64 55.5 72.5 66.5 68 76 57.5 60 71.557 69.5 74 64.5 59 61.5 67 68 63.5 5859 65.5 62.5 69.5 72 64.5 75.5 68.5 64 62 65.5 58.5 67.5 70.5 65 66 66.5 70 63 59.5试根据上述数据画出样本的频率分布直方图,并对相应的总体分布作出估计.解:按照下列步骤获得样本的频率分布:(1)求最大值与最小值的差.在上述数据中,最大值是76,最小值是55,极差是76-55=21.(2)确定组距与组数.如果将组距定为2,那么由21÷2=10.5,组数为11,这个组数是适合的.于是组距为2,组数为11.(3)决定分点.根据本例中数据的特点,第1小组的起点可取为54.5,第1小组的终点可取为56.5,为了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是“左闭右开”的.这样,所得到的分组是[54.5,56.5),[56.5,58.5),…,[74.5,76.5].(4)列频率分布表.分组 频数 频率[54.5,56.5) 2 0.02[56.5,58.5) 6 0.06[58.5,60.5) 10 0.10[60.5,62.5) 10 0.10[62.5,64.5) 14 0.14[64.5,66.5) 16 0.16[66.5,68.5) 13 0.13[68.5,70.5) 11 0.11[70.5,72.5) 8 0.08[72.5,74.5) 7 0.07[74.5,76.5] 3 0.03合计100 1.00(5)绘制频率分布直方图.频率分布直方图如图1-5-3所示.图1-5-3由于图中各小长方形的面积等于相应各组的频率,这个图形的面积的形式反映了数据落在各个小组的频率的大小.在反映样本的频率分布方面,频率分布表比较确切,频率分布直方图比较直观,它们起着相互补充的作用.在得到了样本的频率后,就可以对相应的总体情况作出估计.例如可以估计体重在[64.5,66.5) kg的学生最多,约占学生总数的16%;体重小于58.5 kg 的学生较少,约占8%等.例2对某班50人进行智力测试,其得分为:62,46,63,56,92,74,48,64,41,86,79,71,69,82,85,68,64,62,68,81,57,93,53,74,76,5 6,78,47,66,55,64,52,87,69,43,73,97,68,56,67,59,78,52,79,44,55,69,57,31,54.(1)列出频率分布表及相应的频率分布直方图;(2)由频率分布直方图你能看出点什么吗?思路分析:这个样本量较大并且含有相同数据的样本少,需按照我们前面所说的五步来操作频率分布直方图,关于第(2)问由频率分布直方图的意义不难看出.解:(1)由于最大值为97,最小值为31,则组距为10,各区间为[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]共7个区间,所以频率分布表如下:区间[30,40) [40,50) [50,60) [60,70) [70,80) [80,90) [90,100]频数 1 6 12 14 9 6 2频率0.02 0.12 0.24 0.28 0.18 0.12 0.04 频率分布直方图(图1-5-4)为图1-5-4(2)由频率分布直方图可以看出,智力处在中等的频率较大,而智力成绩特别高和特别低的频率比较小.绿色通道:在作频率分布直方图时可按下列步骤完成:第一步,找出最大值与最小值,计算其差;第二步,决定组距,从而得出组数;第三步,决定第一组的起点(一般稍微小一点),从而决定各个分段点;第四步,算出各组的频数与频率,从而列出频率分布表;第五步,画出频率分布直方图.变式训练 在风帆比赛中,成绩以低分为优胜,比赛共11场,并以最佳的9场成绩计算最终的名次,前7场比赛结束后,五名选手的积分情况如下表所示.运动员 比赛场次 总分 1 2 3 4 5 6 7 8 9 10 11甲 3 2 2 2 4 2 7 22 乙 2 3 6 1 10 5 5 32 丙 7 8 4 4 3 1 8 35 丁 5 5 14 5 5 6 4 44 戊 4 13 5 9 2 7 6 46 根据上面的比赛结果,请你比较各选手之间的成绩,并预测谁将获得最后的胜利.思路分析:可以先用样本平均数与标准差来分析.把前7场比赛成绩看成一个样本,由样本去估计总体.解:分别计算这五位选手前7场比赛积分的平均数和标准差:甲x =3.14,乙x =4.57,丙x =5.00,丁x =6.29,戊x =6.57;s 甲=1.73,s 乙=2.77,s 丙=2.51,s 丁=3.19,s 戊=3.33.由此可以看出甲的成绩最为优异,而且表现也最为稳定,把前7场比赛的成绩看作是总体的一个样本,可以估计每位运动员最后比赛的成绩,因此预测甲会获胜.问题探究问题 我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a ,用水量不超过a 的部分按平价收费,超出a 的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a 定为多少比较合适呢?你认为,为了较合理地确定这个标准,需要做哪些工作? 导思:为了制定出居民用水量的标准,需要了解广大居民的实际月用水量大部分在什么数值范围内.但由于居民户较多,全部调查不易操作,故可采取抽样调查的方式获取一个有代表性的样本,然后通过样本的情况估计所有居民的月用水量,以便制定出这个标准.探究:很显然,如果标准太高,会影响居民的日常生活;如果标准太低,则不利于节水.为了确定一个较合理的标准,必须先了解居民日常用水的分布情况,比如月平均用水量在哪个范围内的居民最多,他们占全市居民的百分比情况等.由于城市居民户较多,通常采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.假设通过抽样我们获得了100位居民今年的月均用水量(单位:t):100位居民2006年的月均用水量(单位:t):3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.64.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.84.33.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.02.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2面对这些随意记录的数据,除了发现月用水量的最大值是4.3和最小值是0.2之外,很难再看出其他信息.为此我们需要对这些数据进行分析整理.分析数据的一种最基本的方法是用图(即频率分布直方图)将它们画出来,以便从数据中提取信息和传递信息,或者是用紧凑的表格(即频率分布表)改变数据的排列方式.下表是100位居民2006年的月均用水量的频率分布表:分组频数频率[0,0.5) 4 0.04[0.5,1) 8 0.08[1,1.5) 15 0.15[1.5,2) 22 0.22[2,2.5) 25 0.25[2.5,3) 14 0.14[3,3.5) 6 0.06[3.5,4) 4 0.04[4,4.5] 2 0.02合计100 1.00频率分布直方图如图1-5-5所示:图1-5-5上面的图和表显示了样本数据落在各个小组的比例大小.从中我们可以看到,月用水量在区间[2,2.5)内的居民最多,在[1.5,2)的次之,大部分居民的月用水量都在[1,3)之间,其中月用水量在3 t以上的居民所占的比例为6%+4%+2%=12%,即大约占12%的居民月用水量在3 t 以上,88%的居民月用水量在3 t以下.因此居民月用水量标准定为3 t是一个可以考虑的标准.。

数学必修三《用样本估计总体》

数学必修三《用样本估计总体》
3、平均数可以反映出更多的关于样本数据全体 的信息,但平均数受数据中的极端值的影响较大, 使平均数在估计时可靠性降低。
极差、方差、标准差
极差:是指一组数据中最大数据与最小数据的差. 方差:是各个数据与平均数之差的平方的平均数,即
s2 1 n
2
x1 x Leabharlann x2 x 2 xn x 2 ,
组距
0.5 0.4
0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)
三种数字特征的优缺点
1、众数体现了样本数据的最大集中点,但它 对其它数据信息的忽视使得无法客观地反映 总体特征.
2、中位数是样本数据所占频率的等分线,它不 受少数几个极端值的影响,这在某些情况下是优 点,但它对极端值的不敏感有时也会成为缺点。
成绩(单 位: 米)
人数
1.50 1.60 1.65
2
3
2
1.70 3
1.75 4
1.80 1
1.85 1
1.90 1
众数、中位数、平均数与频率分布直方图的关系
1、众数在样本数据的频率分布直方图中,就是最高矩形的中点 的横坐标。 2、在频率分布直方图中,中位数左边和右边的直方图的面积应 该相等,由此可以估计中位数的值。下图中蓝色实线代表居民月 均用水量的中位数的估计值,此数据值为2.03t. 3、平均数是频率分布直方图的“重心”.是直方图的平衡点.如 黄色实线频率
【思考】为了直观反映样本数据在各组中的分布情况,我 们将上述频率分布表中的有关信息用下面的图形表示:
频率 组距
0.5 0.4 0.3 0.2 0.1
O0.5 1 1.5 2 2.5 3 3.5 4 4.5

2020-2021学年北师大版高中数学必修三《用样本估计整体》同步练习及解析

2020-2021学年北师大版高中数学必修三《用样本估计整体》同步练习及解析

最新(新课标)北师大版高中数学必修三用样本估计总体同步练习(一)1.为了解我国13岁男孩的平均身高,从北方抽取了300个男孩,平均身高1.60m;从南方抽取了200个男孩,平均身高为1.50m,由此可推断我国13岁男孩的平均身高为()A、1.54mB、1.55mC、1.56mD、1.57m2.下列说法正确的是()A、样本中所有个体的总和是总体B、方差的平方根叫做标准美C、样本平均数与总体平均数相等D、在一组数据中,出现次数最多的数据叫做这组数据的众数3.下列说法正确的是()A、在两组数据中,平均值较大的一组方差较大B、平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小C、方差的求法是求出各个数据与平均值的差的平方后再求和D、在记录两个人射击环数的两组数据中,方差大的表示射击水平高4.样本101,98,102,100,99的标准差为()A、2B、0C、1D、210.为了了解中学生的身高情况,对育才中学同龄的50名男学生的身高进行了测量,结果如下:(单位:cm):175 168 180 176 167 181 162 173 171 177171 171 174 173 174 175 177 166 163 160166 166 163 169 174 165 175 165 170 158174 172 166 172 167 172 175 161 173 167170 172 165 157 172 173 166 177 169 181列出样本的频率分布表,画出频率分布直方图。

11.已知50个数据的分组以及各组的频数如下:153.5-155.5 2 161.5-163.5 10155.5-157.5 7 163.5-165.5 6157.5-159.5 9 165.5-167.5 4159.5-161.5 11 167.5-169.5 1 (1)列出频率分布表;(2)列出累积频率分布表;(3)画出频率分布直方图和频率分布折线图;(4)画出累积频率分布图。

高中数学 1.56 用样本估计总体课时作业 北师大版必修3

高中数学 1.56 用样本估计总体课时作业 北师大版必修3

§5用样本估计总体§6统计活动:结婚年龄的变化课时目标1.通过实例体会分布的意义和作用,会作频率分布直方图和频率折线图,会用样本的频率分布估计总体的分布.2.会用样本的数字特征估计总体的数字特征.3.体会样本估计总体的思想、初步了解频率分布的随机性.1.频率分布直方图中,数据落在各个区间内频率的大小,是该区间所对应的_______.2.当样本量较大时,样本中落在每个区间内样本数的频率会稳定于______________.3.我们可以用样本平均数和样本标准差,来分别估计______________________.一、选择题1.下列说法不正确的是( )A.频率分布直方图中每个小矩形的高就是该组的频率B.频率分布直方图中各个小矩形的面积之和等于1C.频率分布直方图中各个小矩形的宽一样大D.频率分布折线图是从所加的左边区间的中点开始,用线段依次连接频率分布直方图的每个小矩形上端中点,直至右边所加区间的中点得到的组距[10,20)[20,30)[30,40)[40,50)[50,60)[60,70)频数23454 2A.0.5 B.0.24 C.0.6 D.0.73.100辆汽车通过某一段公路时的时速的频率分布直方图如下图所示,则时速在[60,70)的汽车大约有( )A.30辆 B.40辆C.60辆 D.80辆4.为了让人们感受丢弃塑料袋对环境造成的影响,某班环保小组的六名同学记录了自己家中一周内丢弃的塑料袋的数量,结果如下(单位:个):33,25,28,26,25,31.如果该班有45名学生,那么根据提供的数据估计本周全班同学各家总共丢弃塑料袋的数量约为( )A.900个 B.1 080个C.1 260个 D.1 800个5.某工厂对一批产品进行了抽样检测.下图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )A.90 B.75题号1234 5答案6.在样本的频率分布直方图中,共有5个小长方形,已知中间一个小长方形面积是其余4个小长方形面积之和的13,且中间一组的频数为10,则这个样本容量是________.7.某中学举办电脑知识竞赛,满分为100分,80分以上为优秀(含80分).现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成频率分布直方图如下图所示.已知图中从左到右的第一、三、四、五小组的频率分别为0.30、0.15、0.10、0.05,而第二小组的频数是40,则参赛的人数是________,成绩优秀的频率是________.8.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是____________.9.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在各组上的频率为m,该组上直方图的高为h,则|a-b|=________.三、解答题10.美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54, 42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.11.抽查100袋洗衣粉,测得它们的重量如下(单位:g):494 498 493 505 496 492 485 483 508 511495 494 483 485 511 493 505 488 501 491493 509 509 512 484 509 510 495 497 498504 498 483 510 503 497 502 511 497 500493 509 510 493 491 497 515 503 515 518510 514 509 499 493 499 509 492 505 489494 501 509 498 502 500 508 491 509 509499 495 493 509 496 509 505 499 486 491492 496 499 508 485 498 496 495 496 505499 505 496 501 510 496 487 511 501 496(1)列出样本的频率分布表:(2)画出频率分布直方图,频率分布折线图;(3)估计重量在[494.5,506.5]g的频率以及重量不足500 g的频率.能力提升12.在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,你会得到什么结论?13.某市2010年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表.(2)作出频率分布直方图.(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.绘制频率分布直方图的具体步骤:①求极差:找出一组数据中的最大值和最小值,最大值与最小值的差是极差(正值).②确定组距与组数:组数与样本容量有关,当样本容量答案 知识梳理1.频率直方图的面积 2.总体在相应区间内取值的概率 3.总体的平均数和标准差 作业设计 1.A 2.D3.B [时速在[60,70)的汽车的频率为:0.04×(70-60)=0.4,又因汽车的总辆数为100,所以时速在[60,70)的汽车大约有0.4×100=40(辆).]4.C [样本的平均数为28,估计总共:45×28=1 260个.]5.A [∵样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36,∴样本总数为360.3=120.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.] 6.40解析 可知中间长方形的面积是所有长方形面积的14,即频率为14,∴样本容量为1014=40.7.100 0.15 8.45,46解析 由茎叶图及中位数的概念可知 x 甲中=45,x 乙中=46. 9.m h 解析频率组距=h ,故|a -b|=组距=频率h =mh. 10.解分组 频数累计 频数频率 [41.5,45.5)2 0.045 5 [45.5,49.5)正 7 0.159 1 [49.5,53.5)正 8 0.181 8 [53.5,57.5)正正正 160.363 6 [57.5,61.5)正 5 0.113 6 [61.5,65.5)40.090 9[65.5,69.5]2 0.045 5合计441.00(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小.11.解 (1)在样本数据中,最大值是518,最小值是483,它们相差35,若取组距为4,由于354=834,要分9组,组数合适,于是决定取组距为4 g ,分9组,使分点比数据多一位小数,且把第一组起点稍微减小一点,得分组如下:[482.5,486.5),[486.5,490.5),…,[514.5,518.5). 列出频率分布表:分组 个数累计频数频率累积频率[482.5,48 6.5) 正 8 0.080.08 [486.5,490.5) 3 0.030.11 [490.5,49 4.5) 正正正170.170.28 [494.5,498.5) 正正正正-21.210.49 [498.5,50 2.5) 正正 14.140.63 [502.5,50 6.5) 正 9 0.090.72 [506.5,510.5) 正正正190.190.91 [510.5,514.5) 正- 6 0.060.97 [514.5,518.5]3 0.031.00 合计1001.00(2)频率分布直方图与频率分布折线图如图.(3)重量在[494.5,506.5]g 的频率为:0.21+0.14+0.09=0.44. 设重量不足500 g 的频率为b ,根据频率分布表,b -0.49500-498.5≈0.63-0.48502.5-498.5,故b ≈0.55.因此重量不足500 g 的频率约为0.55.12.解 (1)(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物需要通俗易懂、简明.13.解 (1)频率分布表:(2)频率分布直方图如图所示. (3)答对下述两条中的一条即可:①该市有一个月中空气污染指数有2天处于优的水平,占当月天数的115;有26天处于良的水平,占当月天数的1315;处于优或良的天数为28,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数2,占当月天数的1730,超过50%;说明该市空气质量有待进一步改善.。

北师大版数学高一必修3练习 1.5.2 估计总体的数字特征

北师大版数学高一必修3练习 1.5.2 估计总体的数字特征

[A 基础达标]1.某台机床加工的1 000只产品中次品数的频率分布如下表:次品数 0 1 2 3 4 频率0.50.20.050.20.05A .0,1.1B .0,1C .4,1D .0.5,2解析:选A.由题意知,众数为0.数据x i 出现的频率为p i (i =1,2,…,5),则x 1,x 2,…,x 5的平均数为x 1p 1+x 2p 2+…+x 5p 5=0×0.5+1×0.2+2×0.05+3×0.2+4×0.05=1.1.2.(2015·高考山东卷)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:甲乙 9 8 6 2 8 9 1 130 1 2①甲地该月14 ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) A .①③ B .①④ C .②③D .②④解析:选B.甲地该月14时的气温数据分布在26和31之间,且数据波动较大,而乙地该月14时的气温数据分布在28和32之间,且数据波动较小,可以判断结论①④正确,故选B.3.样本中共有5个个体,其值分别为a ,0,1,2,3,若该样本的平均值为1,则样本方差为( )A.65B.65C. 2D .2解析:选D.由题意知15×(a +0+1+2+3)=1,解得a =-1,所以样本方差为s 2=15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2,故选D.4.在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )A .众数B .平均数C .中位数D .标准差解析:选D.只有标准差不变,其中众数、平均数和中位数都加2.5.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:A.25 B.725 C.35D .2解析:选A. x —甲=7,s 2甲=15[(6-7)2+(7-7)2+(7-7)2+(8-7)2+(7-7)2]=25, x —乙=7,s 2乙=15[(6-7)2+(7-7)2+(6-7)2+(7-7)2+(9-7)2]=65, 两组数据的方差中较小的一个为s 2甲,即s 2=25.故选A. 6.甲、乙两人在相同的条件下练习射击,每人打5发子弹,命中的环数如下: 甲:6,8,9,9,8; 乙:10,7,7,7,9. 则两人的射击成绩较稳定的是________. 解析:由题意求平均数可得 x —甲=x —乙=8,s 2甲=1.2,s 2乙=1.6,s 2甲<s 2乙,所以甲稳定.答案:甲7.10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则三个数从小到大的关系为________.解析:将数据从小到大排列为10,12,14,14,15,15,16,17,17,17,则平均数a =110(10+12+14×2+15×2+16+17×3)=14.7,中位数b =15,众数c =17,显然a <b <c .答案:a <b <c8.若40个数据的平方和是56,平均数是22,则这组数据的方差是________,标准差是________.解析:设这40个数据为x i (i =1,2,…,40),平均数为x . 则s 2=140×[(x 1-x —)2+(x 2-x —)2+…+(x 40-x —)2]=140[x 21+x 22+…+x 240+40x —2-2x (x 1+x 2+…+x 40)] =140×⎣⎡⎦⎤56+40×⎝⎛⎭⎫222-2×22×40×22 =140×⎝⎛⎭⎫56-40×12 =0.9. 所以s =0.9=910=31010. 答案:0.9310109.下表是某校学生的睡眠时间抽样频率分布表(单位:h),试估计该校学生的日平均睡眠时间.解:法一:日平均睡眠时间为x —=1100(6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2)=1100×739=7.39(h).法二:求组中值与对应频率之积的和:x —=6.25×0.05+6.75×0.17+7.25×0.33+7.75×0.37+8.25×0.06+8.75×0.02=7.39(h).所以,估计该校学生的日平均睡眠时间约为7.39 h.10.如图所示的是甲、乙两人在一次射击比赛中中靶的情况(击中靶中心的圆面为10环,靶中各数字表示该数字所在圆环被击中时所得的环数),每人射击了6次.(1)请用列表法将甲、乙两人的射击成绩统计出来;(2)请用学过的统计知识,对甲、乙两人这次的射击情况进行比较. 解:(1)甲、乙两人的射击成绩统计表如下:环数 6 7 8 9 10 甲命中次数 0 0 2 2 2 乙命中次数132(2) x —甲=16×(8×2+9×2+10×2)=9(环),x —乙=16×(7×1+9×3+10×2)=9(环),s 2甲=16×[(8-9)2×2+(9-9)2×2+(10-9)2×2]=23, s 2乙=16×[(7-9)2+(9-9)2×3+(10-9)2×2]=1, 因为x 甲=x 乙,s 2甲<s 2乙,所以甲与乙的平均成绩相同,但甲的发挥比乙稳定.[B 能力提升]1.为了增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m o ,平均值为x ,则( )A .m e =m o =x —B .m e =m o <x —C .m e <m o <x —D .m o <m e <x —解析:选D.由题意得m o =5,m e =5+62=5.5,x —=2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030=17930,显然x —>m e >m o ,故选D. 2.已知一组数据x 1、x 2、…、x n 的平均数为5,方差为4,则数据3x 1+7,3x 2+7,…,3x n +7的平均数和方差分别为( )A .22、42B .22、36C .52、36D .52、19解析:选B.由题意得1n (x 1+x 2+…+x n )=5,1n [(x 1-5)2+(x 2-5)2+…+(x n -5)2]=4, 1n (3x 1+7+3x 2+7+…+3x n +7)=3×1n(x 1+x 2+…+x n )+7=22, 1n [(3x 1+7-22)2+(3x 2+7-22)2+…+(3x n +7-22)2]=9×1n [(x 1-5)2+(x 2-5)2+…+(x n -5)2]=36.故选B.3.某人5次上班途中所花的时间(单位:min)分别为x ,y ,10,11,9.若这组数据的平均数为10,方差为2,则|x -y |的值为________.解析:由平均数公式,得(x +y +10+11+9)×15=10,则x +y =20.又因为方差为2,所以[(x -10)2+(y -10)2+(10-10)2+(11-10)2+(9-10)2]×15=2,得x 2+y 2=208,2xy =192,所以|x -y |=(x -y )2=x 2+y 2-2xy =4.答案:44.(选做题)某地区100位居民的人均月用水量(单位:t)的分组及各组的频数如下: 0~0.5,4;0. 5~1,8;1~1.5,15;1.5~2,22;2~2.5,25;2.5~3,14;3~3.5,6;3.5~4,4;4~4.5,2.(1)列出样本的频率分布表;(2)画出频率分布直方图,并根据直方图估计这组数据的平均数、中位数、众数; (3)当地政府制定了人均月用水量为3 t 的标准,若超出标准加倍收费,当地政府说,85%以上的居民不超过这个标准,这个解释对吗?为什么?解:(1)频率分布表分组频数频率0~0.540.040.5~180.081~1.5150.151.5~2220.222~2.5250.252.5~3140.143~3.560.063.5~440.044~4.520.02合计1001(2)频率分布直方图如图:众数:2.25,中位数:2.02,平均数:2.02.(3)人均月用水量在3 t以上的居民所占的比例为6%+4%+2%=12%,即大约有12%的居民人均月用水量在3 t以上,88%的居民人均月用水量在3 t以下,因此政府的解释是正确的.。

2020版高中数学 第一章 统计 1.5.1 估计总体的分布练习 北师大版必修3

2020版高中数学 第一章 统计 1.5.1 估计总体的分布练习 北师大版必修3

5.1估计总体的分布A组1.下列叙述正确的是()A.从频率分布表可以看出样本数据对于平均数的波动大小B.频数是指落在各个小组内的数据C.每个小组的频数与样本容量之比是这个小组的频率D.组数是样本平均数除以组距解析A中表示样本数据对于平均数波动大小的为方差与标准差;B中频数为落在各小组内数据的个数;D中组数是极差除以组距.答案C2.已知样本10,8,10,8,6, 13,11,10,12,7,9,8,12,9,11,12,9,10,11,10,那么频率为0.2的范围是()A.5.5~7.5B.7.5~9.5C.9.5~11.5D.11.5~13.5解析由题意知,共20个数据,频率为0.2,在此范围内的数据有20×0.2=4(个),观察各选项,只有在11.5~13.5范围内有4个数据:13,12,12,12,故选D.答案D3.(2018山东泰安高一检测)在样本的频率分布直方图中,某个小长方形的面积是其他小长方形面积之和的,已知样本容量是80,则该组的频数为()A.20B.16C.30D.35解析设该组的频数为x,则其他组的频数之和为4x,由样本容量是80,得x+4x=80,解得x=16,即该组的频数为16,故选B.答案B4.为了解某校男生体重情况,将样本数据整理后,画出其频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第3小组的频数为12,则样本容量是()A.32B.160C.45D.48解析由已知得从左到右前3个小组的频率之和等于1-(0.012 5+0.037 5)×5=0.75,于是第3小组×0.75=0.375.若样本容量为n,则有=0.375,所以n=32.答案A200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140解析设所求人数为N ,则N=2.5×(0.16+0.08+0.04)×200=140,故选D . 答案D6.如图是一次数学考试结果的频率分布直方图,若规定60分以上(含60分)为考试合格,则这次考试的合格率为 .解析由频率分布直方图可得考试的合格率为(0.024+0.012)×20=0.72=72%. 答案72%50名学生在一次健康体检中,身高全部介于155 cm 与185 cm 之间.其身高频率分布直方图如图所示,则在该班级中身高位于[170,185]之间的学生共有 人.解析身高在[170,185]之间的学生共有50-50×[(0.004+0.036+0.072)×5]=50-28=22(人). 答案22n 的样本中的数据分成6组,绘制成频率分布直方图.若第一组至第六组数据的频率之比3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n 等于 . 答案60,寿命/h个数100~2020200~3030300~4080400~5040500~6030(1)列出频率分布表; (2)作出频率分布直方图;(3)作出频率折线图.解(1)频率分布表如下:数据分组(Δx i) 频数(n i)频率(f i)100~200 20 0.10 0.001 0200~300 30 0.15 0.001 5300~400 80 0.40 0.00 4 0400~500 40 0.20 0.00 2 0500~600 30 0.15 0.001 5(2)由上表得频率分布直方图如图所示.(3)在上面的频率分布直方图中左右各加一个区间0~100,600~700,然后分别取0~100及600~700的中点以及各个矩形的顶端中点,再用线段依次连接起来,得到如图所示的频率折线图.10.为增强市民节能环保意识,某市面向全市征召义务宣传志愿者,现从符合条件的500名志愿者中随机抽取100名志愿者,分组(Δx i单位:岁) 频数(n i)频率(f i)[20,25) 5 0.05 [25,30) ①0.20 [30,35) 35 ②[35,40) 30 0.30 [40,45] 10 0.10 合计100 1.00(1)频率分布表中的①②位置应填什么数据?(2)补全如图所示的频率分布直方图,再根据频率分布直方图估计这500名志愿者中年龄在[30,35)岁的人数.解(1)设年龄在[25,30)岁的频数为x,年龄在[30,35)岁的频率为y.法一:根据题意可得=0.20,=y,解得x=20,y=0.35,故①处应填20,②处应填0.35.法二:由题意得5+x+35+30+10=100,0.05+0.20+y+0.30+0.10=1,解得x=20,y=0.35,故①处填20,②处填0.35.(2)由频率分布表知年龄在[25,30)岁的频率是0.20,组距是5.所以=0.04.补全频率分布直方图如图所示.根据频率分布直方图估计这500名志愿者中年龄在[30,35)岁的人数为500×0.35=175.B组1.某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:g)数据绘制的频率分布直方图,其中产品净重的范围是96~106,样本数据分组为96~98,98~100,100~102,102~104,104~106,已知样本中产品净重小于100 g的个数是36,则样本中净重大于或等于98 g并且小于104 g的产品的个数是()B.75C.60D.45答案A2.为了了解某校高三学生的视力情况,随机抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为a ,最大频率为0.32,则a 的值为( ) A.64 B.54 C.48 D.27 答案B3.在抽查某批产品尺寸的过程中,样本尺寸数据的频率分布表如下,则b 等于( )分组 [100,200] (200,300] (300,400] (400,500] (500,600] (600,700] 频数 10 30 40 80 20 m 频率0.05 0.15 0.2 0.4 a bA.0.1B.0.2C.0.25D.0.3答案A4.从某小区抽取100户居民进行月用电量调查,发现其用电量的千瓦时数在[50,350],频率分布直方图如图所示.(1)直方图中x 的值为 .,用电量落在区间[100,250]内的户数为 .解析(1)50x=1-50×(0.001 2+0.002 4×2+0.003 6+0.006 0)=0.22,解得x=0.004 4.×50×(0.003 6+0.006 0+0.004 4)=100×(0.18+0.3+0.22)=70. 答案(1)0.004 4 (2)70.,随机抽查了该校的100名学生,得到如图所示的频率分布直方图.由于不慎将部分数据丢失,但知道前4组的频数和为40,后6组的频数和为87.设最大频率为a ,视力在4.5到5.2之间的学生数为b ,则a= ,b= .解析由频率分布直方图知组距为0.1,由前4组频数之和为40,后6组频数之和为87,知第4组频数87-100=27,即4.6到4.7之间的频数最大,为27,故最大频率a=0.27.视力在4.5到5.2之间1-0.03-0.01=0.96,故视力在4.5到5.2之间的学生数b=0.96×100=96. 答案0.27 96广东汕头高一同步检测)某高校在2018年的自主招生考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,组号分组(Δx i ) 频数(n i ) 频率(f i ) 第1组 [160,165)5 0.05第2组[165,170)①0.35第3组[170,175)30 ②第4组[175,180)20 0.20第5组[180,185]10 0.10合计100 1.00(1)先求出频率分布表中①②处应填写的数据,并完成如图所示的频率分布直方图;(2)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3,4,5组中用分层抽样的方法抽取6,求第3,4,5组每组各应抽取多少名学生进入第二轮面试.解(1)由题意可知,第2组的频数为0.35×100=35,第3组的频率为=0.30,故①处填35,②处填.频率分布直方图如图所示.(2)因为第3,4,5组共有60名学生,所以利用分层抽样在60名学生中抽取6名学生,抽样比为,故第3组应抽取30×=3(名)学生,第4组应抽取20×=2(名)学生,第5组应抽取10×=1(名)学生,所以第3,4,5组应抽取的学生人数分别为3,2,1.7.导学号36424018国家环保部去年发布了新修订的《环境空气质量标准》.其中规定:居民区中的PM2.5年平均浓度不得超过35微克/立方米,PM2.5的24小时平均浓度不得超过75微克/立方米.某城市环保部门随机抽取了一居民区去年40天的PM2.5的24小时平均浓度的监测数据,数据统计如下:组别PM2.5/(微克/立方米)频数/天频率第一组(0,15] 4 0.1 第二组(15,30] 12 y第三(30,45] 8 0.2组第四(45,60] 8 0.2组第五(60,75] x0.1组第六(75,90) 4 0.1组(1)试确定x,y的值,并写出该样本的众数和中位数(不必写出计算过程).(2)完成相应的频率分布直方图.(3)求出样本的平均数,并根据样本估计总体的思想,从PM2.5的年平均浓度考虑,判断该居民区的?说明理由.解(1)x=4,y=0.3,众数为22.5微克/立方米,中位数为37.5微克/立方米.(2)其频率分布直方图如图所示.(3)样本的平均数为7.5×0.1+22.5×0.3+37.5×0.2+52.5×0.2+67.5×0.1+82.5×0.1=40.5.因为40.5>35,所以去年该居民区PM2.5年平均浓度不符合环境空气质量标准,故该居民区的环境需要改进.。

高中数学北师大版必修三+1.5+用样本估计总体+教案2+

1.5 用样本估计总体教学目标1、知识与技能(1)理解样本标准差的意义和作用,学会计算数据的标准差。

(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(平均数、标准差),并作合理的解释。

2、过程与方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学思想方法。

3、情感态度价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。

教学重点、难点教学重点:利用样本估计总体的数字特征。

教学难点: 样本标准差的计算。

教学过程:统计的基本思想就是用样本估计总体,如何能更合理、更直观,这里有两种估计手段:用样本的频率分布估计总体的分布用样本的数字特征(平均数、标准差等)估计总体的数字特征。

下面我们先来看第一种:(一)课题引入1895年,在英国伦敦有106块男性头盖骨被挖掘出土。

经考证,头盖骨的主人死于1665~1666年之间的大瘟疫。

人类学家分别测量了这些头盖骨的宽度,数据如下所示(单位mm):146 141 139 140 145 141 142 131 142 140 144 140 138 139 147 139 141 137 141 132 140 140 141 143 134 146 134 142 133 149 140 140 143 143 149 136 141 143 143 141 138 136 138 144 136 145 143 137 142 146 140 148 140 140 139 139 144 138 146 153 148 152 143 140 141 145 148 139 136 141 140 139 158 135 132 148 142 145 145 121 129 143 148 138 149 146 141 142 144 137 153 148 144 138 150 148 138 145 145 142 143 143 148 141 145 141请大家思考:用什么统计图可以直观表示上述数据的分布状况?你能根据上述估计在1665~1666年之间英国男性头盖骨宽度的分布情况吗?(二)探求新知问题1、我们学习了哪些统计图?不同的统计图适合描述什么样的数据?问题2、这道题目,我们用什么统计图描述比较合适?问题3、如何画频数分布条形图?关键:确定组距和组数组距:把所有数据等距离地分成若干组,每个小组的两个端点之间的距离(组内数据的取值范围)纵坐标表示频数,横坐标表示组距问题4、你能不能画出给定数据的频率分布直方图?基本步骤是什么?1、计算最大值和最小值的差;2、决定组距和组数,通常第一组起点稍微减小一点;组距:把所有数据等距离地分成若干组,每个小组的两个端点之间的距离(组内数据的取值范围)3、列频率分布表对落在各个小组内的数据进行累计,得到各个小组内的数据的个数(叫做频数),再计算出每一组出现的频率,整理可得频率分布表;4、画频率分布直方图纵坐标表示频率与组距的比值,小长方形的面积=组距×=频率。

2019-2020学年高一数学北师大版必修3同步单元卷:(5)用样本估计总体

同步单元卷(5)用样本估计总体1、一个样本,3,5,7的平均数是,且是方程的两根,则这个样本的方差是( )a b ,a b 2540x x -+=A.3 B.4 C.5 D.62、有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为( )A.18B.36C.54D.723、已知甲、乙两组数据如图茎叶图所示,若它们的中位数相同,平均数也相同,则图中的,的比值( ) m n =n m A. B. 3813C. D. 2914、下列说法不正确的是( )A.方差是标准差的平方B.标准差的大小不会超过极差C.若一组数据的值大小相等,没有波动变化,则标准差为0D.标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散5、一次数学考试后,某老师从自己所带的两个班级中各抽取5人,记录他们的考试成绩,得到如图所示的茎叶图.已知甲班5名同学成绩的平均数为81,乙班5名同学成绩的中位数为73,则x-y 的值为( )A.2B.-2C.3D.-36、某品牌空调在元旦期间举行促销活动,所示的茎叶图表示某专卖店记录的每天销售量情况(单位:台),则销售量的中位数是( )A.13B.14C.15D.167、样本中共有五个个体,其值分别为0,1,2,3,m.若该样本的平均值为1,则其方差为( )A.B. C.2D. 28、某校甲、乙两个班级各有名编号为的学生进行投篮练习,每人投次,投中51,2,3,4,510的次数如表:则以上两组数据的方差中较小的一个为,则等于( )2s 2s A.25B. 725C. 35D. 29、在频率分布直方图中,各个小长方形的面积表示( )A.落在相应各组的数据的频数B.相应各组的频率C.该样本所分成的组数D.该样本的容量10、给出下列数据:3,9,8,3,4,3,5,则众数与极差分别是( )A.3,9B.3,6C.5,1D.9,911、是的平均数, 是的平均数, 是的平均x 12100,,,x x x ⋯a 1240,,,x x x ⋯b 4142100,,,x x x ⋯数,则下列各式正确的是( )A. 4060100a bx +=B. =6040100a b x +=D. 2a bx +=12、若一组样本数据2,3,7,8,a 的平均数为5,则该组数据的方差__________。

高中数学 第一章 统计 1.5 用样本估计总体第1课时自我小测 北师大版必修3(2021年最新整理)

3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第一章统计1.5 用样本估计总体第1课时自我小测北师大版必修3)的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。

本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第一章统计1.5 用样本估计总体第1课时自我小测北师大版必修3的全部内容。

必修31.在频率分布直方图中,各小长方形的面积表示().A.落在相应各组内的数据的频数B.相应各组的频率C.该样本所分成的组数D.该样本的样本容量2.一个容量为10的样本,其分组与频数如下表,则样本落在区间(-∞,5]内的频率为( )。

A.03.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在该组上的频率为m,该组上的直方图的高为h,则|a-b|等于().A.hm B。

错误!C。

错误! D.h+m4.某校在“创新素质实践行”活动中组织学生进行社会调查,并对学生的调查报告进行了评比,下面是将某年级60篇学生调查报告进行整理,分成5组画出的频率分布直方图(如图所示).已知从左至右4个小组的频率分别为0。

05,0。

15,0.35,0.30,那么在这次评比中被评为优秀的调查报告有(分数大于或等于80分为优秀,且分数为整数)().A.18篇 B.24篇C.25篇 D.27篇5.如图是一次数学考试结果的频率分布直方图,若规定60分以上(含60分)为考试合格,则这次考试的合格率为________.6.某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是________.7.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12。

高中数学 第一章 统计 1.5 用样本估计总体 1.5.1 估计总体的分布教案 北师大版必修3

1.5.1估计总体的分布本节教材分析一、三维目标1、知识与技能(1) 通过实例体会分布的意义和作用.(2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.(3)通过实例体会频率分布直方表、频率分布直方图,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.2、过程与方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.3、情感态度与价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系.二、教学重点:会列频率分布表,画频率分布直方图;三、教学难点:能通过样本的频率分布估计总体的分布.四、教学建议教科书通过探究栏目引导学生思考居民生活用水定额管理问题,引出总体分布的估计问题,该案例贯穿于本节始终.通过对该问题的探究,使学生学会列频率分布表、画频率分布直方图、频率分布折线图.教科书在这里主要介绍有关频率分布的列表和画图的方法,而关于频率分布的随机性和规律性方面则给教师留下了较大的发挥空间.教师可以通过初中有关随机事件的知识,也可以利用计算机多媒体技术,引导学生进一步体会由样本确定的频率分布表和频率分布直方图的随机性;通过初中有关频率与概率之间的关系,了解频率分布直方图的规律性,即频率分布与总体分布之间的关系,进一步体会用样本估计总体的思想.由于样本频率分布直方图可以估计总体分布,因此可以用样本频率分布特征来估计相应的总体分布特征,这就提供了估计总体特征的另一种途径,其意义在于:在没有原始数据而仅有频率分布的情况下,此方法可以估计总体的分布特征.新课导入设计导入一在统计中,为了考察一个总体的情况,通常是从总体中抽取一个样本,用样本的有关情况去估计总体的相应情况.这种估计大体分为两类,一类是用样本频率分布估计总体分布,一类是用样本的某种数字特征(例如平均数、方差等)去估计总体的相应数字特征.下面我们先通过案例来介绍总体分布的估计.导入二如下样本是随机抽取近年来北京地区7月25日至8月24日的日最高气温.怎样通过上表中的数据,分析比较两时间段内的高温(≥33 ℃)状况?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布.教学设想【创设情境】在NBA的2004赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布(板出课题)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

§5 用样本估计总体5.1 估计总体的分布5分钟训练 (预习类训练,可用于课前)1.在用样本频率估计总体分布的过程中,下列说法正确的是( )A.总体容量越大,估计越精确B.总体容量越小,估计越精确C.样本容量越大,估计越精确D.样本容量越小,估计越精确答案:C2.已知样本:10,8,6,10,13,8,10,12,11,7,8,9,11,9,12,9,10,11,12,11.那么频率为0.2的范围为( )A.5.5—7.5B.7.5—9.5C.9.5—11.5D.11.5—13.5答案:D解析:只要列出频率分布表,依次对照就可以找到答案,频率分布表如下:分组 频数 频率5.5—7.5 2 0.17.5—9.5 6 0.39.5—11.5 8 0.411.5—13.5 4 0.2合计 20 1.0从表中可以看出频率为0.2的范围是11.5—13.5.3.(2007山东潍坊一模,理15)某地教育部门为了了解学生在数学答卷中的有关信息,从上次考试的10 000名考生的数学试卷中,用分层抽样的方法抽取500人,并根据这500人的数学成绩画出样本的频率分布直方图(如下图).则这10 000人中数学成绩在[140,150]段的约是___________人.答案:800解析:频率=0.008×10=0.08,∴约有10 000×0.08=800人.10分钟训练 (强化类训练,可用于课中)1.从某批零件中抽出若干个,然后再从中抽出40个进行合格检查,发现合格产品有36个,则该批产品的合格率为( )A.36%B.72%C.90%D.25%答案:C解析:用样本估计总体时,用样本的合格率代替总体的合格率.而样本合格率为4036×100%=90%. 2.观察新生婴儿的体重,其频率分布直方图如下图所示,则新生婴儿体重在(2 700,3 000)的频率为( )A.0.001B.0.1C.0.2D.0.3答案:D解析:由图可知组距频率=0.001,∴频率=0.001×300=0.3. 3.一个容量为20的样本数据,分组后组距与频数如下:(10,20],2;(20,30],3;(30,40],4;(40,50], 5;(50,60],4;(60,70],2.则样本在区间(-∞,50]上的频率是( )A.5%B.25%C.50%D.70%答案:D解析:样本在(-100,50]上的频数为2+3+4+5=14,故在(-100,50]上的频率为14÷20=70%.4.(2007天津高考,文11)从一堆苹果中任取了20只,并得到它们的质量(单位:克)数据分布表如下:分组 [90,100) [100,110) [110,120) [120,130) [130,140) [140,150) 频数1 2 3 10 3 1 则这堆苹果中,质量不小于120克的苹果数约占苹果总数的___________%.答案:70解析:本题主要考查统计知识,质量不小于120克的频数为14,所以频率为2014=70%. 5.一个容量为100的样本,数据的分组和各组的一些相关信息如下:分组 频数频率 [12,15) 6[15,18)0.08 [18,21)[21,24) 21[24,27)0.18 [27,30) 16[30,33)0.10 [33,36) 5合计 1001.00 (1)完成上表中每一行的空格;(2)画出频率分布直方图;(3)根据频率分布直方图,总体中小于21的样本数据大约占多大的百分比?解:(1)补全后的表格为:分组 频数频率 [12,15) 60.06[15,18) 8 0.08[18,21) 16 0.16[21,24) 21 0.21[24,27) 18 0.18[27,30) 16 0.16[30,33) 10 0.10[33,36) 5 0.05合计100 1.00(2)频率分布直方图为:(3)由频率分布直方图中可以看出,总体中小于21的样本数据大约占30%.30分钟训练(巩固类训练,可用于课后)1.在频率分布直方图中,各个小长方形的面积表示()A.落在相应各组的数据的频数B.相应各组的频率C.该样本所分成的组数D.该样本的样本容量答案:B解析:由直方图的概念知:频率分布直方图的纵轴(矩形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积.2.一个容量为35的样本数据,分组后,组距与频数如下:[5,10)5个;[10,15)12个;[15,20)7个;[20,25)5个;[25,30)4个;[30,35)2个.则样本在区间[20,+∞)上的频率为()A.20%B.69%C.31%D.27%答案:C解析:35245++=0.3143,∴选C.3.一个容量为32的样本,已知某组样本的频率为0.125,则该样本的频数为()A.2B.4C.6D.8答案:B4.(2007山东高考,8)某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;……第六组,成绩大于等于18秒且小于等于19秒.下图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y 分别为()A.0.9,35B.0.9,45C.0.1,35D.0.1,45答案:A解析:由直方图知x=0.34+0.36+0.18+0.02=0.9,即x=0.9.50y =0.36+0.34=0.7,∴y=35.故选A. 5.有一个容量为50的样本数据分组,各组的频数如下:[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),6;[30.5,33.5),3.根据频率分布,估计小于30的数据的频率可能是( )A.80%B.95%C.97%D.90%答案:D解析:根据所给数据可知小于30的数据个数为3+8+9+11+10=41,而在[27.5,30.5)之间的为6个,如果[27.5,30.5)之内没有小于30的,则小于30的频率为5041=82%,如果[27.5,30.5)之内的数据全部小于30,则小于30的数据个数为47,频率为5047=94%,所以,估计小于30的数据频率应在82%到94%之间,可以判断可能的频率结果应该为D 项.6.容量为100的样本数据,按从小到大的顺序分为8组,但是记录时不小心把第3组数据和第8组数据的部分信息丢失,记录如下:组号 1 2 3 4 5 6 7 8 频数 10 13 14 15 13 12 频率 0.10 0.13 0.14 0.15 0.13 0.12 0.09 则根据上表可知,第3组的频率是____________,第8组的频数是____________.答案:0.14 9解析:根据第8组的频数0.09可计算出第8组的频数是9,根据总的频率之和为1,可以得出第3组的频率是1-0.10-0.13-0.14-0.15-0.13-0.12-0.09=0.14.7.(2006全国高考卷Ⅱ,16)一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(元)月收入段应抽出____________人.答案:25解析:在[2 500,3 000)月收入段应抽出=0005.020004.00003.00002.00001.00005.0⨯++++ ×100=25(人).8.有一容量为200的样本,数据的分组以及各组的频数如下:[-20,-15)7,[-15,-10)11,[-10,-5)15,[-5,0)40,[0,5)49,[5,10)41,[10,15)20,[15,20)17.(1)列出样本的频率分布表;(2)画出频率分布直方图和折线图;(3)求样本数据不足0的频率.解:(1)频率分布表如下:分组 频数 频率[-20,-15) 7 0.035[-15,-10) 11 0.055[-10,-5) 15 0.075[-5,0) 40 0.200[0,5) 49 0.245[5,10) 41 0.205[10,15) 20 0.100[15,20) 17 0.085合计 200 1.000(2)频率分布直方图和折线图如下:(3)样本数据不足0的频率为:0.035+0.055+0.075+0.200=0.365.5.2 估计总体的数字特征5分钟训练 (预习类训练,可用于课前)1.在统计中,样本的标准差可以近似地反映( )A.平均状态B.波动大小C.分布规律D.最大值和最小值答案:B解析:由定义知,数据的标准差反映数据的波动大小.2.下列数字特征一定是数据组中数据的是( )A.众数B.中位数C.标准差D.平均数答案:A解析:根据各数字特征的意义可知唯有众数一定是原数据中的数.3.下列叙述不正确的是( ) A.样本均值可以近似地描述总体的平均水平B.极差描述了一个样本数据变化的幅度C.样本标准差描述了一组样本数据围绕样本均值波动的大小D.一个班级的数学成绩的方差越大说明成绩越稳定答案:D解析:方差越大,说明成绩越不稳定,所以D 项错.4.(2006湖南高考,文12)某高校有甲、乙两个数学建模兴趣班,其中甲班40人,乙班50人,现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则该校数学建模兴趣班的平均成绩是___________分.答案:85解析:由题意知,所求平均成绩为:504081509040+⨯+⨯=85分. 10分钟训练 (强化类训练,可用于课中)1.与总体单位不一致的是( )A.s 2B.sC.xD.三个都不一致 答案:A解析:方差的单位是原始数据单位的平方,所以与总体单位不一致.2.有一个数据为50的样本,数据分组以及各组的频数如下,[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),5;[30.5,33.5),4.估计小于30的数据大约占( )A.10%B.92%C.5%D.30%答案:B解析:样本容量为50,小于30的约有:3+8+9+11+10+5=46,所以,频率≈5046=0.92=92%. 3.一组观察值为4、3、5、6出现的次数分别为3、2、4、2,则样本均值为( )A.4.55B.4.5C.12.5D.1.64答案:A解析:1150242326452334=+++⨯+⨯+⨯+⨯=x ≈4.55. 4.设有n 个样本数据x 1、x 2、…、x n ,其标准差为s x ,另有n 个样本数据y 1、y 2、…、y n ,且y k =3x k +5(k=1,2,…,n),其中标准差为s y ,则下列关系正确的是( )A.s y =3s x +5B.s y =3s xC.s y =x s 3D.s y =x s 3+5答案:B解析:设x 1、x 2、…、x n 的平均数为x ,y 1、y 2、y 3、…、y n 的平均数为y ,则y =nn x x x n x x x n y y y n n n 5)(3535353212121++++=++++++=+++ =3x +5∴s y 2=[(3x 1+5-3x -5)2+(3x 2+5-3x -5)2+…+(3x n +5-3x -5)2]÷n =nx x x x x x n ])()()[(922221-++-+- =9s x 2∴s y =3s x .5.在一次数据测量中,计算出18个数据的样本均值为50,但是后来发现其中一个数据是86被误记为68,那么这18个数据的正确的样本均值应该是____________.答案:51解析:根据条件易知,实际18个数据的总和应该是:50×18+(86-68)=918,根据平均数的计算方法可得这组数据实际的均值应该是18918=51. 6.在某次考试中,要对甲、乙两同学的学习成绩进行比较,甲同学的平均分甲x =76,方差2甲s =4,乙同学的平均分乙x =77,方差2乙s =10,则___________同学平均成绩好,___________同学各科发展均衡.答案:乙 甲解析:∵甲乙x x >,s 2甲<s 2乙, ∴乙甲s s <.∴乙同学平均成绩好,甲同学各科发展均衡.7.从一批棉花中抽取9根棉花的纤维,长度如下:(单位:mm)82,202,352,321,25,293,86,206,115.求样本均值、样本方差和样本标准差.解:样本均值91=x (82+202+352+321+25+293+86+206+115)=186.9(mm) 样本方差s 2≈91[(82-186.9)2+(202-186.9)2+…+(115-186.9)2]≈12 184.1. 样本标准差s=2s =110.430分钟训练 (巩固类训练,可用于课后)1.已知样本12、7、11、12、11、12、10、10、9、8、13、12、10、9、6、11、8、9、8、10,那么频率为0.25的样本的范围是( )A.[5.5,7.5)B.[7.5,9.5)C.[9.5,11.5)D.[11.5,13.5)答案:D解析:样本容量为20,发生在[11.5,13.5)的频数为5,∴频率为205=0.25. 2.为了解我国13岁男孩的平均身高,从北方抽取了300个男孩,平均身高1.60 m;从南方抽取了200个男孩,平均身高1.50 m,由此可推断我国13岁男孩的平均身高为( )A.1.54 mB.1.55 mC.1.56 mD.1.57 m答案:C解析:2003005.12006.1300+⨯+⨯=x =1.56. 3.甲、乙两人在相同条件下,各射击10次,命中环数如下:甲:8 6 9 5 10 7 4 8 9 5乙:7 6 7 8 6 9 6 8 7 7根据上述数据估计两人的技术稳定性,结论是( )A.甲优于乙B.乙优于甲C.两人相同D.无法比较答案:B解析:1059847105968+++++++++=甲x =7.1. 107786968767+++++++++=乙x =7.1.又∵s 2乙<s 2甲,乙甲x x =,∴乙优于甲.4.从总体中抽取的样本数据有m 个a ,n 个b ,p 个c ,则总体的平均数μ的估计值为( )A.3c b a ++B.3p n m ++C.3pc nb ma ++ D.p n m pc nb ma ++++ 答案:D解析:样本均值pn m pc nb ma x ++++=,把它作为总体均值的估计. 5.(2006重庆高考,6)为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁—18岁的男生体重(kg),得到频率分布直方图如下图:根据图可得这100名学生中体重在[56.5,64.5)的学生人数是( )A.20B.30C.40D.50答案:C解析:由组距频率×组距=频率,即(0.03+0.05+0.05+0.07)×2=0.4为体重在[56.5,64.5)的频率.又频率=样本容量频数,∴人数为100×0.4=40. 6.两个样本,甲:5,4,3,2,1;乙:4,0,2,1,-2.那么样本甲和样本乙的波动大小情况是( )A.甲、乙的波动大小一样B.甲的波动比乙的波动大C.乙的波动比甲的波动大D.甲、乙的波动大小无法比较答案:C解析:平均数:51=甲x (5+4+3+2+1)=3,51=乙x (4+0+2+1-2)=1, 方差为s 2甲=51[(5-3)2+(4-3)2+…+(1-3)2]=2, s 2乙=51[(4-1)2+(0-1)2+…+(-2-1)2]=4, ∴s 2甲<s 2乙.7.一个样本方差是S 2=101[(x 1-15)2+(x 2-15)2+…+(x 10-15)2],则这个样本均值x =___________,样本容量是___________.答案:15 108.若a 1,a 2,…,a 20这20个数据的平均数为x ,方差为0.20,则a 1,a 2,…,a 20,x 这21个数据的方差约为___________.答案:0.19解析:由题意得:201[(a 1-x )2+(a 2-x )2+…+(a 20-x )2]=0.20, ∴(a 1-x )2+(a 2-x )2+…+(a 20-x )2=4,且a 1+a 2+…+a 20=20x , ∴x x x x a a a =+=++++2120212021 ,即a 1,a 2,…,a 20,x 这21个数据的平均数也是x . ∴这21个数据的方差是s 2=214])(4[2112=-+x x ≈0.19. 9.甲、乙两台机床同时加工直径100毫米的零件,为了检验产品质量,从产品中各随机抽出6件进行测量,测得数据如下(单位:毫米):甲:99,100,98,100,100,103;乙:99,100,102,99,100,100.(1)分别计算上述两组数据的平均数和方差;(2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求.解:(1)61100+=甲x (-1+0-2+0+0+3)=100;61100+=乙x (-1+0+2-1+0+0)=100. s 2甲=61[(-1)2+02+(-2)2+02+02+32]=37,s 2乙=61[(-1)2+02+22+(-1)2+02+02]=1. (2)由(1)知,x 甲=x 乙,s 2甲>s 2乙,∴乙机床加工的这种零件更符合要求.10.假定下述数据是甲、乙两个供货商的交货天数.甲:10,9,10,10,11,11,9,11,10,10;乙:8,10,14,7,10,11,10,8,15,12.估计两个供货商的交货情况,并问哪个供货商交货时间短一些,哪个供货商交货时间较具一致性与可靠性. 解:甲x =101(10+9+…+10)=10.1,乙x =101(8+10+…+12)=10.5, s 2甲=101[(10-10.1)2+(9-10.1)2+…+(10-10.1)2]=0.49, s 2乙=101[(8-10.5)2+(10-10.5)2+…+(12-10.5)2]=6.05. 从交货天数的平均值来看,甲供货商的供货天数短一些;从方差来看,甲供货商的交货天数较稳定,因此甲是较具一致性与可靠性的厂商.。

相关文档
最新文档