高中数学第二章统计221用样本的频率分布估计总体分布练习含解析新人教A版必修
【优选整合】人教A版高中数学必修三221用样本的频率分布估计总体分布测试(教师版).doc

第二章-2.2.1用样本的频率分布估计总体分布(检测教师版)班级: ___________ 姓名: ____________________一、选择题1. 研究统计问题的基本思想方法是A. 随机抽样B. 使用先进的科学记算器计算样本的频率等C. 用小概率事件理论控制生产工业过程D. 用样本估计总体【答案】D【解析】随机抽样是抽样的一种方法,研究统计问题的基本思想方法是用样本估计总体.故选D.2. 在抽查某批产品尺寸的过程中,样本尺寸数据的频率分布表如,则b 等于【答案】D【解析】因为频率、频数的关系:频率=腿,所嗚哼,所小…所以 O.2+O.4+O.1) =0.1,故选 D.3. 画样本频率分布直方图时,决定组数的止确方法是【答案】C4. 对某班60名同学的一次数学测验成绩进行统计,如果频数分布直方图中80.5〜90.5分这一组的频数是18,那么这个班的学生这次数学测验成绩在80.5〜90.5分Z 间的频率是B. 0.25C. 0.2D. 0.1A. 0.3A.任意确定C.由 极差丽决定 B. 一般分为5〜12组D.根据经验法则,灵活掌握【解析】画样本频率分布直方图时组数,由极差和组距决定,是对极差的值合理収整得到,故选C ・A- 0.8B. 0.4C. ().35D. 0.3【答案】D【解析】成绩在80.5〜90.5分Z间的频率为矿0.3.故选D.5.在频率分布直方图中,小长方形的高表示A.频率B组距X频率C.样爲积 D.爲【答案】D【解析】在频率分布直方图屮,小长方形的面积表示该组的频率,即小长方形的髙X组距二频率,故小6.下列说法正确的是A.样木的数据个数等于频数Z和B.扇形统计图可以告诉我们各部分的数量分别是多少C.如果一组数据可以用扇形统计图表示,那么它一定可以用频数分布直方图表示D.将频数分布直方图中小长方形上面-•边的一个端点顺次连结起来,就可以得到频数折线图【答案】A【解析】因为频数之和就是所有的数据,所臥A正确.对于扇形统计图的说法,扇形统计團杲用整个圆表示总数(单位“1”力用圆内各个扇形的犬小表示各部分童占总量的百分之几,通过扇形的犬小来反映各个部分占总体的百分之几,并不能告诉我们各部分的数量分别是多少,故B, C错误.对于选项D, 将频数分布直方图中小长方形上面一边的中点顺次连结起来,就可以得到频数折线图,故选项D错.故选A.二、填空题7.如图是某电视剧在各年龄段人群收视情况的频率分布直方图.若某村观看此电视剧的观众人数为1400人,则其中50岁以上(含50岁)的观众约有___________ 人.长方形的高二频率故选D.【答案】504【解析】从图中可以发现50岁以上的频率=0.24+0.12=0.36, 1400人其中50岁以上的人数=1400X0.36=504.故答案为:504.8.某工人截取了长度不等的钢筋100根,其部分频率分布表如图,已知氏度(单位:cm)在[25, 50)上的频率为0.6,则估计长度在[35, 50)内的根数为 ___________ .【答案】25【解析】根据题意,得;[25, 50)上的频率为0.6,频数为0.6X100=60,所以长度在[35, 50)内的根数为60-15-20=25.故答案为:25.三、解答题9.某校高三的某次数学测试屮,对其屮100名学生的成绩进行分析,按成绩分组,得到的频率分布表如下:(1)求出频率分布表中①、②位置相应的数据;(2)为了选拔出最优秀的学生参加即将举行的数学竞赛,学校决定在成绩较高的第3、4、5组中分层抽样取5名学生,则第4、5组每组各抽取多少名学生?【解析】(1)①处的•数据为:154-100=0.15②处的数据为:0.35X100=35(2)第三四五组中共有学生20+20+10=50人故抽样比k=—=丄50 10故应从第四组中抽取20X丄二2人,10应从第五组中抽取10X—=1人.1010.为了解普宁市初三年级男生的身高情况,现从梅峰屮学选取容暈为6()的样本(60名男生的身高单位:厘米),分组情况如表所示:分组147.5 〜155.5155.5 〜163.5163.5 〜171.5171.5 〜179.5频数621m 频率a0.1①求出表中的d, 7H的值;②画出频率分布直方图及频率折线图;③从中你可以得出什么结论?【解析】①根据题意,得加二60X0.1=6,所以身高在163.5〜171.5的频数为60-6-21-6=27,27 所以对应的频率为^= —=0.45;60②身高在147.5〜155.5的频率为—=0.1,60所以频率与组距的比值为空=0.0125 ;821身高在155.5〜163.5的频率为—=0.35,60所以频率与组距的比值为吐=0.04375:8身高在163.5〜171.5的频率为0.45,所以频率与组距的比值为匕仝=0.05625:8身.高在171.5〜179.5的频率为0.1,所以频率与组距的比值为—=0.0125;8由此画出频率分布直方图及频率折线图,如图所示:③从频率分布直方图中得知,身高成单峰分布,主要集中在155.5〜171.5之间,.从频率折线图中得知身高明显成单峰分布.。
【精准解析】2021人教A版数学必修3:2.2.1 用样本的频率分布估计总体分布

A.90
B.75
C.60
D.45
解析由频率分布直方图可知,产品净重小于 100g 的频率是 0.05×2+0.1×2=0.3,所以样本中产品
的个数为03.63=120.产品净重小于 98g 的频率为 0.050×2=0.1.产品净重大于或等于 104g 的频率为
0.075×2=0.15.
所以产品净重大于或等于 98g 而小于 104g 的频率为 1-0.15-0.1=0.75.
2.2 用样本估计总体
2.2.1 用样本的频率分布估计总体分布
课后篇巩固提升
基础巩固
1.下列关于样本频率分布折线图与总体密度曲线的关系的说法中,正确的是( ) A.频率分布折线图与总体密度曲线无关 B.频率分布折线图就是总体密度曲线 C.样本容量很大的频率分布折线图就是总体密度曲线 D.如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于总体密度 曲线
答案 D 2.在样本的频率分布直方图中,某个小长方形的面积是其他小长方形面积之和的14,已知样本容 量是 80,则该组的频数为( )
A.20
B.16
C.30
D.35
解析设该组的频数为 x,则其他组的频数之和为 4x,由样本容量是 80,得 x+4x=80,解得 x=16,即该
组的频数为 16,故选 B.
A.100
B.160
C.200
D.280
解析观察茎叶图知,抽取的 20 名教师中使用多媒体进行教学次数在[16,30)内的有 8 人,所以该
区间段的频率为280=0.4,因此全校 400 名教师使用多媒体教学次数在[16,30)内的有
400×0.4=160(人). 答案 B 5.某工厂对一批产品进行了抽样检测,下图是根据抽样检测后的产品净重数据绘制的频率分布 直方图,其中产品净重的范围是[96,106],样本数据分组为 [96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于 100 g 的个数是 36,则样 本中净重大于或等于 98 g 并且小于 104 g 的产品的个数是( )
高中数学第二章统计2.2.1用样本的频率分布估计总体分布课时跟踪训练含解析新人教A版必修

学习资料第二章统计2.2用样本估计总体2.2.1用样本的频率分布估计总体分布[A组学业达标]1.下列命题正确的是()A.频率分布直方图中每个小矩形的面积等于相应组的频数B.频率分布直方图的面积为对应数据的频率C.频率分布直方图中各小矩形高(平行于纵轴的边)表示频率与组距的比D.用茎叶图统计某运动员得分:13,51,23,8,26,38,16,33,14,28,39时,茎是指中位数26解析:在频率分布直方图中,横轴表示样本数据;纵轴表示错误!,由于小矩形的面积=组距×频率组距=频率,所以各小矩形的面积等于相应各组的频率,因此各小矩形面积之和等于1;在茎叶图中茎—-数据的最高位数据,叶——其他位数据排列图.答案:C2.将容量为100的样本数据,按由小到大排列分成8个小组,如下表所示:组号12345678频数101314141513129 第3()A.0。
14和0.37B。
错误!和错误!C.0.03和0。
06 D.错误!和错误!解析:由表可知,第三小组的频率为错误!=0.14,累积频率为错误!=0.37.答案:A3.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()A.46,45,56 B.46,45,53C.47,45,56 D.45,47,53解析:直接列举求解.由题意知各数为12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68,中位数是46,众数是45,最大数为68,最小数为12,极差为68-12=56.答案:A4.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不低于60分的学生人数为()A.588 B.480C.450 D.120解析:由频率分布直方图知[40,60)分的频率为(0.005+0。
2020_2021高中数学第2章统计2.2.1用样本的频率分布估计总体分布学案含解析新人教A版必修3

2.2 用样本估计总体2.2.1用样本的频率分布估计总体分布学习目标核心素养1.会用频率分布表,画频率分布直方图表示样本数据.(难点)2.能通过频率分布表和频率分布直方图对数据做出总体统计.(重点)3.理解茎叶图的概念,会画茎叶图.(重点)1.通过频率分布直方图和茎叶图的学习,培养数据分析素养.2.借助图表中的数据运算,提升数学运算素养.1.频率分布直方图的画法2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到了频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的组数也在增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑曲线,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.3.茎叶图(1)茎叶图的制作方法(以两位数据为例):将所有两位数的十位数字作为茎,个位数字作为叶,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出.(2)茎叶图的优缺点在样本数据较少时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.但是当样本数据较多时,茎叶图就显得不太方便,因为每一个数据都要在图中占据一个空间,如果数据很多,枝叶就会很长.思考:通过抽样获取的原始数据有何缺点?[提示] 因为通过抽样获得的原始数据多而且杂乱,无法直接从中理解它们的含义,并提取信息,也不便于我们用它来传递信息.1.下列关于茎叶图的叙述正确的是( )A .将数组的数按位数进行比较,将数大小基本不变或变化不大的位作为一个主杆(茎),将变化大的位的数作为分枝(叶),列在主杆的后面B .茎叶图只可以分析单组数据,不能对两组数据进行比较C .茎叶图更不能表示三位数以上的数据D .画图时茎要按照从小到大的顺序从下向上列出,共茎的叶可随意同行列出 A [由茎叶图的概念可得.]2.一个容量为80的样本中,数据的最大值为152,最小值为60,组距为10,应将样本数据分为( )A .10组B .9组C .8组D .7组A [由题意知,152-6010=9.2,故应分成10组.]3.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在[50,60)内的汽车有( )A .30辆B .40辆C .60辆D .80辆C [由直方图知,时速在[50,60)内的频率为0.03×10=0.3,故此段内汽车有200×0.3=60辆.]4.如图是一个班的语文成绩的茎叶图(单位:分),则优秀率(90分以上)是________,最低分是________.4% 51 [由茎叶图知,样本容量为25,90分以上有1人,故优秀率为125×100%=4%,最低分为51分.]频率分布直方图的绘制1.要做频率分布表,需要对原始数据做哪些工作? [提示] 分组、频数累计、计算频数和频率. 2.画频率分布直方图时,如何决定组数与组距? [提示] 若极差组距为整数,则极差组距=组数.若极差组距不为整数,则⎣⎢⎡⎦⎥⎤极差组距+1=组数.注意:[x ]表示不大于x 的最大整数.3.同一组数据,如果组距不同,得到的频率分布直方图也会不同吗?[提示] 不同.对于同一组数据分析时,要选好组距和组数,不同的组距与组数对结果有一定的影响.【例1】 某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分): 48 64 52 86 71 48 64 41 86 79 71 68 82 84 68 64 62 68 81 57 90 52 74 73 56 78 47 66 55 64 56 88 69 40 73 97 68 56 67 59 70 52 79 44 55 69 62 58 32 58根据上面的数据,回答下列问题:(1)这次测验成绩的最高分和最低分分别是多少?(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图;(3)分析频率分布直方图,你能得出什么结论?思路点拨:按画频率分布直方图的步骤进行绘制.[解](1)这次测验成绩的最低分是32分,最高分是97分.(2)根据题意,列出样本的频率分布表如下:分组频数频率[30,40)10.02[40,50)60.12[50,60) 120.24[60,70)140.28[70,80) 90.18[80,90)60.12[90,100]20.04合计50 1.00(3)从频率分布直方图可以看出,这50名学生的智力测验成绩大体上呈两头小、中间大,左右基本对称,说明这50名学生中智力特别好或特别差的占极少数,而智力一般的占多数,这是一种最常见的分布.1.(变条件)美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,5 4,51,60,62,43,55,56,61,52,69,64,46,54,48将数据进行适当的分组,并画出相应的频率分布直方图.[解]以4为组距,列表如下:频率分布直方图如下:2.(变结论)本例条件不变,若把所给数据去掉一个最高分和一个最低分后分成5组,试画出这48名学生智力测验成绩的频率分布直方图.[解]列出频率分布表如下:频率分布直方图如下:绘制频率分布直方图应注意的问题(1)组数与样本容量有关,一般地,样本容量越大,所分组数越多.当样本容量不超过100时,按数据的多少,常分成5~12组.(2)在确定分组区间的端点,即分点时,应对分点进行适当调整,使分点比数据多一位小数,并确保每个数据均能落在一个区间内,而不是处于区间的端点.(3)一般地,频率分布直方图中两坐标轴上的单位长度是不一致的,纵轴是频率/组距,而不是频率.频率分布直方图的应用件的500名志愿者中随机抽取100名志愿者,他们的年龄情况如下表所示:分组(单位:岁)频数频率[20,25)50.05[25,30)①0.20[30,35)35②[35,40)300.30[40,45]100.10合计100 1.00(1)频率分布表中的①②位置应填什么数据?(2)补全如图所示的频率分布直方图,再根据频率分布直方图估计这500名志愿者中年龄在[30,35)岁的人数.[解](1)设年龄在[25,30)岁的频数为x,年龄在[30,35)岁的频率为y.法一:根据题意可得x100=0.20,35100=y,解得x =20,y =0.35,故①处应填20,②处应填0.35. 法二:由题意得5+x +35+30+10=100, 0.05+0.20+y +0.30+0.10=1,解得x =20,y =0.35,故①处填20,②处填0.35.(2)由频率分布表知年龄在[25,30)岁的频率是0.20,组距是5. 所以频率组距=0.205=0.04.补全频率分布直方图如图所示.根据频率分布直方图估计这500名志愿者中年龄在[30,35)岁的人数为500×0.35=175.频率分布直方图的性质 (1)因为小矩形的面积=组距×频率组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.(2)在频率分布直方图中,各小矩形的面积之和等于1. (3)频数相应的频率=样本容量.[跟进训练]1.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)求直方图中x 的值;(2)在这些用户中,求用电量落在区间[100,250)内的户数.[解] (1)由频率分布直方图知[200,250)小组的频率为1-(0.002 4+0.003 6+0.006 0+0.002 4+0.001 2)×50=0.22,于是x =0.2250=0.004 4.(2)∵数据落在[100,250)内的频率为(0.003 6+0.006 0+0.004 4)×50=0.7, ∴所求户数为0.7×100=70.茎叶图的绘制及应用下:甲:95,81,75,91,86,89,71,65,76,88,94,110,107. 乙:83,86,93,99,88,103,98,114,98,79,78,106,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.思路点拨:题中可以用十位数字为茎,个位数字为叶作茎叶图.然后由茎叶图的特点分析两人的成绩.[解] 甲、乙两人数学成绩的茎叶图如图所示:从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98;甲同学的得分情况,也大致对称,中位数是88.乙同学的成绩比较稳定,总体情况比甲同学好.绘制茎叶图的注意点(1)绘制茎叶图时需注意“叶”的位置的数字位数只有一位,而“茎”的位置的数字位数一般不需要统一.(2)茎叶图可用于确定数据的中位数,判断数据大致集中在哪个茎,是否关于该茎对称,是否分布均匀等.[跟进训练]2.从甲、乙两个班中各随机选出15名同学进行随堂测验,成绩的茎叶图如图所示,则甲、乙两组的最高成绩分别是________,________,从图中看,________班的平均成绩较高.9692乙[由茎叶图知,甲班最高分是96分,乙班的最高分是92.甲班的成绩集中在60~80间,乙班的成绩集中在70~90间,故乙班的平均成绩较高.]1.总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.2.总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.1.判断下列结论的正误(正确的打“√”,错误的打“×”)(1)用样本的频率分布可以估计总体分布.()(2)频率分布直方图的纵轴表示频率.()(3)只有两位的数据能用茎叶图表示.()[答案](1)√(2)×(3)×2.观察新生儿的体重,其频率分布直方图如图所示,则新生儿体重在[2 700,3 000)内的频率为()A.0.1B.0.2C.0.3D.0.4C[由图可得,新生儿体重在[2 700,3 000)内的频率为0.001×300=0.3.]3.如图所示的茎叶图表示的是一台自动售货机的销售情况,则茎叶图中9表示的销售额为()A.9B.49C.29 D.1 349C[观察茎叶图,分清楚茎和叶即可.分开茎、叶的竖线左侧仅有一列,表示茎,右侧有多列,表示叶,所以9表示的销售额为29.]4.某班50名同学参加数学测验,成绩的分组及各组的频数如下:[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出样本的频率分布表;(2)画出频率分布直方图.[解](1)频率分布表如下:分组频数频率[40,50)20.04[50,60)30.06[60,70)100.2[70,80)150.3[80,90)120.24[90,100]80.16(2)。
2021-2022年高中数学第二章统计2.2.1用样本的频率分布估计总体分布课后提升作业含解析新人教

2021-2022年高中数学第二章统计2.2.1用样本的频率分布估计总体分布课后提升作业含解析新人教A版一、选择题(每小题5分,共40分)1.对于样本频率分布折线图与总体密度曲线的关系,下列说法中正确的是( )A.频率分布折线图与总体密度曲线无关B.频率分布折线图就是总体密度曲线C.样本容量很大的频率分布折线图就是总体密度曲线D.如果样本容量无限增大、分组的组距无限减小,那么频率分布折线图就会无限接近总体密度曲线【解析】选D.总体密度曲线通常是用样本频率分布估计出来的.而频率分布折线图在样本容量无限增大,分组的组距无限减小的情况下会无限接近于一条光滑曲线,这条光滑曲线就是总体密度曲线.2.(xx·长春高一检测)一个容量为80的样本中数据的最大值是140,最小值是51,组距是10,则应将样本数据分为( )A.10组B.9组C.8组D.7组【解析】选B.==8.9.所以分为9组较为恰当.3.将容量为100的样本数据,按由小到大排列分成8个小组,如表所示:A.0.14和0.37B.和C.0.03和0.06D.和【解析】选A.由表可知,第三小组的频率为=0.14,累计频率为=0.37.4.(xx·汕头高一检测)甲、乙两位同学在高三的5次月考中数学成绩统计如茎叶图所示,若甲、乙两人的平均成绩分别是x甲,x乙,则下列叙述正确的是( )A.x甲>x乙;乙比甲成绩稳定B.x甲>x乙;甲比乙成绩稳定C.x甲<x乙;乙比甲成绩稳定D.x甲<x乙;甲比乙成绩稳定【解析】选C.由题意可知,x甲=×(72+77+78+86+92)=81,x乙=×(78+88+88+91+90)=87.又由方差公式可得=×[(72-81)2+(77-81)2+(78-81)2+(86-81)2+(92-81)2]=50.4,=×[(78-87)2+(88-87)2×2+(91-87)2+(90-87)2]=21.6,因为<,故乙的成绩波动较小,乙的成绩比甲稳定.5.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )A.588B.480C.450D.120【解题指南】先求样本频率,利用样本频率估计总体分布频率,最后估计符合条件的人数. 【解析】选B.不少于60分的频率为(0.030+0.025+0.015+0.010)×10=0.8,所以所求学生人数为0.8×600=480(人).6.下列说法正确的是( )A.对于样本数据增加时,频率分布表不变化B.对于样本数据增加时,茎叶图不变化C.对于样本数据增加时,频率折线图不会跟着变化D.对于样本数据增加时,频率分布直方图变化不太大【解析】选D.结合频率分布表、频率折线图、频率分布直方图以及茎叶图可知选项D正确.7.(xx·南宁高一检测)有一个容量为45的样本数据,分组后各组的频数如下:(12.5,15.5],3;(15.5,18.5],8;(18.5,21.5],9;(21.5,24.5],11;(24.5,27.5],10;(27.5,30.5],4.由此估计,不大于27.5的数据约为总体的( )A.91%B.92%C.95%D.30%【解析】选A.不大于27.5的样本数为:3+8+9+11+10=41,所以约占总体百分比为×100%≈91%.8.(xx·北京高一检测)如图是某学校抽取的学生体重的频率分布直方图,已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为10,则抽取的学生人数为( )A.20B.30C.40D.50【解析】选C.前3组的频率之和等于1-(0.012 5+0.037 5)×5=0.75,第2小组的频率是0.75×=0.25,设样本容量为n,则=0.25,即n=40.二、填空题(每小题5分,共10分)9.下列说法正确的是________.(填序号)(1)频率分布直方图中每个小矩形的面积等于相应组的频数.(2)频率分布直方图的面积为对应数据的频率.(3)频率分布直方图中各小矩形的高(平行于纵轴的边)表示频率与组距的比.【解析】在频率分布直方图中,横轴表示样本数据;纵轴表示.由于小矩形的面积=组距×=频率,所以各小矩形的面积等于相应各组的频率,因此各小矩形面积之和等于 1.综上可知(3)正确.答案:(3)10.(xx·杭州高一检测)某棉纺厂为了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标).所得数据均在区间[5,40]中,其频率分布直方图如图所示,则在抽测的100根中,有________根棉花纤维的长度小于20mm.【解析】由题意知,棉花纤维的长度小于20mm的频率为(0.01+0.01+0.04)×5=0.3,故抽测的100根中,棉花纤维的长度小于20mm的有0.3×100=30(根).答案:30三、解答题(每小题10分,共20分)11.如图是甲、乙两名运动员某赛季一些场次得分的茎叶图:(1)甲、乙两名队员的最高得分各是多少?(2)哪名运动员的成绩好一些?【解析】(1)甲、乙两名队员的最高得分分别为51分,52分.(2)从茎叶图可以看出,甲运动员得分大致对称,乙运动员的得分除一个52分以外,也大致对称.因此甲运动员的成绩好,总体得分比乙好.12.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?【解析】(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:=0.08;又因为第二小组频率=,所以样本容量===150.(2)由图可估计该学校高一学生的达标率约为×100%=88%.【能力挑战题】为调查我校学生的用电情况,学校后勤部门组织抽取了100间学生宿舍某月用电量调查,发现每间宿舍用电量都在50度到350度之间,其频率分布直方图如图所示.(1)为降低能源损耗,节约用电,学校规定:每间宿舍每月用电量不超过200度时,按每度0.5元收取费用;超过200度,超过部分按每度1元收取费用.以t表示某宿舍的用电量(单位:度),以y表示该宿舍的用电费用(单位:元),求y与t的函数关系式?(2)求图中月用电量在(200,250]度的宿舍有多少间?【解析】(1)根据题意,得:当0≤t≤200时,用电费用为y=0.5t;当t>200时,用电费用为y=200×0.5+(t-200)×1=t-100;综上:宿舍的用电费用为y=(2)因为月用电量在(200,250]度的频率为50x=1-(0.006 0+0.003 6+0.002 4+0.002 4+0.001 2)×50=1-0.015 6×50=0.22,所以月用电量在(200,250]度的宿舍有100×0.22=22(间).40545 9E61 鹡F-34572 870C 蜌25002 61AA 憪|27150 6A0E 樎?35911 8C47 豇H24833 6101 愁€20368 4F90 侐33679 838F 莏。
2021年高中数学 2.2.1用样本的频率分布估计总体分布练习新人教A版必修3

2021年高中数学 2.2.1用样本的频率分布估计总体分布练习新人教A版必修3一、选择题1.下列关于频率分布直方图的说法正确的是( )A.直方图的高表示取某数的频率B.直方图的高表示该组上的个体在样本中出现的频率C.直方图的高表示取某组上的个体在样本中出现的频数与组距的比值D.直方图的高表示取该组上的个体在样本中出现的频率与组距的比值2.一个容量为80的样本中数据的最大值是140,最小值是51,组距是10,则应将样本数据分为( ) A.10组 B.9组 C.8组 D.7组3.容量为100的样本数据,按从小到大的顺序分为8组,如下表:组号12345678频数1013x 141513129A.14和0.14 B.0.14和14 C.114和0.14 D.13和1144.如图所示是一容量为100的样本的频率分布直方图,则由图形中的数据,样本落在[15,20)内的频数为( )A.20 B.30 C.40 D.505.根据《中华人民共和国道路交通安全法》规定:车辆驾驶员血液酒精浓度在20~80 mg/100 mL(不含80)之间,属于酒后驾车;血液酒精浓度在80 mg/100 mL(含80)以上时,属醉酒驾车.据有关报道,2009年8月15日至8月28日,某地区查处酒后驾车和醉酒驾车共500人,如图是对这500人血液中酒精含量进行检测所得结果的频率分布直方图,则属于醉酒驾车的人数约为( )A.25 B.50 C.75 D.1006.某雷达测速区规定:凡车速大于或等于70 km/h的汽车视为“超速”,并将受到处罚,如图是某路段的一个检测点对300辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可得出将被处罚的汽车数为( )A.30辆 B.40辆 C.60辆 D.80辆7.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁~18岁的男生体重(kg),得到频率分布直方图如下:根据下图可得这100名学生中体重在[56.5,64.5)的学生人数是( )A.20 B.30 C.40 D.508.为了了解某校高三学生的视力情况,随机抽查了该校100名高三学生的视力情况,得到频率分布直方图如下图,由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为( )A.64 B.54 C.48 D.27二、填空题9.今年5月海淀区教育网开通了网上教学,某校高一年级(8)班班主任为了了解学生上网学习时间,对本班40名学生某天上网学习时间进行了调查,将数据(取整数)整理后,绘制出如图所示频率分布直方图,已知从左到右各个小组的频率分别是0.15,0.25,0.35,0.20,0.05,则根据直方图所提供的信息,这一天上网学习时间在100~119分钟之间的学生人数是________人,如果只用这40名学生这一天上网学习时间作为样本去推断该校高一年级全体学生该天的上网学习时间,这样推断是否合理?________(填“合理”或“不合理”)10.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50度至350度之间,频率分布直方图如图所示:(1)直方图中x的值为________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.三、解答题11.某电视台为宣传本省,随机对本省内15~65岁的人群抽取了n人,回答问题“本省内著名旅游景点有哪些”统计结果如图表所示.组号分组回答正确的人数回答正确的人数占本组的频率第1组[15,25) a 0.5第2组[25,35)18x第3组[35,45) b 0.9第4组[45,55)90.36第5组[55,65]3y(1)分别求出a,b,x,y的值;(2)从第2,3,4组回答正确的人中用分层抽样的方法抽取6人,求第2,3,4组每组各抽取多少人?12.一个农技站为了考察某种麦穗长的分布情况,在一块试验地里抽取了100个麦穗,量得长度如下(单位:cm):6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.65.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.86.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.56.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.46.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.7 7.46.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.65.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.05.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.75.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.06.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3根据上面的数据列出频率分布表、绘出频率分布直方图,并估计长度在5.75~6.05 cm之间的麦穗在这批麦穗中所占的百分比.三、探究与创新13.如图是一个样本的频率分布直方图,且在[15,18)内频数为8.(1)求样本容量;(2)若[12,15)一组的小长方形面积为0.06,求[12,15)一组的频数;(3)求样本在[18,33)内的频率.20804 5144 兄 24015 5DCF 巏30712 77F8 矸33838 842E 萮K29373 72BD 犽21782 5516 唖Q24461 5F8D 徍34731 87AB 螫33753 83D9 菙236535C65 履23206 5AA6 媦40089 9C99 鲙。
高中数学 2.2.1 用样本的频率分布估计总体分布配套训练 新人教A版必修3
2.2 用样本估计总体2.2.1 用样本的频率分布估计总体分布1.学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n的样本,其频率分布直方图如下图所示,其中支出在[50,60]元的同学有30人,则n的值为( )A.90B.100C.900D.1000解析:支出在[50,60]元的频率为0.030×10=0.3,又=0.3,∴n=100.答案:B2.从甲、乙两种玉米苗中各抽6株,分别测得它们的株高如右茎叶图所示(单位:cm),根据数据估计( )A.甲种玉米比乙种玉米不仅长得高而且长得整齐B.乙种玉米比甲种玉米不仅长得高而且长得整齐C.甲种玉米比乙种玉米长得高但长势没有乙整齐D.乙种玉米比甲种玉米长得高但长势没有甲整齐答案:D3.某中学为了解学生数学课程的学习情况,在3000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图,如图所示.根据频率分布直方图推测,这3000名学生在该次数学考试中成绩小于60分的学生人数是.解析:由直方图易得数学考试中成绩小于60分的频率为(0.002+0.006+0.012)×10=0.2,所以所求成绩小于60分的学生人数为3000×0.2=600.答案:6004.为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛.为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表和频率分布直方图解答下列问题:分组频数频率[50.5,60.5) 4 0.08[60.5,70.5) 0.16[70.5,80.5) 10[80.5,90.5) 16 0.32[90.5,100.5]合计50(1)填充频率分布表的空格(将答案直接填在表格内);(2)补全频率分布直方图;(3)学校决定成绩在[75.5,85.5]分的学生为二等奖,问该校获得二等奖的学生约有多少人?分组频数频率[50.5,60.5) 4 0.08[60.5,70.5) 8 0.16[70.5,80.5) 10 0.20[80.5,90.5) 16 0.32[90.5,100.5] 12 0.24合计50 1.00(2)频率分布直方图如图所示:(3)成绩在[75.5,80.5)的学生人数占[70.5,80.5)的学生人数的,因为成绩在[70.5,80.5)的学生频率为0.2,所以成绩在[75.5,80.5)的学生频率为0.1.成绩在[80.5,85.5]的学生人数占成绩在[80.5,90.5)的学生人数的,因为成绩在[80.5,90.5)的学生频率为0.32,所以成绩在[80.5,85.5]的学生频率为0.16.所以成绩在[75.5,85.5]的学生频率为0.26,由于有900名学生参加了这次竞赛,所以该校获得二等奖的学生约为0.26×900=234(人).5.在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,得到什么结论?解:(1)茎叶图如图所示:(2)电脑杂志文章中每个句子的字数集中在10~30之间,中位数为22.5;而报纸文章中每个句子的字数集中在20~40之间,中位数为27.5.可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少,说明电脑杂志作为科普读物需要通俗易懂、简明扼要.6.有一个容量为50的样本,数据的分组及各组的频数如下:[12.5,15.5) 3;[15.5,18.5) 8;[18.5,21.5) 9;[21.5,24.5) 11;[24.5,27.5) 10;[27.5,30.5) 5;[30.5,33.5] 4.由此估计:(1)数据落在[15.5,24.5)的频率约是多少?(2)数据落在(-∞,27.5)的频率是多少?(3)数据落在[12.5,26.5)的可能性有多大?解:(1)∵[15.5,24.5)=[15.5,18.5)∪[18.5,21.5)∪[21.5,24.5),∴数据落在[15.5,24.5)的频数为8+9+11=28,故数据落在[15.5,24.5)的频率约为=0.56.(2)数据落在(-∞,27.5)的频数=3+8+9+11+10=41,∴数据落在(-∞,27.5)的频率为=0.82.(3)∵数据落在[12.5,24.5)的频率为=0.62,数据落在[12.5,27.5)的频率为=0.82,设数据落在[12.5,26.5)的频率为x,则,解得x≈0.75.∴数据落在[12.5,26.5)的频率约为0.75,即数据落在[12.5,26.5)的可能性约占75%.7.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如下图.由于不慎将部分数据丢失,但知道后5组频数和为62,视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为( )A.64B.54C.48D.27答案:B8.(2012山东高考,文14)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为.解析:由于组距为1,则样本中平均气温低于22.5℃的城市频率为0.10+0.12=0.22.平均气温低于22.5℃的城市个数为11,所以样本容量为=50.而平均气温高于25.5℃的城市频率为0.18,所以,样本中平均气温不低于25.5℃的城市个数为50×0.18=9.答案:99.甲、乙两名工人每天生产60个机器零件,经检验员检验合格后才能入库,不合格的销毁重做,10天中甲工人的合格品个数为:15,56,28,9,27,38,33,24,31,39;乙工人的合格品个数为:19,51,49,39,37,28,31,33,36,36.(1)用茎叶图表示甲、乙两名工人合格品的分布情况;(2)根据茎叶图分析甲、乙两名工人谁的技术水平发挥得更稳定.解:画茎叶图时,要把十位数作为茎放在中间,两组数据的个位数作为叶放在两边.然后根据茎叶图上的原始数据,分析数字特征,对两组数据加以比较,作出大致估计.(1)茎叶图如下:(2)从茎叶图上可以看到,甲的中位数是29.5,合格品数据较分散,而乙的中位数是36,合格品数据对称,故乙的技术水平发挥较稳定.10.为了了解九年级学生中女生的身高(单位:cm)情况,某中学对九年级女生身高进行了一次测组别频数频率145.5~149.5 1 0.02149.5~153.5 4 0.08153.5~157.5 20 0.40157.5~161.5 15 0.30161.5~165.5 8 0.16165.5~169.5 m n合计M N(1)求出表中m,n,M,N所表示的数分别是多少;(2)画出频率分布直方图;(3)全体女生中身高在哪组范围内的人数最多?估计九年级学生中女生的身高在161.5cm以上的概率.解:(1)M==50,m=50-(1+4+20+15+8)=2,N=1,n==0.04.(2)作出平面直角坐标系,组距为4,纵轴表示,横轴表示身高,画出直方图.(3)在153.5~157.5cm范围内的人数最多,估计身高在161.5cm以上的概率为P==0.2.11.某中学甲、乙两名同学自上高中以来每场数学考试成绩情况如下:甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.解:甲、乙两人数学成绩的茎叶图如下图所示:从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是88.因此乙同学发挥比较稳定,总体得分情况比甲同学好.12.某车站在春运期间为了改进服务,随机抽样调查了100名旅客从开始在售票窗口排队到购到车票所用的时间t(以下简称为购票用时,单位为min),下面是这次调查统计分析得到的频率分布分组频数频率一组0≤t<5 0 0二组5≤t<10 10 0.10三组10≤t<15 10 ②四组15≤t<20 ①0.50五组20≤t≤25 30 0.30合计100 1.00解答下列问题:(1)这次抽样的样本容量是多少?(2)在表中填写出缺失的数据,并绘出频率分布直方图.(3)旅客购票用时的平均数可能落在哪一小组?(4)若每增加一个购票窗口可使平均购票用时降低5min,要使平均购票用时不超过10min,那么你估计最少要增加几个窗口?解:(1)样本容量是100.(2)①50②0.10其频率分布直方图如图所示:(3)设旅客平均购票用时为t分,则有≤t<,即15≤t<20.所以旅客购票用时的平均数可能落在第四组. (4)设需增加x个窗口,则20-5x≤10,解得x≥2, 所以至少需要增加2个窗口.。
人教新课标A版 高中数学必修3 第二章统计 2.2样本估计总体 2.2.1用样本的频率分布估计总体
人教新课标A版高中数学必修3 第二章统计 2.2样本估计总体 2.2.1用样本的频率分布估计总体同步测试C卷姓名:________ 班级:________ 成绩:________一、单选题 (共15题;共30分)1. (2分)某市高三数学抽样考试中,对90分以上(含90分)的成绩进行统计,其频率分布图如图所示,已知130~140分数段的人数为90,90~100分数段的人数为a,则下图所示程序框图的运算结果为(注:n!=1×2×3×…×n,如5!=1×2×3×4×5)()A . 800!B . 810!C . 811!D . 812!2. (2分)从一批电视机中随机抽出10台进行检验,其中有1台次品,则关于这批电视机,下列说法正确的是()A . 次品率小于10%B . 次品率大于10%C . 次品率等于10%D . 次品率接近10%3. (2分)在频率分布直方图中各小长方形的面积表示()A . 落在相应各组内的数据的频数B . 相应各组的频率C . 该样本所分成的组数D . 该样本的容量4. (2分)一个容量为20的样本数据分组后,组距与频数如下:(10,20),2;(20,30),3;(30,40),4;(40,50),5;(50,60),4,(60,70),2.则样本在区间(-∞,50)上的频率是()A . 0.20B . 0.25C . 0.50D . 0.705. (2分)在样本颇率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等于它8个长方形的面积和的,且祥本容量为140,则中间一组的频数为()A . 28B . 40C . 56D . 606. (2分)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克的产品的个数是()A . 120B . 108C . 90D . 457. (2分)有一个样本容量为50的样本数据分布如下,估计不大于30的数据大约占有()[12.5,15.5)3;[15.5,18.5)8;[18.5,21.5)9;[21.5,24,5)11;[24.5,27.5)10;[27.5,30.5)6;[30.5,33.5)3.A . 94%B . 6%C . 88%D . 12%8. (2分)某商场在今年元霄节的促销活动中,对3月5日9时至14时的销售额进行统计,其频率分布直方图如图所示.已知9时至10时的销售额为5万元,则11时至12时的销售额为()A . 10万元B . 15万元C . 20万元D . 25万元9. (2分)某校为了了解高一学生的身体发育情况,打算在高一年级16个班中某两个班男女生比例抽取样本,正确的是()A . 随机抽样B . 分成抽样C . 先用抽签法,再用分层抽样D . 先用分层抽样,再用随机数表法10. (2分)下列说法正确的是()A . 根据样本估计总体,其误差与所选择的样本容量无关B . 方差和标准差具有相同的单位C . 从总体中可以抽取不同的几个样本D . 如果容量相同的两个样本的方差满足S12<S22 ,那么推得总体也满足S12<S2211. (2分)某地一种植物一年生长的高度如下表:则该植物一年生长在[30,40)内的频率是()A . 0.80B . 0.65C . 0.40D . 0.2512. (2分)某市要对两千多名出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在[20,45)岁之间,根据调查结果得出司机的年龄情况残缺的频率分布直方图如图所示,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数大约是()A . 31.6岁B . 32.6岁C . 33.6岁D . 36.6岁13. (2分)如图是根据某班学生在一次数学考试中的成绩画出的频率分布直方图,若80分以上为优秀,根据图形信息可知:这次考试的优秀率为()A . 25%B . 30%C . 35%D . 40%14. (2分)一个容量为20的数据样本,分组与频数为:[10,20]2个,(20,30]3个,(30,40]4个,(40,50]5个,(50,60]4个,(60,70]2个,则样本数据在区间(﹣∞,50)上的可能性为()A . 5%B . 25%C . 50%D . 70%15. (2分)某班学生在一次数学考试中成绩分布如下表:那么分数在[90,120)中的频率是(精确到0.01)()A . 0.18B . 0.40C . 0.50D . 0.38二、填空题 (共5题;共5分)16. (1分)某单位招聘员工,有200名应聘者参加笔试,随机抽查了其中20名应聘者笔试试卷,统计他们的成绩如下表:若按笔试成绩择优录取40名参加面试,由此可预测参加面试的分数线为________ 分.17. (1分)某中学举行了一次田径运动会,其中有50名学生参加了一次百米比赛,他们的成绩和频率如图所示.若将成绩小于15秒作为奖励的条件,则在这次百米比赛中获奖的人数共有________ 人.18. (1分) (2016高二下·姜堰期中) 如图,从2009年参加奥运知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如图所示.观察图形,估计这次奥运知识竞赛的及格率(大于或等于60分为及格)为________.19. (1分) (2016高一下·中山期中) 超速行驶已成为马路上最大杀手之一,已知某中段属于限速路段,规定通过该路段的汽车时速不超过80km/h,否则视为违规.某天,有1000辆汽车经过了该路段,经过雷达测速得到这些汽车运行时速的频率分布直方图如图所示,则违规的汽车大约为________辆.20. (1分)某次射击训练中,一小组的成绩如下表所示:若该小组的平均成绩为8.7环,则成绩为9环的人数是________.三、解答题 (共5题;共25分)21. (5分)某单位组织职工开展构建绿色家园活动,在今年3月份参加义务植树活动的职工中,随机抽取M名职工为样本,得到这些职工植树的株数,根据此数据作出了频数与频率统计表和频率分布直方图如图:(1)求出表中M,p及图中a的值;(2)单位决定对参加植树的职工进行表彰,对植树株数在[25,30)区间的职工发放价值800元的奖品,对植树株数在[20,25)区间的职工发放价值600元的奖品,对植树株数在[15,20)区间的职工发放价值400元的奖品,对植树株数在[10,15)区间的职工发放价值200元的奖品,在所取样本中,任意取出2人,并设X为此二人所获得奖品价值之差的绝对值,求X的分布列与数学期望E(X).分组频数频率[10,15)50.25[15,20)12n[20,25)m p[25,30)10.05合计M122. (5分) (2016高二上·凯里期中) 某种零件按质量标准分为1,2,3,4,5五个等级,现从一批该零件巾随机抽取20个,对其等级进行统计分析,得到频率分布表如下等级12345频率0.05m0.150.35n(1)在抽取的20个零件中,等级为5的恰有2个,求m,n;(2)在(1)的条件下,从等级为3和5的所有零件中,任意抽取2个,求抽取的2个零件等级恰好相同的概率.23. (5分)某校有教职员工150人,为了丰富教工的课余生活,每天下午4:00~5:00同时开放健身房和娱乐室,要求所有教工每天必须参加一个活动.据调查统计,每次去健身房的人有10%下次去娱乐室,而在娱乐室的人有20%下次去健身房.请问,随着时间的推移,去健身房的人数能否趋于稳定?24. (5分)一个地区共有5个乡镇,共30万人,其人口比例为3∶2∶5∶2∶3,从这30万人中抽取一个300人的样本,分析某种疾病的发病率.已知这种疾病与不同的地理位置及水土有关,则应采取什么样的抽样方法?并写出具体过程.25. (5分) (2016高二下·南阳期末) 某校为了探索一种新的教学模式,进行了一项课题实验,甲班为实验班,乙班为对比班,甲乙两班的人数均为50人,一年后对两班进行测试,测试成绩的分组区间为[80,90)、[90,100)、[100,110)、[110,120)、[120,130),由此得到两个班测试成绩的频率分布直方图:(1)完成下面2×2列联表,你能有97.5%的把握认为“这两个班在这次测试中成绩的差异与实施课题实验有关”吗?并说明理由;成绩小于100分成绩不小于100分合计甲班a=________b=________50乙班c=24d=2650合计e=________f=________100(2)现从乙班50人中任意抽取3人,记ξ表示抽到测试成绩在[100,120)的人数,求ξ的分布列和数学期望Eξ.附:K2= ,其中n=a+b+c+dP(K2≥k0)0.150.100.050.0250.0100.0050.001 k0 2.072 2.706 3.841 5.204 6.6357.87910.828参考答案一、单选题 (共15题;共30分)1-1、2-1、3-1、4-1、5-1、6-1、7-1、8-1、9-1、10-1、11-1、12-1、13-1、14-1、15-1、二、填空题 (共5题;共5分) 16-1、17-1、18-1、19-1、20-1、三、解答题 (共5题;共25分) 21-1、22-1、22-2、23-1、24-1、25-1、25-2、。
高中数学人教版A版必修三课时作业习题及答案:第二章2-2 用样本估计总体
第二章统计2.2 用样本估计总体2.2.1用样本的频率分布估计总体分布课时目标 1.理解用样本的频率分布估计总体分布的方法.2.会列频率分布表,画频率分布直方图,频率分布折线图,茎叶图.3.能够利用图形解决实际问题.1,用样本估计总体的两种情况(1)用样本的____________估计总体的分布.(2)用样本的____________估计总体的数字特征.2,数据分析的基本方法(1)借助于图形分析数据的一种基本方法是用图将它们画出来,此法可以达到两个目的,一是从数据中____________,二是利用图形________信息.(2)借助于表格分析数据的另一方法是用紧凑的________改变数据的排列方式,此法是通过改变数据的____________,为我们提供解释数据的新方式.3,频率分布直方图在频率分布直方图中,纵轴表示____________,数据落在各小组内的频率用________________来表示,各小长方形的面积的总和等于____.4,频率分布折线图和总体密度曲线(1)频率分布折线图连接频率分布直方图中各小长方形__________,就得到了频率分布折线图.(2)总体密度曲线随着样本容量的增加,作图时所分的____增加,组距减小,相应的频率分布折线图就会越来越接近于一条________,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.5,茎叶图(1)适用范围:当样本数据较少时,用茎叶图表示数据的效果较好.(2)优点:它不但可以____________,而且可以__________,给数据的记录和表示都带来方便.(3)缺点:当样本数据______时,枝叶就会很长,茎叶图就显得不太方便.一、选择题1,下列说法不正确的是()A,频率分布直方图中每个小矩形的高就是该组的频率B,频率分布直方图中各个小矩形的面积之和等于1C,频率分布直方图中各个小矩形的宽一样大D,频率分布折线图是依次连接频率分布直方图的每个小矩形上端中点得到的2,一个容量为100的样本,其数据的分组与各组的频数如下:组别(0,10] (10,20] (20,30] (30,40] (40,50] (50,60] (60,70] 频数12 13 24 15 16 13 7 则样本数据落在(10,40]上的频率为()A,0.13 B.0.39 C.0.52 D.0.643,100辆汽车通过某一段公路时的时速的频率分布直方图如下图所示,则时速在[60,70)的汽车大约有()A.30辆B.40辆C,60辆D.80辆4,如图是总体密度曲线,下列说法正确的是()A,组距越大,频率分布折线图越接近于它B,样本容量越小,频率分布折线图越接近于它C,阴影部分的面积代表总体在(a,b)内取值的百分比D,阴影部分的平均高度代表总体在(a,b)内取值的百分比5,一个容量为35的样本数据,分组后,组距与频数如下:[5,10),5个;[10,15),12个;[15,20),7个;[20,25),5个;[25,30),4个;[30,35),2个.则样本在区间[20,+∞)上的频率为()A,20% B.69%C,31% D.27%6,某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是()A,90 B.75 C.60 D.45题号 1 2 3 4 5 6答案二、填空题7,将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________. 8,在如图所示的茎叶图中,甲,乙两组数据的中位数分别是________.9.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在各组上的频率为m,该组上直方图的高为h,则|a-b|=________.三、解答题10,抽查100袋洗衣粉,测得它们的重量如下(单位:g):494498493505496492485483508 511495494483485511493505488 501491493509509512484509510 495497498504498483510503497 502511497500493509510493491 497515503515518510514509499 493499509492505489494501509 498502500508491509509499495 493509496509505499486491492 496499508485498496495496505 499505496501510496487511501496(1)列出样本的频率分布表:(2)画出频率分布直方图,频率分布折线图;(3)估计重量在[494.5,506.5]g的频率以及重量不足500 g的频率.能力提升11,在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,你会得到什么结论?12,某市2010年4月1日-4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表.(2)作出频率分布直方图.(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.答案: 2.2.1 用样本的频率分布估计总体分布 知识梳理1,(1)频率分布 (2)数字特征 2.(1)提取信息 传递 (2)表格 构成形式 3.频率/组距 小长方形的面积 1 4.(1)上端的中点 (2)组数 光滑曲线5,(2)保留所有信息 随时记录 (3)较多作业设计1,A 2,C [样本数据落在(10,40]上的频数为13+24+15=52,故其频率为52100=0.52.] 3,B [时速在[60,70)的汽车的频率为:0,04×(70-60)=0.4,又因汽车的总辆数为100, 所以时速在[60,70)的汽车大约有0.4×100=40(辆).]4,C5,C [由题意,样本中落在[20,+∞)上的频数为5+4+2=11,∴在区间[20,+∞)上的频率为1135≈0.31.]6,A [∵样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36, ∴样本总数为360.3=120.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.] 7,60解析 ∵n·2+3+42+3+4+6+4+1=27, ∴n =60.8,45,46解析 由茎叶图及中位数的概念可知x 甲中=45,x 乙中=46. 9.m h解析频率组距=h ,故|a -b|=组距=频率h =m h . 10,解 (1)在样本数据中,最大值是518,最小值是483,它们相差35,若取组距为4,由于354=834,要分9组,组数合适,于是决定取组距为4 g ,分9组,使分点比数据多一位小数,且把第一组起点稍微减小一点,得分组如下:[482.5,486.5),[486.5,490.5),…,[514.5,518.5). 列出频率分布表:分组 个数累计 频数 频率 累积频率 [482.5,486.5) 正 8 0.08 0.08 [486.5,490.5) 3 0.03 0.11[490.5,494.5) 正正正 17 0.17 0.28 [494.5,498.5) 正正正正- 21 0.21 0.49 [498.5,502.5) 正正 14 0.14 0.63 [502.5,506.5) 正 9 0.09 0.72[506.5,510.5) 正正正 19 0.19 0.91 [510.5,514.5) 正- 6 0.06 0.97[514.5,518.5] 3 0.03 1.00合计 100 1.00(2)频率分布直方图与频率分布折线图如图.(3)重量在[494.5,506.5]g 的频率为:0.21+0.14+0.09=0.44.设重量不足500 g 的频率为b ,根据频率分布表,b -0.49500-498.5≈0.63-0.48502.5-498.5,故b ≈0.55.因此重量不足500 g 的频率约为0.55. 11,解 (1)(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物需要通俗易懂、简明.12,解 (1)(2)(3)答对下述两条中的一条即可:①该市有一个月中空气污染指数有2天处于优的水平,占当月天数的115;有26天处于良的水平,占当月天数的1315;处于优或良的天数为28,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数2,占当月天数的1730,超过50%;说明该市空气质量有待进一步改善.2.2.2用样本的数字特征估计总体的数字特征课时目标 1.会求样本的众数,中位数,平均数,标准差,方差.2.理解用样本的数字特征来估计总体数字特征的方法.3.会应用相关知识解决简单的统计实际问题.1,众数,中位数,平均数(1)众数的定义:一组数据中重复出现次数________的数称为这组数的众数.(2)中位数的定义及求法把一组数据按从小到大的顺序排列,把处于最______位置的那个数称为这组数据的中位数.①当数据个数为奇数时,中位数是按从小到大顺序排列的__________那个数.②当数据个数为偶数时,中位数为排列的最中间的两个数的________.(3)平均数①平均数的定义:如果有n个数x1,x2,…,x n,那么x=____________,叫做这n个数的平均数.②平均数的分类:总体平均数:________所有个体的平均数叫总体平均数.样本平均数:________所有个体的平均数叫样本平均数.2,标准差,方差(1)标准差的求法:标准差是样本数据到平均数的一种平均距离,一般用s表示.s=________________________________________________________________________.(2)方差的求法:标准差的平方s2叫做方差.s2=________________________________________________________________________.一、选择题1,下列说法正确的是()A,在两组数据中,平均值较大的一组方差较大B,平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小C,方差的求法是求出各个数据与平均值的差的平方后再求和D,在记录两个人射击环数的两组数据中,方差大的表示射击水平高2,已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则有()A,a>b>c B.a>c>bC,c>a>b D.c>b>a3,甲,乙两位同学都参加了由学校举办的篮球比赛,他们都参加了全部的7场比赛,平均得分均为16分,标准差分别为5.09和3.72,则甲,乙两同学在这次篮球比赛活动中,发挥得更稳定的是()A,甲B.乙C,甲,乙相同D.不能确定4,一组数据的方差为s2,将这组数据中的每个数据都扩大3倍,所得到的一组数据的方差是()A.13s2B.s2C,3s2D.9s25,如图是2010年某校举行的元旦诗歌朗诵比赛中,七位评委为某位选手打出分数的茎叶统计图,去掉一个最高分和一个最低分,所剩数据的平均数和方差分别为()A,84,4.84 B.84,1.6C,85,1.6 D.85,0.46,如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为x A和x B,样本标准差分别为s A和s B则()A.x A>x B,s A>s BB.x A<x B,s A>s BC.x A>x B,s A<s BD.x A<x B,s A<s B题号 1 2 3 4 5 6答案二、填空题7,已知样本9,10,11,x,y的平均数是10,方差是4,则xy=________.8,甲,乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲10 8 9 9 9乙10 10 7 9 9如果甲,乙两人只能有1人入选,则入选的应为________.9,若a1,a2,…,a20,这20个数据的平均数为x,方差为0.20,则数据a1,a2,…,a20,x这21个数据的方差为________.三、解答题10,甲,乙两人在相同条件下各射靶10次,每次射靶的成绩情况如图所示:(1)请填写表:平均数方差中位数命中9环及9环以上的次数甲乙(2)请从下列四个不同的角度对这次测试结果进行分析:①从平均数和方差相结合看(分析谁的成绩更稳定);②从平均数和中位数相结合看(分析谁的成绩好些);③从平均数和命中9环及9环以上的次数相结合看(分析谁的成绩好些);④从折线图上两人射击命中环数的走势看(分析谁更有潜力).能力提升11,下面是一家快餐店所有工作人员(共7人)一周的工资表:总经理大厨二厨采购员杂工服务员会计3 000元450元350元400元320元320元410元(1)计算所有人员一周的平均工资;(2)计算出的平均工资能反映一般工作人员一周的收入水平吗?(3)去掉总经理的工资后,再计算剩余人员的平均工资,这能代表一般工作人员一周的收入水平吗?12,1,平均数、众数、中位数都是描述数据的集中趋势的,其中平均数是最重要的量.众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使得无法客观地反映总体特征;中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也成为缺点,因为这些极端值有时是不能忽视的.由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低.2,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.3,极差、方差、标准差是描述数据的离散程度的,即各数据与其平均数的离散程度.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.答案:2,2.2用样本的数字特征估计总体的数字特征知识梳理1,(1)最多 (2)中间 ①中间位置的 ②平均数 (3)①x 1+x 2+…+x n n ②总体中 样本中2,(1)1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2] (2)1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2] 作业设计1,B [A 中平均值和方差是数据的两个特征,不存在这种关系;C 中求和后还需取平均数;D 中方差越大,射击越不平稳,水平越低.]2,D [由题意a =110(16+18+15+11+16+18+18+17+15+13)=15710=15.7,中位数为16,众数为18,即b =16,c =18,∴c>b>a.]3,B [方差或标准差越小,数据的离散程度越小,表明发挥得越稳定.∵5.09>3.72,故选B .]4,D [s 20=1n [9x 21+9x 22+…+9x 2n -n(3x )2]=9·1n(x 21+x 22+…+x 2n -n x 2)=9·s 2(s 20为新数据的方差).]5,C [由题意x =15(84+84+86+84+87)=85.s 2=15[(84-85)2+(84-85)2+(86-85)2+(84-85)2+(87-85)2]=15(1+1+1+1+4)=85=1.6.]6,B [样本A 数据均小于或等于10,样本B 数据均大于或等于10,故x A <x B , 又样本B 波动范围较小,故s A >s B .] 7,91解析 由题意得8,甲解析 x 甲=9,2S 甲=0.4,x 乙=9,2S 乙=1.2,故甲的成绩较稳定,选甲.9,0.19 解析 这21个数的平均数仍为20,从而方差为121×[20×0.2+(20-20)2]≈0.19. 10,解 由折线图,知甲射击10次中靶环数分别为:9,5,7,8,7,6,8,6,7,7.将它们由小到大重排为:5,6,6,7,7,7,7,8,8,9.乙射击10次中靶环数分别为: 2,4,6,8,7,7,8,9,9,10.也将它们由小到大重排为:2,4,6,7,7,8,8,9,9,10.(1)x 甲=110×(5+6×2+7×4+8×2+9)=7010=7(环), x 乙=110×(2+4+6+7×2+8×2+9×2+10)=7010=7(环),s 2甲=110×[(5-7)2+(6-7)2×2+(7-7)2×4+(8-7)2×2+(9-7)2]=110×(4+2+0+2+4)=1.2,s 2乙=110×[(2-7)2+(4-7)2+(6-7)2+(7-7)2×2+(8-7)2×2+(9-7)2×2+(10-7)2] =110×(25+9+1+0+2+8+9)=5.4. 根据以上的分析与计算填表如下:平均数 方差 中位数 命中9环及9环以上的次数甲 7 1.2 7 1乙 7 5.4 7.5 3 (2)①∵平均数相同,2S 甲<2S 乙,∴甲成绩比乙稳定. ②∵平均数相同,甲的中位数<乙的中位数,∴乙的成绩比甲好些.③∵平均数相同,命中9环及9环以上的次数甲比乙少,∴乙成绩比甲好些.④甲成绩在平均数上下波动;而乙处于上升势头,从第四次以后就没有比甲少的情况发生,乙较有潜力.11,解 (1)平均工资即为该组数据的平均数 x =17×(3 000+450+350+400+320+320+410)=17×5 250=750(元).(2)由于总经理的工资明显偏高,所以该值为极端值,因此由(1)所得的平均工资不能反映一般工作人员一周的收入水平.(3)除去总经理的工资后,其他工作人员的平均工资为:x ′=16×(450+350+400+320+320+410)=16×2 250=375(元).这个平均工资能代表一般工作人员一周的收入水平.12,解 设第一组20名学生的成绩为x i (i =1,2,…,20),第二组20名学生的成绩为y i (i =1,2,…,20), 依题意有:x =120(x 1+x 2+…+x 20)=90,y =120(y 1+y 2+…+y 20)=80,故全班平均成绩为:140(x 1+x 2+…+x 20+y 1+y 2+…+y 20)=140(90×20+80×20)=85;又设第一组学生成绩的标准差为s 1,第二组学生成绩的标准差为s 2,则s 21=120(x 21+x 22+…+x 220-20x 2),s 22=120(y 21+y 22+…+y 220-20y 2) (此处,x =90,y =80),又设全班40名学生的标准差为s ,平均成绩为z (z =85),故有s 2=140(x 21+x 22+…+x 220+y 21+y 22+…+y 220-40z 2) =140(20s 21+20x 2+20s 22+20y 2-40z 2) =12(62+42+902+802-2×852)=51. s =51.所以全班同学的平均成绩为85分,标准差为51.。
2021学年高中数学第二章统计2.2.1用样本的频率分布估计总体分布学案含解析新人教A版必修3
高中数学:2.2 用样本估计总体2.2.1用样本的频率分布估计总体分布[目标] 1.理解用样本的频率分布估计总体分布的方法;2.掌握列频率分布表、画频率分布直方图、频率分布折线图、茎叶图的方法;3.能够利用图形解决实际问题.[重点] 频率分布直方图的画法及茎叶图的画法.[难点] 应用频率分布直方图估计总体的分布.知识点一频率分布表和频率分布直方图[填一填]1.频率分布直方图的绘制(1)求极差,即一组数据中的最大值与最小值的差.(2)决定组距与组数,组距与组数的确定没有固定的标准,一般来说,数据分组的组数与样本容量有关,样本容量越大,所分组数越多,当样本容量不超过100时,按照数据的多少,常分为5~12组.(3)将数据分组.(4)列频率分布表,计算各小组的频率,作出频率分布表.(5)画频率分布直方图.其中横轴表示样本数据,纵轴表示频率与组距的比.2.频率分布直方图的意义频率分布直方图中,各小长方形的面积表示相应各组的频率,各小长方形的面积的总和等于1.[答一答]1.如何确定组距?提示:组距的选择应力求“取整”,如果极差不利于分组(如不能被组数整除),可适当增大极差,如在左、右两端各增加适当范围(尽量使两端增加的量相同).2.频率分布直方图中长方形的面积有什么含义?提示:在频率分布直方图中,由于长方形的面积S =组距×频率组距=频率,所以各个小长方形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组上的频率的大小.知识点二 频率分布折线图、总体密度曲线[填一填]1.频率分布折线图的定义连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图. 2.总体密度曲线的定义在样本频率分布直方图中,随着样本容量的增加,所分组数的增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线,它能够精确地反映总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.[答一答]3.频率分布折线图有什么优缺点?提示:频率分布折线图的优点是它可以表示数量的多少,直观地反映数量的增减情况,即变化趋势;缺点是它不适合总体分布较多的情况.知识点三 茎叶图[填一填]1.茎叶图的适用范围在样本数据较少时,用茎叶图表示数据的效果较好.2.茎叶图的优点它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便. 3.茎叶图的缺点当样本数据较多时,枝叶就会很长,茎叶图就显得不太方便.[答一答]4.画茎叶图时,重复出现的数据只记录一次吗?提示:不是.绘制茎叶图时,重复出现的数据要重复记录,不能遗漏,特别是“叶”位置的数据.同一数据出现几次,就要在图中体现几次.类型三画样本的频率分布直方图[例1]下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高.(单位:cm) 区间界限[122,126)[126,130)[130,134) 人数5810 区间界限[134,138)[138,142)[142,146) 人数223320 区间界限[146,150)[150,154)[154,158] 人数116 5(2)画出频率分布直方图;(3)估计身高小于134 cm的人数占总人数的百分比.[解](1)样本频率分布表如下:分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28[142,146)200.17[146,150)110.09[150,154)60.05[154,158]50.04合计120 1(2)其频率分布直方图如下:(3)由样本频率分布表可知身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.在该问题中,分组区间已经给出,只需计算相应的频率即可列表.在画频率分布直方图时,小长方形的高是频率除以组距,需要预先进行计算.画频率分布直方图时,还需注意比例适当.从频率分布表或频率分布直方图,可以估计总体的分布情况.[变式训练1]为了检测某种产品的质量,抽取了一个容量为100的样本,数据的分组情况与频数如下:[10.75,10.85),3;[10.85,10.95),9;[10.95,11.05),13;[11.05,11.15),16;[11.15,11.25),26;[11.25,11.35),20;[11.35,11.45),7;[11.45,11.55),4;[11.55,11.65),2.(1)列出频率分布表;(2)画出频率分布直方图和频率分布折线图.解:(1)频率分布表如下:分组频数频率[10.75,10.85)30.03[10.85,10.95)90.09[10.95,11.05)130.13[11.05,11.15)160.16[11.15,11.25)260.26[11.25,11.35)200.20[11.35,11.45)70.07[11.45,11.55)40.04[11.55,11.65)20.02合计100 1.00(2)频率分布直方图及频率分布折线图如图所示:类型二频率分布直方图的应用[例2]为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为24171593,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率约是多少?[解] (1)频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的, 因此第二小组的频率为42+4+17+15+9+3=0.08.因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由直方图可估计该校全体高一年级学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%.由频率分布直方图进行相关计算时,需掌握下列关系式: (1)频率组距×组距=频率. (2)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数. [变式训练2] 从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a =0.030.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为3.解析:根据(0.035+a +0.020+0.010+0.005)×10=1, 求得a =0.030.身高在[120,130)内学生有0.030×10×100=30人, 在[130,140)内学生有0.020×10×100=20人,在[140,150]内学生有0.010×10×100=10人,则从身高在[140,150]内的学生中选取的人数为18×10=3(人).30+20+10类型三茎叶图及应用[例3]某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产量数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454.品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430.(1)画出茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,得出统计结论.[分析]两组数据比较多,注意不要漏掉数据,根据茎叶图的特点(分布情况)写出统计结论.[解](1)茎叶图如图.(2)样本容量不大,画茎叶图很方便,此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息丢失,而且还可以随时记录新的数据.(3)通过观察茎叶图可以看出:①品种A亩产量的平均数比品种B亩产量的平均数大;②品种A 的亩产量波动比品种B 的亩产量波动大,故品种A 的亩产量稳定性较差.(1)利用茎叶图进行数据分析时,通常从茎叶图中各个“叶”上的数字多少来分析该组数据的分布对称性、稳定性等.(2)如果茎叶图中的数据大致集中在某一行附近,那么说明这组数据比较稳定.,(3)茎叶图只适用于样本数据较少的情况.[变式训练3] 为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8:00~10:00间各自的点击量,得到如图所示的茎叶图,根据茎叶图解答下列问题:(1)求乙网站点击量的极差;(2)求甲网站点击量在[10,40]间的频数和频率; (3)请你估计甲、乙两网站哪个更受欢迎?并说理由.解:(1)根据茎叶图,得乙网站的点击量的最大值是71,最小值是5,则乙网站的极差为71-5=66.(2)观察茎叶图,得甲网站点击量在[10,40]间的点击量有20,24,25,38共4个,所以甲网站点击量在[10,40]间的频数为4,频率为414=27.(3)观察茎叶图,得甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况来看,甲的平均数大于乙的平均数,所以甲网站更受欢迎.1.一个容量为40的样本数据分组后组数与频数如下: [25,25.3),6;[25.3,25.6),4;[25.6,25.9),10; [25.9,26.2),8;[26.2,26.5),8;[26.5,26.8),4.则样本在[25,25.9)上的频率为( C ) A.320 B.110 C.12 D.14解析:[25,25.9)包括[25,25.3),6;[25.3,25.6),4;[25.6,25.9),10,频数之和为20,频率为2040=12,故选C.2.在用样本频率分布估计总体分布的过程中,下列说法正确的是( C ) A .总体容量越大,估计越精确 B .总体容量越小,估计越精确 C .样本容量越大,估计越精确 D .样本容量越小,估计越精确3.从甲、乙两种玉米苗中各抽6株,分别测得它们的株高如图所示(单位:cm),根据数据估计( D )A .甲种玉米比乙种玉米不仅长得高而且长得整齐B .乙种玉米比甲种玉米不仅长得高而且长得整齐C .甲种玉米比乙种玉米长得高但长势没有乙整齐D .乙种玉米比甲种玉米长得高但长势没有甲整齐解析:甲种玉米株高集中在21 cm ~37 cm ,极差为37-16=21 cm ,乙种玉米株高集中在27~45且极差为45-14=31 cm ,因此可以判断乙种玉米比甲种玉米长得高但长势没有甲整齐.故选D.4.为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( C )A.6B.8 C.12D.18解析:由题图可知,第一组与第二组的频率之和为(0.24+0.16)×1=0.4.因为第一组与第二组共有20人,所以该试验共选取志愿者200.4=50(人),故第三组共有50×0.36=18(人),没有疗效的有6人,故有疗效的有18-6=12(人).5.甲、乙两名篮球运动员在某几场比赛得分情况为甲:12,15,25,24,39,36,31,37,49,44,50;乙:16,13,14,26,23,28,39,33,38,51.(1)画出甲、乙两名篮球运动员在某几场比赛得分的茎叶图;(2)甲、乙两人这几场比赛得分的中位数之和是多少.解:(1)以得分的十位数为“茎”,个位数为“叶”在同一图中画出即可.茎叶图如图所示.(2)甲得分的中位数为第六个数36,乙得分的中位数为第五个和第六个数的平均数,即26+282=27,所以甲、乙得分的中位数之和为63.——本课须掌握的两大问题1.理解频率分布直方图注意以下几点:(1)在频率分布直方图中,各小长方形的面积的总和等于1,利用这一点可以检验所画的直方图是否正确.(2)同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的直方图的形状也不相同.不同的形状给人以不同的印象,这种印象很多时候会影响我们对总体的判断.(3)同一个总体,由于抽样的随机性,如果随机地抽取另外一个样本,所形成的样本频率分布一般会与前一个样本的频率分布有所不同,但是它们都可以近似地看作总体的分布.2.对茎叶图的认识:(1)茎叶图在样本数据较少、较为集中且位数不多时比较适用.由于它较好地保留了原始数据且能够展示数据的分布情况,所以可以帮助我们分析样本数据的大致频率分布,还可以用来分析样本的一些数字特征.(2)用茎叶图表示数据有两个突出的优点:其一,图上没有原始数据的损失,所有信息都可从这个茎叶图中得到;其二,茎叶图可以随时记录,方便记录与表示.学科素养培优精品微课堂不能正确理解频率分布直方图开讲啦在频率分布直方图中,每个小长方形的面积表示相应各组的频率,所有小长方形的面积之和为1.在解题时,常因把小长方形的高误认为是频率而导致错误.[典例]为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄在17.5~18岁之间的男生体重(单位:kg),得到频率分布直方图如下:根据上图可得这100名学生中体重在[56.5,64.5)的学生人数是()A.20B.30C.40 D.50[错答] A[正答] C[错因分析]错解步骤如下:体重在[56.5,64.5)的频率为0.03+0.05×2+0.07=0.2,故学生人数为0.2×100=20.错解原因在于将小长方形的高误认为是频率了,而实际上小长方形的面积才是频率.故体重在[56.5,64.5)的频率为(0.03+0.05×2+0.07)×2=0.4,学生人数为0.4×100=40.[针对训练]某中学举行了一次“环保知识竞赛”活动.为了了解本次竞赛学生的成绩情况,从中抽取了部分学生的成绩(得分取正整数,满分为100分)作为样本(样本容量为n )进行统计.按照[50,60),[60,70),[70,80),[80,90),[90,100]的分组作出了频率分布直方图,并作出了分数的茎叶图(图中仅列出得分在[50,60),[90,100]的数据),如图.则样本容量n 和频率分布直方图中x ,y 的值分别为( A )A .50,0.030,0.004B .30,0.040,0.003C .30,0.030,0.040D .50,0.300,0.400解析:由题意可知,样本容量n =80.016×10=50,y =250×10=0.004,x =0.100-0.004-0.010-0.016-0.040=0.030.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.2.1 用样本的频率分布估计总体分布
A级基础巩固
一、选择题
1.没有信息的损失,所有的原始数据都可以从图中得到的统计图是( )
A.总体密度曲线B.茎叶图
C.频率分布折线图D.频率分布直方图
答案:B
2.下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为( )
B.C.D.
解析:数据总个数n=10,又落在区间[22,30)内的数据个数为4,故所求的频率为4
10
=0.4.
答案:B
3.某雷达测速区规定:凡车速大于或等于70 km/h的汽车视为“超速”,并将受到处罚.下图是某路段的一个检测点对300辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可得出将被处罚的汽车数为( )
A.30辆B.40辆C.60辆D.80辆
解析:车速大于或等于70 km/h的汽车数为×10×300=60(辆).
答案:C
4.一个社会调查机构就某地区居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如图),为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(单位:元)
月收入段应抽出的人数为( )
A.5 B.25 C.50 D.2 500
解析:组距=500,在[2 500,3 000)的频率=0.000 5×500=,样本数为100,则在[2 500,3 000)内应抽100×=25(人).
答案:B
5.为了了解某校高三学生的视力情况,随机抽查了该校100名高三学生的视力情况,得到频率分布直方图如图所示,由于不慎将部分数据丢失,仅知道后5组的频数和为62.设视力在到之间的学生数为a,最大频率为,则a的值为( )
A.27 B.48 C.54 D.64
解析:由已知,视力在到之间的学生数为100×=32,又视力在到之间的频率为1-+
0.5)×-62
100
=,所以视力在到之间的学生数为100×=22,所以视力在到之间的学生数a =32+22=54.
答案:C
二、填空题
6.某市共有5 000名高三学生参加联考,为了了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成如下频率分布表:
分组/分频数频率
[80,90)①②
[90,100)
[100,110)
[110,120)36
[120,130)
[130,140)12③
[140,150]
合计
④
根据上面的频率分布表,可以①处的数值为________,②处的数值为________. 解析:由位于[110,120)的频数为36,频率=36
n
=,得样本容量n =120,
所以[130,140)的频率=12
120=,
②处的数值=1------=; ①处的数值为×120=3. 答案:3
7.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).由图中数据可知a =________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法抽取18人参加一项活动,则从身高在[140,150]内的学生中抽取的人数应为________.
解析:所有小矩形的面积和等于10×++0.020+a +0.035)=1,解得a =;100名同学中,身高在[120,130)内的学生数是10××100=30,身高在[130,140)内的学生数是10××100=20,身高在[140,150]内的学生数是10××100=10,则三组内的总学生数是30+20+10=60,抽样比是1860=310,所以身高在[140,150]内的学生中选取的人数应为10×
3
10=3.
答案: 3
8.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校200名授课教师中抽取20名教师,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如下:
据此可估计该校上学期200名教师中,使用多媒体进行教学次数在[15,25)内的人数为________.
答案:60
三、解答题
9.为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8:00-10:00间各自的点击量,得到如图所示的茎叶图.
(1)甲网站点击量在[10,40]间的频率是多少? (2)甲、乙两个网站哪个更受欢迎?请说明理由.
解:(1)甲网站点击量在[10,40]内的有17,20,38,32,共有4天,则频率为
414=27
. (2)甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况来看,甲网站更受欢迎.
10.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少? 解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:
4
2+4+17+15+9+3
=0.08.
又因为第二小组的频率=第二小组的频数
样本容量
,
所以样本容量=第二小组的频数第二小组的频率=12
0.08
=150.
(2)由题意估计该学校高一学生的达标率约为17+15+9+3
2+4+17+15+9+3
×100%=88%.
B 级 能力提升
1.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图所示是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )
A .6
B .8
C .12
D .18
解析:志愿者的总人数为20
(+)×1
=50,所以第三组的人数为50×=18,有疗效的人
数为18-6=12.
答案:C
2.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.
解析:由题意可知,这35名运动员的分组情况为,第一组(130,130,133,134,135),第二组(136,136,138,138,138),第三组(139,141,141,141,142),第四组(142,142,143,143,144),第五组(144,145,145,145,146),第六组(146,147,148,150,151),第七组(152,152,153,153,153),故成绩在区间[139,151]上的运动员恰有4组,则运动员人数为4.
答案:4
3.从高一学生中抽取50名参加调研考试,成绩的分组及各组的频数如下(单位:分): [40,50),2;[50,60),3;
[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)估计成绩在[70,80)分的学生所占总体的百分比.
解:(1)频率分布表如下:
成绩分组频数频率
[40,50)2
[50,60)3
[60,70)10
[70,80)15
[80,90)12
[90,100]8
合计50
(2)由题意知组距为10,取小矩形的高根据表格画出如下的频率分布直方图:
(3)由频率分布直方图,可估计成绩在[70,80)分的学生所占总体的百分比是×10==30%.。