10-3用样本估计总体2019高三一轮复习课件
2023年高考数学一轮复习 新高考方案 课件第九章 统计与成对数据的统计分析

答案:95
• 层级一/ 基础点——自练通关(省时间)
• 基础点(一) 抽样方法
• [题点全训]
• 1.某班有男生36人,女生18人,用分层随机抽样的方法从该班全 体学生中抽取一个容量为9的样本,则抽取的女生人数为
在一组数据中出现次数_最__多__的数
中位数 将一组数据按_大__小__顺__序___依次排列(相同的数据要重复列出), 处在最中间位置的那个数据(或最中间两个数据的平均数)
平均数
一组数据的_算__术__平__均__数___
方差
s2=n1[(x1- x )2+(x2- x )2+…+(xn- x )2](xn 是样本数据,n 是样本容量, x 是样本平均数),其中 s 是标准差
样本量
(3)平均数计算
在分层随机抽样中,如果层数分为 2 层,第 1 层和第 2 层包含的个体数分
别为 M 和 N,抽取的样本量分别为 m 和 n,第 1 层和第 2 层样本的平均数分别
为
x
,
y
,则样本的平均数
w
=
m m+n
x
+m+n n
y
M = M+N
x +M+N N y .
• 3.作频率分布直方图的步骤 • (1)求极_差____ (即一组数据中最大值与最小值的差);
• 8 44 2 17 8 31 57 4 55 6
•88 77 74 47 7 21 76 33 50 63
•解析:生成的随机数中落在编号1~100范围内的有8,44,2,17,8(重 复,舍弃),31……故选中的第5个个体的编号为31.
《用样本估计总体》复习课件与练习

[5.75,6.05) 28 0.28 [6.05,6.35) 13 0.13 [6.35,6.65) 11 0.11 [6.65,6.95) 10 0.10 [6.95,7.25) 2 0.02 [7.25,7.55] 1 0.01
合计 100 1.00
(5)绘制频率分布直方图如图.
从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13 =0.41,于是可以估计,在这块试验田里长度在5.75~6.35 cm之间 的麦穗约占41%.
第九章 统 计
9.2 用样本估计总体 9.2.1 总体取值规律的估计
学习目标
核心素养
1. 通过对统计图表的学习,培养 1.理解并掌握统计图表的画法及
学生数学抽象素养. 应用.(重点、易混点)
2.通过应用统计图表估计总体的 2.结合实例,能用样本估计总体
取值规律,培养学生数据分析素 的取值规律.(重点、难点)
(3)决定分点: 使分点比数据多一位小数,并且把第1小组的起点稍微减小一 点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~ 4.85,…,7.25~7.55.
(4)列频率分布表: 分组
频数 频率
[3.95,4.25) 1 0.01 [4.25,4.55) 1 0.01 [4.55,4.85) 2 0.02 [4.85,5.15) 5 0.05 [5.15,5.45) 11 0.11 [5.45,5.75) 15 0.15
6.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.4 6.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.7 7.4 6.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6 5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0 5.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7 5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0 6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3
高考数学第一轮知识点总复习 第二节 用样本估计总体

平.因为公司中少数人的月工资额与大多数人的月工资额差别较大,
这样导致了平均数与中位数的偏差较大,所以平均数不能客观真实
地反映这个公司员工的工资水平.
题型四 综合问题
【例4】(12分)某种瓶装溶液,因为装瓶机的不稳定性,所以很可能每 瓶装的容量都不是标准的容量.我们随机抽出了20瓶,测得它们的容量 (单位:百毫升)如下: 12.1 11.9 12.2 12.2 12.0 12.1 12.9 12.1 12.3 12.5 11.7 12.4 12.3 11.8 11.3 12.1 11.4 11.6 11.2 12.2
1
(2)频率分布直方图如图:
(3)电子元件寿命在100 h~400 h以内的频数为130,则频率 为 13=00.65. 200
(4)寿命在400 h以上的电子元件的频数为70,则频率 为 =700.35. 200
学后反思利用样本的频率分布可近似地估计总体的分布.从本例可 以看出,要比较准确地反映出总体70 分布的情况,必须准确地作出
[140,15 0)
人数
4
8
x
5
3
生产能 力分组 人数
表2:
[110, 120)
6
[120,130) [130,14 0)
y
36
[140,15 0)
18
(1)先确定x、y,再完成下列频率分布直方图,就生产能力而言, A类工人中个体间的差异程度与B类工人中个体间的差异程度哪 个更小?(不用计算,可通过观察直方图直接回答结论)
比;所有组距的频率之和为1;每一组距的频率是频率分布直方图中该
组距所对应的矩形的面积.
解
(1)M=0.102
=50,m=50-(1+4+20+15+8)=2n,N =m1,
高三数学人教版A版数学(理)高考一轮复习教案:用样本估计总体 Word版含答案

第三节用样本估计总体总体分布的估计(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.知识点一频率分布直方图1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.易误提醒 (1)易把直方图与条形图混淆:两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,连续随机变量在某一点上是没有频率的.(2)易忽视频率分布直方图中纵轴表示的应为频率组距.必记结论 由频率分布直方图进行相关计算时,需掌握下列关系式: (1)频率组距×组距=频率. (2)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数. [自测练习]1.某校100名学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则图中a 的值为( )A .0.006B .0.005C .0.004 5D .0.002 5解析:由题意知,a =1-(0.02+0.03+0.04)×102×10=0.005.答案:B2.在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积的和的14,且样本容量为80,则中间一组的频数为( )A .0.25B .0.5C .20D .16解析:设中间一组的频数为x ,依题意有x 80=14⎝⎛⎭⎫1-x 80,解得x =16,应选D. 答案:D知识点二 茎叶图 茎叶图的优点茎叶图的优点是可以保留原始数据,而且可以随时记录,这对数据的记录和表示都能带来方便.易误提醒 在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义.[自测练习]3.(2015·惠州模拟)某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员的中位数分别为( )A .19、13B .13、19C .20、18D .18、20解析:由茎叶图可知,甲的中位数为19,乙的中位数为13.故选A. 答案:A知识点三 样本的数字特征 1.众数、中位数、平均数 数字特征定义与求法优点与缺点众数一组数据中重复出现次数最多的数众数通常用于描述变量的值出现次数最多的数.但显然它对其他数据信息的忽视使得无法客观地反映总体特征中位数把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数)中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数如果有n 个数据x 1,x 2,…,x n ,那么这n 个数的平均数x =x 1+x 2+…+x nn平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低2.标准差、方差(1)标准差:样本数据到平均数的一种平均距离,一般用s 表示,s = 1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]. (2)方差:标准差的平方s 2s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x i (i =1,2,3,…,n )是样本数据,n 是样本容量,x 是样本平均数.易误提醒 (1)众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.(2)平均数反映的是样本个体的平均水平,众数和中位数则反映样本中个体的“重心”.(3)实际问题中求得的平均数、众数和中位数应带上单位.必备方法 利用频率分布直方图求众数、中位数与平均数时易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标是众数. (2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.[自测练习]4.对于一组数据x i (i =1,2,3,…,n ),如果将它们改变为x i +C (i =1,2,3,…,n ),其中C ≠0,则下列结论正确的是( )A .平均数与方差均不变B .平均数变,方差保持不变C .平均数不变,方差变D .平均数与方差均发生变化解析:依题意,记原数据的平均数为x ,方差为s 2,则新数据的平均数为(x 1+C )+(x 2+C )+…+(x n +C )n =x +C ,即新数据的平均数改变;新数据的方差为1n {[(x 1+C )-(x +C )]2+[(x 2+C )-(x +C )]2+…+[(x n +C )-(x +C )]2}=s 2,即新数据的方差不变,故选B.答案:B5.(2015·高考陕西卷)中位数为1 010的一组数构成等差数列,其末项为2 015,则该数列的首项为________.解析:设等差数列的首项为a 1,根据等差数列的性质可得,a 1+2 015=2×1 010,解得a 1=5.答案:5考点一频率分布直方图及应用|1.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x的值等于()A.0.12B.0.012C.0.18 D.0.018解析:依题意,0.054×10+10x+0.01×10+0.006×10×3=1,解得x=0.018,故选D.答案:D2.某市为了节约能源,拟出台“阶梯电价”制度,即制订住户月用电量的临界值a.若某住户某月用电量不超过a度,则按平价计费;若某月用电量超过a度,则超出部分按议价计费,未超出部分按平价计费.为确定a的值,随机调查了该市100户的月用电量,工作人员已将90户的月用电量填在了下面的频率分布表中,最后10户的月用电量(单位:度)为:18,63,43,119,65,77,29,97,52,100.(2)根据已有信息,试估计全市住户的平均月用电量(同一组数据用该区间的中点值作代表);(3)若该市计划让全市75%的住户在“阶梯电价”出台前后缴纳的电费不变,试求临界值a.解:(1)(2)由题意,用每小组的中点值代表该小组的平均月用电量,则100户住户组成的样本的平均月用电量为10×0.04+30×0.12+50×0.24+70×0.30+90×0.25+110×0.05=65(度).用样本估计总体,可知全市居民的平均月用电量约为65度.(3)计算累计频率,可得下表:的总面积(频率)为0.75,故有0.7+(a-80)×0.012 5=0.75,解得a=84,由样本估计总体,可得临界值a为84.绘制频率分布直方图时需注意(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确;(2)频率分布直方图的纵坐标是频率组距,而不是频率.考点二 茎叶图|1.如图所示的茎叶图是甲、乙两位同学在期末考试中的六科成绩,已知甲同学的平均成绩为85,乙同学的六科成绩的众数为84,则x ,y 的值分别为( )A .2,4B .4,4C .5,6D .6,4解析:x 甲=75+82+84+(80+x )+90+936=85,解得x =6,由图可知y =4,故选D.答案:D2.(2016·长沙一模)右面的茎叶图是某班学生在一次数学测验时的成绩:根据茎叶图,得出该班男、女生数学成绩的四个统计结论,其中错误的一项是( )A .15名女生成绩的平均分为78B .17名男生成绩的平均分为77C.女生成绩和男生成绩的中位数分别为82,80D.男生中的高分段和低分段均比女生多,相比较男生两极分化比较严重解析:对于A,15名女生成绩的平均分为115×(90+93+80+80+82+82+83+83+85+70+71+73+75+66+57)=78,A正确;对于B,17名男生成绩的平均分为117×(93+93+96+80+82+83+86+86+88+71+74+75+62+62+68+53+57)=77,故B正确;对于D,观察茎叶图,对男生、女生成绩进行比较,可知男生两极分化比较严重,D正确;对于C,根据女生和男生成绩数据分析可得,两组数据的中位数均为80,C错误,故选C.答案:C使用茎叶图时,需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.考点三样本的数字特征|(2015·高考广东卷)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?[解] (1)依题意,20×(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)=1, 解得x =0.007 5.∴直方图中x 的值为0.007 5.(2)由图可知,最高矩形的数据组为[220,240), ∴众数为220+2402=230.∵[160,220)的频率之和为(0.002+0.009 5+0.011)×20=0.45,∴依题意,设中位数为y , ∴0.45+(y -220)×0.012 5=0.5. 解得y =224,∴中位数为224.(3)月平均用电量在[220,240)的用户在四组用户中所占比例为0.012 50.012 5+0.007 5+0.005+0.002 5=511,∴月平均用电量在[220,240)的用户中应抽取11×511=5(户).(1)平均数与方差都是重要的数字特征,是对总体的一种简明地描述,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)利用方差优化比较时方差越小,效果越好.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):.解析:x 甲=x 乙=9,s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s2甲,故甲更稳定.答案:甲11.概率与统计的综合问题的答题模板【典例】(12分)(2015·高考全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图B地区用户满意度评分的频数分布表分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图(2)根据用户满意度评分,将用户的满意度分为三个等级:[思路点拨](1)因为在频率分布直方图上,纵坐标表示的是频率与组距的比值,根据频数求出频率,进而求出频率与组距的比值,根据频率分布直方图可看出满意度评分的平均值的大小和分散程度,中间的矩形面积越高越集中,越不分散;(2)B地区可直接借助低于70分的频数10求出不满意的概率,A地区利用频率分布直方图中小矩形的面积即为频率,可求出不满意的概率,进而比较大小.[规范解答](1)如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(6分)(2)A地区用户的满意度等级为不满意的概率大.(7分)记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,(8分)P(C B)的估计值为(0.005+0.02)×10=0.25.(10分)所以A地区用户的满意度等级为不满意的概率大.(12分)[模板形成]分析图表、审核数据↓作出频率分布直方图↓由直方图数据分析相应问题↓利用直方图求概率,作出判断↓反思解题过程注意规范化A组考点能力演练1.(2016·邢台摸底)样本中共有五个个体,其值分别为0,1,2,3,m .若该样本的平均值为1,则其样本方差为( )A.105B.305C. 2 D .2解析:依题意得m =5×1-(0+1+2+3)=-1,样本方差s 2=15(12+02+12+22+22)=2,即所求的样本方差为2,选D.答案:D2.10名工人某天生产同一零件,生产的零件数分别是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( )A .a >b >cB .b >c >aC .c >a >bD .c >b >a解析:依题意,这些数据由小到大依次是10,12,14,14,15,15,16,17,17,17,因此a <15,b =15,c =17,c >b >a ,选D.答案:D3.(2015·高考全国卷Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关解析:根据柱形图易得选项A ,B ,C 正确,2006年以来我国二氧化硫年排放量与年份负相关,选项D 错误.故选D.答案:D4.(2015·高考山东卷)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) A .①③ B .①④ C .②③D .②④解析:由题中茎叶图,知x 甲=26+28+29+31+315=29,s 甲=15[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2] =3105; x 乙=28+29+30+31+325=30,s 乙=15[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2] = 2.所以x 甲<x 乙,s 甲>s 乙,故选B. 答案:B5.(2016·内江模拟)某公司10个销售店某月销售某产品数量(单位:台)的茎叶图如下:分组成[11,20),[20,30),[30,40]时,所作的频率分布直方图是( )解析:本题考查统计.利用排除法求解.由直方图的纵坐标是频率/组距,排除C 和D ;又第一组的频率是0.2,直方图中第一组的纵坐标是0.02,排除A ,故选B.答案:B6.(2015·郑州二检)已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中的m 、n 的比值mn =________.解析:由茎叶图可知甲的数据为27、30+m 、39,乙的数据为20+n 、32、34、38.由此可知乙的中位数是33,所以甲的中位数也是33,所以m =3.由此可以得出甲的平均数为33,所以乙的平均数也为33,所以有20+n +32+34+384=33,所以n =8,所以m n =38.答案:387.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:学生 1号 2号 3号 4号 5号 甲班 6 7 7 8 7 乙班67679解析:由数据表可得出乙班的数据波动性较大,则其方差较大,甲班的数据波动性较小,其方差较小,其平均值为7,方差s 2=15(1+0+0+1+0)=25.答案:258.(2015·高考湖北卷)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________. 解析:(1)0.1×1.5+0.1×2.5+0.1×a +0.1×2+0.1×0.8+0.1×0.2=1,解得a =3; (2)区间[0.5,0.9]内的频率为1-0.1×1.5-0.1×2.5=0.6,则该区间内购物者的人数为10 000×0.6=6 000.答案:(1)3 (2)6 0009.甲、乙两人参加数学竞赛培训.现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,画出茎叶图如图.(1)指出学生乙成绩的中位数;(2)现要从中选派一人参加数学竞赛,你认为应该派哪位学生参加? 解:(1)依题意知,学生乙成绩的中位数为83+852=84.(2)派甲参加比较合适,理由如下:x 甲=18(70×2+80×4+90×2+9+8+8+4+2+1+5+3)=85,x 乙=18(70×1+80×4+90×3+5+3+5+2+5)=85,s 2甲=35.5,s 2乙=41,∵x 甲=x 乙,且s 2甲<s 2乙,∴甲的成绩比较稳定.10.(2016·唐山统考)为了调查某校学生体质健康达标情况,现采用随机抽样的方法从该校抽取了m 名学生进行体育测试.根据体育测试得到了这m 名学生的各项平均成绩(满足100分),按照以下区间分为七组:[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],并得到频率分布直方图(如图).已知测试平均成绩在区间[30,60)内有20人.(1)求m 的值及中位数n ;(2)若该校学生测试平均成绩小于n ,则学校应适当增加体育活动时间.根据以上抽样调查数据,该校是否需要增加体育活动时间?解:(1)由频率分布直方图知第1组,第2组和第3组的频率分别是0.02,0.02和0.06, 则m ×(0.02+0.02+0.06)=20,解得m =200.由直方图可知,中位数n 位于[70,80)内,则0.02+0.02+0.06+0.22+0.04(n -70)=0.5,解得n =74.5.(2)设第i (i =1,2,3,4,5,6,7)组的频率和频数分别为p i 和x i ,由图知,p 1=0.02,p 2=0.02,p 3=0.06,p 4=0.22,p 5=0.40,p 6=0.18,p 7=0.10,则由x i =200×p i ,可得x 1=4,x 2=4,x 3=12,x 4=44,x 5=80,x 6=36,x 7=20, 故该校学生测试平均成绩是x=35x1+45x2+55x3+65x4+75x5+85x6+95x7200=74<74.5,所以学校应该适当增加体育活动时间.B组高考题型专练1.(2015·高考陕西卷)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93 B.123C.137 D.167解析:由扇形统计图可得,该校女教师人数为110×70%+150×(1-60%)=137.故选C.答案:C2.(2015·高考湖南卷)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.解析:由题意可知,这35名运动员的分组情况为,第一组(130,130,133,134,135),第二组(136,136,138,138,138),第三组(139,141,141,141,142),第四组(142,142,143,143,144),第五组(144,145,145,145,146),第六组(146,147,148,150,151),第七组(152,152,153,153,153),故成绩在区间[139,151]上的运动员恰有4组,故运动员人数为4.答案:43.(2015·高考江苏卷)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________. 解析:由平均数公式可得这组数据的平均数为4+6+5+8+7+66=6.答案:64.(2015·高考全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A 地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89B 地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:记事件用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解:(1)两地区用户满意度评分的茎叶图如下通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.(2)记C A1表示事件:“A地区用户的满意度等级为满意或非常满意”;C A2表示事件:“A地区用户的满意度等级为非常满意”;C B1表示事件:“B地区用户的满意度等级为不满意”;C B2表示事件:“B地区用户的满意度等级为满意”,则C A1与C B1独立,C A2与C B2独立,C B1与C B2互斥,C=C B1C A1∪C B2C A2. P(C)=P(C B1C A1∪C B2C A2)=P(C B1C A1)+P(C B2C A2)=P(C B1)P(C A1)+P(C B2)P(C A2).由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,故P(C A1)=1620,P(C A2)=420,P(C B1)=1020,P(C B2)=820,P(C)=1020×1620+820×420=0.48.。
高考(理)总复习资料:第9章 第2讲 用样本估计总体

• ①甲同学成绩的中位数大于乙同学成绩的中 位数;
• ②甲同学的平均分比乙同学高; • ③甲同学的平均分比乙同学低; • ④甲同学成绩的方差小于乙同学成绩的方
差. • 上解析面:说甲法的中正位确数的81,是乙_的__中_位__数_8_7..5,故①错, x 甲= 81•,答x 案乙=:85③,故④②错,③对,由茎叶图知甲成绩比较稳定,
D. x 甲> x 乙,m甲<m乙
• [审题视点] 仔细观察茎叶图.中位数为一列
数中最中间的那个,当数有偶数个时,中位
数[解为析]中甲间数两据个集中数于的前平半段均,数而.乙数es据集中于后半段,
所以
x
甲<
x
乙;m甲=
18+22 2
=20,m乙=
27+31 2
=29,所以m甲
<m乙,所以选B.
• [答案] B
• [答案] C
32
1.平均数和方差都是重要的数字特征,是对总体一种简 明的阐述.平均数、中位数、众数描述总体的集中趋势,方 差和标准差描述波动大小.
2. 平均数、方差公式的推广 若数据x1,x2,…,xn的平均数为 x ,方差为s2,则数据 mx1+a,mx2+a,…,mxn+a的平均数为m x +a,方差为 m2s2.
33
• [变式探究] [2013·西安质检]某校甲、乙两 个班级各有5名编号为1,2,3,4,5的学生进行投 篮练习,每人投10次,投中的次数如下表:
学生 1号 2号 3号 4号 5号
甲班 6
7
7
8
7
乙班 6
7
6
7
9
34
则以上两组数据的方差中较小的一个为s2,则s2=( )
高考数学一轮总复习课件:随机抽样、用样本估计总体

6.(2020·天津)从一批零件中抽取 80 个,测量其直径(单位: mm),将所得数据分为 9 组:[5.31,5.33),[5.33,5.35),…,[5.45, 5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽 取的零件中,直径落在区间[5.43,5.47)内的个数为( B )
n 的样本进行调查,其中从丙车间的产品中抽取了 3 件,则 n=
(D ) A.9
B.10
C.12
D.13
【解析】 由分层抽样可得630=2n60,解得 n=13.
【讲评】 进行分层抽样的相关计算时,常利用以下关系式 巧解:
①总样体本的容个量数nN=该层该抽层取的的个个体体数数; ②总体中某两层的个体数之比等于样本中这两层抽取的个 体数之比.
5.对某商店一个月内每天的顾客人数进行了统计,得到样本 的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( A )
A.46,45,56 B.46,45,53 C.47,45,56 D.45,47,53
解析 从茎叶图中可以看出样本数据的中位数为中间两个数的 平均数,即45+2 47=46,众数是 45,极差为 68-12=56,故选择 A.
状元笔记
(1)一个抽样试验能否用抽签法,关键看两点:一是制签是否 方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都 较小时可用抽签法.
(2)在使用随机数表时,如遇到取两位数或三位数,可从选择 的随机数表中的某行某列的数字计起,每两个或每三个作为一个 单位,自左向右选取,有超过总体号码或出现重复号码的数字舍 去.
个最高分、1 个最低分,得到 7 个有效评分.7 个有效评分与 9 个
原始评分相比,不变的数字特征是( A )
人教版高中数学必修3A版用样本的频率分布估计总体分布课件

复习:一、画频率分布直方图的步骤:
1、求极差(即一组数据中最大值与最小值的差) 它 反映一组数据的变化范围。 2、决定组距与组数(将数据分组) ①组距与组数的确定没有固定的标准,需要尝试与选择。 ②组数与样本容量有关,一般样本容量越大,所分组数越 极差 多。当样本容量在100个以内时,常分5-12组。 组数= 组距 注意区间的开闭(先闭后开) 3、 将数据分组: 4、列出频率分布表.(频数:落在各小组内的数据的个 数,频率:每小组的频数与数据总数的比值) 第几组频数 第几组频率 样本容量 5、画出频率分布直方图。
我们可以画出茎叶图,也就是中间的数表示十位数, 旁边的数表示两个人得分的个位数,就象一棵树的茎 与叶子一样,能更直观地看出这两个人的得分情况。
1、某赛季甲、乙两名篮球运动员每场比赛得分的原始记录 如下: (1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39 (2)乙运动员得分: 49,24,12,31,50,31,44,36,15,37,25,36,39
茎叶图
甲
8 4ห้องสมุดไป่ตู้6 3 3 6 8 0 1 2 5 5 4
乙
2
3
3 8 9
1 6 1 6 7 9
4 9
4 1
5
0
1、某赛季甲、乙两名篮球运动员每场比赛得分的原始记录 如下: (1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39 (2)乙运动员得分: 49,24,12,31,50,31,44,36,15,37,25,36,39 甲 12, 15, 24, 25, 31, 31, 36, 36, 37, 39, 44, 49, 50.
用样本估计总体课件-2025届高三数学一轮复习

统计与成对数据的统计分析之
用样本估计总体
1.总体百分位数的估计
(1)百分位数
一般地,一组数据的第百分位数是这样一个值,它使得这组数据中至少
有%的数据小于或等于这个值,且至少有 − %的数据大于或等于
这个值.
(2)百分位数的意义
反映该组数中小于或等于该百分位数的分布特点.
胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为
, = , , ⋯ , .试验结果如下:
试验序号
1
2
3
4
5
6
7
8
9
10
伸缩率
545
533
551
522
575
544
541
568
596
548
伸缩率
536
527
543
530
560
533
522
550
576
536
记 = − = , , ⋯ , ,记 , ,⋯ , 的样本平均数为,样本
考点二 总体集中趋势的估计
例2 (多选)(2024·山东济南模拟)某学校发起了“畅读经典,欢度新年”活
动,根据统计数据可知,该校共有1 200名学生,所有学生每天读书时间
均在 到 之间,他们的日阅读时间的频率分布直方图如图
所示.则下列结论正确的是(
)
A.该校学生日阅读时间的众数约为70
⋅ [ +
+
+
+
,样本的方差为
+
− ].
1.频率分布直方图中的常见结论
(1)众数的估计值为最高矩形底边的中点对应的横坐标;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2)由所给茎叶图知,50 位市民对甲、乙部门的评分高于 90 的比率 分别为550=0.1,580=0.16,故该市的市民对甲、乙部门的评分高于 90 的概率的估计值分别为 0.1,0.16. (3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的 评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准 差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价 较高、评价较为一致,对乙部门的评价较低、评价差异较大.
5.(2017·南通调研)为了研究某药品的疗效,选取若干名志愿者进行 临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为 [12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的 顺序分别编号为第一组,第二组,……,第五组.下图是根据试 验数据制成的频率分布直方图.已知第一组与第二组共有 20 人, 第三组中没有疗效的有 6 人,则第三组中有疗效的人数为 ________.
4.样本的数字特征
数字特征
定义
众数
在一组数据中,出现次数 最多 的数据叫做这组 数据的众数
中位数
将一组数据按大小依次排列,把处在 最中间位 置的一个数据(或最中间两个数据的平均数)叫做 这组数据的中位数 在频率分布直方图中,中位数左边和右边的直 方图的面积 相等 .
平均数
样本数据的算术平均数,即 x =
规律方法 (1)茎叶图的优点是保留了原始数据,便于记录及表示, 能反映数据在各段上的分布情况. (2)①作样本的茎叶图时先要根据数据特点确定茎、叶,再作茎叶图; 作“叶”时,要做到不重不漏,一般由内向外,从小到大排列,便 于数据的处理. ②根据茎叶图中数据数字特征进行分是抓住“叶”的分布特征,准 确提炼信息.
10-3用样本估计总体2019高三一轮复习课 件
考试要求 1.分布的意义和作用,样本估计总体的思想,A 级要求;2.频率分布表、频率分布直方图、频率分布折线图、 茎叶图及各自特点, B级要求;3.样本数据的数字特征(如平 均数、标准差)的意义和作用,它们的计算并作出合理的解释, B级要求;4.用样本的频率分布估计总体分布,用样本的基 本数字特征估计总体的基本数字特征,B级要求.
3.(2017·常州期末)在样本的频率分布直方图中,共有 7 个小长方形, 若中间一个小长方形的面积等于其他 6 个小长方形的面积的和的 14,且样本容量为 80,则中间一组的频数为________. 解析 设中间一组的频数为 x, 依题意有8x0=141-8x0,解得 x=16. 答案 16
4.(2016·江苏卷)已知一组数据 4.7,4.8,5.1,5.4,5.5,则该组数据的方 差是________. 解析 易求 x =15(4.7+4.8+5.1+5.4+5.5)=5.1, ∴方差 s2=15[(-0.4)2+(-0.3)2+02+0.32+0.42]=0.1. 答案 0.1
(3)频率分布直方图中,小矩形的面积越大,表示样本数
据落在该区间的频率越高.
()
(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶
按从小到大的顺序写,相同的数据可以只记一次.( )
解析 (2)错误.方差越大,这种数据越离散.
(4)错误.相同的数据叶要重复记录,故(4)错误.
答案 (1)√ (2)× (3)√ (4)×
(1)分别估计该市的市民对甲、乙两部门评分的中位数; (2)分别估计该市的市民对甲、乙两部门的评分高于 90 的概率; (3)根据茎叶图分析该市的市民对甲、乙两部门的评价. 解 (1)由所给茎叶图知,50 位市民对甲部门的评分由小到大排序, 排在第 25,26 位的是 75,75,故样本中位数为 75,所以该市的市民对 甲部门评分的中位数的估计值是 75. 50 位市民对乙部门的评分由小到大排序,排在第 25,26 位的是 66,68, 故样本中位数为66+2 68=67,所以该市的市民对乙部门评分的中位 数的估计值是 67.
【训练 1】 以下茎叶图记录了甲、乙两组各五名学生在一次英语听 力测试中的成绩(单位:分)
已知甲组数据的中位数为 15,乙组数据的平均数为 16.8,则 x +y 的值为________.
2.(必修 3P67 练习 3 改编)若某校高一年级 8 个班参加合唱比赛的 得分茎叶图如图所示,则这组数据的中位数和平均数分别是 ________.
解析 这组数据由小到大排列为 87,89,90,91,92,93,94,96, ∴中位数是91+2 92=91.5, 平均数 x =87+89+90+91+8 92+93+94+96=91.5. 答案 91.5 和 91.5
解析 全体志愿者共有:0.24+200.16×1=50(人), 所以第三组有志愿者:0.36×1×50=18(人), ∵第三组中没有疗效的有 6 人, ∴有疗效的有 18-6=12(人). 答案 12
考点一 茎叶图及其应用 【例1】 (2014·全国Ⅱ卷)某市为了考核甲、乙两部门的工作情
况,随机访问了50位市民.根据这50位市民对这两部门的 评分(评分越高表明市民的评价越高),绘制茎叶图如下:
知识梳理 1.频率分布表
求一组数据的频率分布,可按以下三步进行; (1)数出落在各小组内的数据的个数,即 频数 ; (2)每个小组的频数与样本容量的比值叫作这一小组 的 频率 ; (3)列出频率分布表.
2.频率分布直方图:反映样本频率分布的直方图(如图)
频率 横轴表示样本数据,纵轴表示 组距 ,每个小矩形的面积表示样 本落在该组内的 频率 . 3.茎叶图 统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的 一列数,叶是从茎的旁边生长出来的数.
x1+x2+…+xn n
方差
s2= 1n[(x1- x )2+(x2- x )2+…+(xn- x )2] ,其中 s 为标准差
诊断自测
1.判断正误(在括号内打“√”或“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据
的集中趋势.
()
(2)一组数据的方差越大,说明这组数据越集中. ( )