人教B版(2019)数学必修(第二册):5.1.4 用样本估计总体 学案
人教版(B版2019课标)高中数学必修二5.1.4用样本估计总体 学案

用样本估计总体【学习目标】1.理解样本数据标准差的意义和作用,会计算数据标准差,对样本数据中提取基本的数字作合理的解释。
2.会用样本的基本数字特征估计总体的基本数字特征。
3.培养统计意识,形成尊重事实、用数据说话的态度,认识数据处理的实际意义。
【学习重难点】根据有关问题查找资料或调查,用随机抽样的方法选取样本,能用样本的平均数和方差对总体、个体有合理的估计和推测。
【学习过程】一、问题提出1.对一个未知总体,我们常用样本的频率分布估计总体的分布,其中表示样本数据的频率分布的基本方法有哪些?频率分布直方图、频率分布表、频率分布折线图、茎叶图2.美国NBA在2006-2007年度赛季中,甲、乙两名篮球运动员在随机抽取的12场比赛中的得分情况如下:甲运动员得分:12,15,20,25,31,30,36,36,37,39,44,49。
乙运动员得分:8,13,14,16,23,26,28,38,39,51,31,39。
如果要求我们根据上面的数据,估计、比较甲,乙两名运动员哪一位发挥得比较稳定,就得有相应的数据作为比较依据,即通过样本数据对总体的数字特征进行研究,用样本的数字特征估计总体的数字特征。
二、能力探究用样本的平均数来估测总体的平均数“珍惜能源,从我做起,节约用电,人人有责”。
为了解某小区居民节约用电情况,物业公司随机抽取了今年某一天本小区10户居民的日用电量,数据如下:(1)求这组数据的平均数;(2)已知去年同一天这10户居民的平均日用电量为7.8度,请你估计,这天与去年同日相比,该小区200户居民这一天节约了多少度电?分析:(1)用算术平均数公式可计算出平均数;(2)由10户居民的平均日用电量估计该小区200户居民的平均日用电量,所以该小区节约的用电量等于用电户数与两年同一天的日平均用电量之差的积。
解:(1)这组数据的平均数为:x=4.4+4.0+5.0+5.6+3.4+4.8+3.4+5.2+4.0+4.210=44 10=4.4(度)(2)200×(7.8-4.4)=680(度),即该小区200户居民这一天大约节约了680度电。
高中教育数学必修第二册人教B版《5.1.4 用样本估计总体》教学课件

B
【解析】 观察频率分布直方图可知众数为
中位数为x,
则0.06×5+(x-10)×0.1=0.5,
解得x=12
10+15
=12.5,设
2
状元随笔 众数是最高的矩形的
底边的中点,中位数左边和右边的直
方图的面积相等,都是0.5.
(2)2021年起,我省实行“3+1+2”高考模式,某中学为了解本校学生的
例3 已知一组数据:
125 121 123 125 127 129 125 128 130 129
126 124 125 127 126 122 124 125 126 128
(1)填写下面的频率分布表:
分组
[120.5,122.5)
[122.5,124.5)
[124.5,126.5)
[126.5,128.5)
例1 (1)某工厂有甲、乙两条流水线同时生产直径为50 mm的零件,各抽取10个进行测量,其结果如图所
示,则以下结论不正确的是(
)
【答案】 D
A.甲流水线生产的零件直径的极差为0.4 mm
B.乙流水线生产的零件直径的中位数为50.0 mm
C.乙流水线生产的零件直径比甲流水线生产的零件直径稳定
D.甲流水线生产的零件直径的平均值小于乙流水线生产的零件直径的平均值
=0.21.
7
【解析】从表中一周的利润可得一天的平均利润为തx=
又五月份共有31天,
所以五月份的总利润约是0.21×31=6.51(万元).
18日
0.25
(3)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,
将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下
新教材人教B版必修第二册 5.1.4 用样本估计总体 学案

5.1.4 用样本估计总体5.2 数学探究活动:由编号样本估计总数及其模拟(略)素养目标·定方向课程标准学法解读1.能用样本的数字特征估计总体的数字特征. 2.能用样本的分布估计总体的分布.通过用样本估计总体,提升学生的数据分析、数学运算和逻辑推理素养.必备知识·探新知知识点用样本估计总体(1)前提样本的容量恰当,抽样方法合理. (2)必要性①在容许一定误差存在的前提下,可以用样本估计总体,这样能节省人力和物力. ②有时候总体的数字特征不可能获得,只能用__样本__估计总体. (3)误差估计一般是有__误差__的.但是,大数定律可以保证,当样本的容量__越来越大__时,估计的误差很小的可能性将越来越大.思考:用样本估计总体出现误差的原因有哪些?提示:样本抽取的随机性;样本抽取的方法不合适,导致代表性差;样本容量偏少等. 知识点用样本的数字特征来估计总体的数字特征(1)一般来说,在估计总体的数字特征时,只需直接算出样本对应的__数字特征__即可. (2)样本是用分层抽样得到的,由每一层的数字特征估计总体的数字特征.以分两层抽样的情况为例.条件假设第一层有m 个数,分别为x 1,x 2,…,x m ,平均数为x -,方差为s 2;第二层有n 个数,分别为y 1,y 2,…,y n ,平均数为y -,方差为t 2 结论如果记样本的平均值为a ,样本方差为b ,则a -=m x -+n y-m +n,b 2=1m +n ×⎣⎡⎦⎤(ms 2+nt 2)+mn m +n (x --y -)2知识点用样本的分布来估计总体的分布如果总体在每一个分组的频率记为π1,π2,…,πn ,样本在第一组对应的频率记为p 1,p 2,…,p n ,一般来说,1n ∑i =1n(πi -p i )2不等于零.当样本的容量__越来越大__时,上式很小的可能性将越来越大.关键能力·攻重难题型探究题型用样本的特征数估计总体的特征数角度1 简单随机抽样的数字特征 ┃┃典例剖析__■典例1 甲、乙两机床同时加工直径为100 cm 的零件,为检验质量,各从中抽取6件测量,数据为甲:99 100 98 100 100 103 乙:99 100 102 99 100 100 (1)分别计算两组数据的平均数及方差;(2)根据计算结果判断哪台机床加工零件的质量更稳定. [解析] (1)x -甲=16(99+100+98+100+100+103)=100,x -乙=16(99+100+102+99+100+100)=100.s 2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73, s 2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)两台机床所加工零件的直径的平均值相同,又s 2甲>s 2乙,所以乙机床加工零件的质量更稳定. 规律方法:(1)利用样本的原始数据求得的样本数字特征是准确值,可用以估计总体. (2)此类问题需计算样本的平均值和方差来估计总体. ┃┃对点训练__■1.为了快速了解某学校学生体重(单位:kg)的大致情况,随机抽取了10名学生称重,得到的数据整理成茎叶图如图所示.估计这个学校学生体重的平均数和方差.4 5 9 7 9 6 6 5 1 8 9 6[解析] 将样本中的每一个数都减去50,可得 -5,-1,-3,-1,-4,-4,1,8,9,10,这组数的平均数为-5-1-3-1-4-4+1+8+9+1010=1,方差为62+22+42+22+52+52+02+72+82+9210=30.4,因此可估计这个学校学生体重的平均数为51,方差为30.4. 角度2 分层抽样的数字特征 ┃┃典例剖析__■典例2 在对树人中学高一年级学生身高(单位:cm)的调查中,采用分层抽样的方法,抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62,你能由这些数据计算出样本的方差,并对高一年级全体学生身高的方差作出估计吗?[解析] 把样本中男生的身高记为x 1,x 2,…,x 23,其平均数记为x -,方差记为s 2x ;把样本中女生的身高记为y 1,y 2,…,y 27,其平均数记为y -,方差记为s 2y ,把样本的平均数记为a -,方差记为s 2.则a -=23×170.6+27×160.623+27=165.2,s 2=23×[s 2x +(x --a -)2]+27×[s 2y+(y --a -)2]23+27=23×[12.59+(170.6-165.2)2]+27×[38.62+(160.6-165.2)2]50=51.486 2,即样本的方差为51.486 2.因此估计高一年级全体学生身高的方差为51.486 2.规律方法:1.求分层随机抽样的平均数的步骤 (1)求样本中不同层的平均数;(2)应用分层随机抽样的平均数公式进行求解. 2.求分层随机抽样的方差的步骤 (1)求样本中不同层的平均数; (2)求样本中不同层的方差;(3)应用分层随机抽样的方差公式进行求解. ┃┃对点训练__■2.为了解某公司员工的身体情况,利用分层抽样的方法抽取了9名男员工的身高和体重数据,计算得到他们的体质指数的平均数为25.1,方差为6,抽取了5名女员工的身高和体重数据,计算得到她们的体质指数的平均数为20.3,方差为3.求样本平均数与方差.[解析] 样本平均数x -=9×25.1+5×20.39+5≈23.4,方差s 2=9×[6+(25.1-23.4)2]+5×[3+(20.3-23.4)2]9+5≈10.2. 题型用样本的分布估计总体的分布┃┃典例剖析__■典例3 我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x (吨),一位居民的月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (3)若该市政府希望使85%的居民每月的用水量不超过标准x (吨),估计x 的值,并说明理由.[解析] (1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a +0.20+0.26+0.5×a +0.06+0.04+0.02=1,解得a =0.30. (2)由(1)可知,100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12. 由以上样本的频率,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85, 而前5组的频率之和为:0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x <3, 由0.3×(x -2.5)=0.85-0.73, 所以x =2.9,所以估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.规律方法:(1)由于频率分布表、频率分布直方图丢失了样本的原始数据,以此求得数字特征都是样本数字特征的估计值.(2)可用样本的分布估计总体的分布. ┃┃对点训练__■3.某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层随机抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如图所示的频率分布直方图:(1)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (2)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.[解析] (1)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5. 所以总体中分数在区间[40,50)内的人数估计为400×5100=20.(2)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60, 所以样本中分数不小于70的男生人数为60×12=30.所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层随机抽样原理,总体中男生和女生人数的比例估计为3∶2.易错警示┃┃典例剖析__■典例4 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:成绩/m 1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90 人数23234111[错解] 根据以上数据可得众数为1.75,中位数为1.70+1.752=1.725,平均数为1.69.[辨析] 所求数据要注意单位问题,另外中位数计算错误.[正解] 在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75 m .表中的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是 1.70 m ;这组数据的平均数是x -=117(1.50×2+1.60×3+…+1.90×1)=28.7517≈1.69(m).故17名运动员成绩的众数、中位数、平均数依次为1.75 m,1.70 m,1.69 m .。
高中数学第五章统计与概率51统计514用样本估计总体教学课件新人教B版必修第二册

2021/4/17
高中数学第五章统计与概率51统计514用样本估计总体教学 课件新人教B版必修第二册
14
解
因为
x甲
=
8+11+14+15+22 5
=14,
x乙
=
6+7+10+23+24 5
=14.
x甲 x乙.
s
2 甲
=
62 +32 +02 +12 +82 5
=22,
s
2 乙
=
82 +72 +42 +92 +102 5
(2)已知抽取的样本中,男生20人,女生15人,怎样估计总体平均数与 方差?
2021/4/17
高中数学第五章统计与概率51统计514用样本估计总体教学 课件新人教B版必修第二册
8
问题3.如何分析频率分布直方图,用样本的分布估计总体的分布 通过整理某中学1257名高一学生期中考试数学成绩,得到如下数据,并 作出了频率分布直方图和折线图.
2021/4/17
高中数学第五章统计与概率51统计514用样本估计总体教学 课件新人教B版必修第二册
16
2021/4/17
高中数学第五章统计与概率51统计514用样本估计总体教学 课件新人教B版必修第二册
17
解 (1)由(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)x20=1,得x=0.0075. (2)众数为[220,240)区间的中点230. 因为(0.002+0.0095+0.011)x20=0.45<0.5,所以中位数在[220,240)
5.1.4 高中必修二数学教案《用样本估计总体》

高中必修二数学教案《用样本估计总体》教材分析义务教育阶段,学生学习了统计内容,对数据统计全过程有所体验。
高中阶段要求进一步培养学生的随机思想,发展学生的统计观念。
其中包括:统计意识、统计方法及对统计结果的正确认识。
本节课《用样本估计总体》是抽样方法及数据的数字特征内容后的又一重要内容,通过本节课的学习,学生进一步掌握了对样本数据处理的重要方法之一——画频率分布直方图,以及用样本估计总体的思想,同时为学生在后续学习统计案例和应用统计知识解决实际问题打下良好的基础。
学情分析学生在初中就知道了分布的初步概念,在前面也刚学习过概率及抽样的相关知识,对用样本估计总体有一定的认识,对用表和图来反映知识有很强的意识,具有一定的作图能力和较为周全的分析问题能力,而学生的理解能力不足,发现问题能力上可能很难满足本节课的要求。
但学生对新知识兴趣高,肯下功夫,思维活跃,会为本节课的顺利推进提供一定的保障。
教学目标1、通过实例理解样本数据标准差的意义和作用,学会计算数据标准差。
2、进一步体会用样本估计总体的思想,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性。
教学重点用样本的数字特征估计总体的数字特征、通过频率分布或频率分布直方图对数据作出总体估计。
教学难点通过频率分布或频率分布直方图,对数据作出总体估计。
教学方法讲授法、讨论法、练习法教学过程一、情境导学以下是某学校高一年级98位学生的身高(单位:cm);已知这组数的总体平均数为163.5,总体方差为56.3。
用简单随机抽样的方法,从总体中抽取容量为10的样本3次,分别计算样本平均数与样本方差,并与总体对应的值进行比较。
二、学习新知1、用样本的数字特征估计总体的数字特征一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征。
特别地,样本平均值(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大。
课件1:5.1.4 用样本估计总体

课程标准
学科素养
理解并会运用样本的数字特征估 通过对用样本估计总体的学习,强
计总体的数字特征,用样本的分布 化数据分析、数学运算、数学建模
估计总体的分布,通过实例体会其 的核心素养.
意义和作用.
【自主预习】
知识点1 用样本的数字特征估计总体的数字特征
一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本 的特征能够反映总体的特征.特别地,样本平均数(也称为样本均 值)、方差(也称为样本方差)与总体对应的值相差不会____太__大____.
[方法总结] 1.众数、中位数、平均数与频率分布表、频率分布直方图的关系 (1)众数:众数一般用频率分布表中频率最高的一小组的组中值来表示, 即在样本数据的频率分布直方图中,最高矩形的底边中点的横坐标.
(2)中位数:在频率分布表中,中位数是累计频率(样本数据小于某一数 值的频率叫作该数值点的累计频率)为0.5时所对应的样本数据的值,而 在样本中有50%的个体小于或等于中位数,也有50%的个体大于或等于 中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的 面积应该相等.
探究三 在频率分布直方图中求平均数、中位数、众数
【例3】某校从参加高二年级学业水平测试的学生中抽出80名学生, 其数学成绩(均为整数)的频率分布直方图如图所示. (1)求这次测试数学成绩的众数; (2)求这次测试数学成绩的中位数; (3)求这次测试数学成绩的平均分.
解 (1)由图知众数为70+2 80=75.
【课堂小结】
1. 样本平均数与总体平均数的关系:①在简单随机抽样中,我们常 用样本平均数-y 去估计总体平均数-Y . ②一般地,大部分样本平均数离总体平均数不远,在总体平均数附近 波动.样本量越大,波动幅度越小. 2.众数、中位数分别是频率分布直方图中最高的小矩形的中间值、 累计频率为 0.5 时所对应的样本数据的值,平均数为每个小矩形底边 中点的横坐标与小矩形的面积的乘积之和.
新教材高中数学第五章统计与概率1.4用样本估计总体课件新人教B版必修第二册课件

(☆)为了了解学生的身体发育情况,某校订年满16周岁的60名男生的身高进
行测量,其结果如下:
身高/m 1.57
1.59
Hale Waihona Puke 1.601.621.63
1.64
1.65
1.66
1.68
人数 2
1
3
2
3
4
2
7
6
身高/m 1.69
1.70
1.71
1.72
1.73
1.74
1.75
1.76
1.77
人数 8
7
4
3
2
1
1.如果样本容量恰当,抽样方法又合理,在允许有一定误差的前提下,可以用样本 的散布去估计总体的散布. 频率散布是指一个样本数据在各个小范围内所占比例的大小.一般利用频率散布 表和频率散布直方图来直观体现. 2.如何用样本散布估计总体散布 一般是利用样本在某一范围内的频率近似地估计总体在该范围内的频率.所以, 第一样本抽取要合理科学,其次要正确绘制频率散布表(或直方图),或者要准确找 出题目所给频率散布表(或直方图)中的相关信息,最后由样本散布估计出总体分 布情况.
1.平均数、中位数、众数与频率散布直方图的关系: (1)众数在样本数据的频率散布直方图中,就是最高的小长方形中某个(些)点的横 坐标. (2)由于在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中 位数,因此在频率散布直方图中,中位数左侧和右侧的小长方形的面积和应该相 等,据此可以估计中位数的值. (3)平均数是频率散布直方图的“重心”,是直方图的平衡点.用频率散布直方图 估计平均数时,平均数的估计值等于频率散布直方图中每个小长方形的面积与小 长方形底边中点的横坐标(组中值)之积的和. 2.利用直方图求得的众数、中位数和平均数均为近似值,往往与由实际数据得出 的不一致,但它们能粗略估计众数、中位数和平均数.
5.2 数学探究活动:由编号样本估计总数及其模拟高一数学精品教学课件(人教B版2019必修第二册)

日常生活中,人们经常对人或者 物进行连续编号(即编号为 001,002,003……)
为什么要连续编号?
连续编号的优点:
知道编号的最大值就能方便的知道总数是多少
问题:1 能否举出日常生活中
连续编号的例子 ?
高考学生准考证号,火车座位号等
在很多情况下得到最大的编号并不容易,能不能 根据编号样本的信息,利用有关统计的知识, 估计出人或物的总数呢?
计学家估计值是多少?进一步猜测谁的更准确.)
时间 1940年6月 1941年6月 1942年8月
统计估计/辆 情报估计/辆
169
1000
244
1550
327
1550
实际/辆
下面看实际真实结果是什么样的?
时间 统计估计/辆 情报估计/辆
1940年6月
169
1000
1941年6月
244
1550
1942年8月
第二次世界大战期间,德军生产的坦克是连续编号的,盟军从战场上缴获了一些 德军坦克,因此获得了一些坦克编号,盟军希望能根据这些样本数据估计出德军 所生产的坦克数量.后来统计学家们圆满地解决了这一问题,而且,如下表所示, 当时统计学家们的估计比情报部门的估计误差小很多!
1. 任 务 : 已 知 总 体 是 连 续 编 号 的 , 假 设 已 有 的 编 号 样 本 从 小 到 大 依 次 为 x1 , x2,…,xm,由这些样本去估计总数n.
2 类似问题在实际生活中有 时是具有战略意义的
第二次世界大战期间,德军生产的坦克是连续编号的,盟军 从战场上缴获了一些德军坦克,并获得了一些坦克编号,盟军 希望能根据这些样本数据估计出德军所生产的坦克数量.
对于坦克总数问题,当初统计学家和 情报学家都做了相应的调查和分析,统计 如下,你认为哪个更准确呢? (让学生猜测统
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用样本估计总体【学习目标】1.理解用样本的数字特征估计总体的数字特征的方法,会分析实际问题。
2.能够利用频率分布直方图、茎叶图等解决统计问题。
【学习重难点】1.用样本的数字特征估计总体的数字特征。
2.用样本分布估计总体分布。
【学习过程】问题导学预习教材P77-P83的内容,思考以下问题: 1.如何用样本平均数估计总体平均数?2.样本方差、标准差公式是什么?它们的区别与联系是什么?3.在电视大奖赛中,计算评委打分的平均值时,为什么要去掉一个最高分和一个最低分?4.如何用频率分布直方图估计平均数、中位数、众数?5.同样一组数据,如果组距不同,得到的频率分布直方图也会不同吗? 【新知初探】1.简单随机抽样的数字特征一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征。
特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大。
一般来说,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可。
2.分层抽样的数字特征我们以分两层抽样的情况为例。
假设第一层有m 个数,分别为x 1,x 2,…,x m ,平均数为x -,方差为s 2;第二层有n 个数,分别为y 1,y 2,…,y n ,平均数为y -,方差为t 2.则x -=1m ∑i =1m x i ,s 2=1m ∑i =1m (x i -x -)2,y -=1n ∑i =1n y i ,t 2=1n ∑i =1n (y i -y -)2.如果记样本均值为a -,样本方差为b 2,则可以算出111m ni i i i mx ny a x y m n m n ==+⎛⎫=+= ⎪++⎝⎭∑∑ , ()22222222()()1()m s x a n t y a mn b ms nt x y m nm n m n ⎡⎤⎡⎤+-++-⎡⎤⎣⎦⎣⎦==++-⎢⎥+++⎣⎦【自我检测】1.判断正误(正确的打“√”,错误的打“×”) (1)样本的平均数描述了样本数据的平均水平。
( ) (2)方差越大、数据越集中在平均数左右。
( ) (3)中位数是样本数据中最中间位置的数据。
( ) 2.下列说法不正确的是( )A .频率分布直方图中每个小矩形的高就是该组的频率B .频率分布直方图中各个小矩形的面积之和等于1C .频率分布直方图中各个小矩形的宽一样大D .频率分布折线图是依次连接频率分布直方图的每个小矩形上边的中点得到的3.如图是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知( )A .甲运动员的成绩好于乙运动员B .乙运动员的成绩好于甲运动员C .甲、乙两名运动员的成绩没有明显的差异D .甲运动员的最低得分为0分4.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm ),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100cm 。
探究一、用样本的数字特征估计总体的数字特征1.甲、乙两机床同时加工直径为100cm 的零件,为检验质量,从中抽取6件测量数据为:甲:99 100 98 100 100 103乙:99 100 102 99 100 100 (1)分别计算两组数据的平均数及方差;(2)根据计算说明哪台机床加工零件的质量更稳定。
[规律方法](1)在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散程度(即方差或标准差),方差大说明取值分散性大,方差小说明取值分散性小或者取值集中、稳定。
(2)关于统计的有关性质及规律:①若x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数是m x -+a ;②数据x 1,x 2,…,x n 与数据x 1+a ,x 2+a ,…,x n +a 的方差相等; ③若x 1,x 2,…,x n 的方差为s 2,那么ax 1,ax 2,…,ax n 的方差为a 2s 2. [跟踪训练]1.某校高二年级在一次数学选拔赛中,由于甲、乙两人的竞赛成绩相同,从而决定根据平时在相同条件下进行的六次测试确定出最佳人选,这六次测试的求两人比赛成绩的平均数以及方差,并且分析成绩的稳定性,从中选出一位参加数学竞赛。
2.在对树人中学高一年级学生身高(单位:cm)的调查中,采用分层抽样的方法,抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62,你能由这些数据计算出样本的方差,并对高一年级全体学生身高的方差作出估计吗?探究二、频率分布直方图与数字特征的综合应用2.已知一组数据:125121123125127129125128130129126124125127126122124125126128(2)作出频率分布直方图;(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数。
(1)利用频率分布直方图求数字特征:①众数是最高的矩形的底边的中点;②中位数左右两侧直方图的面积相等;③平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和。
(2)利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数。
3.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:(1)高一参赛学生的成绩的众数、中位数;(2)高一参赛学生的平均成绩。
【达标反馈】1.甲乙两名学生六次数学测验成绩(百分制)如图所示。
①甲同学成绩的中位数大于乙同学成绩的中位数;②甲同学的平均分比乙同学高;③甲同学的平均分比乙同学低;④甲同学成绩的方差小于乙同学成绩的方差。
上面说法正确的是()B.①②④C.②④D.①③2.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为()A.20B.30C.40D.503.如图茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,若乙的平均分是89,则污损的数字是________。
4.甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图所示:平均数方差中位数命中9环及以上甲71.21乙5.43(2)请从四个不同的角度对这次测试进行分析:①从平均数和方差结合分析偏离程度;②从平均数和中位数结合分析谁的成绩好些;③从平均数和命中9环以上的次数相结合看谁的成绩好些;④从折线图上两人射击命中环数及走势分析谁更有潜力。
【参考答案】【自我检测】 1.答案:(1)√ (2)× (3)×2.解析:选A .频率分布直方图中每个小矩形的高=频率组距。
3.解析:选A .由茎叶图可以看出甲的成绩都集中在30~50分,且高分较多。
而乙的成绩只有一个高分52分,其他成绩比较低,故甲运动员的成绩好于乙运动员的成绩。
4.解析:60×(0.015+0.025)×10=24. 答案:24探究一、用样本的数字特征估计总体的数字特征1.【解】(1)甲=16(99+100+98+100+100+103)=100,乙=16(99+100+102+99+100+100)=100, s 2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73,s 2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)由(1)知甲=乙,比较它们的方差,因为s 2甲>s 2乙,故乙机床加工零件的质量更稳定。
[跟踪训练]1.解:设甲、乙两人成绩的平均数分别为甲,乙,则甲=130+16(-3+8+0+7+5+1)=133,乙=130+16(3-1+8+4-2+6)=133, s 2甲=16[(-6)2+52+(-3)2+42+22+(-2)2]=473, s 2乙=16[02+(-4)2+52+12+(-5)2+32]=383。
因此,甲与乙的平均数相同,由于乙的方差较小,所以乙的成绩比甲的成绩稳定,应该选乙参加竞赛比较合适。
2.解:把样本中男生的身高记为x1,x2,…,x23,其平均数记为,方差记为s2x;把样本中女生的身高记为y1,y2,…,y27,其平均数记为,方差记为s2y,把样本的平均数记为,方差记为s2.则=23×170.6+27×160.623+27=165.2,s2==23×[12.59+(170.6-165.2)2]+27×[38.62+(160.6-165.2)2]50=51.4862.即样本的方差为51.4862.因此估计高一年级全体学生身高的方差为51.4862.探究二、频率分布直方图与数字特征的综合应用频数累计(2)(3)在[124.5,126.5)中的数据最多,取这个区间的中点值作为众数的近似值,得众数为125.5,事实上,众数的精确值为125.图中虚线对应的数据是124.5+2×58=125.75,事实上,中位数为125.5.使用“组中值”求平均数:=121.5×0.1+123.5×0.15+125.5×0.4+127.5×0.2+129.5×0.15=125.8,事实上,平均数的精确值为=125.75.3.解:(1)由题图可知众数为65,又因为第一个小矩形的面积为0.3,所以设中位数为60+x ,则0.3+x ×0.04=0.5,得x =5, 所以中位数为60+5=65. (2)依题意,平均成绩为:55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67, 所以高一参赛学生的平均成绩约为67. 【达标反馈】1.解析:选A .甲的中位数为81,乙的中位数为87.5,故①错,排除B 、D ;甲的平均分=16(76+72+80+82+86+90)=81,乙的平均分′=16(69+78+87+88+92+96)=85,故②错,③对,排除C ,故选A .2.解析:选B .样本数据落在[15,20]内的频数为: 100×[1-5×(0.04+0.10)]=30.3.解析:设污损的叶对应的成绩为x ,由茎叶图可得,89×5=83+83+87+x +90+99,所以x =3.故污损的数字是3.答案:34.解:(1)乙的打靶环数依次为2,4,6,8,7,7,8,9,9,10.所以乙=110(2+4+6+8+7+7+8+9+9+10)=7;乙的打靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是7+82=7.5;甲的打靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如(2)①甲、乙的平均数相同,均为7,但s 2甲<s 2乙,说明甲偏离平均数的程度小,而乙偏离平均数的程度大。