用样本的数字特征估计总体的数字特征2
2.2.2 用样本的数字特征估计总体的数字特征

解:(1)计算得x甲=7,x乙=7;
s甲=1.73,s乙=1.10. (2)由(1)知,甲、乙两人平均成绩相 等,但s乙<s甲,这表明乙的成绩比甲的成 绩稳定一些,从成绩的稳定性考虑,可以 选乙参赛。
练习:在一次歌手大奖赛上,七位评委为歌手打 出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4, 9.7,去掉一个最高分和一个最低分后,所剩数 据的平均值和方差分别为________
样本数据 平均数 3 3 3 3 3 3
B
1 1 3 5 5 3
标准差
1.0 0.8 0.6 0.4 0.2
1 2
0
1.79
频率分布 直方图
3
4
5
数据没有离散度
数据离散程度很高
再看钢管内径尺寸的例子,它的样本平 均数是25.401,样本标准差是0.056,再 直方图中用虚线标出平均数所在的位置, 并画出距平均数两侧各一倍标准差和两倍 标准差的区间。可以看到大约有70%的钢 管内径尺寸落在距平均数两侧各一倍标准 差的区间内,即(x-s, x+s) 大约有95%的钢管内径尺寸落在距平 均数两侧各两倍标准差的区间内,即(x- 2s, x+2s)。
六、小结: 1、用样本平均数估计总体平均数时,平均 数较大,数据的集中趋势所处的水平较高; 平均数较小,数据的集中趋势所处的水平较 低。 2、用样本标准差估计总体标准差时,标准 差较大,数据的离散程度较大;标准差较 小,数据的离散程度较小。
9.5,0.016
(3)标准差和频率直方图的关系 从标准差的定义可知,如果样本各数 据都相等,则标准差得0,这表明数据没 有波动幅度,数据没有离散性;若个体 的值与平均数的差的绝对值较大,则标 准差也较大,表明数据的波动幅度也很 大,数据的离散程度很高,因此标准差 描述了数据对平均数的离散程度。
2.2.2用样本的数字特征估计总体的数字特征

2.2.2用样本的数字特征估计总体的数字特征班级 姓名 编者:陆祖银 高二级备课组问题引航1.众数、平均数、中位数在反映样本数据时各有什么特点?如何计算方差、标准差?2.在频率分布直方图中如何求样本的众数、平均数、中位数?方差、标准差的几何意义是什么? 自主探究1.众数、中位数、平均数的定义:(1)众数:一组数据中出现次数 的数据称为这组的众数. (2)中位数:把一组数据按 的顺序排列.①若数据有奇数个,则处于 位置的那个数称为这组数据的中位数; ②若数据有偶数个,把处于中间位置的 称为这组数据的中位数.(3)平均数:如果有n 个数,,,21n x x x , 那么=x 叫做这n 个数的平均数. 2.标准差、方差的计算方法:(1)标准差的定义:标准差是样本数据到平均数的一种 ,一班用s 表示. (2)计算公式:=s . (3)方差的定义:标准差的平方.(4)计算公式:=2s . 互动探究例题1.某超市从2014年甲、乙两种酸奶的日销售量(单位:箱)的数据中分别随机抽取100个,整理得到数据分组及频率分布表.....和频率分布直方图:(Ⅰ)写出频率分布直方图中的a 的值,并作出甲种酸奶日销售量的频率分布直方图;(Ⅱ)记甲种酸奶与乙种酸奶日销售量(单位:箱)的方差分别为2221,s s ,试比较21s与22s 的大小.分组(日销售量) 频率(甲种酸奶) [ 0,10]0.10(10,20] 0.20 (20,30] 0.30 (30,40] 0.25 (40,50] 0.15当堂检测1.已知甲、乙两名同学在五次数学单元测验中得分如下: 学生甲 68 72 70 69 71 学生乙 6972687368则甲、乙两名同学数学成绩( )A .甲比乙稳定B .甲、乙稳定程度相同C .乙比甲稳定D .无法确定2.该茎叶图记录了甲、乙两组各五名学生在一次数学测试中的成绩(单位:分),已知甲组数据的平均数为87,乙组数据的中位数为87,则x ,y 的值分别为( ) A .2,6 B .2,7 C .3,6 D .3,73.某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用右图所示的茎叶图表示,若甲运动员的中位数为a ,乙运动员的众数为b ,则=-b a ( )A.4B.6C.8D.125.甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别是: 甲:8,6,7,8,6,5,9,10,4,7; 乙:6,7,7,8,6,7,8,7,9,5. 则这两组数据的方差是( )A.2.11.322=乙甲,=s sB.4.10.322=乙甲,=s sC.2.10.322=乙甲,=s sD.4.11.322=乙甲,=s s作业:1.甲、乙两同学的6次考试成绩分别为: 甲 99 89 97 85 95 99 乙89 93 90 89 92 90(Ⅰ)画出甲、乙两同学6次考试成绩的茎叶图;(Ⅱ)计算甲、乙两同学考试成绩的方差,并对甲、乙两同学的考试成绩做出合理评价自我评价你对本节课知识掌握的如何( )A.非常好 B.较好 C.一般 D.较差 E.很差。
人教A版必修3《2.2.2用样本的数字特征估计总体的数字特征》优化训练ppt课件

组数据的中位数.
注意:在频率分布直方图中,中位数左边和右边的直方图 相等 ,由此可以估计中位数的值. 的面积________
x1+x2+„+xn x= n (3)如果有n个数x1,x2,„,xn,那么_________________
如下(单位:mL):
342,348,346,340,344,341,343,350,340,342
343.6 则样本的平均数是________.
解析:由于数据较大,又都在常数 342 附近波动,把各数
据都减去 342,得 0,6,4,-2,2,-1,1,8,-2,0,
1 则 x ′=10×(0+6+4-2+2-1+1+8-2+0)=1.6, 即 x = x ′+342=343.6.
人员
平均环数- x 方差s2
甲 8.6 3.5
乙 8.9 3.5
丙 8.9 2.1
丁 8.2 5.6
从这四个人中选择一人参加奥运会射击项目比赛,最佳人 选是( C )
A.甲
C.丙
B.乙
D.丁
【问题探究】
如何通过频率分布直方图估计众数、中位数和平均数? 答案:(1)众数是最高矩形底边的中点;(2)中位数左边和右
边的直方图的面积应相等,由此可以估计中位数的值;(3)平均
数是频率分布直方图的“重心”,它等于每个小矩形的面积乘
以小矩形底边中点的横坐标之和.
题型 1 众数、中位数、平均数的求法
【例 1】 在一次中学生田径运动会上,参加男子跳高的 17 名运动员的成绩如下表: 成绩/米 1.50 1.60 1.65 1.70 人数/名
1 这组数据的平均数是 x =17×(1.50×2+1.60×3+1.65×
【精编】人教A版高中数学必修三课件第1部分第二章2.22.2.2用样本的数字特征估计总体的数字特征课件-精心整

6.从高三抽出50名学生参加数学竞赛,由成绩得到如 下的频率分布直方图.
由于一些数据丢失,试利用频率分布直方图求: (1)这50名学生成绩的众数与中位数. (2)这50名学生的平均成绩.
解:(1)由众数的概念可知,众数是出现次数最多的 数.在直方图中最高的矩形底边中点的横坐标即为所求, 所以众数应为75. 将频率分布直方图中所有小矩形的面积一分为二的直线 所对应的成绩即为所求. ∵0.004×10+0.006×10+0.02×10 =0.04+0.06+0.2=0.3, ∴前三个小矩形面积的和为0.3.
(2)中位数: 把一组数据按从小到大的顺序排列,把处于最位中置间的 那个数称为这组数据的中位数.在频率分布直方图中,中 位数左边和右边的直方图的面积. 相等 ①当数据个数为奇数时,中位数是按从小到大顺序排 列的那中个间数. ②当数据个数为偶数时,中位数为排列的最中间的两 个数的.平均数
(3)平均数:
管理 高级
人员 经理
工人 学徒 合计
人员 技工
周工资 2 200 250 220 200 100 2 970
(元)
人数 1
6 5 10 1 23
合计 2 200 1 500 1 100 2 000 100 6 900
(1)指出这个问题中的众数、中位数、平均数. (2)这个问题中,平均数能客观地反映该公司的工资水平 吗?为什么? [思路点拨] 由平均数的定义 → 计算平均数 → 已知数据从小到大排列 → 得中位数、平均数 → 结论
如果有 n 个数 x1、x2、…、xn,
那么 x =
1 n
(x1+x2+…+xn) ,叫做这
n
个数的平均
数.平均数的估计值等于频率分布直方图中每个小矩形的 面积 乘以小矩形底边中点横坐标之和.
2019-2020学年度最新高中数学新人教版必修3教案:第2章 2-2-2 用样本的数字特征估计总体的数字特征-含答案

2019-2020学年度最新高中数学新人教版必修3教案:第2章2-2-2 用样本的数字特征估计总体的数字特征-含答案1.会求样本的众数、中位数、平均数、标准差、方差.(重点)2.理解用样本的数字特征来估计总体数字特征的方法.(重点)3.会应用相关知识解决实际统计问题.(难点)[基础·初探]教材整理1众数、中位数、平均数阅读教材P72~P73的内容,完成下列问题.1.众数:在一组数据中,出现次数最多的数叫做众数.如果有两个或两个以上数据出现的最多且出现的次数相等,那么这些数据都是这组数据的众数;如果一组数据中,所有数据出现的次数都相等,那么认为这组数据没有众数.2.中位数:将一组数据按从小到大的顺序依次排列,当数据有奇数个时,处在最中间的那个数是这组数据的中位数;当数据有偶数个时,处在最中间的两个数的平均数是这组数据的中位数.3.平均数:一组数据的总和除以这组数据的个数取得的商叫做这组数据的平均数,一般记为x=1n(x1+x2+…+x n).4.三种数字特征的比较1.判断(正确的打“√”,错误的打“×”)(1)中位数一定是样本数据中的某个数.()(2)在一组样本数据中,众数一定是唯一的.()【答案】(1)×(2)×2.已知一组数据为20,30,40,50,50,60,70,80.其中平均数、中位数和众数的大小关系是()A.平均数>中位数>众数B.平均数<中位数<众数C.中位数<众数<平均数D.众数=中位数=平均数【解析】众数为50,平均数x=18(20+30+40+50+50+60+70+80)=50,中位数为12(50+50)=50,故选D.【答案】 D3.一组观察值4,3,5,6出现的次数分别为3,2,4,2,则样本平均值为( ) A .4.55 B .4.5 C .12.5 D .1.64【解析】x =4×3+3×2+5×4+6×23+2+4+2≈4.55.【答案】 A教材整理2 频率分布直方图中的众数、中位数、平均数 阅读教材P 72~P 73的内容,完成下列问题.在频率分布直方图中,众数是最高矩形中点的横坐标,中位数左边和右边的直方图的面积应该相等,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.教材整理3 标准差、方差阅读教材P 74~P 77例2上面的内容,完成下列问题. 1.标准差的计算公式标准差是样本数据到平均数的一种平均距离,一般用s 表示, s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 2.方差的计算公式 标准差的平方s 2叫做方差.s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].其中,x i (i =1,2,…,n )是样本数据,n 是样本容量,x 是样本平均数.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4. 则:(1)平均命中环数为________; (2)命中环数的标准差为________.【解析】 (1)x =7+8+7+9+5+4+9+10+7+410=7.(2)s 2=110[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,∴s=2.【答案】(1)7(2)2[小组合作型](2)这个问题中,平均数能客观地反映该工厂的工资水平吗?为什么?【精彩点拨】先结合众数、中位数、平均数的意义求出众数、中位数、平均数,再结合影响平均数的因素作答.【尝试解答】(1)由题中表格可知:众数为1 200,中位数为1 220,平均数为(2 200+1 250×6+1 220×5+1 200×10+490)÷23=1 230(元/周).(2)虽然平均数为1 230元/周,但从题中表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该厂的工资水平.1.众数、中位数、平均数都是刻画数据特征的,但任何一个样本数据改变都会引起平均数的改变,而众数、中位数不具有这个性质.所以平均数可以反映出更多的关于样本数据全体的信息,它是样本数据的重心.2.在样本中出现极端值的情况下,众数、中位数更能反映样本数据的平均水平.[再练一题]1.已知一组数据按从小到大排列为-1,0,4,x,6,15,且这组数据的中位数是5,那么数据的众数是________,平均数是________.【解析】 ∵中位数为5,∴4+x2=5,即x =6.∴该组数据的众数为6,平均数为-1+0+4+6+6+156=5.【答案】 6 5甲、乙两机床同时加工直径为100 cm 的零件,为检验质量,从中抽取6件测量数据为:甲:99 100 98 100 100 103 乙:99 100 102 99 100 100 (1)分别计算两组数据的平均数及方差;(2)根据计算说明哪台机床加工零件的质量更稳定. 【精彩点拨】【尝试解答】 (1)x 甲=16[99+100+98+100+100+103]=100, x 乙=16[99+100+102+99+100+100]=100,s2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73,s2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)由(1)知x甲=x乙,比较它们的方差,∵s2甲>s2乙,故乙机床加工零件的质量更稳定.1.在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散程度(即方差或标准差),方差大说明取值分散性大,方差小说明取值分散性小或者取值集中、稳定.2.关于统计的有关性质及规律(1)若x1,x2,…,x n的平均数为x,那么mx1+a,mx2+a,…,mx n+a的平均数是m x+a;(2)数据x1,x2,…,x n与数据x1+a,x2+a,…,x n+a的方差相等;(3)若x1,x2,…,x n的方差为s2,那么ax1,ax2,…,ax n的方差为a2s2.[再练一题]2.某校高二年级在一次数学选拔赛中,由于甲、乙两人的竞赛成绩相同,从而决定根据平时在相同条件下进行的六次测试确定出最佳人选,这六次测试的成绩数据如下:求两人比赛成绩的平均数以及方差,并且分析成绩的稳定性,从中选出一位参加数学竞赛.【解】 设甲、乙两人成绩的平均数分别为x 甲,x 乙, 则x 甲=130+16(-3+8+0+7+5+1)=133, x 乙=130+16(3-1+8+4-2+6)=133,s 2甲=16[(-6)2+52+(-3)2+42+22+(-2)2]=473, s 2乙=16[(02+(-4)2+52+12+(-5)2+32]=383. 因此,甲与乙的平均数相同,由于乙的方差较小,所以乙的成绩比甲的成绩稳定,应该选乙参加竞赛比较合适.125 121 123 125 127 129 125 128 130129 126 124 125 127 126 122 124 125 126 128 (1)填写下面的频率分布表:(2)(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数. 【精彩点拨】 将数据分组后依次填写分布表.然后画出直方图,最后根据数字特征在直方图中的求法求解.【尝试解答】 (1)(3)在[124.5,126.5)中的数据最多,取这个区间的中点值作为众数的近似值,得众数为125.5,事实上,众数的精确值为125.图中虚线对应的数据是124.5+2×58=125.75,事实上中位数为125.5.使用“组中值”求平均数:x -=121.5×0.1+123.5×0.15+125.5×0.4+127.5×0.2+129.5×0.15=125.8,事实上平均数的精确值为x -=125.75.1.利用频率分布直方图求数字特征 (1)众数是最高的矩形的底边的中点;(2)中位数左右两侧直方图的面积相等;(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.2.利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数.[再练一题]3.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图2-2-20所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:图2-2-20(1)高一参赛学生的成绩的众数、中位数;(2)高一参赛学生的平均成绩.【解】(1)由题图可知众数为65,又∵第一个小矩形的面积为0.3,∴设中位数为60+x,则0.3+x×0.04=0.5,得x=5,∴中位数为60+5=65.(2)依题意,平均成绩为:55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,∴平均成绩约为67.[探究共研型]探究【提示】一组数据的平均数、中位数都是唯一的,众数不唯一,可以有一个,也可以有多个,还可以没有.如果有两个数据出现的次数相同,并且比其他数据出现的次数都多,那么这两个数据都是这组数据的众数.探究2如何从样本的数字特征中了解数据中是否存在极端数据?【提示】中位数不受几个极端数据的影响,而平均数受每个数据的影响,“越离群”的数据,对平均数的影响越大,因此如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以了解样本数据中极端数据的信息.探究3众数、中位数有哪些应用?【提示】(1)众数只与这组数据中的部分数据有关,当一组数据中有不少数据重复出现时,众数往往更能反映问题.(2)中位数仅与数据的排列位置有关,中位数可能在所给数据中,也可能不在所给数据中.当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.探究4【提示】(1)数据的离散程度可以通过极差、方差或标准差来描述,极差反映了一组数据变化的最大幅度,它对一组数据中的极端值极为敏感,一般情况下,极差大,则数据波动性大;极差小,则数据波动性小.极差只需考虑两个极端值,便于计算,但没有考虑中间的数据,可靠性较差.(2)标准差和方差则反映了一组数据围绕平均数波动的大小,方差、标准差的运算量较大.因为方差与原始数据单位不同,且平方后可能夸大了偏差程度,所以虽然标准差与方差在体现数据离散程度上是一样的,但解决问题时一般用标准差.探究5【提示】(1)样本的数字特征具有随机性,这种随机性是由样本的随机性引起的.(2)样本的数字特征具有规律性,在很广泛的条件下,简单随机样本的数字特征(如众数、中位数、平均数和标准差等)随样本容量的增加而稳定于总体相应的数字特征(总体的数字特征是一定的,不存在随机性).某班4个小组的人数为10,10,x,8,已知该组数据的中位数与平均数相等,求这组数据的中位数.【精彩点拨】x的大小未知,可根据x的取值不同分别求中位数.【尝试解答】该组数据的平均数为14(x+28),中位数一定是其中两个数的平均数,由于x不知是多少,所以要分几种情况讨论:(1)当x≤8时,原数据按从小到大的顺序排列为x,8,10,10,其中位数为12×(10+8)=9.若14(x+28)=9,则x=8,此时中位数为9.(2)当8<x≤10时,原数据按从小到大的顺序排列为8,x,10,10,其中位数为12(x+10).若14(x+28)=12·(x+10),则x=8,而8不在8<x≤10的范围内,所以舍去.(3)当x>10时,原数据按从小到大的顺序排列为8,10,10,x,其中位数为12×(10+10)=10.若14(x +28)=10,则x =12,此时中位数为10.综上所述,这组数据的中位数为9或10.当在数据中含有未知数x ,求该组数据的中位数时,由于x 的取值不同,所以数据由小到大(或由大到小)排列的顺序不同,由于条件的变化,问题的结果有多种情况,不能用同一标准或同一种方法解决,故需分情况讨论,讨论时要做到全面合理,不重不漏.[再练一题]4.为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为____________.【解析】 设5个班级中参加的人数分别为x 1,x 2,x 3,x 4,x 5,则由题意知x 1+x 2+x 3+x 4+x 55=7,(x 1-7)2+(x 2-7)2+(x 3-7)2+(x 4-7)2+(x 5-7)2=20,五个整数的平方和为20,则必为0+1+1+9+9=20,由|x -7|=3可得x =10或x =4.由|x -7|=1可得x =8或x =6,由上可知参加的人数分别为4,6,7,8,10,故最大值为10.【答案】 101.样本101,98,102,100,99的标准差为( ) A.2B .0C.1 D.2【解析】样本平均数x=100,方差为s2=2,∴标准差s=2,故选A.【答案】 A2.甲乙两名学生六次数学测验成绩(百分制)如图2-2-21所示.图2-2-21①甲同学成绩的中位数大于乙同学成绩的中位数;②甲同学的平均分比乙同学高;③甲同学的平均分比乙同学低;④甲同学成绩的方差小于乙同学成绩的方差.上面说法正确的是()A.③④B.①②④C.②④D.①③【解析】甲的中位数81,乙的中位数87.5,故①错,排除B、D;甲的平均分x=16(76+72+80+82+86+90)=81,乙的平均分x′=16(69+78+87+88+92+96)=85,故②错,③对,排除C,故选A.【答案】 A3.甲、乙、丙、丁四名射手在选拔赛中所得的平均环数x及其方差s2如下表所示,则选送决赛的最佳人选应是()【解析】∵x乙=x丙>x甲=x丁,且s2甲=s2乙<s2丙<s2丁,∴应选择乙进入决赛.【答案】 B4.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图2-2-22,则图2-2-22(1)这20名工人中一天生产该产品数量在[55,75)的人数是________.(2)这20名工人中一天生产该产品数量的中位数为________.(3)这20名工人中一天生产该产品数量的平均数为________.【解析】(1)(0.040×10+0.025×10)×20=13.(2)设中位数为x,则0.2+(x-55)×0.04=0.5,x=62.5.(3)0.2×50+0.4×60+0.25×70+0.1×80+0.05×90=64.【答案】(1)13(2)62.5(3)645.甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图2-2-23所示:图2-2-23(1)填写下表:①从平均数和方差结合分析偏离程度;②从平均数和中位数结合分析谁的成绩好些;③从平均数和命中9环以上的次数相结合看谁的成绩好些;④从折线图上两人射击命中环数及走势分析谁更有潜力.【解】(1)乙的射靶环数依次为2,4,6,8,7,7,8,9,9,10.所以x乙=110(2+4+6+8+7+7+8+9+9+10)=7;乙的射靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是7+82=7.5;甲的射靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示:(2)①甲、乙的平均数相同,均为7,但s甲乙小,而乙偏离平均数的程度大.②甲、乙的平均水平相同,而乙的中位数比甲大,说明乙射靶成绩比甲好.③甲、乙的平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的射靶成绩比甲好.④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力.学业分层测评(十三)用样本的数字特征估计总体的数字特征(建议用时:45分钟)[学业达标]一、选择题1.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图2-2-24所示,则( )图2-2-24A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差【解析】 由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 对;甲、乙的成绩的极差均为4,D 错.【答案】 C2.若样本1+x 1,1+x 2,1+x 3,…,1+x n 的平均数是10,方差为2,则对于样本2+x 1,2+x 2,…,2+x n ,下列结论正确的是( )A .平均数是10,方差为2B .平均数是11,方差为3C .平均数是11,方差为2D .平均数是10,方差为3【解析】 若x 1,x 2,…,x n 的平均数为x ,方差为s ,那么x 1+a ,x 2+a ,…,x n +a 的平均数为x +a ,方差为s .【答案】 C3.如图2-2-25是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,甲、乙两人这几场比赛得分的平均数分别为x 甲,x 乙;标准差分别是s 甲,s 乙,则有( )图2-2-25A.x 甲>x 乙,s 甲>s 乙B.x 甲>x 乙,s 甲<s 乙C.x 甲<x 乙,s 甲>s 乙D.x 甲<x 乙,s 甲<s 乙【解析】 观察茎叶图可大致比较出平均数与标准差的大小关系,或者通过公式计算比较.【答案】 C4.已知一组数据x 1,x 2,x 3,x 4,x 5的平均数是x =2,方差是13,那么另一组数据3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数和方差分别为( )A .2,13 B .2,1 C .4,13D .4,3【解析】 平均数为x ′=3x -2=3×2-2=4,方差为s ′2=9s 2=9×13=3.【答案】 D5.为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图,如图2-2-26所示.由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a ,视力在4.6到5.0之间的学生数为b ,则a ,b 的值分别为( )图2-2-26A .0.27,78B .0.27,83C .2.7,78D .2.7,83【解析】 由题意,4.5到4.6之间的频率为0.09,4.6到4.7之间的频率为0.27,后6组的频数成等差数列,设公差为d ,则6×0.27+15d =1-0.01-0.03-0.09,∴d =-0.05.∴b =(0.27×4+6d )×100=78,a =0.27. 【答案】 A 二、填空题6.一个样本数据按从小到大的顺序排列为:13,14,19,x,23,27,28,31,中位数为22,则x =________.【解析】 由题意知x +232=22,则x =21. 【答案】 217.甲、乙两位同学某学科的连续五次考试成绩用茎叶图表示如图2-2-27所示,则平均分数较高的是________,成绩较为稳定的是________.图2-2-27【解析】x甲=70,x乙=68,s 2甲=15×(22+12+12+22)=2,s 2乙=15×(52+12+12+32)=7.2.【答案】甲甲8.已知样本9,10,11,x,y的平均数是10,标准差为2,则xy=________.【解析】由平均数得9+10+11+x+y=50,∴x+y=20.又由(9-10)2+(10-10)2+(11-10)2+(x-10)2+(y-10)2=(2)2×5=10,得x2+y2-20(x+y)=-192,(x+y)2-2xy-20(x+y)=-192,∴xy=96.【答案】96三、解答题9.从高三抽出50名学生参加数学竞赛,由成绩得到如图2-2-28的频率分布直方图.图2-2-28由于一些数据丢失,试利用频率分布直方图求:(1)这50名学生成绩的众数与中位数;(2)这50名学生的平均成绩.【解】(1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形的底边中点的横坐标即为所求,所以众数应为75.由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.因此在频率分布直方图中将所有小矩形的面积一分为二的垂直于横轴的直线与横轴交点的横坐标所对应的成绩即为所求.∵0.004×10+0.006×10+0.02×10=0.04+0.06+0.2=0.3,∴前三个小矩形面积的和为0.3.而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5,∴中位数应约位于第四个小矩形内.设其底边为x ,高为0.03,∴令0.03x =0.2得x ≈6.7, 故中位数应约为70+6.7=76.7.(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点的横坐标乘以每个小矩形的面积求和即可.∴平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.021×10)+95×(0.016×10)=73.65.10.对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:(1)(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、极差、方差,并判断选谁参加比赛比较合适?【解】 (1)画茎叶图如下:中间数为数据的十位数.从茎叶图上看,甲、乙的得分情况都是分布均匀的,只是乙更好一些.乙发挥比较稳定,总体情况比甲好.(2)x 甲=27+38+30+37+35+316=33.x 乙=33+29+38+34+28+366=33.s 2甲=16[(27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2]≈15.67.s 2乙=16[(33-33)2+(29-33)2+(38-33)2+(34-33)2+(28-33)2+(36-33)2]≈12.67.甲的极差为11,乙的极差为10.综合比较以上数据可知,选乙参加比赛较合适.[能力提升]1.有一笔统计资料,共有11个数据如下(不完全以大小排列):2,4,4,5,5,6,7,8,9,11,x ,已知这组数据的平均数为6,则这组数据的方差为( )A .6 B.6 C .66D .6.5【解析】 ∵x =111(2+4+4+5+5+6+7+8+9+11+x )=111(61+x )=6,∴x =5.方差为:s 2=42+22+22+12+12+02+12+22+32+52+1211=6611=6.【答案】 A2.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图2-2-29中以x 表示:89⎪⎪⎪7 74 0 1 0 x 9 1图2-2-29则7个剩余分数的方差为( )A.1169B.367C .36D.677【解析】 根据茎叶图,去掉1个最低分87,1个最高分99, 则17[87+94+90+91+90+(90+x )+91]=91, ∴x =4.∴s 2=17[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=367.【答案】 B3.若40个数据的平方和是56,平均数是22,则这组数据的方差是________,标准差是________.【解析】 设这40个数据为x i (i =1,2,…,40),平均数为x . 则s 2=140×[(x 1-x )2+(x 2-x )2+…+(x 40-x )2] =140[x 21+x 22+…+x 240+40x 2-2x (x 1+x 2+…+x 40)] =140⎣⎢⎡⎦⎥⎤56+40×⎝ ⎛⎭⎪⎫222-2×22×40×22=140×⎝ ⎛⎭⎪⎫56-40×12=0.9. ∴s =0.9=910=31010. 【答案】 0.9310104.某地区100位居民的人均月用水量(单位:t)的分组及各组的频数如下: [0,0.5),4;[0.5,1),8;[1,1.5),15;[1.5,2),22;[2,2.5),25;[2.5,3),14;[3,3.5),6;[3.5,4),4;[4,4.5),2.(1)列出样本的频率分布表;(2)画出频率分布直方图,并根据直方图估计这组数据的平均数、中位数、众数;(3)当地政府制定了人均月用水量为3t的标准,若超出标准加倍收费,当地政府说,85%以上的居民不超过这个标准,这个解释对吗?为什么?【解】(1)频率分布表(2)频率分布直方图如图:众数:2.25,中位数:2.02,平均数:2.02.(3)人均月用水量在3t以上的居民所占的比例为6%+4%+2%=12%,即大约有12%的居民月用水量在3t以上,88%的居民月用水量在3t以下,因此政府的解释是正确的.。
2.2.2 用样本的数字特征估计总体的数字特征

2.2.2 用样本的数字特征估计总体的数字特征整体设计教学分析教科书结合实例展示了频率分布的众数、中位数和平均数.对于众数、中位数和平均数的概念,重点放在比较它们的特点,以及它们的适用场合上,使学生能够发现,在日常生活中某些人通过混用这些(描述平均位置的)统计术语进行误导.另一方面,教科书通过思考栏目让学生注意到,直接通过样本计算所得到的中位数与通过频率直方图估计得到的中位数不同.在得到这个结论后,教师可以举一反三,使学生思考对于众数和平均数,是否也有类似的结论.进一步,可以解释对总体众数、总体中位数和总体平均数的两种不同估计方法的特点.在知道样本数据的具体数值时,通常通过样本计算中位数、平均值和众数,并用它们估计总体的中位数、均值和众数.但有时我们得到的数据是整理过的数据,比如在媒体中见到的频数表或频率表,用教科书中的方法也可以得到总体的中位数、均值和众数的估计.教科书通过几个现实生活的例子,引导学生认识到:只描述平均位置的特征是不够的,还需要描述样本数据离散程度的特征.通过对如何描述数据离散程度的探索,使学生体验创造性思维的过程.教科书通过例题向学生展示如何用样本数字特征解决实际问题,通过阅读与思考栏目“生产过程中的质量控制图”,让学生进一步体会分布的数字特征在实际中的应用.三维目标1.能利用频率分布直方图估计总体的众数、中位数、平均数;能用样本的众数、中位数、平均数估计总体的众数、中位数、平均数,并结合实际,对问题作出合理判断,制定解决问题的有效方法;初步体会、领悟“用数据说话”的统计思想方法;通过对有关数据的搜集、整理、分析、判断,培养学生“实事求是”的科学态度和严谨的工作作风.2.正确理解样本数据标准差的意义和作用,学会计算数据的标准差;能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程进行初步评价的意识.3.在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法;会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系.重点难点教学重点:根据实际问题对样本数据中提取基本的数据特征并作出合理解释,估计总体的基本数字特征;体会样本数字特征具有随机性.教学难点:用样本平均数和标准差估计总体的平均数与标准差;能应用相关知识解决简单的实际问题.课时安排2课时教学过程第2课时标准差导入新课思路1平均数为我们提供了样本数据的重要信息,但是,有时平均数也会使我们作出对总体的片面判断.某地区的统计显示,该地区的中学生的平均身高为176 cm,给我们的印象是该地区的中学生生长发育好,身高较高.但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质.因此,只有平均数难以概括样本数据的实际状态.所以我们学习从另外的角度来考察样本数据的统计量——标准差.(教师板书课题)思路2在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员:7,8,7,9,5,4,9,10,7,4;乙运动员:9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?如果你是教练,选哪位选手去参加正式比赛?我们知道,x甲=7,x乙=7.两个人射击的平均成绩是一样的.那么,是否两个人就没有水平差距呢?从上图直观上看,还是有差异的.很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据——标准差.推进新课新知探究提出问题(1)如何通过频率分布直方图估计数字特征(中位数、众数、平均数)?(2)有甲、乙两种钢筋,现从中各抽取一个标本(如下表)检查它们的抗拉强度(单位:kg/mm2),哪种钢筋的质量较好?(3)某种子公司为了在当地推行两种新水稻品种,对甲、乙两种水稻进行了连续7年的种植对比实验,年亩产量分别如下:(千克)甲:600, 880, 880, 620, 960, 570, 900(平均773)乙:800, 860, 850, 750, 750, 800, 700(平均787)请你用所学统计学的知识,说明选择哪种品种推广更好?(4)全面建设小康社会是我们党和政府的工作重心,某市按当地物价水平计算,人均年收入达到1.5万元的家庭即达到小康生活水平.民政局对该市100户家庭进行调查统计,它们的人均收入达到了1.6万元,民政局即宣布该市民生活水平已达到小康水平,你认为这样的结论是否符合实际?(5)如何考查样本数据的分散程度的大小呢?把数据在坐标系中刻画出来,是否能直观地判断数据的离散程度?讨论结果:(1)利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. (2)由上图可以看出,乙样本的最小值100低于甲样本的最小值110,乙样本的最大值145高于甲样本的最大值135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定.我们把一组数据的最大值与最小值的差称为极差(range ).由上图可以看出,乙的极差较大,数据点较分散;甲的极差小,数据点较集中,这说明甲比乙稳定.运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论.(3)选择的依据应该是,产量高且稳产的品种,所以选择乙更为合理.(4)不符合实际.样本太小,没有代表性.若样本里有个别高收入者与多数低收入者差别太大.在统计学里,对统计数据的分析,需要结合实际,侧重于考察总体的相关数据特征.比如,市民平均收入问题,都是考察数据的分散程度.(5)把问题(3)中的数据在坐标系中刻画出来.我们可以很直观地知道,乙组数据比甲组数据更集中在平均数的附近,即乙的分散程度小, 如何用数字去刻画这种分散程度呢? 考察样本数据的分散程度的大小,最常用的统计量是方差和标准差.标准差:考察样本数据的分散程度的大小,最常用的统计量是标准差(standard deviation).标准差是样本数据到平均数的一种平均距离,一般用s 表示.所谓“平均距离”,其含义可作如下理解:假设样本数据是x 1,x 2,…,x n ,x 表示这组数据的平均数.x i 到x 的距离是|x i -x |(i=1,2,…,n). 于是,样本数据x 1,x 2,…,x n 到x 的“平均距离”是S=nx x x x x x n ||||||21-++-+- . 由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差: s=])()()[(122221x x x x x x nn -++-+- . 意义:标准差用来表示稳定性,标准差越大,数据的离散程度就越大,也就越不稳定.标准差越小,数据的离散程度就越小,也就越稳定.从标准差的定义可以看出,标准差s≥0,当s=0时,意味着所有的样本数据都等于样本平均数.标准差还可以用于对样本数据的另外一种解释.例如,在关于居民月均用水量的例子中,平均数x =1.973,标准差s=0.868,所以x +s=2.841,x +2s=3.709;x -s=1.105,x -2s=0.237.这100个数据中,在区间[x -2s,x +2s ]=[0.237,3.709]外的只有4个,也就是说,[x -2s, x +2s ]几乎包含了所有样本数据.从数学的角度考虑,人们有时用标准差的平方s 2——方差来代替标准差,作为测量样本数据分散程度的工具:s 2=n1[(x 1-x )2+(x 2-x )2+…+(x n -x )2].显然,在刻画样本数据的离散程度上,方差与标准差是一样的.但在解决实际问题时,一般多采用标准差.需要指出的是,现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.两者都是描述一组数据围绕平均数波动的大小,实际应用中比较广泛的是标准差.如导入中的运动员成绩的标准差的计算器计算.用计算器计算运动员甲的成绩的标准差的过程如下:即s甲=2.用类似的方法,可得s乙≈1.095.由s甲>s乙可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.应用示例思路1例1 画出下列四组样本数据的条形图,说明它们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8.分析:先画出数据的条形图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差.解:四组样本数据的条形图如下:四组数据的平均数都是5.0,标准差分别是:0.00,0.82,1.49,2.83.它们有相同的平均数,但它们有不同的标准差,说明数据的分散程度是不一样的.例2 甲、乙两人同时生产内径为25.40 mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm):甲25.46 25.32 25.45 25.39 25.3625.34 25.42 25.45 25.38 25.4225.39 25.43 25.39 25.40 25.4425.40 25.42 25.35 25.41 25.39乙25.40 25.43 25.44 25.48 25.4825.47 25.49 25.49 25.36 25.3425.33 25.43 25.43 25.32 25.4725.31 25.32 25.32 25.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?分析:每一个工人生产的所有零件的内径尺寸组成一个总体.由于零件的生产标准已经给出(内径25.40 mm),生产质量可以从总体的平均数与标准差两个角度来衡量.总体的平均数与内径标准尺寸25.40 mm 的差异大时质量低,差异小时质量高;当总体的平均数与标准尺寸很接近时,总体的标准差小的时候质量高,标准差大的时候质量低.这样,比较两人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可.但是,这两个总体的平均数与标准差都是不知道的,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本的平均数、标准差,以此作为两个总体之间差异的估计值.解:用计算器计算可得甲x ≈25.401,乙x ≈25.406;s 甲≈0.037,s 乙≈0.068.从样本平均数看,甲生产的零件内径比乙的更接近内径标准(25.40 mm),但是差异很小;从样本标准差看,由于s 甲<s 乙,因此甲生产的零件内径比乙的稳定程度高得多.于是,可以作出判断,甲生产的零件的质量比乙的高一些.点评:从上述例子我们可以看到,对一名工人生产的零件内径(总体)的质量判断,与所抽取的零件内径(样本数据)直接相关.显然,我们可以从这名工人生产的零件中获取许多样本.这样,尽管总体是同一个,但由于样本不同,相应的样本频率分布与平均数、标准差等都会发生改变,这就会影响到我们对总体情况的估计.如果样本的代表性差,那么对总体所作出的估计就会产生偏差;样本没有代表性时,对总体作出错误估计的可能性就非常大.这也正是我们在前面讲随机抽样时反复强调样本代表性的理由.在实际操作中,为了减少错误的发生,条件许可时,通常采取适当增加样本容量的方法.当然,关键还是要改进抽样方法,提高样本的代表性. 变式训练某地区全体九年级的3 000名学生参加了一次科学测试,为了估计学生的成绩,从不同学校的不同程度的学生中抽取了100名学生的成绩如下:100分12人,90分30人,80分18人,70分24人,60分12人,50分4人.请根据以上数据估计该地区3 000名学生的平均分、合格率(60或60分以上均属合格). 解:运用计算器计算得:100450126024701880309012100⨯+⨯+⨯+⨯+⨯+⨯=79.40, (12+30+18+24+12)÷100=96%,所以样本的平均分是79.40分,合格率是96%,由此来估计总体3 000名学生的平均分是79.40分,合格率是96%.思路2例1 甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm 2),试根据解:甲品种的样本平均数为10,样本方差为[(9.8-10)2 +(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02.乙品种的样本平均数也为10,样本方差为[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷5=0.24.因为0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.例 2 为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的分析:用每一区间内的组中值作为相应日光灯的使用寿命,再求平均寿命.解:各组中值分别为165,195,225,255,285,315,345,375,由此算得平均数约为165×1%+195 ×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天).这些组中值的方差为1001×[1×(165-268)2+11×(195-268)2+18×(225-268)2+20×(255-268)2+ 25×(285-268)2+16×(315-268)2+7×(345-268)2+2×(375-268)2]=2 128.60(天2).故所求的标准差约6.2128≈46(天).答:估计这种日光灯的平均使用寿命约为268天,标准差约为46天.知能训练(1)在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为____________.(2)若给定一组数据x 1,x 2,…,x n ,方差为s 2,则ax 1,ax 2,…,ax n 的方差是____________.(3)在相同条件下对自行车运动员甲、乙两人进行了6次测试,测得他们的最大速度(单位:m/s)答案:(1)9.5,0.016 (2)a 2s 2(3)甲x =33,乙x =33,33734722=>=乙甲s s , 乙的成绩比甲稳定,应选乙参加比赛更合适.拓展提升某养鱼专业户在一个养鱼池放入一批鱼苗,一年以后准备出售,为了在出售以前估计卖掉鱼后有多少收入,这个专业户已经了解到市场的销售价是每千克15元,请问,这个专业户还应该了解什么?怎样去了解?请你为他设计一个方案.解:这个专业户应了解鱼的总重量,可以先捕出一些鱼(设有x 条),作上标记后放回鱼塘,过一段时间再捕出一些鱼(设有a 条),观察其中带有标记的鱼的条数,作为一个样本来估计总体,则鱼塘中鱼的总条数鱼的条数鱼塘中所有带有标记条鱼中带有标记的条数)(x a a 这样就可以求得总条数,同时把第二次捕出的鱼的平均重量求出来,就可以估计鱼塘中的平均重量,进而估计全部鱼的重量,最后估计出收入.课堂小结1.用样本的数字特征估计总体的数字特征分两类:用样本平均数估计总体平均数,平均数对数据有“取齐”的作用,代表一组数据的平均水平.用样本标准差估计总体标准差.样本容量越大,估计就越精确,标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度.2.用样本估计总体的两个手段(用样本的频率分布估计总体的分布;用样本的数字特征估计总体的数字特征),需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本容量越大,估计的结果也就越精确.作业习题2.2A 组4、5、6、7,B 组1、2.设计感想统计学科,最大的特点就是与现实生活的密切联系,也是新教材的亮点.仅仅想借助“死记硬背一些概念及公式,简单模仿课本例题”来学习,是绝对不行的.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差,其原因在于样本的随机性.这种偏差是不可避免的.虽然我们从样本数据得到的分布、均值和标准差并不是总体的真正分布、均值和标准差,而只是总体的一个估计,但这种估计是合理的,特别是当样本的容量很大时,它们确实反映了总体的信息.教师建议:亲身经历“提出问题,收集数据,分析数据,并作出合理决策”过程,在此过程中不仅可以加深对概念等知识的深刻理解,更重要的是发展了思维,培养了分析及解决问题能力,同时在情感、意志等领域也得到了协调发展,这才是学校学习的科学而全面的目标,习题设置有层次,尽量源于教材,又高于教材,这也是高考命题原则.。
用样本的数字特征估计总体的数字特征
用样本的数字特征估计总体的数字特征估计总体的数字特征是统计学中的一个重要问题,在实际应用中经常需要通过样本数据对总体数据的统计参数进行估计。
估计总体的数字特征包括均值、方差、标准差、偏度、峰度等多个方面。
首先,对于总体的均值μ的估计,可以使用样本的平均值x_bar作为总体均值的近似值,即:μ ≈ x_bar这是因为样本的平均值是总体均值的无偏估计量。
在大样本条件下,由于中心极限定理的作用,样本的平均值的标准差会越来越小,从而使得x_bar更加接近总体均值μ。
其次,对于总体的方差σ^2的估计,可以使用样本方差s^2作为总体方差的无偏估计量,即:σ^2 ≈ s^2其中,样本方差的计算公式为:s^2 = ∑(x_i - x_bar)^2 / (n-1)其中,x_i表示第i个样本数据,x_bar表示样本的平均值,n表示样本容量。
在样本容量较大时,样本方差与总体方差之间的差别会越来越小,从而可以更加准确地估计总体方差。
然而,使用样本方差进行总体方差的估计存在一个问题,即样本方差的值通常比总体方差的值偏小。
因此,为了更加准确地估计总体方差,可以使用修正样本方差s_*^2,即将分母从n-1改为n,计算公式为:除了均值和方差的估计外,偏度和峰度等数字特征的估计也是非常重要的。
偏度是衡量数据分布对称性的数字特征,偏度为0表示数据分布对称。
正偏度表示数据分布向右倾斜,负偏度表示数据分布向左倾斜。
偏度的计算公式为:其中,s是样本标准差。
峰度是衡量数据分布尖峭程度的数字特征,峰度为0表示数据分布与正态分布相同。
正峰度表示数据分布比正态分布更加集中,负峰度表示数据分布较为平缓。
峰度的计算公式为:通过样本的数字特征估计总体的数字特征是数据分析的一个基本问题。
在实际应用中,要根据数据分析的目的选择合适的估计方法,并掌握估计方法的优缺点,以确保估计结果的准确性和可靠性。
用样本的数字特征估计总体的数字特征说课稿 教案 教学设计
本章节是学生在初中学过的简单的统计知识一个深化。学生通过本章的学习应体会统计思维与确定性思维的差异。在本章中学生应通过实习作业较为系统地经历数据收集与处理的全过程。学生在了解统计问题时,应该包括两个方面的信息,即问题所涉及的总体和变量,处理统计问题时,学生对于随机性的理解是困难的,为此在教学过程中要通过日常生活中大量的实例以助理解。
解:(图略,可查阅课本P68)
四组数据的平均数都是5.0,标准差分别为:0.00,0.82,1.49,2.83。
他们有相同的平均数,但他们有不同的标准差,说明数据的分散程度是不一样的。
〖例2〗ቤተ መጻሕፍቲ ባይዱ(见课本P69)
分析: 比较两个人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本数据的平均数、标准差,以此作为两个总体之间的差异的估计值。
考试说明:1.理解样本数据标准差的意义和作用,会计算数据标准差及方差。2.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释。3.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想。4.会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题。
〖例1〗:画出下列四组样本数据的直方图,说明他们的异同点。
(1)5,5,5,5,5,5,5,5,5
(2)4,4,4,5,5,5,6,6,6
(3)3,3,4,4,5,6,6,7,7
(4)2,2,2,2,5,8,8,8,8
分析:先画出数据的直方图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差。
新课标人教A版数学必修3全部课件:2.2.2用样本的数字特征估计总体的数字特征习题
用样本的数字特征估计总体的数字特征
怎样将各个样本数据 汇总为一个数值,并使 它成为样本数据的中 心点? 能否用一个数值来描 写样本数据的离散程 度?
例题:
某班12名学生体育考试跳高成绩如 下(单位:米): 1.58 1.59 1.57 1.61 1.58 1.65
直方图,说明它们的异同点
(1) 5,5,5,5,5,5,5,5,5;
(2) 4,4,4,5,5,5,6,6,6; (3) 3,3,4,4,5,6,6,7,7;
(4) 2,2,2,2,5,8,8,8,8.
±½ ¼ Ö ·Í 1
频1.0 率0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0
x 5 s 1 . 49
3
4
5
6
7
8
±½ ¼ Ö ·Í 4
频 1.0 率 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0
x 5 s 2 . 83
1
2
3
4
5
6
7
8
例2
甲乙两人同时生产内径为25.40mm的一种零件。 为了对两人的生产质量进行评比,从他们生产的零件 中各抽出20件,量得其内径尺寸如下(单位:mm)
甲
乙
25.46 25.34 25.39 25.40 25.40 25.47 25.33 25.31
25.32 25.42 25.43 25.42 25.43 25.49 25.43 25.32
25.45 25.45 25.39 25.35 25.44 25.49 25.43 25.32
25.39 25.38 25.40 25.41 25.48 25.36 25.32 25.32
必修三2-2-2用样本的数字特征估计总体的数字特征
课前探究学习
课堂讲练互动
活页规范训练
规律方法 1.中位数的求法 (1)当数据个数为奇数时,中位数是按从小到大顺序排列 的中间那个数. (2)当数据个数为偶数时,中位数为排列的最中间的两个 数的平均数. 2.深刻理解和把握平均数、中位数、众数在反映样本数 据上的特点,并结合实际情况,灵活应用.
课前探究学习
课堂讲练互动
活页规范训练
自学导引
众数、中位数、平均数的概念 1. 次数 最多的数称为这组数据的 (1)众数:一组数据中出现_____ 众数.一组数据中的众数可能不止一个,也可能没有.众 集中趋势 .在频率分布直方图中, 数反映了该组数据的_________ 中点 就是数据的众数. 最高矩形的_____ (2)中位数:一组数据按从小到大的顺序排成一列,处于 _____ 中间 位置的数称为这组数据的中位数(或两个数据的平均 数).一组数据中的中位数是唯一的,反映了该组数据的 集中趋势.在频率分布直方图中,中位数左边和右边的直 方图的面积_____ 相等 .
课前探究学习 课堂讲练互动 活页规范训练
1 解 (1) 利 用 平 均 数 计 算 公 式 得 x = (82×27 + 48 80×21)≈81.13(分). (2)∵男同学的中位数是75, ∴至少有14人得分不超过75分.
又∵女同学的中位数是80, ∴至少有11人得分不超过80分. ∴全班至少有25人得分低于80分(含80分). (3)男同学的平均分与中位数的差别较大,说明男同学中 两极分化现象严重,得分高的和低的相差较大.
课前探究学习
课堂讲练互动
活页规范训练
(4)数据的离散程度可以通过极差、方差或标准差来描 述.极差反映了一组数据变化的最大幅度,它对一组数据 中的极端值非常敏感,方差则反映了一组数据围绕平均数 波动的大小.为了得到以样本数据的单位表示的波动幅 度,通常用标准差——样本方差的算术平方根来描述. (5)标准差的大小不会越过极差. (6)方差、标准差、极差的取值范围:[0,+∞).当标准 差、方差为0时,样本各数据全相等,表明数据没有波动 幅度,数据没有离散性. (7)因为方差与原始数据的单位不同,且平方后可能夸大 了偏差的程度,所以虽然方差和标准差在刻画样本数据的 分散程度上是一样的,但在解决实际问题时,一般采用标 准差.