2.2用样本的数字特征估计总体的数字特征

合集下载

高中数学2.2.2 用样本的数字特征估计总体的数字特征1

高中数学2.2.2 用样本的数字特征估计总体的数字特征1

2.(1)由平均数公式得 x=
(182×27+80×21)≈81.13(分).
48
(2)因为男生的中位数是75分,所以至少有14人得分不超过75
分.
又因为女生的中位数是80分,所以至少有11人得分不超过80分.
所以全班至少有25人得分不超过80分.
(3)男生的平均分与中位数的差别较大,说明男生中两极分化现
2.2.2 用样本的数字特征估计总体的数字特征
1.正确理解样本数据标准差的意义和作用,学会计算数据的标 准差. 2.能根据实际问题的需要合理地选取样本,从样本数据中提取 基本的数字特征(如平均数、标准差),并作出合理的解释. 3.会用样本的基本数字特征估计总体的基本数字特征,形成对 数据处理过程进行初步评价的意识.
x1 x2 xn
则 x =_______n_______.
2.方差、标准差 假设样本数据是x1,x2,x3,…,xn, x 是平均数,则 (1)方差是
s2=__n1[___x1___x_2____x_2 __x__2 ______x_n__x__2_].
(2)标准差为
s=__n1_[__x_1__x__2___x_2___x_2____ __x_n___x__2 ]_.
【解题指南】1.由平均数和方差的定义直接求解.
2.先画出茎叶图,再利用平均数和方差结合的形式分析稳定性.
【自主解答】1.
s2
1 [ 21
a1
x
2
a2 x
2
a20 x
2
xx
2

1 20 0.20 4 0.19.
21
21
答案:0.19
2.(1)作出茎叶图如下:
(2)派甲参赛比较合适.理由如下:

2019-2020学年度最新高中数学新人教版必修3教案:第2章 2-2-2 用样本的数字特征估计总体的数字特征-含答案

2019-2020学年度最新高中数学新人教版必修3教案:第2章 2-2-2 用样本的数字特征估计总体的数字特征-含答案

2019-2020学年度最新高中数学新人教版必修3教案:第2章2-2-2 用样本的数字特征估计总体的数字特征-含答案1.会求样本的众数、中位数、平均数、标准差、方差.(重点)2.理解用样本的数字特征来估计总体数字特征的方法.(重点)3.会应用相关知识解决实际统计问题.(难点)[基础·初探]教材整理1众数、中位数、平均数阅读教材P72~P73的内容,完成下列问题.1.众数:在一组数据中,出现次数最多的数叫做众数.如果有两个或两个以上数据出现的最多且出现的次数相等,那么这些数据都是这组数据的众数;如果一组数据中,所有数据出现的次数都相等,那么认为这组数据没有众数.2.中位数:将一组数据按从小到大的顺序依次排列,当数据有奇数个时,处在最中间的那个数是这组数据的中位数;当数据有偶数个时,处在最中间的两个数的平均数是这组数据的中位数.3.平均数:一组数据的总和除以这组数据的个数取得的商叫做这组数据的平均数,一般记为x=1n(x1+x2+…+x n).4.三种数字特征的比较1.判断(正确的打“√”,错误的打“×”)(1)中位数一定是样本数据中的某个数.()(2)在一组样本数据中,众数一定是唯一的.()【答案】(1)×(2)×2.已知一组数据为20,30,40,50,50,60,70,80.其中平均数、中位数和众数的大小关系是()A.平均数>中位数>众数B.平均数<中位数<众数C.中位数<众数<平均数D.众数=中位数=平均数【解析】众数为50,平均数x=18(20+30+40+50+50+60+70+80)=50,中位数为12(50+50)=50,故选D.【答案】 D3.一组观察值4,3,5,6出现的次数分别为3,2,4,2,则样本平均值为( ) A .4.55 B .4.5 C .12.5 D .1.64【解析】x =4×3+3×2+5×4+6×23+2+4+2≈4.55.【答案】 A教材整理2 频率分布直方图中的众数、中位数、平均数 阅读教材P 72~P 73的内容,完成下列问题.在频率分布直方图中,众数是最高矩形中点的横坐标,中位数左边和右边的直方图的面积应该相等,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.教材整理3 标准差、方差阅读教材P 74~P 77例2上面的内容,完成下列问题. 1.标准差的计算公式标准差是样本数据到平均数的一种平均距离,一般用s 表示, s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 2.方差的计算公式 标准差的平方s 2叫做方差.s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].其中,x i (i =1,2,…,n )是样本数据,n 是样本容量,x 是样本平均数.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4. 则:(1)平均命中环数为________; (2)命中环数的标准差为________.【解析】 (1)x =7+8+7+9+5+4+9+10+7+410=7.(2)s 2=110[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,∴s=2.【答案】(1)7(2)2[小组合作型](2)这个问题中,平均数能客观地反映该工厂的工资水平吗?为什么?【精彩点拨】先结合众数、中位数、平均数的意义求出众数、中位数、平均数,再结合影响平均数的因素作答.【尝试解答】(1)由题中表格可知:众数为1 200,中位数为1 220,平均数为(2 200+1 250×6+1 220×5+1 200×10+490)÷23=1 230(元/周).(2)虽然平均数为1 230元/周,但从题中表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该厂的工资水平.1.众数、中位数、平均数都是刻画数据特征的,但任何一个样本数据改变都会引起平均数的改变,而众数、中位数不具有这个性质.所以平均数可以反映出更多的关于样本数据全体的信息,它是样本数据的重心.2.在样本中出现极端值的情况下,众数、中位数更能反映样本数据的平均水平.[再练一题]1.已知一组数据按从小到大排列为-1,0,4,x,6,15,且这组数据的中位数是5,那么数据的众数是________,平均数是________.【解析】 ∵中位数为5,∴4+x2=5,即x =6.∴该组数据的众数为6,平均数为-1+0+4+6+6+156=5.【答案】 6 5甲、乙两机床同时加工直径为100 cm 的零件,为检验质量,从中抽取6件测量数据为:甲:99 100 98 100 100 103 乙:99 100 102 99 100 100 (1)分别计算两组数据的平均数及方差;(2)根据计算说明哪台机床加工零件的质量更稳定. 【精彩点拨】【尝试解答】 (1)x 甲=16[99+100+98+100+100+103]=100, x 乙=16[99+100+102+99+100+100]=100,s2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73,s2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)由(1)知x甲=x乙,比较它们的方差,∵s2甲>s2乙,故乙机床加工零件的质量更稳定.1.在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散程度(即方差或标准差),方差大说明取值分散性大,方差小说明取值分散性小或者取值集中、稳定.2.关于统计的有关性质及规律(1)若x1,x2,…,x n的平均数为x,那么mx1+a,mx2+a,…,mx n+a的平均数是m x+a;(2)数据x1,x2,…,x n与数据x1+a,x2+a,…,x n+a的方差相等;(3)若x1,x2,…,x n的方差为s2,那么ax1,ax2,…,ax n的方差为a2s2.[再练一题]2.某校高二年级在一次数学选拔赛中,由于甲、乙两人的竞赛成绩相同,从而决定根据平时在相同条件下进行的六次测试确定出最佳人选,这六次测试的成绩数据如下:求两人比赛成绩的平均数以及方差,并且分析成绩的稳定性,从中选出一位参加数学竞赛.【解】 设甲、乙两人成绩的平均数分别为x 甲,x 乙, 则x 甲=130+16(-3+8+0+7+5+1)=133, x 乙=130+16(3-1+8+4-2+6)=133,s 2甲=16[(-6)2+52+(-3)2+42+22+(-2)2]=473, s 2乙=16[(02+(-4)2+52+12+(-5)2+32]=383. 因此,甲与乙的平均数相同,由于乙的方差较小,所以乙的成绩比甲的成绩稳定,应该选乙参加竞赛比较合适.125 121 123 125 127 129 125 128 130129 126 124 125 127 126 122 124 125 126 128 (1)填写下面的频率分布表:(2)(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数. 【精彩点拨】 将数据分组后依次填写分布表.然后画出直方图,最后根据数字特征在直方图中的求法求解.【尝试解答】 (1)(3)在[124.5,126.5)中的数据最多,取这个区间的中点值作为众数的近似值,得众数为125.5,事实上,众数的精确值为125.图中虚线对应的数据是124.5+2×58=125.75,事实上中位数为125.5.使用“组中值”求平均数:x -=121.5×0.1+123.5×0.15+125.5×0.4+127.5×0.2+129.5×0.15=125.8,事实上平均数的精确值为x -=125.75.1.利用频率分布直方图求数字特征 (1)众数是最高的矩形的底边的中点;(2)中位数左右两侧直方图的面积相等;(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.2.利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数.[再练一题]3.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图2-2-20所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:图2-2-20(1)高一参赛学生的成绩的众数、中位数;(2)高一参赛学生的平均成绩.【解】(1)由题图可知众数为65,又∵第一个小矩形的面积为0.3,∴设中位数为60+x,则0.3+x×0.04=0.5,得x=5,∴中位数为60+5=65.(2)依题意,平均成绩为:55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,∴平均成绩约为67.[探究共研型]探究【提示】一组数据的平均数、中位数都是唯一的,众数不唯一,可以有一个,也可以有多个,还可以没有.如果有两个数据出现的次数相同,并且比其他数据出现的次数都多,那么这两个数据都是这组数据的众数.探究2如何从样本的数字特征中了解数据中是否存在极端数据?【提示】中位数不受几个极端数据的影响,而平均数受每个数据的影响,“越离群”的数据,对平均数的影响越大,因此如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以了解样本数据中极端数据的信息.探究3众数、中位数有哪些应用?【提示】(1)众数只与这组数据中的部分数据有关,当一组数据中有不少数据重复出现时,众数往往更能反映问题.(2)中位数仅与数据的排列位置有关,中位数可能在所给数据中,也可能不在所给数据中.当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.探究4【提示】(1)数据的离散程度可以通过极差、方差或标准差来描述,极差反映了一组数据变化的最大幅度,它对一组数据中的极端值极为敏感,一般情况下,极差大,则数据波动性大;极差小,则数据波动性小.极差只需考虑两个极端值,便于计算,但没有考虑中间的数据,可靠性较差.(2)标准差和方差则反映了一组数据围绕平均数波动的大小,方差、标准差的运算量较大.因为方差与原始数据单位不同,且平方后可能夸大了偏差程度,所以虽然标准差与方差在体现数据离散程度上是一样的,但解决问题时一般用标准差.探究5【提示】(1)样本的数字特征具有随机性,这种随机性是由样本的随机性引起的.(2)样本的数字特征具有规律性,在很广泛的条件下,简单随机样本的数字特征(如众数、中位数、平均数和标准差等)随样本容量的增加而稳定于总体相应的数字特征(总体的数字特征是一定的,不存在随机性).某班4个小组的人数为10,10,x,8,已知该组数据的中位数与平均数相等,求这组数据的中位数.【精彩点拨】x的大小未知,可根据x的取值不同分别求中位数.【尝试解答】该组数据的平均数为14(x+28),中位数一定是其中两个数的平均数,由于x不知是多少,所以要分几种情况讨论:(1)当x≤8时,原数据按从小到大的顺序排列为x,8,10,10,其中位数为12×(10+8)=9.若14(x+28)=9,则x=8,此时中位数为9.(2)当8<x≤10时,原数据按从小到大的顺序排列为8,x,10,10,其中位数为12(x+10).若14(x+28)=12·(x+10),则x=8,而8不在8<x≤10的范围内,所以舍去.(3)当x>10时,原数据按从小到大的顺序排列为8,10,10,x,其中位数为12×(10+10)=10.若14(x +28)=10,则x =12,此时中位数为10.综上所述,这组数据的中位数为9或10.当在数据中含有未知数x ,求该组数据的中位数时,由于x 的取值不同,所以数据由小到大(或由大到小)排列的顺序不同,由于条件的变化,问题的结果有多种情况,不能用同一标准或同一种方法解决,故需分情况讨论,讨论时要做到全面合理,不重不漏.[再练一题]4.为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为____________.【解析】 设5个班级中参加的人数分别为x 1,x 2,x 3,x 4,x 5,则由题意知x 1+x 2+x 3+x 4+x 55=7,(x 1-7)2+(x 2-7)2+(x 3-7)2+(x 4-7)2+(x 5-7)2=20,五个整数的平方和为20,则必为0+1+1+9+9=20,由|x -7|=3可得x =10或x =4.由|x -7|=1可得x =8或x =6,由上可知参加的人数分别为4,6,7,8,10,故最大值为10.【答案】 101.样本101,98,102,100,99的标准差为( ) A.2B .0C.1 D.2【解析】样本平均数x=100,方差为s2=2,∴标准差s=2,故选A.【答案】 A2.甲乙两名学生六次数学测验成绩(百分制)如图2-2-21所示.图2-2-21①甲同学成绩的中位数大于乙同学成绩的中位数;②甲同学的平均分比乙同学高;③甲同学的平均分比乙同学低;④甲同学成绩的方差小于乙同学成绩的方差.上面说法正确的是()A.③④B.①②④C.②④D.①③【解析】甲的中位数81,乙的中位数87.5,故①错,排除B、D;甲的平均分x=16(76+72+80+82+86+90)=81,乙的平均分x′=16(69+78+87+88+92+96)=85,故②错,③对,排除C,故选A.【答案】 A3.甲、乙、丙、丁四名射手在选拔赛中所得的平均环数x及其方差s2如下表所示,则选送决赛的最佳人选应是()【解析】∵x乙=x丙>x甲=x丁,且s2甲=s2乙<s2丙<s2丁,∴应选择乙进入决赛.【答案】 B4.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图2-2-22,则图2-2-22(1)这20名工人中一天生产该产品数量在[55,75)的人数是________.(2)这20名工人中一天生产该产品数量的中位数为________.(3)这20名工人中一天生产该产品数量的平均数为________.【解析】(1)(0.040×10+0.025×10)×20=13.(2)设中位数为x,则0.2+(x-55)×0.04=0.5,x=62.5.(3)0.2×50+0.4×60+0.25×70+0.1×80+0.05×90=64.【答案】(1)13(2)62.5(3)645.甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图2-2-23所示:图2-2-23(1)填写下表:①从平均数和方差结合分析偏离程度;②从平均数和中位数结合分析谁的成绩好些;③从平均数和命中9环以上的次数相结合看谁的成绩好些;④从折线图上两人射击命中环数及走势分析谁更有潜力.【解】(1)乙的射靶环数依次为2,4,6,8,7,7,8,9,9,10.所以x乙=110(2+4+6+8+7+7+8+9+9+10)=7;乙的射靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是7+82=7.5;甲的射靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示:(2)①甲、乙的平均数相同,均为7,但s甲乙小,而乙偏离平均数的程度大.②甲、乙的平均水平相同,而乙的中位数比甲大,说明乙射靶成绩比甲好.③甲、乙的平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的射靶成绩比甲好.④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力.学业分层测评(十三)用样本的数字特征估计总体的数字特征(建议用时:45分钟)[学业达标]一、选择题1.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图2-2-24所示,则( )图2-2-24A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差【解析】 由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 对;甲、乙的成绩的极差均为4,D 错.【答案】 C2.若样本1+x 1,1+x 2,1+x 3,…,1+x n 的平均数是10,方差为2,则对于样本2+x 1,2+x 2,…,2+x n ,下列结论正确的是( )A .平均数是10,方差为2B .平均数是11,方差为3C .平均数是11,方差为2D .平均数是10,方差为3【解析】 若x 1,x 2,…,x n 的平均数为x ,方差为s ,那么x 1+a ,x 2+a ,…,x n +a 的平均数为x +a ,方差为s .【答案】 C3.如图2-2-25是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,甲、乙两人这几场比赛得分的平均数分别为x 甲,x 乙;标准差分别是s 甲,s 乙,则有( )图2-2-25A.x 甲>x 乙,s 甲>s 乙B.x 甲>x 乙,s 甲<s 乙C.x 甲<x 乙,s 甲>s 乙D.x 甲<x 乙,s 甲<s 乙【解析】 观察茎叶图可大致比较出平均数与标准差的大小关系,或者通过公式计算比较.【答案】 C4.已知一组数据x 1,x 2,x 3,x 4,x 5的平均数是x =2,方差是13,那么另一组数据3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数和方差分别为( )A .2,13 B .2,1 C .4,13D .4,3【解析】 平均数为x ′=3x -2=3×2-2=4,方差为s ′2=9s 2=9×13=3.【答案】 D5.为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图,如图2-2-26所示.由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a ,视力在4.6到5.0之间的学生数为b ,则a ,b 的值分别为( )图2-2-26A .0.27,78B .0.27,83C .2.7,78D .2.7,83【解析】 由题意,4.5到4.6之间的频率为0.09,4.6到4.7之间的频率为0.27,后6组的频数成等差数列,设公差为d ,则6×0.27+15d =1-0.01-0.03-0.09,∴d =-0.05.∴b =(0.27×4+6d )×100=78,a =0.27. 【答案】 A 二、填空题6.一个样本数据按从小到大的顺序排列为:13,14,19,x,23,27,28,31,中位数为22,则x =________.【解析】 由题意知x +232=22,则x =21. 【答案】 217.甲、乙两位同学某学科的连续五次考试成绩用茎叶图表示如图2-2-27所示,则平均分数较高的是________,成绩较为稳定的是________.图2-2-27【解析】x甲=70,x乙=68,s 2甲=15×(22+12+12+22)=2,s 2乙=15×(52+12+12+32)=7.2.【答案】甲甲8.已知样本9,10,11,x,y的平均数是10,标准差为2,则xy=________.【解析】由平均数得9+10+11+x+y=50,∴x+y=20.又由(9-10)2+(10-10)2+(11-10)2+(x-10)2+(y-10)2=(2)2×5=10,得x2+y2-20(x+y)=-192,(x+y)2-2xy-20(x+y)=-192,∴xy=96.【答案】96三、解答题9.从高三抽出50名学生参加数学竞赛,由成绩得到如图2-2-28的频率分布直方图.图2-2-28由于一些数据丢失,试利用频率分布直方图求:(1)这50名学生成绩的众数与中位数;(2)这50名学生的平均成绩.【解】(1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形的底边中点的横坐标即为所求,所以众数应为75.由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.因此在频率分布直方图中将所有小矩形的面积一分为二的垂直于横轴的直线与横轴交点的横坐标所对应的成绩即为所求.∵0.004×10+0.006×10+0.02×10=0.04+0.06+0.2=0.3,∴前三个小矩形面积的和为0.3.而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5,∴中位数应约位于第四个小矩形内.设其底边为x ,高为0.03,∴令0.03x =0.2得x ≈6.7, 故中位数应约为70+6.7=76.7.(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点的横坐标乘以每个小矩形的面积求和即可.∴平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.021×10)+95×(0.016×10)=73.65.10.对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:(1)(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、极差、方差,并判断选谁参加比赛比较合适?【解】 (1)画茎叶图如下:中间数为数据的十位数.从茎叶图上看,甲、乙的得分情况都是分布均匀的,只是乙更好一些.乙发挥比较稳定,总体情况比甲好.(2)x 甲=27+38+30+37+35+316=33.x 乙=33+29+38+34+28+366=33.s 2甲=16[(27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2]≈15.67.s 2乙=16[(33-33)2+(29-33)2+(38-33)2+(34-33)2+(28-33)2+(36-33)2]≈12.67.甲的极差为11,乙的极差为10.综合比较以上数据可知,选乙参加比赛较合适.[能力提升]1.有一笔统计资料,共有11个数据如下(不完全以大小排列):2,4,4,5,5,6,7,8,9,11,x ,已知这组数据的平均数为6,则这组数据的方差为( )A .6 B.6 C .66D .6.5【解析】 ∵x =111(2+4+4+5+5+6+7+8+9+11+x )=111(61+x )=6,∴x =5.方差为:s 2=42+22+22+12+12+02+12+22+32+52+1211=6611=6.【答案】 A2.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图2-2-29中以x 表示:89⎪⎪⎪7 74 0 1 0 x 9 1图2-2-29则7个剩余分数的方差为( )A.1169B.367C .36D.677【解析】 根据茎叶图,去掉1个最低分87,1个最高分99, 则17[87+94+90+91+90+(90+x )+91]=91, ∴x =4.∴s 2=17[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=367.【答案】 B3.若40个数据的平方和是56,平均数是22,则这组数据的方差是________,标准差是________.【解析】 设这40个数据为x i (i =1,2,…,40),平均数为x . 则s 2=140×[(x 1-x )2+(x 2-x )2+…+(x 40-x )2] =140[x 21+x 22+…+x 240+40x 2-2x (x 1+x 2+…+x 40)] =140⎣⎢⎡⎦⎥⎤56+40×⎝ ⎛⎭⎪⎫222-2×22×40×22=140×⎝ ⎛⎭⎪⎫56-40×12=0.9. ∴s =0.9=910=31010. 【答案】 0.9310104.某地区100位居民的人均月用水量(单位:t)的分组及各组的频数如下: [0,0.5),4;[0.5,1),8;[1,1.5),15;[1.5,2),22;[2,2.5),25;[2.5,3),14;[3,3.5),6;[3.5,4),4;[4,4.5),2.(1)列出样本的频率分布表;(2)画出频率分布直方图,并根据直方图估计这组数据的平均数、中位数、众数;(3)当地政府制定了人均月用水量为3t的标准,若超出标准加倍收费,当地政府说,85%以上的居民不超过这个标准,这个解释对吗?为什么?【解】(1)频率分布表(2)频率分布直方图如图:众数:2.25,中位数:2.02,平均数:2.02.(3)人均月用水量在3t以上的居民所占的比例为6%+4%+2%=12%,即大约有12%的居民月用水量在3t以上,88%的居民月用水量在3t以下,因此政府的解释是正确的.。

2.2.2 用样本的数字特征估计总体的数字特征(学案)王明

2.2.2 用样本的数字特征估计总体的数字特征(学案)王明

§2.2.2 用样本的数字特征估计总体的数字特征1. 正确理解样本数据标准差的意义和作用,学会计算数据的标准差2. 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释;3. 会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程进行初步评价的意识。

教学重点用样本平均数和标准差估计总体的平均数与标准差。

教学难点能应用相关知识解决简单的实际问题。

1、知识回顾:作频率分布直方图分几个步骤?各步骤需要注意哪些问题?2、众数、中位数、平均数的概念众数:____________________________________________________________________中位数:___________________________________________________________________平均数:____________________________________________________________________3、求下列各组数据的众数、中位数、平均数(1)1 ,2,3,3,3,4,6,7,7,8,8,8(2)1 ,2,3,3,3,4,6,7,8,9,9二、新课导学自学教材71页—73页,完成下例内容新知一:众数、中位数、平均数1、众数、中位数、平均数与频率分布直方图的关系:众数在样本数据的频率分布直方图中,就是______________________________________中位数左边和右边的直方图的______ __应该相等,由此可估计中位数的值。

平均数是直方图的____ _______.2、完成课本P72页思考3、众数、中位数、平均数的优缺点分别是什么?练习一、(1)课本74页,练习(2)课本82页,习题2.2 第5题自学教材74页—78页,完成下例内容新知二:标准差1、.标准差、方差标准差 s=_________________________________________________________________ 方差s2=_________________________________________________________________ 2思考:标准差的大小和数据的离散程度有什么关系?3思考:标准差的取值范围是什么?标准差为0的样本数据有什么特点?典型例题学习课本76—77页例1 、例2练习二、(1)课本79页练习1、2、3(2)课本习题2.2 第4、6、7题三、课堂小结1、在频率分布直方图中,如何求出众数、中位数、平均数?2、标准差的公式;标准差的大小和数据的离散程度有什么关系?。

2.2.2 用样本的数字特征估计总体的数字特征(二) 标准差

2.2.2  用样本的数字特征估计总体的数字特征(二)  标准差

2.2.2 用样本的数字特征估计总体的数字特征(二) 标准差 ●学习目标1、能从样本数据中求出标准差,并做出合理解释;2、进一步体会用样本估计总体的思想,会用样本的标准差估计总体的特征;3、注意对样本标准差的随机性的体会,并能够正确利用标准差解决一些简单的实际问题. ●学习重点从样本数据中求出标准差并做出合理解释;样本估计总体的思想. ●学习难点体会统计的作用和样本标准差的随机性,并利用标准差解决一些简单的实际问题. ●学习过程 一.温故知新1、众数、中位数和平均数都是描述一组数据_________的量.2、两名射击运动员在一次射击测试中各射靶10次,每次命中的环数如下: 甲:7 8 7 9 5 4 9 10 7 4 乙:9 5 7 8 7 6 8 6 7 7 分别求出这两名运动员射击成绩的众数、中位数和平均数,对这次射击情况应如何评价?二.走进课堂1、极差:反映一组数据的变化的___________,它对一组数中的______非常敏感,由此可以得到一种“______________,______________”的统计策略.2、标准差:考察样本数据的______________最常用的统计量,是样本数据到_______的一种____________,一般用s 表示.(1)标准差的表达式:______________________s =;变形得:s = (2)标准差的大小,受样本中每个数据的影响,如果数据间变异大,则标准差也大,反之则小.因此,标准差越大,数据的离散程度_____,标准差越小,数据的离散程度_____; (3)标准差的取值范围是:______s ∈;(4)标准差常被理解为稳定性,标准差的单位与原数值的单位相同. 如何对上面甲、乙两名射击运动员做出评价?3、方差:即标准差的平方2s .(1)方差的表达式:2________________________________s =;(2)方差也是反映数据离散程度的特征数字,它的单位是原数值的单位的平方. 【夯实基础】(1)甲、乙两支女子曲棍球队在去年的国际联赛中,甲队平均每场进球数为3.2,全年比赛进球个数的标准差为3;乙队平均每场进球数为1.8,全年比赛进球个数的标准差为0.3,下列说法正确的有( )①甲队的技术比乙队好; ②乙队发挥比甲队稳定 ③乙队几乎每场都进球; ④甲队的表现时好时坏A.1个 B.2个 C.3个 D.4个 (2)某班有50名学生,某次数学考试的成绩经计算得到的平均分数是70分,标准差是s ,后来发现记录有误,某甲得70分却记为40分,某乙50分误记为80分,更正后重新计算得标准差为1s ,则s 与1s 之间的大小关系是( )A.s =1s B.s <1s C.s >1s D.不能确定 (3)已知一个样本为:x ,1,y ,5,其中x ,y 是方程组222,10x y x y +=⎧⎨+=⎩的解,则这个样本的标准差是( )A.2 C.5(4)一组数据的方差是2s ,将这组数据中的每一个数都乘以2,得到一组新数据,其方差是( ) A.212s B.22s C.24s D.2s(5)一组数据中的每一个数都减去80,得一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是( )A.81.2,4.4 B.78.8,4.4 C.81.2,84.4 D.78.8,75.6 (6)五个数1,2,3,4,a 的平均数是3,,则a =____,这五个数的标准差是_____.(7)若1a ,2a ,…,20a ,这20个数据的平均数为x ,方差为0.20,则数据1a ,2a ,…,20a ,x 这21个数据的方差约为__________(保留2位有效 ).4、典例精析【例1】从一批棉花中抽取9根棉花的纤维,长度如下:(单位:mm ) 82,202,352,321,25,293,86,206,115. 求样本的平均数、样本的方差和样本的标准差.【例2】现有A 、B 两个班级,每个班级有45名学生参加一次测验,每名参加者可获得0,1B 班的测试结果如右图:(1)你认为哪个班级的成绩比较稳定?(2)若两班共有60人及格,则参加者最少获得 多少分才可能及格?5、课堂小结:(1)众数、中位数和平均数都是描述一组数据集中趋势的特征数;标准差、方差都是用来描述一组数据波动情况的特征数,标准差更具无偏性.(2)当两个样本的平均数相等或相差无几时,就要用标准差来反映样本数据的离散程度. 作业:。

2.2.2用样本的数字特征估计总体的数字特征

2.2.2用样本的数字特征估计总体的数字特征

举例 1. 甲在一次射击比赛中的得分如下: ( 单 位:环).7,8,6,8,6,5,9,10,7,5,则他命中的平均 数是_____. 7.1 2. 某次数学试卷得分抽样中得到:90分 的有3个人,80分的有10人,70分的有5人,60 77分 分的有2人,则这次抽样的平均分为______.
思考
2.2.2用样本的数字特征 估计总体的数字特征
创设意境
在一次射击比赛中,甲、乙两名运动员各射击
10次,命中环数如下﹕ 甲运动员﹕7,8,6,8,6,5,8,10,7,4; 乙运动员﹕9,5,7,8,7,6,8,6,7,7. 观察上述样本数据,你能判断哪个运动员发挥
的更稳定些吗?为了从整体上更好地把握总体的规
如何从频率分布直方图中估计中位数?
练习
应该采用平均数来表示每一个国家项目的平 均金额,因为它能反映所有项目的信息.但平均数 会受到极端数据2200万元的影响,所以大多数项 目投资金额都和平均数相差比较大.
标准差
有两位射击运动员在一次射击测试中各射 靶十次,每次命中的环数如下:
如果你是教练,你应当如何对这次射击情况作出 评价?如果这是一次选拔性考核,你应当如何作出选 择?
律,我们要通过样本的数据对总体的数字特征进行 研究——用样本的数字特征估计总体的数字特征.
1. 众数
在一组数据中,出现次数最多
的数据叫做这一组数据的众数. 2. 中位数 将一组数据按大小依次排列,把 处在最中间位置的一个数据(或两个数据的 平均数)叫做这组数据的中位数. 3. 平均数 (1) x = (x1+x2+……+xn) /n (2) x = x’ +a (3) x = (x1f1+x2f2+……xkfk)/n

(完整版)用样本的数字特征估计总体的数字特征

(完整版)用样本的数字特征估计总体的数字特征

2.2.2用样本的数字特征估计总体的数字特征 (两课时)零号作业一、众数、中位数、平均数1、众数:(1)定义:一组数据中出现次数最多的数称为这组数据的众数.(2)特征:一组数据中的众数可能不止一个,也可能没有,反映了该组数据的集中趋势 [破疑点] 众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使其无法客观地反映总体特征.(3)在直方图中为最高矩形下端中点的横坐标 2、中位数:(1)定义:一组数据按从小到大的顺序排成一列,处于中间位置的数称为这组数据的中位数. (2)特征:一组数据中的中位数是唯一的,反映了该组数据的集中趋势.在频率分布直方图中,中位数左边和右边的直方图的面积相等.[破疑点] 中位数不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点.(3) 直方图面积平分线与横轴交点的横坐标.左右两边面积各占一半3、平均数:(1)定义:一组数据的和与这组数据的个数的商.数据x 1,x 2,…,x n 的平均数为xn=x 1+x 2+…+x nn(2)特征:平均数对数据有“取齐”的作用,代表该组数据的平均水平.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中极端值的影响较大,使平均数在估计总体时可靠性降低.(3) 直方图中每个小矩形的面积与小矩形底边中点的横坐标的乘积之和. 二、标准差、方差1、标准差(1)定义:标准差是样本数据到平均数的一种平均距离,一般用s 表示,通常用以下公式来计算s =1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]可以用计算器或计算机计算标准差.(2)特征:标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较_ 小.2.方差(1)定义:标准差的平方,即s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2](2)特征:与标准差的作用相同,描述一组数据围绕平均数波动程度的大小. (3)取值范围:[0,+∞)3、数据组x 1,x 2,…,x n 的平均数为x ,方差为s 2,标准差为s ,则数据组ax 1+b ,ax 2+b ,…,ax n +b (a ,b 为常数)的平均数为a x +b ,方差为a 2s 2,标准差为4、规律总结(1)用样本的数字特征估计总体的数字特征,是指用样本的众数、中位数、平均数和标准差等统计数据,估计总体相应的统计数据. 样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息. 平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度.用样本的数字特征估计总体的数字特征,是指用样本的众数、中位数、平均数和标准差等统计数据,估计总体相应的统计数据(2)平均数对数据有“取齐”的作用,代表一组数据的平均水平.标准差描述一组数据围绕平均数波动的幅度.在实际应用中,我们常综合样本的多个统计数据,对总体进行估计,为解决问题作出决策.(3)标准差越大离散程度越大,数据较分散;标准差越小离散程度越小,数据较集中在平均数周围.列出一组样本数据的频率分布表步骤说明:1、对同一个总体,可以抽取不同的样本,相应的平均数与标准差都会发生改变.如果样本的代表性差,则对总体所作的估计就会产生偏差;如果样本没有代表性,则对总体作出错误估计的可能性就非常大,由此可见抽样方法的重要性.2.在抽样过程中,抽取的样本是具有随机性的,如从一个包含6个个体的总体中抽取一个容量为3的样本就有20中可能抽样,因此样本的数字特征也有随机性.用样本的数字特征估计总体的数字特征,是一种统计思想,没有惟一答案.3.在实际应用中,调查统计是一个探究性学习过程,需要做一系列工作,我们可以把学到的知识应用到自主研究性课题中去.一号作业11、众数(1)定义:一组数据中出现次数______的数称为这组数据的众数.(2)特征:一组数据中的众数可能______一个,也可能没有,反映了该组数据的____________.在直方图中为最高矩形下端中点的____________最多不止集中趋势横坐标2.中位数(1)定义:一组数据按从小到大的顺序排成一列,处于______位置的数称为这组数据的中位数.(2)特征:一组数据中的中位数是______的,反映了该组数据的______________.在频率分布直方图中,中位数左边和右边的直方图的面积______..中间唯一集中趋势相等3.平均数(1)定义:一组数据的和与这组数据的个数的商.数据x1,x2,…,x n的平均数为x n=_________________.(2)特征:平均数对数据有“取齐”的作用,代表该组数据的_____________.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的______,但平均数受数据中_________的影响较大,使平均数在估计总体时可靠性降低.直方图中每个小矩形的面积与小矩形底边中点的横坐标的. ______x1+x2+…+x nn平均水平信息极端值乘积之和4.标准差(1)定义:标准差是样本数据到平均数的一种平均距离,一般用s表示,通常用以下公式来计算s=__________________________.可以用计算器或计算机计算标准差.(2)特征:标准差描述一组数据围绕______波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较______;标准差较小,数据的离散程度较______.1n[(x1-x)2+(x2-x)2+…+(x n-x)2]平均数大小5.方差(1)定义:标准差的平方,即s2=________________________________________.(2)特征:与____________的作用相同,描述一组数据围绕平均数波动程度的大小.(3)取值范围:___________.1n[(x1-x)2+(x2-x)2+…+(x n-x)2] 标准差[0,+∞)数据组x1,x2,…,x n的平均数为x,方差为s2,标准差为s,则数据组ax1+b,ax2+b,…,ax n+b(a,b为常数)的平均数为a x+b,方差为a2s2,标准差为as.典例讲解中位数、众数、平均数的应用例1据报道,某公司的33名职工的月工资(以元为单位)如下:(1)求该公司的职工月工资的平均数、中位数、众数;(2)假设副董事长的工资从5 000元提升到20 000元,董事长的工资从5 500元提升到30 000元,那么新的平均数、中位数、众数又是什么?(精确到1元)(3)你认为哪个统计量更能反映这个公司职工的工资水平?结合此问题谈一谈你的看法.[解析](1)平均数是x=1 500+4 000+3 500+2 000×2+1 500+1 000×5+500×3+0×2033≈1 500+591=2 091(元).中位数是1 500元,众数是1 500元.(2)平均数是x′=1 500+28 500+18 500+2 000×2+1 500+1 000×5+500×3+0×2033≈1 500+1 788=3 288(元).中位数是1 500元,众数是1 500元.(3)在这个问题中,中位数或众数均能反映该公司职工的工资水平.因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数偏差较大,所以平均数不能反映这个公司职工的工资水平.练习1:某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):甲群13,13,14,15,15,15,15,16,17,17;乙群54,3,4,4,5,5,6,6,6,57.(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好反映甲群市民的年龄特征?(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好反映乙群市民的年龄特征?[答案](1)甲群市民年龄的平均数为13+13+14+15+15+15+15+16+17+1710=15(岁),中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.(2)乙群市民年龄的平均数为54+3+4+4+5+5+6+6+6+5710=15(岁),中位数为5岁,众数为6岁.由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.例2:(1)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差(2)某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.①求这次测试数学成绩的众数.②求这次测试数学成绩的中位数.③求这次测试数学成绩的平均分.[解析](1)x甲=15(4+5+6+7+8)=6,x乙=15(5×3+6+9)=6,甲的中位数是6,乙的中位数是5.甲的成绩的方差为15(22×2+12×2)=2,乙的成绩的方差为15(12×3+32×1)=2.4.甲的极差是4,乙的极差是4.所以A,B,D错误,C正确.(2)①由图知众数为70+802=75.②由图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x-70),所以x≈73.3.③由图知这次数学成绩的平均分为:40+502×0.005×10+50+602×0.015×10+60+702×0.02×10+70+802×0.03×10+80+902×0.025×10+90+1002×0.005×10=72.[答案](1)C (2)见解析练习1:参加市数学调研抽测的某校高三学生成绩分布的茎叶图1和频率分布直方图2均受到不同程度的破坏,但可见部分信息如下,据此解答如下问题:求参加数学抽测的人数n,抽测成绩的中位数及分数分布在[80,90),[90,100]内的人数.[答案]分数在[50,60)内的频率为2,由频率分布直方图可以看出,分数在[90,100]内的同样有2人.由2n=10×0.008,得n=25.由茎叶图可知抽测成绩的中位数为73.∴分数在[80,90)之间的人数为25-(2+7+10+2)=4.参加数学竞赛人数n=25,中位数为73,分数在[80,90),[90,100]内的人数分一号作业21.对于数据3,3,2,3,6,3,10,3,6,3,2.①这组数据的众数是3;②这组数据的众数与中位数的数值都不相等;③这组数据的中位数与平均数的数值相等;④这组数据的平均数与众数的值相等.其中正确的结论的个数() A.1B.2 C.3 D.42、为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如下图所示,假设得分值的中位数为m e,众数为m O,平均值为x,则()A.m e=m O=x B.m e=m O<x C.m e<m O<x D.m O<m e<x3、某市要对两千多名出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在[20,45)岁之间,根据调查结果得出司机的年龄情况残缺的频率分布直方图如图所示,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数大约是() A.31,6岁B.32.6岁C.33.6岁D.36.6岁4、阶段考试以后,班长算出了全班40个人数学成绩的平均分为M,如果把M当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均分为N,那么M N为________.1、A 2 D 3、C 4、 15、为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4服用B药的20位患者日平均增加的睡眠时间:3.2 1.7 1.90.80.9 2.4 1.2 2.6 1.3 1.4 1.60.5 1.80.6 2.1 1.1 2.5 1.2 2.70.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据绘制茎叶图,从茎叶图看,哪种药的疗效更好?[解析](1)设A药观测数据的平均数为x,B药观测数据的平均数为y.由观测结果可得x=120×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,y=120×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得x>y,因此可看出A药的疗效更好.(2)由观测结果可绘制如下茎叶图:从以上茎叶图可以看出,A药疗效的试验结果有710的叶集中在茎2,3上,而B药疗效的试验结果有710的叶集中在茎0,1上,由此可看出A药的疗效更好.标准差、方差的应用例3、从甲、乙两种玉米的苗中各抽10株,分别测它们的株高如下:(单位:cm)甲:25414037221419392142乙:27164427441640401640问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?[解析]看哪种玉米的苗长得高,只要比较甲、乙两种玉米的苗的均高即可;要比较哪种玉米的苗长得齐,只要看两种玉米的苗高的方差即可,因为方差是体现一组数据波动大小的特征数.(1)x甲=110(25+41+40+37+22+14+19+39+21+42)=110×300=30(cm),x乙=110(27+16+44+27+44+16+40+40+16+40)=110×310=31(cm).所以x甲<x乙.(2)s2甲=110[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=110(25+121+100+49+64+256+121+81+81+144)=110×1042=104.2(cm2),s2乙=110[(2×272+3×162+3×402+2×442)-10×312]=110×1288=128.8(cm2).所以s2甲<s2乙.[答案](1)乙种玉米的苗长得高,(2)甲种玉米的苗长得齐.练习1:甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表:s1,s2,s3分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有() A.s3>s1>s2B.s2>s1>s3C.s1>s2>s3D.s2>s3>s1[答案] B练习2:一次数学知识竞赛中,两组学生成绩如下表:已经算得两个组的平均分都是80分,请根据你所学过的统计知识,进一步判断这两个组这次竞赛中成绩谁优谁次,并说明理由.[答案](1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数比较看,甲组成绩好些.(2)s2甲=12+5+10+13+14+6×[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=150×(2×900+5×400+10×100+13×0+14×100+6×400)=172.s2乙=150×(4×900+4×400+16×100+2×0+12×100+12×400)=256.因为s2甲<s2乙,所以甲组成绩较乙组成绩稳定.(3)甲、乙两组成绩的中位数、平均数都是80分,其中甲组成绩在80分以上(含80分)的有33人,乙组成绩在80分以上(含80分)的有26人,从这一角度看,甲组成绩总体较好.(4)从成绩统计表看,甲组成绩大于或等于90分的人数为20人,乙组成绩大于或等于90分的人数为24人,所以乙组成绩在高分阶段的人数多,同时,乙组得满分的比甲组得满分的多6人,从这一角度看,乙组成绩较好.一号作业31. 若样本数据x 1,x 2,……,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( )A .8B .15C .16D .322.为了稳定市场,确保农民增收,某农产品7个月份的每月市场收购价格与其前三个月的市场收购价格有关,并使其与前三个月的市场收购价格之差的平方和最小,下表列出的是该产品今年前6个月的市场收购价格:则前7A.757 B.767 C .11D.7873. 某班级有50名学生,其中有30名男生和20名女生.随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是( )A .这种抽样方法是一种分层抽样B .这种抽样方法是一种系统抽样C .这五名男生成绩的方差大于这五名女生成绩的方差D .该班男生成绩的平均数小于该班女生成绩的平均数4.由正整数组成的一组数据x 1,x 2,x 3,x 4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)1、C2、B3、C4、1,1,3,3。

2.2.2 用样本的数字特征估计总体的数字特征009

2.2.2 用样本的数字特征估计总体的数字特征009

2.2.2 用样本的数字特征估计总体的数字特征(必修三数学009)制作人:李媛 备课组长签字:一、学习目标:1、能从样本数据中提取基本的数字特征(如平均数、众数、中位数、方差、标准差),并做出合理的解释;2、正确理解样本数据标准差的意义和作用,学会计算数据的标准差.二、情景引入例:在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下甲运动员7,8,6,8,6,5,8,10,7,4;乙运动员9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?如果你是教练,选哪位选手去参加正式比赛?三、新知学习 样本的数字特征:1、平均数:nx x x x n+++= 21 2、方差:n x x x x x x s n 222212)()()(-++-+-= 3、标准差:n x x x x x x s s n222212)()()(-++-+-== 说明:方差与标准差描述了数据对平均数的离散程度,即稳定性。

方差与标准差越小,表明数据的波动幅度越小,越稳定。

四、典型例题例1、甲、乙两名学生,六次数学测验成绩(百分制)如图所示①甲同学成绩的中位数大于乙同学成绩的中位数;②甲同学的平均分比乙同学高; ③甲同学的平均分比乙同学低;④甲同学成绩的方差小于乙同学成绩的方差。

上面说法中正确的是 。

甲 乙 6 7 8 9 8 7 8 6 2 0 6 2 0 9 2 6变式:甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t/hm 2): 品种 第1年 第2年 第3年 第4年 第5年甲 9.8 9.9 10.1 10 10.2乙 9.4 10.3 10.8 9.7 9.8其中产量比较稳定的小麦品种是 。

五、巩固练习1、数据5,7,7,8,10,11的标准差为 .2、甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表: 甲的成绩 乙的成绩 丙的成绩环数 7 8 9 10 环数 7 8 9 10 环数 7 8 9 10 频数 5 5 5 5 频数 6 4 4 6 频数 4 6 6 4 123s s s ,, 分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有( ) A.312s s s >> B.213s s s >> C.123s s s >> D.231s s s >>3、某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么由 此求出的平均数与实际平均数的差是( )A .3.5B .3-C .3D .5.0-4、已知样本9,10,11,,x y 的平均数是10,标准差是2,则xy =5、如果数据n x x x ,,,21 的平均数为x ,方差为2s ,则53,,53,5321+++n x x x 的平均值和方差分别为( ) (A )x 和2s (B )53+x 和29s (C )53+x 和2s (D )53+x 和253092++s s六、小结七、课后作业全品测评卷P29,1~9,11;(10、12选作)。

2.2.2 用样本的数字特征估计总体的数字特征标准差

2.2.2 用样本的数字特征估计总体的数字特征标准差
2.2.2 用样本的数字特征估计 总体的数字特征
标准差
平均数向我们提供了样本数据的重要信息,但是 平均数向我们提供了样本数据的重要信息 但是 平均有时也会使我们作出对总体的片面判断. 平均有时也会使我们作出对总体的片面判断.因 为这个平均数掩盖了一些极端的情况, 为这个平均数掩盖了一些极端的情况,而这些极 端情况显然是不能忽的.因此, 端情况显然是不能忽的.因此,只有平均数还难 以概括样本数据的实际状态. 以概括样本数据的实际状态. 如:有两位射击运动员在一次射击测试中各 射靶10次 每次命中的环数如下: 射靶 次,每次命中的环数如下:
考察样本数据的分散程度的大小, 考察样本数据的分散程度的大小,最常用的统计量是 标准差. 标准差. 标准差是样本平均数的一种平均距离,一般用s表示 表示. 标准差是样本平均数的一种平均距离,一般用 表示. 所谓“平均距离” 其含义可作如下理解: 所谓“平均距离”,其含义可作如下理解: 假设样本数据是 x1 , x 2 ,⋅ ⋅ ⋅, x n , x 表示这组数据的平均 的距离是: 数,则 x i 到 x 的距离是: 则 的平均距离是: 于是样本数据 x1 , x 2 ,⋅ ⋅ ⋅, x n 到 x 的平均距离是:
甲 25.46, 25.32, 25.45, 25.39, 25.36 25.34, 25.42, 25.45, 25.38, 25.42 25.39, 25.43, 25.39, 25.40, 25.44 乙 25.40, 25.42, 25.35, 25.41, 25.39 25.40, 25.43, 25.44, 25.48, 25.48 25.47, 25.49, 25.49, 25.36, 25.34 25.33, 25.43, 25.43, 25.32, 25.47 25.31, 25.32, 25.32, 25.32, 25.48
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
知识探究(一) :众数、中位数和平均数
思考 4:因此估计总体的中位数是什么?
x , 则 设 中 位 数 为 0.04 0.08 0.15 0.22 ( x 2) 0.5 0.5
求出 x 2.02
2.2 用样本估计总体
第三课时
问题提出
1. 对一个未知总体, 我们常用样本的频率分布估 计总体的分布,其中表示样本数据的频率分布的 基本方法有哪些?
频率分布直方图、频率分布表、 频率分布折线图、茎叶图
问题提出
我们初中时学习众数、中位 数、平均数等数字特征.我们共同 回忆一下?什么是众数、中位数、 平均数?
知识探究(一) :众数、中位数和平均数
思考 4:在城市居民月均用水量样本数据的频 率分布直方图中, 从左至右各个小矩形的面积 分别是 0.04,0.08,0.15,0.22,0.25, 0.14,0.06,0.04,0.02. 由此估计总体的中位数是什么? 频率
组距 0.5 0.4 0.3 0.2 0.1
平均数大于(或小于)中位数,说明样 本数据中存在许多较大 (或较小) 的极端值.
知识探究(一) :众数、中位数和平均数
思考 8 (2) 样本数据的平均数大于 (或小于) 中位数说明什么问题?
平均数大于(或小于)中位数,说明样 本数据中存在许多较大 (或较小) 的极端值.
思考 8 (3)你怎样理解“我们单位的收入水 平比别的单位高”这句话的含义?
知识探究(一) :众数、中位数和平均数
思考 8 (2) 样本数据的平均数大于 (或小于) 中位数说明什么问题?
平均数大于(或小于)中位数,说明样 本数据中存在许多较大 (或较小) 的极端值.
思考 8 (3)你怎样理解“我们单位的收入水 平比别的单位高”这句话的含义?
这句话具有模糊性甚至蒙骗性,其中收 入水平是员工工资的某个中心点,它可以是 众数、中位数或平均数.
0.25×0.04+0.75×0.08+1.25×0.15 +1.75×0.22+2.25×0.25+2.75×0.14 +3.25× 0.06+3.75×0.04+4.25×0.02 =2.02(t). 平均数是 2.02.
知识探究(一) :众数、中位数和平均数
思考 7:从居民月均用水量样本数据可知,该 样本的众数是 2.3,中位数是 2.0,平均数是 1.973,这与我们从样本频率分布直方图得出 的结论有偏差,你能解释一下原因吗?
问题提出
答案:(1)
众数是:3和8 中位数是:5 平均数是:5 (2) 众数是:3 中位数是:4 平均数是:5
知识探究(一) :众数、中位数和平均数
在上一节抽样调查的100位居民的 月均用水量的数据中,我们如何得 知这一组样本数据的众数、中位数 和平均数 ? 众 数=2.3(t)、中位数=2.0(t)、 平均数=1.973(t)
频率 组距 0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
知识探究(一) :众数、中位数和平均数
思考 2:由此估计总体的众数是什么?
频率 组距 0.5 0.4 0.3 0.2 0.1
O
取最高矩形下端 中点的横坐标 2.25 作为众数.
0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
• 因为在频率分布直方图中,各小长方形的 面积表示相应各组的频率,也显示出样本 数据落在各小组的比例的大小,所以从图 中可以看到,在区间[2,2.5)的小长方形 的面积最大,即这组的频率是最大的,也 就是说月均用水量在区间[2,2.5)内的居 民最多,即众数就是在区间[2,2.5)内. 众 数在样本数据的频率分布直方图中,就是 最高矩形的中点的横坐标.
如:样本数据收集有个别差错不影响中位 数;大学毕业生凭工资中位数找单位可能收 入较低.
知识探究(一) :众数、中位数和平均数
思考 8 (2) 样本数据的平均数大于 (或小于) 中位数说明什么问题?
知识探究(一) :众数、中位数和平均数
思考 8 (2) 样本数据的平均数大于 (或小于) 中位数说明什么问题?
月均用水量/t
知识探究(一) :众数、中位数和平均数
思考 5:平均数是频率分布直方图的“重心” , 从直方图估计总体在各组数据内的平均数分 别为多少? 0.25,0.75,1.25,1.75,2.25, 2.75,3.25,3.75,4.25.
0.5 0.4 0.3 0.2 0.1 O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 频率 组距
知识探究(一) :众数、中位数和平均数
思考 2:在城市居民月均用水量样本数据的频 率分布直方图中,如何估计众数?
频率 组距 0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
知识探究(一) :众数、中位数和平均数
思考 2:你认为众数应在哪个小矩形内?
月均用水量/t
知识探究(一) :众数、中位数和平均数
思考 6: 将频率分布直方图中每个小矩形的 面 积与小矩形底边中点的横坐标之积相加, 就 是样本数据的估值平均数 . 由此估计总体的 平均数是什么?
知识探究(一) :众数、中位数和平均数
思考 6: 将频率分布直方图中每个小矩形的 面 积与小矩形底边中点的横坐标之积相加, 就 是样本数据的估值平均数 . 由此估计总体的 平均数是什么?
• 小结:
• 1.学习利用频率直方图估计总体的众 数 、中位数和平均数的方法。 • 2.介绍众数、中位数和平均数这三个 特征数的优点和缺点。 • 3.学习如何利用众数、中位数和平均 数的特征去分析解决实际问题。
作业:
习题2.2 A组 第5题
思考 7:从居民月均用水量样本数据可知,该 样本的众数是 2.3,中位数是 2.0,平均数是 1.973,这与我们从样本频率分布直方图得出 的结论有偏差,你能解释一下原因吗?
频率分布直方图损失了一些样本数据, 得到 的是一个估计值,且所得估值与数据分组有关.
注: 在只有样本频率分布直方图的情况下,我 们可以按上述方法估计众数、 中位数和平均数, 并由此估计总体特征.
频率 组距 0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
知识探究(一) :众数、中位数和平均数
思考 5:平均数是频率分布直方图的“重心” , 从直方图估计总体在各组数据内的平均数分 别为多少?
频率 组距
0.5 0.4 0.3 0.2 0.1 O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
• 解析:(1)公司职工月工资的平均数约为 2091(元),若把所有数据从大到小排序,则 得到:中位数是1500元,众数是1500元. • (2)若董事长、副董事长的工资提升后,职 工月工资的平均数约为:3288(元),中位数 是1500元,众位是1500元. • (3)在这个问题中,中位数和众数都能反映 出这个公司员工的工资水平,因为公司少数人 的工资额与大多数人的工资额差别较大,这样 导致平均数与中位数偏差较大,所以平均数不 能反映这个公司员工的工资水平.
知识探究(一) :众数、中位数和平均数
思考 7:从居民月均用水量样本数据可知,该 样本的众数是 2.3,中位数是 2.0,平均数是 1.973,这与我们从样本频率分布直方图得出 的结论有偏差,你能解释一下原因吗?
频率分布直方图损失了一些样本数据, 得到 的是一个估计值,且所得估值与数据分组有关.
知识探究(一) :众数、中位数和平均数
知识探究(一) :众数、中位数和平均数
思考 3:如何从频率分布直方图估计中
位数?
频率 组距 0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
• 分析:在样本数据中,有50%的个体小于或 等于中位数,也有50%的个体大示频率的大小,即中位数左 边和右边的直方图的面积应该相等. 由此可 以估计中位数的值.
对众数,中位数,平均数估计总体数字特征的 认识 (1)样本众数通常用来表示分类变量的中心值, 比较容易计算,但是它只能表示样本数据中的 很少一部分信息. (2) 中位数不受少数几个极端值的影响, 容易计 算,它仅利用了数据排在中间的数据的信息. (3)样本平均数与每个样本数据有关,所以,任何 一个样本数据的改变都会引起平均数的改变.这 是中位数,众数都不具有的性质,也正因为这个原 因,与众数,中位数比较起来,平均数可以反映出 更多的关于样本数据全体的信息.

例:某公司的33名职工的月工资(单位:元)如下表:
管理 职员
职务 董事长 副董事长 董事 总经理 经理
人数 工资
1 5500
1 5000
2 1 5 3 20 3500 3000 2500 2000 1500
• (1)求该公司职工月工资的平均数、中位数、 众数. • (2)若董事长、副董事长的工资分别从5500 元、5000元提升到30000元、20000元,那么 公司职工新的平均数、中位数和众数又是什么? • (3)你认为哪个统计量更能反映这个公司员工 的工资水平?
知识探究(一) :众数、中位数和平均数
思考 8 (1)一组数据的中位数一般不受少数 几个极端值的影响, 这在某些情况下是一个优 点,但它对极端值的不敏感有时也会成为缺 点,你能举例说明吗?
知识探究(一) :众数、中位数和平均数
思考 8 (1)一组数据的中位数一般不受少数 几个极端值的影响, 这在某些情况下是一个优 点,但它对极端值的不敏感有时也会成为缺 点,你能举例说明吗?
相关文档
最新文档