高中数学第一章统计4数据的数字特征教案北师大必修3创新

合集下载

新教材高中数学本估计总体的数字特征4-2分层随机抽样的均值与方差4-3百分位数课件北师大版必修第一册

新教材高中数学本估计总体的数字特征4-2分层随机抽样的均值与方差4-3百分位数课件北师大版必修第一册
的四分位数.
基础自测
1.某病患者8人的潜伏期(天)分别为2,3,3,4,7,8,10,18,
则它们的50%分位数是
( D)
A.4或7
B.4
C.7
D.5.5
[解析] 50%分位数即中位数,为12×(4+7)=5.5.
2.一组数据为6,47,49,15,42,41,7,39,43,40,36,这
组数据的一个四分位数是15,则它是________分位数.
2 . 某 射 手 在 一 次 训 练 中 12 次 射 击 的 成 绩 分 别 为 9.6 , 9.7 , 9.0 ,
9.1,9.4,9.4,9.8,9.9,9.4,9.6,9.6,9.7,则该射手本次射击的成绩
的75%分位数是
( C)
A.9.5
B.9.6
C.9.7
D.9.8
[解析] 将 12 个数从小到大排列:9.0,9.1,9.4,9.4,9.4,9.6,9.6,
(3)求值: 分数
p%分位数
i 不是整数 xi0,其中 i0 为大于 i 的最小整数
i 是整数
xi+xi+1 2
【对点练习】❷ 确定数据0,0,0,0,1,1,2,3,4,5,6, 6,7,7,10,14,14,14,14,15的28%分位数和75%分位数.
[解析] 因为数据已从小到大排列,共有 20 个. 而且 i1=20×28%=5.6,不为整数, i2=20×75%=15 是整数, 因此,此数据的 28%分位数为 x6=1,75%分位数为x15+2 x16=10+2 14 =12.
51. 求 甲 、 乙 两 名 运 动 员 得 分 的 25% 分 位 数 , 75% 分 位 数 和 90% 分 位
数.

《数据的数字特征第1课时》参考教学方案

《数据的数字特征第1课时》参考教学方案

数据的数字特征第1课时1.通过实例理解数据的数字特征:最值、平均数、中位数、百分位数、众数,理解不同数字特征的优势与不足.2.会用求和符号表示平均数,掌握求和符号的性质.3.能根据现实问题的需要选择恰当的数字特征来表达数据信息,体会数字特征在分析数据时的重要作用,培养数学抽象能力、数学运算能力、数据分析素养.教学重点:理解数据的数字特征(最值、平均数、中位数、百分位数和众数)的计算、意义与作用.教学难点:数字特征的计算及求和符号的运用.PPT课件.一、整体概览问题1:阅读课本,回答下列问题:(1)本课时将要研究哪类问题?(2)本课时要研究的问题在数学中的地位是怎样的?师生活动:学生带着问题阅读课本,老师指导学生概括本课时要研究的内容.预设的答案:(1)本节内容主要研究数据的数字特征——最值、平均数、中位数、百分位数;(2)通过前面的学习,学生已经学习掌握了有关统计的基础知识:从普查到抽样、简单随机抽样、分层抽样.数据的数字特征是将得到的多个数据“加工”成一个数值,使这个数值能够反映这组数据的某些重要的整体特征.从实际入手,通过抽象思维,建立数学模型,进而认知数学理论,应用于实际的过程.会对今后数学及相关学科的学习产生深远的影响.设计意图:通过本课时内容的预习,让学生明晰下一阶段的学习目标,初步搭建学习内容的框架.二、探索新知观察如下数据:69 84 69 80 75 70 75 71 87 70 80 84 73 81 81 7366 78 68 79 73 75 76 76 70 74 71 86 63 8876 86 74 82 77 68 62 82 72 82 76 81 84 79 67 7870 72 81 89 81 77 72 77 67 67 72 79 81 75 75 84问题2:看到数据的第一感觉是什么?预设的答案:乱而多,这是什么数据……问题3:你能够从中得到哪些信息?预设的答案:一共有62个数据,都是两位数,其中最大数为89,感觉七十多的数据比较多…师生活动:教师引导学生充分讨论发言,并不限定学生发言的角度.在交流过程中不断完善.若研究的数据是两班的语文成绩如下:高一(1)班期中考试语文成绩69 84 69 80 75 70 75 71 87 70 80 84 73 81 81 7366 78 68 79 73 75 76 76 70 74 71 86 63 88高一(2)班期中考试语文成绩76 86 74 82 77 68 62 82 72 82 76 81 84 79 67 7870 72 81 89 81 77 72 77 67 67 72 79 81 75 75 84问题4:为了对比两个班的成绩,你能够从哪些角度分析数据?预设的答案:引导学生回忆初中学习过的数字特征:最大值,平均数,中位数等.设计意图:从数据出发,让学生亲身感受数据分析的必要性,不借助数字特征并不能够很好的认识数据.开放性的问题,激发学生的学习兴趣,调动已有经验.引语:在日常生活中,当面对一组数据时,相比每一个观测值,有时我们更关心的是能反映这组数据特征的一些值.即为本节我们要研究的内容(板书:数据的数字特征)1.形成定义(1)最值一组数据的最值指的是其中的最大值与最小值,最值反映的是这组数最极端的情况,一般地,最大值用max表示,最小值用min表示.(2)平均数如果给定的一组数是12,,...,n x x x ,则这组数的平均数为:121(...)n x x x x n=+++这一公式在数学中常简记为:11ni i x x n ==∑注:(1)其中的符号∑表示求和,读作“西格玛”,∑右边式子中的i 表示求和的范围,其最小值和最大值分别写在∑的下面和上面.例如3712256715,ii i i xx x x x x x x ===++=++∑∑(2)求和符号∑具有以下性质:111()n n n iiiii i i x y x y ===+=+∑∑∑,11()n niii i kx k x ===∑∑,1ni t nt ==∑问题5:某武术比赛中,共有7个评委,计分的规则是:去掉一个最高分,去掉一个最低分,然后把其他分数的平均数作为选手的最后得分,按照这样的规则,根据以下数据,计算三位选手的最后得分:(1)从数学的角度,讨论为什么要去掉一个最高分与最低分后再计算平均数,以及平均数具有什么特点:(2)有人认为,应该把最高分与最低分之外的分数总分作为选手的最后得分,讨论这样的计分规则与前面的规则是否有本质上的区别.师生活动:学生小组讨论,得出答案,教师帮助总结答案.预设的答案:(1)平均数会受每一个数的影响,尤其是最大值、最小值.很多情况下,为了避免过于极端的值影响结果太大等,会去掉最低分与最高分后再计算平均数.;平均分刻画了一组数据的平均水平(或中心位置)(2)计算总分与计算平均分没有本质上的区别.设计意图:为了让学生明了平均数容易受到最值的影响、思考平均数的本质含义以及怎样利用平均数的性质来简化计算.2.教师讲解一般地,利用平均数地计算公式可知,如果12,,...,n x x x 的平均数为x ,且,a b 为常数,则12,,...,n ax b ax b ax b +++的平均数为ax b +,这是因为1111111()[()]()n n nn i i i i i i i ax b ax b a x nb n n n ====+=+=+∑∑∑∑11()ni i a x b ax b n ==+=+∑ 问题5:有甲、乙两个组,每组有6名成员,他们暑假读书的本数分别如下: 甲组:1,2,3,4,5; 乙组:0,0,1,2,3,12. (1)分别求出两组数的平均数;(2)平均数是否很好地表示了每一组数的中心位置?如果没有,可以选择什么数来表示?师生活动:学生充分思考后,写出并有老师给出答案.预设的答案:(1)上述甲、乙两组数的平均数均为3,(2)用3来刻画乙组数的中心位置是不合适的,因为这组数中有5个数都不大于3.一般地,有时也可以借助中位数来表示一组数的中心位置.设计意图:强调中位数的性质:至少有一半的数值不小于中位数,也至少有一般地数值不大于中位数.教师讲解 一般地,(1)如果一组数有奇数个数,且按照从小到大排列后为1221,,...,n x x x + ,则称1n x +为这组数的中位数;(2)如果一组数有偶数个数,且按照从小到大排列后为122,,...,n x x x ,则称12n n x x ++为这组数的中位数.问题6:指出甲乙两组数的中位数,并思考:中位数是否能比较全面地体现数据的分布特点?如果不能,有什么补救的办法?预设的答案:将甲、乙两组数小于5.5的前10个数分别看出一组数,则它们的中位数分别是2.5,1,这两个数能够反映甲、乙两组数小于5.5的数的分布特点,因为这两个数是通过找小于或者等于中位数的所有数的中位数得到的,所以它们分别称为甲、乙两组数的25%分位数.设计意图:通过数据,让学生观察到研究小于等于中位数的所有数的中位数的必要性.展示数学知识发生发展的过程.教师讲解一般地,当数据个数较多时,可以借助多个百分位数来了解数据的分布特点. 一组数的%((0,100))p p ∈分位数指的是满足下列条件的一个数值:至少有%p 的数据不大于该值,且至少有(100)%p -的数据不小于该值.注:(1)直观来说,一组数的%p 分位数指的是,将这组数按照从小到大的顺序排列后,处于%p 位置的数,例如中位数就是一个50%分位数.(2)按照定义可知,%p 分位数可能不唯一(3)设一组数按照从小到大排列后为12,,...,n x x x ,计算%i np =的值,如果i 不是整数,设0i 为大于i 的最小整数,取0i x 为%p 分位数:如果i 是整数,取12i i x x ++为%p 分位数.特别的,规定:0分位数是1x (是最小值),100%分位数是n x (即最大值).(4)实际应用中,除了中位数外,经常使用的是25%分位数(简称为第一四分位数)与75%分位数(简称为第三四分位数) 三、初步应用例1 计算甲、乙两组数的75%分位数.师生活动:学生分析解题思路,给出答案.预设的答案:因为数据个数为20,而且:2075%15⨯= 因此,甲组数的75%分位数为:15169109.522x x ++== 乙组数的75%分位数为:151610141222x x ++== 设计意图:针对比较熟悉的数字特征,师生共同总结梳理,学会列表整理的方法.结合实例,理解求和符号及其性质,培养学生的数学抽象能力,数学运算能力.由于表达形式比较抽象,可借助具体例子进行说明.四、归纳小结,布置作业问题7:本课时学到的数据的数字特征有哪些?他们各自的数字特征是什么? 师生活动:学生尝试总结,老师适当补充. 预设的答案:最值、平均数、中位数、百分位数,最值反映的是这组数最极端的情况;平均数刻画的是一组数据的平均水平(或中心位置);中位数反映了一组数据的“中等水平”;百分位数反映的一组大数据中p%分位数.设计意图:通过梳理本节课的内容,能让学生更加明确数据的数字特征. 五、目标检测设计1.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,则由此求出的平均数与实际平均数的差是( )A .3.5B .-3C .3D .-0.5 设计意图:考查学生对平均数的掌握程度.2.已知一组数据为20,30,40,50,50,60,70,80.则这组数据的平均数是________. 设计意图:考查学生对平均数的计算.3.以下10个数据:49,64,50,48,65,52,56,46,54,51的中位数是________. 设计意图:考查学生对中位数的计算.4.某同学在7天内每天参加体育锻炼的时间(单位:分钟)如下65,65,66,74,73,81,80,则它们的第三四分位数是________ .设计意图:考查学生对百分位数的计算. 参考答案: 1.【答案】B【解析】少输入90,9030=3,平均数少3,求出的平均数减去实际平均数等于-3.2.【答案】50【解析】x -=18(20+30+40+50+50+60+70+80)=50.3.【答案】51.5【解析】12(51+52)=51.5.4.【答案】80【解析】从小到大排序为65,65,66,73,74,80,81,第三四分位数即75%分位数,7×75%=5.25,所以第三四分位数是第6项数据80.。

5.1.2数据的数字特征教学设计-2024-2025学年高一上学期数学人教B版(2019)必修第二册

5.1.2数据的数字特征教学设计-2024-2025学年高一上学期数学人教B版(2019)必修第二册
2.案例分析:接下来,我们来看一个具体的案例。这个案例展示了数据的数字特征在实际中的应用,以及它如何帮助我们解决问题。
3.重点难点解析:在讲授过程中,我会特别强调众数、中位数、平均数的计算方法和在数据分布不均匀时的作用。对于难点部分,我会通过举例和比较来帮助大家理解。
三、实践活动
1.分组讨论:学生们将分成若干小组,每组讨论一个与数据的数字特征相关的实际问题。
(二)存在主要问题
1.课堂管理:部分学生在课堂上注意力不集中,影响学习效果。
2.教学方法:部分学生对传统的讲授方式感到枯燥乏味,缺乏参与感。
3.教学评价:评价方式较为单一,难以全面反映学生的学习情况和能力。
(三)改进措施
1.加强课堂管理:通过设定课堂规则,加强课堂纪律管理,提高学生的学习专注度。
2.多样化教学方法:采用多种教学方法,如小组讨论、实验操作、案例分析等,增加学生的参与感和学习兴趣。
反思改进措施
(一)教学特色创新
1.引入实际案例:在教学中引入与学生生活相关的实际案例,让学生通过分析案例来理解众数、中位数、平均数的概念和应用,提高学生的学习兴趣和积极性。
2.开展小组讨论:组织学生进行小组讨论,让学生在讨论中互相学习、交流想法,培养学生的团队合作能力和沟通表达能力。
3.运用多媒体教学:利用多媒体教学工具,如PPT、视频等,丰富教学手段,提高学生的学习效果和参与度。
2.注重学生的思维训练,引导学生思考实际问题。
3.注重课堂纪律,保持教学秩序。
核心素养的定义及求法,培养学生运用数学逻辑推理解决问题的能力。
2.数据分析:培养学生收集、整理、分析数据的能力,并能运用数据进行分析与判断。
3.数学建模:培养学生运用数学知识解决实际问题的能力,将数学知识与生活实际相结合。

北师大版高中数学必修三第1章1.4数据的数字特征教案设计

北师大版高中数学必修三第1章1.4数据的数字特征教案设计

温故知新问题1 :在上一节中,从甲乙两个城市随机抽取的16台自动售货机的销售额可以用茎叶图表示如下1°甲乙两组数据的中位数众数极差分别是多少?2°你能从上图中分别比较甲乙两组数据的平均数和方差的大小吗?解:(1)观察茎叶图,我们不难看出:甲城市销售额的中位数为20,众数为10,18,30,极差为53;乙城市销售额的中位数为29,众数为23,34,极差为38.(2)从茎叶图中我们可以看出:甲城市的销售额分布主要在茎叶图的上方且相对较散,而乙城市的销售额分布则相对集中在茎叶图的中部.由此,我们可以估计:甲城市销售额的平均数比乙城市的小,而方差比乙城市的大.通过计算我们得到:甲城市销售额的平均数和方差分别为22.8和210.9,乙城市销售额的平均数和方差分别为28.6和115.2,这与上面的估计是一致的.结合上节课的茎叶图的相关内容,为学生复习巩固初中学习的统计量的内容,提供了材料信息教科书设计了这个问题,自然承接上一节统计图表的内容,并初步发展学生从统计图中获取数字特征的能力.创设情境,讲授新课导入:请大家思考,初中时我们学习了哪些统计量?他们怎样定义的?他们在刻画数据时,各有怎样的优缺点?请大家结合下面问题的解决,对这个问题进行思考?探究学习:问题2:某公司员工的月工资情况如表所示:职务董事长副董事长董事总经理经理管理员职员学生讨论回答过阅读材料,让学生感受数据的数字在活动开始时,建议教师控制“开始”和“停止”之间的时间间隔在20秒以内,并且在增加时间间隔之前,可以先保持“开始”和“停止”之间的时间间隔不变,重复刚才的试验.此时,得到的平均值与确切的时间值应该会更接近,标准差也应该会比第一次的更小.这是因为经历了刚才的活动,学生已经积累了一定的经验,加之时间间隔又没有改变,他们估计的结果应该会比第一次更准确.随后,教师再增加“开始”和“停止”之间的时间间隔,重复试验,并让学生分析自己以及全班同学最后的估计结果.这个活动还可以初步培养学生的估计能力.作业课本P31 习题1-4(1)、(2)思考:“用数据说话”,这是我们经常可以听到的一句话,但数据有时也会被利用,从而产生误导。

5.1.2数据的数字特征-2024-2025学年高一数学必修第二册(人教B版)上课课件

5.1.2数据的数字特征-2024-2025学年高一数学必修第二册(人教B版)上课课件
答案:B
4.已知五个数据 3,5,7,4,6,则该样本的标准差为________.
解析:因为 x =15×(3+5+7+4+6)=5, 所以 s= 15×[3-52+…+6-52]= 2. 答案: 2
题型一 百分位数[教材 P64 例 1] 例 1 计算甲、乙两组数的 25%分位数与 75%分位数.

元)
(2)假设副董事长的月工资从 5 000 元提升到 20 000 元,董事长
的月工资从 5 500 元提升到 30 000 元,那么新的平均数、中位数、
众数又分别是多少?(精确到 1 元)
(3)你认为哪个统计量更能反映这个公司员工的工资水平?结
合此问题谈一谈你的看法.
【解析】 (1)平均数是 x =
【解析】 因为数据个数为 20,而且 20×25%=5,20×75%=
15. 因此,甲组数的 25%分位数为x5+2 x6=2+2 3=2.5; 甲组数的 75%分位数为x15+2 x16=9+210=9.5. 乙组数的 25%分位数为x5+2 x6=1+2 1=1; 乙组数的 75%分位数为x15+2 x16=10+2 14=12.
知识点二 百分位数 一般地,一组数据的第 p 百分位数是这样一个值,它使得这组 数据中至少有 p%的数据小于或等于这个值,且至少有(100-p)%的 数据大于或等于这个值.
状元随笔 可以通过下面的步骤计算一组 n 个数据的第 p 百分
位数: 第 1 步,按从小到大排列原始数据. 第 2 步,计算 i=n×p%. 第 3 步,若 i 不是整数,而大于 i 的比邻整数为 j,则第 p 百分
≈3 288(元), 中位数是 1 500 元,众数是 1 500 元. (3)在这个问题中,中位数和众数都能反映出这个公司员工的工 资水平.因为公司中少数人的工资额与大多数人的工资额差别较 大,这样导致平均数偏差较大,所以平均数不能反映这个公司员工 的工资水平.

统计.板块四.统计数据的数字特征.教师版 普通高中数学复习讲义Word版

统计.板块四.统计数据的数字特征.教师版 普通高中数学复习讲义Word版

一.随机抽样1.随机抽样:满足每个个体被抽到的机会是均等的抽样,共有三种经常采用的随机抽样方法:⑴简单随机抽样:从元素个数为N 的总体中不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样. 抽出办法:①抽签法:用纸片或小球分别标号后抽签的方法.②随机数表法:随机数表是使用计算器或计算机的应用程序生成随机数的功能生成的一张数表.表中每一位置出现各个数字的可能性相同. 随机数表法是对样本进行编号后,按照一定的规律从随机数表中读数,并取出相应的样本的方法.简单随机抽样是最简单、最基本的抽样方法.⑵系统抽样:将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法.抽出办法:从元素个数为N 的总体中抽取容量为n 的样本,如果总体容量能被样本容量整除,设Nk n=,先对总体进行编号,号码从1到N ,再从数字1到k 中随机抽取一个数s 作为起始数,然后顺次抽取第2(1)s k s k s n k +++-,,,个数,这样就得到容量为n 的样本.如果总体容量不能被样本容量整除,可随机地从总体中剔除余数,然后再按系统抽样方法进行抽样.系统抽样适用于大规模的抽样调查,由于抽样间隔相等,又被称为等距抽样.⑶分层抽样:当总体有明显差别的几部分组成时,要反映总体情况,常采用分层抽样,使总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样,这种抽样方法叫做分层抽样.分层抽样的样本具有较强的代表性,而且各层抽样时,可灵活选用不同的抽样方法,应用广泛.2.简单随机抽样必须具备下列特点:⑴简单随机抽样要求被抽取的样本的总体个数N 是有限的. ⑵简单随机样本数n 小于等于样本总体的个数N . ⑶简单随机样本是从总体中逐个抽取的. ⑷简单随机抽样是一种不放回的抽样.⑸简单随机抽样的每个个体入样的可能性均为nN.3.系统抽样时,当总体个数N 恰好是样本容量n 的整数倍时,取Nk n=;若Nn不是整数时,先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量n 整除.因为每个个体被剔除的机会相等,因而整个抽样过程中每个个体被抽取的机会仍知识内容板块四.统计数据的数字特征然相等,为N n.二.频率直方图列出样本数据的频率分布表和频率分布直方图的步骤:①计算极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:取组距,用极差组距决定组数;③决定分点:决定起点,进行分组;④列频率分布直方图:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图,知小长方形的面积=组距×频率组距=频率.频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x =来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.三.茎叶图制作茎叶图的步骤:①将数据分为“茎”、“叶”两部分;②将最大茎与最小茎之间的数字按大小顺序排成一列,并画上竖线作为分隔线; ③将各个数据的“叶”在分界线的一侧对应茎处同行列出.四.统计数据的数字特征用样本平均数估计总体平均数;用样本标准差估计总体标准差. 数据的离散程序可以用极差、方差或标准差来描述.极差又叫全距,是一组数据的最大值和最小值之差,反映一组数据的变动幅度; 样本方差描述了一组数据平均数波动的大小,样本的标准差是方差的算术平方根. 一般地,设样本的元素为12n x x x ,,,样本的平均数为x , 定义样本方差为222212()()()n x x x x x x s n-+-++-=,样本标准差s =简化公式:22222121[()]n s x x x nx n=+++-.五.独立性检验1.两个变量之间的关系;常见的有两类:一类是确定性的函数关系;另一类是变量间存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有一定随机性的.当一个变量取值一定时,另一个变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.2.散点图:将样本中的n 个数据点()(12)i i x y i n =,,,,描在平面直角坐标系中,就得到了散点图.散点图形象地反映了各个数据的密切程度,根据散点图的分布趋势可以直观地判断分析两个变量的关系.3.如果当一个变量的值变大时,另一个变量的值也在变大,则这种相关称为正相关;此时,散点图中的点在从左下角到右上角的区域.反之,一个变量的值变大时,另一个变量的值由大变小,这种相关称为负相关.此时,散点图中的点在从左上角到右下角的区域.散点图可以判断两个变量之间有没有相关关系.4.统计假设:如果事件A 与B 独立,这时应该有()()()P AB P A P B =,用字母0H 表示此式,即0:()()()H P AB P A P B =,称之为统计假设. 5.2χ(读作“卡方”)统计量:统计学中有一个非常有用的统计量,它的表达式为22112212211212()n n n n n n n n n χ++++-=,用它的大小可以用来决定是否拒绝原来的统计假设0H .如果2χ的值较大,就拒绝0H ,即认为A 与B 是有关的.2χ统计量的两个临界值:3.841、6.635;当2 3.841χ>时,有95%的把握说事件A 与B 有关;当2 6.635χ>时,有99%的把握说事件A 与B 有关;当2 3.841χ≤时,认为事件A 与B 是无关的.独立性检验的基本思想与反证法类似,由结论不成立时推出有利于结论成立的小概率事件发生,而小概率事件在一次试验中通常是不会发生的,所以认为结论在很大程度上是成立的. 1.独立性检验的步骤:统计假设:0H ;列出22⨯联表;计算2χ统计量;查对临界值表,作出判断.2.几个临界值:222()0.10( 3.841)0.05( 6.635)0.01P P P χχχ≈≈≈≥2.706,≥,≥.22⨯联表的独立性检验:如果对于某个群体有两种状态,对于每种状态又有两个情况,这样排成一张22⨯的表,如下:如果有调查得来的四个数据11122122n 4个数据来检验上述的两种状态A 与B 是否有关,就称之为22⨯联表的独立性检验.六.回归分析1.回归分析:对于具有相关关系的两个变量进行统计分析的方法叫做回归分析,即回归分析就是寻找相关关系中这种非确定关系的某种确定性. 回归直线:如果散点图中的各点都大致分布在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 2.最小二乘法:记回归直线方程为:ˆy a bx =+,称为变量Y 对变量x 的回归直线方程,其中a b ,叫做回归系数.ˆy是为了区分Y 的实际值y ,当x 取值i x 时,变量Y 的相应观察值为i y ,而直线上对应于i x 的纵坐标是ˆi i ya bx =+. 设x Y ,的一组观察值为()i i x y ,,12i n =,,,,且回归直线方程为ˆya bx =+, 当x 取值i x 时,Y 的相应观察值为i y ,差ˆ(12)i i y yi n -=,,,刻画了实际观察值i y 与回归直线上相应点的纵坐标之间的偏离程度,称这些值为离差.我们希望这n 个离差构成的总离差越小越好,这样才能使所找的直线很贴近已知点. 记21()ni i i Q y a bx ==--∑,回归直线就是所有直线中Q 取最小值的那条.这种使“离差平方和为最小”的方法,叫做最小二乘法.用最小二乘法求回归系数a b ,有如下的公式:1221ˆni ii nii x ynxy bxnx ==-=-∑∑,ˆˆa y bx =-,其中a b ,上方加“^”,表示是由观察值按最小二乘法求得的回归系数.3.线性回归模型:将用于估计y 值的线性函数a bx +作为确定性函数;y 的实际值与估计值之间的误差记为ε,称之为随机误差;将y a bx ε=++称为线性回归模型. 产生随机误差的主要原因有:①所用的确定性函数不恰当即模型近似引起的误差; ②忽略了某些因素的影响,通常这些影响都比较小; ③由于测量工具等原因,存在观测误差. 4.线性回归系数的最佳估计值:利用最小二乘法可以得到ˆˆab ,的计算公式为 1122211()()()()nnii iii i nniii i xx y y x ynxyb xx xn x ====---==--∑∑∑∑,ˆˆa y bx =-,其中11n i i x x n ==∑,11nii y y n ==∑ 由此得到的直线ˆˆya bx =+就称为回归直线,此直线方程即为线性回归方程.其中ˆa ,b 分别为a ,b 的估计值,ˆa称为回归截距,b 称为回归系数,ˆy 称为回归值. 5.相关系数:()()nnii i ixx y y x ynx yr ---==∑∑6.相关系数r 的性质: ⑴||1r ≤;⑵||r 越接近于1,x y ,的线性相关程度越强; ⑶||r 越接近于0,x y ,的线性相关程度越弱.可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关. 7.转化思想:根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数. 8.一些备案 ①回归(regression )一词的来历:“回归”这个词英国统计学家Francils Galton 提出来的.1889年,他在研究祖先与后代的身高之间的关系时发现,身材较高的父母,他们的孩子也较高,但这些孩子的平均身高并没有他们父母的平均身高高;身材较矮的父母,他们的孩子也较矮,但这些孩子的平均身高却比他们父母的平均身高高.Galton 把这种后代的身高向中间值靠近的趋势称为“回归现象”.后来,人们把由一个变量的变化去推测另一个变量的变化的方法称为回归分析.②回归系数的推导过程:22222[()]222i i i i i i i i Q y a bx y a y na b x y ab x b x =--=-+-++∑∑∑∑∑∑ 22222()2i i i i i i na a b x y b x b x y y =+-+-+∑∑∑∑∑,把上式看成a 的二次函数,2a 的系数0n >,因此当2()2i i i ib x y y b x a n n --=-=∑∑∑∑时取最小值. 同理,把Q 的展开式按b 的降幂排列,看成b 的二次函数,当2i iiix y a xb x-=∑∑∑时取最小值.解得:12221()()()ni iii i niii x ynxyx x y y b x x xnx==---==--∑∑∑∑,a y bx =-, 其中1i y y n =∑,1i x x n=∑是样本平均数. 9. 对相关系数r 进行相关性检验的步骤: ①提出统计假设0H :变量x y ,不具有线性相关关系;②如果以95%的把握作出推断,那么可以根据10.950.05-=与2n -(n 是样本容量)在相关性检验的临界值表中查出一个r 的临界值0.05r (其中10.950.05-=称为检验水平); ③计算样本相关系数r ;④作出统计推断:若0.05||r r >,则否定0H ,表明有95%的把握认为变量y 与x 之间具有线性相关关系;若0.05||r r ≤,则没有理由拒绝0H ,即就目前数据而言,没有充分理由认为变量y 与x 之间具有线性相关关系. 说明:⑴对相关系数r 进行显著性检验,一般取检验水平0.05α=,即可靠程度为95%.⑵这里的r 指的是线性相关系数,r 的绝对值很小,只是说明线性相关程度低,不一定不相关,可能是非线性相关的某种关系.⑶这里的r 是对抽样数据而言的.有时即使||1r =,两者也不一定是线性相关的.故在统计分析时,不能就数据论数据,要结合实际情况进行合理解释.题型一.数字特征的计算【例1】 某校高中年级开设了丰富多彩的校本课程,甲、乙两班各随机抽取了5名学生的学分,用茎叶图表示(如右图).1s ,2s 分别表示甲、乙两班各自5名学生学分的标准差,则1s 2s .(填“>”、“<”或“=”)乙甲3407602125418【考点】数字特征的计算 【难度】1星 【题型】填空题典例分析【关键字】2010年,海淀2模【解析】易知甲乙的平均数均为14,易知乙比较分散,故12s s <. 【答案】<;【例2】 甲、乙、丙三名射击运动员在某次测试中各射击20次,三人的测试成绩如下表123,,x x x 分别表示甲、乙、丙三名运动员这次测试成绩的平均数,则123,,x x x 的大小关系为 ;123,,s s s 分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则123,,s s s 的大小关系为 .【考点】数字特征的计算 【难度】2星 【题型】填空题【关键字】2010年,北京崇文2模【解析】1238.5x x x ===;由成绩与平均数的偏差可看出,丙的稳定性最好,其次是甲,故213s s s >>.【答案】123x x x ==【例3】 10个正数的平方和是370,方差是33,那么平均数为( )A .1B .2C .3D .4【考点】数字特征的计算 【难度】1星 【题型】选择 【关键字】无 【解析】22133370210s x x ==⨯-⇒=. 【答案】B ;【例4】 若M 个数的平均数是X ,N 个数的平均数是Y ,则这M N +个数的平均数是( )A .2X Y +B .X Y M N++ C .MX NY M N ++ D .MX NY X Y ++【考点】数字特征的计算 【难度】1星 【题型】选择 【关键字】无 【解析】略 【答案】C ;【例5】 已知一组数据1210x x x ,,,的方差是2,且2221210(3)(3)(3)380x x x -+-++-=,则这组数据的平均数x =__________.【考点】数字特征的计算 【难度】1星 【题型】填空 【关键字】无【解析】依题设有2221210()()()210x x x x x x -+-++-=,展开变形得222212101210()102()20x x x x x x x x ++++-+++=.……………①同样的,2221210(3)(3)(3)380x x x -+-++-=,展开变形得22212101210()1096()380x x x x x x ++++⨯-⋅+++=.…………②②-①并化简得26270x x --=.解得3x =-或9x =.【答案】9或3-;【例6】 求下列各组数据的方差与标准差(精确到0.1),并分析由这些结果可得出什么更一般的结论.⑴123456789;⑵111213141516171819; ⑶24681012141618【考点】数字特征的计算 【难度】2星 【题型】解答 【关键字】无 【解析】略【答案】⑴11(129)59x =+++=,222221120(12995) 6.793s =+++-⨯=≈,1 2.6s =≈;⑵21(111219)159x =+++=,22222120[(1115)(1215)(1915)] 6.793s =-+-++-=≈,2 2.6s =≈;⑶31(2418)109x =+++=,22223180[(210)(410)(1810)]26.73s =-+-++-=≈,3 5.2s =≈;一组数都加上相同的数后,方差不变,都乘以相同的倍数n 后,标准差变为原来的n 倍,方差变为原来的2n 倍.即12n x x x ,,,的方差为2s ,则12n x a x a x a +++,,,的方差仍为2s , 12n nx nx nx ,,,的方差为22n s .【例7】 在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A .甲地:总体均为3,中位数为4B .乙地:总体均值为1,总体方差大于0C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为3【考点】数字特征的计算 【难度】2星 【题型】选择【关键字】2009年,上海高考【解析】根据信息可知,连续10天内,每天的新增疑似病例不能有超过7的数,选项A 中,中位数为4,可能存在大于7的数; 同理,在选项C 中也有可能;选项B 中,如果某天数据为10,其余9天为0,则不符合标志;选项D 中,根据公式,若有大于7的数存在,则方差至少为21(82) 3.610⎡⎤-+⎣⎦≥.【答案】D ;【例8】 设矩形的长为a ,宽为b ,其比满足0.618b a ≈∶,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本: 甲批次:0.598 0.625 0.628 0.595 0.639 乙批次:0.618 0.613 0.592 0.622 0.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是A .甲批次的总体平均数与标准值更接近B .乙批次的总体平均数与标准值更接近C .两个批次总体平均数与标准值接近程度相同D .两个批次总体平均数与标准值接近程度不能确定【考点】数字特征的计算 【难度】2星 【题型】选择【关键字】2009年,四川高考【解析】甲批次的平均数为0.617,乙批次的平均数为0.613【答案】A ;【例9】 已知总体的各个体的值由小到大依次为23371213.718.320a b ,,,,,,,,,,且总体的中位数为10.5,若要使该总体的方差最小,则a 、b 的取值分别是 .【考点】数字特征的计算 【难度】3星 【题型】填空【关键字】2008年,上海高考【解析】10.52a b+=21a b ⇒+=,要使方差最小,只需22(10.5)(10.5)a b -+-最小,当且仅当22a b +最小,显然当10.5a b ==时取到最小值.【答案】10.5,10.5;【例10】 从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为( )A【考点】数字特征的计算 【难度】2星 【题型】选择【关键字】2008年,山东高考【解析】这100个人的平均数为520410*********3100⨯+⨯+⨯+⨯+⨯=.【答案】B ;【例11】 两台机床同时生产直径为10的零件,为了检验产品质量,质量检验员从两台机床的产品中各抽出4件进行测量,结果如下:机床生产的零件质量更符合要求?【考点】数字特征的计算 【难度】3星 【题型】解答 【关键字】无 【解析】略【答案】⑴先计算平均直径:1(109.91010.2)10.0254x =+++=甲,1(10.1109.910.1)10.0254x =+++=乙,由于x x =乙甲,因此平均直径反映不出两台机床生产零件的质量优劣. ⑵再计算方差:2221[(9.910)(10.210)]0.01254s =-+-=甲;22221[(10.110)(9.910)(10.110)]0.00754s =-+-+-=乙;由于22s s <乙甲,这说明乙机床生产出的零件直径波动小;因此,从产品质量稳定性的角度考虑,乙机床生产的零件质量更符合要求.。

北师大版高中数学高一第一章 4 数据的数字特征


组数据的中位数与平均数的数值相等;④这组数据的平均数与众数的数值
相等.
其中正确结论的个数为
√A.1
B.2 C.3 D.4
解析 在这11个数中,数3出现了6次,频率最高,故众数是3;将这11个
数按从小到大的顺序排列得2,2,3,3,3,3,3,3,6,6,10,中间数据是3,故中位数 是3;而平均数 x =2×2+3×611+6×2+故10只=有4. ①正确.
A.5
B.6 C.7 D.8

解析 由题意知,10+11+0+3+x+8+9=7×7,解得x=8.
12345
解析 答案
4.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…, 2x10-1的标准差为__1_6__.
解析 设样本数据x1,x2,…,x10的标准差为s, 则s=8, 可知数据2x1-1,2x2-1,…,2x10-1的标准差为2s=16.
解答
类型三 数据的数字特征的综合应用
例3 在一次科技知识竞赛中,两组学生的成绩如下表:
分数
50 60 70 80 90 100
甲组 2 人数
乙组 4
5 10 13 14
6
4 16 2 12 12
已经算得两个组的平均分都是80分.请根据你所学过的统计知识,进一步 判断这两个组在这次竞赛中的成绩谁优谁劣,并说明理由.
解答
达标检测
1.某市2017年各月的平均气温(℃)数据的茎叶图如图:
则这组数据的中位数是
A.19
√B.20
C.21.5
D.23
解析 由茎叶图知,平均气温在20℃以下的有5个月,在20℃以上的也有
5个月,恰好是20℃的有2个月,由中位数的定义知,这组数据的中位数

高中数学第一章统计4数据的数字特征教案北师大版必修3

§4 数据的数字特征整体设计教学分析在义务教育阶段,学生已经通过实例,学习了平均数、中位数、众数、极差、方差等,并能解决简单的实际问题.(由于义务教育阶段《大纲》中对统计部分的要求与《标准》的要求相差较大,若是承接现行《大纲》的话,建议先补充《标准》中第三学段相应部分的内容.)在这个基础上,高中阶段还将进一步学习标准差,并在学习中不断地体会它们各自的特点,在具体的问题中根据情况有针对性地选择一些合适的数字特征.三维目标1.能结合具体情境理解不同数字特征的意义,并能根据问题的需要选择适当的数字特征来表达数据的信息,培养学生解决问题的能力.2.通过实例理解数据标准差的意义和作用,学会计算数据的标准差,提高学生的运算能力. 重点难点教学重点:平均数、中位数、众数、极差、方差的计算、意义和作用.教学难点:根据问题的需要选择适当的数字特征来表达数据的信息.课时安排1课时教学过程导入新课思路1.中国女排与俄罗斯女排队员的身高、年龄如下表:中国女排俄罗斯女排号码身高/米年龄/岁号码身高/米年龄/岁2 1.83 25 2 1.90 263 1.83 24 4 1.84 334 1.86 245 1.94 276 1.85 247 1.88 257 1.82 25 8 1.92 298 1.96 23 9 1.90 299 1.82 29 10 1.80 2410 1.82 29 11 2.04 2412 1.78 24 12 1.80 1915 1.81 26 13 1.83 2816 1.81 24 14 1.85 2618 1.87 22 16 1.90 32怎样判断中国女排和俄罗斯女排的队员谁的身材更为高大?我们分别求出两队球员的平均身高,谁的平均身高数值大,谁的身材就更高大,教师点出课题:数据的数字特征.思路2.小明开设了一个生产玩具的小工厂,管理人员由小明、他的弟弟和六个亲戚组成.工作人员由五个领工和十个工人组成.工厂经营得很顺利,需要增加一个新工人,小亮需要一份工作,应征而来与小明交谈.小明说:“我们这里报酬不错,平均薪金是每周300元.你在学徒期每周75元,不过很快就可以加工资了.”小亮工作几天后找到小明说:“你欺骗了我,我已经找其他工人核对过了,没有一个人的工资超过每周100元,平均工资怎么可能是一周300元呢?”小明说:“小亮啊,不要激动,平均工资是300元,你看,这是一张工资表.”工资表如下:人员 小明 小明弟 亲戚 领工 工人 周工资 2 400 1 000 250 200 100 人数 1 1 6 5 10 合计 2 400 1 000 1 500 1 000 1 000 这到底是怎么了?教师点出课题:数据的数字特征.推进新课新知探究提出问题1.什么叫平均数?有什么意义?2.什么叫中位数?有什么意义?3.什么叫众数?有什么意义?4.什么叫极差?有什么意义?5.什么叫标准差?有什么意义?6.什么叫方差?有什么意义?讨论结果:1.一组数据的和与这组数据的个数的商称为这组数据的平均数.数据x 1,x 2,…,x n 的平均数为x =nx x x n +++ 21.平均数对数据有“取齐”的作用,代表该组数据的平均水平.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.2.一组数据按从小到大的顺序排成一列,处于中间位置的数称为这组数据的中位数.一组数据中的中位数是唯一的,反映了该组数据的集中趋势.3.一组数据中出现次数最多的数称为这组数据的众数.一组数据中的众数可能不止一个,也可能没有,反映了该组数据的集中趋势.4.一组数据的最大值与最小值的差称为这组数据的极差,表示该组数据之间的差异情况.5.标准差是样本数据到平均数的一种平均距离,一般用s 表示,通常用公式 s=])()()[(122221x x x x x x nn -++-+- 来计算. 可以用计算器或计算机计算标准差.标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差大,数据的离散程度大;标准差小,数据的离散程度小.取值范围是[0,+∞).样本数据x 1,x 2,…,x n 的标准差的计算步骤:①计算样本数据的平均数,用x 来表示;②计算每个样本数据与样本数据平均数的差:x i -x (i=1,2,…,n);③计算x i -x (i=1,2,…,n)的平方;④计算这n 个x i -x (i=1,2,…,n)的平方的平均数,即方差;⑤计算方差的算术平方根,即为样本标准差.6.方差等于标准差的平方,即s 2=n1[(x 1-x )2+(x 2-x )2+…+(x n -x )2],与标准差的作用相同,描述一组数据围绕平均数波动的程度的大小.取值范围是[0,+∞).应用示例思路1例1 某公司员工的月工资情况如表所示:月工资/元 8 000 5 000 4 000 2 000 1 000 800 700 600 500 员工/人 1 2 4 6 12 8 20 5 2(1)分别计算该公司员工月工资的平均数、中位数和众数.(2)公司经理会选取上面哪个数来代表该公司员工的月工资情况?税务官呢?工会领导呢? 解:(1)经过简单计算可以得出:该公司员工的月工资平均数为1 373元,中位数为800元,众数为700元.(2)公司经理为了显示本公司员工的收入高,采用平均数1 373元作为月工资的代表;而税务官希望取中位数800元,以便知道目前的所得税率对该公司的多数员工是否有利;工会领导则主张用众数700元作为代表,因为每月拿700元的员工数最多.点评:平均数是将所有的数据都考虑进去得到的度量,它是反映数据平均水平最常用的统计量;中位数将观测数据分成相同数目的两部分,其中一部分都比这个数小而另一部分都比这个数大,对于非对称的数据集,中位数更实际地描述了数据的中心;当变量是分类变量时,众数往往经常被使用.变式训练1.下表为某班40名学生参加“环保知识竞赛”的得分统计表:分数 0 1 2 3 4 5 人数 4 7 10 x 8 y 请参照这个表解答下列问题:(1)用含x,y 的代数式表示该班参加“环保知识竞赛”的班平均分f ;(2)若该班这次竞赛的平均分为2.5分,求x,y 的值.解:(1)f=405953++y x ; (2)依题意,有⎩⎨⎧==⎩⎨⎧=+=+.4,7,11,4153y x y x y x 解得 2.某风景区对5个旅游景点的门票价格进行了调整,据统计,调价前后各景点的游客人数基本不变.有关数据如下表所示:景点 A B C D E原价(元) 10 10 15 20 25 现价(元) 5 5 15 25 30 平均日人数(千人)1 123 2(1)该风景区调整前后这5个景点门票的平均收费不变,平均日总收入持平,问风景区是怎样计算的?(2)游客认为调整收费后风景区的平均日总收入相对于调价前,实际上增加了约9.4%,问游客是怎样计算的?(3)你认为风景区和游客哪一个的说法较能反映整体实际?解:(1)风景区是这样计算的: 调整前的平均价格:52520151010++++=16(元),调整后的平均价格:530251555++++=16(元), 因为调整前后的平均价格不变,平均日人数不变,所以平均日总收入不变.(2)游客是这样计算的:原平均日总收入:10×1+10×1+15×2+20×3+25×2=160(千元),现平均日总收入:5×1+5×1+15×2+25×3+30×2=175(千元), 所以平均日总收入增加了160160175-≈9.4%. (3)游客的说法较能反映整体实际.例2 甲、乙两台机床同时生产直径是40 mm 的零件.为了检验产品质量,从两台机床生产的产品中各抽取10件进行测量,结果如下表所示.甲机床直径/mm40.0 39.8 40.1 40.2 39.9 40.0 40.2 39.8 40.2 39.8 乙机床直径/mm40.0 40.0 39.9 40.0 39.9 40.1 40.1 40.1 40.0 39.9 分别计算上面从甲、乙两台机床抽取的10件产品直径的标准差.解:从数据很容易得到甲、乙两台机床生产的这10件产品直径的平均值x 甲=x 乙=40(mm).我们分别计算它们直径的标准差:s 甲=10/])408.39()408.39()4040[(222-++-+- =0.161(mm),s 乙=10/])409.39()4040()4040[(222-++-+- =0.077(mm).由上面的计算可以看出:甲、乙两台机床生产的产品直径的平均值相同,而甲机床生产的产品直径的标准差为0.161 mm,比乙机床的标准差0.077 mm 大,说明乙机床生产的零件要更标准些,即乙机床的生产过程更稳定一些.点评:对数据数字特征内容的评价,应当更多地关注对其本身意义的理解和在新情境中的应用,而不是记忆和使用的熟练程度.变式训练设有容量为n 的样本x 1,x 2,…,x n ,其标准差为s x ,另有容量为n 的样本y 1,y 2,…,y n ,其标准差为s y ,且y k =3x k +5(k=1,2,…,n),则下列关系正确的是( )A.s y =3s x +5B.s y =3s xC.s y =3s xD.s y =3s x +5 答案:B思路2例1 某企业员工的月工资如下(单位:元):800 800 800 800800 1 000 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 2001 200 1 200 1 200 1 200 1 200 1 2001 200 1 200 1 200 1 200 1 200 1 2001 200 1 200 1 200 1 200 1 200 1 2001 200 1 500 1 500 1 500 1 500 1 500 1 500 1 5002 000 2 000 2 000 2 000 2 000 2 5002 500 2 500(1)计算该公司员工的月工资的平均数、中位数和众数;(2)假如你去这家企业应聘职位,你会如何看待员工的收入情况?分析:(1)根据平均数、中位数和众数的定义可以分别求得;(2)主要根据月工资的平均数来看待员工的收入情况,当然也要考虑中位数和众数.解:(1)公司员工的月工资的平均数为502500320005150071200201000108005⨯+⨯+⨯+⨯+⨯+⨯=1 320元, 中位数为1 200元,众数为1 200元.(2)由于该公司员工的月工资的中位数和众数与平均数比较接近,所以主要考虑月工资的平均数1 320元作为月工资的代表,这样以该公司月平均工资1 320元与同类企业的工资待遇作比较即可.点评:大多情况下人们会把眼光仅停留在工资表中的最大与最小值处,把最高工资作为一个单位工资的评价,这是一种错误的评价方式.变式训练1.已知10个数据:1 203,1 201,1 194,1 200,1 204,1 201,1 199,1 204,1 195,1 199,它们的平均数是( )A.1 400B.1 300C.1 200D.1 100答案:C2.某公司有15名员工,他们所在的部门及相应每人所创的年利润(万元)如下表所示:部门 A B C D E F G 人数 1 1 2 4 2 2 3 每人所创的年利润 20 5 2.5 2.1 1.5 1.5 2 根据表中提供的信息填空:(1)该公司每人所创的年利润的平均数是___________万元.(2)该公司每人所创的年利润的中位数是___________万元.(3)你认为应该使用平均数和中位数中哪一个来描述该公司每人所创的年利润的一般水平? 答案:(1)3.36 (2)2.1 (3)中位数.例2 对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:甲 60 80 70 90 70 乙 80 60 70 80 75(1)甲、乙的平均成绩谁最好?(2)谁的各门功课发展较平衡?分析:(1)利用公式计算平均数;(2)计算方差来分析.解:(1)51=甲x (60+80+70+90+70)=74,51=乙x (80+60+70+80+75)=73, ∴甲的平均成绩较好.(2)s 甲2=51 (142+62+42+162+42)=104,s 乙2=51(72+132+32+72+22)=56, ∵s 甲2>s 乙2,∴乙的各门功课发展较平衡.点评:平均数和方差是样本的两个重要数字特征,方差越大,表明数据越分散,相反地,方差越小,数据越集中、稳定;平均数越大表明数据的平均水平越高,平均数越小表明数据的平均水平越低.变式训练已知一个样本中含有5个数据3,5,7,4,6,则样本方差为( )A.1B.2C.3D.4 分析:564753++++=x =5,则方差s 2=51[(5-3)2+(5-5)2+(5-7)2+(5-4)2+(5-6)2]=2. 答案:B知能训练1.下列说法正确的是( )A.甲、乙两个班期末考试数学平均成绩相同,这表明这两个班数学学习情况一样B.期末考试数学成绩的方差甲班比乙班的小,这表明甲班的数学学习情况比乙班好C.期末考试数学平均成绩甲、乙两班相同,方差甲班比乙班大,则数学学习甲班比乙班好D.期末考试数学平均成绩甲、乙两班相同,方差甲班比乙班小,则数学学习甲班比乙班好 答案:D2.在一次数学测验中,某小组14名学生分别与全班的平均分85分的差是:2,3,-3,-5,12,12, 8,2,-1,4,-10,-2,5,5,那么这个小组的平均分是—————分.( )A.97.2答案:B3.(2007海南高考,理11)甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表:甲的成绩环数 7 8 9 10频数 5 5 5 5乙的成绩环数 7 8 9 10频数 6 4 4 6丙的成绩环数 7 8 9 10频数 4 6 6 4s 1、s 2、s 3分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有( )A.s 3>s 1>s 2B.s 2>s 1>s 3C.s 1>s 2>s 3D.s 2>s 3>s 1 分析:方法一:计算得x 甲=x 乙=x 丙=8.5,s 12=2025,s 22=2028, s 32=2021,则s 2>s 1>s 3; 方法二:可以计算三名运动员成绩的平均数都等于8.5,观察对比三个表格,相比之下丙的环数集中在8.5周围,比甲和乙要稳定,乙的环数比甲更分散,则有s 1>s 3,s 2>s 3.答案:B4.某人射击5次,分别为8,7,6,5,9环,这个人射击命中的平均环数为____________. 答案:75.华山鞋厂为了了解中学生穿鞋的鞋号情况,对某中学初二(1)班的20名男生所穿鞋号的统计如下表:鞋号 23.5 24 24.5 25 25.5 26 人数 3 4 4 7 1 1 那么这20名男生鞋号数据的平均数是___________,中位数是___________,众数是___________,在平均数,中位数和众数中,鞋厂最感兴趣的是___________.答案:24.55 24.5 25 众数6.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么由此求出的平均数与实际平均数的差是___________.答案:-3拓展提升甲、乙两种玉米苗中各抽10株,分别测得它们的株高如下(单位:cm):甲 25 41 40 37 22 14 19 39 21 42 乙 27 16 44 27 44 16 40 40 16 40 问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?解:(1)101甲x (25+41+40+37+22+14+19+39+21+42)=101×300=30(cm), x 乙=101(27+16+44+27+44+16+40+40+16+40)=101×310=31(cm). ∴x 甲<x 乙,即乙种玉米的苗长得高.(2)s 甲2=104.2(cm 2),s 乙2=128.8(cm 2).∴s 甲2<s 乙2,即甲种玉米的苗长得齐.课堂小结本节课学习了平均数、中位数、众数、极差、方差的计算、意义和作用.作业习题1-4 1、2.设计感想本节教学设计依据课程标准,在义务教育阶段的基础上,进一步掌握平均数、中位数、众数、极差、方差的计算、意义和作用,重在应用.。

学案4:5.1.2 数据的数字特征

5.1.2 数据的数字特征【课标要求】课程标准:理解不同数字特征的意义和作用,并能根据问题的需要选择适当的数字特征来表达数据的信息.学习重点:理解最值、平均数、中位数、百分位数、众数、极差、方差、标准差的意义和作用.学习难点:根据问题的需要选择恰当的数字特征来表达数据的信息.【知识导学】知识点一 最值一组数据的最值指的是其中的最 值与最 值,最值反应的是这组数据最 的情况.一般地,最大值用 表示,最小值用 表示. 知识点二 平均数(1)日常生活中,我们经常使用平均数来刻画一组数据的 (或 ). (2)如果给定的一组数是x 1,x 2,…,x n ,则这组数的平均数为 .这一公式在数学中常简记为 ,其中的符号“ ”表示求和,读作“ ”. (3)求和符号∑具有以下性质: ①∑i =1n(x i +y i )= ;②∑i =1n(kx i )= ;③∑i =1nt = .知识点三 中位数、百分位数(1)一般地,有时也可以借助中位数来表示一组数的 位置;如果一组数据有奇数个数,且按照从小到大排列后为x 1,x 2,…,x 2n +1,则称 为这组数的中位数;如果一组数据有偶数个数,且按照从小到大排列后为x 1,x 2,…,x 2n ,则称 为这组数的中位数. (2)一组数的p %(p ∈(0,100))分位数指的是满足下列条件的一个数值:至少有p %的数据 该值,且至少有(100-p )%的数据 该值.为了方便,我们按如下方式确定p %分位数:设一组数按照从 到 排列后为x 1,x 2,…,x n,计算i=的值,如果i不是整数,设i0为i的整数,取为p%分位数;如果i是整数,取为p%分位数.特别地,规定:0分位数是(即),100%分位数是(即).知识点四众数一组数据中,某个数据出现的次数称为这个数据的,出现次数最多的数据称为这组数据的.知识点五极差、方差与标准差(1)一组数的极差指的是这组数据中的减去所得的差.极差反应了一组数的,描述了这组数的.(2)方差和标准差也是描述一组数的的量.如果x1,x2,…,x n的平均数为x-,则方差可用求和符号表示为s2=.此时,如果a,b为常数,则ax1+b,ax2+b,…,ax n+b的方差为.方差的算术平方根称为,描述了数据相对于平均数的离散程度.【新知拓展】1.平均数、中位数、百分位数、众数的异同(1)平均数、中位数及众数都是描述一组数据集中趋势的量,平均数是最重要的量.由于平均数与该组中的每一个数据有关,因此,任何一个样本数据的改变都会引起平均数的改变.这是中位数和众数都不具有的性质.(2)中位数、百分位数与数据的排列位置有关,中位数、百分位数可能出现在所给数据中,也可能不在所给数据中.2.对方差、标准差概念的理解(1)方差、标准差描述了一组数据围绕平均数波动的大小.方差、标准差越大,数据的离散程度越大;方差、标准差越小,数据的离散程度越小.(2)方差、标准差的取值范围:[0,+∞).方差、标准差为0时,样本中各数据全相等,表明数据没有波动幅度,数据没有离散性.3.极差、方差与标准差的区别与联系(1)数据的离散程度可以通过极差、方差或标准差来描述.(2)极差是一组数据中的最大值与最小值的差.它反映了一组数据变化的最大幅度,它对一组数据中的极端值非常敏感.(3)方差反映了一组数据围绕平均数波动的大小.为了得到以样本数据的单位表示的波动幅度,通常要求算出标准差,即样本方差的算术平方根.标准差是样本数据到平均数的一种平均距离. 4.常用结论若x 1,x 2,x 3,…,x n 的平均数是x -,方差是s 2,则(1)x 1+b ,x 2+b ,x 3+b ,…,x n +b 的平均数为x -+b ,方差是s 2. (2)ax 1,ax 2,ax 3,…,ax n 的平均数为a x -,方差是a 2s 2.(3)ax 1+b ,ax 2+b ,ax 3+b ,…,ax n +b 的平均数为a x -+b ,方差是a 2s 2.【基础自测】1.判一判(正确的打“√”,错误的打“×”) (1)中位数一定是这组数据中的某个数.( ) (2)在一组数据中,众数一定是唯一的.( ) (3)在两组数据中,平均值较大的一组方差较大.( )(4)若x 1,x 2,…,x 100的平均数为x -,x 1,x 2,…,x 40的平均数为a ,x 41,x 42,…,x 100的平均数为b ,则x -=40a +60b100.( )(5)下表记录了某地区某天早晨7点到下午6点的温度变化情况:则这组数据的25%分位数是10 ℃.( ) 2.做一做(1)某班40名学生一次体育测试成绩统计如下:如果已知该班的平均成绩为76分,则x ,y 的值分别为( ) A .14,4 B .13,5 C .12,6 D .11,7(2)若一组数据按从小到大的顺序排列为10,12,13,x,17,19,21,24,且中位数为16,则x =________.(3)一位同学进行十次投实心球的练习,每次投出的成绩如表:则此同学成绩的50%分位数是________.(4)某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4.则:①平均命中环数为________;②命中环数的标准差为________.【题型探究】题型一平均数、中位数、百分位数、众数的计算例1一次数学测试中,高一(1)班1小组12名学生的成绩分别是:58分、67分、73分、74分、76分、82分、82分、87分、90分、92分、93分、98分,则这次测试该小组12名学生成绩的众数、平均数、75%分位数分别是()A.82、82、90B.82、81、92C.82、80、91D.82、81、91【规律方法】1.众数、中位数、平均数的特点(1)众数、中位数及平均数都是描述一组数据集中趋势的量.(2)平均数的大小与一组数据里每个数的大小均有关系,任何一个数据的变动都会引起平均数的变动.(3)众数考查各数出现的频数,其大小与这组数据中部分数据有关,当一组数据中有不少数据重复出现时,其众数往往更能反映问题.(4)中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响,中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中个别数据较大时,用中位数描述这种趋势.2.计算一组n个数据的p%分位数的一般步骤第1步,按照从小到大排列原始数据;第2步,计算i=np%;第3步,若i不是整数,大于i的最小整数为i0,则p%分位数为第i0项数据;若i是整数,则p%分位数为第i项与第(i+1)项数据的平均数.【跟踪训练1】某校调查某班30名同学所穿的鞋的尺码如下表所示:则这组数据的中位数、众数、平均数、25%分位数分别是()A.35,35,35,33B.35,35,34.5,34C.34,35,34,34D.35,35,34.5,33题型二平均数、中位数、众数的实际应用例2某公司的33名职工的月工资(以元为单位)如下表:(1)求该公司职工月工资的平均数、中位数、众数;(2)假设副董事长的工资从5000元提升到20000元,董事长的工资从5500元提升到30000元,那么新的平均数、中位数、众数又是多少?(精确到元)(3)你认为平均数、中位数、众数哪个更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法.【规律方法】各种数字特征的优缺点中位数、众数不受少数几个极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点,而平均数与本组中的每一个数据都有关系,可反映出更多的关于本组数据的信息,但受数据中的极端值的影响较大,妨碍了对本组数据集中趋势的估计,因此用平均数来描述一组数据的集中趋势有时不可靠.(1)16位参加百米半决赛同学的成绩各不相同,按成绩取前8位进入决赛.如果小刘知道了自己的成绩后,要判断能否进入决赛,其他15位同学成绩的下列数据中,能使他得出结论的是()A.平均数B.极差C.中位数D.方差(2)某鞋店试销一种新女鞋,销售情况如下表:如果你是鞋店经理,最关心的是哪种型号的鞋销量最大,那么下列统计量中对你来说最重要的是()A.平均数B.众数C.中位数D.方差题型三方差、标准差的计算例3甲、乙两机床同时加工直径为100 cm的零件,为了检验质量,各从中抽取6件进行测量,分别记录数据为:甲:99,100,98,100,100,103;乙:99,100,102,99,100,100.(1)分别计算两组数据的平均数及方差;(2)根据计算结果判断哪台机床加工零件的质量更稳定.【规律方法】在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度,在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性就越差;方差越小,数据越集中,质量越稳定.对划艇运动员甲、乙两人在相同的条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:甲:27,38,30,37,35,31;乙:33,29,38,34,28,36.根据以上数据,试估计两人最大速度的平均数和标准差,并判断他们谁更优秀.题型四数据的数字特征的综合应用例4在一次科技知识竞赛中,两组学生的成绩如下表:已经计算得到两个组成绩的平均数都是80.请根据你所学过的统计知识,进一步判断这两个组在这次竞赛中的成绩谁优谁劣,并说明理由.【规律方法】要正确处理此类问题,首先要抓住问题中的关键词语,全方位地进行必要的计算、分析,而不能习惯性地仅从方差的的大小去决定哪一组的成绩好,像这样的实际问题还得从实际的角度去分析,如本例的“满分人数”;其次要在恰当地评估后,组织好正确的语言作出结论.【跟踪训练4】某班共有45名同学,在某次满分为100分的测验中,得分前15名同学的平均分为90分,标准差为3,后30名同学的平均分为72分,标准差为 6.(得分均为整数)(1)求全班同学成绩的平均分;(2)求全班同学成绩的方差;(3)能否下“全班同学全都及格了”的结论?说明理由.(达到60分及以上为及格)【随堂达标】1.某公园对“十一”黄金周7天假期的游客人数进行了统计,如下表:则该公园“十一”黄金周七天假期游客人数的平均数和25%分位数分别是()A.2万、1.5万B.2万、2.2万C.2.2万、2.2万D.2万、1.85万2.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各有1人,则该小组成绩的平均数、众数、中位数分别是() A.85,85,85B.87,85,86C.87,85,85D.87,85,903.在一次歌手大奖赛上,七位评委为某歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7.去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为()A.9.40.484B.9.40.016C.9.50.04D.9.50.0164.某校高一年级在一次广播操比赛中,三个班的各项得分如下表:(1)根据表中提供的信息,在服装统一方面,三个班得分的平均数是________;在动作准确方面最有优势的是________班;(2)如果服装统一、动作整齐、动作准确三个方面按20%,30%,50%的比例计算各班的得分,那么________班得分最高.5.某工厂甲、乙两名工人参加操作技能培训,他们在培训期间参加的8次测试成绩记录如下:甲:9582888193798478乙:8392809590808575试比较哪个工人的成绩较好.【参考答案】【知识导学】知识点一 最值 大小极端maxmin知识点二 平均数 (1)平均水平中心位置(2)x -=1n(x 1+x 2+…+x n )x -=1n ∑i =1n x I∑西格玛(3)①i +∑i =1ny i②k ∑i =1nx i③nt知识点三 中位数、百分位数 (1)中心 x n +1 x n +x n +12(2)不大于不小于小大np %大于最小xi 0x i +x i +12 x 1最小值 x n最大值知识点四 众数 频数众数知识点五 极差、方差与标准差 (1)最大值最小值变化范围离散程度(2)离散程度 1n ∑i =1n (x i -x -)2 a 2s 2标准差标准差【基础自测】1.答案 (1)× (2)× (3)× (4)√ (5)× 2.答案 (1)B (2)15 (3)10.3 (4)①7 ②2【题型探究】题型一 平均数、中位数、百分位数、众数的计算例1[解析] 这组数据中82出现的次数最多,故众数为82.平均数为58+67+73+74+76+82+82+87+90+92+93+9812=81. 因为12×75%=9,所以这组数据的75%分位数为90+922=91.故选D. [答案] D【跟踪训练1】答案 B解析 这组数据中处于最中间位置的是第15、第16个数据,故这组数据的中位数为35. 这组数据中35出现的次数最多,故众数为35,平均数为33×7+34×6+35×14+36×1+37×230=34.5. 因为30×25%=7.5,所以这组数据的25%分位数为34.故选B.题型二 平均数、中位数、众数的实际应用例2[解] (1)平均数是x -=5500+5000+3500×2+3000+2500×5+2000×3+1500×2033≈2091, 中位数是1500,众数是1500.(2)新的平均数是x -′=30000+20000+3500×2+3000+2500×5+2000×3+1500×2033≈3288, 新的中位数是1500,新的众数是1500.(3)在这个问题中,中位数或众数均能反映该公司员工的工资水平,因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.【跟踪训练2】答案 (1)C (2)B解析 (1)判断是不是能进入决赛,只要判断是不是前8名,所以只要知道其他15位同学的成绩中是不是有8位高于他,也就是把其他15位同学的成绩排列后看第8位的成绩即可,其成绩高于这个成绩就能进入决赛,低于这个成绩就不能进入决赛,这个第8位的成绩就是这15位同学成绩的中位数.(2)鞋店经理最关心的是哪种型号的鞋销量最大,由表可知,型号为37的鞋销量最大,共销售了16双,并且这组数据的众数为37.题型三 方差、标准差的计算例3[解] (1)x -甲=16×(99+100+98+100+100+103)=100, x -乙=16×(99+100+102+99+100+100)=100. s 2甲=16×[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2] =73, s 2乙=16×[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2] =1.(2)两台机床所加工零件的直径的平均数相同,又s 2甲>s 2乙,所以乙机床加工零件的质量更稳定. 【跟踪训练3】解 x -甲=16×(27+38+30+37+35+31)=33, s 2甲=16×[(27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2]=473, s 甲=473≈3.96; x -乙=16×(33+29+38+34+28+36)=33, s 2乙=16×[(33-33)2+(29-33)2+(38-33)2+(34-33)2+(28-33)2+(36-33)2]=383, s 乙=383≈3.56, 由上知,甲、乙两人最大速度的平均数均为33,甲的标准差约为3.96,乙的标准差约为3.56. 说明甲、乙两人的最大速度的平均值相同,但乙比甲更稳定,故乙比甲更优秀.题型四 数据的数字特征的综合应用例4[解] (1)甲组成绩的众数为90,乙组成绩的众数为70,从成绩的众数比较看,甲组的成绩好一些.(2)s2甲=12+5+10+13+14+6×[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=172,s2乙=14+4+16+2+12+12×[4×(50-80)2+4×(60-80)2+16×(70-80)2+2×(80-80)2+12×(90-80)2+12×(100-80)2]=256.∵s2甲<s2乙,∴甲组的成绩比乙组的成绩稳定,故甲组好些.(3)甲、乙两组成绩的中位数、平均数都是80.其中,甲组成绩在80分以上(包括80分)的有33人,乙组成绩在80分以上(包括80分)的有26人,从这一角度来看,甲组的成绩总体较好.(4)从成绩统计表来看,甲组的成绩大于等于90分的有20人,乙组的成绩大于等于90分的有24人,∴乙组成绩集中在高分段的人数比甲组多.同时乙组得满分的比甲组得满分的多6人.从这一角度来看,乙组的成绩较好.【跟踪训练4】解(1)该班45人分成两组,这两组的平均分分别是90,72;∴全班的平均分是145×(90×15+72×30)=78.(2)s2=1n∑i=1n(x i-x-)2=1n∑i=1nx2i-n x-2,s1=3,∴s21=115×[(x21+x22+…+x215)-15×902]=3,∴x21+x22+…+x215=45+15×8100=121545;∵s2=6,∴s22=130×[(x216+x217+…+x245)-30×722]=6,∴x216+x217+…+x245=180+30×722=155700;∴全班的方差是s2=145×[(x21+x22+…+x245)-45×782]=145×[(121545+155700)-273780]=77.(3)能.若后30名中有人不及格,设该同学为b30,则b30≤59,该同学比平均分低至少13分,那么其他同学比平均分高出的分数至少有13分,所以(b1-72)2+…+(b30-72)2≥13+169=182>180,而(b1-72)2+(b2-72)2+…+(b30-72)2=180,矛盾,所以必定全部及格.【随堂达标】1.答案 A解析 游客人数的平均数为17×(1.5+2.2+2.2+3.8+1.5+2.2+0.6)=2(万).将数据由小到大排列,因为7×25%=1.75,所以这组数据的25%分位数为1.5万.故选A.2.答案 C解析 由平均数、中位数、众数的定义可知,平均数x -=1×100+1×95+2×90+4×85+1×80+1×751+1+2+4+1+1=87;因为得85分的有4人,所以众数是85;把成绩由大到小排列为100,95,90,90,85,85,85,85,80,75,故中位数是85.3.答案 D解析 去掉最高分9.9和最低分8.4,余下的数为9.4,9.4,9.6,9.4,9.7,其平均数x -=3×9.4+9.6+9.75=9.5,s 2=15×(0.12+0.12+0.12+0.12+0.22)=0.016. 4.答案 (1)89 高一甲 (2)高一甲解析 (1)在服装统一方面,三个班得分的平均数为80+97+903=89,在动作准确方面最有优势的是高一甲班.(2)高一甲班的得分为80×20%+84×30%+87×50%=84.7(分),高一乙班的得分为97×20%+78×30%+80×50%=82.8(分),高一丙班的得分为90×20%+78×30%+85×50%=83.9(分),故高一甲班的得分最高.5.解 x -甲=18×(78+79+81+82+84+88+93+95)=85, x -乙=18×(75+80+80+83+85+90+92+95)=85. s 2甲=18×[(78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88-85)2+(93-85)2+(95-85)2]=35.5,s 2乙=18×[(75-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90-85)2+(92-85)2+(95-85)2]=41.∵x -甲=x -乙,s 2甲<s 2乙,∴甲的成绩较稳定.综上可知,甲的成绩较好.。

数据的数字特征教案

数据的数字特征教案一、教学目标1. 让学生理解众数、平均数、中位数、方差等基本概念。

2. 培养学生运用数字特征分析数据的能力。

3. 引导学生通过实际问题,感受数字特征在生活中的应用。

二、教学内容1. 众数的定义及其求法。

2. 平均数的定义及其求法。

3. 中位数的定义及其求法。

4. 方差的定义及其求法。

5. 数字特征在实际问题中的应用。

三、教学重点与难点1. 教学重点:众数、平均数、中位数、方差的定义及其求法。

2. 教学难点:方差的计算及其实际应用。

四、教学方法1. 采用讲解法,讲解众数、平均数、中位数、方差的定义及其求法。

2. 采用案例分析法,分析数字特征在实际问题中的应用。

3. 采用小组讨论法,让学生分组讨论,培养学生的合作能力。

五、教学过程1. 导入:通过生活中的实例,引出数据的数字特征这一概念。

2. 讲解:讲解众数、平均数、中位数、方差的定义及其求法。

3. 案例分析:分析数字特征在实际问题中的应用,如统计考试成绩、分析商品销售数据等。

4. 小组讨论:让学生分组讨论,运用所学知识分析数据。

6. 作业布置:布置练习题,巩固所学知识。

六、教学评估1. 课堂问答:通过提问方式检查学生对众数、平均数、中位数、方差概念的理解。

2. 练习题:布置相关的练习题,让学生独立完成,检验学生对知识点的掌握程度。

3. 小组讨论:评估学生在小组讨论中的参与程度和分析问题的能力。

七、教学拓展1. 引入更多类型的数据特征,如标准差、离差等。

2. 探讨数字特征在实际领域中的应用,如经济学、生物学等。

八、教学资源1. 教材:《数学统计基础》、《数据分析与应用》等。

2. 网络资源:相关在线教程、视频讲解等。

3. 实际案例数据:收集各类实际数据,用于案例分析。

九、教学建议1. 注重学生的基础知识培养,加强对众数、平均数、中位数、方差概念的理解。

2. 鼓励学生积极参与课堂讨论,提高学生的分析问题和解决问题的能力。

3. 布置多样化的作业,让学生在实践中巩固知识。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

§4 数据的数字特征整体设计教学分析在义务教育阶段,学生已经通过实例,学习了平均数、中位数、众数、极差、方差等,并能解决简单的实际问题.(由于义务教育阶段《大纲》中对统计部分的要求与《标准》的要求相差较大,若是承接现行《大纲》的话,建议先补充《标准》中第三学段相应部分的内容.)在这个基础上,高中阶段还将进一步学习标准差,并在学习中不断地体会它们各自的特点,在具体的问题中根据情况有针对性地选择一些合适的数字特征.三维目标1.能结合具体情境理解不同数字特征的意义,并能根据问题的需要选择适当的数字特征来表达数据的信息,培养学生解决问题的能力.2.通过实例理解数据标准差的意义和作用,学会计算数据的标准差,提高学生的运算能力. 重点难点教学重点:平均数、中位数、众数、极差、方差的计算、意义和作用.教学难点:根据问题的需要选择适当的数字特征来表达数据的信息.课时安排1课时教学过程导入新课思路1.中国女排与俄罗斯女排队员的身高、年龄如下表:中国女排俄罗斯女排号码身高/米年龄/岁号码身高/米年龄/岁2 1.83 25 2 1.90 263 1.83 24 4 1.84 334 1.86 245 1.94 276 1.85 247 1.88 257 1.82 25 8 1.92 298 1.96 23 9 1.90 299 1.82 29 10 1.80 2410 1.82 29 11 2.04 2412 1.78 24 12 1.80 1915 1.81 26 13 1.83 2816 1.81 24 14 1.85 2618 1.87 22 16 1.90 32怎样判断中国女排和俄罗斯女排的队员谁的身材更为高大?我们分别求出两队球员的平均身高,谁的平均身高数值大,谁的身材就更高大,教师点出课题:数据的数字特征.思路2.小明开设了一个生产玩具的小工厂,管理人员由小明、他的弟弟和六个亲戚组成.工作人员由五个领工和十个工人组成.工厂经营得很顺利,需要增加一个新工人,小亮需要一份工作,应征而来与小明交谈.小明说:“我们这里报酬不错,平均薪金是每周300元.你在学徒期每周75元,不过很快就可以加工资了.”小亮工作几天后找到小明说:“你欺骗了我,我已经找其他工人核对过了,没有一个人的工资超过每周100元,平均工资怎么可能是一周300元呢?”小明说:“小亮啊,不要激动,平均工资是300元,你看,这是一张工资表.”工资表如下:人员 小明 小明弟 亲戚 领工 工人 周工资 2 400 1 000 250 200 100 人数 1 1 6 5 10 合计 2 400 1 000 1 500 1 000 1 000 这到底是怎么了?教师点出课题:数据的数字特征.推进新课新知探究提出问题1.什么叫平均数?有什么意义?2.什么叫中位数?有什么意义?3.什么叫众数?有什么意义?4.什么叫极差?有什么意义?5.什么叫标准差?有什么意义?6.什么叫方差?有什么意义?讨论结果:1.一组数据的和与这组数据的个数的商称为这组数据的平均数.数据x 1,x 2,…,x n 的平均数为x =nx x x n +++ 21.平均数对数据有“取齐”的作用,代表该组数据的平均水平.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.2.一组数据按从小到大的顺序排成一列,处于中间位置的数称为这组数据的中位数.一组数据中的中位数是唯一的,反映了该组数据的集中趋势.3.一组数据中出现次数最多的数称为这组数据的众数.一组数据中的众数可能不止一个,也可能没有,反映了该组数据的集中趋势.4.一组数据的最大值与最小值的差称为这组数据的极差,表示该组数据之间的差异情况.5.标准差是样本数据到平均数的一种平均距离,一般用s 表示,通常用公式 s=])()()[(122221x x x x x x nn -++-+- 来计算. 可以用计算器或计算机计算标准差.标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差大,数据的离散程度大;标准差小,数据的离散程度小.取值范围是[0,+∞).样本数据x 1,x 2,…,x n 的标准差的计算步骤:①计算样本数据的平均数,用x 来表示;②计算每个样本数据与样本数据平均数的差:x i -x (i=1,2,…,n);③计算x i -x (i=1,2,…,n)的平方;④计算这n 个x i -x (i=1,2,…,n)的平方的平均数,即方差;⑤计算方差的算术平方根,即为样本标准差.6.方差等于标准差的平方,即s 2=n1[(x 1-x )2+(x 2-x )2+…+(x n -x )2],与标准差的作用相同,描述一组数据围绕平均数波动的程度的大小.取值范围是[0,+∞).应用示例思路1例1 某公司员工的月工资情况如表所示:月工资/元 8 000 5 000 4 000 2 000 1 000 800 700 600 500 员工/人 1 2 4 6 12 8 20 5 2(1)分别计算该公司员工月工资的平均数、中位数和众数.(2)公司经理会选取上面哪个数来代表该公司员工的月工资情况?税务官呢?工会领导呢? 解:(1)经过简单计算可以得出:该公司员工的月工资平均数为1 373元,中位数为800元,众数为700元.(2)公司经理为了显示本公司员工的收入高,采用平均数1 373元作为月工资的代表;而税务官希望取中位数800元,以便知道目前的所得税率对该公司的多数员工是否有利;工会领导则主张用众数700元作为代表,因为每月拿700元的员工数最多.点评:平均数是将所有的数据都考虑进去得到的度量,它是反映数据平均水平最常用的统计量;中位数将观测数据分成相同数目的两部分,其中一部分都比这个数小而另一部分都比这个数大,对于非对称的数据集,中位数更实际地描述了数据的中心;当变量是分类变量时,众数往往经常被使用.变式训练1.下表为某班40名学生参加“环保知识竞赛”的得分统计表:分数 0 1 2 3 4 5 人数 4 7 10 x 8 y 请参照这个表解答下列问题:(1)用含x,y 的代数式表示该班参加“环保知识竞赛”的班平均分f ;(2)若该班这次竞赛的平均分为2.5分,求x,y 的值.解:(1)f=405953++y x ; (2)依题意,有⎩⎨⎧==⎩⎨⎧=+=+.4,7,11,4153y x y x y x 解得 2.某风景区对5个旅游景点的门票价格进行了调整,据统计,调价前后各景点的游客人数基本不变.有关数据如下表所示:景点 A B C D E原价(元) 10 10 15 20 25 现价(元) 5 5 15 25 30 平均日人数(千人)1 123 2(1)该风景区调整前后这5个景点门票的平均收费不变,平均日总收入持平,问风景区是怎样计算的?(2)游客认为调整收费后风景区的平均日总收入相对于调价前,实际上增加了约9.4%,问游客是怎样计算的?(3)你认为风景区和游客哪一个的说法较能反映整体实际?解:(1)风景区是这样计算的: 调整前的平均价格:52520151010++++=16(元),调整后的平均价格:530251555++++=16(元), 因为调整前后的平均价格不变,平均日人数不变,所以平均日总收入不变.(2)游客是这样计算的:原平均日总收入:10×1+10×1+15×2+20×3+25×2=160(千元),现平均日总收入:5×1+5×1+15×2+25×3+30×2=175(千元), 所以平均日总收入增加了160160175-≈9.4%. (3)游客的说法较能反映整体实际.例2 甲、乙两台机床同时生产直径是40 mm 的零件.为了检验产品质量,从两台机床生产的产品中各抽取10件进行测量,结果如下表所示.甲机床直径/mm40.0 39.8 40.1 40.2 39.9 40.0 40.2 39.8 40.2 39.8 乙机床直径/mm40.0 40.0 39.9 40.0 39.9 40.1 40.1 40.1 40.0 39.9 分别计算上面从甲、乙两台机床抽取的10件产品直径的标准差.解:从数据很容易得到甲、乙两台机床生产的这10件产品直径的平均值x 甲=x 乙=40(mm).我们分别计算它们直径的标准差:s 甲=10/])408.39()408.39()4040[(222-++-+- =0.161(mm),s 乙=10/])409.39()4040()4040[(222-++-+- =0.077(mm).由上面的计算可以看出:甲、乙两台机床生产的产品直径的平均值相同,而甲机床生产的产品直径的标准差为0.161 mm,比乙机床的标准差0.077 mm 大,说明乙机床生产的零件要更标准些,即乙机床的生产过程更稳定一些.点评:对数据数字特征内容的评价,应当更多地关注对其本身意义的理解和在新情境中的应用,而不是记忆和使用的熟练程度.变式训练设有容量为n 的样本x 1,x 2,…,x n ,其标准差为s x ,另有容量为n 的样本y 1,y 2,…,y n ,其标准差为s y ,且y k =3x k +5(k=1,2,…,n),则下列关系正确的是( )A.s y =3s x +5B.s y =3s xC.s y =3s xD.s y =3s x +5 答案:B思路2例1 某企业员工的月工资如下(单位:元):800 800 800 800800 1 000 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 2001 200 1 200 1 200 1 200 1 200 1 2001 200 1 200 1 200 1 200 1 200 1 2001 200 1 200 1 200 1 200 1 200 1 2001 200 1 500 1 500 1 500 1 500 1 5001 500 1 5002 000 2 000 2 000 2 000 2 000 2 500 2 500 2 500(1)计算该公司员工的月工资的平均数、中位数和众数;(2)假如你去这家企业应聘职位,你会如何看待员工的收入情况?分析:(1)根据平均数、中位数和众数的定义可以分别求得;(2)主要根据月工资的平均数来看待员工的收入情况,当然也要考虑中位数和众数.解:(1)公司员工的月工资的平均数为502500320005150071200201000108005⨯+⨯+⨯+⨯+⨯+⨯=1 320元, 中位数为1 200元,众数为1 200元.(2)由于该公司员工的月工资的中位数和众数与平均数比较接近,所以主要考虑月工资的平均数1 320元作为月工资的代表,这样以该公司月平均工资1 320元与同类企业的工资待遇作比较即可.点评:大多情况下人们会把眼光仅停留在工资表中的最大与最小值处,把最高工资作为一个单位工资的评价,这是一种错误的评价方式.变式训练1.已知10个数据:1 203,1 201,1 194,1 200,1 204,1 201,1 199,1 204,1 195,1 199,它们的平均数是( )A.1 400B.1 300C.1 200D.1 100答案:C2.某公司有15名员工,他们所在的部门及相应每人所创的年利润(万元)如下表所示:部门 A B C D E F G 人数 1 1 2 4 2 2 3 每人所创的年利润 20 5 2.5 2.1 1.5 1.5 2 根据表中提供的信息填空:(1)该公司每人所创的年利润的平均数是___________万元.(2)该公司每人所创的年利润的中位数是___________万元.(3)你认为应该使用平均数和中位数中哪一个来描述该公司每人所创的年利润的一般水平? 答案:(1)3.36 (2)2.1 (3)中位数.例2 对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:甲 60 80 70 90 70 乙 80 60 70 80 75(1)甲、乙的平均成绩谁最好?(2)谁的各门功课发展较平衡?分析:(1)利用公式计算平均数;(2)计算方差来分析.解:(1)51=甲x (60+80+70+90+70)=74,51=乙x (80+60+70+80+75)=73, ∴甲的平均成绩较好.(2)s 甲2=51 (142+62+42+162+42)=104,s 乙2=51(72+132+32+72+22)=56, ∵s 甲2>s 乙2,∴乙的各门功课发展较平衡.点评:平均数和方差是样本的两个重要数字特征,方差越大,表明数据越分散,相反地,方差越小,数据越集中、稳定;平均数越大表明数据的平均水平越高,平均数越小表明数据的平均水平越低.变式训练已知一个样本中含有5个数据3,5,7,4,6,则样本方差为( )A.1B.2C.3D.4 分析:564753++++=x =5,则方差s 2=51[(5-3)2+(5-5)2+(5-7)2+(5-4)2+(5-6)2]=2. 答案:B知能训练1.下列说法正确的是( )A.甲、乙两个班期末考试数学平均成绩相同,这表明这两个班数学学习情况一样B.期末考试数学成绩的方差甲班比乙班的小,这表明甲班的数学学习情况比乙班好C.期末考试数学平均成绩甲、乙两班相同,方差甲班比乙班大,则数学学习甲班比乙班好D.期末考试数学平均成绩甲、乙两班相同,方差甲班比乙班小,则数学学习甲班比乙班好 答案:D2.在一次数学测验中,某小组14名学生分别与全班的平均分85分的差是:2,3,-3,-5,12,12, 8,2,-1,4,-10,-2,5,5,那么这个小组的平均分是—————分.( )A.97.2B.87.29C.92.32D.82.86 答案:B3.(2007海南高考,理11)甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表:甲的成绩环数 7 8 9 10频数 5 5 5 5乙的成绩环数 7 8 9 10频数 6 4 4 6丙的成绩环数 7 8 9 10频数 4 6 6 4s 1、s 2、s 3分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有( )A.s 3>s 1>s 2B.s 2>s 1>s 3C.s 1>s 2>s 3D.s 2>s 3>s 1 分析:方法一:计算得x 甲=x 乙=x 丙=8.5,s 12=2025,s 22=2028, s 32=2021,则s 2>s 1>s 3; 方法二:可以计算三名运动员成绩的平均数都等于8.5,观察对比三个表格,相比之下丙的环数集中在8.5周围,比甲和乙要稳定,乙的环数比甲更分散,则有s 1>s 3,s 2>s 3.答案:B4.某人射击5次,分别为8,7,6,5,9环,这个人射击命中的平均环数为____________. 答案:75.华山鞋厂为了了解中学生穿鞋的鞋号情况,对某中学初二(1)班的20名男生所穿鞋号的统计如下表:鞋号 23.5 24 24.5 25 25.5 26人数 3 4 4 7 1 1 那么这20名男生鞋号数据的平均数是___________,中位数是___________,众数是___________,在平均数,中位数和众数中,鞋厂最感兴趣的是___________.答案:24.55 24.5 25 众数6.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么由此求出的平均数与实际平均数的差是___________.答案:-3拓展提升甲、乙两种玉米苗中各抽10株,分别测得它们的株高如下(单位:cm):甲 25 41 40 37 22 14 19 39 21 42 乙 27 16 44 27 44 16 40 40 16 40 问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?解:(1)101甲x (25+41+40+37+22+14+19+39+21+42)=101×300=30(cm), x 乙=101(27+16+44+27+44+16+40+40+16+40)=101×310=31(cm). ∴x 甲<x 乙,即乙种玉米的苗长得高.(2)s 甲2=104.2(cm 2),s 乙2=128.8(cm 2).∴s 甲2<s 乙2,即甲种玉米的苗长得齐.课堂小结本节课学习了平均数、中位数、众数、极差、方差的计算、意义和作用.作业习题1-4 1、2.设计感想本节教学设计依据课程标准,在义务教育阶段的基础上,进一步掌握平均数、中位数、众数、极差、方差的计算、意义和作用,重在应用.。

相关文档
最新文档