湖北省宜昌市高中数学第二章统计2.2.2用样本的数字特征估计总体的数字特征练习(无答案)新人教A版必修3
2.2.2 用样本的数字特征估计总体的数字特征(2)

x甲 x乙
∴乙种玉米的苗长得高.
(2)由方差公式得:
1 s甲= [(25-30)2+(41-30)2+…+(42-30)2]=104.2, 10
2
2 同:乙种玉米苗长得高,甲种玉米苗长得齐.
2
2
课后作业
1.甲、乙两种水稻试验品种连续 5 年的平均单位面积产量如 下(单位:t/hm2),试根据这组数据估计哪一种水稻品种的产 量比较稳定.
课堂练习
1.如图是某校举行的元旦诗歌朗诵比赛中, 七位评委为某位选手打出分数的茎叶统计图 ,
去掉一个最高分和一个最低分,所剩数据
的平均数和方差分别为( (A)84,4.84 (B)84,1.6 )
(C)85,1.6
(D)85,0.4
【解析】选C.得分是79,84,84,86,84,87,93,最高分是93,最低分 是79,则去掉一个最高分和一个最低分后该选手得分是84,84, 86,84,87,计算得平均数是85,方差是1.6.
(2)因平均数为300,由表格中所列出的数据可见,只有经理 在平均数以上,其余的人都在平均数以下,故用平均数不能 客观真实地反映该工厂的工资水平.
因此,在例子中的解答过程可表述为: 解:由数据可得:
1 1 7 x甲 (7 8 7 4) 7, x乙 (9 5 7 7) 10 10
x甲 x乙
∴从平均成绩看甲、乙二人的成绩无明显差异。
1 7 72 8 72 4 72 2 s甲 10
|x1- x |+|x2- x |+„+|xn- x | S= .由于上式含有绝对值, n
运算不太方便,因此,通常改用如下公式来计算标准差:
s= 1 2 2 2 [ x - x + x - x +„+ x - x ]. 2 n n 1
2018版高中数学第二章统计2.2.2用样本的数字特征估计总体的数字特征学案

2.2.2 用样本的数字特征估计总体的数字特征1.会求样本的平均数、标准差、方差.(重点)2.理解用样本的数字特征估计总体的数字特征的方法.(重点)3.会应用相关知识解决实际统计问题.(难点)[基础·初探]教材整理1 样本的平均数 阅读教材P 65~P 66,完成下列问题.1.定义:样本中所有个体的平均数叫做样本平均数.2.特点:平均数描述了数据的平均水平,定量地反映了数据的集中趋势所处的水平.用样本的平均数估计总体的平均数时,样本平均数只是总体平均数的近似.3.作用:n 个样本数据x 1,x 2,…,x n 的平均数x =x 1+x 2+…+x nn,则有n x =x 1+x 2+…+x n ,也就是把每个x i (i =1,2,…,n )都用x 代替后,数据总和保持不变.所以平均数x 对数据有“取齐”的作用,代表了一组数据的数值平均水平.一组观察值4,3,5,6出现的次数分别为3,2,4,2,则样本平均值约为( ) A.4.55 B.4.5 C.12.5D.1.64【解析】 x =4×3+3×2+5×4+6×23+2+4+2≈4.55.【答案】 A教材整理2 样本的方差和标准差阅读教材P 66“最后一段”至P 68,完成下列问题.1.数据的离散程度可以用极差、方差或标准差来描述.样本方差描述了一组数据围绕平均数波动的大小.一般地,设样本的元素为x 1,x 2,…,x n ,样本的平均数为x ,定义s 2= x 1-x 2+ x 2-x 2+…+ x n -x 2n.s 2表示样本方差.2.为了得到以样本数据的单位表示的波动幅度,通常要求出样本方差的算术平方根s s 表示样本标准差.某学员在一次射击测试中射靶10次,命中环数如下: 7,8,7,9,5,4,9,10,7,4.则:(1)平均命中环数为________; (2)命中环数的标准差为________.【解析】 (1)x =7+8+7+9+5+4+9+10+7+410=7.(2)s 2=110[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,∴s =2.【答案】 (1)7 (2)2[小组合作型]2220所示,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为_________和________.【精彩点拨】 由茎叶图分别提取出甲、乙10天中每天加工零件的个数,然后求平均数.【尝试解答】 甲每天加工零件的个数分别为:18,19,20,20,21,22, 23,31,31,35,所求平均数为x 甲=110×(18+19+20+20+21+22+23+31+31+35)=24.乙每天加工零件的个数分别为:11,17,19,21,22,24,24,30,30,32,所求平均数为:x 乙=110×(11+17+19+21+22+24+24+30+30+32)=23.【答案】 24 23茎叶图与平均数相结合的问题,关键是识别茎叶图的意义.在一般情况下,要计算一组数据的平均数可使用平均数计算公式;当数据较大,且大部分数据在某一常数a 左右波动时,可建立一组新的数据 各个数据减去a ,再利用平均数简化公式计算,应用此法可减少运算量.[再练一题]1.某中学号召学生在今年春节期间至少参加一次社会公益活动(以下简称活动),该校合唱团共有100名学生,他们参加活动的次数统计如图2221所示.求合唱团学生参加活动的人均次数.图2221【解】 由图可知,该合唱团学生参加的人均次数为10×1+50×2+40×3100=2.3.取6件测量数据为:甲:99 100 98 100 100 103 乙:99 100 102 99 100 100 (1)分别计算两组数据的平均数及方差;(2)根据计算说明哪台机床加工零件的质量更稳定. 【精彩点拨】【尝试解答】 (1)x 甲=16[99+100+98+100+100+103]=100,x 乙=16[99+100+102+99+100+100]=100,s 2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73,s 2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)由(1)知x 甲=x 乙,比较它们的方差,∵s 2甲>s 2乙,故乙机床加工零件的质量更稳定.1.在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散程度(即方差或标准差),方差大说明取值分散性大,方差小说明取值分散性小或者取值集中、稳定.2.关于统计的有关性质及规律:(1)若x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数是m x +a ;(2)数据x 1,x 2,…,x n 与数据x 1+a ,x 2+a ,…,x n +a 的方差相等; (3)若x 1,x 2,…,x n 的方差为s 2,那么ax 1,ax 2,…,ax n 的方差为a 2s 2.[再练一题]2.某校高二年级在一次数学选拔赛中,由于甲、乙两人的竞赛成绩相同,从而决定根据平时在相同条件下进行的六次测试确定出最佳人选,这六次测试的成绩数据如下:赛.【解】 设甲、乙两人成绩的平均数分别为x 甲,x 乙,则x 甲=130+16(-3+8+0+7+5+1)=133,x 乙=130+16(3-1+8+4-2+6)=133,s 2甲=16[(-6)2+52+(-3)2+42+22+(-2)2]=473, s 2乙=16[02+(-4)2+52+12+(-5)2+32]=383. 因此,甲与乙的平均数相同,由于乙的方差较小,所以乙的成绩比甲的成绩稳定,应该选乙参加竞赛比较合适.125 121 123 125 127 129 125 128 130 129 126 124 125 127 126 122 124 125 126 128 (1)填写下面的频率分布表:(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数. 【精彩点拨】 将数据分组后依次填写分布表.然后画出直方图,最后根据数字特征在直方图中的求法求解.【尝试解答】 (1)(3)在[124.5,126.5)中的数据最多,取这个区间的中点值作为众数的近似值,得众数为125.5,事实上,众数的精确值为125.图中虚线对应的数据是124.5+2×58=125.75,事实上中位数为125.5.使用“组中值”求平均数:x -=121.5×0.1+123.5×0.15+125.5×0.4+127.5×0.2+129.5×0.15=125.8,事实上平均数的精确值为x -=125.75.1.利用频率分布直方图求数字特征: (1)众数是最高的矩形的底边的中点; (2)中位数左右两侧直方图的面积相等;(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.2.利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数.[再练一题]3.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图2222所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30、0.40、0.15、0.10、0.05.求:图2222(1)高一参赛学生的成绩的众数、中位数;(2)高一参赛学生的平均成绩.【解】(1)由题图可知众数为65,又∵第一个小矩形的面积为0.3,∴设中位数为60+x,则0.3+x×0.04=0.5,得x=5,∴中位数为60+5=65.(2)依题意,平均成绩为:55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,∴平均成绩约为67.[探究共研型]探究1【提示】一组数据的平均数、中位数都是唯一的,众数不唯一,可以有一个,也可以有多个,还可以没有.如果有两个数据出现的次数相同,并且比其他数据出现的次数都多,那么这两个数据都是这组数据的众数.探究2 如何从样本的数字特征中了解数据中是否存在极端数据?【提示】中位数不受几个极端数据的影响,而平均数受每个数据的影响,“越离群”的数据,对平均数的影响越大,因此如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以了解样本数据中极端数据的信息.探究3 众数、中位数有哪些应用?【提示】(1)众数只与这组数据中的部分数据有关,当一组数据中有不少数据重复出现时,众数往往更能反映问题.(2)中位数仅与数据的排列位置有关,中位数可能在所给数据中,也可能不在所给数据中.当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.探究4【提示】(1)数据的离散程度可以通过极差、方差或标准差来描述,极差反映了一组数据变化的最大幅度,它对一组数据中的极端值极为敏感,一般情况下,极差大,则数据波动性大;极差小,则数据波动性小.极差只需考虑两个极端值,便于计算,但没有考虑中间的数据,可靠性较差.(2)标准差和方差则反映了一组数据围绕平均数波动的大小,方差、标准差的运算量较大.因为方差与原始数据单位不同,且平方后可能夸大了偏差程度,所以虽然标准差与方差在体现数据离散程度上是一样的,但解决问题时一般用标准差.探究5 【提示】 (1)样本的数字特征具有随机性,这种随机性是由样本的随机性引起的. (2)样本的数字特征具有规律性,在很广泛的条件下,简单随机样本的数字特征(如众数、中位数、平均数和标准差等)随样本容量的增加而稳定于总体相应的数字特征(总体的数字特征是一定的,不存在随机性).某班4个小组的人数为10,10,x,8,已知该组数据的中位数与平均数相等,求这组数据的中位数.【精彩点拨】 x 的大小未知,可根据x 的取值不同分别求中位数.【尝试解答】 该组数据的平均数为14(x +28),中位数一定是其中两个数的平均数,由于x 不知是多少,所以要分几种情况讨论:(1)当x ≤8时,原数据按从小到大的顺序排列为x,8,10,10,其中位数为12×(10+8)=9. 若14(x +28)=9,则x =8,此时中位数为9.(2)当8<x ≤10时,原数据按从小到大的顺序排列为8,x,10,10,其中位数为12(x +10).若14(x +28)=12(x +10),则x =8,而8不在8<x ≤10的范围内,所以舍去. (3)当x >10时,原数据按从小到大的顺序排列为8,10,10,x ,其中位数为12×(10+10)=10.若14(x +28)=10,则x =12,此时中位数为10.综上所述,这组数据的中位数为9或10.当在数据中含有未知数x ,求该组数据的中位数时,由于x 的取值不同,所以数据由小到大 或由大到小 排列的顺序不同,由于条件的变化,问题的结果有多种情况,不能用同一标准或同一种方法解决,故需分情况讨论,讨论时要做到全面合理,不重不漏.[再练一题]4.为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为______________.【解析】 设5个班级中参加的人数分别为x 1,x 2,x 3,x 4,x 5,则由题意知x 1+x 2+x 3+x 4+x 55=7,(x1-7)2+(x2-7)2+(x3-7)2+(x4-7)2+(x5-7)2=20,五个整数的平方和为20,则必为0+1+1+9+9=20,由|x-7|=3可得x=10或x=4.由|x-7|=1可得x=8或x=6,由上可知参加的人数分别为4,6,7,8,10,故最大值为10.【答案】101.样本101,98,102,100,99的标准差为( )A. 2B.0C.1D.2【解析】样本平均数x=100,方差为s2=2,∴标准差s=2,故选A.【答案】 A2.甲乙两名学生六次数学测验成绩(百分制)如图2223所示.图2223①甲同学成绩的中位数大于乙同学成绩的中位数;②甲同学的平均分比乙同学高;③甲同学的平均分比乙同学低;④甲同学成绩的方差小于乙同学成绩的方差.上面说法正确的是( )A.③④B.①②④C.②④D.①③【解析】甲的中位数81,乙的中位数87.5,故①错,排除B、D;甲的平均分x=16 (76+72+80+82+86+90)=81,乙的平均分x′=16(69+78+87+88+92+96)=85,故②错,③对,排除C,故选A.【答案】 A3.甲、乙、丙、丁四名射手在选拔赛中所得的平均环数x及其方差s2如下表所示,则选送决赛的最佳人选应是( )A.甲B.乙【解析】∵x乙=x丙>x甲=x丁,且s2甲=s2乙<s2丙<s2丁,∴应选择乙进入决赛.【答案】 B4.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图2224,则图2224(1)这20名工人中一天生产该产品数量在[55,75)的人数是________.(2)这20名工人中一天生产该产品数量的中位数为________.(3)这20名工人中一天生产该产品数量的平均数为________.【解析】(1)(0.040×10+0.025×10)×20=13.(2)设中位数为x,则0.2+(x-55)×0.04=0.5,x=62.5.(3)0.2×50+0.4×60+0.25×70+0.1×80+0.05×90=64.【答案】(1)13 (2)62.5 (3)645.甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图2225所示:图2225(1)填写下表:①从平均数和方差结合分析偏离程度;11 ②从平均数和中位数结合分析谁的成绩好些;③从平均数和命中9环以上的次数相结合看谁的成绩好些;④从折线图上两人射击命中环数及走势分析谁更有潜力.【解】 (1)乙的射靶环数依次为2,4,6,8,7,7,8,9,9,10.所以x 乙=110(2+4+6+8+7+7+8+9+9+10)=7;乙的射靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是7+82=7.5;甲的射靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示:甲乙离平均数的程度大.②甲、乙的平均水平相同,而乙的中位数比甲大,说明乙射靶成绩比甲好.③甲、乙的平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的射靶成绩比甲好.④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力.。
高中数学 第二章 统计 2.2.2 用样本的数字特征估计总

高中数学 第二章 统计 2.2.2 用样本的数字特征估计总体的数字特征预习导航 新人教B 版必修31.通过随机抽样,会用样本平均数估计总体平均数,会用样本标准差估计总体标准差.2.掌握几个数据的标准差及方差的计算方法,理解数据标准差的意义和作用.1.众数、中位数、平均数(1)在一组数据中,出现次数最多的数据叫做这组数据的众数.(2)将一组数据按大小依次排列,把处在中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数.(3)如果有n 个数x 1,x 2,x 3,…,x n ,那么x =1n(x 1+x 2+…+x n ),叫做这n 个数的平均数. 总体中所有个体的平均数叫做总体平均数. 样本中所有个体的平均数叫做样本平均数.【做一做1】10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,17,17,16,14,12.设平均数为a ,中位数为b ,众数为c ,则有( )A .a <b <cB .a >b >cC .a <c <bD .c >a >b解析:众数c =17,中位数b =15,平均数a =110×(10+12+14×2+15×2+16+17×3)=14.7,所以a <b <c .答案:A2.样本方差、样本标准差 数据的离散程度可以用极差、方差或标准差来描述.我们知道,样本方差描述了一组数据围绕平均数波动的大小.一般地,设样本的元素为x 1,x 2,…,x n ,样本的平均数为x ,定义s 2=1-x 2+2-x 2+…+n -x 2n , s =1-x 2+2-x2+…+n -x 2n . 其中s 2表示样本方差,s 表示样本标准差.归纳总结 因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.【做一做2-1】 样本101,98,102,100,99的标准差为( )A . 2B .0C .1D .2解析:样本平均数x =15×(101+98+102+100+99)=100,方差s 2=15×[(101-100)2+(98-100)2+(102-100)2+(100-100)2+(99-100)2]=2, ∴s=2.答案:A【做一做2-2】 若k 1,k 2,…,k 6的方差为3,则2(k 1-3),2(k 2-3),…,2(k 6-3)的方差为__________.解析:设k 1,k 2,…,k 6的平均数为k ,则16[(k 1-k )2+(k 2-k )2+…+(k 6-k )2]=3, 而2(k 1-3),2(k 2-3),…,2(k 6-3)的平均数为2(k -3),则所求方差为16[4(k 1-k )2+4(k 2-k )2+…+4(k 6-k )2]=4×3=12.答案:12。
湖北省数学《 2.2.2 用样本的数字特征估计总体的数字特征(第二课时 标准差)》学案 必修3

学习内容2.2.2 用样本的数字特征估计总体的数字特征(第二课时标准差)【学习目标】1.掌握标准差、方程的定义和特征; 2.会求标准差、方差,并能用解决有关问题. 【学习重点】1.理解样本数据标准差的意义和作用;2.体会数字特征的随机性。
【学习难点】体会数字特征的随机性。
【课前预习案】【自主学习】————大胆尝试 1.提出问题: 问题1:如何通过频率分布直方图估计数字特征(中位数、众数、平均数)? 利用频率分布直方图估计众数、中位数、平均数: 估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点) 估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.问题2:某种子公司为了在当地推行两种新水稻品种,对甲、乙两种水稻进行了连续7年的种植对比实验,年亩产量分别如下:(千克) 甲:600, 880, 880, 620, 960, 570, 900(平均773) 乙:800, 860, 850, 750, 750, 800, 700(平均787) 请你用所学统计学的知识,说明选择哪种品种推广更好?选择的依据应该是,产量高且稳产的品种,所以选择乙更为合理.问题3:有甲、乙两种钢筋,现从中各抽取一个标本(如下表)检查它们的抗拉强度(单位:kg/mm 2),通过计算发现,两个样本的平均数均为125. 甲 110 120 130 125 120 125 135 乙115100125130115125125哪种钢筋的质量较好?【具体要求】 阅读课本74页——78页解决课前预习案中的问题 【学法指导】 自主探究、合作交流由上图可以看出,乙样本的最小值100低于甲样本的最小值110,乙样本的最大值145高于甲样本的最大值135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定.我们把一组数据的最大值与最小值的差称为极差(range ).由上图可以看出,乙的极差较大,数据点较分散;甲的极差小,数据点较集中,这说明甲比乙稳定.运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论.问题4:如何考查样本数据的分散程度的大小呢?把数据在坐标系中刻画出来,是否能直观地判断数据的离散程度?把问题3中的数据在坐标系中刻画出来.我们可以很直观地知道,乙组数据比甲组数据更集中在平均数的附近,即乙的分散程度小, 如何用数字去刻画这种分散程度呢? 考察样本数据的分散程度的大小,最常用的统计量是方差和标准差.2.标准差的求法:标准差是样本数据到平均数的一种平均距离,一般用s 表示.s =])()()[(122221x x x x x x nn -++-+- . 3.方差的求法:标准差的平方s 2叫做方差.s 2=222121[()()()]n x x x x x x n-+-++-.其中,x n 是样本数据,n 是样本容量,是样本平均数.4.标准差(方差)用来衡量 样本数据的离散程度 ,标准差(方差)越大,数据的离散程度 越大 ;标准差(方差)越小,数据的离散程 度 越小 .【课堂探究】探究一:标准差的取值范围是什么?标准差为0的样本数据有什么特点?[0,)+∞;该组各数据全相等,表明数据没有波动,数据没有离散性。
高中数学 第2章 统计 2.2.2 用样本的数字特征估计总体的数字特征学案 新人教A版必修3

学习资料2。
2。
2 用样本的数字特征估计总体的数字特征学习目标核心素养1.会求样本的众数、中位数、平均数、标准差、方差.(重点)2.理解用样本的数字特征来估计总体数字特征的方法.(重点)3.会应用相关知识解决实际统计问题.(难点)1.通过数字特征的计算,提升数学运算素养.2.借助实际统计问题的应用,培养数学建模素养。
1.众数、中位数、平均数的概念(1)众数:一组数据中出现次数最多的数.(2)中位数:一组数据按大小顺序排列后,处于中间位置的数.如果个数是偶数,则取中间两个数据的平均数.(3)平均数:一组数据的和除以数据个数所得到的数.2.三种数字特征的比较名称优点缺点众数①体现了样本数据的最大集中点;②容易计算①它只能表达样本数据中很少的一部分信息;②无法客观地反映总体的特征中位数①不受少数几个极端数据(即排序靠前或靠后的数据)的影响;②容易计算,便于利用中间数据的信息对极端值不敏感平均数代表性较好,是反映数据集中趋势的量.一般情况下,可以反映出更多的关于样本数据全体的信息任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大(1)标准差:标准差是样本数据到平均数的一种平均距离,一般用s表示,s=错误!.(2)方差:标准差的平方s2叫做方差.s2=错误![(x1-错误!)2+(x2-错误!)2+…+(x n-错误!)2].其中,x n是样本数据,n是样本容量,错误!是样本平均数.思考:在统计中,计算方差的目的是什么?[提示]方差与标准差描述了一组数据围绕平均数波动的大小,其值越大,数据离散程度越大,当其值为0时,说明样本各数据相等,没有离散性.1.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是() A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数B[标准差能反映一组数据的稳定程度.]2.数据101,98,102,100,99的标准差为()A。
高中数学第二章统计2-2用样本估计总体2-2-2用样本的数字特征估计总体的数字特征优化练习新人教A版必修3

高中数学第二章统计2-2用样本估计总体2-2-2用样本的数字特征估计总体的数字特征优化练习新人教A版必修3[课时作业][A组学业水平达标]1.下列说法不正确的是( )A.方差是标准差的平方B.标准差的大小不会超过极差C.若一组数据的值大小相等,没有波动变化,则标准差为0 D.标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散解析:标准差越小,表明各个样本数据在样本平均数周围越集中;标准差越大,表明各个样本数据在样本平均数的周围越分散.答案:D 2.数学测验中,某小组14名学生分别与全班的平均分85分的差是:2,3,-3,-5,12,12,8,2,-1,4,-10,-2,5,5,这个小组的平均分是( )B.87.29A.97.2D.82.86C.92.32 解析:2,3,-3,-5,12,12,8,2,-1,4,-10,-2,5,5的平均数为:(2+3-3-5+12+12+8+2-1+4-10-2+5+5)÷14=≈2.29,故这个小组的平均成绩是85+2.29=87.29(分).故选B.答案:B 3.一次数学考试后,某老师从自己所带的两个班级中各抽取5人,记录他们的考试成绩,得到如图所示的茎叶图.已知甲班5名同学成绩的平均数为81,乙班5名同学成绩的中位数为73,则x-y的值为( )B.-2A.2D.-3C.3解析:由题意得=81⇒x=0,易知y=3.∴x-y=-3,故选D.答案:D 4.某品牌空调在春节期间举行促销活动,下面的茎叶图表示某专卖店记录的每天销售量的情况(单位:台),则销售量的中位数是( )B.14A.13D.16C.15 解析:由茎叶图可知这些数分别为5,8,10,14,16,16,20,23,∴中位数为=15,故选C.答案:C 5.某项测试成绩满分为10分,现随机抽取30名学生参加测试,得分如图所示,假设得分值的中位数为me,平均值为,众数为m0,则( ) B.me=m0<xA.me=m0=D.m0<me<xC.me<m0<解析:由图可知m0=5.由中位数的定义知应该是第15个数与第16个数的平均值,由图知将数据从小到大排,第15个数是5,第16个数是6,所以me==5.5. x=(3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2)≈5.97>5.5,。
2.2.2 用样本的数字特征估计总体的数字特征(2)
测量样本数据分散程度的工具 :
− − − 1 2 2 s = ( x1 − x) + ( x2 − x) + ⋯ + ( xn − x) 2 . n 2
甲乙两人同时生产内径为25.40mm的一种零件 的一种零件. 例2 甲乙两人同时生产内径为 的一种零件 为了对两人的生产质量进行评比,从他们生产的零件 为了对两人的生产质量进行评比 从他们生产的零件 中各抽出20件 量得其内径尺寸如下 单位:mm) 量得其内径尺寸如下(单位 中各抽出 件,量得其内径尺寸如下 单位 甲 25.46, 25.32, 25.45, 25.39, 25.36 25.34, 25.42, 25.45, 25.38, 25.42 25.39, 25.43, 25.39, 25.40, 25.44 25.40, 25.42, 25.35, 25.41, 25.39 乙 25.40, 25.43, 25.44, 25.48, 25.48 25.47, 25.49, 25.49, 25.36, 25.34 25.33, 25.43, 25.43, 25.32, 25.47 25.31, 25.32, 25.32, 25.32, 25.48
x甲 = 25.4005, x乙 = 25,4008; s甲 = 0.038, s乙 = 0.074
−
−
从样本平均数看,甲生产的零件内径比乙生产的更接 从样本平均数看 甲生产的零件内径比乙生产的更接 近内径标准(25.40mm),但是差异很小 从样本标准差看 但是差异很小;从样本标准差看 近内径标准 但是差异很小 从样本标准差看, 由于
−
−
x =5
S=0.82
−
x=5
S=1.49
1 2 3 45 (2)
2017-2018学年高中数学 第二章 统计 2.2 用样本估计总体 2.2.2 用样本的数字特征估
2.2.2 用样本的数字特征估计总体的数字特征(1)如何根据样本数据的频率分布直方图,分别估计总体的众数、中位数和平均数?(2)如何理解众数、中位数、平均数与极端数据的关系?(3)平均数向我们提供了样本数据的重要信息,平均数会使我们作出对总体的片面判断吗?(4)方差、标准差有什么区别与联系?[新知初探]1.众数、中位数、平均数的概念(1)众数:一组数据中出现次数最多的数.(2)中位数:一组数据按大小顺序排列后,处于中间位置的数.如果个数是偶数,则取中间两个数据的平均数.(3)平均数:一组数据的和除以数据个数所得到的数.2.三种数字特征的比较名称优点缺点众数①体现了样本数据的最大集中点;②容易计算①它只能表达样本数据中很少的一部分信息;②无法客观地反映总体的特征中位数①不受少数几个极端数据(即排序靠前或靠后的数据)的影响;对极端值不敏感预习课本P3~6,思考并完成以下问题3.标准差、方差的概念与计算公式 (1)标准差:标准差是样本数据到平均数的一种平均距离,一般用s 表示,s = 1nx 1-x2+x 2-x2+…+x n -x2].(2)方差:标准差的平方s 2叫做方差.s 2=1n[(x 1-x )2+(x 2-x )2+…+(x 其中,x n 是样本数据,n 是样本容量,[点睛](1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.(2)标准差、方差的取值范围:[0,+∞).标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.[小试身手]1.下列说法不正确的是( ) A .方差是标准差的平方 B .标准差的大小不会超过极差C .若一组数据的值大小相等,没有波动变化,则标准差为0D .标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散解析:选D 标准差越小,表明各个样本数据在样本平均数周围越集中;标准差越大,表明各个样本数据在样本平均数的周围越分散.2.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( )A .a >b >cB .b >c >aC .c >a >bD .c >b >a解析:选D 将数据从小到大排列为10,12,14,14,15,15,16,17,17,17,则平均数a =110(10+12+14×2+15×2+16+17×3)=14.7,中位数b =15,众数c =17, 显然a <b <c ,选D.3.奥运会体操比赛的计分规则为:当评委亮分后,其成绩先去掉一个最高分,去掉一个最低分,再计算剩下分数的平均值,这是因为( )A .减少计算量B .避免故障C .剔除异常值D .活跃赛场气氛解析:选C 因为在体操比赛的评分中使用的是平均分,记分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量公平.4.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为________.解析:由题意知15(a +0+1+2+3)=1,解得a =-1.所以样本方差为s 2=15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.答案:2[典例] (单位:岁):甲群:13,13,14,15,15,15,15,16,17,17; 乙群:54,3,4,4,5,6,6,6,6,56.(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?[解] (1)甲群市民年龄的平均数为13+13+14+15+15+15+15+16+17+1710=15(岁),中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征. (2)乙群市民年龄的平均数为54+3+4+4+5+6+6+6+6+5610=15(岁),中位数为6岁,众数为6岁.由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.平均数、众数、中位数的计算方法平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.[活学活用](广东高考)已知样本数据x 1,x 2,…,x n x =5,则样本数据2x 1+1,2x 2+1,…,2x n +1的均值为________.解析:由条件知x =x 1+x 2+…+x n n =5,则所求均值x 0=2x 1+1+2x 2+1+…+2x n +1n=x 1+x 2+…+x n +n=2x +1=2×5+1=11.答案:11标准差(方差)的计算及应用[典例] 甲、乙两名战士在相同条件下各打靶 甲:8,6,7,8,6,5,9,10,4,7; 乙:6,7,7,8,6,7,8,7,9,5.(1)分别计算以上两组数据的平均数;(2)分别求出两组数据的方差;(3)根据计算结果,估计两名战士的射击情况.若要从这两人中选一人参加射击比赛,选谁去合适?[解] (1)x 甲=110×(8+6+7+8+6+5+9+10+4+7)=7(环),x 乙=110×(6+7+7+8+6+7+8+7+9+5)=7(环).(2)由方差公式s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],得s 2甲=3,s 2乙=1.2.(3)x 甲=x 乙,说明甲、乙两战士的平均水平相当.又s2甲>s2乙,说明甲战士射击情况波动比乙大.因此,乙战士比甲战士射击情况稳定.从成绩的稳定性考虑,应选择乙参加比赛.计算标准差的5步骤(1)求出样本数据的平均数x.(2)求出每个样本数据与样本平均数的差x i-x(i=1,2,…,n).(3)求出x i-x(i=1,2,…,n)的平方值.(4)求出上一步中n个平方值的平均数,即为样本方差.(5)求出上一步中平均数的算术平方根,即为样本标准差.[活学活用]从甲、乙两种玉米的苗中各抽10株,分别测它们的株高如下:(单位:cm)甲:25 41 40 37 22 14 19 39 21 42;乙:27 16 44 27 44 16 40 40 16 40.问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?解:(1)x甲=110(25+41+40+37+22+14+19+39+21+42)=110×300=30(cm),x乙=110(27+16+44+27+44+16+40+40+16+40)=110×310=31(cm).所以x甲<x乙.即乙种玉米苗长得高.(2)s2甲=110[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=110(25+121+100+49+64+256+121+81+81+144)=110×1 042=104.2(cm2),s2乙=110[2×(27-31)2+3×(16-31)2+2×(44-31)2+3×(40-31)2]=110×1 288=128.8(cm2).所以s2甲<s2乙.即甲种玉米苗长得齐.[典例] 某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.(1)求这次测试数学成绩的众数; (2)求这次测试数学成绩的中位数. [解] (1)由题图知众数为70+802=75.(2)由题图知,设中位数为x ,由于前三个矩形面积之和为0.4,第四个矩形面积为,因此中位数位于第四个矩形内,得0.1=0.03(x -70)众数、中位数、平均数与频率分布直方图的关系(1)这20名工人中一天生产该产品数量在[55,75)的人数是________.(2)这20名工人中一天生产该产品数量的中位数为________. (3)这20名工人中一天生产该产品数量的平均数为________. 解析:(1)在[55,75)的人数为(0.040×10+0.025×10)×20=13. (2)设中位数为x ,则0.2+(x -55)×0.04=0.5,x =62.5. (3)0.2×50+0.4×60+0.25×70+0.1×80+0.05×90=64. 答案:(1)13 (2)62.5 (3)64[层级一 学业水平达标]1.甲、乙两名篮球运动员在某几场比赛中得分的茎叶图如图所示,则甲、乙两人这几场比赛得分的中位数之和是( )A .63B .64C .65D .66解析:选 A 甲、乙两人在这几场比赛中得分的中位数分别是36和27,则中位数之和是36+27=63.2.下列说法中,不正确的是( ) A .数据2,4,6,8的中位数是4,6 B .数据1,2,2,3,4,4的众数是2,4C .一组数据的平均数、众数、中位数有可能是同一个数据D .8个数据的平均数为5,另3个数据的平均数为7,则这11个数据的平均数是8×5+7×311解析:选A 数据2,4,6,8的中位数为4+62=5,显然A 是错误的,B 、C 、D 都是正确的.故选A.3.已知一组数据,现将每个数据都加上m ,则新的一组数据的平均数与原来一组数的平均数相比( )A .扩大到m 倍B .增加m 倍C .数值不变D .增加m解析:选D 设原来一组数据为x 1,x 2,…,x n ,平均数x ,那么加上m 后得到的一组新数据为x 1+m ,x 2+m ,…,x n +m ,其平均数x ′=m +x 1+x 2+…+x nn=m +x .故答案为D.4.如图是一次考试结果的统计图,根据该图可估计,这次考试的平均分数为( )A.46 B.36C.56 D.60解析:选A 根据题中统计图,可估计有4人成绩在[0,20)之间,其考试分数之和为4×10=40;有8人成绩在[20,40)之间,其考试分数之和为8×30=240;有之间,其考试分数之和为10×50=500;有6人成绩在[60,80)之间,=420;有2人成绩在[80,100)之间,其考试分数之和为2×90=180数为4+8+10+6+2=30,考试总成绩为40+240+500+420+180==46.5.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:(1)高一参赛学生的成绩的众数、中位数;(2)高一参赛学生的平均成绩.解:(1)由图可知众数为65,∵第一个小矩形的面积为0.3,∴设中位数为60+x,则0.3+x×0.04=0.5,得x=5,∴中位数为60+5=65.(2)依题意,平均成绩为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,故平均成绩约为67.[层级二应试能力达标]1.如图为甲、乙两名篮球运动员每场比赛得分情况的茎叶图,则甲和乙得分的中位数的和是( )A.56分B .57分C .58分D .59分解析:选B 易得甲得分的中位数是32,乙得分的中位数是25,其和为32+25=57. 2.在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( )A .9.4,0.484B .9.4,0.016C .9.5,0.04D .9.5,0.016解析:选D x =9.4×3+9.6+9.75=9.5,s 2=15(0.12×4+0.22)=0.016.3.如图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为x A 和x B ,样本标准差分别为s A 和s B ,则( )A.x A >x B ,s A >s BB.x A <x B ,s A >s BC.x A >x B ,s A <s BD.x A <x B ,s A <s B解析:选B 由图易得x A <x B ,又A 波动性大,B 波动性小,所以s A >s B .4.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x ,则( )A .m e =m 0=xB .m e =m 0<xC .m e <m 0<xD .m 0<m e <x解析:选D 由题目所给的统计图可知,30个数据按大小顺序排列好后,中间两个数为5,6,故中位数为m e =5+62=5.5.又众数为m 0=5,平均值x =130(3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2)=17930,∴m 0<m e <x .5.五个数1,2,3,4,a 的平均数是3,则a =________,这五个数的标准差是________. 解析:由1+2+3+4+a5=3,得a =5;由s 2=15[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2答案:526.某医院急救中心随机抽取20用上述分组资料计算出病人平均等待时间的估计值解析:x =120(2.5×4+7.5×8+12.5×5+17.5×2+22.5×1)=9.5.答案:9.510次,命中环数如下:7,8,7,9,5,4,9,10,7,4.+4+9+10+7+4)=7.7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-答案:(1)7 (2)28.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表).(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?解:(1)频率分布直方图如图所示:(2)质量指标值的样本平均数为:x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为:s2=(80-100)2×0.06+(90-100)2×0.26+(100-100)2×0.38+(110-100)2×0.22+(120-100)2×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.9.(广东高考)某工厂36名工人的年龄数据如下表.到的年龄数据为44,列出样本的年龄数据.(2)计算(1)中样本的均值x 和方差s 2.(3)36名工人中年龄在x -s 与x +s 之间有多少人?所占的百分比是多少(精确到0.01%)?解:(1)36人分成9组,每组4人,其中第一组的工人年龄为44,所以它在组中的编号为2,所以所有样本数据的编号为4n -2(n =1,2,…,9), 其年龄数据为:44,40,36,43,36,37,44,43,37. (2)由均值公式知:x =44+40+…+379=40,由方差公式知:s 2=19[(44-40)2+(40-40)2(3)因为s 2=1009,s =103,所以36名工人中年龄在x -s [37,43]上的人数, 即40,40,41,…,39,共23s 之间的人数所占的百分比为2336×100%≈63.89%.。
2018版高中数学 第二章 统计 2.2.2 用样本的数字特征估计总体的数字特征学案 新人教A版必修
2.2.2 用样本的数字特征估计总体的数字特征[学习目标] 1.正确理解样本数据标准差的意义和作用,学会计算数据的标准差.2.理解用样本的基本数字特征来估计总体的基本数字特征.知识点一众数、中位数、平均数1.众数、中位数、平均数定义(1)众数:一组数据中重复出现次数最多的数.(2)中位数:把一组数据按从小到大的顺序排列,处在中间位置(或中间两个数的平均数)的数叫做这组数据的中位数.(3)平均数:如果n个数x1,x2,…,x n,那么x=1n(x1+x2+…+x n)叫做这n个数的平均数.2.三种数字特征与频率分布直方图的关系1.标准差(1)平均距离与标准差标准差是样本数据到平均数的一种平均距离,一般用s表示.假设样本数据是x1,x2,…,x n,x表示这组数据的平均数.x i到x的距离是|x i-x|(i=1,2,…,n),则用如下公式来计算标准差:s =1nx1-x2+x2-x2+…+x n-x2].(2)计算标准差的步骤①求样本数据的平均数x;②求每个样本数据与样本平均数的差x i-x(i=1,2,…,n);③求(x i -x )2(i =1,2,…,n );④求s 2=[1n(x 1-x )2+(x 2-x )2+…+(x n -x )2];⑤求s =s 2,即为标准差. 2.方差标准差的平方s 2叫做方差.s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中,x i (i =1,2,…,n )是样本数据,n 是样本容量,x 是样本平均数.题型一 众数、中位数、平均数的简单运用例1 某公司的33名职工的月工资(以元为单位)如下表:(2)假设副董事长的工资从5000元提升到20000元,董事长的工资从5500元提升到30000元,那么新的平均数、中位数、众数又是多少?(精确到元)(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法. 解 (1)平均数是:x =1500+4000+3500+2000×2+1500+1000×5+500×3+0×2033≈1500+591=2091(元),中位数是1500元,众数是1500元. (2)新的平均数是x ′=1500+28500+18500+2000×2+1500+1000×5+500×3+0×2033≈1500+1788=3288(元),新的中位数是1500元,新的众数是1500元.(3)在这个问题中,中位数或众数均能反映该公司员工的工资水平,因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.反思与感悟 1.众数、中位数及平均数都是描述一组数据集中趋势的量,当一组数据中个别数据较大时,可用中位数描述其集中趋势,当一组数据中有不少数据重复出现时,其众数往往更能反映问题.2.在求平均数时,可采用新数据法,即当所给数据在某一常数a 的左右摆动时,用简化公式:x =x ′+a .跟踪训练1 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:解 在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是 1.70;这组数据的平均数是x =117(1.50×2+1.60×3+…+1.90×1)=28.7517≈1.69(m).答 17名运动员成绩的众数、中位数、平均数依次为1.75m ,1.70m,1.69m. 题型二 平均数和方差的运用例2 甲、乙两机床同时加工直径为100cm 的零件,为检验质量,各从中抽取6件测量,数据为甲:99 100 98 100 100 103 乙:99 100 102 99 100 100 (1)分别计算两组数据的平均数及方差;(2)根据计算结果判断哪台机床加工零件的质量更稳定. 解 (1)x 甲=16(99+100+98+100+100+103)=100,x 乙=16(99+100+102+99+100+100)=100.s 2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73, s 2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)两台机床所加工零件的直径的平均值相同, 又s 2甲>s 2乙,所以乙机床加工零件的质量更稳定. 反思与感悟 1.极差、方差与标准差的区别与联系: 数据的离散程度可以通过极差、方差或标准差来描述.(1)极差是数据的最大值与最小值的差,它反映了一组数据变化的最大幅度,它对一组数据中的极端值非常敏感.(2)方差或标准差则反映了一组数据围绕平均数波动的大小,为了得到以样本数据的单位表示的波动幅度通常用标准差,即样本方差的算术平方根,是样本数据到平均数的一种平均距离. 2.在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度,在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,数据越集中,质量越稳定.跟踪训练2 某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其质量,分别记录抽查数据如下(单位:kg): 甲:102 101 99 98 103 98 99 乙:110115908575115110 (1)这种抽样方法是哪一种方法?(2)试计算甲、乙两个车间产品质量的平均数与方差,并说明哪个车间产品比较稳定. 解 (1)采用的抽样方法是:系统抽样.(2)x 甲=17(102+101+99+98+103+98+99)=100;x 乙=17(110+115+90+85+75+115+110)=100;x 2甲=17[(102-100)2+(101-100)2+(99-100)2+(98-100)2+(103-100)2+(98-100)2+(99-100)2]=17(4+1+1+4+9+4+1)≈3.43; s 2乙=17[(110-100)2+(115-100)2+(90-100)2+(85-100)2+(75-100)2+(115-100)2+(110-100)2]=17(100+225+100+225+625+225+100) ≈228.57.所以s 2甲<s 2乙,故甲车间产品较稳定. 题型三 频率分布与数字特征的综合应用 例3 已知一组数据:125 121 123 125 127 129 125 128 130 129 126 124 125 127 126 122 124 125 126 128 (1)填写下面的频率分布表:(2)作出频率分布直方图;(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数. 解 (1)(2)频率分布直方图如下:(3)在[125,127)中的数据最多,取这个区间的中点值作为众数的近似值,得众数126,事实上,众数的精确值为125.图中虚线对应的数据是125+2×58=126.25,事实上中位数为125.5.使用“组中值”求平均数:x =122×0.1+124×0.15+126×0.4+128×0.2+130×0.15=126.3,平均数的精确值为x =125.75.反思与感悟 1.利用频率分布直方图估计数字特征: (1)众数是最高的矩形的底边中点的横坐标. (2)中位数左右两侧直方图面积相等.(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和. 2.利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致.跟踪训练3 某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05..求:(1)高一参赛学生成绩的众数、中位数; (2)高一参赛学生的平均成绩. 解 (1)由图可知众数为65, 又∵第一个小矩形的面积为0.3,∴设中位数为60+x ,则0.3+x ×0.04=0.5,得x =5, ∴中位数为60+5=65.(2)依题意,平均成绩为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,∴平均成绩约为67.分类讨论思想例4 某班有四个学习小组,各小组人数分别为10,10,x,8,已知这组数据的中位数与平均数相等,求这组数据的中位数.分析 由于x 未知,因此中位数不确定,需讨论.解 该组数据的平均数为14(10+10+x +8)=14(28+x ),中位数是这4个数按从小到大的顺序排列后处在最中间两个数的平均数.(1)当x ≤8时,原数据从小到大排序为x,8,10,10,中位数是9,由14(28+x )=9,得x =8,符合题意,此时中位数是9;(2)当8<x ≤10时,原数据从小到大排序为8,x,10,10,中位数是12(x +10),由14(28+x )=12(10+x ),得x =8,与8<x ≤10矛盾,舍去; (3)当x >10时,原数据从小到大排序为8,10,10,x ,中位数是10,由14(28+x )=10,得x=12,符合题意,此时中位数是10. 综上所述,这组数据的中位数是9或10.解后反思 一组数据按从小到大排列,中间一个(或中间两项的平均数)为中位数.当题目中含有参数,且参数的不同取值影响求解结果时,需对参数的取值分类讨论.1.下列选项中,能反映一组数据的离散程度的是( ) A .平均数 B .中位数 C .方差 D .众数答案 C解析 由方差的定义,知方差反映了一组数据的离散程度.2.一组样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,其中位数为22,则x 等于( )A .21B .22C .20D .23 答案 A解析 根据题意知,中位数22=x +232,则x =21.3.一组样本数据a,3,5,7的平均数是b ,且a ,b 是方程x 2-5x +4=0的两根,则这个样本的方差是( ) A .3B .4C .5D .6 答案 C解析 x 2-5x +4=0的两根是1,4. 当a =1时,a,3,5,7的平均数是4; 当a =4时,a,3,5,7的平均数不是1. 所以a =1,b =4,则方差为s 2=5.4.一次选拔运动员的测试中,测得7名选手中的身高(单位:cm)分布的茎叶图如图所示.记录的平均身高为177cm ,有一名候选人的身高记录不清楚,其末位数记为x ,则x 等于( )A .5B .6C .7D .8 答案 D解析 由题意知,10+11+0+3+x +8+9=7×7,解得x =8.5.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4 则:(1)平均命中环数为________; (2)命中环数的标准差为________. 答案 (1)7 (2)2解析 (1)x =7+8+7+9+5+4+9+10+7+410=7.(2)∵s 2=110[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,∴s =2.1.一组数据中的众数可能不止一个,中位数是唯一的,求中位数时,必须先排序. 2.利用直方图求数字特征时,一方面要掌握众数、中位数、平均数的计算方法;另一方面要理解这些数字特征只是真实数据的估计值.3.标准差的平方s 2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,方差一定程度上夸大了离散程度,在实际应用中一般多采用标准差.。
2.2.2用样本的数字特征估计总体的数字特征
甲的环数极差=10- 4=6 甲的环数极差=10- 4=6 =10
乙的环数极差=9-5=4 乙的环数极差=9-5=4. =9
它们在一定程度上表明了样本数据的分散程度, 它们在一定程度上表明了样本数据的分散程度,与平均 数一起,可以给我们许多关于样本数据的信息.显然, 数一起,可以给我们许多关于样本数据的信息.显然,极差对极端 值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高 值非常敏感,注意到这一点,我们可以得到一种“ 去掉一个最低分”的统计策略. 分,去掉一个最低分”的统计策略. 考察样本数据的分散程度的大小,最常用的统计量是标准 考察样本数据的分散程度的大小,最常用的统计量是标准 标准差是样本数据到平均数的一种平均距离,一般用s 是样本数据到平均数的一种平均距离 差.标准差是样本数据到平均数的一种平均距离,一般用s表 示. 所谓“平均距离” 其含义可作如下理解: 所谓“平均距离”,其含义可作如下理解:
频率 组距
0.5 0.4 0.3 0.2 0.1 O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)
2、在样本中,有50%的个体小于或等于 在样本中, 50% 中位数,也有50 50% 中位数,也有50%的个体大于或等于中位 因此,在频率分布直方图中, 数,因此,在频率分布直方图中,中位数 左边和右边的直方图的面积应该相等,由 左边和右边的直方图的面积应该相等, 此可以估计中位数的值。 此可以估计中位数的值。下图中虚线代表 居民月均用水量的中位数的估计值, 居民月均用水量的中位数的估计值,此数 据值为2.02t. 据值为2.02t.
人员 工 月 资 人数 合计 理 理 员 工 人 徒 合 经 管 人 技 工 学 计
张 计 发 表 资 总 均 恰 中 小 通 算 现 关工 的 平 数 为 ( × + × + × + × )÷ = 没 错 并 有 .
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.2.2用样本的数字特征估计总体的数字特征
1.如果5个数1x ,2x ,3x ,4x ,5x 的平均数是7 ,那么1x +1,2x +1,3x +1,4x +1,5x +1这5个数的平均数是( )
A.5
B.6
C.7
D.8
2.下面说法:
①如果一组数据的众数是5,那么这组数据中出现次数最多的数是5;
②如果一组数据的平均数是0,那么这组数据的中位数为0 ;
③如果一组数据1,2,x ,4的中位数是3 ,那么x =4;
④如果一组数据的平均数是正数,那么这组数据都是正数
其中错误的个数是( )
A.1
B.2
C.3
D.4
3. 一组数据12,15,24,25,31,31,36,36,37,39,44,49,50的中位数是( ) A.31 B.36 C.35 D.34
4.某农科所种植的甲、乙两种水稻,连续六年在面积相等的两块稻田中作对比试验,试验得出平均产量是x 甲=x 乙=415㎏,方差是2s 甲=794,2s 乙=958,那么这两个水稻品种中产量比较稳定的是( )
A.甲
B.乙
C.甲、乙一样稳定
D.无法确定
5.对一射击选手的跟踪观测,其环数及相应频率如下:
环数 6 7 8 9 10
频率 15% 25% 40% 10% 10%
求该选手的平均成绩__________。
6.五个数1,2,3,4, a 的平均数是3 ,则a =_______,这五个数的标准差是___________.
7.已知2,4,2x ,4y 四个数的平均数是5而5,7,4x ,6y 四个数的平均数是9,则x y 的值是___________.
8.已知样本数据1x ,2x ,…n x 的方差为4,则数据21x +3,22x +3,…2n x +3的标准差是_____.
9.甲.乙两名射手在相同条件下射击10次,环数如下:
甲:7 8 8 9 9 9 9 10 10 10
乙:7 7 8 9 9 9 10 10 10 10
问哪一名选手的成绩稳定?
10.样本101,98,102,100,99的标准差为______
11.在统计中,样本的标准差可以近似地反映总体的( )
A.平均状态
B.分布规律
C.波动大小
D.最大值和最小值
12.两个样本甲和乙,其中x
甲=10,x
乙
=10,2s甲=0.055,2s乙=0.015,那么样本甲比样本乙波动( )
A. 大
B. 相等
C. 小
D.无法确定
13.频率分布直方图的重心是( )
A.众数
B.中位数
C.标准差
D.平均数
14.能反映一组数据的离散程度的是( )
A.众数
B.平均数
C.标准差
D.极差
15.与原数据单位不一样的是( )
A.众数
B.平均数
C.标准差
D.方差
16.下列数字特征一定是数据组中数据的是( )
A.众数
B.中位数
C.标准差
D.平均数
17.数据:1,1,3,3的众数和中位数分别是( )
A. 1或3,2
B. 3,2
C. 1或3,1或3
D. 3,3
18.某医院为了了解病人每分钟呼吸次数,对20名病人进行测量,记录结果如下:12,20,16,18,20,28,23,16,15,18,20,24,18,21,18,19,18,31,18,13,
求这组数据的平均数,中位数,众数.
19.某班进行个人投篮比赛,受污损的下表记录了在规定时间内投进n个球的人数分
布情况:
2
同时,已知进球3个或3个以上的人平均每人投进3.5个球,进球4个或4个以下
人平均每人投进2.5个球.那么投进3个球和4个球的各有多少人?。