平均数、众数、中位数、极差、方差、标准差
数理统计平均数、中位数、众数,极差、标准差、方差

平均数、中位数和众数的知识归纳与梳理:(一)平均数:一组数据的总和除以这组数据个数所得到的商叫这组数据的平均数。
即x=(x1+x2+……+xn)÷n中位数:将一组数据按大小顺序排列,处在最中间位置的一个数或最中间的两个数的平均数叫做这组数据的中位数。
众数:在一组数据中出现次数最多的数叫做这组数据的众数。
平均数:一组数据的平均值平均水平平均数是描述一组数据的一种常用指标,反映了这组数据中各数据的平均大小。
平均数的大小与一组数据里的每个数据都有关系,其中任何数据的变动都会引起平均数的相应变动平均数一般的计算方法为:用一组数据的总和除以这组数据的个数.平均数的优点。
反映一组数的总体情况比中位数、众数更为可靠、稳定.平均数的缺点。
平均数需要整批数据中的每一个数据都加人计算,因此,在数据有个别缺失的情况下,则无法准确计算,计算的工作量也较大。
平均数易受极端数据的影响,从而使人对平均数产生怀疑。
中位数:在有序排列的一组数据中最居中的那个数据中等水平中位数是描述数据的另一种指标,如果将一组数按从小到大排列那么中位数的左边和右边恰有一样多的数据。
中位数仅与数据的大小排列位置有关,某些数据的变动对它的中位数没有影响.中位数是将数据按大小顺序依次排列(相等的数也要全部参加排序)后“找”到的.当数据的个数是奇数时,中位数就是最中间的那个数据;当数据的个数是偶数时,就取最中间的两个数据的平均数作为中位数.中位数的优点。
简单明了,很少受一组数据的极端值的影响。
中位数的缺点。
中位数不受其数据分布两端数据的影响,因此中位数缺乏灵敏性,不能充分利用所有数据的信息。
当观测数据已经分组或靠近中位数附近有重复数据出现时,则难以用简单的方法确定中位数。
众数一组数据中出现次数最多的那个数据。
集中趋势众数告诉我们,这个值出现次数最多,一组数据可以有不止一个众数,也可以没有众数。
众数着眼于对各数据出现的频数的考查,其大小只与这组数据中的部分数据有关.一组数据中的众数不止一个.当一组数据中有相同数据多次出现时,其众数往往是我们关心的.众数的优点比较容易了解一组数据的大致情况,不受极端数据的影响,并且求法简便。
§4 4.1 平均数、中位数、众数、极差、方差 4.2 标准差

在上一节中,从甲、乙两个城市随机抽取的16 16台自动 例2 在上一节中,从甲、乙两个城市随机抽取的16台自动 售货机的销售额可以用茎叶图表示,如图所示: 售货机的销售额可以用茎叶图表示,如图所示: (1)甲、乙两组数据的中位数、众数、极差分别是多少? 乙两组数据的中位数、众数、极差分别是多少? (2)你能从图中分别比较甲、乙两组数据的平均数和方差 你能从图中分别比较甲、 的大小吗? 的大小吗? 观察茎叶图, 解:(1) 观察茎叶图,我们不难 看出: 看出:甲城市销售额的中位数为 20,众数为10,18,30,极差为53;乙 20,众数为10,18,30,极差为53;乙 众数为10,18,30,极差为53; 城市销售额的中位数为29,众数为 城市销售额的中位数为29,众数为 29, 23,34,极差为38. 23,34,极差为38.
5. 方 差 是 样 本 数 据 到 平 均 数 的 平 均 距 离 , 一 般 用 s 2 表 示 , 通 常 用 公 式
1 s 2 = [( x1 − x ) 2 + ( x2 − x ) 2 + L + ( xn − x ) 2 ] 来计算.反映了数据的离散程度.方差越大,数据的离散程度越 来计算.反映了数据的离散程度.方差越大, n
(2)从茎叶图中我们不难看出:甲城市销售额分布主要在 从茎叶图中我们不难看出: 茎叶图的上方且相对较散, 茎叶图的上方且相对较散,而乙城市的销售额分布则相对 集中在茎叶图的中部.由此,我们可以估计:甲城市销售额 集中在茎叶图的中部.由此,我们可以估计: 的平均数比乙城市的小,而方差比乙城市的大. 的平均数比乙城市的小,而方差比乙城市的大.
对数据数字特征内容的评价, 对数据数字特征内容的评价,应当更多地关注对其本 身意义的理解和在新情境中的应用, 身意义的理解和在新情境中的应用,而不是记忆和使用的 熟练程度. 熟练程度.
平均数、中位数、众数、极差、方差标准差的概念讲解

【解析】1.选A.中位数为 1 (91+92)=91.5;
2
平均数为 1 (87+89+90+91+92+93+94+96)=91.5.
8
2. x甲=1 (65+82+80+85)=78,
4
x乙=1 (75+65+70+90)=75,
4
知识点2 对方差与标准差的理解 标准差、方差的作用 (1)标准差、方差描述了一组数据围绕着平均数波动的大小, 标准差、方差越大,数据的离散程度越大;标准差、方差越小, 数据的离散程度越小. (2)标准差、方差为0时,表明样本数据全相等,数据没有波动 幅度和离散性.
(2)据报道,某公司的33名职工的月工资(以元为单位)如下:
职务
人数 工资
董事 长
副董 事长
董事
总经 理
经理
管理 员
职员
1
1
2
1
5
3 20
5 500 5 000 3 500 3 000 2 500 2 000 1 500
①求该公司职工月工资的平均数、中位数、众数. ②假设副董事长的工资从5000元提升到20000元,董事长的工资 从5500元提升到30000元,那么新的平均数、中位数、众数又是 什么?(精确到元) ③你认为哪个统计量更能反映这个公司员工的工资水平?结合 此问题谈一谈你的看法.
【即时练】
1.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,
则这组数据的中位数和平均数分别是
()
A.91.5和91.5
B.91.5和92
C.91和91.5
D.92和92
统计学第3章数值性的主要统计指标

统计学第3章数值性的主要统计指标统计学中,数值性的主要统计指标是描述和总结数据集中数值变量的中心趋势和离散程度。
这些指标包括平均数、中位数、众数、四分位数、极差、方差和标准差等。
1. 平均数(Mean)是数据集中所有数值的总和除以观测次数。
它是一种常见的统计指标,用于表示数据的“典型”数值。
平均数对异常值敏感,受数据的分布和范围影响较大。
2. 中位数(Median)是将数据按大小排序后,处于中间位置的数值。
它不受异常值的影响,适用于数据存在明显偏态或异常值的情况。
3. 众数(Mode)是数据集中出现频率最高的数值。
对于离散变量,可能存在多个众数;对于连续变量,众数可能不存在或不唯一4. 四分位数(Quartiles)将数据按大小排序后,将数据集分为四个部分。
第一个四分位数(Q1)是排序后数据集中25%位置处的数值,第二个四分位数(Q2)就是中位数,第三个四分位数(Q3)是75%位置处的数值。
四分位数用于描述数据的分布和离群值。
5. 极差(Range)是数据集中最大值与最小值之间的差值。
它衡量了数据的全局离散度,但忽略了数据集的内部变化。
6. 方差(Variance)是数据值与其平均数之间的差的平方和的平均值。
方差表示了数据的离散程度,反映了数据点离平均值的距离。
7. 标准差(Standard Deviation)是方差的平方根。
标准差是用于衡量数据的离散度的常用指标。
一般来说,标准差越大,数据的离散程度越高。
这些统计指标能够揭示数据的集中趋势和离散程度,帮助我们理解数据的分布情况。
根据数据的类型和分布情况,选择适当的统计指标进行描述和总结,能够更好地理解数据,进行进一步的分析和推断。
20.数据的分析知识点及练习题

20.数据的分析知识点:数据的代表:平均数、众数、中位数、极差、方差知识点详解:1.解统计学的几个基本概念总体、个体、样本、样本容量是统计学中特有的规定,明确所考查的对象是解决有关总体、个体、样本、样本容量问题的关键。
2.平均数当给出的一组数据,都在某一常数a上下波动时,一般选用简化平均数公式,其中a是取接近于这组数据平均数中比较“整”的数;•当所给一组数据中有重复多次出现的数据,常选用加权平均数公式。
3.众数与中位数平均数、众数、中位数都是用来描述数据集中趋势的量。
平均数的大小与每一个数据都有关,任何一个数的波动都会引起平均数的波动,当一组数据中有个数据太高或太低,用平均数来描述整体趋势则不合适,用中位数或众数则较合适。
中位数与数据排列有关,个别数据的波动对中位数没影响;当一组数据中不少数据多次重复出现时,可用众数来描述。
4.极差用一组数据中的最大值减去最小值所得的差来反映这组数据的变化范围,用这种方法得到的差称为极差,极差=最大值-最小值。
5.方差与标准差用“先平均,再求差,然后平方,最后再平均”得到的结果表示一组数据偏离平均值的情况,这个结果叫方差,计算公式是s2=[(x1-)2+(x2-)2+…+(xn-)2];方差是反映一组数据的波动大小的一个量,其值越大,波动越大,也越不稳定或不整齐。
课堂练习一、选择题1.一组数据3,5,7,m,n的平均数是6,则m,n的平均数是()A.6B.7C. 7.5D. 152.小华的数学平时成绩为92分,期中成绩为90分,期末成绩为96分,若按3:3:4的比例计算总评成绩,则小华的数学总评成绩应为()A.92 B.93 C.96 D.92.73.关于一组数据的平均数、中位数、众数,下列说法中正确的是()A.平均数一定是这组数中的某个数B. 中位数一定是这组数中的某个数C.众数一定是这组数中的某个数D.以上说法都不对4.某小组在一次测试中的成绩为:86,92,84,92,85,85,86,94,92,83,则这个小组本次测试成绩的中位数是()A.85 B.86 C.92 D.87.95.某人上山的平均速度为3km/h,沿原路下山的平均速度为5km/h,上山用1h,则此人上下山的平均速度为()A.4 km/hB. 3.75 km/hC. 3.5 km/hD.4.5 km/h6.在校冬季运动会上,有15名选手参加了200米预赛,取前八名进入决赛.已知参赛选手成绩各不相同,某选手要想知道自己是否进入决赛,只需要了解自己的成绩以及全部成绩的()A.平均数B.中位数C.众数D.以上都可以二、填空题:(每小题6分,共42分)7.将9个数据从小到大排列后,第个数是这组数据的中位数8.如果一组数据4,6,x,7的平均数是5,则x = .9.已知一组数据:5,3,6,5,8,6,4,11,则它的众数是,中位数是 . 10.一组数据12,16,11,17,13,x的中位数是14,则x = .11则这组数据的平均数是,中位数是,众数是 .12.某小组10个人在一次数学小测试中,有3个人的平均成绩为96,其余7个人的平均成绩为86,则这个小组的本次测试的平均成绩为 .13.为了了解某立交桥段在四月份过往车辆承载情况,连续记录了6天的车流量(单位:千辆/日):3.2,3.4,3,2.8,3.4,7,则这个月该桥过往车辆的总数大约为辆.14.为了培养学生的环保意识,某校组织课外小组对该市进行空气含尘调查,下面是一天中每2 3(1)(2)如果对大气飘尘的要求为平均值不超过0.025 g/m3,问这天该城市的空气是否符合要求?为什么?15. A、(1)A班众数为分,B班众数为分,从众数看成绩较好的是班;(2)A班中位数为分,B班中位数为分,A班中成绩在中位数以上的(包括中位数)学生所占的百分比是 %,B班中成绩在中位数以上的(包括中位数)学生所占的百分比是 %,从中位数看成绩较好的是班;(3)若成绩在85分以上为优秀,则A班优秀率为 %,B班优秀率为 %,从优秀率看成绩较好的是班.(4)A班平均数为分,B班平均数为分,从平均数看成绩较好的是班;16.(1)(2)平均月工资能准确反映该酒店员工工资的一般水平吗?若能,请说明理由.若不能,如何才能较准确地反映该酒店员工工资的一般水平?谈谈你的看法.总结:基本统计量的数学内涵:平均数:把一组数据的总和除以这组数据的个数所得的商。
医药数理统计习题答案解析

第一章数据的描述和整理一、学习目的和要求1. 掌握数据的类型及特性;2.掌握定性和定量数据的整理步骤、显示方法;3.掌握描述数据分布的集中趋势、离散程度和分布形状的常用统计量;4.能理解并熟练掌握样本均值、样本方差的计算;5.了解统计图形和统计表的表示及意义;6. 了解用Excel软件进行统计作图、频数分布表与直方图生成、统计量的计算。
二、内容提要(一)数据的分类(二)常用统计量1、描述集中趋势的统计量2、描述离散程度的统计量3、描述分布形状的统计量* 在分组数据公式中,m i , f i 分别为各组的组中值和观察值出现的频数。
三、综合例题解析例1.证明:各数据观察值与其均值之差的平方和(称为离差平方和)最小,即对任意常数C ,有2211()()n ni ii i x x x C ==-≤-∑∑ 证一:设 21()()ni i f C x C ==-∑由函数极值的求法,对上式求导数,得11()2()22, ()2 n ni i i i f C x C x nC f C n =='''=--=-+=∑∑令 f '(C )=0,得唯一驻点11= ni i C x x n ==∑由于()20f x n ''=>,故当C x =时f (C )y 有最小值,其最小值为21()()ni i f x x x ==-∑。
证二:因为对任意常数C 有22222211111222212()()(2)2(2)()0nn n n nii iii i i i i i ni i xx x C x nx x C x nC nx C x nC n x Cx C n x C ======---=---+=-+-=--+=--≤∑∑∑∑∑∑故有2211()()nni ii i x x x C ==-≤-∑∑。
四、习题一解答1.在某药合成过程中,测得的转化率(%)如下:94.3 92.8 92.7 92.6 93.3 92.9 91.8 92.4 93.4 92.6 92.2 93.0 92.9 92.2 92.4 92.2 92.8 92.4 93.9 92.0 93.5 93.6 93.0 93.0 93.4 94.2 92.8 93.2 92.2 91.8 92.5 93.6 93.9 92.4 91.8 93.8 93.6 92.1 92.0 90.8 (1)取组距为0.5,最低组下限为90.5,试作出频数分布表; (2)作频数直方图和频率折线图;(3)根据频数分布表的分组数据,计算样本均值和样本标准差。
平均数、众数、中位数、极差、方差、标准差

平均数、众数、中位数、极差、方差、标准差说明6个基本统计量(平均数、众数、中位数、极差、方差、标准差)的内涵,学生学习过程中可能产生的困难及主要原因、应对策略.首先,结合简单实例认真把握这6个基本统计量的内涵。
一、平均数、众数、中位数是刻画一组数据的“平均水平”的数据代表。
(八上《第八章数据的代表》)平均数分算术平均数和加权平均数,算术平均数是指n个数据的和的平均值,学生理解与计算都不成问题,只要注意细心运算就是其中的取标准值后的简便算法也都是在小学早已熟练的(公式:x=1/n(x1+x2+x3+……+xn);而加权平均数是一组数据里的各个数据乘各自的“权”之后的平均数。
此处理解“权”的概念可能产生很大困难,因为“权”的理解的确不易,若是照搬教材直接给出其定义,学生会迷惑成团,再进行应用更是不可思议。
所以应对措施:讲好、用好加权平均数就要先举例、后分析、再给出定义,比如:某同学的一次考试各科成绩如下:语文110、数学105、英语106、物理95、化学90、政治86、历史98、地理66、生物89,你可以先让学生算算各科的平均数,再按中考计分法将语、数、英各取120%,物、化、政各取100%,史、地、生各取40%后的平均值算出,两个结果一比较,学生就会很容易发现不同的原因是加入了所谓的“权”,这样,不仅通俗易懂,而且对“权”内涵的理解和应用就不再困难。
众数是一组数据中出现次数最多的数。
其内涵很好理解和掌握,就是结合实际应用也顺理成章,如商店老板进货号多大的男鞋好?那当然是“众数”(调查数据最多的号)所代表的。
中位数顾名思义是一组数据中间位置的数,但考虑一组数可能有偶数个或奇数个,所以要注意强调取中位数的方法。
教材上给出的内涵很好:一般地,n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数。
如一组数据1.5,1.5,1.6,1.65,1.7,1.7,1.75,1.8的中位数是1/2(1.65+1.7),即1.675。
高中数学《平均数、中位数、众数、极差、方差 标准差》导学案

1.4.1平均数、中位数、众数、极差、方差1.4.2标准差[航向标·学习目标]1.理解平均数、中位数、众数、极差、方差、标准差的概念.2.会计算数据的平均数、标准差.3.体会用统计量表达样本数据,提高学生的学习兴趣.[读教材·自主学习]1.平均数:一般地,对于n个数x1,x2,…,x n,我们把□011n(x1+x2+…+x n)叫作这n个数的算术平均数,简称平均数.2.中位数:一般地,将n个数据按大小顺序排列,处于□02最中间的一个数(或最中间两个数据的平均数)叫作这组数据的中位数.3.众数:一组数据中□03出现次数最多的那个数据叫作这组数据的众数.4.极差:极差是数据的□04最大值与□05最小值的差.5.标准差:各个数据与平均数□06之差的平方的平均数,称为这组数据的方差,方差的□07算术平方根称为这组数据的标准差.[看名师·疑难剖析]1.平均数、中位数、众数刻画一组数据集中趋势的统计量有平均数、中位数和众数等,它们作为一组数据的代表各有优缺点,也各有各的用处,从不同的角度出发,不同的人会选取不同的统计量来表达同一组数据的信息.平均数是刻画一组数据集中趋势最常用的统计量.2.方差、标准差n 个数据x 1,x 2,…,x 3,我们把x 1+x 2+…+x n n记为x -,则方差可以用s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]来表示,将方差的算术平方根s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]称为标准差. 刻画一组数据离散趋势的统计量有方差、标准差等.对方差和标准差的理解还要注意以下几方面:(1)标准差、方差描述了一组数据围绕平均数的波动大小.标准差、方差越大,数据离散程度越大,稳定性越差;标准差、方差越小,数据离散程度越小,稳定性越好;(2)因方差与原始数据单位不同,且平方后可能夸大了偏差程度,所以虽然标准差与方差在体现数据分散程度上是一样的,但解决问题时一般用标准差;(3)标准差与方差的取值范围是[0,+∞).考点一 平均数、众数、中位数的计算例1 求下列一组数据的平均数、中位数、众数:10,20,80,40,30,90,50,40,50,40. [分析] 明确各概念,利用定义解题.[解] 这组数据的平均数为(10+20+80+40+30+90+50+40+50+40)÷10=45.将这组数据按从小到大的顺序排列,得10,20,30,40,40,40,50,50,80,90,所以中位数为(40+40)÷2=40.又因为40出现3次,出现次数最多,所以众数为40.类题通法求平均数必须先将所有数据求和,再把和除以数据的个数.求中位数时,必须将所有数据按从小到大的顺序排列后,把中间的数或中间两项的平均数称为这组数据的中位数.而众数则是出现次数最多的数据.在解答本类问题时,一定要审清题意,明确各数据出现的次数,认真计算,以防计算失误.[变式训练1] (1)甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为________和________.(2)在如下图所示的茎叶图中,甲、乙两组数据的中位数分别是________,________.答案(1)2423(2)4546解析(1)由茎叶图可知甲的平均数为(9+8+20)+(1+3+2+100)+(1+1+5+90)=24,乙的平均数为10(9+7+1+30)+(1+4+2+4+80)+(2+90)=23.10(2)甲组数据从小到大排序后,最中间的数是45,即甲组数据的中位数为45;乙组数据从小到大排序后,最中间的数是46,即乙组数据的中位数是46.考点二平均数、众数、中位数的应用例2个体户李某经营一家快餐店,下面是快餐店所有工作人员8月份的工资表:李某大厨二厨采购员杂工服务生会计3000元450元350元400元320元320元410元(1)计算所有员工8月份的平均工资;(2)由(1)计算出的平均工资能否反映打工人员这个月收入的一般水平?为什么?(3)去掉李某的工资后,再计算平均工资,这能代表打工人员当月的收入水平吗?(4)根据以上计算,以统计的观点,你对(3)的结果有什么看法?[解] (1)这7个人的8月份平均工资是x -1=17(3000+450+350+400+320+320+410)=750(元).(2)计算出的平均工资不能反映打工人员的当月收入的一般水平,可以看出,打工人员的工资都低于平均工资,因为这7个值中有一个极端值——李某的工资特别高,所以他的工资对平均工资的影响较大,同时他也不是打工人员.(3)去掉李某的工资后的平均工资x -2=16(450+350+400+320+320+410)=375(元),该平均工资能代表打工人员的当月收入的一般水平.(4)从本题的计算可以看出,个别特殊值对平均数有很大的影响,因此在选择样本时,样本中尽量不用特殊数据.类题通法本题充分说明了平均数在具体问题中的意义.[变式训练2] 据报道,某公司的33名职工的月工资(以元为单位)如下:(1)求该公司职工月工资的平均数、中位数、众数;(2)假设副董事长的工资从5000元提升到20000元,董事长的工资从5500元提升到30000元,那么新的平均数、中位数、众数又是什么?(精确到元)(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法.解 (1)平均数是x -=1500+4000+3500+2000×2+1500+1000×5+500×3+0×2033≈1500+591=2091(元),中位数是1500元,众数是1500元. (2)平均数是x -′=1500+28500+18500+2000×2+1500+1000×5+500×3+0×2033≈1500+1788=3288(元).中位数是1500元,众数是1500元.(3)在这个问题中,中位数或众数均能反映该公司员工的工资水平,因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.考点三 方差与标准差的计算例3 一个样本数据的方差是s 2=120[(x 1-3)2+(x 2-3)2+(x 3-3)2+…+(x 20-3)2].(1)求样本的容量n 及平均数x -;(2)如果样本数据的平方和为200,求样本的方差.[分析] 本题主要用方差的公式进行变形求解,我们要熟练掌握公式的变形. [解] (1)由样本数据方差公式可以得到样本容量n =20,平均数x -=3. (2)由s 2=120[(x 1-3)2+(x 2-3)2+…+(x 20-3)2]=120[(x 21+x 22+…+x 220)-6(x 1+x 2+…+x 20)+20×9]=120(200-360+180)=1.类题通法解决此类问题一定要熟记公式.[变式训练3] 甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表:s 1、s 2、s 3分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有( ) A .s 3>s 1>s 2 B .s 2>s 1>s 3 C .s 1>s 2>s 3 D .s 2>s 3>s 1 答案 B解析 x -甲=(7+8+9+10)×520=8.5,s 21=5×[(7-8.5)2+(8-8.5)2+(9-8.5)2+(10-8.5)2]20 =1.25,x -乙=(7+10)×6+(8+9)×420=8.5,s 22=6×[(7-8.5)2+(10-8.5)2]+4×[(8-8.5)2+(9-8.5)2]20=1.45,x -丙=(7+10)×4+(8+9)×620=8.5,s 23=4×[(7-8.5)2+(10-8.5)2]+6×[(8-8.5)2+(9-8.5)2]20=1.05,由s 22>s 21>s 23得s 2>s 1>s 3.故选B.考点四 数据的数字特征的应用例4 一次科技知识竞赛,两组学生成绩如下表:已经计算得到两个组成绩的平均数都是80分,请根据你所学过的统计知识,进一步判断这两个组在这次竞赛中的成绩谁优谁次,并说明理由.[分析]优次之分的标准是通过数据的各数字特征来反映.[解](1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数比较看,甲组的成绩好一些;(2)s2甲=150×[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=172(分2).s2乙=150×(4×900+4×400+16×100+2×0+12×100+12×400)=256(分2).因为s2甲<s2乙,所以甲组的成绩比乙组的成绩好.(3)甲、乙两组成绩的中位数、平均数都是80分,其中,甲组成绩在80分以上(含80分)的有33人,乙组成绩在80分以上(含80分)的有26人,从这一角度来看,甲组的成绩总体较好.(4)从成绩统计表来看,甲组的成绩高于90分(含90分)的人数为14+6=20(人),乙组的成绩高于90分(含90分)的人数为12+12=24(人),所以乙组成绩集中在高分段的人数多,同时乙组得满分的比甲组得满分的多6人,从这一角度来看,乙组的成绩较好.类题通法用数据的数字特征来反映该组数据的特点,本例就是从众数、中位数、方差、高分段以及满分的人数等数字特征全方位进行综合分析、比较,并作出判断.[变式训练4]有一组数据:x1,x2,…,x n(x1<x2<…<x n)的算术平均值为10,若去掉其中最大的一个,余下数据的算术平均值为9,若去掉其中最小的一个,余下数据的算术平均值为11.(1)求出第一个数x 1关于n 的表达式及第n 个数x n 关于n 的表达式; (2)若x 1,x 2,…,x n 都是正整数,试求第n 个数x n 的最大值,并举出满足题目要求且x n 取到最大值的一组数据.解 (1)依条件得⎩⎪⎨⎪⎧x 1+x 2+…+x n =10n , ①x 1+x 2+…+x n -1=9(n -1),②x 2+x 3+…+x n =11(n -1), ③由①-②得x n =n +9. 又由①-③得x 1=11-n .(2)由于x 1是正整数.故x 1=11-n ≥1⇒1≤n ≤10, 故x n =n +9≤19.当n =10时,x 1=1,x 10=19,x 2+x 3+…+x 9=80.此时,x 2=6,x 3=7,x 4=8,x 5=9,x 6=11,x 7=12,x 8=13,x 9=14.[例] (12分)某酒厂有甲、乙两条生产线生产同一种型号的白酒,产品在自动传输带上包装传送,每15分钟抽一瓶测定其质量是否合格,分别记录抽查的数据如下(单位:毫升):甲生产线:508,504,496,510,492,496 乙生产线:515,520,480,485,497,503 问:(1)这种抽样是何种抽样方法?(2)分别计算甲、乙两条生产线的平均值与标准差,并说明哪条生产线的产品较稳定.(一)精妙思路点拨(二)分层规范细解(1)根据题意知,抽样是每15分钟抽一瓶,是等距抽样,所以这种抽样是系统抽样.4分(2)根据已知抽样数据可计算:x -甲=16×(508+504+496+510+492+496)=501①,6分∴s 2甲=16×[(508-501)2+(504-501)2+(496-501)2+(510-501)2+(492-501)2+(496-501)2]=45①,∴s 甲=35≈6.708.8分x -乙=16×(515+520+480+485+497+503)=500①,∴s 2乙=16×[(515-500)2+(520-500)2+(480-500)2+(485-500)2+(497-500)2+(503-500)2]≈211.3①10分∴s 乙≈14.536.∴s 甲<s 乙,甲生产线的产品较稳定②.12分 (三)来自一线的报告通过阅卷后分析,对解答本题的失分警示和解题启示总结如下:(注:此处的①②见分层规范细解过程)(四)类题练笔掌握从甲、乙两种玉米苗中各抽10株,分别测得它们的株高如下(单位:cm): 甲:25,41,40,37,22,14,19,39,21,42; 乙:27,16,44,27,44,16,40,40,16,40. 问:(1)哪种玉米的苗长得高? (2)哪种玉米的苗长得齐?解 (1)x -甲=110×(25+41+40+37+22+14+19+39+21+42) =110×300=30(cm),x -乙=110×(27+16+44+27+44+16+40+40+16+40)=110×310=31(cm),∵x-甲<x-乙,∴乙种玉米的苗长得高.(2)s2甲=110×[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=110×1042=104.2(cm2),s2乙=110×[(27-31)2×2+(16-31)2×3+(44-31)2×2+(40-31)2×3]=110×1288=128.8(cm2).∵s2甲<s2乙,∴甲种玉米的苗长得齐.(五)解题设问(1)本题中样本数据的个数是多少?________.(2)需用样本数据的哪些数字特征?需要求出样本数据的________,用来衡量玉米的高度;求出样本数据的________(或________)用来衡量玉米长得是否齐.答案(1)有10个(2)平均数方差标准差1.已知某班8名学生的身高(单位:m)分别为:1.74,1.68,1.72,1.80,1.64,1.69,1.75,1.82,则这8名学生的平均身高为()A.1.60 m B.1.82 mC.1.73 m D.1.64 m答案 C解析求平均数.2.在一次歌手大奖赛上,七位评委为某歌手打出的分数如下:9.48.49.49.99.69.49.7去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为() A.9.40.484 B.9.40.016C.9.50.04 D.9.50.016答案 D解析 去掉最高分9.9和最低分8.4,余下的数为9.4,9.4,9.6,9.4,9.7,其平均数x -=3×9.4+9.6+9.75=9.5,s 2=15×(0.12+0.12+0.12+0.12+0.22)=0.016.3.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各有1人,则该小组成绩的平均数、众数、中位数分别是( )A .85、85、85B .87、85、86C .87、85、85D .87、85、90答案 C4.已知总体的各个体的值由小到大依次为2,3,3,7,a ,b,12,13.7,18.3,20,且总体的中位数为10.5,若要使该总体的方差最小,则a ,b 的取值分别是________.答案 a =10.5,b =10.5解析 依题意及中位数定义可知:a =10.5,b =10.5.5.甲、乙两台机床在相同的技术条件下,同时生产一种零件,现在从中抽测10个,它们的尺寸(单位:mm)分别如下.甲:10.2,10.1,10,9.8,9.9,10.3,9.7,10,9.9,10.1 乙:10.3,10.4,9.6,9.9,10.1,10.9,8.9,9.7,10.2,10分别计算上面两个样本的平均数和方差.如果图纸规定零件的尺寸为10 mm ,从计算的结果来看,用哪台机床加工这种零件较合适?(要求利用公式笔算)解 x -甲=110×(10.2+10.1+…+10.1)=110×100=10, x -乙=110×(10.3+10.4+…+10)=110×100=10.所以s 2甲=110×[(10.2-10)2+(10.1-10)2+…+(10.1-10)2]=0.03(mm 2), 所以s 2乙=110×[(10.3-10)2+(10.4-10)2+…+(10-10)2]=0.06(mm 2). 所以s 2甲<s 2乙.所以甲机床比乙机床稳定,即用甲机床加工较合适.一、选择题1.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )89⎪⎪⎪ 9 73 1 6 4 0 2A .91.5和91.5B .91.5和92C .91和91.5D .92和92答案 A解析 中位数为12(91+92)=91.5;平均数为18(87+89+90+91+92+93+94+96)=91.5.2.某校高一有四个班,1~4班的人数分别为N 1,N 2,N 3,N 4,总人数为N ,英语成绩的平均分分别为M 1,M 2,M 3,M 4,则该校高一英语的平均分是( )A .M 1,M 2,M 3,M 4的平均数B .M 1,M 2,M 3,M 4的中位数C .M 1N 1,M 2N 2,M 3N 3,M 4N 4的平均数D .M 1N 1,M 2N 2,M 3N 3,M 4N 4的和与1N 的乘积 答案 D3.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为( )A.65 B.65 C. 2 D .2答案 D解析 由题可知样本的平均值为1,所以a +0+1+2+35=1,解得a =-1,所以样本的方差为15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2,故选D. 4.甲、乙两名同学在五次考试中数学成绩统计用茎叶图表示如下图所示,则下列说法正确的是( )A.甲的平均成绩比乙的平均成绩高B .甲的平均成绩比乙的平均成绩低C .甲成绩的方差比乙成绩的方差大D .甲成绩的方差比乙成绩的方差小 答案 C解析 x -甲=15(98+99+105+115+118)=107, x -乙=15(95+106+108+112+114)=107.s 2甲=15[(98-107)2+(99-107)2+(105-107)2+(115-107)2+(118-107)2]=66.8,s 2乙=15[(95-107)2+(106-107)2+(108-107)2+(112-107)2+(114-107)2]=44.所以排除A 、B 、D ,选C.5.如下图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为x -A 和x -B ,样本标准差分别为s A 和s B ,则( )A.x -A >x -B ,s A >s BB.x -A <x -B ,s A >s BC.x -A >x -B ,s A <s BD.x -A <x -B ,s A <s B 答案 B解析 由图可知A 组的6个数为2.5,10,5,7.5,2.5,10, B 组的6个数为15,10,12.5,10,12.5,10, 所以x -A =2.5+10+5+7.5+2.5+106=37.56, x -B =15+10+12.5+10+12.5+106=706.显然x -A <x -B ,又由图形可知,B 组的数据分布比A 均匀,变化幅度不大,故B 组数据比较稳定,方差较小,从而标准差较小,所以s A >s B ,故选B.6.某次考试,班长算出了全班40人的数学成绩的平均分M ,如果把M 当成一个同学的成绩与原来的40个分数加在一起,算出这41个分数的平均值为N ,那么M ∶N 为( )A .40∶41B .41∶40C .2∶1D .1∶1答案 D解析 由题意知全班40个同学的总分为40M ,则N =40M +M41,整理,得M =N .二、填空题7.若40个数据的平方和是48,平均数是12,则这组数据的方差是________. 答案 1920解析 由题可得x 21+x 22+…+x 240=48,x -=12. 所以s 2=140[(x 1-x -)2+(x 2-x -)2+…+(x 40-x -)2] =140[(x 21+x 22+…+x 240)+40x -2-2x -(x 1+x 2+…+x 40)] =140⎝ ⎛⎭⎪⎫48+40×14-2×12×12×40=1920.8.从甲、乙、丙三个厂家生产的同一种产品中抽取8件产品,对其使用寿命(单位:年)进行追踪调查的结果如下:甲:3,4,5,6,8,8,8,10; 乙:4,6,6,6,8,9,12,13; 丙:3,3,4,7,9,10,11,12.三个厂家广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数,众数,中位数中的哪一种集中趋势的特征数.甲:________,乙:________,丙:________. 答案 众数 平均数 中位数9.某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s 2=________.答案 3.2解析本题主要考查统计知识——方差的计算.5个数据的平均数x-=10+6+8+5+65=7,所以s2=15×[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=3.2.三、解答题10.某校在一次考试中,甲、乙两班学生的数学成绩统计如下:选用平均数与众数、中位数评估这两个班的成绩.解甲班平均数79.6分,乙班平均数80.2分,从平均分看成绩较好的是乙班;甲班众数为90分,乙班众数为70分,从众数看成绩较好的是甲班;甲班的第25个和第26个数据都是80,所以中位数是80分,同理,乙班中位数也是80分,但是甲班成绩在中位数以上(含中位数)的学生有31人,占全班学生的62%,同理乙班27人,占54%,所以从中位数看成绩较好的是甲班.如果记85分以上为优秀,甲班有20人,优秀率为40%;乙班有24人,优秀率为48%,从优秀率来看成绩较好的是乙班.可见,一个班学生成绩的评估方法很多,需视要求而定.11.为了了解市民的环保意识,某校高一(1)班50名学生在6月5日(世界环境日)这一天调查了各自家庭丢弃旧塑料袋的情况.有关数据如下表:每户丢弃旧塑料袋个数234 5户数6161513(1)求这50户居民每天丢弃旧塑料袋的平均数;(2)求这50户居民每天丢弃旧塑料袋的标准差.解根据平均数和标准差的公式计算即可.(1)平均数x -=150(2×6+3×16+4×15+5×13)=18550=3.7. (2)这50户居民每天丢弃旧塑料袋的方差为s 2=150[6×(2-3.7)2+16×(3-3.7)2+15×(4-3.7)2+13×(5-3.7)2]=150×48.5=0.97.所以标准差s ≈0.985.12.两台机床同时生产直径为10毫米的零件,为了检验产品质量,检验员从两台机床的产品中各抽出4件进行测量,结果如下(单位:毫米):如果你是检验员,在收集到上述数据后,你将通过怎样的运算来判断哪台机床生产的零件更符合要求?解 先计算平均直径:x -甲=14×(10+9.8+10+10.2)=10(毫米).x -乙=14×(10.1+10+9.9+10)=10(毫米).由于x -甲=x -乙,因此,平均直径反映不出两台机床生产的零件的优劣.再计算方差:s 2甲=14×[(10-10)2+(9.8-10)2+(10-10)2+(10.2-10)2]=0.02(毫米2),s 2乙=14×[(10.1-10)2+(10-10)2+(9.9-10)2+(10-10)2]=0.005(毫米2). 由于s 2乙<s 2甲,这说明乙机床生产出的零件直径波动小,因此,从产品质量稳定性的角度考虑,乙机床生产的零件更符合要求.13.近几届冬奥会男、女1500米速滑的冠军成绩分别如下表所示:(1)分别求出男、女1500米速滑的冠军成绩的平均数和中位数;(2)分别求出男、女1500米速滑的冠军成绩的标准差;(3)通过(1)(2)的计算,请用自己的语言描述近几届冬奥会男、女1500米速滑的冠军成绩分别有什么特点.解(1)近几届冬奥会男子1500米速滑冠军成绩的平均数和中位数分别是1′54.17″,1′54.81″;女子的平均数和中位数分别是2′05.32″,2′03.42″.(2)近几届冬奥会男、女1500米速滑冠军成绩的标准差分别是3.7637″,6.0194″.(3)从上面的计算结果我们不难看出:近几届冬奥会男子速滑的冠军成绩相比女子成绩优异而且比较稳定.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
平均数、众数、中位数、极差、方差、标准差
说明6个基本统计量(平均数、众数、中位数、极差、方差、标准差)的内涵,学生学习过程中可能产生的困难及主要原因、应对策略.
首先,结合简单实例认真把握这6个基本统计量的内涵。
一、平均数、众数、中位数是刻画一组数据的“平均水平”的数据代表。
(八上《第八章数据的代表》)平均数分算术平均数和加权平均数,算术平均数是指n个数据的和的平均值,学生理解与计算都不成问题,只要注意细心运算就是其中的取标准值后的简便算法也都是在小学早已熟练的(公式:
x=1/n(x1+x2+x3+……+xn);而加权平均数是一组数据里的各个数据乘各自的“权”之后的平均数。
此处理解“权”的概念可能产生很大困难,因为“权”的理解的确不易,若是照搬教材直接给出其定义,学生会迷惑成团,再进行应用更是不可思议。
所以应对措施:讲好、用好加权平均数就要先举例、后分析、再给出定义,比如:某同学的一次考试各科成绩如下:语文110、数学105、英语106、物理95、化学90、政治86、历史98、地理66、生物89,你可以先让学生算算各科的平均数,再按中考计分法将语、数、英各取120%,物、化、政各取100%,史、地、生各取40%后的平均值算出,两个结果一比较,学生就会很容易发现不同的原因是加入了所谓的“权”,这样,不仅通俗易懂,而且对“权”内涵的理解和应用就不再困难。
众数是一组数据中出现次数最多的数。
其内涵很好理解和掌握,就是结合实际应用也顺理成章,如商店老板进货号多大的男鞋好?那当然是“众数”(调查数据最多的号)所代表的。
中位数顾名思义是一组数据中间位置的数,但考虑一组数可能有偶数个或奇数个,所以要注意强调取中位数的方法。
教材上给出的内涵很好:一般地,n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数。
如一组数据1.5,1.5,1.6,1.65,1.7,1.7,1.75,1.8的中位数
是1/2(1.65+1.7),即1.675。
教学过程中可能出现的困难是学生不排序就直接找中间数,应对措施:还可多举几例加强对排序的理解,防止出现错误。
二、极差、方差、标准差是刻画数据离散程度的统计量。
(八下第五章《数据的收集与处理》)
极差好理解,是指一组数据中最大数据与最小数据的差。
极差越大,表示这组数据越分散。
重点和难点是方差的内涵:方差是各个数据与平均数之差的平方的平均数,即(公式
),单纯概念的叙述就有些模糊,计算起来困难更大。
所以,在教授这一概念时应首先复习“平均数”的定义,后牢记公式,关键要简化例题,如取一组有代表性的简单数据1,2,3,4,5的方差是1/5(1+2+3+4+5)=2,另一组数8,9,10,11,12,的方差是
1/5(8+9+10+11+12)=2,……还可多举几例,学生从这几个简单数据的举例中很快就理解并记住了方差的内涵和计算,而且在此基础上总结其中的几个规律也就非常容易了,如连续五个整数的方差都是2、一组数据中每个数据增加相同数后的方差变不变?怎样变?(平均数变,方差不变);每个数据都扩大相同倍数后方差怎样变化?(平均数变相同倍数而方差变为平方倍)等等。
至于标准差就好理解了---标准差就是方差的算术平方根。
,即
标准差也可以用来表征一组数据波动情况。
在实际问题中,极差和方差经常结合起来共同去更全面地描述一组数据的波动情况。
一般而言,一组数据的极差、方差或标准差越小,这组数据就越稳定。
其次,借助计算器帮助计算出现的困难。
上述6个基本统计量在生活中的应用是很广泛的,而通过生活中的简单数据的举例,会帮助学生理解其不简单的内涵,甚至可以做到事半功倍,教材中出现的各类问题(复杂的可借助计时器)肯定也会迎刃而解。