中位数、众数、极差、方差_42_标准差

合集下载

数理统计平均数、中位数、众数,极差、标准差、方差

数理统计平均数、中位数、众数,极差、标准差、方差

平均数、中位数和众数的知识归纳与梳理:(一)平均数:一组数据的总和除以这组数据个数所得到的商叫这组数据的平均数。

即x=(x1+x2+……+xn)÷n中位数:将一组数据按大小顺序排列,处在最中间位置的一个数或最中间的两个数的平均数叫做这组数据的中位数。

众数:在一组数据中出现次数最多的数叫做这组数据的众数。

平均数:一组数据的平均值平均水平平均数是描述一组数据的一种常用指标,反映了这组数据中各数据的平均大小。

平均数的大小与一组数据里的每个数据都有关系,其中任何数据的变动都会引起平均数的相应变动平均数一般的计算方法为:用一组数据的总和除以这组数据的个数.平均数的优点。

反映一组数的总体情况比中位数、众数更为可靠、稳定.平均数的缺点。

平均数需要整批数据中的每一个数据都加人计算,因此,在数据有个别缺失的情况下,则无法准确计算,计算的工作量也较大。

平均数易受极端数据的影响,从而使人对平均数产生怀疑。

中位数:在有序排列的一组数据中最居中的那个数据中等水平中位数是描述数据的另一种指标,如果将一组数按从小到大排列那么中位数的左边和右边恰有一样多的数据。

中位数仅与数据的大小排列位置有关,某些数据的变动对它的中位数没有影响.中位数是将数据按大小顺序依次排列(相等的数也要全部参加排序)后“找”到的.当数据的个数是奇数时,中位数就是最中间的那个数据;当数据的个数是偶数时,就取最中间的两个数据的平均数作为中位数.中位数的优点。

简单明了,很少受一组数据的极端值的影响。

中位数的缺点。

中位数不受其数据分布两端数据的影响,因此中位数缺乏灵敏性,不能充分利用所有数据的信息。

当观测数据已经分组或靠近中位数附近有重复数据出现时,则难以用简单的方法确定中位数。

众数一组数据中出现次数最多的那个数据。

集中趋势众数告诉我们,这个值出现次数最多,一组数据可以有不止一个众数,也可以没有众数。

众数着眼于对各数据出现的频数的考查,其大小只与这组数据中的部分数据有关.一组数据中的众数不止一个.当一组数据中有相同数据多次出现时,其众数往往是我们关心的.众数的优点比较容易了解一组数据的大致情况,不受极端数据的影响,并且求法简便。

北师大必修三数学 平均数、中位数、众数、极差、方差 标准差

 北师大必修三数学 平均数、中位数、众数、极差、方差 标准差

首页
上一页
下一页
末页
结束
数字特征与统计图表的综合问题 [典例] (1)为了普及环保知识,增强环保意识,某大学随机 抽取 30 名学生参加环保知识测试,得分(十分制)如图所示,假 设得分值的中位数为 me,众数为 mo,平均值为 x ,则( )
A.me=mo= x B.me=mo< x C.me<mo< x D.mo<me< x
x

2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10 30
≈5.97.
于是得 mo<me< x .
首页
上一页
下一页
末页
结束
(2)观察图形可得:样本 A 的数据均小于或等于 10,样本 B 的数据均大于或等于 10,故 x A< x B,又样本 B 的波动范围 较小,故 sA>sB.
()
A.平均数
B.极差
C.中位数
D.方差
解析:选 C 判断是不是能进入决赛,只要判断是不是前 8 名,
所以只要知道其他 15 位同学的成绩中是不是有 8 个高于他,
也就是把其他 15 位同学的成绩排列后看第 8 个的成绩即可,
小刘的成绩高于这个成绩就能进入决赛,低于这个成绩就不能
进入决赛,这个第 8 名的成绩就是这 15 位同学成绩的中位数.
1.平均数、中位数、众数
(1)平均数
如果有 n 个数 x1,x2,…,xn,那么 x =
x1+x2+…+xn n

叫作这 n 个数的平均数.
(2)中位数
把一组数据按从小到大的顺序排列,把处于 最中间位置的那个
数(或中间两数的平均数)称为这组数据的中位数.
(3)众数
一组数据中重复出现次数 最多的数称为这组数的众数,一组数

统计口径指标

统计口径指标

统计口径指标统计口径指标是指在统计学中用来衡量和描述某个现象、事件或者样本的指标或者变量。

它们可以帮助我们了解和分析数据,从而得出结论或者作出决策。

本文将从不同角度介绍几个常见的统计口径指标,以帮助读者更好地理解和运用统计学知识。

一、平均数平均数是统计学中最常见的一个指标,用来表示一组数据的集中趋势。

它是将所有数据相加后再除以数据的个数得到的。

平均数可以帮助我们了解数据的中心位置,但在分布不均匀的情况下可能不太准确。

二、中位数中位数是将一组数据按照大小顺序排列后,位于中间位置的数值。

它可以帮助我们了解数据的分布情况,尤其是在存在异常值的情况下更加稳健。

三、众数众数是指一组数据中出现次数最多的数值。

它可以帮助我们了解数据的频数分布情况,尤其是在数据集中有一个或多个峰值的情况下。

四、方差方差是用来衡量一组数据的离散程度的指标。

它表示各个数据与平均数之间的差异程度,差异越大方差越大。

方差可以帮助我们了解数据的波动情况,从而评估风险和不确定性。

五、标准差标准差是方差的平方根,用来衡量数据的离散程度。

它和方差一样可以帮助我们了解数据的波动情况,但标准差更容易理解和解释。

六、相关系数相关系数是用来衡量两个变量之间相关程度的指标。

它可以帮助我们了解两个变量之间的线性关系强弱,从而预测或者分析它们的相互影响。

七、回归系数回归系数是用来衡量自变量对因变量的影响程度的指标。

它可以帮助我们建立回归模型,预测因变量的取值,从而作出合理的决策。

八、置信区间置信区间是用来估计参数真值范围的指标。

它可以帮助我们通过样本数据来推断总体参数的取值范围,从而评估统计结果的可靠性。

九、假设检验假设检验是用来判断统计推断结果是否具有统计显著性的指标。

它可以帮助我们判断样本数据是否足够支持或者反驳某个假设,从而作出决策或者推断总体参数。

以上是几个常见的统计口径指标,它们在统计学中有着重要的作用。

通过合理运用这些指标,我们可以更好地理解和分析数据,从而得出科学的结论和决策。

统计学基本指标

统计学基本指标

统计学基本指标统计学基本指标是统计学中用来描述和分析数据的一组常见指标。

这些指标能够帮助我们对数据进行概括和解释,从而更好地理解数据的特征和趋势。

本文将介绍一些常用的统计学基本指标,包括平均数、中位数、众数、离散程度、偏度和峰度。

一、平均数平均数是一组数据的总和除以数据个数所得的值。

它是最常用的描述数据集中趋势的指标之一。

平均数可以帮助我们了解数据的集中程度。

当数据集中趋势明显时,平均数的值会比较接近数据的中心。

二、中位数中位数是一组数据中排在中间位置的值。

将数据按照大小顺序排列,如果数据个数为奇数,中位数就是中间那个数;如果数据个数为偶数,中位数就是中间两个数的平均值。

中位数可以帮助我们了解数据的分布情况,特别适用于存在离群值的数据集。

三、众数众数是一组数据中出现次数最多的值。

众数可以帮助我们找出数据中的重要特征。

当数据集中存在多个众数时,我们可以称之为多峰分布。

四、离散程度离散程度是一组数据分散程度的度量。

常见的离散程度指标有极差、方差和标准差。

极差表示数据的最大值与最小值之间的差异;方差是每个数据与平均数之差的平方和的平均数;标准差是方差的平方根。

离散程度指标能够帮助我们了解数据的分散程度,从而判断数据的可靠性和稳定性。

五、偏度偏度是一组数据分布偏斜程度的度量。

正偏分布指数据的右尾较长,负偏分布指数据的左尾较长。

偏度为0表示数据分布对称。

通过偏度指标,我们可以判断数据的分布形态,从而选择合适的处理方法。

六、峰度峰度是一组数据分布峰态的度量。

正常分布的峰度为3,大于3表示峰态较高,小于3表示峰态较平。

峰度指标可以帮助我们判断数据的分布形态,从而选择合适的分析方法。

统计学基本指标是描述和分析数据的重要工具。

通过平均数、中位数、众数、离散程度、偏度和峰度等指标,我们可以更好地理解数据的特征和趋势,为后续的数据分析和决策提供依据。

在实际应用中,我们根据具体问题选择合适的指标进行分析,以获得准确和可靠的结果。

正态分布的集中趋势和离散统计指标

正态分布的集中趋势和离散统计指标

正态分布的集中趋势和离散统计指标在统计学中,正态分布是一种非常重要且常见的概率分布,也被称为高斯分布。

它具有许多重要特性,其中包括集中趋势和离散统计指标。

在本文中,我们将探讨正态分布的集中趋势和离散统计指标,以及它们在实际应用中的意义和重要性。

1. 集中趋势指标正态分布的集中趋势指标是描述数据集中取值位置的统计量。

常见的集中趋势指标包括均值、中位数和众数。

其中,均值是所有数据值的平均数,是最常用的集中趋势指标之一。

在正态分布中,均值通常位于分布的中心位置,并且具有对称性。

除了均值,中位数和众数也是描述集中趋势的重要指标。

中位数是将数据集等分为两部分的数值,而众数则是数据集中出现最频繁的数值。

在实际应用中,集中趋势指标可以帮助我们理解数据分布的中心位置,判断数据的平均水平,并做出相应的决策。

在财务报表分析中,我们可以利用均值来评估企业的盈利水平,进而制定财务策略和规划预算。

在医学研究中,研究人员也常用中位数来描述疾病的发病率,以便做出治疗方案和预防措施。

2. 离散统计指标除了集中趋势指标外,正态分布还具有离散统计指标,用于描述数据的分散程度和波动性。

常用的离散统计指标包括标准差、方差和极差。

标准差是数据偏离均值的平均距离,是描述数据离散程度的重要统计量。

方差则是标准差的平方,用于衡量数据的波动性和离散程度。

另外,极差是描述数据取值范围的统计量,可以帮助我们了解数据的最大和最小取值之间的差异程度。

在实际应用中,离散统计指标可以帮助我们评估数据的波动性和风险程度,从而制定相应的风险管理和控制策略。

在金融投资中,我们可以利用标准差来衡量资产价格的波动性,进而评估投资风险并调整投资组合。

在生产制造中,研究人员也常用方差来评估生产过程的稳定性和一致性,以便提高生产效率和质量。

个人观点和理解对于正态分布的集中趋势和离散统计指标,我认为它们在数据分析和决策制定中起着至关重要的作用。

集中趋势指标可以帮助我们理解数据的中心位置,从而判断平均水平和典型取值。

平均数、众数、中位数、极差、方差、标准差

平均数、众数、中位数、极差、方差、标准差

平均数、众数、中位数、极差、方差、标准差说明6个基本统计量(平均数、众数、中位数、极差、方差、标准差)的内涵,学生学习过程中可能产生的困难及主要原因、应对策略.首先,结合简单实例认真把握这6个基本统计量的内涵。

一、平均数、众数、中位数是刻画一组数据的“平均水平”的数据代表。

(八上《第八章数据的代表》)平均数分算术平均数和加权平均数,算术平均数是指n个数据的和的平均值,学生理解与计算都不成问题,只要注意细心运算就是其中的取标准值后的简便算法也都是在小学早已熟练的(公式:x=1/n(x1+x2+x3+……+xn);而加权平均数是一组数据里的各个数据乘各自的“权”之后的平均数。

此处理解“权”的概念可能产生很大困难,因为“权”的理解的确不易,若是照搬教材直接给出其定义,学生会迷惑成团,再进行应用更是不可思议。

所以应对措施:讲好、用好加权平均数就要先举例、后分析、再给出定义,比如:某同学的一次考试各科成绩如下:语文110、数学105、英语106、物理95、化学90、政治86、历史98、地理66、生物89,你可以先让学生算算各科的平均数,再按中考计分法将语、数、英各取120%,物、化、政各取100%,史、地、生各取40%后的平均值算出,两个结果一比较,学生就会很容易发现不同的原因是加入了所谓的“权”,这样,不仅通俗易懂,而且对“权”内涵的理解和应用就不再困难。

众数是一组数据中出现次数最多的数。

其内涵很好理解和掌握,就是结合实际应用也顺理成章,如商店老板进货号多大的男鞋好?那当然是“众数”(调查数据最多的号)所代表的。

中位数顾名思义是一组数据中间位置的数,但考虑一组数可能有偶数个或奇数个,所以要注意强调取中位数的方法。

教材上给出的内涵很好:一般地,n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数。

如一组数据1.5,1.5,1.6,1.65,1.7,1.7,1.75,1.8的中位数是1/2(1.65+1.7),即1.675。

高中数学《平均数、中位数、众数、极差、方差 标准差》导学案

高中数学《平均数、中位数、众数、极差、方差   标准差》导学案

1.4.1平均数、中位数、众数、极差、方差1.4.2标准差[航向标·学习目标]1.理解平均数、中位数、众数、极差、方差、标准差的概念.2.会计算数据的平均数、标准差.3.体会用统计量表达样本数据,提高学生的学习兴趣.[读教材·自主学习]1.平均数:一般地,对于n个数x1,x2,…,x n,我们把□011n(x1+x2+…+x n)叫作这n个数的算术平均数,简称平均数.2.中位数:一般地,将n个数据按大小顺序排列,处于□02最中间的一个数(或最中间两个数据的平均数)叫作这组数据的中位数.3.众数:一组数据中□03出现次数最多的那个数据叫作这组数据的众数.4.极差:极差是数据的□04最大值与□05最小值的差.5.标准差:各个数据与平均数□06之差的平方的平均数,称为这组数据的方差,方差的□07算术平方根称为这组数据的标准差.[看名师·疑难剖析]1.平均数、中位数、众数刻画一组数据集中趋势的统计量有平均数、中位数和众数等,它们作为一组数据的代表各有优缺点,也各有各的用处,从不同的角度出发,不同的人会选取不同的统计量来表达同一组数据的信息.平均数是刻画一组数据集中趋势最常用的统计量.2.方差、标准差n 个数据x 1,x 2,…,x 3,我们把x 1+x 2+…+x n n记为x -,则方差可以用s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]来表示,将方差的算术平方根s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]称为标准差. 刻画一组数据离散趋势的统计量有方差、标准差等.对方差和标准差的理解还要注意以下几方面:(1)标准差、方差描述了一组数据围绕平均数的波动大小.标准差、方差越大,数据离散程度越大,稳定性越差;标准差、方差越小,数据离散程度越小,稳定性越好;(2)因方差与原始数据单位不同,且平方后可能夸大了偏差程度,所以虽然标准差与方差在体现数据分散程度上是一样的,但解决问题时一般用标准差;(3)标准差与方差的取值范围是[0,+∞).考点一 平均数、众数、中位数的计算例1 求下列一组数据的平均数、中位数、众数:10,20,80,40,30,90,50,40,50,40. [分析] 明确各概念,利用定义解题.[解] 这组数据的平均数为(10+20+80+40+30+90+50+40+50+40)÷10=45.将这组数据按从小到大的顺序排列,得10,20,30,40,40,40,50,50,80,90,所以中位数为(40+40)÷2=40.又因为40出现3次,出现次数最多,所以众数为40.类题通法求平均数必须先将所有数据求和,再把和除以数据的个数.求中位数时,必须将所有数据按从小到大的顺序排列后,把中间的数或中间两项的平均数称为这组数据的中位数.而众数则是出现次数最多的数据.在解答本类问题时,一定要审清题意,明确各数据出现的次数,认真计算,以防计算失误.[变式训练1] (1)甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为________和________.(2)在如下图所示的茎叶图中,甲、乙两组数据的中位数分别是________,________.答案(1)2423(2)4546解析(1)由茎叶图可知甲的平均数为(9+8+20)+(1+3+2+100)+(1+1+5+90)=24,乙的平均数为10(9+7+1+30)+(1+4+2+4+80)+(2+90)=23.10(2)甲组数据从小到大排序后,最中间的数是45,即甲组数据的中位数为45;乙组数据从小到大排序后,最中间的数是46,即乙组数据的中位数是46.考点二平均数、众数、中位数的应用例2个体户李某经营一家快餐店,下面是快餐店所有工作人员8月份的工资表:李某大厨二厨采购员杂工服务生会计3000元450元350元400元320元320元410元(1)计算所有员工8月份的平均工资;(2)由(1)计算出的平均工资能否反映打工人员这个月收入的一般水平?为什么?(3)去掉李某的工资后,再计算平均工资,这能代表打工人员当月的收入水平吗?(4)根据以上计算,以统计的观点,你对(3)的结果有什么看法?[解] (1)这7个人的8月份平均工资是x -1=17(3000+450+350+400+320+320+410)=750(元).(2)计算出的平均工资不能反映打工人员的当月收入的一般水平,可以看出,打工人员的工资都低于平均工资,因为这7个值中有一个极端值——李某的工资特别高,所以他的工资对平均工资的影响较大,同时他也不是打工人员.(3)去掉李某的工资后的平均工资x -2=16(450+350+400+320+320+410)=375(元),该平均工资能代表打工人员的当月收入的一般水平.(4)从本题的计算可以看出,个别特殊值对平均数有很大的影响,因此在选择样本时,样本中尽量不用特殊数据.类题通法本题充分说明了平均数在具体问题中的意义.[变式训练2] 据报道,某公司的33名职工的月工资(以元为单位)如下:(1)求该公司职工月工资的平均数、中位数、众数;(2)假设副董事长的工资从5000元提升到20000元,董事长的工资从5500元提升到30000元,那么新的平均数、中位数、众数又是什么?(精确到元)(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法.解 (1)平均数是x -=1500+4000+3500+2000×2+1500+1000×5+500×3+0×2033≈1500+591=2091(元),中位数是1500元,众数是1500元. (2)平均数是x -′=1500+28500+18500+2000×2+1500+1000×5+500×3+0×2033≈1500+1788=3288(元).中位数是1500元,众数是1500元.(3)在这个问题中,中位数或众数均能反映该公司员工的工资水平,因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.考点三 方差与标准差的计算例3 一个样本数据的方差是s 2=120[(x 1-3)2+(x 2-3)2+(x 3-3)2+…+(x 20-3)2].(1)求样本的容量n 及平均数x -;(2)如果样本数据的平方和为200,求样本的方差.[分析] 本题主要用方差的公式进行变形求解,我们要熟练掌握公式的变形. [解] (1)由样本数据方差公式可以得到样本容量n =20,平均数x -=3. (2)由s 2=120[(x 1-3)2+(x 2-3)2+…+(x 20-3)2]=120[(x 21+x 22+…+x 220)-6(x 1+x 2+…+x 20)+20×9]=120(200-360+180)=1.类题通法解决此类问题一定要熟记公式.[变式训练3] 甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表:s 1、s 2、s 3分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有( ) A .s 3>s 1>s 2 B .s 2>s 1>s 3 C .s 1>s 2>s 3 D .s 2>s 3>s 1 答案 B解析 x -甲=(7+8+9+10)×520=8.5,s 21=5×[(7-8.5)2+(8-8.5)2+(9-8.5)2+(10-8.5)2]20 =1.25,x -乙=(7+10)×6+(8+9)×420=8.5,s 22=6×[(7-8.5)2+(10-8.5)2]+4×[(8-8.5)2+(9-8.5)2]20=1.45,x -丙=(7+10)×4+(8+9)×620=8.5,s 23=4×[(7-8.5)2+(10-8.5)2]+6×[(8-8.5)2+(9-8.5)2]20=1.05,由s 22>s 21>s 23得s 2>s 1>s 3.故选B.考点四 数据的数字特征的应用例4 一次科技知识竞赛,两组学生成绩如下表:已经计算得到两个组成绩的平均数都是80分,请根据你所学过的统计知识,进一步判断这两个组在这次竞赛中的成绩谁优谁次,并说明理由.[分析]优次之分的标准是通过数据的各数字特征来反映.[解](1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数比较看,甲组的成绩好一些;(2)s2甲=150×[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=172(分2).s2乙=150×(4×900+4×400+16×100+2×0+12×100+12×400)=256(分2).因为s2甲<s2乙,所以甲组的成绩比乙组的成绩好.(3)甲、乙两组成绩的中位数、平均数都是80分,其中,甲组成绩在80分以上(含80分)的有33人,乙组成绩在80分以上(含80分)的有26人,从这一角度来看,甲组的成绩总体较好.(4)从成绩统计表来看,甲组的成绩高于90分(含90分)的人数为14+6=20(人),乙组的成绩高于90分(含90分)的人数为12+12=24(人),所以乙组成绩集中在高分段的人数多,同时乙组得满分的比甲组得满分的多6人,从这一角度来看,乙组的成绩较好.类题通法用数据的数字特征来反映该组数据的特点,本例就是从众数、中位数、方差、高分段以及满分的人数等数字特征全方位进行综合分析、比较,并作出判断.[变式训练4]有一组数据:x1,x2,…,x n(x1<x2<…<x n)的算术平均值为10,若去掉其中最大的一个,余下数据的算术平均值为9,若去掉其中最小的一个,余下数据的算术平均值为11.(1)求出第一个数x 1关于n 的表达式及第n 个数x n 关于n 的表达式; (2)若x 1,x 2,…,x n 都是正整数,试求第n 个数x n 的最大值,并举出满足题目要求且x n 取到最大值的一组数据.解 (1)依条件得⎩⎪⎨⎪⎧x 1+x 2+…+x n =10n , ①x 1+x 2+…+x n -1=9(n -1),②x 2+x 3+…+x n =11(n -1), ③由①-②得x n =n +9. 又由①-③得x 1=11-n .(2)由于x 1是正整数.故x 1=11-n ≥1⇒1≤n ≤10, 故x n =n +9≤19.当n =10时,x 1=1,x 10=19,x 2+x 3+…+x 9=80.此时,x 2=6,x 3=7,x 4=8,x 5=9,x 6=11,x 7=12,x 8=13,x 9=14.[例] (12分)某酒厂有甲、乙两条生产线生产同一种型号的白酒,产品在自动传输带上包装传送,每15分钟抽一瓶测定其质量是否合格,分别记录抽查的数据如下(单位:毫升):甲生产线:508,504,496,510,492,496 乙生产线:515,520,480,485,497,503 问:(1)这种抽样是何种抽样方法?(2)分别计算甲、乙两条生产线的平均值与标准差,并说明哪条生产线的产品较稳定.(一)精妙思路点拨(二)分层规范细解(1)根据题意知,抽样是每15分钟抽一瓶,是等距抽样,所以这种抽样是系统抽样.4分(2)根据已知抽样数据可计算:x -甲=16×(508+504+496+510+492+496)=501①,6分∴s 2甲=16×[(508-501)2+(504-501)2+(496-501)2+(510-501)2+(492-501)2+(496-501)2]=45①,∴s 甲=35≈6.708.8分x -乙=16×(515+520+480+485+497+503)=500①,∴s 2乙=16×[(515-500)2+(520-500)2+(480-500)2+(485-500)2+(497-500)2+(503-500)2]≈211.3①10分∴s 乙≈14.536.∴s 甲<s 乙,甲生产线的产品较稳定②.12分 (三)来自一线的报告通过阅卷后分析,对解答本题的失分警示和解题启示总结如下:(注:此处的①②见分层规范细解过程)(四)类题练笔掌握从甲、乙两种玉米苗中各抽10株,分别测得它们的株高如下(单位:cm): 甲:25,41,40,37,22,14,19,39,21,42; 乙:27,16,44,27,44,16,40,40,16,40. 问:(1)哪种玉米的苗长得高? (2)哪种玉米的苗长得齐?解 (1)x -甲=110×(25+41+40+37+22+14+19+39+21+42) =110×300=30(cm),x -乙=110×(27+16+44+27+44+16+40+40+16+40)=110×310=31(cm),∵x-甲<x-乙,∴乙种玉米的苗长得高.(2)s2甲=110×[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=110×1042=104.2(cm2),s2乙=110×[(27-31)2×2+(16-31)2×3+(44-31)2×2+(40-31)2×3]=110×1288=128.8(cm2).∵s2甲<s2乙,∴甲种玉米的苗长得齐.(五)解题设问(1)本题中样本数据的个数是多少?________.(2)需用样本数据的哪些数字特征?需要求出样本数据的________,用来衡量玉米的高度;求出样本数据的________(或________)用来衡量玉米长得是否齐.答案(1)有10个(2)平均数方差标准差1.已知某班8名学生的身高(单位:m)分别为:1.74,1.68,1.72,1.80,1.64,1.69,1.75,1.82,则这8名学生的平均身高为()A.1.60 m B.1.82 mC.1.73 m D.1.64 m答案 C解析求平均数.2.在一次歌手大奖赛上,七位评委为某歌手打出的分数如下:9.48.49.49.99.69.49.7去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为() A.9.40.484 B.9.40.016C.9.50.04 D.9.50.016答案 D解析 去掉最高分9.9和最低分8.4,余下的数为9.4,9.4,9.6,9.4,9.7,其平均数x -=3×9.4+9.6+9.75=9.5,s 2=15×(0.12+0.12+0.12+0.12+0.22)=0.016.3.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各有1人,则该小组成绩的平均数、众数、中位数分别是( )A .85、85、85B .87、85、86C .87、85、85D .87、85、90答案 C4.已知总体的各个体的值由小到大依次为2,3,3,7,a ,b,12,13.7,18.3,20,且总体的中位数为10.5,若要使该总体的方差最小,则a ,b 的取值分别是________.答案 a =10.5,b =10.5解析 依题意及中位数定义可知:a =10.5,b =10.5.5.甲、乙两台机床在相同的技术条件下,同时生产一种零件,现在从中抽测10个,它们的尺寸(单位:mm)分别如下.甲:10.2,10.1,10,9.8,9.9,10.3,9.7,10,9.9,10.1 乙:10.3,10.4,9.6,9.9,10.1,10.9,8.9,9.7,10.2,10分别计算上面两个样本的平均数和方差.如果图纸规定零件的尺寸为10 mm ,从计算的结果来看,用哪台机床加工这种零件较合适?(要求利用公式笔算)解 x -甲=110×(10.2+10.1+…+10.1)=110×100=10, x -乙=110×(10.3+10.4+…+10)=110×100=10.所以s 2甲=110×[(10.2-10)2+(10.1-10)2+…+(10.1-10)2]=0.03(mm 2), 所以s 2乙=110×[(10.3-10)2+(10.4-10)2+…+(10-10)2]=0.06(mm 2). 所以s 2甲<s 2乙.所以甲机床比乙机床稳定,即用甲机床加工较合适.一、选择题1.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )89⎪⎪⎪ 9 73 1 6 4 0 2A .91.5和91.5B .91.5和92C .91和91.5D .92和92答案 A解析 中位数为12(91+92)=91.5;平均数为18(87+89+90+91+92+93+94+96)=91.5.2.某校高一有四个班,1~4班的人数分别为N 1,N 2,N 3,N 4,总人数为N ,英语成绩的平均分分别为M 1,M 2,M 3,M 4,则该校高一英语的平均分是( )A .M 1,M 2,M 3,M 4的平均数B .M 1,M 2,M 3,M 4的中位数C .M 1N 1,M 2N 2,M 3N 3,M 4N 4的平均数D .M 1N 1,M 2N 2,M 3N 3,M 4N 4的和与1N 的乘积 答案 D3.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为( )A.65 B.65 C. 2 D .2答案 D解析 由题可知样本的平均值为1,所以a +0+1+2+35=1,解得a =-1,所以样本的方差为15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2,故选D. 4.甲、乙两名同学在五次考试中数学成绩统计用茎叶图表示如下图所示,则下列说法正确的是( )A.甲的平均成绩比乙的平均成绩高B .甲的平均成绩比乙的平均成绩低C .甲成绩的方差比乙成绩的方差大D .甲成绩的方差比乙成绩的方差小 答案 C解析 x -甲=15(98+99+105+115+118)=107, x -乙=15(95+106+108+112+114)=107.s 2甲=15[(98-107)2+(99-107)2+(105-107)2+(115-107)2+(118-107)2]=66.8,s 2乙=15[(95-107)2+(106-107)2+(108-107)2+(112-107)2+(114-107)2]=44.所以排除A 、B 、D ,选C.5.如下图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为x -A 和x -B ,样本标准差分别为s A 和s B ,则( )A.x -A >x -B ,s A >s BB.x -A <x -B ,s A >s BC.x -A >x -B ,s A <s BD.x -A <x -B ,s A <s B 答案 B解析 由图可知A 组的6个数为2.5,10,5,7.5,2.5,10, B 组的6个数为15,10,12.5,10,12.5,10, 所以x -A =2.5+10+5+7.5+2.5+106=37.56, x -B =15+10+12.5+10+12.5+106=706.显然x -A <x -B ,又由图形可知,B 组的数据分布比A 均匀,变化幅度不大,故B 组数据比较稳定,方差较小,从而标准差较小,所以s A >s B ,故选B.6.某次考试,班长算出了全班40人的数学成绩的平均分M ,如果把M 当成一个同学的成绩与原来的40个分数加在一起,算出这41个分数的平均值为N ,那么M ∶N 为( )A .40∶41B .41∶40C .2∶1D .1∶1答案 D解析 由题意知全班40个同学的总分为40M ,则N =40M +M41,整理,得M =N .二、填空题7.若40个数据的平方和是48,平均数是12,则这组数据的方差是________. 答案 1920解析 由题可得x 21+x 22+…+x 240=48,x -=12. 所以s 2=140[(x 1-x -)2+(x 2-x -)2+…+(x 40-x -)2] =140[(x 21+x 22+…+x 240)+40x -2-2x -(x 1+x 2+…+x 40)] =140⎝ ⎛⎭⎪⎫48+40×14-2×12×12×40=1920.8.从甲、乙、丙三个厂家生产的同一种产品中抽取8件产品,对其使用寿命(单位:年)进行追踪调查的结果如下:甲:3,4,5,6,8,8,8,10; 乙:4,6,6,6,8,9,12,13; 丙:3,3,4,7,9,10,11,12.三个厂家广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数,众数,中位数中的哪一种集中趋势的特征数.甲:________,乙:________,丙:________. 答案 众数 平均数 中位数9.某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s 2=________.答案 3.2解析本题主要考查统计知识——方差的计算.5个数据的平均数x-=10+6+8+5+65=7,所以s2=15×[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=3.2.三、解答题10.某校在一次考试中,甲、乙两班学生的数学成绩统计如下:选用平均数与众数、中位数评估这两个班的成绩.解甲班平均数79.6分,乙班平均数80.2分,从平均分看成绩较好的是乙班;甲班众数为90分,乙班众数为70分,从众数看成绩较好的是甲班;甲班的第25个和第26个数据都是80,所以中位数是80分,同理,乙班中位数也是80分,但是甲班成绩在中位数以上(含中位数)的学生有31人,占全班学生的62%,同理乙班27人,占54%,所以从中位数看成绩较好的是甲班.如果记85分以上为优秀,甲班有20人,优秀率为40%;乙班有24人,优秀率为48%,从优秀率来看成绩较好的是乙班.可见,一个班学生成绩的评估方法很多,需视要求而定.11.为了了解市民的环保意识,某校高一(1)班50名学生在6月5日(世界环境日)这一天调查了各自家庭丢弃旧塑料袋的情况.有关数据如下表:每户丢弃旧塑料袋个数234 5户数6161513(1)求这50户居民每天丢弃旧塑料袋的平均数;(2)求这50户居民每天丢弃旧塑料袋的标准差.解根据平均数和标准差的公式计算即可.(1)平均数x -=150(2×6+3×16+4×15+5×13)=18550=3.7. (2)这50户居民每天丢弃旧塑料袋的方差为s 2=150[6×(2-3.7)2+16×(3-3.7)2+15×(4-3.7)2+13×(5-3.7)2]=150×48.5=0.97.所以标准差s ≈0.985.12.两台机床同时生产直径为10毫米的零件,为了检验产品质量,检验员从两台机床的产品中各抽出4件进行测量,结果如下(单位:毫米):如果你是检验员,在收集到上述数据后,你将通过怎样的运算来判断哪台机床生产的零件更符合要求?解 先计算平均直径:x -甲=14×(10+9.8+10+10.2)=10(毫米).x -乙=14×(10.1+10+9.9+10)=10(毫米).由于x -甲=x -乙,因此,平均直径反映不出两台机床生产的零件的优劣.再计算方差:s 2甲=14×[(10-10)2+(9.8-10)2+(10-10)2+(10.2-10)2]=0.02(毫米2),s 2乙=14×[(10.1-10)2+(10-10)2+(9.9-10)2+(10-10)2]=0.005(毫米2). 由于s 2乙<s 2甲,这说明乙机床生产出的零件直径波动小,因此,从产品质量稳定性的角度考虑,乙机床生产的零件更符合要求.13.近几届冬奥会男、女1500米速滑的冠军成绩分别如下表所示:(1)分别求出男、女1500米速滑的冠军成绩的平均数和中位数;(2)分别求出男、女1500米速滑的冠军成绩的标准差;(3)通过(1)(2)的计算,请用自己的语言描述近几届冬奥会男、女1500米速滑的冠军成绩分别有什么特点.解(1)近几届冬奥会男子1500米速滑冠军成绩的平均数和中位数分别是1′54.17″,1′54.81″;女子的平均数和中位数分别是2′05.32″,2′03.42″.(2)近几届冬奥会男、女1500米速滑冠军成绩的标准差分别是3.7637″,6.0194″.(3)从上面的计算结果我们不难看出:近几届冬奥会男子速滑的冠军成绩相比女子成绩优异而且比较稳定.。

众数中位数(PPT课件)

众数中位数(PPT课件)

x=
1 ( x1 x2 xn ) n
3
练习: 在一次中学生田径运动会上,参加 男子跳高的17名运动员的成绩如下表所示:
成绩 (单位:米)
1.50 2
1.60 1.65 1.70 3 2 3
1.75 1.80 1.85 1.90 4 1 1 1
人数
分别求这些运动员成绩的众数,中位数与 平均数 解:在17个数据中,1.75出现了4次,出现的 次数最多,即这组数据的众数是1.75. 上面表里的17个数据可看成是按从小到大 的顺序排列的,其中第9个数据1.70是最中间 的一个数据,即这组数据的中位数是1.70;
6
2、中位数是样本数据所占频率 的等分线,它不受少数几个极端值的 影响,这在某些情况下是优点,但它 对极端值的不敏感有时也会成为缺点。
7
3、由于平均数与每一个样本的 数据有关,所以任何一个样本数据的 改变都会引起平均数的改变,这是众 数、中位数都不具有的性质。
也正因如此 ,与众数、中位数比较起 来,平均数可以反映出更多的关于样 本数据全体的信息,但平均数受数据 中的极端值的影响较大,使平均数在 估计时可靠性降低。
S 2的数量单位与原数据的数量单位不
一致了,因此在实际应用时常将求出的方差 再开平方,这就是标准差
(standard deviation).
标准差 方差
方差出下列四组样本数据的条形图,说明它们的异同点.
(1) 5, 5, 5, 5, 5, 5, 5, 5, 5; (2) 4, 4, 4, 5 , 5, 5, 6, 6, 6; (3) 3 , 3 , 4 , 4 , 5, 6 , 6, 7 , 7; (4) 2 , 2 , 2 , 2, 5 , 8 , 8 , 8 , 8 ;
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
27
小明开设了一个生产玩具的小工厂,管理人员由小明、 他的弟弟和六个亲戚组成,工作人员由五个领工和十个工人 组成.工厂经营的很顺利,需增加一个新工人,小亮需要一 份工作,应征而来与小明交谈.小明说:“我们这里报酬不 错,平均薪金是每周300元.你在学徒期每周75元,不过很快 就可以加工资了.”小亮工作几天后找到小明说:“你欺骗 了我,我已经找其他工人核对过了,没有一个人的工资超过 每周100元,平均工资怎么可能是一周300元呢?”小明说: “小亮啊,不要激动,平均工资是300元,你看,这是一张 工资表.”
2、从总体中逐个进行抽取 3、不放回抽样
7
4、每个个体被抽到的机会相等
抽签法de操作程序
1、先将总体中的所有个体(共N个)编号 (号码可以从1到N),
2、并把号码写在形状、大小相同的号签上 (号签可以用小球、卡片、纸条等制作),
3、然后将这些号签放在同一个箱子里,进行 均匀搅拌。
4、抽签时,每次从中抽出1个号签,连续抽取 n次,就得到一个容量为n的样本。
33
例1 某公司员工的月工资情况如下表所示:
月工资/元 8000 5000 4000 2000 1000 800 700 600 500
员工/人
1
24
6
12 8 20 5 2
(1)分别计算该公司员工月工资的平均数、中位数和众数.
解: 平均数:
8000×1+5000×2+4000×2+2000×6+1000×12+800×8+700×20+600×5+500×2
标明相应的百分比,各比例的名称可以注明在图 上,也可以用图例标明。 (注意:各扇形可以用不同颜色表示,也可以用斜 线、网状等不同线形表示)
25
茎叶图
一般地, 当数据很小时, 用中间的数字表示十位数, 两边的
数字表示个位数, 它的中间部分像植物的茎, 两边部分像植物茎
上长出来的叶子. 因此, 通常把这样的图叫做茎叶图.
结束
2.系统抽样
当总体的个体数较大时,可将总体分成均
衡的几个部分,然后按照预先定出的规则,
从每一部分抽取1个个体,得到所需要的样
本.这种抽样叫做系统抽样。
系统抽样是将总体中的个体进行编号,等
距分组,在第一组中按照简单随机抽样抽
取第一个样本,然后按分组的间隔(称为
抽样距)抽取其他样本,这种抽样方法有
顺次连接起来,形成折线。
23
扇形统计图:
用圆和扇形分别表示总体和各个组成 部分数据的统计图叫作扇形统计图(或 饼图)。
特点:能直观、生动地反映个部分在总 体中所占比例。
24
制作扇形统计图的步骤:
1、画一个圆。 2、按各组成部分所占比例算出各个扇形的圆心角
度数。 3、根据算出的各圆心角的度数画出各个扇形,并
在起始部 分抽样时, 采用简单随 机抽样
各层抽样 时采用简单 随机分构成
抽样过程 中每个个 体被抽到 的可能性 相同
17
统计图表是表达和分析数据的重要工具, 它不仅可以帮助我们从数据中获取有用的信息, 还可以帮助我们直观、准确地理解相应的结果. 我们在初中阶段已经学习过条形统计图、扇形统
2、在横轴上确定直条的位置。 3、在纵轴上根据数量的多少确定单位长度。 4、根据数量的多少画出长短不同的直条。 (注意:直条的宽窄要一致,长短要准确,条与条
之间间隔要均等)
21
折线统计图:
用一定单位长度表示一定的数量,并根 据数量的多少描出各点,然后把各点用线 段顺次连接起来,形成折线,用折线的升 降来表示数量之间的关系及变化趋势,这 样的统计图叫作折线统计图。 特点:折线统计图可以表示一种数量的增减变化情
5、对个体编号时,也可以利用已有的编号。
例如学生的学号,座位号等。
8
随机数表法的操作步骤
第一步:将总体中的所有个体编号(每个号码 位数一致);
第二步:在随机数表中任选一个数作为开始;
第三步:从选定的数开始按一定的方向读下去, 得到的数码若不在编号中,则跳过;若在编号 中,则取出。得到的数码若在前面已经取出, 则跳过。如此进行下去,直到取满为止;
28
工资表如下:
人 员 小明 小明弟 亲戚 领工 工人
周工资 2400 1000 250 200 100
人数 1
1
6 5 10
合 计 2400 1000 1500 1000 1000
这到底是怎么了?
29
1.什么叫平均数?有什么意义? 2.什么叫中位数?有什么意义? 3.什么叫众数?有什么意义? 4.什么叫极差?有什么意义? 5.什么叫方差?有什么意义? 6.什么叫标准差?有什么意义?
规律方法总结
1、分层抽样的步骤:
(1) 将总体按一定的标准分层;
(2)计算各层的个体数与总体的 个体数的比;
开始 分层 计算比
(3)按各层个体数占总体的个 体数的比确定各层应抽取
定层抽取容量
的样本容量;
抽样
(4)在每一层进行抽样;(可用简单
随机抽样或系统抽样)
组样
(5)综合每层抽样,组成样本.
13
第四步:根据选定的号码抽取样本。
9
用抽签法抽取样本的步骤:
简记为:编号;制签;搅匀;抽签;取个体。
用随机数表法抽取样本的步骤:
简记为:编号;选数;读数;取个体。
10
分层抽样 当已知总体由差异明显的几部分
组成时,为了使样本充分地反映总体的情况,常 将总体按其属性特征分成若干类型(有时称作 层),然后在每个类型中按照所占比例随机抽取 一定的样本。这种抽样叫做分层抽样。
有效数字的数据, 对位数多的数据不太
752
容易操作;
00
(3)茎叶图对重复出现的数据要重复
31
记录, 不能遗漏.
8
茎: 叶: 乙
0
1 028
2 02337
3 12448
4 238
5
26
数据的信息除了通过前面介绍的用各种统计图表 来加以整理和表达之外,还可以通过一些统计量来表 述,也就是将多个数据“加工”为一个数值,使这个 数值能够反映这组数据的某些重要的整体特征.
简记为:编号;分段;在第一段确定起始号;加 间隔逐个获取样本。
16
三种抽样方法的特点及适用范围可归纳如下
类别 特点 相互联系 适用范围 共同点
简单随 机抽样
从总体中逐个 抽取
总体中的个 体个数较少
系统 抽样
分层 抽样
将总体平均分 成几部分,按 一定的规则分 别在各部分中 抽取
将总体分成几 层,按各层个 体数之比抽取
茎按从小到大的顺序从上向下列出, 共茎的叶一般按从大到
小(或从小到大)的顺序列出.
茎叶图的特征:
(1)用茎叶图表示数据有两个优点: ①原始数据没有损失, 所有数据信息都 可以在茎叶图中得到; ②茎叶图中的数 据可以随时添加, 方便记录与表示.
叶: 甲 865
(2)茎叶图只便于表示两位(或一位) 8 8 4 0 0
5. 方 差 是 样 本 数 据 到 平 均 数 的 平 均 距 离 , 一 般 用 s2 表 示 , 通 常 用 公 式
s2
1 n
[(x1
x)2
(
x2
x
)2
(xn x)2]来计算.反映了数据的离散程度.方差越大,数据的离散程度越
大,方差越小数据的离散程度越小.
6. 标准差等于方差的正的平方根,即s s2 ,与方差的作用相同,描述一组数据围绕平均数的
计图和折线统计图, 在这里,我们将结合一些案例进一步对统计图表
的特点和选用加以具体分析.
18
选取调查对象
普查或抽样
统计活动
收集数据 整理并分析数据
收集 数据
整理 分析
获取信息
列统计表 画统计图
作出决策
如何整理和分析已收集的数据, 较准确的获取信息,从而作 出恰当的决策-. -----统计学的任务
奇数个数时,中位数有1个; 偶数个数时,中位数有2个
注:中位数可能在所给数据中,也可能不在所给数据中
3. 一组数据中出现次数最多的数称为这组数据的众数.一组数据中的众数可能不止
一个,也可能没有,反映了数据的集中趋势. 31
4.一组数据的最大值与最小值的差称为这组数据的极差,表示该组数据之间的差异情况.
简单随机抽样
抽签法 随机数表法
分层抽样
系统抽样
抽样过程中每个个体被抽取的机会相等, 体现了 抽样的客观性与公平性
6
复习
简单随机抽样的定义:
一般地,设总体含有N个个体,从中逐个不 放回地抽取n个个体作为样本(n≤N) ,如果每次 抽取时,每个个体被抽到的概率都相等,这种抽
样方法叫作 简单随机抽样.
特点: 1、总体的个数有限(较少)
时也叫等距抽样或机械抽样。
14
1.系统抽样的概念 一般地,要从容量为N的总体中抽取容量为n的样本,可将 总体分成_均__衡__的若干部分,然后按照预先制定的规则,从 每一部分抽取_一__个__个体,得到所需要的样本,这种抽样的 方法叫做系统抽样.
2.系统抽样的步骤 一般地,假设要从容量为N的总体中抽取容量为n的样本, 我们可以按下列步骤进行系统抽样: (1)编号:先将总体的N个个体_编__号__ .有时可直接利用个体 自身所带的号码,如学号、准考证号、门牌号等.
15
(2)分段:_确__定__分__段__间__隔__k_,对编号进行分段.当Nn(n 是样本容量) 是整数时,取 k=Nn. (3)确定第一个编号:在第1段用__简__单__随__机__抽__样__确定第一个个体 编号l(l≤k); (4)成样:按照一定的规则抽取样本.通常是将l _加__上__间__隔__k_得到 第2个个体编号(l+k),再_加__k_得到第3个个体编号(l+2k),依次 进行下去,直到获取整个样本.
相关文档
最新文档