数理统计_方差与标准差

合集下载

方差和标准差的计算

方差和标准差的计算

标准差是衡量 数据离散程度 的指标,用于 反映数据的波
动大小。
标准差越大, 数据波动越大; 标准差越小, 数据越趋近于
平均值。
标准差的性质
描述数据离散程度
无单位,与平均值无关
与方差成正比
计算公式为:标准差 = sqrt((1/N) * Σ(xi-μ)^2)
标准差பைடு நூலகம்应用场景
金融领域:评估投资组合的风险 统计学:比较不同数据集的离散程度 质量控制:识别生产过程中的异常值 社会科学:研究不同群体的收入或教育水平的差异
方差和标准差的区别与联系
方差和标准差的区别
方差是数据与平均值之差的平方的平均值,用于衡量数据的离散程度。
标准差是方差的平方根,与方差具有相同的量纲,也可以用于衡量 数据的离散程度。 标准差在数学处理上更加方便,很多统计公式和定理都以标准差的形 式出现。
方差和标准差的区别在于它们的计算方法和量纲不同。
方差和标准差可用于检验数据是 否符合某种分布
方差和标准差在金融领域的应用
风险评估:用于衡量投资组合的风险水平 资产配置:确定不同资产类别的权重,以实现风险和收益的平衡 业绩评估:比较不同投资策略或基金经理的表现,以选择更优的投资方案 资本充足率:评估银行的资本充足情况,确保其具备足够的抵御风险能力
方差的优缺点
优点:可以衡量一组数据的 离散程度,是描述数据稳定 性和可靠性的重要指标。
缺点:对于数据中的异常值 敏感,异常值对方差的影响 较大,可能导致结果失真。
标准差的优缺点
优点:可以衡量一组数据的 离散程度,常用于评估数据 的稳定性。
缺点:对极端值的影响较为 敏感,可能导致评估结果失
真。
如何选择使用方差或标准差

方差 均方差 标准差

方差 均方差 标准差

方差均方差标准差在统计学中,方差、均方差和标准差是描述数据离散程度的重要指标。

它们之间存在一定的联系,下面我们将分别介绍这三个概念的定义和意义。

一、方差的定义和意义方差(Variance)是指各个数据值与数据集的平均值之差的平方值的平均数。

用公式表示为:V = (Σ(x_i - μ)) / n。

其中,x_i表示各个数据值,μ表示数据集的平均值,n表示数据个数。

方差反映了数据值围绕平均值的波动程度,值越小,数据越稳定。

二、均方差的计算方法均方差(Mean Squared Deviation,简称MSD)是指各个数据值与数据集的平均值之差的平方值的平均数。

计算公式为:MSD = Σ(x_i - μ) / n。

与方差的计算公式相同,均方差也反映了数据值围绕平均值的波动程度。

三、标准差的定义和意义标准差(Standard Deviation,简称SD)是方差的平方根。

用公式表示为:SD = √V。

标准差反映了数据值围绕平均值的离散程度,值越小,数据越稳定。

标准差在实际应用中具有重要意义,例如,在投资领域,标准差用于衡量投资组合的风险;在医学领域,标准差用于评估患者的健康状况等。

四、方差、均方差和标准差的关系方差、均方差和标准差都是描述数据离散程度的指标,它们之间存在一定的联系。

均方差是方差的平方根,而标准差是方差的平方根。

因此,在实际应用中,我们通常通过计算标准差来描述数据的离散程度。

五、实例分析假设一个数据集为:1,2,3,4,5。

首先计算平均值:μ = (1 + 2 + 3 + 4 + 5) / 5 = 3。

然后计算各个数据值与平均值之差的平方值:(-2),(-1,0,1,2)。

接着计算平方值的和:Σ(x_i - μ) = 14。

最后计算方差:V = Σ(x_i - μ) / n = 14 / 5 = 2.8。

根据方差计算标准差:SD = √V = √2.8 ≈ 1.67。

通过这个实例,我们可以看出,方差、均方差和标准差都是描述数据离散程度的有效工具。

方差和标准差 知识讲解

方差和标准差 知识讲解

方差和标准差——知识讲解【学习目标】1. 了解方差和标准差的概念,会计算简单数据的方差,体会它们刻画数据离散程度的意义;2. 知道可以通过样本的方差来推断总体的方差.能解释统计结果,根据结果作出简单的判断和预测;3. 能综合运用统计知识解决一些简单的实际问题. 【要点梳理】要点一、方差和标准差 1.方差在一组数据12,,n x x x …,中,设它们的平均数是x ,各数据与平均数的差的平方的平均数()[]222212)(...)(1x x x x x x nS n -++-+-=叫做这组数据的方差. 方差越大,说明数据的波动越大,越不稳定. 要点诠释:(1)方差反映的是一组数据偏离平均值的情况. 方差越大,稳定性越差;反之,则稳定性越好.(2)一组数据的每一个数都加上(或减去)同一个常数,所得的一组新数据的方差不变. (3)一组数据的每一个数据都变为原来的k 倍,则所得的一组新数据的方差变为原来的2k 倍.2.标准差一般地,一组数据的方差的算术平方根称为这组数据的标准差. 要点诠释:(1)标准差的数量单位与原数据一致.(2)一组数据的方差或标准差越小,这组数据的离散程度越小,这组数据就越稳定. 要点二、方差和标准差的联系与区别联系:方差和标准差都是用来衡量一组数据偏离平均数的大小(即波动大小)的指标,常用来比较两组数据的波动情况.区别:方差是用“先平均,再求差,然后平方,最后再平均”的方法得到的结果,主要反映整组数据的波动情况,是反映一组数据与其平均值离散程度的一个重要指标,每个数据的变化都将影响方差的结果,是一个对整组数据波动情况更敏感的指标.在实际使用时,往往计算一组数据的方差,来衡量一组数据的波动大小. 方差的单位是原数据单位的平方,而标准差的单位与原数据单位相同.【典型例题】类型一、方差和标准差1. 一组数据-2,-1,0,1,2的方差是( )A .1B .2C .3D .4【思路点拨】按照“先平均,再求差,然后平方,最后再平均”的方法,利用求方差的公式:()[]222212)(...)(1x x x x x x nS n -++-+-=计算. 【答案】B【解析】该组数据的平均数是0,所以215s =2222(2)(1)12⎡⎤-+-++⎣⎦=2. 【总结升华】此类题关键是掌握求方差的步骤,记准求方差的公式.举一反三:【变式】学校篮球队五名队员的年龄分别为1715171615,,,,,其方差为0.8,则3年后这五名队员年龄的方差为______. 【答案】0.8.2.已知某样本的标准差是2,则这个样本的方差是( ) A.1 B.2 C.2 D.4【思路点拨】根据标准差的概念计算.标准差是方差的算术平方根. 【答案】D ;【解析】解:由于方差的算术平方根就是标准差,所以样本的方差=22=4.故选D .【总结升华】正确理解标准差的概念,是解决本题的关键.标准差是方差的算术平方根. 举一反三:【变式】下列说法:其中正确的个数有( ) (1)方差越小,波动性越小,说明稳定性越好; (2)一组数据的众数只有一个;(3)数据2,2,3,2,2,5的众数为4; (4)一组数据的标准差一定是正数.A .0个B .1个C .2个D .4个 【答案】B.提示:(1)正确.类型二、方差和标准差的实际应用3.甲、乙两班举行汉字输入比赛,•参赛学生每分钟输入汉字的个数经统计计算后,填入下表:班级 参加人数 中位数 方差 平均字数 甲 55 149 191 135 乙55151110135(1)甲、乙两班学生成绩的平均水平相同;(2)乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字150个为优秀) (3)甲班学生成绩的波动情况比乙班成绩波动大. A .(1)(2) B .(1)(2)(3) C .(2)(3) D .(1)(3) 【思路点拨】理清表格中所列数据代表的含义,以及数据差异而导致的不同. 【答案】B【解析】甲、乙两班学生的平均字数都是135个/分钟,所以平均水平相同;从中位数上看,乙班的151大于甲班的149,表明乙班优秀的人数多于甲班优秀的人数;从方差上看,甲班的方差大于乙班的方差,所以甲班学生成绩的波动情况比乙班成绩波动大.因此,(1)(2)(3)都正确,选B. 【总结升华】此类题关键是要能从表格中筛选出所需要的信息,理解每个数据所代表的含义. 举一反三: 【变式】(2015•崇左)甲、乙、丙、丁四位同学在三次数学测验中,他们成绩的平均分是x 甲=85,x 乙=85,x 丙=85,x 丁=85,方差是2S 甲=3.8,2S 乙=2.3,2S 丙=6.2,2S 丁=5.2,则成绩最稳定的是( )A .甲B .乙C .丙D .丁 【答案】B.解:∵2S 甲=3.8,2S 乙=2.3,2S 丙=6.2,2S 丁=5.2,∴2S 乙<2S 甲<2S 丁<2S 丙, ∴成绩最稳定的是乙. 故选B .4.(2016春•商水县期末)甲、乙两种水稻试验田连续5年的平均单位面积产量如下:(单位:吨/公顷)品种 第1年 第2年 第3年 第4年 第5 年 甲 9.8 9.9 10.1 10 10.2 乙9.410.310.89.79.8(1)哪种水稻的平均单位面积产量比较高? (2)哪种水稻的产量比较稳定.【思路点拨】首先求得平均产量,然后求得方差,比较方差,越小越稳定. 【答案与解析】 解:(1)()19.89.910.11010.2105=++++=x 甲, ()19.410.310.89.7105=++++9.8=x 乙, 所以甲、乙两种水稻的平均产量一样高; (2)甲中水稻产量的方差是:[(9.8﹣10)2+(9.9﹣10)2+(10.1﹣10)2+(10﹣10)2+(10.2﹣10)2]=0.02, 乙种水稻产量的方差是:[(9.4﹣10)2+(10.3﹣10)2+(10.8﹣10)2+(9.7﹣10)2+(9.8﹣10)2]=0.244. ∴0.02<0.244,∴产量比较稳定的水稻品种是甲.【总结升华】此题考查了方差,用到的知识点是方差和平均数的计算公式,它反映了一组数据的波动大小,方差越大,波动性越大,反之也成立.举一反三: 【变式】为了比较甲、乙两种水稻的长势,农技人员从两块试验田中,分别随机抽取5棵植株,将测得的苗高数据绘制成下图:请你根据统计图所提供的数据,计算平均数和方差,并比较两种水稻的长势. 【答案】5.8 5.2x x ==乙甲∵,,∴甲种水稻比乙种水稻长得更高一些.222.160.56S S ==乙甲∵,,∴乙种水稻比甲种水稻长得更整齐一些.5.(2015春•安达市期末)甲、乙两台机床同时加工直径为10mm 的同种规格零件,为了检查两台机床加工零件的稳定性,质检员从两台机床的产品中各抽取5件进行检测,结果如下(单位:mm ):甲 10 9.8 10 10.2 10 乙 9.9 10 10 10.1 10(1)分别求出这两台机床所加工零件直径的平均数和方差;(2)根据所学的统计知识,你认为哪一台机床生产零件的稳定性更好一些,说明理由. 【思路点拨】(1)根据所给的两组数据,分布求出两组数据的平均数,再利用方差公式求两组数据的方差即可.(2)根据甲的方差大于乙的方差,即可得出乙机床生产的零件稳定性更好一些. 【答案与解析】 解:(1)∵甲机床所加工零件直径的平均数是:(10+9.8+10+10.2+10)÷5=10,乙机床所加工零件直径的平均数是:(9.9+10+10+10.1+10)÷5=10,植株编号 1 2 3 4 5甲种苗高 7 5 4 5 8乙种苗高 6 4 5 6 5∴甲机床所加工零件直径的方差=[(10﹣10)2+(9.8﹣10)2+(10﹣10)2+(10.2﹣10)2+(10﹣10)2]=0.013,乙机床所加工零件直径的方差=[(9.9﹣10)2+(10﹣10)2+(10﹣10)2+(10.1﹣10)2+(10﹣10)2]=0.004,(2)∵S 2甲>S 2乙,∴乙机床生产零件的稳定性更好一些.【总结升华】本题考查了平均数和方差,一般地设n 个数据,x 1,x 2,…x n 的平均数为,则方差S 2=[(x 1﹣)2+(x 2﹣)2+…+(x n ﹣)2],它反映了一组数据的波动大小,方差越大,波动性越大. 举一反三:【变式】某工厂甲、乙两名工人参加操作技能培训.现分别从他们在培训期间参加的若干次甲 95 82 88 81 93 79 84 78 乙8375808090859295(2)现要从中选派一人参加操作技能比赛,从统计学的角度考虑,你认为选派哪名工人参加合适?请说明理由. 【答案】解:1(9582888193798478)858x =+++++++=甲(分), 1(8375808090859295)858x =+++++++=乙(分).甲、乙两组数据的中位数分别为83分、84分. (2)由(1)知85x x ==甲乙分,所以22221[(9585)(8285)(7885)]35.58s =-+-++-=甲, 22221[(8385)(7585)(9585)]418s =-+-++-=乙.①从平均数看,甲、乙均为85分,平均水平相同; ②从中位数看,乙的中位数大于甲,乙的成绩好于甲;③从方差来看,因为x x =甲乙,22s s <乙甲,所以甲的成绩较稳定;④从数据特点看,获得85分以上(含85分)的次数,甲有3次,而乙有4次,故乙的成绩好些;⑤从数据的变化趋势看,乙后几次的成绩均高于甲,且呈上升趋势,因此乙更具潜力. 综上分析可知,甲的成绩虽然比乙稳定,但从中位数、获得好成绩的次数及发展势头等方面分析,乙具有明显优势,所以应派乙参赛更有望取得好成绩.。

方差、标准差、均方差、均方误差区别总结

方差、标准差、均方差、均方误差区别总结

方差、标准差、均方差、均方误差区别总结一、百度百科上方差是这样定义的(variance)是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。

概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。

统计中的方差(样本方差)是各个数据分别与其平均数之差的平方的和的平均数。

在许多实际问题中,研究方差即偏离程度有着重要意义。

看这么一段文字可能有些绕,那就先从公式入手,对于一组随机变量或者统计数据,其期望值我们由E(X)表示,即随机变量或统计数据的均值,然后对各个数据与均值的差的平方求和,最后对它们再求期望值就得到了方差公式。

这个公式描述了随机变量或统计数据与均值的偏离程度。

二、方差与标准差之间的关系就比较简单了根号里的内容就是我们刚提到的那么问题来了,既然有了方差来描述变量与均值的偏离程度,那又搞出来个标准差干什么呢?发现没有,方差与我们要处理的数据的量纲是不一致的,虽然能很好的描述数据与均值的偏离程度,但是处理结果是不符合我们的直观思维的。

举个例子:一个班级里有60个学生,平均成绩是70分,标准差是9,方差是81,成绩服从正态分布,那么我们通过方差不能直观的确定班级学生与均值到底偏离了多少分,通过标准差我们就很直观的得到学生成绩分布在[61,79]范围的概率为0.6826,即约等于下图中的34.2%*2三、均方差、均方误差又是什么?标准差(Standard Deviation),中文环境中又常称均方差,但不同于均方误差(mean squared error,均方误差是各数据偏离真实值的距离平方和的平均数,也即误差平方和的平均数,计算公式形式上接近方差,它的开方叫均方根误差,均方根误差才和标准差形式上接近),标准差是离均差平方和平均后的方根,用σ表示。

标准差是方差的算术平方根。

从上面定义我们可以得到以下几点:1、均方差就是标准差,标准差就是均方差2、均方误差不同于均方误差3、均方误差是各数据偏离真实值的距离平方和的平均数举个例子:我们要测量房间里的温度,很遗憾我们的温度计精度不高,所以就需要测量5次,得到一组数据[x1,x2,x3,x4,x5],假设温度的真实值是x,数据与真实值的误差e=x-xi那么均方误差MSE=总的来说,均方差是数据序列与均值的关系,而均方误差是数据序列与真实值之间的关系,所以我们只需要搞清楚真实值和均值之间的关系就行了。

方差与标准差的关系

方差与标准差的关系

方差与标准差的关系方差和标准差都是描述数据分布离散程度的统计量,它们之间存在着密切的关系。

在统计学中,方差和标准差是常用的概念,它们可以帮助我们更好地理解和分析数据的分布情况。

本文将围绕方差与标准差的关系展开讨论,希望能够帮助读者更好地理解这两个概念。

首先,让我们来了解一下方差和标准差的定义。

方差是衡量一组数据离散程度的统计量,它是各数据与其均值之差的平方和的平均数。

方差的计算公式为,。

\[ \sigma^2 = \frac{1}{n}\sum_{i=1}^{n}(x_i \mu)^2 \]其中,\( \sigma^2 \)表示方差,\( n \)表示样本容量,\( x_i \)表示第\( i \)个数据点,\( \mu \)表示数据的均值。

而标准差则是方差的平方根,它用来衡量数据的离散程度,标准差的计算公式为:\[ \sigma = \sqrt{\frac{1}{n}\sum_{i=1}^{n}(x_i \mu)^2} \]标准差的意义在于,它可以告诉我们数据的离散程度有多大,标准差越大,代表数据越分散;标准差越小,代表数据越集中。

接下来,我们来探讨方差和标准差之间的关系。

从定义公式可以看出,标准差是方差的平方根,也就是说,标准差是方差的一种度量单位更为统一的形式。

在实际应用中,我们通常更倾向于使用标准差而不是方差,因为标准差的量纲与原始数据一致,更容易理解和解释。

此外,方差和标准差都可以用来衡量数据的离散程度,但是在比较不同数据集的离散程度时,由于方差的单位是数据单位的平方,所以通常会使用标准差来进行比较。

标准差的值越大,代表数据的波动越大,反之则波动越小。

因此,标准差在实际应用中更为直观和易于理解。

另外,方差和标准差还可以用来进行数据的分布比较。

当我们比较两个数据集的离散程度时,可以通过比较它们的标准差来判断哪个数据集的波动更大或更小。

而通过方差和标准差的分析,我们还可以对数据的稳定性和可靠性进行评估,从而更好地进行数据分析和决策。

标准差与方差的关系

标准差与方差的关系

标准差与方差的关系标准差和方差是统计学中常用的两个概念,它们都是用来衡量数据的离散程度和波动程度的。

虽然它们有着相似的作用,但是它们之间又存在着一定的联系和区别。

首先,我们来了解一下方差。

方差是指各个数据与所有数据算术平均数的离差平方的平均数,用来度量数据的离散程度。

方差越大,数据的波动越大,反之则波动越小。

方差的计算公式为,。

其中,n表示样本容量,xi表示第i个数据点,x̄表示所有数据的算术平均数。

接下来,我们来了解一下标准差。

标准差是方差的平方根,用来度量数据的波动程度。

标准差越大,数据的离散程度越大,反之则离散程度越小。

标准差的计算公式为:标准差= √方差。

通过以上的介绍,我们可以看出,标准差和方差之间存在着密切的联系。

方差是标准差的平方,而标准差是方差的平方根。

它们都是用来度量数据的离散程度和波动程度的,只是在具体的数值上有所不同。

在实际的统计分析中,我们常常会用到标准差和方差来描述数据的分布和离散程度。

比如在财务分析中,我们可以用标准差和方差来衡量股票价格的波动程度;在生产管理中,我们可以用标准差和方差来衡量产品质量的稳定程度;在市场营销中,我们可以用标准差和方差来衡量销售额的波动程度。

总的来说,标准差和方差都是非常重要的统计指标,它们可以帮助我们更好地理解和分析数据的特征,从而做出更准确的决策。

在实际应用中,我们要根据具体的情况选择合适的指标来描述数据的波动程度,以便更好地进行数据分析和决策制定。

综上所述,标准差与方差是统计学中常用的两个概念,它们都是用来衡量数据的离散程度和波动程度的。

它们之间存在着密切的联系,方差是标准差的平方,而标准差是方差的平方根。

在实际应用中,我们可以根据具体的情况选择合适的指标来描述数据的波动程度,以便更好地进行数据分析和决策制定。

方差和标准差公式

方差和标准差公式

方差和标准差公式方差和标准差是统计学中常用的概念,用来衡量数据的离散程度和波动程度。

在实际应用中,方差和标准差经常被用来评估数据的稳定性和可靠性,因此对于研究人员和决策者来说,了解方差和标准差的计算公式及其意义是非常重要的。

本文将详细介绍方差和标准差的计算公式及其应用。

方差的计算公式。

方差是衡量数据离散程度的一种统计指标,它的计算公式如下:\[Var(X) = \frac{1}{n}\sum_{i=1}^{n}(X_i \bar{X})^2\]其中,\(X\) 是随机变量,\(X_i\) 是随机变量的第 \(i\) 个取值,\(\bar{X}\) 是随机变量的均值,\(n\) 是样本容量。

方差的计算公式可以简单理解为每个数据与均值的差的平方的平均值。

方差越大,表明数据的离散程度越大,反之亦然。

标准差的计算公式。

标准差是方差的平方根,它的计算公式如下:\[SD(X) = \sqrt{Var(X)} = \sqrt{\frac{1}{n}\sum_{i=1}^{n}(X_i \bar{X})^2}\] 标准差是衡量数据波动程度的一种指标,它是方差的平方根,用来度量数据的离散程度。

标准差越大,表明数据的波动程度越大,反之亦然。

方差和标准差的应用。

方差和标准差在实际应用中有着广泛的应用,主要体现在以下几个方面:1. 金融领域。

在金融领域,方差和标准差常常被用来衡量资产的风险和波动性。

投资者可以通过计算资产的方差和标准差来评估其风险水平,从而做出相应的投资决策。

2. 质量管理。

在质量管理中,方差和标准差被用来评估生产过程的稳定性和一致性。

通过监控产品的方差和标准差,企业可以及时发现生产过程中的异常波动,从而采取相应的控制措施,保证产品质量稳定。

3. 统计学分析。

在统计学分析中,方差和标准差被用来比较不同样本之间的离散程度和波动程度。

研究人员可以通过计算样本的方差和标准差来评估样本数据的稳定性和可靠性,从而得出科学的结论。

数理统计公式

数理统计公式

数理统计公式数理统计公式是数理统计学中的重要内容,通过公式的运用可以对数据进行分析和推断。

本文将介绍几个常用的数理统计公式,包括概率密度函数、期望值、方差和标准差等。

一、概率密度函数(Probability Density Function,简称PDF)是描述连续随机变量的概率分布的函数。

对于一个连续随机变量X,其概率密度函数f(x)满足以下两个条件:1) f(x)≥0,对于所有的x∈R;2) ∫f(x)dx=1,即概率密度函数在整个实数轴上的积分等于1。

概率密度函数可以用来求解连续随机变量的概率。

二、期望值(Expectation)是用来描述随机变量平均取值的一个数学概念。

对于离散随机变量X,其期望值E(X)定义为E(X)=∑xP(X=x),即随机变量X取值的加权平均值,其中P(X=x)表示随机变量X取值为x的概率。

对于连续随机变量X,其期望值E(X)定义为E(X)=∫xf(x)dx,其中f(x)为X的概率密度函数。

三、方差(Variance)是用来描述随机变量离散程度的一个数学概念。

对于随机变量X,其方差Var(X)定义为Var(X)=E[(X-E(X))^2],即随机变量X与其期望值之差的平方的期望值。

方差可以衡量数据的离散程度,方差越大表示数据越分散,方差越小表示数据越集中。

四、标准差(Standard Deviation)是方差的平方根,用来度量随机变量的离散程度。

对于随机变量X,其标准差σ定义为σ=sqrt(Var(X))。

标准差是方差的一种常见的度量方式,它具有与原始数据相同的单位,可以直观地表示数据的离散程度。

除了以上介绍的几个常用的数理统计公式外,数理统计学还有许多其他重要的公式,如协方差、相关系数、似然函数等。

这些公式在实际数据分析和统计推断中起到了重要的作用,帮助我们理解和解释数据背后的规律和特征。

数理统计公式是数理统计学的重要工具,它们可以帮助我们对数据进行分析和推断。

概率密度函数、期望值、方差和标准差是数理统计中常用的公式,通过它们的运用,我们可以更好地理解和解释数据的特征和规律。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

心理和教育方面的实验或调查所得到的数据,大都具有随机变量的性质。而对这些随机变量的描述,仅有前一章所讲集中趋势的度量是不够的。集中量数只描述数据的集中趋势和典型情况,它还不能说明一组数据的全貌。数据除典型情况之外,还有变异性的特点。对于数据变异性即离中趋势进行度量的一组统计量,称作差异量数,这些差异量数有标准差或方差,全距,平均差,四分差及各种百分差等等。

第一节 方差与标准差

方差(Variance)也称变异数、均方。作为统计量,常用符号S2表示,作为总体参数,常用符号σ2表示。它是每个数据与该组数据平均数之差乘方后的均值,即离均差平方后的平均数。方差,在数理统计中又常称之为二阶中心矩或二级动差。它是度量数据分散程度的一个很重要的统计特征数。标准差(Standard deviation)即方差的平方根,常用S或SD表示。若用σ表示,则是指总体的标准差,本章只讨论对一组数据的描述,尚未涉及总体问题,故本章方差的符号用S2,标准差的符号用S。符号不同,其含义不完全一样,这一点望读者能够给予充分的注意。

一、方差与标准差的计算 (一)未分组的数据求方差与标准差 基本公式是:

(3—l a)

(3—1b) 表3—1说明公式3—1a与3—1b的计算步骤 表3—1 未分组的数据求方差与标准差 Xi Xi—X=x x2=(Xi—X)2 Xi2 6 5 7 4 6 8 0 -1 l -2 0 2 0 l 1 4 0 4 36

25 49 16 36 64 N=6

∑Xi=36 ∑x=0 ∑x2=10 ∑Xi2=226

应用3—1公式的具体步骤:①先求平均数X=36/6=6;②计算Xi -X;③求(Xi - X)2即离均差x2;④将各离均差的平方求和 (∑x2);⑤代入公式3—1a与3—1b求方差与标准差。具体结果如下:

S2=10/6=1.67

(二)已分组的数据求标准差与方差 数据分组后,便以次数分布表的形式出现,这时原始数据不见了,若计算方差与标准差可用下式:

(3—3a)

(3—3b) 式中d=(Xc - AM) / i,AM为估计平均数 Xc为各分组区间的组中值 f为各组区间的次数 N=Σf 为总次数或各组次数和 i为组距。 下面以表1—8数据为例,说明分组数据求方差与标准差的步骤: 表3—2 次数分布表求方差与标准差 分组 区间 Xc f d fd fd2 计 算

96- 93- 90- 87- 84- 81- 78- 75- 72- 69- 66- 97 94 91 88 85 82 79 76 73 70 67 2 3 4 8 11 17 19 14 10 7 3 6 5 4 3 2 1 0 —1 —2 —3 —4 12 15 16 24 22 17 0 —14 —20 —21 —12 72 75 64 72 44 17 0 14 40 63 48

S2=32* (570/100 -(28/100)2)=50.5944

S=7.113

63- 60- 64 61 l 1 —5 —6 —5 —6 25 36 i=3 Σf=100 Σfd=28 Σfd2=570

具体步骤: ①设估计平均数AM,任选一区间的Xc充任; ②求d ⑧用f乘d,并计算Σfd; ④用d与fd相乘得fd2,并求Σfd2; ⑤代入公式计算。 二、方差与标准差的意义 方差与标准差是表示一组数据离散程度的最好的指标。其值越大,说明离散程度大,其值小说明数据比较集中,它是统计描述与统计分析中最常应用的差异量数。它基本具备一个良好的差异量数应具备的条件:①反应灵敏,每个数据取值的变化,方差或标准差都随之变化;②有一定的计算公式严密确定;③容易计算;④适合代数运算;⑤受抽样变动的影响小,即不同样本的标准差或方差比较稳定;⑥简单明了,这一点与其他差异量数比较稍有不足,但其意义还是较明白的。

除上述之外,方差还具有可加性特点,它是对一组数据中造成各种变异的总和的测量,能利用其可加性分解并确定出属于不同来源的变异性(如组间、组内等)并可进一步说明每种变异对总结果的影响,是以后统计推论部分常用的统计特征数。在描述统计部分,只需要标准差就足以表明一组数据的离中趋势了。标准差比其他各种差异量数具有数学上的优越性,特别是当已知一组数据的平均数与标准差后,便可知占一定百分比的数据落在平均数上下各两个标准差,或三个标准差之内。对于任何一个数据集合,至少有1一1/h2的数据落在平均数的h(大于1的实数)个标准差之内。(切比雪夫定理)。例如某组数据的平均数为50,标准差是5,则至少有75%(1一1/22)的数据落在50-2*5至50+2*5即40至60之间,至少有88.9%(1一1/32)的数据落在50-3*5至50+3*5=35—65之间 (h=2,1-1/h2=1-1/22=3/4=75%,h=3, -1/h2=1-1/32=8/9=88.9%)。

如果数据是呈正态分布,则数据将以更大的百分数落在平均数上下两个标准差之内(95%)或三个标准差之内 (99.%)。 三、由各小组的标准差求总标准差 由于方差具有可加性特点,在已知几个小组的方差或标准差的情况下,可以计算出几个小组联合在一起的总的方差或标准差。这种计算常在科研协作中应用,例如先了解各班学生情况,再了解全年级情况;或先了解各年级情况,再了解全校总的情况。但这种方差或标准差的合成,只有在应用同一种观测手段,测量的是同一个特质,只是样本不同时,才能应用。

计算总方差或总标准差的公式如下;

(3—4a)

(3—4b) 式中 为总方差 为总标准差 N1…Nn为各小组数据个数

为总平均数 为各小组的平均数 四、标准差的应用 (一)差异系数(Coefficient of variation) 当所观测的样本水平比较接近,而且是对同一个特质使用同一种测量工具进行测量时,要比较不同样本之间离散程度的大小,一般可直接比较标准差或方差的大小-标准差的值大说明该组数据较分散,若标准差小,则说明该组数据较集中。标准差的单位与原数据的单位相同,因而有时称它为绝对差异量。在对不同样本的观测结果的离散程度进行比较时,常会遇到下述情况:①两个或多个样本所测的特质不同,即所使用的观测工具不同,如何比较其离散程度?②即使使用的是同+种观测工具,但样本的水平相差较大时,如何比较它们的离散程度?在第一种情况下,标准差的单位不同,显然不能直接比较标准差的大小。第二种情况虽然标准差的单位相同,但两样本的水平不同,这可从平均数的大小明显不同确定。通常情况下,平均数的值较大,其标准差的值一般也较大,平均数的值较小,其标准差的值也较小。这种情况下,若直接比较标准差取值的大小,借以比较不同样本的分散情况是无意义的。可见,上述两种情况下,若用绝对差异量进行直接比较以确定其分散程度的大小是不行的,这时可用相对差异量进行比较。最常用的相对差异量就是差异系数。差异系数,.又称变异系数、相对标准差等,通常用符号CV表示,其计算如下,

CV=S / M * 100% (3—5) 式中S为某样本的标准差 M为该样本的平均数。 差异系数在心理与教育研究中常用于:①同一团体不同观测值离散程度的比较,②对于水平相差较大,但进行的是同一种观测的各种团体,进行观测值离散程度的比较。

例2 已知某小学一年级学生的平均体重为25公斤,体重的标准差是3.7公斤,平均身高110厘米,标准差为6.2厘米,问体重与身高的离散程度哪个大?

解: CV体重=3.7 / 25 * 100%=14.8% CV身高=6.2 / 110 * 100%=5.64% 通过比较差异系数可知,体重的分散程度比身高的分散程度大(14.8%>5.64%)。 例3 通过同一个测验,一年级(7岁)学生的平均分数为60分,标准差为4.02分,五年级(14岁)学生的平均分数为 80分,标准差为6.04分,问这两个年级的测验分数中哪一个分散程度大?

解: CV一年级=4.02 / 60 * 100%= 6.7% CV五年级=6.04 /80 * 100%= 7.55% 答;五年级的测验分数分散程度大。 在应用差异系数比较相对差异大小时,一般应注意测量的数据要保证具有等距的尺度,这时计算的平均数和标准差才有意义,应用差异系数进行比较也才有意义。另外,观测工具应具备绝对零,这时应用差异系数去比较分散程度效果才更好。因此,差异系数常用于重量、长度、时间,编制得好的测验量表范围内。第三,差异系数只能用于一般的相对差异量的描述上,至今尚无有效的假设检验方法,因此对差异系数不能进行统计推论。

(二)标准分数(standard score) 标准分数又称基分数或z分数,是以标准差为单位表示一个分数在团体中所处位置的相对位置量数。 1.计算公式;

Z = (X— )/ S (3—6) 式中X代表原始数据,X为一组数据的平均数,S为标准差。从公式3—6可以明了,Z分数的意义,它是一个数与平均数之差除以标准差所得的商数,它无实际单位。如果了个数小于平均数,其值为负数,如果一个数的值大于平均数,其值为正数,如果一个数的值等于平均数,其值为零。可见Z分数可以表明原数目在该组数据分布中的位置,故称为相对位置量数。

例4 某班平均成绩为90分,标准差为3分,甲生得94.2分,乙生得89.1分,求甲乙'学生的Z分数各是多少? 解:根据公式3—6 Z甲=(94.2—90) / 3 = 1.4 Z乙=(89.1—90) / 3 = -0.3 Z分数表示其原分数在以平均数为中心时的相对位置,这比使用平均数和原分数表达了更多的信息。 2.Z分数的性质 ①在一组数据中所有由原分数转换得出的z分数之和为零,其Z分数的平均数亦为零。 ②一组数据中各z分数的标准差为1。

相关文档
最新文档