第三章 统计资料的数量分布特征分析讲解

合集下载

第三章 统计数据分布的特征

第三章 统计数据分布的特征
20550
12.42 6.60
82.2
调和平均数
各变量值的倒数的平均数。又称倒数平均 数。 n x 1 简单调和平均数
x
例题:书77页例3-2 加权调和平均数 x m m为权数 例题:见书78页例
m x
几何平均数
用于计算比率或速度的平均。 在计算社会经济现象时应用较多。 公式: N
i i 1
n
2
样本方差用(n-1)去除,从数学角度看是
因为它是总体方差σ2的无偏估计量。
n 1
k
分组数据
2

i 1
K
( X i X )2 fi
s2

i 1
( xi x ) 2 f i
k
f
i 1
K
i
f
i 1
i
1
标准差(例子)
某工会随机调查了5名工人上月的加班时间 如下表,平均加班时间为13小时。计算数 据的标准差。
1、集中趋势分析 2、离中趋势分析 3、分布偏态与峰度的测度
数据描述的数值方法
数据描述的数值方法
集中趋势
均 值
离散程度
极差 四分位距
分布的形状
偏 态 峰 度
中位数 众 数
方差和标准差 离散系数
2.2 分布集中趋势的测度
众数 中位数 分位数 均值 几何平均数 切尾均值
集中趋势
集中趋势:一组数据向其中 心值靠拢的倾向和程度。 集中趋势测度:寻找数据水 平的代表值或中心值。
特点:
反映了相对于均值的相对离散程度; 可用于比较计量单位不同的数据的离散程度; 计量单位相同时,如果两组数据的均值相差悬殊, 离散系数可能比标准差等绝对指标更有意义。

《统计学》第三章 统计分布的数值特征解读

《统计学》第三章   统计分布的数值特征解读


1 k
称为k阶幂平均数,当k 取不同的整数值时, 幂平均数就给出不同的数值平均数计算公式。
例如: 当k=1时,幂平均数为算术平均数计 1 算公式。 x1 1 x
xk x1 n n
当 k=-1 时,幂平均数为调和平均数 1 计算公式。 1 1
1)反映总体各单位变量分布的集中趋势 和一般水平。 2)比较同类现象在不同单位的发展水平 3)比较同类现象在不同时期的发展变化 趋势或规律。 4)分析现象之间的依存关系。
3.分类: 按其具体代表的含义和计算方式的不 同,分为数值平均数和位置平均数。 1)数值平均数: A)定义 B)特点 C)种类 按计算方法不同,分为:算术平均数、 调和平均数、几何平均数和幂平均数。
2)位置平均数: A)定义:用处于数列中特殊位置 上的个别单位或部分单位的标志值 来确定的代表值。 B)特点:对数据的概括能力不如 数值平均数的强,但是不易受数列 中极端值的影响。 C)种类:常用的位置平均数有众 数和中位数两种。
二、数值平均数
( 一 ) 算 术 平 均 数 arithmetic mean
x
x
i 1 N i 1
N
i
fi
i
f
1 p 0 q p pq
p为总体中具有某种属性的单位成数,N为 总体单位数。成数是是非标志的平均数。
4. 算术平均数的数学性质 1 )算术平均数与标志值个数的乘积等 于各标志值的总和。 2 )各个标志值与其算术平均数的离差 之和等于零。 3 )各标志值与算术平均数离差的平方 和为最小值。 4)对被平均的变量实施某种线性变换后, 新变量的算术平均数等于对原变量的算 术平均数实施同样的线性变换的结果。

第3章统计学数据分布特征的描述

第3章统计学数据分布特征的描述

第3章统计学数据分布特征的描述统计学是一门研究收集、分析和解释数据的学科。

在统计学中,数据分布特征的描述是指通过一系列统计量和图表来描述数据的集中趋势、离散程度和分布形态等特征。

数据的集中趋势描述了数据的平均水平或中心。

常用的统计量有平均值、中位数和众数。

平均值是将所有观测值相加然后除以观测值的总数,它能够反映数据的总体平均水平。

然而,当数据包含异常值时,平均值的计算结果可能会受到影响。

因此,中位数和众数在这种情况下被认为是更稳健的集中趋势度量。

中位数是将数据按大小排序,然后找出中间位置的观测值。

众数是数据中出现次数最多的观测值。

数据的离散程度描述了数据的变异程度或分散程度。

常用的统计量有方差、标准差和四分位差。

方差是观测值与均值之间差异的平方的平均值,它反映了数据的总体离散程度。

标准差是方差的平方根,用于衡量数据的波动性。

四分位差是数据的上四分位数和下四分位数之差,它描述了数据的中间50%的变异程度。

数据的分布形态描述了数据的形状和对称性。

常用的分布形态有正态分布、偏态分布和峰态分布。

正态分布是最常见的分布形态,其特点是对称、钟形曲线。

偏态分布是指数据分布不对称的情况,主要分为正偏态和负偏态。

正偏态分布意味着数据的尾部偏向右侧,负偏态分布则意味着数据的尾部偏向左侧。

峰态分布用于描述数据的峰值的尖锐程度,主要分为正态分布、高峰态和低峰态。

除了统计量,还可以使用图表来对数据分布特征进行描述。

常用的图表包括直方图、箱线图和散点图。

直方图是通过将数据分组并在坐标轴上绘制各组的频率或相对频率来展示数据的分布形态。

箱线图通过绘制数据的分位数和异常值来展示数据的中位数、四分位数和离群观测值。

散点图用于展示两个变量之间的关系,特别适用于发现变量之间的相关性和异常值。

综上所述,统计学中的数据分布特征描述是通过一系列统计量和图表来描述数据的集中趋势、离散程度和分布形态等特征。

这些描述能够帮助我们更好地理解数据,并对数据进行分析和解释。

统计学第3章数据分布特征描述

统计学第3章数据分布特征描述

xi fi i1
xf
f1 f2 ... fn
n
fi
f
x x f
i 1
f
举例
表3-3 节能灯泡使用寿命数据
使用寿命 组中 数量 (小时) 值x f
xf
频率 f /Σf
xf/Σf
1000以下 900 2 1800 0.020 18
1000-1200 1100 8 8800 0.080 88
n(xi x) 0
i1
(3)各变量值与算术平均数的离差平方之总和最小。 (从全 部数据看,算术平均数最接近所有变量值)
n(xi x)2 min
i1
性质(3)证明:
(三)调和平均数(Harmonic mean)
➢ 调和平均数,也称倒数平均数。 ➢ 各变量值倒数(1/xi)的算术平均数的倒数。 ➢ 计算公式为:
➢由一组数据的总和(总体标志总量)除以 该组数据的项数(总体单位总量)得到; 算术平均数=总体标志总量/总体单位总量
➢是最常用的数值平均数;
➢根据掌握资料不同,其有多种计算公式。
1.简单算术平均数 ➢对未分组数据,采用简单算术平均数公式。即 把各项数据直接加总,然后除以总项数。 ➢计算公式:
N
xi x i1
例如,改变教师职称结构,而不改变各种职 称教师课时费标准,会改变平均课时费水平。
权数实质
➢权数的实质在于其结构,即结构比例形式(比重 权数)。
➢其更能清晰表明权数之权衡轻重的作用。
权数形式有2种:
➢ 绝对数形式
Mp
➢ 结构比例形式
k
N
xik wi
i 1
N
wi
i 1
k
N
i 1

第3章分布数量特征的统计描述

第3章分布数量特征的统计描述
解:计算简单算术平均数 x=(28+31+32…+302)/60 =112.45(百万元)
山东财经大学东方学院
的资料!
统计学(第四版)
计算加权算术平均数: 依据表2-3的分组资料,用各组频数做权数计算: X=(25×7+75×25+125×12+175×7+225×4+275 ×3+325×2)/(7+25+12+7+4+3+2 )=7150/60 =119.17(百万元) 或者 =(25×11.67%+75×41.67%+125×20%+175×1 1.67%+225×6.67%+275×5%+325×3.33%) /100% =119.17(百万元)
当总体单位数n为奇数时:中位数位置=(N+1)/2
,则处于中间位置的标志值就是中位数。
当总体单位数N为偶数时,中位数是处于中间位置
的两个单位标志值的算术平均数。
2.由单项式分组资料确定中位数:
单项式分组已经将资料的标志值序列化,这时总体 单位数N=Σf,确定中位数位置的方法要通过累计 次数计算。
山东财经大学东方学院
i
fi
山东财经大学东方学院
统计学(第四版)
(2) 各个标志值与算术平均数离差之和等于零。 简单算术平均数: xi
i 1
N
n
x 0
加权算术平均数:
i 1
f ( x xi ) 0
(3) 各标志值与算术平均数离差的平方和为最小
值。
设 x0 为任意值,
山东财经大学东方学院
统计学(第四版)

第3章 分布数量特征的统计描述

第3章 分布数量特征的统计描述
x
21 22 23 24 25 合计
420 660 1380 1200 750 4610
20 30 60 50 30 200
f
xf
26
例2:求平均利润率

某公司下属三个部门销售情况,求三个部门的平均利润率 部 A B C 门 销售利润率(%) x 12 10 7 销售额(万元) f 1000 2000 1500


n
xi
i 1
加权算术平均数
i 1
fi x xi fi
i 1
19
n
n

性质2:各单位标志值与算术平均数的离差之和等
于0
x x x x
x1
x x
x
x x
xn
(x x) x x N x N x 0
( x x ) f xf x f x f x f 0
17

例:某市有126万人口,其中男性人口64.26 万,女性人口61.74万,求该城市人口的男性 平均成数。
解:
x p
64 . 26 126
51 %
该城市人口的男性成数为51%
(三)算术平均数的数学性质

性质1:算术平均数与标志值个数的乘积等于 各标志值的总和

简单算术平均数
Nx
2 .1 1 2 5(万 吨 )
按产棉量分 县数 组中值 组(万吨) f 1 以下 5 0.5 1~2 42 1.5 2~3 16 2.5 13 3.5 3~4 4 4.5 4 以上 合计 — 80
x
xf
2.5 63 40 45.5 18 169
注意:这里假定各组标志值在组内分布是均匀的。但

第三章 数据分布特征的描述《统计学》

第三章 数据分布特征的描述《统计学》

【 例 3 -2 】
• 某厂 某厂2006年计划完成工业增加值为 年计划完成工业增加值为200万元, 万元, 年计划完成工业增加值为 万元 实际完成220万元,则:计划完成相对数 万元, 实际完成 万元 =220/200×100%=110%。超额完成 × 。超额完成10%。 。
• 短期计划完成情况检查(年度内计划): 短期计划完成情况检查(年度内计划): • 一是计划数和实际数是同期的,说明计划执行 一是计划数和实际数是同期的, 结果; 结果; • 二是计划期中某一段实际累计数与全期计划数 的对比,说明计划执行进度。公式: 的对比,说明计划执行进度。公式:累计至本 期止实际完成数/全期计划数 全期计划数× 期止实际完成数 全期计划数×100%。 。
• 时期指标与时点指标相比较有以下的特点: 时期指标与时点指标相比较有以下的特点: • (1)时期指标的数值可以连续登记和计算,它的每一 )时期指标的数值可以连续登记和计算, 个数值均说明了社会经济现象在一段时期内的发展总 有实际意义;而时点指标数值只能间断登记 只能间断登记, 量,有实际意义;而时点指标数值只能间断登记,每 个指标数值只能反映社会经济现象在某一瞬间状态下 的水平,连续计算多个时点指标数值一般无意义。 的水平,连续计算多个时点指标数值一般无意义。 可以直接相加, • (2)时期指标的各期数值可以直接相加,相加后说明 )时期指标的各期数值可以直接相加 更长时期内社会经济发展的总量, 更长时期内社会经济发展的总量,如将一年内各季度 的工业总产值相加,就得到一年内总的工业总产值; 的工业总产值相加,就得到一年内总的工业总产值; 时点指标数值相加一般无实际意义 相加一般无实际意义。 时点指标数值相加一般无实际意义。 • (3)一般来说,同一总体时期指标数值与时间长短有 )一般来说,同一总体时期指标数值与时间长短有 直接关系,如一年的总产值必然大于一月的总产值, 直接关系,如一年的总产值必然大于一月的总产值, 时间越长指标数值越大;时点指标数值与时间长短一 时间越长指标数值越大;时点指标数值与时间长短一 般没有直接关系,一定时期内相对稳定。 般没有直接关系,一定时期内相对稳定。

第三章统计数据分布特征的描述

第三章统计数据分布特征的描述

第三章统计数据分布特征的描述统计数据分布特征的描述是统计学中非常重要的一个概念,它用于对数据进行系统化的描述和分析。

统计数据分布特征的描述包括位置参数、散布参数和形状参数。

位置参数描述了数据集中心位置的特征。

最常用的位置参数是均值和中位数。

均值是指所有数据值的总和除以数据个数,它能够反映数据集的平均水平。

中位数是将数据值按大小排序后的中间值,它能够反映数据集的中心位置。

均值对异常值比较敏感,中位数能够较好地排除异常值的干扰。

散布参数描述了数据集的离散程度。

最常用的散布参数是方差和标准差。

方差是指每个数据值与均值之差的平方和的平均值,它能够反映数据集的离散程度。

标准差是方差的平方根,它与数据的单位相一致,常用于衡量数据的波动性。

方差和标准差越大,表示数据的离散程度越大。

形状参数描述了数据集的分布形状。

常用的形状参数包括偏度和峰度。

偏度是指数据分布的不对称程度,大于0表示右偏,小于0表示左偏,等于0表示对称。

偏度能够反映数据集的分布形态。

峰度是指数据分布的尖锐程度,大于0表示尖锐,小于0表示平坦,等于0表示与正态分布相似。

峰度能够反映数据集的尖峰或扁平程度。

除了这些常见的参数之外,还有其他一些描述统计数据分布特征的方法,如四分位数和箱线图。

四分位数是将数据分为四等分的值,它包括上四分位数、下四分位数和中位数。

上四分位数是四分之三分位数,下四分位数是四分之一分位数。

箱线图是以箱子和线段的形式展示数据分布特征,箱子的上边界和下边界分别代表上四分位数和下四分位数,箱子的中线代表中位数,箱子的长度代表数据的离散程度。

统计数据分布特征的描述对于研究数据的特征、提取有效信息以及进行统计推断都非常重要。

了解数据的位置、散布和形状特征能够帮助研究者更好地理解数据集的性质和规律。

在实际应用中,统计数据分布特征的描述还可以帮助决策者进行决策,例如对于质量控制的判断和产品的质量评估等。

综上所述,统计数据分布特征的描述是对数据集进行系统化描述和分析的重要工具。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档