统计学 第3章 数据分布特征描述

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
加权
MH
1 N Ni 1 1 1 wi wi i 1 xi i 1 xi
i 1

N
wi

N
wi
简单
MH
1
i 1

N
1 xi

N
i 1

N
1 xi
N
k0:几何平均数
加权
MG
简单
w
i 1
N
i
w1 x1
w2 x2

wN xN
MG
N
2.比较同一现象在不同空间或不同阶段的发 展水平,反映现象变化特征、趋势和规律性。 能消除总体规模差异造成的不利影响; 在一定程度上减弱偶然因素的影响。
3.分析现象之间的依存关系。
如研究劳动者文化程度与收入的关系。
4.(数值)平均指标是推断统计中的重要 统计量,是进行统计推断的基础。
几种常见的位置特征数
数据分布特征与测度:概览
集中趋势 (位置) 离中趋势 (分散程度) 偏态和峰态 (形状)
数据分布特征测度
集中趋势
幂平均数 中位数 众 数
离散程度
极差 平均差 方差、标准差 异众比率 变异系数
分布形状
偏 度
峰 度
第一节 统计变量集中趋势测定
一 集中趋势指标及作用 二 数值平均数 三 众数与中位数(位置平均数)
本章学习任务
以数值特征,对统计数据分布进行量化描述。
主要包括三方面:
集中趋势
用平均指标描述(位置特征); 离中趋势 用变异指标描述(离散特征); 偏斜程度 用偏度和峰度描述(偏斜特征、峰度特征)。
学习要求:
理解测度统计数据集中趋势、离散程度的概念 、指标、相互关系; 掌握主要分析指标的计算方法和应用场合,并能 熟练进行相关计算分析。
数据分布的位置特征数实际上也是数据的代表值,
代表了数据的一般水平。 在不同场合,可以适当选用平均数、中位数、众数充 当位置特征数(代表值) 其中平均数不同于中位数、众数的特点在于: 平均数是由所研究的全体数据参加计算所得。
平均数的一般形式叫做幂平均数。常见的有算
术平均数、几何平均数、调和平均数。
权数实质 权数的实质在于其结构,即结构比例形式(比重 权数)。 其更能清晰表明权数之权衡轻重的作用。
k 权数形式有2种: xi wi N w k i M p k i 1 x 绝对数形式 k i N N i 1 wi w 结构比例形式 i N
一、集中趋势指标及作用
集中趋势(Central tendency)
集中趋势 即一组数据向其中心值聚集或靠 拢的倾向和程度。 用平均指标表示,代表数据的一 般水平。 测定集中趋势是认识数据分布特征的 基本内容。
集中趋势指标有两类:
数值平均数 根据全部数据计算得到的代表值。 优点:数学性质良好,可用于统计推断 缺点:易受极端值影响。 主要有算术平均数、调和平均数及几 何平均数,三者均为幂平均数特例。
1.简单算术平均数 对未分组数据,采用简单算术平均数公式。即 把各项数据直接加总,然后除以总项数。 计算公式:
x
i 1
xi
N
N
举例
表 3-1 男性 22 22 25 25 25 女性 22 22 25 25 25
解:采用简单算术平均法计算,即全体队员的
平均年龄为(单位:周岁)
22 22 25 25 25 25 25 30 30 50 22 ... 30 20 538 分组数据不能简单平 26.9 20 均 !因为各组变量值 表 3-2 的次数(权数)不等! 年龄 人数(人) 若采用简单平均:

i 1
i 1

MH xi wi w N 1 x i N xi N i i 1 wi wi i 1 i 1
N
1 N 1 wi i 1 xi
i 1

N
wi
1 N 1 w N i i 1 xi w i i 1
二、数值平均数
(一)幂平均数
幂,power 变量X取N个值: x1 , x2 , , xN。 权数为一组正数: w1 , w2 , , wN 。 加权幂平均数一般形式为: 其中,k 为任意实数。
Mp k
i 1 N
xi
i 1
N
k
wi

Βιβλιοθήκη Baiduwi
权数w均相等时,加权平均数退化为简单 平均数:
wi
MG
wi
i 1
N
wN w2 x1w1 x2 xN xi i1 i 1
N
wi
N
(二)算术平均数 算术平均数(Arithmetic mean ),也称均 值(mean)。 由一组数据的总和(总体标志总量)除以 该组数据的项数(总体单位总量)得到; 算术平均数=总体标志总量/总体单位总量 是最常用的数值平均数; 根据掌握资料不同,其有多种计算公式。
x1 x2 xN
关于加权问题 权数确定方式: 客观权数: 权数由实际统计资料获得或推算。 主观权数: 根据研究问题,由研究者主观赋值。 权数作用: 权衡变量的各种取值在计算平均数时的重 要性。 权数作用,根本上是通过权数结构实现。
权数作用: 即使不改变被平均的数值,仅改变权数结构,即 可改变平均数水平。 例如,改变教师职称结构,而不改变各种职 称教师课时费标准,会改变平均课时费水平。
Mp
k xi k i 1
N
N
特例情况
算术平均数(幂指数 k=1)
幂平均数
调和平均数(幂指数 k=-1) 几何平均数(幂指数 k0) 其他幂平均数
k=1:算术平均数
加权
1 x i N
简单
xi wi
i 1
N

wi
x
i 1
xi
N
N
k=-1:调和平均数
位置平均数 根据对总体中处于特定位置的单个或部 分单位标志值直接观察或推算确定的代表值。 优点:不易受极端值影响,具有较好稳健性。 缺点:不宜用作统计推断。 主要包括众数和中位数。
一、集中趋势指标及作用
集中趋势指标作用
1.反映变量分布的集中趋势和一般水平。 如用平均工资了解职工工资分布的中心, 反映职工工资的一般水平。
相关文档
最新文档