3第三章 集中趋势和离散趋势

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4
n 1 不是整数,则用 插值法 计算四分位数。
4
相邻位次上的标志值的加 权算术平均数
返回本章
返回总目录
(2)由分组资料计算四分位数。
第 i 四分位数的计算公式为:
i
M i Li
f
4
Smi1
f mi
di
(i 1, 2, 3)
式中:
Li ——第 i 四分位数所在组的下限; fmi ——第 i 四分位数所在组的次数;
i ——众数组的组距
返回本章
返回总目录
计算众数的上限公式为:
M0

U

d1
d1 d2
i
式中: U ——众数组的上限
众数的计算只适用于单位数较多,且存在明显的集中趋势的 情况,否则,计算众数时没有意义的。
返回本章
返回总目录
离散趋势的测度
离散趋势的测度,在统计学中也称为指标变异指标,是用来描述数 列中指标值的离散趋势与离散程度的。常用的标志变异指标有极差、 平均差和标准差等。
过给定的范围,就说明有不正常情况产伤。但极差受到极端是的影响,测
定结果往往不能反映数据的实际离散程度。
返回本章
返回总目录
2. 四分位差
四分位差是根据四分位数计算的。首先把变量各单位标志值从 小到大排序,再将数列四等分,处于四分位点位次的标志值就 是四分位数,记作 M1,M2,M3 ,M1 为第一四分位数(也称为下 四分位数),M2 为第二四分位数,就是中位数 Me ,M3 为第三 四分位数。 四分位差的计算公式为: 四分位差 M3 M1
数主要有平均差离散系数 VA.D. 和标准差离散系数 V
其公式分别为:
V
A.D.
A.D. 100% X

V X 100%
返回本章
返回总目录
6. 偏度和峰度
(1)偏度
偏度是用来反映变量数列分布偏斜程度的
指标。
对称分布
右偏分布
变量数列的
(或称正偏分布)
单峰钟形分布
非对称分布
(或称偏态分布) 左偏分布
1. 极差
极差是指一个数列中两个极端值即最大值与最小值之间的差异。 根据极差的大小能说明标志值变动范围的大小。其计算公式为:
极差=最大标志值-最小标志值
根据组距数列求极差的计算公式为:
极差=最高组上限-最低组下限
在实际工作中,极差可以用于检查产品质量的稳定性和进行质量控制。
在正常生产的条件下,产品质量稳定,极差在一定范围内波动,若极差超
返回本章
返回总目录
1. 算术平均数
算术平均数是平均指标中最重要的一种,一般不特别说明时, 所称的“平均数”就是指算术平均数,其定义的公式为:
算术平均数=总体标志总量/总体单位总量 计算算术平均数时,标志总量和单位总量必须属于同一总体, 分子分母所包含的口径必须一致。否则,计算出来的平均数 指标便失去了科学性。算术平均数,可以分为简单算术平均 数和加权算术平均数两种。
返回本章
返回总目录
5. 众数
众数是一种位置平均数。众数是总体单位中,标志值出现次 数最多的那个数值。 为了确定众数的具体数值,可以利用 下限公式或上限公式加以计算。
计算众数的下限公式为:
Leabharlann Baidu
M0
L d1 i d1 d2
式中: M0 ——众数
L ——众数组的下限
d1 ——众数组次数与上一组次数之差 d2 ——众数组次数与下一组次数之差
n
n 1
用于估计总体标准差 。
在小样本的情况下,
S X X 2 较 S X X 2 为总体标准差 的更优
n 1
n
良的估计量 。
返回本章
返回总目录
5. 离散系数
上述的各种标志变异度指标,都是对总体中各单位指标 值变异测定的绝对量指标。而离散系数是测定总体中各 单位标志值变异的相对量指标,以消除不同总体之间在 计量单位、平均水平方面的不可比因素。常用的离散系
未分组资料时,中位数位次= N 1
2
当总体位数 N 为奇数时,中位数就是中位数位次上的那个数据; 当 N 为偶数时,中位数是中位数位次上2项数据的算术平均数。
返回本章
返回总目录
分组资料时,中位数位次 f 2
可以利用中位数所在组的下限来测算中位数,即中位数的下
限公式为 :
M c L
XX f A.D. f
返回本章
返回总目录
4. 方差和标准差
未分组资料时,方差的公式为:
2
2
X X
N
标准差的公式为:

X X 2
N
分组资料时,方差的公式为:
2
2
XX f
f
标准差的公式为:

X X 2 f
f
式中: X
X N
f ——总次数,即各组次数总和;
Smi1 ——小于第 i 四分位数所在组的各组次数之和;
di ——第i 四分位数所在组的组距。
返回本章
返回总目录
四分位差与极差相比较: 四分位差是对极差的一种改进。与极差相比,四分位差因不受 极值的影响,在反映数据的离散程度方面比极差准确,具有较 高的稳定性;同时,对于存在开口的组距数列,不能计算极差, 但可以计算四分位差。 四分位差和极差一样,不能充分利用数据的全部信息,也无法 反映标志值的一般变动。
2
四分位差的计算步骤为: 先寻找四分位数, 然后根据四分位差的计算公式计算。
返回本章
返回总目录
四分位数的计算 (1)由未分组资料计算四分位数。
首先确定四分位数的位次,再找出对应位次的标志值即为四分位数。
设样本容量为 n ,
M1的位次

n
1 4
M
的位次
3

3(n 1) 4
n 1 是整数,则位次对应的 标志值即为相应的四分位数。
——变量值 ——算术平均数 ——总体单位数
f ——各组次数 2 ——方差 ——标准差
返回本章
返回总目录
需要指出的是, X X 2 是总体标准差,而样本标 N
准差为 S X X 2 。 n 1
当样本较大时,由于
1 几乎等于
n 1
1 n
,因此常用公式
X X 2 代替公式 X X 2 来计算样本标准差S,并
•当 A= X ,即以 X 为中心,M 称为K 阶原点矩,用mK表示。
K=1,2,3时,有: 一阶中心矩 二阶中心矩 三阶中心矩
m1 ( X X )1 / n 0 m2 ( X X )2 / n
m3 ( X X )3 / n
返回本章
返回总目录
偏度系数 的计算公式:
N ——总体单位数
——总和
返回本章
返回总目录
(2)加权算术平均数
加权算术平均数的计算公式为:
n
X i fi
X
i 1 n
fi
i 1
式中: X(i 或X) fi (或f )
——标志值 ——标志值 Xi (或X ) 出现的次数或权数
n
——组数
n
Xi fi (或 Xf ) ——标志总量
返回本章
返回总目录
(1)简单算术平均数
将总体的各个单位标志值简单相加,然后除以单位个数,求出
的平均标志值,叫做简单算术平均数。简单算术平均数的计算
公式为:
n
X X1 X 2 X3 X n i1 Xi
N
N
式中:
X ——算术平均数
X i ——第i个单位的标志值,i=1,2,3,…,n
返回本章
返回总目录
3. 平均差
平均差是各单位标志值对平均数的离差绝对值的平均数。平均 差仅反映总体各单位标志值对其平均数的平均离差量。平均差 越大,表明标志变异程度越大;反之,则表明标志变异程度越 小。平均差通常用字母 A.D. 表示。
未分组资料时,其计算公式为:
X X
A.D.
N
分组资料时,其计算公式为:
返回本章
返回总目录
用偏度系数准确地测定分布的偏斜程度和进行比较分析。
※ Pearson偏度系数,用SK 表示。
SK X MO
SK 为无量纲的系数,通常取值在-3~+3之间。绝对值越大,
说明分布的倾斜程度越大。
SK =0 SK > 0 SK < 0
对称分布 右偏分布 左偏分布
返回本章
返回总目录
返回本章
返回总目录
4. 中位数
中位数是一种按其在数列中的特殊位置而决定的平均数。把总 体各单位标志值按大小顺序排列后,处在中点位次的标志值就 是中位数,它将全部标志值分成两个部分,一半标志值比它大, 一半标志值比它小,而且比它大的标志值个数和比它小的标志 值个数相等。
要求得中位数,首先要确定中位数的位次。
i1
返回本章
返回总目录
2. 调和平均数
调和平均数又称“倒数平均数”,它是根据各标志值的倒数 来计算的平均数,即各个标志值倒数的算术平均数的倒数。 调和平均数也分简单调和平均数和加权调和平均数。
简单调和平均数的计算公式为:
1

1 X1

1 X2

1 X3

1 Xn

XH
N
X H
1
(或称负偏分布)
返回本章
返回总目录
利用平均数、中位数、众数的位置关系大致判断分布是否 对称:
f
f
f
X
Mo Me X
X Me Mo
对称分布
X
X Me Mo
X Me Mo
左偏分布
X
Mo Me X
X Me Mo
右偏分布
偏态分布情况下平均数、中位数、众数有近似的关系:
M e M o 2( X M e )
返回总目录
第3章
集中趋势和离散趋势
返回总目录
集中趋势的测度
集中趋势是对频数分布资料的集中状况和平均水平的综 合测度。而离散趋势是对频数分布资料的差异程度和离 散程度的测度,用来衡量集中趋势所册书之的代表性, 或者反映变量值的稳定性和均匀性。
常用来表达数列集中趋势的测度有算术平均数、调和平均 数、几何平均数、中位数和众数。这些测度在统计学中也 称为平均指标或平均数,可以用来反映标志值的典型水平 和标志值分布的中心位置或集中趋势。
1
N 1

1

N 1
X1 X2 X3
Xn
X
设m为权数,则加权调和平均数的计算公式为:
1

m1 m2 m3 mn
X1 X2 X3
Xn

XH
m1 m2 m3 mn
n
X H
m1 m2 m3 mn m1 m2 m3 mn
f
2
Sm1 i
fm
式中: Mc
L
——中位数 ——中位数所在组的下限
fm ——中位数所在组的次数
f ——总次数即各组次数总和
Sm1 ——小于中位数组的各组次数之和
i
——中位数所在组的组距
返回本章
返回总目录
也可以利用中位数所在组的上限来测算中位数,即中位数的
上限公式为 :
Mc U
※ 动差法(或称矩法)计算偏度系数,用 表示。
定义变量X关于A的K阶矩(对未分组资料): M=∑(X-A)K/n
• 当 A=0,即以原点为中心,M 称为K 阶原点矩,用MK表示。 K=1,2,3时,有: 一阶原点矩M1=∑(X-0)1/n=∑X/n 二阶原点矩M2=∑(X-0)2/n=∑X2/n 三阶原点矩M3=∑(X-0)3/n=∑X3/n
m3 3
=0 >0 <0
对称分布; 右偏分布, 值越大,右偏程度越高; 左偏分布, 值越小,左偏程度越高。

mi
i1
n mi
X1 X 2 X 3
X n X i1 i
返回本章
返回总目录
3. 几何平均数
几何平均数是计算平均比率和平均速度最适用的一种方法。 几何平均数有简单几何平均数和加权几何平均数之分。 简单几何平均数是 N 个标志值连乘积的 n 次方根。
其计算公式为: X G n X1 X 2 X 3 X n N X
在用几何平均数法计算平均数时,如果 N 大于2, 可采用对数法计算。计算公式为:
ln
XG

1 N
ln
X1
ln
X2
ln
X3
ln
Xn


1 N
ln X
返回本章
返回总目录
需要指出的是,当把几何平均数应用于经济现象时,必须注 意经济现象本身的特点。只有当标志总量表现为各个标志值 的连乘积时,才适合采用几何平均数方法来计算平均标志值。 一般来说,计算社会经济现象在各个时期的平均发展速度时, 要采用几何平均数。例如,工农业总产值年平均发展速度、 全国人口年平均发展速度等。
f
2
Sm1 i
fm
式中: U ——中位数所在组的上限
Sm1 ——大于中位数组的各组次数之和
中位数最大的特点是:它是序列中间1项或2项的平均数,不受极 端值的影响,所以在当一个变量数列中含有特大值与特小值的情 况下,采用中位数较为适宜。正式由于中位数的这一特点,在统 计研究中,当遇到掌握统计资料不多而且各标志值之间差异程度 较大或频数分布有偏态时,为避免计算标志值所得的算术平均数 偏大或偏小,就可利用中位数来表示现象的一般水平。
相关文档
最新文档