3.3变量分布特征的统计描述(一)

合集下载

统计学 第三章 变量分布特征的描述

统计学 第三章 变量分布特征的描述
18000 47.393元 / 股 380
(2)作为独立公式运用
例1:计算1与2的调和平均。 例2:编制价格总指数时,代表品1的价格指数是 110%,代表品2的价格指数是105%,则可用两者的 调和平均值作为这一小类的价格指数。 例3:甲员工的“德”、“才”、“能”测量分值 分别是90分、86分、84分;乙员工的“德”、 “才”、“能”测量分值分别为84分、98分、78 分。要求采用简单调和平均方法计算并比较甲、 乙两人的综合素质。
概念
平均指标主要用来表明同质总体中某一 标志值,在一定时间、地点条件下所达 到的一般水平。其数值表现平均数。
平均指标的种类
1、反映时间不同,分为静态和动态平均数。 2、取得集中趋势代表值方法的不同,可分为数值平均数 和位臵平均数 。
数值平均数
从总体各单位变量值中抽象出具有一般 水平的量,这个量是根据各个单位的具 体标志值计算出来的,有算术平均数、 调和平均数、几何平均数等形式。 先将总体各单位的变量值按一定顺序排 列,然后取某一位臵的变量值来反映总 体各单位的一般水平。位臵平均数有众 数、中位数、四分位数等形式。
1、简单调和平均数
(1)作为算术平均的变形
H
n 1 1 1 xn x1 x2

n 1 x
例1:三种不同等级的青 菜,每公斤单价分别为2 元、4元、5元。每种等 级各买1元,则均价是多 少?
例2:某人在30元/股、50 元/股、100元/股的三个不 同价位各买进“贵州茅台” 股票6000元,则所持该股 票的均价是多少?
1.简单算术平均数
• 简单算术平均数的公式根据未经分组整 理的原始数据计算的均值。设一组数据 为x ,x2,x3,…xn.则简单算术平均数的计 算公式如下:

3 变量分布特征的描述

3 变量分布特征的描述

2)受极端值的影响较算术平均数和调和平均小,
较稳健。
3)适用于反映总体标志总量是总体各单位标志值
连乘积的现象。
2015/12/25
浙江财经大学
13
第一节
三、位置平均数
(一)众数 ( M 0 )
集中趋势的描述
1、概念 众数是总体中出现次数最多的标志值。出现两个 以上次数最多的标志值,称为复众数。 2、存在条件
2015/12/25

f f
表示。
浙江财经大学
7
第一节
1 1 2 2
集中趋势的描述
k k
xf x f x f ... x f x f f f ... f
1 2 k
或 x x
f
f

5、算术平均数的数学性质——P62 6、算术平均数的优缺点 优点:1)可以利用算术平均数来推算总体标志总量;2)在数 理上具有无偏性现有效性; 3)具有良好的代数运算功能。 缺点:1)易受极端值影响,代表性降低,并且受极大值影 响大于受极小值影响。2)组中值具有假定性,计算结果只 是一个近似值,尤其是开口组,平均数准确性会更差。
现实中,有时由于掌握资料的限制,往往用调和平均数作 为算术平均数的变形来使用,此时,二者计算的结果是相等的。
xf xf m x H f 1 xf m x x
式中,m=xf, f=m/x
调和平均数运用于计算相对数或平均数的平均数: 例
1)凡是掌握被平均指标的分母资料时,用算术平均法。 2)凡是掌握被平均指标的分子资料时,用调和平均法。
浙江财经大学
2015/12/25
第一节
2)单项数列
集中趋势的描述
f A、计算中位数累计位置:中位数累计位置

1分布特征描述类

1分布特征描述类

1分布特征描述类分布特征是指在一定范围内,不同数值或对象的分布情况。

通过对分布特征的描述和分析,可以更好地理解数据的规律和特点,有助于数据的统计分析和决策支持。

在统计学和数据分析领域,分布特征描述是非常重要的一部分,可以帮助我们揭示数据的本质,并为后续的研究和应用提供依据。

分布特征描述主要包括对数据的中心趋势、离散程度、形状和对称性等方面的描述。

其中,数据的中心趋势反映了数据的集中程度,通常用均值、中位数和众数等来描述;数据的离散程度则反映了数据的分散程度,通常用方差、标准差和极差等来描述;数据的形状和对称性反映了数据的分布形态,通常用偏度和峰度来描述。

这些描述指标可以帮助我们全面地认识数据的特点,为数据分析和决策提供依据。

在描述分布特征时,我们通常会用图表和统计指标相结合的方法,来展示数据的分布情况。

常见的图表包括直方图、箱线图、饼图和散点图等,这些图表可以直观地展示数据的分布情况,帮助我们找出数据的规律和特点。

而统计指标则可以量化地描述数据的分布特征,提供客观的数据支持。

在实际应用中,分布特征描述可以帮助我们进行数据探索和分析,找出数据中的异常情况和规律性,为后续的数据处理和分析提供基础。

比如,在市场调研中,我们可以通过对销售数据的分布特征描述,找出最畅销的产品和销售状况,为产品的推广和销售提供决策支持;在金融风险管理中,我们可以通过对资产收益率的分布特征描述,找出潜在的风险源和赚钱机会,为投资决策提供指导。

总的来说,分布特征描述是数据分析的重要一环,可以帮助我们更好地理解数据的特点和规律,为数据处理和决策提供依据。

通过对数据的中心趋势、离散程度、形状和对称性等方面的描述,我们可以全面地认识数据,并更好地利用数据为我们的工作和生活带来更多的价值。

因此,分布特征描述不仅在统计学和数据分析领域具有重要意义,而且在各个行业和领域都有着广泛的应用前景。

第3章数据分布特征的描述PPT课件

第3章数据分布特征的描述PPT课件

n
fi
164 07 04 50 000 10350
i 1
3-11
5.算术平均数的主要数学性质
(1)算术平均数与变量值个数的乘 积等于各个变量值的总和。
n
nx xi i 1
(2)各变量值与算术平均数
的离差之总和等于零。
n(xi x) 0
i1
(3)各变量值与算术平均
数的离差平方之总和为
最小。
n(xi x)2 min
• 集中趋势(Central tendency)
– 较大和较小的观测值出现的频率比较低,大多数 观测值密集分布在中心附近,使得全部数据呈现 出向中心聚集或靠拢的态势。
测度集中趋势的指标有两大类:
数值平均数——是根据全部数据计算得到的代表值,主要 有算术平均数、调和平均数及几何平均数;
位置代表值——根据数据所处位置直接观察、或根据与特 定位置有关的部分数据来确定的代表值,主要有众数和中 位数。
• 计算结果是近似值 .
3-10
4.对相对数求算术平均数
• 由于各个相对数的对比基础不同,采用简单 算术平均通常不合理,需要加权。
权数的选择必须符 合该相对数本身的 计算公式。
权数通常为该相对 数的分母指标。
n
xifi xi 1
1% 6 16 1 0% 0 0 47 1 5% 2 0 400 10 2 1 1% 0 1 0 1.7 1 %
n
fi
i1
n(xifi) i1 xi
1 2% 6 56 1 4% 0 75 1 4% 2 80 10350
3-14
(三)几何平均数(Geometric mean)
• 几何平均数— n个变量值连乘积的n次方根。

第3章 分布数量特征的统计描述

第3章 分布数量特征的统计描述
x
21 22 23 24 25 合计
420 660 1380 1200 750 4610
20 30 60 50 30 200
f
xf
26
例2:求平均利润率

某公司下属三个部门销售情况,求三个部门的平均利润率 部 A B C 门 销售利润率(%) x 12 10 7 销售额(万元) f 1000 2000 1500


n
xi
i 1
加权算术平均数
i 1
fi x xi fi
i 1
19
n
n

性质2:各单位标志值与算术平均数的离差之和等
于0
x x x x
x1
x x
x
x x
xn
(x x) x x N x N x 0
( x x ) f xf x f x f x f 0
17

例:某市有126万人口,其中男性人口64.26 万,女性人口61.74万,求该城市人口的男性 平均成数。
解:
x p
64 . 26 126
51 %
该城市人口的男性成数为51%
(三)算术平均数的数学性质

性质1:算术平均数与标志值个数的乘积等于 各标志值的总和

简单算术平均数
Nx
2 .1 1 2 5(万 吨 )
按产棉量分 县数 组中值 组(万吨) f 1 以下 5 0.5 1~2 42 1.5 2~3 16 2.5 13 3.5 3~4 4 4.5 4 以上 合计 — 80
x
xf
2.5 63 40 45.5 18 169
注意:这里假定各组标志值在组内分布是均匀的。但

变量分布特征描述

变量分布特征描述

第三章变量分布特征的描述第一节集中趋势的描述变量分布特征可以从以下三个方面加以描述:集中趋势:反映变量分布中各变量值向中心值靠拢的程度;离中趋势:反映变量分布中各变量值远离中心值的程度;分布形状:反映变量分布的偏斜程度和尖陡程度。

一、集中趋势与平均指标集中趋势亦称为趋中性,是指变量分布以某一数值为中心的倾向。

用平均指标来反映。

平均指标的种类数值平均数包括算术平均数:简单算术平均加权算术平均调和平均数:简单调和平均加权调和平均几何平均数:简单几和平均加权几和平均位置平均数包括:众数中位数分位数平均指标的作用(自学)二、数值平均数(一)算术平均数1、基本计算公式:总体标志总量/总体单位总数2、简单算术平均数:1)计算公式:(2)适用范围:末分组资料。

3、加权算术平均数:(1)计算公式:(2)说明:)(212211∑∑∑∑⋅=++++++==ffxffffxfxfxfxfxkkk加权算术平均数:n xx∑=简单算术平均数:在组距数列中x 用组中值 ;影响因素:标志值、权数。

(3)适用范围:分组资料中已知分母加总资料。

(4)注意问题——权数及权数的作用。

4、算术平均数的数学性质5、算术平均数的优缺点: 优点: a.)可推算总体标志总量;b.)便于代数运算;c.)抽样中具有良好稳定性。

缺点:a.)受极端值的影响大;b.)组距数列中有较大假设性。

(二)调和平均数 1.问题的提出例:市场上苹果的价格有三种:3元/斤;2.4元/斤;1.2元/斤,现有两种可供选择的方案:甲各买30元或乙各买15斤,问选择何方案为优?2.调和平均数的概念(1) 概念:标志值倒数的算术平均数的倒数。

(2) 特点:a.)常作为算术平均数的变形 b.)标志值中有数据为零时无法计算。

(3)简单调和平均数适用范围:末分组资料。

(4)加权调和平均数实质:加权算术平均数的变形。

适用范围:分组资料已知基本公式分子加总资料。

(三)由相对数或平均数计算平均数 基本步骤:1.)写出基本公式; 2.)确定计算公式;3.)具体计算。

第三章 变量分布特征的描述 《统计学》PPT课件

第三章  变量分布特征的描述  《统计学》PPT课件

2.四分位差:四分位差作为变异程度的一种度量,能够克服 异常值的影响。它是第三个四分位数与第一个四分位数的差 值。也就是说,四分位差是中间50%的数据的全距。
Qd QU QL
四分位差弥补了全距容易受极端值影响的缺陷。剔除数据中最小25%和最 大25%的数据,反映了中间50%数据的离散趋势。数值越小,说明中间的 数据越集中;数值越大,说明中间的数据越分散。
x me mo
3.根据经验,在轻微偏态时,不论是左偏还是右偏,众数与算术平均
数的距离约等于中位数与算术平均数距离的3倍,即 mo x 3me -x
右偏分布
M0 Me x
对称分布
左偏分布
x
x Me M0
Me
M0
第二节 离中趋势的描述
所谓离中趋势,就是变量分布中各变量值背离中心值的倾向。 如果说集中趋势体现变量分布的同质性,那么离中趋势就是变 量分布变异性的体现。对离中趋势的描述就是要反映变量分布 中各变量值远离中心值的程度,以反映变量分布的特征。
H 20 3
3
15.83
20 20 20 1 1 1
18 16 14 18 16 14
2.加权调和平均数:当各组的标志总量不相等时,所计算的 调和平均数要以各组的标志总量为权数,其结果即为加权调 和平均数。
H m1 m2 m1 m2 x1 x2
k
mk
mk
mi
i 1
k mi
x x1 x2 xn 95% 92% 90% 85% 80% 88.40%
n
5
G n x1 x2 x3 xn 5 95%92%90%85%80% 88.24%
2.加权几何平均数:当计算几何平均数的各变量值出现的次 数不等,即数据经过了统计分组时,则应采用加权几何平均 数。

3第三章 变量分布特征的描述

3第三章 变量分布特征的描述
0.09 0.05
15.2
9.45 5.75
合 计
i i i
i
164
1.00
82.62
x f x f x f f
i
i
(千克) =82.62
3.注意点
x
xi fi f
i
f1 f 2 f h
x
i 1
h
i
h
(1)简单算术平均数和加权算数平均数的关系 (2)算术平均数的大小,取决于研究对象的变量值(x) 和各变量值重复出现的频数(f)或频率 (fi/∑fi)大小 的影响。 绝对权数 (3)权数的表现形式 相对权数
一、集中趋势与平均指标 集中
趋势
平均
指标
1.平均指标的种类
计算方法不同
数值平均数 从总体各单位变量值中抽 象出具有一般水平的量, 这个量是根据各个单位的 具体标志值计算出来的, 有算术平均数、调和平均 数、几何平均数等形式。 位置平均数 先将总体各单位的变量 值按一定顺序排列,然 后取某一位置的变量值 来反映总体各单位的一 般水平。有众数、中位 数、四分位数等形式。
55 65 75 85 95 105 115 -
xifi
550 1235 3750 3060 2565 1470 920 13550
加权算术平 均数公式往 往用于分过 组经过整理 的数据
x f x f
i i
i
13550 82.62(千克) 164
权数转换
按日产量分组 组中值xi (千克) (千克)
n 3 H 1 xi 1 1 1 2 4 5 3 3.16元 / 公斤 0.95
n 3 H 1 xi 1 1 1 30 50 100 3 47.393元 / 股 0.062
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计原理>>第三章>>第三节
月工资(元) 人数比重 % 快速练习: 2000 2500 3000 30 20
600 500
50
1500 2600合计 Nhomakorabea100
举例 仍用表3-3中的资料,用频率 术平均数,结果见表3-5。
表3-5
作权数来计算加权算
根据资料,计算加权算术平均数为:
统计原理>>第三章>>第三节
统计原理>>第三章>>第三节
(1)根据单项变量分布数列计算算术平 均数。用字母表示为,其计算公式为:
计算过程: ①表内,根据x栏与f栏内数值计算出 xf栏内数值。xf栏为各组变量总值,xf栏 的合计数为总体变量总值。 ②表外,将Σ xf(变量总值)和Σ f (总频数)代入公式,计算出算术平均数。
统计原理>>第三章>>第三节
• 练习册P31 10
(二)调和平均数
如果只掌握各且的标志值和各组的标志值总量 及总体总量,则用调和平均数的方法计算平均指标。
是算术平均数的变形形式。
统计原理>>第三章>>第三节
举例
举例
表3-7
某期某商品价格及销售量资料 价格(元)x 销售量(元) m 0.80 20000 1.00 21000
统计原理>>第三章>>第三节
依据资料的条件不同,具体计算方法可 分为简单算术平均数和加权算术平均数。
统计原理>>第三章>>第三节
1.简单算术平均数
简单算术平均数就是通过将总体各个单位的 标志值相加除以总体单位数求得。 其计算公式为:
式中:
统计原理>>第三章>>第三节
例题:
某生产组6名工人生产同一种零件的日产量 分别为:67、68、69、71、72、73。 求:平均日产量( )。
fi
xi
. fi
15 16 17 合计
75 288 51 414
请求 平均年龄。 平均年龄=414÷26=15.9(岁)
当各组变量值x不变时,各组次数即频 数f对平均值的大小起着权衡轻重的作用。 因此,次数f称为权数,这种方法称为加权 算术平均法。 权数不仅可以用绝对数f表示,也可用 相对数即频率f/Σ f表示。即:
59000
统计原理>>第三章>>第三节
要求计算该种商品的平均价格。
练习 • 练习册:P31 11 12
• P32 13
课堂练习
• 练习册P22 一、判断题 5~9 二、单选:3~5、9 三、多选:7~10
第三章复习练习
1. 2004年第一季度某部门总产值计划为 5400万元,实际完成5600万元,该部门 计划完成情况为多少? 2. 某企业计划规定2009年的劳动生产率要比 2008年提高5%,实际执行结果比上年提 高了6%;计划规定2009年的可比产品成 本2008年降低7%,实际执行结果比上年 降低了6%.
P45 第三节 变量分布特征的统计描述
集中趋势的代表值—数值平均数
统计原理>>第三章>>第三节
一、集中趋势的代表值 (一)算术平均数
算术平均数(也称为均值)是最常用的最基本的反 映分布数列中各变量值分布的集中趋势的代表值。它是 在总量指标基础上计算出来的。 算术平均数是总体各单位的标志总量除以总体单位 数得到的数值,即同一总体内的标志总量与总体总量之 比,反映社会经济现象的一般水平。 公式: (总体)标志总量 算术平均数= 总体(单位)总量
=
=
=
=70件
练习
练习:对某班12名学生某科某次考试成 绩按试卷登记得到如下资料: 54 60 62 97 85 52 55 83 79 95 80 89
2.加权算术平均数
加权算术平均数是在总体经过分组形成 变量数列(包括单项数列和组距数列),有变 量值和次数的情况下,将各组变量值分别与 其次数相乘后加总求得标志总量,再除以总 体单位数(即次数总和)而求得。计算公式 为:
4000~5000
5000元以上 合计
8 12 15 10 3 50
1000 12000 30000 52500 45000 16500
(1) ×(3) 20 240 600 1050 900 330 3140 方法一:用 频率求
157000
法二:用频数求: 平均工资=15700÷50=3140
练习
统计原理>>第三章>>第三节
表3-6
日产量 (件)
400以下 400~500 500~600 600~700 700~800 800以上
组距数列加权算术平均数计算表
组中值 (件)x 工人数(人)
f f/Σ f
xf 1750 5850 9900 9750 5250 1700
x·f/ Σ f 29.05 97.65 165.00 162.50 87.75 28.05
快速练习:
月工资(元) 工人人数(人) 人数比重(fi%)
xi
fi

fi xi
.
fi
fi
2000 2500 3000
3 2 5
30 20 50 100
600 500 1500 2600 平均工资 2600元
合计
10
请求:该小组的平均月工资额。
(2)根据组距变量分布数列计算算术平 均数。若掌握组距数列资料,计算方法是: 先计算组中值xi ,然后再按上述方法计算 加权算术平均数。如表3-6所示。
350 450 550 650 750 850
5 13 18 15 7 2
0.083 0.217 0.300 0.250 0.117 0.033



60
1.000
34200
570.00
根据工人数计算:平均数=34200÷60=570(件)
统计原理>>第三章>>第三节
快速练习(填列下表,求出平均工资)
月工资额 组中值 (元)
工人数 (人 )
xi
1000元以下
fi
fi
(3) 0.04 0.16 0.24 0.3 0.2 0.06 1
fi
xi . fi
(1)×(2)
xi
.
fi
fi
(1) 500 1500 2500 3500 4500 5500
(2) 2
1000~2000
2000~3000 3000~4000
统计原理>>第三章>>第三节
月工资(元) 工人人数(人) . 快速练习: xi fi fi xi 2000 2500 3000 3 2
6000 5000
5
15000 26000
合计
10
请求:该小组的平均月工资额。
平均工资=26000÷10=2600元
年龄(岁) 快速练习:
xi
人数(人) 5 18 3 26
商场名称 甲 乙

合 计
1.20

18000
59000
统计原理>>第三章>>第三节
要求计算该种商品的平均价格。
统计原理>>第三章>>第三节
举例
举例
表3-7
某期某商品价格及销售量资料 价格(元)x 销售额(元) m 0.80 20000 1.00 21000
商场名称 甲 乙

合 计
1.20

18000
• 3. A先生2003年年支出为4万元,2004年年支出 为5万元,则2004年为2003年的动态相对指标为 多少? • 4.某学校有三个级,学生总人数3000人,其中: 高一有1200人,高二有1000人,高三有800人。 • 要求: • (1)计算三个年级的学生的比重各是多少?。 • (2)计算高一、高二、高三学生的人数比例关 系。
举例
P46例题:某生产组10名工人生产甲产品,日产量 分组资料如表3-3所示,计算工人的平均日产量。
表3-3 算术平均数计算表之一
根据资料,可以计算该生产组10名工人的平均日产量为:
统计原理>>第三章>>第三节
P46
表3-4
算术平均数计算表之二
平均日产量为:
由此可见,平均日产量 14件趋向于工人人数最 多,即频数最大的那个 变量值10件。
5、某厂有50名职工,工资资料见下表。 职工人数 组中值x (2) 按月工资 (人)f 分组(元 (1) ) 1000以下 6 1000-1200 10 x .f (1)×(2)
1200-1400 16 1400-1600 14
1600以上 4 合计
要求:计算该厂职工的平均工资.
相关文档
最新文档