第4章 统计数据的分布特征(集中趋势度量法) 应用统计学

合集下载

统计学(第六版)期末考试考点梳理

统计学(第六版)期末考试考点梳理

统计学(第六版)期末考试考点梳理统计学(第六版)期末考试考点梳理第⼀章导论1.1.1 什么是统计学统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。

数据分析所⽤的⽅法分为描述统计⽅法和推断统计⽅法。

1.2 统计数据的类型1.2.1 分类数据、顺序数据、数值型数据按照所采⽤的计算尺度不同,可以将统计数据分为分类数据、顺序数据、数值型数据。

分类数据:只能归于某⼀类别的⾮数字型数据,它是对事物进⾏分类的结果,数据表现为类别,是⽤⽂字来表⽰。

例如:⽀付⽅式、性别、企业类型等。

顺序数据:只能归于某⼀有序类别的⾮数字型数据。

例如:员⼯对改⾰措施的态度、产品等级、受教育程度等。

数值型数据:按数字尺度测量的观测值,其结果表现为具体的数值。

例如:年龄、⼯资、产量等。

统计数据⼤体上可分为品质数据(定性数据)和数量数据(定量数据、数值型数据)。

1.2.2 观测数据和实验数据按照统计数据的收集⽅法,可以分为观测数据和实验数据。

观测数据:通过调查或观测⽽收集的数据。

例如:降⾬量、GDP、家庭收⼊等。

实验数据:在实验中控制实验对象⽽收集到的数据。

例如:医药实验数据、化学实验数据等。

1.2.3 截⾯数据和时间序列数据按照被描述的现象与时间的关系,可分类截⾯数据和时间序列数据。

截⾯数据:在相同或近似相同的时间点上收集的数据。

例如:2012年我国各省市的GDP。

时间序列数据:同⼀现象在不同的时间收集的数据。

例如:2000-2012年湖北省的GDP。

1.3.1 总体和样本总体:包含所研究的全部个体(数据)的集合。

样本:从总体中抽取的⼀部分元素的集合。

1.3.2 参数和统计量参数:⽤来描述总体特征的概括性数字度量。

统计量:⽤类描述样本特征的概括性数字度量。

例如:某研究机构准备从某乡镇5万个家庭中抽取1000个家庭⽤于推断该乡镇所有农村居民家庭的年⼈均纯收⼊。

这项研究的总体是5万个家庭;样本是1000个家庭;参数是5万个家庭的⼈均纯收⼊;统计量是1000个家庭的⼈均纯收⼊。

统计学 第4章 综合指标和数据分布特征的描述

统计学 第4章 综合指标和数据分布特征的描述

G 0.95 0.92 0.90 0.85 0.80
5
0.5349 88.24%
5
例2 加权几何平均数
投资银行某笔投资的年利率是按复利计算的,25年的 年利率分配是:有1年为3%,有4年为5%,有8年为8%, 有10年为10%,有2年为15%,求平均年利率。 年本利率(%) X 年数 f
三、调和平均数 (一)基本公式
例4-1-7:某蔬菜批发市场三种蔬菜的日成交 数据如表,计算三种蔬菜该日的平均批发价格
某日三种蔬菜的批发成交数据 蔬菜 名称
批发价格 (元)
成交额(元) 成交量(公斤)
xi
1.20 0.50 0.80 —
mi
18000 12500 6400 36900
Fi
甲 乙 丙 合计
平均完成计划程度
m 1,100 110% 1 1,000 m X
2.由相对数计算平均数时加权平均数法的应用:

某公司有四个工厂,已知其计划完成程度(%)及计划产值资料如下: 工厂 计划完成程度(%) X 90 100 计划产值 (万元) F 100 200
甲 乙

丁 合计
平均完成计划程度
5000-6000
6000以上
200
180
解: 众数组为第四组
1 d M 0 = XL+ 1 2
= 4000 +
950 320 1000 (950 320) (950 200)
•加权算术平均数: •证明:
(X X ) f
0
Xf f Xf Xf 0 ( X X ) f Xf X f Xf f

统计学第4章学习指导

统计学第4章学习指导

第4章(数据的概括性度量)学习指导数据分布的特征可以从三个方面进行描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布偏斜程度和峰度。

掌握计算、特点及其应用场合。

主要内容学习要点2.1 集中趋势的度量众数▶概念:众数。

▶众数的特点。

中位数和分位数▶概念:中位数,四分位数。

▶中位数和四分位数的特点。

▶中位数和四分位数的计算。

平均数▶概念:平均数,简单平均数,加权平均数,调和平均数,几何平均数。

▶简单平均数和加权平均数的计算。

▶用Excel中的统计函数计算平均数。

▶几何平均数的计算和应用场合。

众数、中位数和平均数的比较▶众数、中位数和平均数在分布上的关系。

▶众数、中位数和平均数的特点及应用场合。

异众比率▶概念:异众比率异众比率的计算和应用场合。

2.2离散程度的度量四分位差(内距)概念:四分位差。

四分位差的计算。

用Excel中的统计函数计算四分位差。

方差和标准差概念:极差,平均差,方差,标准差。

样本方差和标准差的计算。

用Excel计算标准差。

离散系数概念:离散系数。

离散系数的计算。

离散系数的用途。

2.3偏态与峰态的度量偏态及其测度概念:偏态,偏态系数。

用Excel计算偏态系数。

偏态系数数值的意义。

峰态及其测度概念:峰态,峰态系数。

用Excel计算峰态系数。

峰态系数数值的意义。

Excel统计函数的应用。

一)判断题1,各变量值与其平均数的离差之和为最小值。

( )2.当各组的变量值所出现的频率相等时,加权算术平均数中的权数就失去作用,因而,加权算术平均数也就等于简单算术平均数( )3.比较两总体的平均数的代表性,离散系数较小的总体,平均数代表性亦小。

( )4,平均数与次数和的乘积等于各变量值与次数乘积的和。

( )5.若两总体的平均数不同,而标准差相同,则离散系数也相同。

( )6.并非任意一个变量数列都可以计算其算术平均数、中位数和众数。

第四章 集中趋势和离中趋势 《统计学》 ppt课件

第四章 集中趋势和离中趋势 《统计学》 ppt课件

六种相对数指标的比较
不同时期
同一现象 比较
不同现象 比较
同一时期比较 同类现象比较
动态 相对数
不同总体 比较
强度
同一总体中
部分与部分 部分与总体实际与计划
相对数 比 较 比 较 比 较 比 较
比例 相对数
结 构 计划完成
相对数 相对数 相对数
五、计算和应用相对指标的原则
1、正确选择对比的基础(即分母) 2、保证分子、分母的可比性 3、注意相对指标与总量指标结合运用 4、多个相对指标结合运用
(xi x) 0
(xi x) f 0
(2)各个变量值与算术平均数的离差平方和为最 小值。
(xi x)2 min
II调和平均数(H)
与算术平均数没有本质区别,是算术平均数的变形。 是根据变量值x的倒数计算的,又称为倒数平均数。 1、简单调和平均数:未分组资料
步骤:(1) x1、x2、、xn
计量单位表现为两种形式:
一种是复名数,即双重计量单位。在计算这种强度相对指标时,由 于其分子与分母的计量单位在计算时无法约去,故计算后仍保留 对比双方的单位,如人口密度用“人/平方公里”表示,人均国 民生产总值用“元/人”表示;
另一种是无名数,即无计量单位。在计算这种强度 相对指标时,由于其分子与分母的计量单位相同, 在计算时已约去,故计算后其无单位,一般用千 分数、百分数表示,如:人口出生率用千分数来 表示。
(2) 1 、1 、 、1
x1 x2
xn
(3)
1 x
n
(4)
H
n
1 x
2、加权调和平均数:
各组变量值x 各组标志总量 m=xf
将算术平均数公式变形,得:
H

第4章 数据分布特征的度量(1).ppt

第4章 数据分布特征的度量(1).ppt

2020年11月12日/下午11时15分
《统计学教程》
第4章 数据分布特征的度量
4.1 集中趋势的度量
例4.2 利用第三章中例3.1中某学期某班35名学生统计学考试成绩的 原始数据。
要求 试计算计算该班35名学生统计学考试成绩的众数。 解 将该原始数据排序之后,得到有序数据如下 52,56,62,64,65,69,70,74,75,75,76,78,78,79,79, 81,82,82,83,84,84,84,84,86,87,87,88,89,89,90, 91,91,92,96,98
2020年11月12日/下午11时15分
《统计学教程》
第4章 数据分布特征的度量
4.1 集中趋势的度量
2020年11月12日/下午11时15分
《统计学教程》
第4章 数据分布特征的度量
4.1 集中趋势的度量
MO
2020年11月12日/下午11时15分
《统计学教程》
第4章 数据分布特征的度量
4.1 集中趋势的度量
4.1 集中趋势的度量
原始数据经过分组整理所形成的频数分布,直观和概略地反映出数据 分布的基本特征。频数分布属于对数据分布特征的初步描述,缺乏对数 据分布特征的综合度量,若需要深入地表述数据分布特征的具体特征和 内在联系,还应对数据分布特征进行综合性的度量。
数据分布特征的度量包括三个方面的内容,一是数据分布的集中趋势, 反映总体中各个单位的数值水平向其聚集,或者集中的中心数值;二是 数据分布的离散趋势,反映总体中各个单位的数值水平偏离中心数值的 综合程度;三是数据分布的偏态和峰度,反映各个总体单位的数值水平 的分布形态是对称或偏倚,平坦或尖耸的具体数值。
4.1.1众数 众数(Mode)是一组数据中频数最大的变量值,直观地反映了数据的

统计学-数据分布特征

统计学-数据分布特征

2
描述集中趋势的统计
一、平均数
平均数:
集中趋势的测度值之一
最常用的测度值
一组数据的均衡点所在 易受极端值的影响
用于数值型数据,不能用于品质型数据
4
一、平均数
5
平均数的计算公式
6
二、中位数和分位数
(一)中位数 集中趋势的测度值之一 排序后处于中间位置上的值 不受极端值的影响

14
15
例:某城市居民关注广告类型的频数分布
16
例:甲城市家庭对住房状况评价的分布频数
17
四、各度量值的比较
18
四、各度量值的比较
19
四、各度量值的比较
20
各度量值适用的数据类型
21
4.2离散程度的度量
22
4.2离散程度的度量
离散程度 数据分布的另一个重要特征 离中趋势的各测度值是对数据离散程度所作的描述 反映各变量值远离其中心值的程度,因此也称为离 中趋势 从另一个侧面说明了集中趋势测度值的代表程度 不同类型的数据有不同的离散程度测度值
50
51
一、偏态及其测度
52
二、峰态及其测度
53
例:
54
55
56
57
用Excel计算描述统计量
58
用Excel计算描述统计量 72页习题2
59
60
61
62
63
作业1:
64
65
作业2:
66
答案:
67
68

对某一个值在一组数据中相对位置的度量 可用于判断一组数据是否有离群点 用于对变量的标准化处理
40
标准分数的性质
41
例:

统计学原理第4章:数据特征的描述

统计学原理第4章:数据特征的描述

第四章 数据特征的描述
某公司400名职工平均工资计算表 单位:元
按月工资 组中值 职工
分组
x
人数
f
x f
比重(%)
f
f


③ ④=②×③ ⑤=③÷ 400
1100以下 1000
60
60000
15
1100-1300 1200 100 120000
25
1300-1500 1400 140 196000
35
分组
职工 人数
f
x f

1100以下 1100-1300 1300-1500 1500-1700 1700以上

1000 1200 1400 1600 1800
③ ④=②×③
60
60000
100 120000
140 196000
60
96000
40
72000
人数为权数
x x f f
544000 400
算术平均数、调和平均数、中位数、众数、几何平均数
3. 各种平均数的Excel操作
24/77
1. 集中趋势的含义
第四章 数据特征的描述
集中趋势是一组数据向其中心值靠
拢的倾向和程度
测度集中趋势就是寻找数据一般水
平的代表值或中心值
中心值 即:平均水平

25/77
2. 集中趋势的度量方法
第四章 数据特征的描述
第四章 数据特征的描述
《统计学原理》(第3版)
第四章 数据特征的描述
学习目标
第一节 总量与相对量的测度 第二节 集中趋势的测度 第三节 离散程度的测度
2/77
第一节 总量与相对量的测度

统计学课件 第四章 统计分布的数值特征

统计学课件  第四章 统计分布的数值特征

组距数列中位数的确定—例
年人均纯 收入 (千元) 5以下 5—6 农户数 (户) 240 480 向上累 计频数 240 720 (1)计算累计频数
(2)确定中位数组(6—7)
f 1 3001 1500.5
2 2
6—7
7—8 8—9 9以上 合计
1100
700 320 160 3000
设总体各单位某数量标志值为:
x1 ,x2 ,„ ,xn
简单算数平均数
x1 x2 ... xn x n
x
i 1
n
i
n
1)简单算术平均数
计算公式: x x1 x2 ... xn
x
i 1
n
i
n
n
应用条件:未分组的原始资料,或各组出现的次 数都是1的数据资料。
25%
QL
25%
QM
25%
25%Βιβλιοθήκη QU不受极端值的影响。 主要用于顺序数据,也可用于数值型数据,但不能 用于分类数据。
四分位数—位置的确定
原始数据
n 1 QL 位置 4 Q 位置 3(n 1) U 4 n QL 位置 4 Q 位置 3n U 4
特大值或特小值的情况下,采用中位数较适宜。
[例]:在工业产品的质量检验或分析时间序列的季
节变动时,常常要用到中位数。
四分位数
能够将全部总体单位按标志值大小等分为四部分的三个数值。 第一个四分位数叫做“1/4分位数”或“下分位数”;
第二个就是中位数;
第三个叫“3/4分位数”或“上分位数”。 排序后处于25%、50%和75%位置上的值。
一、分布的集中趋势
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
10
已知
计算栏
二、调和平均数(Harmonic Mean)
解: xH 收购额 = 收购量 xH
xf 1 x xf
m 1 xm
xH
61 1.016(元 / 件) 60 m 1 xm 1 1 m x m
11
三、众数(Mode)
1、众数是一组数据中出现次数最多的变量 值,用 M0 表示。 2、单项数列,出现次数最多的变量值即为 众数,举例:教材61页 3、组距数列,计算众数步骤: (1)、确定众数组 (2)、利用公式计算众数
第4 章
集中趋势度量法
(Central Tendency)
本章介绍的主要内容: 算数平均数(均数Mean) 调和平均数(Harmonic) 众数(Mode) 中位数(Median) 几何平均数(Geometric)
1
集中趋势
集中趋势(Central Tendency)是 指一组数据向某一中心值靠拢的倾向, 测度集中趋势是寻找数据一般水平的代 表值或中心值。
8
课堂练习
解:
总成本 平均单位产品成本= 总产量 x x f
f
11 22%+13 40 %+ 16 38 % = 13.(元 7 / 件)
9
二、调和平均数(Harmonic Mean)
调和平均数是均值的另一种表现形式 例:教材55页:
等级 单价(元/斤)收购额(元)收购量(斤) x xf xf/x 一级 1.2 24 20 二级 1.0 30 30 三级 0.7 7 10 合计 61 60
12
众数与相邻两组的关系示意图
f f f
频 数
f-1
f+1
频 数
f-1
f+1 频 数
f+1
f-1
m0 (a)
m0 (b)
m0 (c)
13
三、众数(Mode)
计算公式: 下限公式
1 m0 L i 1 2
符号含义见P74页
14
四、中位数(dian)
1、中位数是一组数据按从小到大排序后, 处于中间位置上的变量值,用me表示。 2、未分组数据计算中位数 1)先对数据进行排列 2)确定中位数的位置=(N+1)/2 3)确定中位数的具体数值
4、分组数据计算中位数 计算向上累计次数或向下累计次数 f 根据 确定中位数所在的组—中位数组 2 用下面公式计算
f
me L 2
sm 1 fm
i
17
五、分位数(PERCENTILE VALUES)
中位数是从中间点将全部数据等分 为两部分,与中位数类似的还有四分位 数(Quartile)、十分位数(Decimal)、百 分位数(Percentile)等,分位数与中位 数计算方法类似。
15
四、中位数(Median)
3、例:有五位工人生产某种产品件数按序排列 如下: 20、23、26、29、30 中位数的位置=(5+1)/2=3 me=26 若改为有6位工人 20、23、26、29、30、32 中位数的位置=(6+1)/2 me=(26+29)/2=27.5
16
四、中位数(Median)
2
一、算术平均数(均值)
总体标志总量 算术平均数= 总体单位总量
1、简单算术平均数(均值) 根据未分组资料计算均值:
x1 x2 xn x x N N 举例:教材 80页
3
一、算术平均数(均值)
2、加权算数平均数(加权均值) (Arithmetic Mean) 根据分组资料计算均值
18
五、分位数
例题:教材62页
19
众数、中位数和均值的比较
频 数 频 数 频 数
m0 me x
(a) 对称分布
x me m0
(b) 左偏分布
m0 me x
(c) 右偏分布
20
5
组中值的计算举例
◆举例: 见教材54 页,例4.2
6
课堂练习
某管理局所属15个企业,2012年按其生产 某种产品平均单位产品成本的高低分组资料, 如下表所示,试计算这15个企业总的平均单位 产品成本。
7
课堂练习
按平均单位产品 成本分组 10-12 12-14 14-18 合计 企业 各组产量所 个数 占比重(%) 2 22 7 40 6 38 15 100
x f x2 f 2 xn f n x 1 1 f1 f 2 f n x x f
xf(权数为绝对数) f
f
(权数为相对数)
4
组距数列下均值的计算
◆有上限和下限 组中值=(上限+下限)/2 ◆有上限无下限 组中值=上限—相邻组组距/2 ◆有下限无上限 组中值=下限+相邻组组距/2 用组中值近似代替各组的变量值
相关文档
最新文档