第4章 数据的概括性度量

合集下载

统计学第四章统计数据的概括性度量

统计学第四章统计数据的概括性度量

4-3
经济、管理类 基础课程
统计学
一、统计数据的概括性度量方法—统计指标
1、概念:统计指标是反映现象总体综合数量特征的基本概念及其具体 数值的总称 2、特点:同质事物的可量性和量的综合性 3、作用: (1)是记录社会经济现象发展变化情况的工具,也是反映社会经济现 象数量规律的手段 (2)是进行社会经济管理和科学研究的基本依据 4、种类: (1)按作用和表现形式的不同分为:总量指标、相对指标、平均指标、 离散指标和形状指标 (2)按其所反映的内容和数量性质不同分为:数量指标和质量指标 (3)按其反映现象的时间状况不同分为:静态指标和动态指标 (4)按其计算范围不同分为:总体指标和样本指标 (5)按其计量单位不同可分为:实物指标、价值指标和劳动量指标
经济、管理类 基础课程
统计学
第四章 统计数据的概括性度量
4-1
经济、管理类 基础课程
统计学
第一节 第二节 第三节 第四节
第四章 统计数据的概括性度量
统计数据的概括性度量理论 集中趋势的度量 离散程度的度量 偏态与峰态的度量
4-2
经济、管理类 基础课程
统计学
第一节 统计数据的概括性度量理论
一、统计数据的概括性度量方法——统计指标 二、总量指标 三、相对指标 四、数据分布的特征及度量 (集中趋势、离中趋势、分布形状的测度)
4-8
经济、管理类 基础课程
统计学
三、相对指标
5、种类与计算方法
(3)比例相对数:是总体内部分与部分的数据对比,反映事物各组成部分 之间的数量联系程度,常用系数或倍数,以及n:1或n:100或1:m:n 的连比等形式表示 公式为: 比例相对指标=(总体中某一部分数值÷总体中另一部分数值)×100% 注意:分子分母指标可以互换、对比数值可以大于1或小于1,这一特点与 结构相对数不同。该指标有助于认识客观现象是否按比例协调发展 (4)比较相对数:是同类现象在不同国家、地区、部门、单位之间的数值 对比,用以表现同类现象在不同空间条件下的数量对比关系。常用百 分数、系数、倍数等表示。 公式为: 比较相对指标=某条件下的某类指标数值÷另一条件下同类指标数值 注意:分子分母可以互换,根据研究需要决定

统计学第四章-数据的概括性度量

统计学第四章-数据的概括性度量
在数据集中,众数组是出现频率最高的一组。 Set of data may have one mode (or modal
class), or two or more modes (or modal class). 数据集可能有一个众数(组),或两(多)个众数
(组)。
The modal class 众数组
(计算公式)
Me
1X2NX21N2
XN21
当N为奇数时 当N为偶数时
数值型未分组数据的中位数
(5个数据的算例)
位 置 N1513 22
中位数 22
数值型未分组数据的中位数
(6个数据的算例)
原始数据: 10 5 9 12 6 8 排 序: 5 6 8 9 10 12 位 置: 1 2 3 4 5 6

n
(xi x) 0
i1
2). 各变量值与均值的离差平方和最小
n
(xi x)2 min
i1
(二)、调
和平均数 是总体各单位标志值倒数的算术平
harmean (harmonic mean)
均数的倒数,又叫倒数平均数
【例】 设X=(2,4,6,8),则其调和平 均数可由定义计算如下:
⒈求各标志值的倒数 : 1 ,1 ,1 ,1
第四章 数据的概括性度量
4.1 集中趋势度量 4.2 离散程度的度量 4.3 偏态与峰态的度量
数据分布的特征
集中趋势 (位置)
离中趋势 (分散程度) 偏态和峰度 (形状)
4.1 集中趋势的度量
4.1.1. 分类数据:众数 4.1.2. 顺序数据:中位数和分位数 4.1.3. 数值型数据:均值 4.1.4. 众数、中位数和均值的比较
2. 相邻两组的频数相等时,众不相等时,众数采用 下列近似公式计算

第4章统计数据的概括性度量(新)

第4章统计数据的概括性度量(新)
Biblioteka xii 1N
N
简写为:
x N
通常用于未分组数值型数据算术均值计算 且研究总量取决于各变量值的和。
简单算术均值
(例题分析)
【例】某班级40名同学统学的考试成绩 :
该班40名同学统计学的平均成绩为:
x 6 4 7 0 7 8 7 5 3 0 8 9 7 7 .2 3 (分)
总规模数据的计算要求
1.现象要具有同类性 2.要有明确、科学的涵义和科学的统计方法 3.要有统一的计量单位
第二节 相对水平的度量
一、相对数据的概述 二、相对水平的度量
一、相对数据的概述
1.相对数是由两个相互联系的变量值相除而得出的比 率,它反映了研究对象内部各部分之间或现象之间的 相互关系。
2.其数值表现形式有无名数和有名数两种,其中绝大 多数的相对数数值都采用无名数表现,常用的无 名数是系数、倍数和百分数。
3. 其计算公式为:
动态相对数=
报告期数值 基期数值

动态相对数=
报告期数值-基期数值 基期数值
如某年某国的经济增长率,某企业某月产品销售量
的发展速度,具体在第5章介绍。
17
强度相对数
1.是指两个性质不同但有联系的总体变量值的比率
2.强度相对数主要用来反映事物的密度、强度和普遍程度。
3. 强度相对数可用名数表示,也可用无名数表示。
13
二、相对水平的度量
常用的相对数:结构相对数,比较相对数, 动态相对数,强度相对数,计划完成程度相 对数。
结构相对数
1. 是指总体中某部分数值与全部数值的比率,可用 来反映研究现象内部的构成状况。 2. 常表现为比重,以百分数或系数表示。 3. 其计算公式为:

04 数据的概括性度量

04 数据的概括性度量
2.众数主要用于分类数据,也可用于顺序数据和数 值型数据 3.众数是一个位置代表值,它不受极端值的影响。 一组数据可能没有众数,也可能有几个众数。
经管类 核心课程
统计学
一个众数 原始数据: 5
一个众数 原始数据: 5 6
众数(众数的不唯一性)
7
9
8
7
7
6
7
8
7
7
多于一个众数 原始数据: 25 28 28 36 42 42 48 无众数 原始数据:10 5 9 12 6 8
经管类 核心课程
统计学
分类数据的众数(例题)
解:这 里的变 量为 “饮料 品牌 ” ,是 个分类 变量 , 不同 的品牌 就是变 量值 。在 所 调查 的 50人 中,购 买可口 可乐 的人 数 最多 , 为15 人,因 此众数 为 “ 可口可 乐 ”这 一品 牌,即
M =可口可乐
【例4.1】根据第三章表3-4 中的数据,计算“饮料品牌 ”众数
数据类型
品质数据 汇总表 原始数据
数值型数据 分组数据 时序数据 多变量数据
条 饼 环 形 图 形 图 图
茎 叶 图
箱 线 图
直 方 图
线 图
散 点 图
气 泡 图
雷 达 图
经管类 核心课程
统计学
§2.4 合理使用图表
3.4.1 鉴别图形优劣的准则 3.4.2 统计表的设计
经管类 核心课程
统计学
3.4.1 鉴别图形优劣的准则
经管类 核心课程
统计学
数值型数据的四分位数(例题)
【例4.6】在某城市中随机抽取9个家庭,调查得到 每个家庭的人均月收入数据如下(单位:元)。要求 计算人均月收入的四分位数。 750 780 850 960 1080 1250 1500 1630 2000

第四章 数据的概括性度量

第四章 数据的概括性度量

第四章数据的概括性度量第四章 数据的概括性度量一.填空题 1. 是一组数据中出现次数最多的变量值。

2.一组数据排序后处于中间位置上的变量值称 。

3.不受极端值影响的集中趋势度量指标有 . 和 。

4.一组数据的最大值与最小值之差称 。

5. 是一组数据的标准差与其相应的平均数之比。

6.Excel 中计算中位数时选用的函数为 。

7. 某工厂13名工人某日生产零件数分别为(单位:件)10.11.13.11.14.11.12.11.15.16.12.11.13 ,则中位数为 ;众数为 。

8.某百货公司连续几天的销售额如下:257.276.297.252.238.310.240.236.265,则其下四分位数是 。

9.若一组数据的e oX M M 〈〈,则其属于_______________分布(左偏.右偏)。

10.如果一组数据服从标准正态分布,则峰态系数为___________。

11.假定一个总体由5个数据组成:3.7.8.9.13,该总体的方差为。

13.某班共有25名学生,期末统计学课程的考试分数分别为:68.73.66.76.86.74.61.89.65.90.69.67.76.62.81.63.68.81.70.73.60.87.75.64.56,该班考试分数的下四分位数和上四分位数分别是和。

14.在某行业中随机抽取10家企业,第一季度的利润额(单位:万元)分别为72.63.1.54.7.54.3.29.26.9.25.23.9.23.20,该组数据的极差为。

二.单项选择题1.对于对称分布的数据,众数.中位数和平均数的关系是:()。

A.众数>中位数>平均数B.众数=中位数=平均数C.平均数>中位数>众数D.中位数>众数>平均数2.可以计算平均数的数据类型有:()。

A.分类型数据B.顺序型数据C.数据型数据D.所有数据类型3.数值型数据的离散程度测度方法中,受极端变量值影响最大的是()。

A.极差B.方差C.均方差D.平均差4.当偏态系数为正数时,说明数据的分布是()。

(04)数据概括度量

(04)数据概括度量

调和平均数的应用
【例】某企业某日工人的日产量资料如下:
日产量(件) 各组工人日总产量(件)
X
10 11 12 13 14
m
700 1100 4560 1950 1400 9710
合计
计算该企业该日全部工人的平均日产量。
调和平均数的应用
解:
XH m 1 Xm 9710 700 1400 10 14
求解比值的平均数的方法
mi 比值 X i fi

X
m f

Xf f
m 1 X m
己知 m、f, 己知 X、f , 采用基本平 采用加权算术 均数公式 平均数公式
己知 X、m , 采用加权调和 平均数公式
求解比值的平均数的方法
【例A】某季度某工业公司18个工业企业 产值计划完成情况如下:
STAT
第四章 数据的概括性度量
统计学家与数学家
一名统计学家遇到一位数学家,统计学家 调侃数学家说道:“你们不是说若X=Y且Y =Z,则X=Z吗!那么想必你若是喜欢一个 女孩,那么那个女孩喜欢的男孩你也会喜欢 喽!?” 数学家想也没事吧!因为它们平均的温度 不过是五十度而已!”
计划完成程度 组中值 (﹪) (﹪) 85 90以下 95 90~100 105 100~110 115 110以上 — 合计 企业数 计划产值 (个) (万元) 2 800 3 2500 10 17200 3 4400 18 24900
计算该公司该季度的平均计划完成程度。
计划完成 实际产值m 求解比值的平均数的方法 X 分析:
1 1 1 1 4 ⒉再求算术平均数: 2 4 6 8
⒊再求倒数:
1 1 1 1 4 2 4 6 8

第四章--数据的概括性度量

第四章--数据的概括性度量
平均增长速度等方面有很重要的作用。
计算公式
G

n
x 1

x2

xn
适用于特殊数据,变量值x一般为比率
9.97%
某企业最近4年产品销售收入的年增长 率分别为8%、7%、12%、13%,求该 企业这4年销售收入的年平均增长率?
众数、中位数和均值的关系
均值 中位数 众数 均值 = 中位数 = 众数
各变量值与中位数的离差绝对值之和最小。
中位数的位置
未分组数据 中位数的位置=(1+n)/2
分组数据 中位数的近似位置=n/2
数值型数据的中位数
(9个数据的实例)
【例1】 9个家庭的人均月生活费支出数据
原始数据: 1500 750 780 1080 850 960 2000 1250 1630
四口之家的年收入在23624美元以下即为贫困户。
2016年,美国家庭收入中位数增长3.2%,从2015 年的57230美元增至59039美元,创有记录以来新 高,超过1999年的前纪录58655美元。所有数字都 是经过通胀调整后的。
2017年底港府统计处发表《2016年中期人口统计》, 称本港人均居住面积中位数为161呎(约合15平方 米)
离散系数
(coefficient of variation)
① 标准差与其相应的均值之比 ② 对数据相对离散程度的测度 ③ 消除了数据水平高低和计量单位的影响 ④ 用于对不同组别数据离散程度的比较 ⑤ 计算公式为
Vs

s x
p97 利用前5对数据做分析
解:成年人的平均身高和身高标准差分别为
i1
fi
实例分析
按零件加工数分组

第四章 数据的概括性度量

第四章 数据的概括性度量

第四章 数据的概括性度量
4.2.3 数值型数据:方差和标准差 1、极差 一组数据的最大值与最小值之差称为极差,也称全距,用R表示。 R=Max-Min 极差是描述数据离散程度的最简单的测度值,计算简单,易于理解,但容易受极 端值的影响。由于极差只是利用了一组数据两端的信息,不能反映出中间数据的 分散情况,因而不能准确表述出数据的分散程度。 2、平均差 也称平均绝对离差,是各变量值与其平均数离差绝对值的平均数,用Md表示。 Md=(∑ ∣Xi-X ∣)/n
第四章 数据的概括性度量
MEDIAN函数用于计算给定数值的中值,即一组数值中居于中间的数值,其语法是 MEDIAN(number1,number2,…)。其中,参数number1,number2…为数组或对单元格 的引用,参数的个数介于1—255之间。 2、四分位数 四分位数、十分位数和百分位数分别是用3个点、9个点和99个点将数据4等分、10 等分和100等分后各分位点上的值。 四分位数也称为四分位点,是一组数据排序后处于25%和75%位置上的值。四分位 数通过3个点将全部数据等分为4部分,其中每部分包含25%的数据。中间的四分位 数就是中位数。
变异指标:一组数值之间的差异程度称为标志变动度。测定标志变动度大小的指 标叫做标致变异指标。
第四章 数据的概括性度量
变异指标的作用:
① 反映总体各单位变量值分布的均衡性。一般来说,标致变异指标数值越大,总 体各单位变量值分布的离散趋势越高,均衡性越低;反之,变量值分布的离散 趋势越低,均衡性就越高。
数据的概括性度量
第四章 数据的概括性度量
利用图表展示数据,可以对数据分布的形状和特征有一个大致的了解。但要全面 把握数据分布的特征,还需要找到反映数据分布特征的各个代表值。 数据分布特征可以从三个方面进行测度和描述: •分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度。 •分布的离散程度,反映各数据远离其中心值的趋势。 •分布的形状,反映数据分布的偏态和峰态。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例如:2011年国内生产总值同比增长9.2%,社会消费 品零售总额实际增长17.1%,全社会固定资产投资比 上年增长23.8%等。
2013年8月9日/下午6时54分
《统计学》
第4章 数据的概括性度量
4.2 比较度量
(二)相对指标的作用 首先,相对指标可以综合反映现象的相互关系、内部 结构、实现的程度、强度和速度等,从而说明总量指标不 能充分表达的问题。 其次,相对指标可以使某些利用总量指标不能直接进 行对比的社会经济现象,取得可以比较的基础。
2013年8月9日/下午6时54分
《统计学》
第4章 数据的概括性度量
4.2 比较度量
2、计划数为相对数 当计划任务数为相对数,而且以提高(或降低)百 分数表示时,则不能以实际提高(或降低)百分数与计 划提高(或降低)百分数直接对比,应在原有基数100% 的基础上提高(或降低),才能对比。其计算公式为:
实际达到的百分数 计划完成相对数(%) 100% 计划规定的百分数

1+实际提高(或降低)的百分数 1+计划提高(或降低)的百分数
2013年8月9日/下午6时54分
《统计学》
第4章 数据的概括性度量
4.2 比较度量
例1 某企业产量计划提高10%,实际提高15%,则:
1+15% 产量计划完成相对数 100% 104.55% 1+10%
例2 某企业甲种产品单位成本计划降低5%,实际成本
降低3%,则:
1-3% 单位成本计划完成相对数 100% 102.11% 1-5%
2013年8月9日/下午6时54分
《统计学》
第4章 数据的概括性度量
4.2 比较度量
3、计划数为平均数 当计划任务数为平均数时,计划完成程度的计算公 式为:
第4章 数据的概括性度量
4.2 比较度量
表4-1 我国国内生产总值构成变化表(%) 年份 1978 1980 1985 1990 1995 2000 2005 国内生产总值 第一产业 第二产业 第三产业 100 100 100 100 100 100 100 28.2 30.2 28.4 27.1 19.9 15.1 12.5 47.9 48.2 42.9 41.3 47.2 45.9 47.5 23.9 21.6 28.7 31.6 32.9 39 40
第4章 数据的概括性度量
4.2 比较度量
(二)结构相对数 结构相对数是表示总体内部各组成部分在总体中所
占比重的相对指标,也称比重相对数,一般用百分数表 示。其数值一般介于0与100之间。计算公式为:
结构相对数(%) 总体中某一部分数值 100% 总体全部数值
2013年8月9日/下午6时54分
《统计学》
《统计学》
第4章 数据的概括性度量
4.1 总规模度量
4.1.1 总量指标概述
(一)总量指标的概念 总量指标是反映社会经济现象在一定时间、地点
条件下总规模或总水平的统计指标。总量指标通常是 用绝对数来表示的,所以也称为绝对指标或绝对数。
例 如 : 2011 年 我 国 财 政 收 入 103740 亿 元 , 财 政 支 出 108930亿元,财政赤字5190亿元。
2013年8月9日/下午6时54分
从GDP总量来看,美国是中国的2.55倍,中国和日本相 当;但从人均GDP看,美国是中国的11倍,日本是中国 的9.9倍。
2013年8月9日/下午6时54分
《统计学》
第4章 数据的概括性度量
4.2 比较度量
(五)动态相对数 动态相对数又称发展速度,它是把同一现象在不同 时间上的指标数值进行对比的比值,用以说明现象发展 变化的方向和程度。通常用百分比表示,也可用倍数或 翻番数表示。其计算公式为:
划完成数对比求得计划完成程度指标。计算公式为:
实际完成数 计划完成相对数 100% 计划完成数
2013年8月9日/下午6时54分
《统计学》
第4章 数据的概括性度量
4.2 比较度量
中长期计划完成情况检查。根据计划指标的性质不
同,分为水平法和累计法两种。
水平法,适用于反映生产能力的经济指标,以计划 期末(即最后一年)应达到的水平为对象考核的。计算 公式为:
学习目标
◎了解总量指标和相对指标的含义和计算方法; ◎掌握集中趋势各测度值的计算方法、特点及应 用场合; ◎掌握离散程度各测度值的计算方法、特点及应 用场合; ◎了解偏态与峰度的测度方法; ◎会用Excel计算描述统计量并进行分析。
2013年8月9日/下午6时54分
第4章 数据的概括性度量
4.1 总规模度量
计划完成相对数 实际完成数 100% 计划完成数
2013年8月9日/下午6时54分
《统计学》
第4章 数据的概括性度量
4.2 比较度量
1、计划数为绝对数 当计划任务数为绝对数即总量指标时,它一般适合 于考核社会经济现象的规模或水平的计划完成情况。检 查计划完成情况一般分为短期计划和中长期计划完成情 况两种检查。 短期计划完成情况检查。可直接用实际完成数与计
按其反映的时间状况不同可分为: 时期指标——反映现象在某一时期发展过程的总数 量。(可连续计数,是累计结果,与时间长短有关)
时点指标——反映现象在某一时刻的状况。 (间断计 数,不能累计,与时间间隔无关)
2013年8月9日/下午6时54分
《统计学》
第4章 数据的概括性度量
4.1 总规模度量
按其采用的计量单位不同可分为: 实物指标——以实物单位计量的总量指标,直接反 映现象的使用价值和经济内容,能够具体表现事物的规 模或水平。 价值指标——以货币为单位计量的总量指标,反映 社会经济现象价值量。 劳动指标——以劳动单位计量的总量指标,是由劳 动和工作时间组合而成的复合单位。
某一现象报告期数值 动态相对数 100% 同一现象基期数值
2013年8月9日/下午6时54分
《统计学》
第4章 数据的概括性度量
4.2 比较度量
(六)强度相对数 强度相对数是两个性质不同但又相互联系的总量指 标进行对比的比值,可以反映现象的强度、密度或普遍 程度。计算公式为:
某一总量指标的数值 强度相对数 另一有联系但性质不同的总量指标数值
计划完成相对数 计划期末(最后一年)实际达到的水平 100% 计划规定期末应达到的水平
2013年8月9日/下午6时54分
《统计学》度量
累积法,是以计划期内各年计划数量的累计总和
为对象考核的。适用于检查计划期内构成国民财产存 量的经济指标。计算公式为:
计划完成相对数 计划期间实际累计完成数 100% 计划期间规定的累计数
《统计学》
第4章 数据的概括性度量
4.2 比较度量
(四)应用相对指标应遵循的原则 可比性原则 正确选择对比基数的原则 多种相对指数结合运用的原则 相对指标与总量指标结合运用的原则
2013年8月9日/下午6时54分
《统计学》
第4章 数据的概括性度量
4.2 比较度量
4.2.2 相对指标的种类及其计算方法
2006
100
11.7
48.9
39.4
2013年8月9日/下午6时54分
《统计学》
第4章 数据的概括性度量
4.2 比较度量
(三)比例相对数 比例相对数是反映一个统计总体内部各个组成部分 之间数量对比关系的相对指标,常用系数或倍数表示。 计算公式为:
总体中某一部分数值 比例相对数 总体中另一部分数值
相对指标
计划完成 相对数
结构 相对数
比例 相对数
比较 相对数
动态 相对数
强度 相对数
2013年8月9日/下午6时54分
《统计学》
第4章 数据的概括性度量
4.2 比较度量
(一)计划完成相对数 计划完成相对数也称计划完成百分比,它是现象在 某一时期的实际完成数与计划任务数的比值。它表明某 一现象在一定时间计划的完成程度,用来检查、监督计 划的执行情况,通常用百分数(%)表示。其计算公式为:
《统计学》
第4章 数据的概括性度量
4.1 总规模度量
(三)总量指标应用中应注意的问题 首先,必须注意现象的同质性。 其次,明确总量指标的含义、范围和计算方法。 最后,要使用统一的计量单位。
2013年8月9日/下午6时54分
《统计学》
第4章 数据的概括性度量
4.1 总规模度量
4.1.2 总量指标的种类
2013年8月9日/下午6时54分
《统计学》第4章 数据的概括性度量
4.4 离散程度的度量 4.4.1 异众比率 4.4.2 四分位差、极差和平均差
4.4.3 方差和标准差
4.4.4 相对离散程度:离散系数 4.5 偏态与峰度的度量 4.5.1 偏态及其测度 4.5.2 峰度的度量
2013年8月9日/下午6时54分
《统计学》
第4章 数据的概括性度量
《统计学》第4章 数据的概括性度量
4.1 总规模度量
4.1.1 总量指标概述
4.1.2 总量指标的种类 4.2 比较度量 4.2.1 相对指标概述 4.2.2 相对指标的种类及其计算方法 4.3 集中趋势的度量 4.3.1 数值平均数 4.3.2 位置平均数 4.3.3 各种平均数之间的关系
某地区(单位)某期某类指标数值 比较相对数 另一地区(单位)同期同类指标数值
2013年8月9日/下午6时54分
《统计学》
第4章 数据的概括性度量
4.2 比较度量
例4 2010年GDP美国是14624184,中国是5745133,日
本是5390897;人均GDP美国是47132,日本是42325, 中国式4283。
2013年8月9日/下午6时54分
《统计学》
相关文档
最新文档