精选(贾俊平 统计学 第五版)第4章数据的概括性度量资料

合集下载

统计学第五版(贾俊平)课后习题答案 (1)

统计学第五版(贾俊平)课后习题答案 (1)

中位数位置
30 1 2
15.5 , M e
272
2
273
272.5 。
(2) QL 位置
30 4
7.5
, QL
258 2
261
259.5 。
QU 位置
3 30 4
22 .5 , QU
284 291 287.5 。 2
(3) s
n
(xi x)2
i 1
n 1
13002.7 21.17 。 30 1
4.2 172.1
0.024 ;
幼儿组身高的离散系数: vs
2.5 71.3
0.035 ;
由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离
散程度相对较大。
4,11(1)应该从平均数和标准差两个方面进行评价。在对各种方法的离散程度进
行比较时,应该采用离散系数。
(2)下表给出了用 Excel 计算一些主要描述统计量。
550
18
9900
600 以上
650
11
7150
合计

120
k
x
Mi fi
i 1
51200
426.67 。
n
120
51200
标准差计算过程见下表:
按利润额分组 组中值 M i 企业数 fi (M i x)2 (M i x)2 fi
200~300
250
19
31212.3
593033.5
300~400
2 (25 1)
0.77 。
(5)分析:从众数、中位数和平均数来看,网民年龄在 23~24 岁的人数占多数。 由于标准差较大,说明网民年龄之间有较大差异。从偏态系数来看,年龄分布为右

统计学第五版课后答案(贾俊平)

统计学第五版课后答案(贾俊平)

第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。

(2)根据定义公式计算四分位数。

(3)计算销售量的标准差。

(4)说明汽车销售量分布的特征。

解:Statistics10Missing 0Mean 9.60Median 10.00Mode 10Std. Deviation 4.169Percentiles 25 6.2550 10.0075单位:周岁19 15 29 25 2423 21 38 22 1830 20 19 19 1623 27 22 34 2441 20 31 17 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄(2)根据定义公式计算四分位数。

Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。

(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652(4)计算偏态系数和峰态系数:Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。

如需看清楚分布形态,需要进行分组。

1、确定组数:()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图:客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。

精选人大版,贾俊平,第五版,统计学第4章数据的概括性度量资料

精选人大版,贾俊平,第五版,统计学第4章数据的概括性度量资料

R
. =
最高组上限
-
最低组下限
2. 平均差
1. 离散程度的测度值之一
2. 各变量值与其均值离差绝对值的平均数
3. 能全面反映一组数据的离散程度
4. 数学性质较差,实际中应用较少
5. 计算公式为
未分组数据 组距分组数据
N
Xi X
M D i1 N K X i X Fi
M D i1 K
QD = QU - QL =3–2 =1
4.2.3 数值型数据:方差和标准差 1.极差
1. 一组数据的最大值与最小值之差
2. 离散程度的最简单测度值
3. 易受极端值影响
4. 未考虑数据的分布 5. 计算公式为
7 8 9 10
7 8 9 10
未分组数据 R = max(Xi) - min(Xi)
组距分组数据
QU位置=3×50/4=37.5
350 30
QU 125
4 10
5 128.75(个)
4.1.3 数值型数据:平均值 1.集中趋势的测度值之一 2.最常用的测度值 3.一组数据的均衡点所在 4.易受极端值的影响 5.用于数值型数据,不能用于定类数据和定
序数据
均值(计算公式)
M0
125
(14
14 10 8) (14
10)
5
123(个)
4.1.2 顺序数据:中位数和分位数 1.中位数
集中趋势的测度值之一 排序后处于中间位置上的值 不受极端值的影响 主要用于定序数据,也可用数值型数据,但不能
用于定类数据
各变量值与中位数的离差绝对值之和最小,即
25% 25% 25% 25%

贾俊平《统计学》考研真题(含复试)与典型习题详解(数据的概括性度量)【圣才出品】

贾俊平《统计学》考研真题(含复试)与典型习题详解(数据的概括性度量)【圣才出品】

2.统计学期中考试非常简单,为了评估简单程度,教师记录了 9 名学生交上考试试卷
的时间如下(分钟)
33 29
45 60 42 19 52 38 36[东北财经大学
2012 研]
(1)这些数据的极差为( )。
A.3.00
B.-3.00
C.41.00
D.-41.00
【答案】C
【解析】数据按从小到大排序结果如下:
A.0.38
B.0.40
C.0.54
D.2.48
【答案】A
【解析】离散系数也称为变异系数,它是一组数据的标准差与其相应的平均数之比。其
计算公式为: vs
s x
。得到 vs
22.85 0.38 。 12.45
9.已知某工厂生产的某零件的平均厚度是 2 厘米,标准差是 0.25 厘米。如果已知该 厂生产的零件厚度为正态分布,可以判断厚度在 1.5 厘米到 2.5 厘米之间的零件大约占 ( )。[浙江工商大学 2011 研]
圣才电子书 十万种考研考证电子书、题库视频学习平台

5.随机变量 X 的方差为 2,随机变量 Y=2X,那么 y 的方差是( )。[中央财经大学 2011 研]
A.1 B.2 C.4 D.8 【答案】D
【解析】Var(cX ) c2Var(X ) 22 2 8
7.设 X1,X2,…,X n 为随机样本,则哪个统计量能较好地反映样本值的分散程度( )。
[中山大学 2012 研] A.样本平均 B.样本中位数 C.样子书

【答案】C
十万种考研考证电子书、题库视频学习平台
【解析】集中趋势是指 一 组 数 据 向 某 一 中 心 值 靠 拢 的 程 度 ,它 反 映 了 一 组 数 据 中 心

统计学第四章习题答案 贾俊平

统计学第四章习题答案 贾俊平

第四章 统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下: 2 4 7 10 10 10 12 12 14 15 要求:(1)计算汽车销售量的众数、中位数与平均数。

(2)根据定义公式计算四分位数。

(3)计算销售量的标准差。

(4)说明汽车销售量分布的特征。

解:Statistics汽车销售数量 10 Missing0 Mean 9、60 Median 10、00Mode10 Std 、 Deviation 4、169 Percentiles25 6、25 50 10、00 75单位:周岁19 15 29 25 24 23 21 38 22 18 30 20 19 19 16 23 27 22 34 24 41 20 3117 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布与累计频数分布:网络用户的年龄(2)根据定义公式计算四分位数。

Q1位置=25/4=6、25,因此Q1=19,Q3位置=3×25/4=18、75,因此Q3=27,或者,由于25与27都只有一个,因此Q3也可等于25+0、75×2=26、5。

(3)计算平均数与标准差;Mean=24、00;Std、Deviation=6、652(4)计算偏态系数与峰态系数:Skewness=1、080;Kurtosis=0、773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6、652、呈右偏分布。

如需瞧清楚分布形态,需要进行分组。

1、确定组数:()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4、3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图::一种就是所有颐客都进入一个等待队列:另—种就是顾客在三千业务窗口处列队3排等待。

统计学(第五版)贾俊平-课后思考题和练习题答案(完整版)

统计学(第五版)贾俊平-课后思考题和练习题答案(完整版)

统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版)第一部分思考题第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。

1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。

推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。

1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。

它也是有类别的,但这些类别是有序的。

(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。

统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。

实验数据:在实验中控制实验对象而收集到的数据。

统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。

时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。

1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。

1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。

变量也可以分为随机变量和非随机变量。

经验变量和理论变量。

1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。

【单位】统计学贾俊平第五版分章习题及答案

【关键字】单位《统计学》分章习题及答案(贾俊平,第五版)主编:杨群目录习题部分第1章导论一、单项选择题1.指出下面的数据哪一个属于分类数据()A.年龄B.工资C.汽车产量D.购买商品的支付方式(现金、信用卡、支票)2.指出下面的数据哪一个属于顺序数据()A.年龄B.工资C.汽车产量D.员工对企业某项制度改革措施的态度(赞成、中立、反对)3.某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是()A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的人均收入4.了解居民的消费支出情况,则()A.居民的消费支出情况是总体B.所有居民是总体C.居民的消费支出情况是总体单位D.所有居民是总体单位5.统计学研究的基本特点是()A.从数量上认识总体单位的特征和规律B.从数量上认识总体的特征和规律C.从性质上认识总体单位的特征和规律D.从性质上认识总体的特征和规律6.一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。

这里的“月收入”是()A.分类变量B.顺序变量C.数值型变量D.离散变量7.要反映我国工业企业的整体业绩水平,总体单位是()A.我国每一家工业企业B.我国所有工业企业C.我国工业企业总数D.我国工业企业的利润总额8.一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均消费是200元,他们选择在网上购物的主要原因是“价格便宜”。

这里的参数是()A.1000个消费者B.所有在网上购物的消费者C.所有在网上购物的消费者的平均消费额D.1000个消费者的平均消费额9.一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2006年城镇家庭的人均收入数据属于()A.分类数据B.顺序数据C.截面数据D.时间序列数据10.一家公司的人力资源部主管需要研究公司雇员的饮食习惯,改善公司餐厅的现状。

统计学(贾俊平)第五版课后习题答案(完整版)

统计学(第五版)贾俊平课后习题答案(完整版)第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。

1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。

推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。

1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。

它也是有类别的,但这些类别是有序的。

(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。

统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。

实验数据:在实验中控制实验对象而收集到的数据。

统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。

时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。

1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。

1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。

变量也可以分为随机变量和非随机变量。

经验变量和理论变量。

1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。

(完整版)统计学贾俊平考研知识点总结

统计学重点笔记第一章导论一、比较描述统计和推断统计:数据分析是通过统计方法研究数据,其所用的方法可分为描述统计和推断统计。

(1)描述性统计:研究一组数据的组织、整理和描述的统计学分支,是社会科学实证研究中最常用的方法,也是统计分析中必不可少的一步。

内容包括取得研究所需要的数据、用图表形式对数据进行加工处理和显示,进而通过综合、概括与分析,得出反映所研究现象的一般性特征。

(2)推断统计学:是研究如何利用样本数据对总体的数量特征进行推断的统计学分支。

研究者所关心的是总体的某些特征,但许多总体太大,无法对每个个体进行测量,有时我们得到的数据往往需要破坏性试验,这就需要抽取部分个体即样本进行测量,然后根据样本数据对所研究的总体特征进行推断,这就是推断统计所要解决的问题。

其内容包括抽样分布理论,参数估计,假设检验,方差分析,回归分析,时间序列分析等等。

(3)两者的关系:描述统计是基础,推断统计是主体二、比较分类数据、顺序数据和数值型数据:根据所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。

(1)分类数据是只能归于某一类别的非数字型数据。

它是对事物进行分类的结果,数据表现为类别,是用文字来表达的,它是由分类尺度计量形成的。

(2)顺序数量是只能归于某一有序类别的非数字型数据。

也是对事物进行分类的结果,但这些类别是有顺序的,它是由顺序尺度计量形成的。

(3)数值型数据是按数字尺度测量的观察值。

其结果表现为具体的数值,现实中我们所处理的大多数都是数值型数据。

总之,分类数据和顺序数据说明的是事物的本质特征,通常是用文字来表达的,其结果均表现为类别,因而也统称为定型数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此可称为定量数据或数量数据。

三、比较总体、样本、参数、统计量和变量:(1)总体是包含所研究的全部个体的集合。

通常是我们所关心的一些个体组成,如由多个企业所构成的集合,多个居民户所构成的集合。

贾俊平《统计学》(第5版)章节题库-第4章 数据的概括性度量【圣才出品】

第4章 数据的概括性度量一、单项选择题1.一组数据中出现频数最多的变量值称为( )。

A.众数B.中位数C.四分位数D.平均数【答案】A【解析】众数是一组数据中出现次数最多的变量值。

众数主要用于测度分类数据的集中趋势。

一般情况下,只有在数据量较大的情况下,众数才有意义。

2.下列关于众数的叙述,不正确的是( )。

A.一组数据可能存在多个众数B.众数主要适用于分类数据C.一组数据的众数是唯一的D.众数不受极端值的影响【答案】C【解析】众数是一组数据中出现次数最多的变量值。

众数主要用于测度分类数据的集中趋势,当然也适用于作为顺序数据以及数值型数据集中趋势的测度值。

一般情况下,只有在数据量较大的情况下,众数才有意义。

一组数据可能存在多个众数,由于众数是一个位置代表值,因此它不受数据中极端值的影响。

3.一组数据排序后处于中间位置上的变量值称为( )。

A.众数B.中位数C.四分位数D.平均数【答案】B【解析】中位数是一组数据排序后处于中间位置上的变量值。

中位数将全部数据等分成两部分,每部分包含50%的数据,一部分数据比中位数大,另一部分则比中位数小。

4.一组数据排序后处于25%和75%位置上的值称为( )。

A.众数B.中位数C.四分位数D.平均数【答案】C【解析】四分位数也称四分位点,它是一组数据排序后处于25%和75%位置上的值。

四分位数是通过3个点将全部数据等分为4部分,其中每部分包含25%的数据。

5.非众数组的频数占总频数的比例称为( )。

A.异众比率B.离散系数C.平均差D.标准差【答案】A【解析】异众比率是指非众数组的频数占总频数的比例。

主要用于衡量众数对一组数据的代表程度。

6.四分位差是( )。

A.上四分位数减下四分位数的结果B.下四分位数减上四分位数的结果C.下四分位数加上四分位数D.四分位数与上四分位数的中间值【答案】A【解析】四分位差也称内距或四分间距,它是上四分位数与下四分位数之差。

四分位差反映了中间50%数据的离散程度,其数值越小,说明中间的数据越集中;其数值越大,说明中间的数据越分散。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计学
STATISTICS (第五版)
数值型数据:平均数
4 - 20
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
平均数
(mean)
1. 也称为均值
2. 集中趋势的最常用测度值
3. 一组数据的均衡点所在
x
3. 体现了数据的必然性特征
4. 易受极端值的影响
5. 有简单平均数和加权平均数之分
统计学
STATISTICS (第五版)
学习目标
1. 集中趋势各测度值的计算方法 2. 集中趋势各测度值的特点及应用场合 3. 离散程度各测度值的计算方法 4. 离散程度各测度值的特点及应用场合 5. 偏态与峰态的测度方法 6. 用Excel计算描述统计量并进行分析
4-3
作者:贾俊平,中国人民大学统计学院
4.2 离散程度的度量
4.2.1 分类数据:异众比率 4.2.2 顺序数据:四分位差 4.2.3 数值型数据:方差和标准差 4.2.4 相对离散程度:离散系数
4 - 30
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
离中趋势
1. 数据分布的另一个重要特征 2. 反映各变量值远离其中心值的程度(离散程度) 3. 从另一个侧面说明了集中趋势测度值的代表程度 4. 不同类型的数据有不同的离散程度测度值
几何平均:
G 4 104.5% 102.1% 125.5% 101.9% 1
8.0787%
算术平均:
G 4.5% 2.1% 25.5% 1.9% 4 8.5%
4 - 26
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
众数、中位数和平均数的比较
中位数 1080
4 - 15
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
数值型数据的中位数
(10个数据的算例)
【例】:10个家庭的人均月收入数据
排 序: 660 750 780 850 960 1080 1250 1500 1630 2000
位 置: 1 2 3 4 5 6 7 8 9 10
非常不满意
24
8
不满意
108
36
一般
93
31
满意
45
15
非常满意
30
10
合计
300
100.0
解:这里的数据为顺 序数据。变量为“回 答类别”
甲城市中对住房 表示不满意的户数最 多 , 为 108 户 , 因 此 众数为“不满意”这 一类别,即
Mo=不满意
4 - 10
作者:贾俊平,中国人民大学统计学院
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
众数
(不惟一性)
无众数 原始数据:
10 5 9 12 6 8
一个众数 原始数据:
659855
多于一个众数 原始数据: 25 28 28 36 42 42
4-8
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
统计学
STATISTICS (第五版)
顺序数据:中位数和分位数
4 - 11
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
中位数
(median)
1. 排序后处于中间位置上的值
50%
Me
2. 不受极端值的影响
50%
3. 主要用于顺序数据,也可用数值型数据,但不能 用于分类数据
统计学
STATISTICS (第五版)
加权平均数
(例题分析)
某电脑公司销售量数据分组表
按销售量分组
140~150 150~160 160~170 170~180 180~190 190~200 200~210 210~220 220~230 230~240
合计
组中值(Mi) 145 155 165 175 185 195 205 215 225 235
位 置: 1 2 3 4 5 6 7 8 9


QL 位置

9 4

2.25
QU 位置

39 4

6.75
QL 780 (850 780) 0.25 QU 1250 (1500 1250) 0.75
797.5
1437.5
4 - 19
作者:贾俊平,中国人民大学统计学院
6. 根据总体数据计算的,称为平均数,记为;根据 样本数据计算的,称为样本平均数,记为x
4 - 21
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
简单平均数
(Simple mean)
设一组数据为:x1 ,x2 ,… ,xn (总体数据xN)
样本平均数
n
x
x1 x2 xn
分类数据的众数
(例题分析)
不同品牌饮料的频数分布
饮料品牌
频数 比例 百分比 (%)
果汁 矿泉水 绿茶 其他 碳酸饮料
6 0.12 12 10 0.20 20 11 0.22 22 8 0.16 16 15 0.30 30
合计
50
1
100
4-9
解:这里的变量为“饮 料品牌”,这是个分类 变量,不同类型的饮料 就是变量值
(第五版)
1. 众数
不受极端值影响
具有不惟一性
数据分布偏斜程度较大且有明显峰值时应用
2. 中位数
不受极端值影响
数据分布偏斜程度较大时应用
3. 平均数
易受极端值影响
数学性质优良
数据对称分布或接近对称分布时应用
4 - 29
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
4 - 27
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS
众数、中位数和平均数的关系
(第五版)
均值 中位数 众数 均值 = 中位数 = 众数
众数 中位数 均值
左偏分布
对称分布
右偏分布
4 - 28
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS
众数、中位数、平均数的特点和应用
4. 各变量值与中位数的离差绝对值之和最小,即
n
xi M e min
4 - 12
i 1
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
中位数
(位置和数值的确定)
位置确定 中位数位置 n 1 2
数值确定
4 - 13
Me


x
n1 2

STATISTICS (第五版)
几何平均数
(geometric mean)
1. n 个变量值乘积的 n 次方根
2. 适用于对比率数据的平均
3. 主要用于计算平均增长率
4. 计算公式为
n
Gm n x1 x2 xn n xi
i1
5. 可看作是平均数的一种变形
n
lg Gm

1 (lg n
样本加权平均
k
x M1 f1 M 2 f2 M k fk

Mi fi
i 1
f1 f2 ห้องสมุดไป่ตู้ fk
n
总体加权平均
k

M1 f1 M 2 f2 M k fk

Mi fi
i 1
f1 f2 fk
N
4 - 23
作者:贾俊平,中国人民大学统计学院

频数(fi) 4 9
16 27 20 17 10
8 4 5
120
4 - 24
Mi fi 580 1395 2640 4725 3700 3315 2050 1720 900 1175
22200

k
Mi fi
x i1 n
22200 185 120
作者:贾俊平,中国人民大学统计学院
统计学
x1 lg x2
lg xn )
lg xi
i 1
n
4 - 25
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
几何平均数
(例题分析)
【例】一位投资者购持有一种股票,在2000、2001、 2002和2003年收益率分别为4.5%、2.1%、25.5%、 1.9%。计算该投资者在这四年内的平均收益率

xi
i1
n
n
总体平均数
N

x1 x2 xN

xi
i 1
N
N
4 - 22
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
加权平均数
(Weighted mean)
设各组的组中值为:M1 ,M2 ,… ,Mk 相应的频数为: f1 , f2 ,… ,fk
1. 一组数据向其中心值靠拢的倾向和程度
2. 测度集中趋势就是寻找数据水平的代表值或中心值
3. 不同类型的数据用不同的集中趋势测度值
4. 低层次数据的测度值适用于高层次的测量数据,但高 层次数据的测度值并不适用于低层次的测量数据
4-5
作者:贾俊平,中国人民大学统计学院
相关文档
最新文档