第4章数据分布特征的测度(修改版)
统计学第四章课后习题答案

第四章一.思考题1、一组数据的分布特征可以从哪几个方面进行测度?答:可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。
2、怎样理解平均数在统计学中的地位?答:平均数在统计学中具有重要的地位,它是进行统计分析和统计推断的基础。
从统计学思想上看,平均数是一组数据的重心所在,是数据误差相互抵消后的必然结果。
3、简述四分位数的计算方法。
答:四分位数是一组数据排序后处于25%和75%位子上的值。
四分位数是通过3个点将全部数据等分成4分,其中每部分包含25%的数据。
中间的四分位数就是中位数,因此通常所说的四分位数是指处在25%位置上的数值和处在75%位置上的数值。
它是根据为分组数据计算四分位数时,首先对数据进行排序,然后确定四分位数所在的位置,该位置上的数据就是四分位数。
4、对于比率数据的平均数为什么采用几何平均?答:几何平均数是适用于特殊数据的一种平均数,主要适用于计算平均比率。
当所掌握的变量值本身是比率的形式时,采用几何平均法计算平均比率更为合理。
5、简述众数、中位数、平均数的特点和应用场合。
答:众数是数据中出现次数次数最多的变量值。
主要应用于分类数据。
中位数是一组数据排序后处于中间位置的变量值,其适用于顺序数据。
平均数也称均值,它是一组数据相加后除以数据个数的结果,是集中去世的主要测量值,它适用于数值型数据。
6、简述异众比率、四分位差、方差、标准差的使用场合。
答:异众比率主要适合测度分类数据的离散程度,对于顺序数据以及数值型数据也可以计算异众比率。
四分位差主要用于测度顺序数据的离散程度。
方差和标准差适用于测度数值型数据的离散程度。
7、标准分数有哪些用途?答:首先是比较不同单位和不同质数据的位置。
其次是和正态分布结合起来,求得概率和标准分值之间的对应关系。
还有就是在假设检验和估计中应用。
第4章 数据分布特征的度量(1).ppt

2020年11月12日/下午11时15分
《统计学教程》
第4章 数据分布特征的度量
4.1 集中趋势的度量
例4.2 利用第三章中例3.1中某学期某班35名学生统计学考试成绩的 原始数据。
要求 试计算计算该班35名学生统计学考试成绩的众数。 解 将该原始数据排序之后,得到有序数据如下 52,56,62,64,65,69,70,74,75,75,76,78,78,79,79, 81,82,82,83,84,84,84,84,86,87,87,88,89,89,90, 91,91,92,96,98
2020年11月12日/下午11时15分
《统计学教程》
第4章 数据分布特征的度量
4.1 集中趋势的度量
2020年11月12日/下午11时15分
《统计学教程》
第4章 数据分布特征的度量
4.1 集中趋势的度量
MO
2020年11月12日/下午11时15分
《统计学教程》
第4章 数据分布特征的度量
4.1 集中趋势的度量
4.1 集中趋势的度量
原始数据经过分组整理所形成的频数分布,直观和概略地反映出数据 分布的基本特征。频数分布属于对数据分布特征的初步描述,缺乏对数 据分布特征的综合度量,若需要深入地表述数据分布特征的具体特征和 内在联系,还应对数据分布特征进行综合性的度量。
数据分布特征的度量包括三个方面的内容,一是数据分布的集中趋势, 反映总体中各个单位的数值水平向其聚集,或者集中的中心数值;二是 数据分布的离散趋势,反映总体中各个单位的数值水平偏离中心数值的 综合程度;三是数据分布的偏态和峰度,反映各个总体单位的数值水平 的分布形态是对称或偏倚,平坦或尖耸的具体数值。
4.1.1众数 众数(Mode)是一组数据中频数最大的变量值,直观地反映了数据的
统计学习题答案 4~9章

统计学
第4章 数据分布特征的测度
4.1 一家汽车零售店的10名销售人员5月份销售的汽 车数量(单位:台)排序后如下: 2 4 7 10 10 10 12 12 14 15 要求: (1)计算汽车销售量的众数、中位数和平均数; M 0 10,M e 10,x 9.6, (2)根据定义公式计算四分位数;QL 5.5,QU 12, (3)计算销售量的标准差;
n ( xi x )3 1.08
(4)计算偏态系数和峰态系数;
(n 1)(n 2) s 4 2 2 n(n 1) ( xi x ) 3[ ( xi x ) ] (n 1)
3
(n 1)(n 2)(n 3)s
4
0.77
(5)对网民年龄的分布特征进行综合分析。 样本数据的均值为24岁,但标准差较大,说明网民 年龄之间差异较大.
0
30
60
经管类 核心课程
统计学
第3章 数据的整理与显示
3.1 为评价家电行业售后服务的质量,随机抽取了由 100家庭构成的一个样本。服务质量的等级分别 表示为:A.好;B.较好;C.一般;D.较差;E.差。 调查结果如下表:
B E C C A D C B A E
D
A B C D B
A
D A B A E
SK 0.203,K 0.688
600以上
合计
11
120
(2) 计算分布的偏态系数和峰态系数。
经管类 核心课程
统计学
第4章 数据分布特征的测度
4.7 为研究少年儿童的成长发育状况,某研究所的 一位调查人员在某城市抽取100名7~17岁的少 年儿童作为样本,另一位调查人员则抽取了 1000名7~17岁的少年儿童作为样本。请回答下 面的问题,并解释其原因。 (1)哪一位调查研究人员在其所抽取的样本中得到的 少年儿童的平均身高较大?或者这两组样本的 平均身高相同? (2)哪一位调查研究人员在其所抽取的样本中得到的 少年儿童身高的标准差较大?或者这两组样本 的标准差相同?
第四章 数据分布特征度量

220-230 230-240 合计
4 5 120
115 120 -
9 5 -
二、定序数据:中位数/四分位数
2. 四分位数(Quartile) 一组数据排序后处于25%、75%位臵上的变量值
25% 25% 25% 25%
QL
QM
QU
四分位数的计算 数据排序 确定四分位数位臵(n/4、 3n/4 ) 确定该位臵上的数值(QL、QU)
1. 极差(全距) 一组数据的最大值与最小值之差 特点 离散程度的最简单测度值 易受极端值影响 未考虑数据的分布
7 8 9 10
计算公式: R = max(xi) - min(xi)
7 8 9 10
2. 平均差(平均绝对离差 ) 各变量值与其平均数离差绝对值的平均数 计算公式 n xi x 简单平均差
可看作是均值的一种变形
X
i 1
n i 1
n
i
1 lg G (lg x1 lg x2 lg xn ) n
lg x
n
i
几何平均法的含义 从最初水平 a0 出发,每期按平均发展速度发展, 经过 n 期后将达到最末期水平 an 只与序列的最初观察值 a0 和最末观察值 an 有关
§4.2
离散趋势的度量
离散趋势 不同类型的数据有不同的 离散程度测度指标 常用测度指标: 异众比率 四分位差 方差和标准差 离散系数
§4.2 离散趋势的度量
一、定类数据:异众比率
非众数组的频数占总频数的比例 特点 用来衡量众数对一组数据的代表程度 主要用于定类数据 计算公式 k fi f m f Vr i 1 k 1 k m fi fi
统计学-数据分布特征

2
描述集中趋势的统计
一、平均数
平均数:
集中趋势的测度值之一
最常用的测度值
一组数据的均衡点所在 易受极端值的影响
用于数值型数据,不能用于品质型数据
4
一、平均数
5
平均数的计算公式
6
二、中位数和分位数
(一)中位数 集中趋势的测度值之一 排序后处于中间位置上的值 不受极端值的影响
14
15
例:某城市居民关注广告类型的频数分布
16
例:甲城市家庭对住房状况评价的分布频数
17
四、各度量值的比较
18
四、各度量值的比较
19
四、各度量值的比较
20
各度量值适用的数据类型
21
4.2离散程度的度量
22
4.2离散程度的度量
离散程度 数据分布的另一个重要特征 离中趋势的各测度值是对数据离散程度所作的描述 反映各变量值远离其中心值的程度,因此也称为离 中趋势 从另一个侧面说明了集中趋势测度值的代表程度 不同类型的数据有不同的离散程度测度值
50
51
一、偏态及其测度
52
二、峰态及其测度
53
例:
54
55
56
57
用Excel计算描述统计量
58
用Excel计算描述统计量 72页习题2
59
60
61
62
63
作业1:
64
65
作业2:
66
答案:
67
68
对某一个值在一组数据中相对位置的度量 可用于判断一组数据是否有离群点 用于对变量的标准化处理
40
标准分数的性质
41
例:
第四章 数据分布特征的测度

第四章数据分布特征的测度教学目的与要求:统计平均指标是表明总体数量特征的一个重要指标,它是将总体各单位标志值的差异抽象化,反映总体各单位标志值的一般水平,揭示总体分布的集中趋势。
变异指标是反映总体各单位标志值的差异程度,揭示总体分布离中趋势的又一重要数量特征指标。
通过本章的学习,要求理解统计平均指标的意义和作用;掌握各种统计平均指标的特点、应用条件、应用范围和计算方法;理解变异指标的意义和作用;掌握各种变异指标的性质和计算方法;能运用变异指标衡量平均数代表性的大小。
教学重点与难点:重点为各种平均指标和变异指标的概念、特点、应用条件、应用范围和计算方法。
难点是不同条件下平均指标和变异指标的计算。
统计数据经过整理和显示后,对数据分布的形状和特征就可以有一个大致的了解。
为进一步掌握数据分布的特征和规律,进行更深入的分析,还需要找到反映数据分布特征的各个代表值。
对一组数据分布的特征,可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢和聚集的程度;二是分布的离散程度,反映各数据远离中心值的趋势;三是分布偏态和峰态,反映数据分布的形状。
这三个方面分别反映了数据分布特征的不同侧面。
第一节集中趋势的测度集中趋势是指一组数据向某一中心值靠拢的倾向,它反映了一组数据中心点的位置所在。
测度集中趋势也就是寻找数据一般水平的代表值或中心值。
低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据。
因此,选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型和特点来确定。
一、分类数据:众数(M o)众数是指一组数据中出现次数最多的变量值。
•出现次数最多的变量值•不受极端值的影响•一组数据可能没有众数或有几个众数•主要用于分类数据,也可用于顺序数据和数值型数据从分布的角度看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的数值即为众数。
第四章数据特征测度平均指标

m1 m2 mn
1 x1
m1
1 x2
m2
1 xn
mn
m 1 m x
调和平均数
(例题分析)
【例】某蔬菜批发市场三种蔬菜的日成交数据如表,计算三 种蔬菜该日的平均批发价格
某日三种蔬菜的批发成交数据
蔬菜 名称
甲 乙 丙
批发价格(元) xi
1.20 0.50 0.80
成交额(元) mi=xi fi 18000 12500 6400
分组资料: (x x)2 f 为最小。
这两个性质是进行趋势预测、回归预测、 建立数学模型的重要数学理论依据。
算术平均数(均值,mean ) 小结
1. 集中趋势的最常用测度值 2. 一组数据的均衡点所在(重心) 3. 体现了数据的必然性特征 4. 易受极端值的影响 5. 用于数值型数据,不能用于分类数据和顺
f 1 f 2 fn
i 1 n
fi
i 1
简写为:
x
xf f
分组资料时,各组变量值应用组中值M代替。
加权算术平均数
(权数对均值的影响)
甲乙两组各有10名学生,他们的考试成绩及其分布数据如下
甲组: 考试成绩(x ): 0 20 100 人数分布(f ):1 1 8
乙组: 考试成绩(x): 0 20 100
2.平均指标可以反映现象总体的综合特征 3.平均指标经常用来进行同类现象在不同空间
、不同时间条件下的对比分析
二、平均指标的类别及计算
算术平均数(Mean) 均 值(Mean) 调和平均数(Harmonic mean)
几何平均数(Geometric mean) 中位数 (Median)
众 数 (Mode)
值 x及各组的标志总和 m 即 xf 时,可采用加权调和
统计学课后习题与答案 郑贵华、颜泳红主编 湘潭大学出版:第四章 数据分布特征的度量

第四章思考与习题一、思考题1.什么是集中趋势?测度集中趋势常用指标有哪些?2.算术均值.众数和中位数有何关系?3.什么是几何平均数?其适用场合是什么?4.什么叫离散趋势?测度离散趋势常用指标有哪些?5.为什么要计算离散系数?二、练习题(一)填空题1.统计数据分布的特征,可以从三个方面进行测度和描述:一是分布的__________,反映所有数据向其中心值靠拢或聚集的程度;二是分布的__________,反映各数据远离其中心值的趋势;三是分布的__________,反映数据分布的形状。
2.在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080.750.1080.850.960.2000.1050.1080.760.1080.950.1080.660,则其众数为,中位数为。
3.算术均值有两个重要数学性质:各变量值与其算术均值的__________等于零;各变量值与其算术均值的__________等于最小值。
4.简单算术均值是__________的特例。
4.几何均值主要用于计算__________的平均。
5.在一组数据分布中,当算术均值大于中位数大于众数时属于________分布;当算术均值小于中位数小于众数时属于________分布。
6.__________是各变量值与其均值离差平方的平均数,是测度数值型数据__________最主要的方法。
7.为了比较人数不等的两个班级学生的学习成绩的优劣,需要计算__________;而为了说明哪个班级学生的学习成绩比较整齐,则需要计算________。
8.偏态是对数据分布__________或__________的测度;而峰度是对数据分布_________的测度。
(二)判断题1.众数的大小只取决于众数组与相邻组次数的多少。
()2.当总体单位数n为奇数时,中位数=(n+1)/2。
()3.根据组距分组数据计算的均值是一个近似值。
()4.若已知甲企业工资的标准差小于乙企业,则可断言:甲企业平均工资的代表性好于乙企业。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
楼市价格下降?
❖ 《2010年3月广州市十区房地产交易登记情 况通报》,数据显示,广州十区3月的一手住 宅成交量环比回升两成,达到62.35万平方米, 成交量接近去年3月“小阳春”。
❖ 今年3月楼市成交回暖是否也是楼价低的因素? 因为广州3月楼价环比下降了9.2%。
❖ 表面看来是如此。
集中趋势的概念 与测度指标
2、分组数据例-经过分组整理的数据
某城市居民关注广告类型的频数分布
广告类型
商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告
人数(人)
112 51 9 16 10 2
频率(%)
56.0 25.5 4.5 8.0 5.0 1.0
合计
200
100.0
某地 区农 民家 庭年 人均 收入 资料
平均数的种类
位置平均数
数值平均数
众数
算术平均数
中位数
调和平均数
几何平均数
众数
定义 确定方法 特点 总结
众数的引例
❖ 一个班30名同学参加英语考试,成绩如下:
❖ 2名同学——60分
❖ 10名同学——72分
❖ 15名同学——80分 ❖ 3名同学——85分
众数
❖ 5名同学——90分
众 数 (Mode)
合计
300
100
—
—
—
—
众数:不满意
2、分组数据例-单项式分组
某200名手机使用者目前已更换手机数量频 数分布表
更换手机数量
0 1 2 3及以上 合计
人数(人)
6 82 76 36 200
频率(%)
3 41 38 18 100
众数:1
2、分组数据例-组距分组
某地 区农 民家 庭年 人均 收入 资料
❖统计学中是用一个或几个数据测度(刻画) 数据总体的分布特征。
❖统计学中刻划数据分布特征的最主要的代表 有数据分布的集中趋势、离散程度和分布形态。描述统计统计数据 源自收集统计数据统计数据
的整理与显示 分布特征的测度
第四章 数据分布特征的测度
主要内容和学习目标
集中趋势的测度(重点掌握) 离散程度的测度(重点掌握) ——均从未分组和分组两角度进行介绍 偏度与峰度的测度(了解)
集中趋势的概念:是指一组数据向某一中心值靠拢
的倾向,它反映了数据聚集的中心所在 。
集中趋势的测度:是指寻找数据(总体)一般水平
的代表值或中心值
集中趋势的测度指标:称之为平均指标(平均 数)——众数、中位数、算术平均数、调和平 均数、几何平均数。
集中趋势测度的作用: 可以用一个数值说明总体的一般水平。
按年人均收入 分组(元)
农民家庭数 (户)
1000~1200 1200~1400 1400~1600 1600~1800 1800~2000 2000~2200 2200~2400 2400~2600
240 480 1050 600 270 210 120 30
合计
3000
M
o
1400
(1050
1050 480 480) (1050
未分组和分组数据辨析
1、未分组数据——未经过分组整理的数据
某生产车间50名工人日加工零件数原始资料(单位:个) 107 108 108 110 112 112 113 114 115 117 117 117 118 118 118 119 120 120 121 122 122 122 122 123 123 123 123 124 124 124 125 125 126 126 127 127 127 128 128 129 130 131 133 133 134 134 135 137 139 139
=1511.8(元)
众数的确定方法总结
1、未分组数据的众数 MO=频(次)数最多的数据值(变量值、标志值)
2、分组数据的众数
(1) 品质数据和单项式分组的数值型数据 MO =频数最多组的数据值(变量值、标志值)
众数:122
2、分组数据例-品质型分组
某城市居民关注广告类型的频数分布
广告类型
商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告
人数(人)
112 51 9 16 10 2
频率(%)
56.0 25.5 4.5 8.0 5.0 1.0
合计
200
100.0
众数:商品广告
甲城市家庭对住房状况满意程度的频数分布
定义:是指一组数据中出现次数最多的变量值, 用MO表示。
实际应用:当更感兴趣的是最普遍的尺寸而不是平均
尺寸的大小时众数是一个合适的集中趋势代表值。
众数的确定方法
1. 未分组数据 2. 分组数据
3. -品质型分组 -数值型分组
1、未分组数据例
某生产车间50名工人日加工零件数原始资料(单位:个) 107 108 108 110 112 112 113 114 115 117 117 117 118 118 118 119 120 120 121 122 122 122 122 123 123 123 123 124 124 124 125 125 126 126 127 127 127 128 128 129 130 131 133 133 134 134 135 137 139 139
满意 户数 程度 (户)
非常 不满意
24
百分比 (%)
向上累积
户数 百分比 (户) (%)
8
24
8.0
向下累积
户数(户)
百分比 (%)
300 100
不满意 108
36
132
44.0
276 92
一般
93
31
225
75.0
168 56
满意
45
15
270
90.0
非常 满意
30
10
300 100.0
75 25 30 10
按年人均收入 分组(元)
1000~1200 1200~1400 1400~1600 1600~1800 1800~2000 2000~2200 2200~2400 2400~2600
合计
农民家庭数 (户)
240 480 1050 600 270 210 120 30
3000
一、集中趋势的测度
概念与测度指标 众 数(掌握) 中位数(掌握) 算术平均数(重点掌握) 调和平均数 几何平均数(掌握)
600)
200
1511.(8 元)
解:从表中的资料可以看出,出现频数最多的是1050, 即众数组为1400~1600,且
L=1400 fm 1050 fm1 480 fm1 600 d 200
根据众数公式可得:
Mo
1400
1050 480
200
(1050 480) (1050 600)