第三章 统计数据分布特征的描述
第三章 统计数据分布的特征

12.42 6.60
82.2
调和平均数
各变量值的倒数的平均数。又称倒数平均 数。 n x 1 简单调和平均数
x
例题:书77页例3-2 加权调和平均数 x m m为权数 例题:见书78页例
m x
几何平均数
用于计算比率或速度的平均。 在计算社会经济现象时应用较多。 公式: N
i i 1
n
2
样本方差用(n-1)去除,从数学角度看是
因为它是总体方差σ2的无偏估计量。
n 1
k
分组数据
2
i 1
K
( X i X )2 fi
s2
i 1
( xi x ) 2 f i
k
f
i 1
K
i
f
i 1
i
1
标准差(例子)
某工会随机调查了5名工人上月的加班时间 如下表,平均加班时间为13小时。计算数 据的标准差。
1、集中趋势分析 2、离中趋势分析 3、分布偏态与峰度的测度
数据描述的数值方法
数据描述的数值方法
集中趋势
均 值
离散程度
极差 四分位距
分布的形状
偏 态 峰 度
中位数 众 数
方差和标准差 离散系数
2.2 分布集中趋势的测度
众数 中位数 分位数 均值 几何平均数 切尾均值
集中趋势
集中趋势:一组数据向其中 心值靠拢的倾向和程度。 集中趋势测度:寻找数据水 平的代表值或中心值。
特点:
反映了相对于均值的相对离散程度; 可用于比较计量单位不同的数据的离散程度; 计量单位相同时,如果两组数据的均值相差悬殊, 离散系数可能比标准差等绝对指标更有意义。
数据分布特征的描述

2019/9/1
版权所有 BY 统计学课程组
15
算术平均数的性质
2019/9/1
版权所有 BY 统计学课程组
16
算术平均数(均值)特征:
1. 集中趋势的最常用测度值; 2. 一组数据的均衡点所在; 3. 易受极端值的影响; 4. 由组距分组资料计算的均值有近似值性质; 5、用于数值型数据,不能用于分类数据和顺
(CM) (人)
152
1
154
2
155
2
156
4
157
1
158
2
159
2
160 12
161
7
162
8
163
4
2019/9/1
身高 人数
(CM) (人)
164
3
165
8
166
5
167
3
168
7
169
1
170
5
171
2
172
3
174
1
总计 83
版权所有 BY 统计学课程组
STAT
众数
32
注意:
众数不仅适用于测度顺序数据和 数值型数据的集中趋势,而且适用 于测度不能计算平均数的分类数据 的集中趋势。
2019/9/1
版权所有 BY 统计学课程组
3
数据分布的特征:
一、集中趋势:反映数据向其中心靠拢或 聚集
程度;
二、离中趋势;数据远离中心的趋势(又称离散
程度);
三、偏态和峰态;偏态是对数据分布对称性的度
量;峰度是指数据分布的平峰或尖峰程度
概率与数理统计第3章 数据分布特征的描述

第3章数据分布特征的描述[引例]根据国家统计局对全国31个省(自治区、直辖市)7.4万户农村居民家庭和6.6万户城镇居民家庭的抽样调查,2011年城乡居民收入增长情况如下1:2011年全国农村居民人均纯收入6977元,比上年增加1058元,增长17.9%。
剔除价格因素影响,实际增长11.4%,增速同比提高0.5个百分点。
其中,人均工资性收入2963元,同比增加532元,增长21.9%。
工资性收入对全年农村居民增收的贡献率达50.3%。
工资性收入占农村居民纯收入的比重达42.5%,同比提高1.4个百分点。
2011年农村居民人均纯收入中位数为6194元,比上年增加995元,增长19.1%。
农村居民人均纯收入中位数比人均纯收入低783元,但增速高1.2个百分点。
2011年城镇居民人均总收入23979元,其中,人均可支配收入21810元,比上年增加2701元,增长14.1%。
剔除价格因素影响,城镇居民人均可支配收入实际增长8.4%,增速同比提高0.6个百分点。
2011年城镇居民人均可支配收入中位数为19118元,比上年增加2279元,增长13.5%。
城镇居民人均可支配收入中位数比人均可支配收入低2692元,增速低0.6个百分点。
主要是受最低工资标准、城镇居民基本养老金和离退休金以及最低生活保障标准提高影响,城镇低收入户收入增速较高;同时高收入户也保持了较快的增长速度,所以中等收入户增速相对较慢。
2011年城镇居民人均可支配收入与农村居民人均纯收入之比为3.13:1,2010年该收入比为3.23:1。
本章小结1.总量指标是说明现象总规模和总水平的数值,又称为绝对数。
绝对数的计量单位有实物单位和价值量单位。
按反映总体内容不同,总量指标可分为总体单位总量和总体标志总量;按反映的时间状况不同,总量指标可分为时期指标和时点指标。
2.将两个有联系的数值对比得到的比率称为相对数。
相对数既有无名数形式也有复名数形式。
根据研究目的和对比基础的不同,有结构相对数、比例相对数、计划完成程度相对数、比较相对数、动态相对数和强度相对数等。
曾五一《统计学导论》配套题库【课后习题】第三章 数据分布特征的描述 【圣才出品】

2 / 16
圣才电子书 十万种考研考证电子书、题库视频学习平台
映了全部数据的信息。众数、中位数和四分位数都是根据数据分布的特定位置所确定的集中 趋势测度值。算术平均数只能用于定量(数值型)数据,中位数、四分位数适用于定序数据 和定量数据,众数对所有形式的数据(定性数据和定量数据)都适用。本题中测验成绩的记 录结果为定性数据,所以 B 项正确。
答 : 可 计 算 出 总 体 标 准 差 =100 × 10 % =10 , 总 体 方 差 为 100 , 于 是 峰 度 系 数 K=34800/10000=3.48,可以认为总体呈现非正态分布。
4 / 16
圣才电子书 十万种考研考证电子书、题库视频学习平台
峰度系数 K
5.一组数据呈微偏分布,且知其均值为 510,中位数为 516,则可推算众数为( )。 A.528 B.526 C.513 D.512 【答案】A
【解析】英国统计学家皮尔逊( K.Pearson )提出了一个经验公式:在数据分布呈轻
微偏态时,算术平均数和众数、中位数三者之间存在如下的近似关系:
,由此可得众数 M0 528 。
2.你正在筹划一次聚会,想知道该准备多少瓶饮料,你最希望得到所有客人需要饮料 数量的( )。
A.均值 B.中位数 C.众数 D.四分位数 【答案】A 【解析】算术平均数是数值平均数,即它是利用全部数据加总来计算的平均数,综合反
1 / 16
圣才电子书 十万种考研考证电子书、题库视频学习平台
曲线的陡峭(或平坦)的程度。对峰度的度量通常以正态分布曲线为比较标准,一般将峰度
曾五一《统计学导论》(第2版)配套题库【章节题库】第三章 数据分布特征的描述 【圣才出品】

5.现有一数列:3,9,27,81,243,729,2187,反映其平均水平最好用( )。 A.算术平均数 B.调和平均数
圣才电子书 十万种考研考证电子书、题库视频学习平台
第三章 数据分布特征的描述
一、单项选择题
1.甲班学生平均分是 80 分,标准差是 10 分;乙班同学平均分是 75 分,标准差是 5
分。由此可以认为( )。[武汉大学 2013 研]
A.甲班平均分的代表性好于乙班
B.乙班平均分的代表性好于甲班
3 / 33
圣才电子书
A.2.9
十万种考研考证电子书、题库视频学习平台
B.3.4
C.3.9
D.4.1
【答案】A
【解析】极差,是用来表示统计资料中的变异量数,其最大值与最小值之间的差距;即
最大值减最小值后所得之数据。8 位居民看电视时间最长的是 4.4,最短的是 1.5,极差是
1 / 33
圣才电子书 十万种考研考证电子书、题库视频学习平台
3.一组数据排序后处于中间位置上的变量值称为( )。 A.众数 B.中位数 C.四分位数 D.平均数 【答案】B 【解析】中位数是一组数据排序后处于中间位置上的变量值。中位数将全部数据等分成 两部分,每部分包含 50%的数据,一部分数据比中位数大,另一部分则比中位数小。
【答案】D
【解析】平均废品率是某一段时期内同一总体中的废品数量与总体产品数量的相对数。
统计学第3章数据分布特征描述

3.分析现象之间的依存关系。 如研究劳动者文化程度与收入的关系。
4.(数值)平均指标是推断统计中的重要 统计量,是进行统计推断的基础。
几种常见的位置特征数
N
MH
N
i 1
1
1 xi
wi
wi
i 1
N
i 1
1 xi
wi
N
wi
i 1
MH
1 N1
N N1
i1 xi i1 xi
N
k0:几何平均数 加权
N
M G i 1w i x 1 w 1x2 w 2 xN w N
简单
M G N x 1x 2 x N
fi
i1
i 1(xifi)254 674 58 012 1110 % 01.7 1%
n(xifi) i1 xi
1 2% 6 56 1 4% 0 75 1 4% 2 80 10350
(四)几何平均数(Geometric mean)
简单几何平均数— n个变量值连乘积的n次方根。
n(xi x)2 min
i1
性质(3)证明:
(三)调和平均数(Harmonic mean)
调和平均数,也称倒数平均数。 各变量值倒数(1/xi)的算术平均数的倒数。 计算公式为:
n
xHx11m1x12m12... x1nmn
m1m2... mn
m1m2 ... mn
与单项式分组资料一样,采用加权算术平均数计算。
概率与数理统计第3章数据分布特征的描述

概率与数理统计第3章数据分布特征的描述概率与数理统计是一门关于随机现象的描述和分析的学科。
在实际问题中,我们经常需要对数据进行分析和描述,以便更好地理解数据的特征和规律。
第三章主要介绍了数据分布的特征描述,包括中心位置度量、离散程度度量和分布形状度量。
首先是中心位置度量,它用来描述数据集的平均水平。
一般来说,我们关心的是数据集的平均值和中位数。
平均值是数据的加权平均,它能够反映数据集的集中趋势。
平均值的计算公式是:```平均值=总和/观测数```中位数是按照数据的大小顺序排列后,处于中间位置的观测值。
中位数的计算方法是:```如果数据集的观测数为奇数,中位数为第(n+1)/2个观测值如果数据集的观测数为偶数,中位数为第n/2和(n/2+1)个观测值的平均值```其次是离散程度度量,它用来描述数据集的变异程度。
我们常用的度量指标有极差、方差和标准差。
极差是数据集中最大观测值与最小观测值之间的差距,它反映了数据的全局离散程度。
方差是每个观测值与数据集平均值的差的平方的平均值,它度量了数据的局部离散程度。
标准差是方差的平方根,它与方差具有相同的单位,能够更好地反映数据的离散程度。
最后是分布形状度量,它用来描述数据分布的偏度和峰度。
偏度是描述数据分布对称性的度量,正偏表示数据集的右尾较重,负偏表示数据集的左尾较重。
峰度是描述数据分布峰态的度量,正峰表示数据集的峰部较陡,负峰表示数据集的峰部较平。
偏度和峰度能够帮助我们了解数据分布的形态特征,从而判断数据集是否服从其中一种特定的分布。
在实际应用中,我们可以通过对数据集进行描述统计分析来了解数据的特征。
通过计算平均值、中位数、方差、标准差、偏度和峰度等指标,我们能够更好地理解数据的分布情况。
此外,我们还可以通过绘制直方图、箱线图、概率密度函数等图形来展示数据的分布特征,进一步加深对数据的认识。
总之,数据分布特征的描述是概率与数理统计中重要的内容之一、通过中心位置度量、离散程度度量和分布形状度量,我们能够充分了解数据的平均水平、变异程度和形态特征,为进一步的数据分析和决策提供有力的支持。
第3章统计学数据分布特征的描述

第3章统计学数据分布特征的描述统计学是一门研究收集、分析和解释数据的学科。
在统计学中,数据分布特征的描述是指通过一系列统计量和图表来描述数据的集中趋势、离散程度和分布形态等特征。
数据的集中趋势描述了数据的平均水平或中心。
常用的统计量有平均值、中位数和众数。
平均值是将所有观测值相加然后除以观测值的总数,它能够反映数据的总体平均水平。
然而,当数据包含异常值时,平均值的计算结果可能会受到影响。
因此,中位数和众数在这种情况下被认为是更稳健的集中趋势度量。
中位数是将数据按大小排序,然后找出中间位置的观测值。
众数是数据中出现次数最多的观测值。
数据的离散程度描述了数据的变异程度或分散程度。
常用的统计量有方差、标准差和四分位差。
方差是观测值与均值之间差异的平方的平均值,它反映了数据的总体离散程度。
标准差是方差的平方根,用于衡量数据的波动性。
四分位差是数据的上四分位数和下四分位数之差,它描述了数据的中间50%的变异程度。
数据的分布形态描述了数据的形状和对称性。
常用的分布形态有正态分布、偏态分布和峰态分布。
正态分布是最常见的分布形态,其特点是对称、钟形曲线。
偏态分布是指数据分布不对称的情况,主要分为正偏态和负偏态。
正偏态分布意味着数据的尾部偏向右侧,负偏态分布则意味着数据的尾部偏向左侧。
峰态分布用于描述数据的峰值的尖锐程度,主要分为正态分布、高峰态和低峰态。
除了统计量,还可以使用图表来对数据分布特征进行描述。
常用的图表包括直方图、箱线图和散点图。
直方图是通过将数据分组并在坐标轴上绘制各组的频率或相对频率来展示数据的分布形态。
箱线图通过绘制数据的分位数和异常值来展示数据的中位数、四分位数和离群观测值。
散点图用于展示两个变量之间的关系,特别适用于发现变量之间的相关性和异常值。
综上所述,统计学中的数据分布特征描述是通过一系列统计量和图表来描述数据的集中趋势、离散程度和分布形态等特征。
这些描述能够帮助我们更好地理解数据,并对数据进行分析和解释。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 .根据组距式数列确定众数
例 3‐12 根据表3‐4 的资料计算众数 。
第一步 :确定众数组 。表 3‐4 中数据显 示 ,月工资在 800 — 1000 元这一组的职 工人数最多 ,为 70 人 ,因此 ,这一组即 第二组为众数组 。
第二步 :将相关数据代入下限公式或上限 公式进行计算 。
四 、离散系数
计算变异指标的相对指标 ——— 离散 系数 ,又称为变异系数 ,通常用 V 表示 , 它是极差 、平均差 、标准差与其平均指 标对比的结果 ,分别称为极差系数 、平 均差系数和标准差系数 ,其计算公式为
例 3‐17 有甲、乙两个村子,每村各户年 收入情况如表3‐9 所示 ,计算两村村民年 收入的平均数和标准差系数 。
70 ,但极差不同 ,甲数列 R = 4 ,乙数 列 R = 40
二 、平均差
平均差是指总体所有单位的标志值与 其算术平均数的离差绝对值的算术平均数 , 通常用 A .D表示 。
(一) 简单式平均差
例 3‐14 某车间有两个生产小组,每组5 个工人,每人日产量(件)如表3‐6 所 示 ,试计算其平均差 。
按众数的下限公式计算 :
一 、极差
极差又称为全距 ,是总体中或分布中 最大的标志值与最小的标志值之差 ,一般
用 R来表示 。其计算公式为
R = x max - x min
例 3‐13 有甲、乙两个数列: 甲数列 68 69 70 71 72 , x = 70 ,R = 4 乙数列 50 60 70 80 90 , x = 70 ,R = 40 由结果可知 ,这两个数列的平均数均为
根据式(3‐10) 可确定中位数位置 :
(二)众数
1 .根据单项式数列确定众数
(1) 确定众数组 ,即出现次数最多的组 ;
(2) 确定众数值 ,即众数组所对应的具体 数值 。
例 3‐11 调查100名顾客所购买皮鞋的有关 资料如表3‐5 所示 ,找出众数 。
从表 3‐5 中可以看出 ,购买 24 厘米皮 鞋的顾客最多 ,有 40 人 ,因此 24 厘米就 是众数 。
统计学
作者:张增臣
责任编辑:朱玲 出版日期:2012年3月 IDPN: 308-2011-80 课件章数:11
第一节 统计数据分布集中趋势的测度 第二节 统计数据分布离散趋势的测度 第三节 统计数据分布的偏态与峰度的测度
一 、数值平均数
数值平均数就是根据统计数列中的所有 数据计算的平均数 ,能够概括反映整个数 列所有数据的平均水平 。
一 、偏态
(一) 偏态的概念
如果次数分布在中位数两边是对称的 , 则称为对称分布 ,即正态分布 ;如果次 数分布在中位数两边是不对称的 ,则称为 偏态分布 。
(二) 偏态的测度 1 .算术平均数与众数比较法
偏度系数 ,通常用 SK 表示 ,计算公式为:
2 .矩法 (1) 矩的形式
例 3‐3 某班级50名学生的“统计学原理” 课程考试成绩如表3‐2 所示 ,计算此班 级该课程的平均成绩 。
该班学生统计学原理的平均成绩为:
(二) 调和平均数 1 .简单调和平均数
例 3‐4 某市场苹果的价格早、中、晚分 别为每斤2元、1.8元和1.5元,若各买1 元钱的苹果 ,求其平均价格 。
三 、应用 Excel 进行统计量描述 (一)用函数计算描述统计量 (二) 用描述统计工具的方法计算统计量
(一)算术平均数
算术平均数 =总体标志总量/总体单位总量 1 .简单算术平均数
例 3‐1 一个学习小组有5名学生,他们一 天背诵英语单词量分别为18个、20个、25 个 、28 个和 29 个 ,问这 5名学生这一天 平均背诵单词量为多少 ?
2 .加权算术平均数
例 3‐2 某车间有10名工人,按日生产零 件数分组编制单项式变量数列如表3‐1 所示 ,计算平均日产量 。
① 将标志值按从小到大顺序排列 ,即 4 ,6 ,6 , 8 ,9 ,12 ,14 ;
② 根据公式确定中位数位置 ,即(7 + 1)/2 =4;
③ 变量值为 7 个 ,是奇数项 ,则居于第四位的 变量值 8 即为中位数 。
2 .根据已分组资料计算中位数
例 3‐10 某企业200名职工的月工资分布 如表3‐4 所示 ,试确定中位数 。
当A=0时
当 A =x -
(2) 偏度系数
二 、峰度 (一) 峰度的概念 峰度是测定次数分布曲线顶端尖峭程
度的指标 。 峰度主要分为正态峰度 、尖顶峰度和
平顶峰度三种 。
(二) 峰度的测度
K = 0 ,次数分布为标准正态分布 ; K > 0 时 ,次数分布曲线为尖顶曲线 ; K < 0 时 ,次数分布曲线为平顶曲线 。
2 .加权调和平均数
(三) 几何平均数 1 .简单几何平均数
2 .加权几何平均数
二 、位置平均数 (一) 中位数 1 .根据未分组资料计算中位数
例 3‐8 设有7个工人生产某种产品,他们的 日产量(件)分别为6,4,6,8,9,14,12, 求中位数 。
由于例题中所给资料未分组 ,则可按上述步 骤:
A .D 甲 = 6/5 = 1.2(件) A .D 乙 = 60/5 = 12(件)
(二) 加权式平均差
例 3‐15 某企业某月工人按日包装箱数分 组,资料如表3‐7 所示 ,计算其平均差 。
三 、方差与标准差 (一) 简单平均式
(二) 加权平均式
例 3‐16 已知某车间有两组工人,第一组工人 的平均工资为767元,其标准差为92元;第二组 工人的工资情况如表 3‐8 所示 ,试计算第二组 工人的平均工资及标准差 。