统计学 第3章 数据分布特征描述

合集下载

统计学第三章理解练习知识题

统计学第三章理解练习知识题

第三章数据分布特征的描述一、填空题3.1.1 是指一组数据向其中心值靠拢的倾向。

3.1.2 加权算术平均数受两个重要因素的影响,一个是;另一个是各组变量值出现的。

3.1.3 计算比率的平均数时,如果已知比率及其基本计算式的分母资料,则采用。

3.1.4 计算比率的平均数时,如果已知比率及其基本计算式的分子资料,则采用。

3.1.5 是计算平均比率或平均发展速度最适用的一种方法。

3.1.6 是指一组数据中出现次数最多的变量值。

3.1.7 是指将按大小顺序排列的一组数据划分为四等分的三个变量值。

3.1.8 是指将按大小顺序排列的一组数据划分为10等分的9个变量值。

3.1.9 在数据分布呈时,算术平均数、众数和中位数三者相等。

3.1.10 是指非众数组的频数占总频数的比率。

3.1.11 上四分位数与下四分位数之差的简单算术平均数称为。

3.1.12 各个变量值与其算术平均数离差的绝对值的平均数称为。

3.1.13 总体方差是各个数据与其的离差平方的平均数,通常以2 表示。

3.1.14 皮尔逊测度法就是利用算术平均数与众数的关系来测度数据分布的一种方法。

3.1.15 是指用标准差的三次方除三阶中心矩计算偏态系数的一种方法。

二、单项选择题(在每小题的3个备选答案中选出1个正确答案,并将其字母填在题干后面的括号内。

)3.2.1 先将一组数据的变量值按一定顺序排列,然后取某一位置的变量值来反映这些数据的一般水平,把这个特殊位置上的数值看作是平均数,称为 ( )A .数值平均数B .位置平均数C .离散系数 3.2.2算术平均数反映的是数据分布的什么特征( )A .集中趋势B .离散趋势C .偏态趋势3.2.3 根据算术平均数的性质,下列表达式正确的是 ( )A .0)(=∑-f x xB .0x x f C .2()0x x f3.2.4 如果分布数列中各变量值呈几何级数变化或频率分布极不对称,计算平均数的常用方法是( )A .算术平均法B .几何平均法C .调和平均法3.2.5 用各组的组中值代表其实际数据计算算术平均数时,通常假定 ( )A .各组数据在组内是均匀分布的B .各组次数相等C .各组数据之间没有差异3.2.6 当数据分布为右偏分布时,算术平均数与中位数、众数的关系表现为 ( ) A .o e M M x << B .e o x M M << C .o e x M M <<3.2.7 离散程度测度指标中,受极端值影响最大的是 ( )A .平均差B .标准差C .全距3.2.8 平均差与标准差的主要区别在于 ( ) A .说明问题的角度不同 B .对离差的数学处理方法不同 C .计算对象不同 3.2.9标准差系数消除了( )A .总体单位数多少的影响B .平均数大小和计量单位的影响C .离散程度的影响3.2.10 直接使用标准差比较分析两个同类总体平均数的代表性,其前提条件是 ( )A.两个总体的标准差应该相等B.两个总体的平均数应该相等C.两个总体的离差平方和应该相等3.2.11 下列指标中,实际应用最广泛的离散程度测度指标是()A.平均差B.标准差C.离散系数3.2.12 皮尔逊测度法就是利用算术平均数与众数的关系来测度数据分布的()A.偏斜程度B.离散程度C.集中程度三、多项选择题(在下列4个备选答案中,至少有二个是正确的,请将其全部选出,并把字母填在题干后面的括号内。

旅游统计学 教学课件 ppt 作者 张珊 第3章 旅游统计数据分布特征的描述

旅游统计学 教学课件 ppt 作者 张珊 第3章 旅游统计数据分布特征的描述
Xh n
n


1 X
1 X
在加权的情况下: Xh
f 1 X f
• 小王登山,上山的速度是每小时4km, 到达山顶后原路返回,速度为每小时 6km,设山路长9km,小王的平均速度 为()km/h。(湖南2009)
– – – – A.5 B.4.8 C.4.6 D.4.4 答案:B
• 地铁检修车沿地铁线路匀速前进,每6 分钟有一列地铁从后面追上,每2分钟 有一列地铁迎面开来。假设两个方向的 发车间隔和列车速度相同,则发车间隔 是()分钟。(广东2009)
按日产量分组 工人数f (千克) (人 ) 10 60 以下 60 – 70 19 70 – 80 50 80 – 90 36 90 – 100 27 100 – 110 14 8 110 以上 164 合 计
平均日产量 X Xf f
组中值X (千克) 55 65 75 85 95 105 115 -
– – – – A.2 B.3 C.4 D.5
答案:B
• 有人沿地铁线路匀速前进,每12分钟有 一列地铁从后面追上,每4分钟有一列 地铁迎面开来。假设两个方向的发车间 隔和列车速度相同,则发车间隔是() 分钟。(黑龙江2010)
– – – – A.2 B.4 C.6 D.8
答案:C
• 一艘游轮从甲港口顺水航行至乙港口需 7小时,从乙港口逆水航行至佳港口需9 小时。问如果在静水条件下,游轮从甲 港口航行至乙港口需要多少小时()。 (浙江2011)
大,平均数受该组的影响就越大。反之亦然。
例 将上例资料略作修改:
按日产量分 组(件) 工人数(f) 各组日产量 (件)
12 13 16 17
合计
2 1 3 2 8

习题及参考答案

习题及参考答案

习题及参考答案第三章数据分布特征的描述⼀、单项选择题 1、经验表明,当数据分布近似于正态分布时,则有95%的数据位于区间() A 、σ±X B 、σ2X ± C 、σ3X ± D 、σ4X ± 2、实际中应⽤最⼴泛的离散程度测度值是()A 、极差和平均差B 、平均差和四分位差C 、⽅差和标准差D 、异众⽐率和四分位差3、集中趋势的测度值中,最主要的是()A 、众数B 、中位数C 、均值D 、⼏何平均数4、有10个数据,它们对数据6的离差分别为:-3,-2,-2,-2,0,0,4,4,5,5。

由此可知这10个数据的()A 、均值为0B 、均值为1 B 、均值为6C 、均值为5、某⽣产⼩组由36名⼯⼈,每⼈⽣产的产量数量相同,其中有14⼈⽣产每件产品耗时8分钟;16⼈⽣产每件产品耗时10分钟;6⼈⽣产每件产品耗时5分钟,计算该⽣产⼩组⽣产每件产品的平均耗时应采⽤()A 、简单算术均值B 、简单调和算术均值C 、加权算术均值 D.、加权调和均值6、某敬⽼院⾥有9位百岁⽼⼈的岁数分别为101、102、103、104、108、102、105、110、102 ,据此计算的结果是()A 、均值=中位数=众数B 、均值>中位数>众数C 、众数>中位数>均值D 、中位数>均值>中数 7、⼏何均值主要适合于()A 、具有等差关系的数列B 、变量值为偶数的数列C 、变量值的连乘积等于总⽐率或总速度的数列D 、变量值之和等于总⽐率或总速度的数列 8、加权算术均值不但受变量值⼤⼩的影响,也受变量之出现的次数多少的影响,因此下列情况中对均值不发⽣影响的是()A 、变量值出现次数相等时B 、变量值较⼩、次数较多时C 、变量值较⼤、次数较少时D 、变量值较⼤、次数较多时9、⼀组数据的均值为350,众数为200,则()A 、中位数为275,数据呈右偏分布B 、中位数为275,数据呈左偏分布C 、中位数为300,数据呈左偏分布D 、中位数为300,数据呈右偏分布10、⼀组数据的均值为5,中位数为3,则()A 、数据呈右偏分布B 、数据呈对称分布C 、数据呈左偏分布D 、数据呈正态分布11、经验表明,当数据分布近似于正态分布时,则变量值落在区间σ±X 的概率为()A、95%B、68%C、%D、%12、当众数(Mo)中位数(Me)和均值(X)三者的关系表现为:Mo=Me=X,则()A、数据有极⼩值B、数具有极⼤值C、数据是对称分布D、数据是左偏分布E、数据右偏分布13、在单项式数列中,假定标志值所对应的权数都缩⼩1/10,则算术平均数()A、不变B、⽆法判断C、缩⼩1/100D、扩⼤10倍14、若单项式数列的所有标志值都减少⼀倍,⽽权数都增加⼀倍,则其算术平均数()A、增加⼀倍B、减少⼀倍C、不变D、⽆法判断15、各变量值与其算术平均数的离差之和()A、等于各变量值之和的平均数B、等于最⼤值C、等于零D、等于最⼩值16、各变量值与其算术平均数的离差平⽅之和()A、等于各变量值之和的平均数B、等于最⼤值C、等于零D、等于最⼩值⼆、多项选择题1、当众数(Mo)、中位数(Me)和均值(X)三者的关系表现为:X<Me<Mo,则()A、数据是左偏分布B、数据是右偏分布C、数据是对称分布D、数据存在极⼩值E、数据存在极⼤值2、当众数(Mo)、中位数(Me)和均值(X)三者的关系表现为:Mo<Me<X,则()A、数据是右偏分布B、数据是对称分布C、数据是左偏分布D、数据有极⼤值E、数据有极⼩值3、数据分布的两个重要特征是()A、正态分布B、集中趋势C、t分布D、 2分布E、离散程度4、利⽤组距分组数据计算众数时,有⼀些基本假定,即()A、假定数据分布具有明显的离中趋势B、既定数据分布具有明显的集中趋势C、假定众数组的频数在该组内是正态分布D、假定众数组的频数在该组内是均匀分布E、假定众数组的频数在该组内是⼆项分布5、众数()A、是⼀组数据分布的最⾼峰点所对应的数值B、可以不存在C、也可以有多个D、是位置代表值E、不受数据中极端值的影响。

【论文资料】《统计学》数据分布特征的统计描述练习

【论文资料】《统计学》数据分布特征的统计描述练习

第三章数据分布特征的统计描述练习题一、单项选择题1、一组数据排序后处于25%和75%位置上的值称为()A、众数B、中位数C、四分位数D、均值2、离散系数的主要用途是()A、反映一组数据的离散程度B、反映一组数据的平均水平C、比较多组数据的离散程度D、比较多组数据的平均水平3、离散系数()A、只能消除一组数据的水平对标准差的影响B、只能消除一组数据的计量单位对标准差的影响C、可以同时消除数据的水平和计量单位对标准差的影响D、可以准确反映一组数据的离散程度4、峰态通常是与标准正态分布相比较而言的,如果一组数据服从标准正态分布,则峰态系数的值()A、等于0B、大于0C、小于0D、等于15、如果峰态系数K>0,表明该组数据是()A、尖峰分布B、扁平分布C、左偏分布D、右偏分布6、某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。

在上面的描述中,众数是()A、1200B、经济管理学院C、200D、理学院7、某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户,描述该组数据的集中趋势宜采用()A、众数B、中位数C、四分位数D、均值8、甲、乙两组工人的平均日产量分别为18件和15件。

若甲、乙两组工人的平均日产量不变,但是甲组工人数占两组工人总数的比重下降,则两组工人总平均日产量()A、上升B、下降C、不变D、可能上升,也可能下降9、权数对平均数的影响作用取决于()。

在统计计算中,用来衡量总体中各单位标志值在总体中作用大小的数值叫权数。

A、各组标志值的大小B、各组的次数多少C、各组次数在总体单位总量中的比重D、总体单位总量10、当各个变量值的频数相等时,该变量的()A、众数不存在B、众数等于均值C、众数等于中位数D、众数等于最大的数据值11、有8名研究生的年龄分别为21,24,28,22,26,24,22,20岁,则他们的年龄中位数为()A、24B、23C、22D、2112、下列数列平均数都是50,在平均数附近离散程度最小的数列是()A、0 20 40 50 60 80 100B、0 48 49 50 51 52 100C、0 1 2 50 98 99 100D、0 47 49 50 51 53 10013、如果你的业务是提供足球运动鞋的号码,那么,哪一种平均指标对你更有用?()A、算术平均数B、几何平均数C、中位数D、众数14、假定某人6个月的收入分别是1800元,1840元,1840元,1840元,1840元,8800元,反映其月收入一般水平应该采用()A、算术平均数B、几何平均数C、众数D、调和平均数15、某组数据分布的偏度系数为正时,该数据的众数、中位数、均值的大小关系是()A、众数>中位数>均值B、均值>中位数>众数C、中位数>众数>均值D、中位数>均值>众数二、填空题1、某班的经济学成绩如下表所示:43 55 56 56 59 60 67 69 73 75 77 77 78 79 80 81 82 83 83 83 84 86 87 88 88 89 90 90 95 97该班经济学成绩的平均数为,众数为,中位数为,上四分位数为,下四分位数为,四分位差为,离散系数为。

数据分布特征的描述

数据分布特征的描述
邋 ( x -x )= 0 或 者 ( x -x )f= 0
2019/9/1
版权所有 BY 统计学课程组
15
算术平均数的性质
2019/9/1
版权所有 BY 统计学课程组
16
算术平均数(均值)特征:
1. 集中趋势的最常用测度值; 2. 一组数据的均衡点所在; 3. 易受极端值的影响; 4. 由组距分组资料计算的均值有近似值性质; 5、用于数值型数据,不能用于分类数据和顺
(CM) (人)
152
1
154
2
155
2
156
4
157
1
158
2
159
2
160 12
161
7
162
8
163
4
2019/9/1
身高 人数
(CM) (人)
164
3
165
8
166
5
167
3
168
7
169
1
170
5
171
2
172
3
174
1
总计 83
版权所有 BY 统计学课程组
STAT
众数
32
注意:
众数不仅适用于测度顺序数据和 数值型数据的集中趋势,而且适用 于测度不能计算平均数的分类数据 的集中趋势。
2019/9/1
版权所有 BY 统计学课程组
3
数据分布的特征:
一、集中趋势:反映数据向其中心靠拢或 聚集

程度;
二、离中趋势;数据远离中心的趋势(又称离散
程度);
三、偏态和峰态;偏态是对数据分布对称性的度
量;峰度是指数据分布的平峰或尖峰程度

应用统计学(第三章 数据的描述性分析)

应用统计学(第三章 数据的描述性分析)

累积频率 Cumulative P
0.02 0.09 0.28 0.63
0.84 0.95 1.00
a.自然值进行分组,最大值17,最小值11 b.数据主要集中在14,向两侧分布逐渐减少
(3)计量数据
100例健康男子血清总胆固醇(mol/L)测定结果
4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 6.51 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.49 5.30 4.97 3.18 3.97 5.16 5.10 5.85 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90
15
21
0.21
0.84
16
11
0.11
0.95
17
5
0.05
1.00
表 2-2 100只梅花鸡每月产蛋数次数分布表
每月产蛋数
11 12 13 14 15 16 17

第3章统计学数据分布特征的描述

第3章统计学数据分布特征的描述

第3章统计学数据分布特征的描述统计学是一门研究收集、分析和解释数据的学科。

在统计学中,数据分布特征的描述是指通过一系列统计量和图表来描述数据的集中趋势、离散程度和分布形态等特征。

数据的集中趋势描述了数据的平均水平或中心。

常用的统计量有平均值、中位数和众数。

平均值是将所有观测值相加然后除以观测值的总数,它能够反映数据的总体平均水平。

然而,当数据包含异常值时,平均值的计算结果可能会受到影响。

因此,中位数和众数在这种情况下被认为是更稳健的集中趋势度量。

中位数是将数据按大小排序,然后找出中间位置的观测值。

众数是数据中出现次数最多的观测值。

数据的离散程度描述了数据的变异程度或分散程度。

常用的统计量有方差、标准差和四分位差。

方差是观测值与均值之间差异的平方的平均值,它反映了数据的总体离散程度。

标准差是方差的平方根,用于衡量数据的波动性。

四分位差是数据的上四分位数和下四分位数之差,它描述了数据的中间50%的变异程度。

数据的分布形态描述了数据的形状和对称性。

常用的分布形态有正态分布、偏态分布和峰态分布。

正态分布是最常见的分布形态,其特点是对称、钟形曲线。

偏态分布是指数据分布不对称的情况,主要分为正偏态和负偏态。

正偏态分布意味着数据的尾部偏向右侧,负偏态分布则意味着数据的尾部偏向左侧。

峰态分布用于描述数据的峰值的尖锐程度,主要分为正态分布、高峰态和低峰态。

除了统计量,还可以使用图表来对数据分布特征进行描述。

常用的图表包括直方图、箱线图和散点图。

直方图是通过将数据分组并在坐标轴上绘制各组的频率或相对频率来展示数据的分布形态。

箱线图通过绘制数据的分位数和异常值来展示数据的中位数、四分位数和离群观测值。

散点图用于展示两个变量之间的关系,特别适用于发现变量之间的相关性和异常值。

综上所述,统计学中的数据分布特征描述是通过一系列统计量和图表来描述数据的集中趋势、离散程度和分布形态等特征。

这些描述能够帮助我们更好地理解数据,并对数据进行分析和解释。

统计学第三章知识题

统计学第三章知识题

第三章数据分布特征的描述一、单选题1. 如果所掌握到的只是各单位的标志值(变量值),这时计算算术平均数()。

A 应用简单算术平均数B应用加权算术平均数C用哪一种方法无法判断D这种资料不能计算算术平均数2. 加权算术平均数受什么因素的影响()。

A 只受各组变量值大小的影响B只受各组次数多少的影响C同时受以上两种因素的影响D无法做出判断3. 权数本身对加权算术平均数的影响决定于()。

A 权数所在组标志值的大小B权数绝对数值的大小C各组单位数占总体单位数比重的大小D总体单位数的多少4. 标志值的次数多少,对于算术平均数的影响有权衡轻重的作用。

若把标志值的次数都缩小为原来的十分之一,则算术平均数的值为()。

A 也缩小为原来的十分之一B保持不变C扩大为原来的十倍D无法判断5. 如果被平均的每一个标志值都增加5个单位,则算术平均数的数值()。

A 也增加5个单位B只有简单算术平均数是增加5个单位C减少5个单位D保持不变6. 设某企业在基期老职工占60%,而在报告期准备招收一批青年工人,估计新职工所占的比重将比原来增加20%。

假定老职工和新职工的工资水平不变,则全厂职工的总平均工资将如何变化()。

A 提高B降低C不变D无法判断7. 设有8个工人生产某种产品,他们的日产量(件)按顺序排列是:4、6、6、8、9、12、14、15,则日产量的中位数是()。

A 4.5B8和9 C8.5 D没有中位数8. 在下列哪种情况下, 算术平均数、众数和中位数三者相等()。

A 只有钟形分布B只有U形分布C钟形分布或U形分布D只有对称的钟形分布9. 当变量右偏分布时,有()。

A Mo<Me<XB Mo>Me>XC Mo≤Me≤XD Mo≥Me≥X10. 设有某企业职工人数和工资水平资料如下:报告期的总平均工资低于基期的总平均工资,原因是:()。

A 各组工资水平的变动B各组人数的增加C各组人数结构的变动D职工收入的下降11. 总体的离散程度越大,说明()。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Mp
k xi k i 1
N
N
特例情况
算术平均数(幂指数 k=1)
幂平均数
调和平均数(幂指数 k=-1) 几何平均数(幂指数 k0) 其他幂平均数
k=1:算术平均数
加权
1 x i N
简单
xi wi
i 1
N

wi
x
i 1
xi
N
N
k=-1:调和平均数
一、集中趋势指标及作用
集中趋势(Central tendency)
集中趋势 即一组数据向其中心值聚集或靠 拢的倾向和程度。 用平均指标表示,代表数据的一 般水平。 测定集中趋势是认识数据分布特征的 基本内容。
集中趋势指标有两类:
数值平均数 根据全部数据计算得到的代表值。 优点:数学性质良好,可用于统计推断 缺点:易受极端值影响。 主要有算术平均数、调和平均数及几 何平均数,三者均为幂平均数特例。
加权
MH
1 N Ni 1 1 1 wi wi i 1 xi i 1 xi
i 1

N
wi

N
wi
简单
MH
1
i 1

N
1 xi

N
i 1

N
1 xi
N
k0:几何平均数
加权
MG
简单
w
i 1
N
i
w1 x1
w2 x2

wN xN
MG
N
二、数值平均数
(一)幂平均数
幂,power 变量X取N个值: x1 , x2 , , xN。 权数为一组正数: w1 , w2 , , wN 。 加权幂平均数一般形式为: 其中,k 为任意实数。
Mp k
i 1 N
xi
i 1
N
k
wi

wi
权数w均相等时,加权平均数退化为简单 平均数:
Leabharlann i 1 i 1
MH xi wi w N 1 x i N xi N i i 1 wi wi i 1 i 1
N
1 N 1 wi i 1 xi
i 1

N
wi
1 N 1 w N i i 1 xi w i i 1
数据分布的位置特征数实际上也是数据的代表值,
代表了数据的一般水平。 在不同场合,可以适当选用平均数、中位数、众数充 当位置特征数(代表值) 其中平均数不同于中位数、众数的特点在于: 平均数是由所研究的全体数据参加计算所得。
平均数的一般形式叫做幂平均数。常见的有算
术平均数、几何平均数、调和平均数。
位置平均数 根据对总体中处于特定位置的单个或部 分单位标志值直接观察或推算确定的代表值。 优点:不易受极端值影响,具有较好稳健性。 缺点:不宜用作统计推断。 主要包括众数和中位数。
一、集中趋势指标及作用
集中趋势指标作用
1.反映变量分布的集中趋势和一般水平。 如用平均工资了解职工工资分布的中心, 反映职工工资的一般水平。
1.简单算术平均数 对未分组数据,采用简单算术平均数公式。即 把各项数据直接加总,然后除以总项数。 计算公式:
x
i 1
xi
N
N
举例
表 3-1 男性 22 22 25 25 25 女性 22 22 25 25 25
解:采用简单算术平均法计算,即全体队员的
平均年龄为(单位:周岁)
22 22 25 25 25 25 25 30 30 50 22 ... 30 20 538 分组数据不能简单平 26.9 20 均 !因为各组变量值 表 3-2 的次数(权数)不等! 年龄 人数(人) 若采用简单平均:
2.比较同一现象在不同空间或不同阶段的发 展水平,反映现象变化特征、趋势和规律性。 能消除总体规模差异造成的不利影响; 在一定程度上减弱偶然因素的影响。
3.分析现象之间的依存关系。
如研究劳动者文化程度与收入的关系。
4.(数值)平均指标是推断统计中的重要 统计量,是进行统计推断的基础。
几种常见的位置特征数
x1 x2 xN
关于加权问题 权数确定方式: 客观权数: 权数由实际统计资料获得或推算。 主观权数: 根据研究问题,由研究者主观赋值。 权数作用: 权衡变量的各种取值在计算平均数时的重 要性。 权数作用,根本上是通过权数结构实现。
权数作用: 即使不改变被平均的数值,仅改变权数结构,即 可改变平均数水平。 例如,改变教师职称结构,而不改变各种职 称教师课时费标准,会改变平均课时费水平。
权数实质 权数的实质在于其结构,即结构比例形式(比重 权数)。 其更能清晰表明权数之权衡轻重的作用。
k 权数形式有2种: xi wi N w k i M p k i 1 x 绝对数形式 k i N N i 1 wi w 结构比例形式 i N
wi
MG
wi
i 1
N
wN w2 x1w1 x2 xN xi i1 i 1
N
wi
N
(二)算术平均数 算术平均数(Arithmetic mean ),也称均 值(mean)。 由一组数据的总和(总体标志总量)除以 该组数据的项数(总体单位总量)得到; 算术平均数=总体标志总量/总体单位总量 是最常用的数值平均数; 根据掌握资料不同,其有多种计算公式。
数据分布特征与测度:概览
集中趋势 (位置) 离中趋势 (分散程度) 偏态和峰态 (形状)
数据分布特征测度
集中趋势
幂平均数 中位数 众 数
离散程度
极差 平均差 方差、标准差 异众比率 变异系数
分布形状
偏 度
峰 度
第一节 统计变量集中趋势测定
一 集中趋势指标及作用 二 数值平均数 三 众数与中位数(位置平均数)
本章学习任务
以数值特征,对统计数据分布进行量化描述。
主要包括三方面:
集中趋势
用平均指标描述(位置特征); 离中趋势 用变异指标描述(离散特征); 偏斜程度 用偏度和峰度描述(偏斜特征、峰度特征)。
学习要求:
理解测度统计数据集中趋势、离散程度的概念 、指标、相互关系; 掌握主要分析指标的计算方法和应用场合,并能 熟练进行相关计算分析。
相关文档
最新文档