第4章离散趋势测度

合集下载

离散程度的测度

离散程度的测度

离散程度的测度(一)离散程度的测度1.离散程度是指数据之间的差异程度或频数分布的分散程度。

2.离散程度和集中趋势是两个同样重要的数据分布特征。

集中趋势的测度值是对数据一般水平的一个概括性变量,它对一组数据的代表程度,取决于该组数据的离散水平。

3.数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,其代表性就越好。

(二)极差、标准差和方差【例如】根据下表中的数据,计算100个会员企业年销售额方差和标准差。

销售额(万元)【思考】通过10省调查得知,刚满周岁的女童体重均数为8.42kg,标准差为0.98kg;身高均数为72.4cm,标准差为3.0cm,试比较二者的离散程度?『正确答案』体重的离散系数:0.98÷8.42×100%=11.64%身高的离散系数:3.0÷72.4×100%=4.14%(三)离散系数含义离散系数通常是就标准差来计算的,因此也称标准差系数;它是一组数据的标准差与其相应的算术平均数之比,是测度数据离散程度的相对指标。

目的为了消除变量值水平高低和计量单位不同对离散程度测度值的影响。

计算公式应用主要是用于比较对不同组别数据的离散程度。

离散系数大的说明数据的离散程度也就大,离散系数小的说明数据的离散程度也就小。

【例题·单选题】(2004)某学校学生的平均年龄为20岁,标准差为3岁;该校教师的平均年龄为38岁,标准差为3岁。

比较该校学生年龄和教师年龄的离散程度,则( )。

A.学生年龄和教师年龄的离散程度相同B.教师年龄的离散程度大一些C.教师年龄的离散程度是学生年龄离散程度的1.9倍D.学生年龄的离散程度大一些『正确答案』D『答案解析』本题考查离散系数。

平均值不同的情况下,用离散系数比较离散程度。

学生年龄的离散系数=3/20×100%=15%。

教师年龄的离散系数=3/38×100%=7.89%。

统计学习题_第四章_数据分布特征的描述习题答案

统计学习题_第四章_数据分布特征的描述习题答案

统计学习题_第四章_数据分布特征的描述习题答案第四章静态指标分析法(⼀)⼀、填空题1、数据分布集中趋势的测度值(指标)主要有、和。

其中和⽤于测度品质数据集中趋势的分布特征,⽤于测度数值型数据集中趋势的分布特征。

2、标准差是反映的最主要指标(测度值)。

3、⼏何平均数是计算和的⽐较适⽤的⼀种⽅法。

4、当两组数据的平均数不等时,要⽐较其数据的差异程度⼤⼩,需要计算。

5、在测定数据分布特征时,如果M M e X 0==,则认为数据呈分布。

6、当⼀组⼯⼈的⽉平均⼯资悬殊较⼤时,⽤他们⼯资的⽐其算术平均数更能代表全部⼯⼈⼯资的总体⽔平。

⼆.选择题单选题:1.反映的时间状况不同,总量指标可分为()A 总量指标和时点总量指标B 时点总量指标和时期总量指标C 时期总量指标和时间指标D 实物量指标和价值量指标2、某⼚1999年完成产值200万元,2000年计划增长10%,实际完成了231万元,超额完成( )A 5.5%B 5%C 115.5%D 15.5%3、在同⼀变量数列中,当标志值(变量值)⽐较⼤的次数较多时,计算出来的平均数()A 接近标志值⼩的⼀⽅B 接近标志值⼤的⼀⽅C 接近次数少的⼀⽅D 接近哪⼀⽅⽆法判断4、在计算平均数时,权数的意义和作⽤是不变的,⽽权数的具体表现()A 可变的B 总是各组单位数C 总是各组标志总量D 总是各组标志值 5、1998年某⼚甲车间⼯⼈的⽉平均⼯资为520元,⼄车间⼯⼈的⽉平均⼯资为540元,1999年各车间的⼯资⽔平不变,但甲车间的⼯⼈占全部⼯⼈的⽐重由原来的40%提⾼到了60%,则1999年两车间⼯⼈的总平均⼯资⽐1998年()A 提⾼D 不能做结论 6、在变异指标(离散程度测度值)中,其数值越⼩,则()A 说明变量值越分散,平均数代表性越低B 说明变量值越集中,平均数代表性越⾼C 说明变量值越分散,平均数代表性越⾼D 说明变量值越集中,平均数代表性越低7、有甲、⼄两数列,已知甲数列:07.7,70==甲甲σX ;⼄数列:41.3,7==⼄⼄σX 根据以上资料可直接判断( )A 甲数列的平均数代表性⼤B ⼄数列的平均数代表性⼤C 两数列的平均数代表性相同D 不能直接判别8、杭州地区每百⼈⼿机拥有量为90部,这个指标是()A 、⽐例相对指标B 、⽐较相对指标C 、结构相对指标D 、强度相对指标9、某组数据呈正态分布,计算出算术平均数为5,中位数为7,则该数据分布为() A 、左偏分布 B 、右偏分布 C 、对称分布 D 、⽆法判断10、加权算术平均数的⼤⼩() A 主要受各组标志值⼤⼩的影响,与各组次数多少⽆关; B 主要受各组次数多少的影响,与各组标志值⼤⼩⽆关; C 既与各组标志值⼤⼩⽆关,也与各组次数多少⽆关; D 既与各组标志值⼤⼩有关,也受各组次数多少的影响11、已知⼀分配数列,最⼩组限为30元,最⼤组限为200元,不可能是平均数的为() A 、50元 B 、80元 C 、120元 D 、210元12、⽐较两个单位的资料,甲的标准差⼩于⼄的标准差,则()A 两个单位的平均数代表性相同B 甲单位平均数代表性⼤于⼄单位C ⼄单位平均数代表性⼤于甲单位D 不能确定哪个单位的平均数代表性⼤ 13、若单项数列的所有标志值都增加常数9,⽽次数都减少三分之⼀,则其算术平均数() A 、增加9 B 、增加6 C 、减少三分之⼀ D 、增加三分之⼆ 14、如果数据分布很不均匀,则应编制 ( )A 开⼝组B 闭⼝组C 等距数列D 异距数列 15、计算总量指标的基本原则是:( )A 总体性B 全⾯性16、某企业的职⼯⼯资分为四组:800元以下;800-1000元;1000—1500元;1500以上,则1500元以上这组组中值应近似为 ( )A1500元 B 1600元 C 1750元 D 2000元 17、统计分组的⾸要问题是 ( )A 选择分组变量和确定组限B 按品质标志分组C 运⽤多个标志进⾏分组,形成⼀个分组体系D 善于运⽤复合分组18、某连续变量数列,其末组为开⼝组,下限为200,⼜知其邻组的组中值为170,则末组组中值为 ( )A 230B 260C 185D 215 19、分配数列中,靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,这种分布的类型是 ( )A 钟型分布B U 型分布C J 型分布D 倒J 型分布 20、要了解上海市居民家庭的开⽀情况,最合适的调查⽅式是:() A 普查 B 抽样调查 C 典型调查 D 重点调查21、已知两个同类企业的职⼯平均⼯资的标准差分别为5元和6元,⽽平均⼯资分别为3000元,3500元则两企业的⼯资离散程度为 ( )A 甲⼤于⼄B ⼄⼤于甲C ⼀样的D ⽆法判断 22、加权算术平均数的⼤⼩取决于 ( )A 变量值B 频数C 变量值和频数D 频率23、如果所有标志值的频数都减少为原来的1/5,⽽标志值仍然不变.那么算术平均数 ( ) A 不变 B 扩⼤到5倍 C 减少为原来的1/5D 不能预测其变化 24、计算平均⽐率最好⽤ ( )A 算术平均数B 调和平均数C ⼏何平均数D 中位数25、若两数列的标准差相等⽽平均数不同,在⽐较两数列的离散程度⼤⼩时,应采⽤ ( ) A 全距 B 平均差 C 标准差 D 标准差系数26、若n=20,∑∑==2080,2002x x ,标准差为 ( )A 2B 4C 1.5D 327、已知某总体3215,3256==eMM,则数据的分布形态为( )A左偏分布 B 正态分布 C 右偏分布 D U型分布28、⼀次⼩型出⼝商品洽谈会,所有⼚商的平均成交额的⽅差为156.25万元,标准差系数为14.2%,则平均成交额为( )万元A11 B 177.5 C 22.19 D 8826、欲粗略了解我国钢铁⽣产的基本情况,调查了上钢、鞍钢等⼗⼏个⼤型的钢铁企业,这是()A普查B重点调查C典型调查D抽样调查多选题:1.某企业计划2000年成本降低率为8%,实际降低了10%。

离散趋势的度量

离散趋势的度量

xi − x zi = S
二、变异系数
1)标准差与其相应的均值之比 消除数据水平高低和计量单位的影响度量了数 据的相对离散程度 2)用于对不同组别数据离散程度的比较 3)计算公式为
S Vs = x
例6 8家企业的产品销售数据如表3.1。试比较产 品销售额与销售利润的离散程度
表3.2.3 某管理局所属8家企业的产品销售数据 产品销售额(万元) 销售利润(万元) 企业编号
例3 设有数据如下:10,5,9,13,6,8。计 算它们的修正方差、标准差。 解:
S =
2 n−1
∑( x − x)
i =1 i
n
2
n −1
= 8.3
2
S n −1 =
∑ (x
i =1
n
i
− x)
n −1
= 8.3 = 2.88
8、方差的简化计算公式 方差
1 N 1 N 2 S 2 = ∑ ( xi − x ) 2 = ∑ x i − ( x ) 2 N i =1 N i =1
X1
X2
1 2 3 4 5 6 7 8
170 220 390 430 480 650 950 1000
8.1 12.5 18.0 22.0 26.5 40.0 64.0 69.0
解: X1=536.25(万元) =536.25(万元) S1=309.19(万元) =309.19(万元) X2=32.5215(万元) =32.5215(万元) S2=23.09(万元) =23.09(万元)
QU = 28+0.25(30-28) = 28.5
例 7 根据下表 3.2.3 中的数据,计算甲城市家庭 对住房满意状况评价的四分位数
表3.2.4 甲城市家庭对住房状况评价的频数分布

统计学第四章第三节

统计学第四章第三节

第二节离散程度的测度10天道森供应公司克拉克批发公司5 0.54 0.49 10 11 工作日数 7 8 9 10 11 12 13 14 15 工作日数集中趋势只是数据分布的一个特征,数据的离中趋势是数据分布的另一个重要特征。

两者是反映总体数据分布特征的一对对立统一的代表值。

一、离散程度指标,又称标志变异指标,标志变动度。

(一)定义就是总体各项标志值差别大小的程度。

(二)应用1.主要是评价平均数代表性的依据。

平均数的代表性与标志变动度的数值成反比。

例如:有甲乙两组工人,人数都是5人。

每人每日产量:甲:5 20 45 85 95乙:48 49 50 51 52平均数 5095-59052-48 42.标志变动度可以用来反映社会生产和其他社会经济活动过程的均衡性或协调性。

标志变动度小,就说明生产或经济活动各阶段变动幅度小,是均衡的协调的,反之,就是不均衡,不协调的。

二、测量标志变动度的主要方法(一)异众比率——分类数据,顺序数据,数值型数据1 定义:异众比率,即非众数组的频数占总频数的比率。

2 公式:Vr=(∑fi —fm)/ ∑fi =1—fm/ ∑fi∑fi变量值的总频数,fm众数组的频数。

3作用:主要用于衡量众数对一组数据的代表程度。

异众比率越大,说明非众数组的频数占总频数的比重越大,众数的代表性就越差;反之,异众比率越小,说明非众数组的频数占总频数的比重越小,众数的代表性越好。

4 适用范围:测定分类数据(也可以是顺序数据,数值型数据)的离散程度饮料品牌频数可口可乐 15旭日升 11百事可乐 9汇源果汁 6露露 9合计 50异众比率解:Vr=(∑fi —fm)/ ∑fi=1—fm/ ∑fi=(50—15)/50=35/50=0.7=70%(二)四分位差——顺序数据数值型数据1 定义:上四分位数和下四分位数之差。

2 公式: Qd=Qu—Ql3 作用:反映了中间50%数据的离散程度。

其数值越小,说明中间的数据越集中,数值越大,说明中间的数据越分散。

离散趋势指标

离散趋势指标

• 离散系数通过计算绝对指标与均值的比率,
从而消除了变量绝对水平与计量单位对绝 对离散指标的影响,因而离散系数可用于 比较不同随机变量的离散程度的大小或平 均指标代表性的大小。
分布的偏度和峰度
一、皮尔逊偏度系数 皮尔逊偏度系数是利用算术平均值和众 数之间的关系来测定随机变量密度曲线的 偏斜状态的。 公式为 SK p =
四分位数
(quartile) quartile) 1. 排序后处于25%和75%位置上的值 排序后处于25%和75%位置上的值
25%
QL
25%
25%
QM
25%
QU
2. 不受极端值的影响 3. 主要用于顺序数据,也可用于数值型数据, 主要用于顺序数据,也可用于数值型数据, 但不能用于分类数据
四分位数
309.19 =0.577 v 1= 536.25
x2 = 32.5215(万元) s2 = 23.09(万元)
23.09 v 2= =0.710 32.5215
结论: 计算结果表明,v1<v2,说明产品销售额 结论: 计算结果表明, 的离散程度小于销售利润的离散程度 ,则销售 额的平均值代表性较高。 额的平均值代表性较高。
• 2、作用:消除现象由于不同计量单位、不
同平均水平所产生的影响。 σ
V= x ×100%
离散系数
(例题分析) 例题分析)
【 例 】某管理局抽查了所属的8家企业,其产品销售数 某管理局抽查了所属的8家企业, 据如表。 据如表。试比较产品销售额与销售利润的离散程度
某管理局所属8 某管理局所属8家企业的产品销售数据
Vr
∑F − F = ∑F
i i
m
Fm = 1− ∑Fi

统计学原理第4章:数据特征的描述

统计学原理第4章:数据特征的描述

第四章 数据特征的描述
某公司400名职工平均工资计算表 单位:元
按月工资 组中值 职工
分组
x
人数
f
x f
比重(%)
f
f


③ ④=②×③ ⑤=③÷ 400
1100以下 1000
60
60000
15
1100-1300 1200 100 120000
25
1300-1500 1400 140 196000
35
分组
职工 人数
f
x f

1100以下 1100-1300 1300-1500 1500-1700 1700以上

1000 1200 1400 1600 1800
③ ④=②×③
60
60000
100 120000
140 196000
60
96000
40
72000
人数为权数
x x f f
544000 400
算术平均数、调和平均数、中位数、众数、几何平均数
3. 各种平均数的Excel操作
24/77
1. 集中趋势的含义
第四章 数据特征的描述
集中趋势是一组数据向其中心值靠
拢的倾向和程度
测度集中趋势就是寻找数据一般水
平的代表值或中心值
中心值 即:平均水平

25/77
2. 集中趋势的度量方法
第四章 数据特征的描述
第四章 数据特征的描述
《统计学原理》(第3版)
第四章 数据特征的描述
学习目标
第一节 总量与相对量的测度 第二节 集中趋势的测度 第三节 离散程度的测度
2/77
第一节 总量与相对量的测度

第4章数据分布特征的测度精品PPT课件

第4章数据分布特征的测度精品PPT课件

位 置: 1 2 3 4 5 6 7 8
9
位置 n 1 9 1 5 22
中位数Me 1080
统计函数—MEDIAN
数值型数据的中位数(偶数个数据)
例4-2:10个家庭的人均月收入数据
排 序: 660 750 780 850 960 1080 1250 1500 1630 2000
位 置: 1 2 3 4 5 6
集中趋势
离散程度
分布的形状
位置 平均数
众数 中位数
数值 平均数
算术平均数 几何平均数
全距 方差 标准差 变异系数
偏态 系数
峰度 系数
数据分布特征的测度
4.1 集中趋势的测度 4.2 离中趋势的测度 4.3 偏度和峰度的测度
学习目标
了解集中趋势指标的概念、特点和作用,掌握各 种平均数的计算方法、应用条件以及几种平均数之间 的关系。 了解离中趋势指标的概念、种类和作用及与平均 指标的区别。其中重点是标准差与离散系数的计算。 了解数据的分布形态测定方法。 了解各项指标的应用原则,能结合实际调查资料 计算有关指标和进行初步的分析。
Mo=不满意
统计函数—MODE
4.1.2 中位数(median)
1. 按数值大小排序后处于中间位置上的值;
50%
Me
2. 不受极端值的影响;
50%
3. 主要用于定序数据,也可用定量数据,但不能用 于定类数据;
数值型数据的中位数(奇数个数据)
例4-1: 9个家庭的人均月收入数据
原始数据: 1500 750 780 1080 850 960 2000 1250 1630 排 序: 750 780 850 960 1080 1250 1500 1630 2000

统计学课后习题与答案 郑贵华、颜泳红主编 湘潭大学出版:第四章 数据分布特征的度量

统计学课后习题与答案   郑贵华、颜泳红主编 湘潭大学出版:第四章 数据分布特征的度量

第四章思考与习题一、思考题1.什么是集中趋势?测度集中趋势常用指标有哪些?2.算术均值.众数和中位数有何关系?3.什么是几何平均数?其适用场合是什么?4.什么叫离散趋势?测度离散趋势常用指标有哪些?5.为什么要计算离散系数?二、练习题(一)填空题1.统计数据分布的特征,可以从三个方面进行测度和描述:一是分布的__________,反映所有数据向其中心值靠拢或聚集的程度;二是分布的__________,反映各数据远离其中心值的趋势;三是分布的__________,反映数据分布的形状。

2.在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080.750.1080.850.960.2000.1050.1080.760.1080.950.1080.660,则其众数为,中位数为。

3.算术均值有两个重要数学性质:各变量值与其算术均值的__________等于零;各变量值与其算术均值的__________等于最小值。

4.简单算术均值是__________的特例。

4.几何均值主要用于计算__________的平均。

5.在一组数据分布中,当算术均值大于中位数大于众数时属于________分布;当算术均值小于中位数小于众数时属于________分布。

6.__________是各变量值与其均值离差平方的平均数,是测度数值型数据__________最主要的方法。

7.为了比较人数不等的两个班级学生的学习成绩的优劣,需要计算__________;而为了说明哪个班级学生的学习成绩比较整齐,则需要计算________。

8.偏态是对数据分布__________或__________的测度;而峰度是对数据分布_________的测度。

(二)判断题1.众数的大小只取决于众数组与相邻组次数的多少。

()2.当总体单位数n为奇数时,中位数=(n+1)/2。

()3.根据组距分组数据计算的均值是一个近似值。

()4.若已知甲企业工资的标准差小于乙企业,则可断言:甲企业平均工资的代表性好于乙企业。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
变异系数(离散系数): 数列的离散水平指标与数列均
V 值的比值。
VR

R x
VAD

AD x
V


x
离散程度的度量
(一)全距和四分位差 (二)平均差 (三)方差和标准差
(四)变异系数 (五)偏度
4.3 统计分佈的形态
相对于正态分佈而言,总体的分佈是否对称? 集中趋势是高是低?分别用偏度和峰度指标 来反映。
20 18
集中趋势弱、
16 14
离散趋势强
12
10
8
6
4
2
0
x 164cm 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175
140 120
集中趋势强、
(x x)2 N 1
方差及标准差的计算
一般的计算过程:列表
第一步 第二步 第三步 第四步 计算均值 计算离差 离差平方 乘以权数
x x x (x x)2 (x x)2 f
简捷计算方法:不计算离差
2 x2 x2 x2 f x2 f
方差及标准差的作用
5
165 166
165 166
165 167
165 167

2 167 168 168 168 168 168 168 168 169
0
170 172
170 174
170 185
11Q79001 117900Q2127001Q1371
172
172
152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175
SK

m3
3
对称分布 左偏分布 右偏分布
0
数据向左边 延伸得更多
偏态系数的含义
左偏分布(也称负偏分布):
偏态系数 SK< 0;偏态系数的 绝对值越大,偏斜越严重
数据向右边 延伸得更多
对称分布:偏态系数=0。
右偏分布(也称正偏分布) : 偏态系数SK> 0;偏态系数的 绝对值越大,偏斜越严重。
三阶中心矩、四阶中心矩可用来描述 偏度和峰度两个指标可检验数据集的分佈是
否接近正态分佈(Skew=0,Kurt=0)。统计实 务中常用来进行质量管理(如产品、过程等的 一致性、稳定性)
一、矩(动差 )
矩(动差 )—— 一系列刻画数据分布 特征的指标的统称。
• 变量值与数值 a 之离差的 K 次方的平均数 称为变量 x 关于 a 的K 阶矩,即:
全距=127040-152=2428(cm)
四分位差=1678-160=78(cm)
离散程度的度量
(一)全距和四分位差 (二)方差和标准差
(三)变异系数 (四)偏度
方差及标准差的概念
Var 2 S2
方差(variance):各变量值与其 算术平均数离差平方的算术平均数。
标准差(mean square deviation Standard deviation ):是方差的 算术平方根。也称均方差、均方根
zi

xi

x
若数据落在控制 线外,则认为生产过 程失去控制,判断错 误的概率小于0.5%。
控制上限 中心线
3 x
3 x
控制下限
质量控制统计中控制图的原理
国外一项研究表明,IQ 值呈 正态分布,其平均数为100,标准 差为15。问:凡 IQ 值高于145的 人都被视为天才,经验法则是否 支持这一论断?
N0 f0 Q
N f
是非标志的均值及标准差
是非标志的均值:
x


x

f

f
1 P 0Q P
是非标志的标准差:

(x x)2 f Q2P P2Q

PQ
f
PQ
某厂某月份生产了1000件产品, 其中合格品900件,不合格品100件。 求产品质量分布的集中趋势与离散 趋势。
离散程度的度量
(一)全距和四分位差 (二)平均差 (三)方差和标准差
(四)变异系数 (五)偏度
变异现象举例
如果某家人每天的食谱都是一样的,穷还是 富?南美安第斯山,穷人老是吃土豆和玉米
• 变异太小是“单调”、“斋”
宁欺山莫欺水
• 水裏的危险更多更隐蔽,猝不及防
什么是“戏剧性变化”
• 现实中的变化小,但无巧不成书,要把许多小概 率事件汇集一处,“浓缩”人生
《统计学》第二章 统计数据 STAT
大象 500 kg
免子 0.5kg
可比
x大象 3500 kg
x免子 2.5kg
《统计学》第二章 统计数据 STAT
身高
x身高
可 比
体重
x体重
身高的差异水平:cm 用变异系数可以相互比较
体重的差异水平:kg
《统计学》第二章 统计数据 STAT
说应明当该进学一生步两加科以考检试查成、绩鉴的别。
Z分数 相于zi一于以对平般-被位均3X的认或置成i建为大是绩议是于相0.是异+5同z个3:常i的的标值凡,数准x。Z即i据差s分都均。x数高可小
标准化的数值,标明 Xi 距 离其平均数的标准差个数。
异常值的诊断
Z分数法 异常值:
zi 3
n
(xi
a)k
fi
i1
n
fi
i 1
K 阶原点矩(当a = 0 时)是数据的K次方的平均数.
• 一阶原点矩即算术平均数;
• 二阶原点矩即平方平均数。 Nhomakorabea K 阶中心矩矩(当a =均值 时)是以均值为中心计 算的离差 K 次方的平均数
• k=1时,称为一阶中心矩,它恒等于0,即 m1=0; • k=2时,称为二阶中心矩,也就是方差,即m2=σ2。
0
极右偏态
+3
(二)由三个四分位数之间的关系求 偏态系数
Sk

Q3
Q1 2M e Q3 Q1
值域:-1 Sk 1
极左偏态
-1
对称分布
0
极右偏态
+1
偏度系数
(三)利用 3 阶中心矩来计算偏度系数。
• 测定偏度最常用的方法 • 原理:若分布不对称,则 3 阶中心矩不为0。
不对此程度愈严重, 3 阶中心矩的绝对值愈大。 为消除量纲的影响,可除以σ3。
z 4.63 167 168 168 168 18768 168 168 168 169 7.6627 170 170 170 170 170 171 171 172 172
172 174 185 190 190 200
异常值
练习:
前NBA 巨星Michael Jordan 身高78英寸, 而WNBA运动员 R.lobo身高76英寸。很明 显,Jordan高出2英寸,但谁相对来说更高 一些?Jordan在男性中的身高是否超过了 lobo在女性中的身高?(男性身高的平均数 为69.0英寸,标准差为2.8英寸;女性身高 平均数为63.6英寸,标准差为2.5英寸。)
男性笨还是女性笨?
在平均智力水平方面,男女并无明显差别。 但在被测为最聪明的2%人群和最傻的2%人 群中,男子人数均为女子的两倍。
参与这项研究的英国爱丁堡大学教授蒂莫 西·贝茨说:“男性更容易处在顶点和底部。”
《泰晤士报》提到一種理论,男子为在女性 面前更具魅力,会儘量提陞自己的智力。
10

方差及标准差的作用
99.73% 95.45% 68.27%
3 2 2 3
方差及标准差的作用某学《统生计学期》第末二考章 统试计时数据,数STAT 学成绩一为个85数分据,集据中此某计个算或的某
标准Z差几分可个数以数为用据0.来反5;常度英地量语大相成或对绩小为,一 位置和异7常0般分值称,的其Z检为分测极数端。也值是或0异.5常。值则,
显然,只了解变量的集中趋势是
不够的!
一、测定离散程度的指标及其作 用
1.说明数据的分散程度,反映变量的稳定性、 均衡性。
• 数据之间差异越大,变量的稳定性或均衡性越差。
2.衡量平均数的代表性。
• 离散程度越大,平均数的代表性就越小。
3. 统计推断的重要依据
• 判别统计推断前提条件是否成立, • 衡量推断效果好坏的重要尺度。
是非标志的均值及标准差
其值仅表现为具有某种特征 或不具有某种特征两种情况的标 志称为是非标志,也称交替标志。
性别:男、女(非男)
10
产品质量:合格、不合格
1
0
是非标志的均值及标准差
具有某种标志 总体单 的总体单位数 位总数
不具有某种标志 的总体单位数
N N1 N0
N1 f1 P
N f PQ 1
二、偏度(Skewness)
偏度——指数据分布的不对称程度或偏斜程 度。
• 以 对称分布 为标准来区分 • 偏态分布又分左偏(负偏)和右偏(正偏).
左偏分布 (负偏)
右偏分布 (正偏)
偏态的测度方法
(一)由均值与众数(中位数)之间的关系 求偏态系数:
一般有:
极左偏态
-3
Sk

x Mo

对称分布
16 160 160 160 160 160 160 160 160 161
14 12
极161
161
相关文档
最新文档