练习题解答:第五章集中趋势与离散趋势

合集下载

第五章离散趋势的测量

第五章离散趋势的测量
U
• QU=(1500+1630)÷2=1565(元) QU=(1500+1630) 1565(元) • QL和QU之间包含了50%的数据,因此,我 QL和QU之间包含了50%的数据,因此,我
们可以说有一半的家庭人均月收入在815~ 们可以说有一半的家庭人均月收入在815~ 1565元之间。 1565元之间。 • 根据例3.2资料计算上下四分位数,那么家 根据例3.2资料计算上下四分位数,那么家 庭人均月收入的四分位差为: • QU—QL=? QU—
• 三、变异指标的作用 • 变异指标是描述数据分布的一个很重要的
特征值,因此,它在统计分析、统计推断 特征值,因此,它在统计分析、 中具有很重要的作用。 中具有很重要的作用。具体可以概括为以 下几点: 下几点:
• 1.反映总体各单位变量值分布的均衡性 1.反映总体各单位变量值分布的均衡性 • 一般来说,标志变异指标数值越大,总体 一般来说,标志变异指标数值越大,
• 2. 加权平均法 • 在资料分组的情况下,应采用加权平均式: 在资料分组的情况下,应采用加权平均式:
• 平均差计算简便,意义明确,而且平均差 平均差计算简便,意义明确,
是根据所有变量值计算的,每个数据均参 是根据所有变量值计算的, 与了计算,因此它能够准确地、 与了计算,因此它能够准确地、全面地反 映一组数值的变异程度。但是, 映一组数值的变异程度。但是,由于平均 差是用绝对值进行运算的, 差是用绝对值进行运算的,它不适宜于代 数形式处理, 数形式处理,所以在实际应用上受到很大 的限制。 的限制。
• [例3.13] 某厂甲、乙两组工人生产某种产
品的产量资料如表3.8所示。 品的产量资料如表3.8所示。
• 从计算结果看,甲、乙两组平均生产件数 从计算结果看,

定量资料统计描述——集中趋势与离散程度

定量资料统计描述——集中趋势与离散程度

度量单位不同资料之间离散度的比较; 均数相差悬殊的资料之间离散度的比较。
【例4-11】
某研究收集了100例7岁男孩的身高和体重的资料,身高均数为 123.10cm,标准差为4.71cm;体重均数为22.92kg,标准差为 2.26kg,比较这100例7岁男孩的身高和体重的变异度。
身高 CV
4.71 100 % 3.83 %
M X n1
当n为奇数时,
() 2
, 位置居中的观察值
当n为偶数时,
M
(X n ()
X n )/ ( 1)
2 ,计算出位次居中的两个观察值的均数
2
2
例:7名病人患某病的潜伏期分别为2,3,4,5,6,9,16天,求其中位数。
本例n=7,为奇数
M X 71 X 4 5(天 ) () 2
例:8名患者食物中毒的潜伏期分别为1,2,2,3,5,8,15,24小时,求其中位数。
本例n=8,为偶数
M
1
2
X 8
() 2
X 8
( 1) 2
1 2
X
4
X5
1 3 5 4(小时)
2
(二) 中位数的应用
中位数可用于各种分布的资料,在正态分布资料中,中位数等于 均数,在对数正态分布资料中,中位数等于几何均数。
中位数不受极端值的影响,因此,实际工作中主要用于不对称分 布类型的资料、两端无确切值(>100)或分布不明确的资料。
患者编号:1 2 3 4 5 6 7 8 9 ... 117 118 119 120 住院天数:1 2 2 2 3 3 4 4 5 ... 40 40 42 45
n=120,120*5%=6,为整数:
P5

集中趋势和离散趋势共96页

集中趋势和离散趋势共96页


29、在一切能够接受法律支配的人类 的状态 中,哪 里没有 法律, 那里就 没有自 由。— —洛克

30、风俗可以造就法律,也可以废除 法律。 ——塞·约翰逊
谢谢你的阅读
❖ 知识就是财富 ❖ 丰富你的人生
71、既然我已经踏上这条道路,那么,任何东西都不应妨碍我沿着这条路走下去。——康德 72、家庭成为快乐的种子在外也不致成为障碍物但在旅行之际却是夜间的伴侣。——西塞罗 73、坚持意志伟大的事业需要始终不渝的精神。——伏尔泰 74、路漫漫其修道远,吾将上下而求索。——屈原 75、内外相应,言行相称。——韩非
集中趋势和离散趋势

26、我们像鹰一样,生来就是自由的 ,但是 为了生 存,我 们不得 不为自 己编织 一个笼 子,然 后把自 己关在 里面。 ——博 莱索

27、法律如果不讲道理,即使延续时 间再长 ,也还 是没有 制约力 的。— —爱·科 克

Hale Waihona Puke 28、好法律是由坏风俗创造出来的。 ——马 克罗维 乌斯

集中趋势和离散趋势

集中趋势和离散趋势

Variance and Standard Deviation
返回总目录
集中趋势的测度
集中趋势是对频数分布资料的集中状况和平均水平的综 合测度。而离散趋势是对频数分布资料的差异程度和离 散程度的测度,用来衡量集中趋势所测度的代表性,或 者反映变量值的稳定性和均匀性。
常用来表达数列集中趋势的测度有算术平均数、调和平均 数、几何平均数、中位数和众数。这些测度在统计学中也 称为平均指标或平均数,可以用来反映标志值的典型水平 和标志值分布的中心位置或集中趋势。
几何平均数
(概念要点)
1. 2. 3. 4. 5. 集中趋势的测度值之一 N 个变量值乘积的 N 次方根 适用于特殊的数据 主要用于计算平均发展速度 计算公式为
GM N X 1 X 2 X N N X i
i 1 N
6. 可看作是均值的一种变形
1 log GM (log X 1 log X 2 log X N ) N

XH
m1 m2 m3 mn mn m1 m2 m3 X1 X 2 X 3 Xn
m
i 1 n
n
i
mi X i 1 i
调和平均数
(概念要点)
1. 集中趋势的测度值之一 2. 均值的另一种表现形式 3. 易受极端值的影响 4. 用于定比数据 5. 不能用于定类数据和定序数据 6. 计算公式为L源自fmfSm1
i
——中位数所在组的组距
也可以利用中位数所在组的上限来测算中位数,即中位数的 上限公式为 :
Me U
f
2
Sm 1 fm
i
式中: U
Sm1
——中位数所在组的上限 ——大于中位数组的各组次数之和

数据的集中趋势与离散程度

数据的集中趋势与离散程度

数据的集中趋势与离散程度统计学中,描述和衡量数据分布特征的两个重要方面是集中趋势和离散程度。

集中趋势指的是数据集中在哪个数值附近,而离散程度描述了数据的分散程度。

在本文中,我将详细介绍集中趋势和离散程度的定义、常用的衡量指标和如何应用。

一、集中趋势集中趋势是指数据集中在哪个数值处的趋势或位置,常用的衡量指标包括均值、中位数和众数。

1. 均值均值是数据集所有观测值的算术平均数。

它是最常用的衡量集中趋势的指标。

计算均值的方法是将所有观测值相加,再除以观测值的个数。

均值受极端值的影响较大。

2. 中位数中位数是将数据集按照大小排序后,位于中间位置的观测值。

如果数据集的个数是奇数,则中位数就是排序后位于中间的观测值;如果数据集的个数是偶数,则中位数是中间两个观测值的平均数。

中位数对极端值不敏感,更能反映数据的典型情况。

3. 众数众数是数据集中出现频率最高的观测值。

一个数据集可能存在一个众数,也可能存在多个众数,或者没有众数。

众数主要用于描述离散型数据。

二、离散程度离散程度是描述数据分散程度的指标,常用的衡量指标包括极差、方差和标准差。

1. 极差极差是数据集中最大观测值和最小观测值之间的差值。

极差越大,表示数据的离散程度越大;极差越小,表示数据的离散程度越小。

极差对极端值非常敏感。

2. 方差方差是数据集观测值与均值之差的平方的平均值。

方差衡量了数据与其均值之间的离散程度,数值越大表示数据的离散程度越大,反之亦然。

方差对极端值非常敏感。

3. 标准差标准差是方差的平方根,用于衡量数据集的离散程度。

标准差具有与原始数据相同的度量单位,比方差更容易解释和理解。

标准差越大,表示数据的离散程度越大,反之亦然。

三、应用集中趋势和离散程度的概念和指标在各个领域具有广泛的应用。

在金融领域,通过分析股票价格的均值和离散程度,可以评估股票的风险和收益。

在市场调研中,通过分析产品价格的中位数和标准差,可以了解市场需求和产品价值的稳定性。

集中趋势离散趋势的注意事项

集中趋势离散趋势的注意事项

集中趋势离散趋势的注意事项集中趋势和离散趋势是统计学中常用的描述数据分布的概念。

集中趋势主要关注数据的平均值,而离散趋势则关注数据的离散程度。

在研究数据时,我们需要同时考虑这两种趋势,以全面了解数据的特点。

以下是在分析集中趋势和离散趋势时需要注意的事项。

1. 选择合适的度量指标:在描述集中趋势时,通常使用均值、中位数和众数等指标。

均值是最常用的度量指标,但在存在极值或偏态分布的情况下,中位数可能更适用。

众数适用于描述离散型数据的集中趋势。

因此,在选择度量指标时,需要根据数据类型和分布情况权衡选择。

2. 注意极值的影响:极值数据可能会对集中趋势产生很大的影响。

均值很容易受到极值的干扰,因此在分析集中趋势时,应该考虑是否存在极值,并对其进行合理处理。

一种常见的处理方法是使用中位数来代替均值,以减弱极值对集中趋势的影响。

3. 理解离散趋势的度量:离散趋势可以通过范围、方差、标准差、四分位数范围等指标来度量。

范围描述了最大值和最小值之间的差异,但对极值较为敏感。

方差和标准差则考虑了每个数据点与均值的差异,是衡量离散趋势的常用指标。

四分位数范围指标描述了数据的中间50%的离散程度。

4. 观察分布的形状:集中趋势和离散趋势的分析应该结合观察数据分布的形状。

常见的数据分布形状包括对称型、偏态和峰态等。

对称型分布的集中趋势和离散趋势可以用单个指标描述,例如正态分布的均值和标准差。

而偏态和峰态分布可能需要使用更多的指标来描述集中和离散趋势。

5. 注意样本量的大小:样本量的大小对集中趋势和离散趋势的分析结果有很大的影响。

在样本较小的情况下,集中趋势和离散趋势的估计可能不够准确,容易受到抽样误差的影响。

因此,在分析数据时应考虑样本量的大小,并对统计推断结果进行适当的解释。

6. 针对特殊情况进行适当处理:在实际应用中,可能遇到一些特殊情况,如缺失值、异常值和重复值等。

对于缺失值,我们需要根据数据缺失的原因和模式进行处理,以减少对集中趋势和离散趋势分析结果的影响。

偏态分布的集中趋势和离散统计指标

偏态分布的集中趋势和离散统计指标

偏态分布的集中趋势和离散统计指标我们来介绍偏态分布的集中趋势指标。

均值是最常用的集中趋势指标,它表示一组数据的平均值。

均值的计算方法是将所有数据相加,然后除以数据的个数。

中位数是将一组数据按照从小到大的顺序排列,找出中间位置的数值,如果数据的个数为奇数,则中位数就是中间的那个数;如果数据的个数为偶数,则中位数是中间两个数的平均值。

众数是一组数据中出现次数最多的数值,可能有一个或多个众数。

我们来介绍偏态分布的离散统计指标。

方差是衡量数据分散程度的指标,它表示一组数据与其均值的偏离程度。

方差的计算方法是将每个数据与均值的差的平方相加,然后除以数据的个数。

标准差是方差的平方根,它的计算方法和方差类似,但是标准差更常用,因为它和原始数据的单位一致。

偏态分布的集中趋势和离散统计指标对数据的分布特征有很大的影响。

对于正偏态分布,均值大于中位数,表示数据的右侧尾部较长;对于负偏态分布,均值小于中位数,表示数据的左侧尾部较长。

通过观察均值和中位数的关系,我们可以初步判断数据的偏斜方向。

而方差和标准差则可以衡量数据的离散程度,数值越大表示数据越分散,数值越小表示数据越集中。

在实际应用中,我们经常使用偏态分布的集中趋势和离散统计指标来描述和分析数据。

例如,在金融领域,我们经常使用均值来衡量资产的收益率,使用标准差来衡量资产的风险;在人口统计学中,我们使用中位数来描述人口的收入水平,使用方差来衡量人口的收入差距。

偏态分布的集中趋势和离散统计指标是统计学中重要的概念和工具,它们可以帮助我们理解和描述数据的分布特征,从而进行更准确的数据分析和决策。

通过合理选择和运用这些指标,我们可以更好地理解数据背后的规律,并将其应用到实际问题中。

数据的集中趋势与离散程度知识梳理及典型问题

数据的集中趋势与离散程度知识梳理及典型问题

数据的集中趋势与离散程度知识梳理及典型问题作者:薛飞来源:《初中生世界·九年级》2016年第10期《数据的集中趋势与离散程度》这一章中我们主要学习了体现数据集中趋势的三种“数”——平均数、中位数和众数以及体现数据离散程度的两种“差”——极差与方差.平均数分“算术平均数”与“加权平均数”,我们重点理解加权平均数.加权平均数重在理解什么是“权”.课本中是这样定义“权”的:一组数据的平均数,不仅与这组数据中各个数据的值有关,而且与各个数据的“重要程度”有关.我们把衡量各个数据的“重要程度”的数值叫做“权”.例1 学校食堂午餐供应3元、4元和5元三种价格的盒饭,根据食堂某月销售午餐盒饭的统计图,计算该月食堂销售午餐盒饭的平均价格.【分析】这个题目给出的两组数据分别是:①午餐盒饭的价格为3元、4元和5元;②不同价格的盒饭所占的比例.题目最后要求的是午餐盒饭的平均价格,也就是说第①组数据是题目研究的数据对象,第②组数据中盒饭所占的比例是“权”.解:该月食堂销售午餐盒饭的平均价格为[15%×5+25%×3+60%×415%+25%+60%]=3.9(元).答:该月食堂销售的午餐盒饭的平均价格为3.9元.求中位数的一般步骤:①把数据从小到大排列;②若该数据含有奇数个数,位于中间位置的数是中位数,若该数据含有偶数个数,位于中间位置的两个数的平均数就是中位数.例2 有奇数个数据10,20,80,40,30,90,50,40,50,40,60,求这一组数据的中位数.【分析】把这组数据按从小到大的顺序排列10、20、30、40、40、40、50、50、60、80、90,该数据含有奇数个数,位于中间位置的数是中位数,所以该组数据的中位数为40.例3 一组数据分别为1,2,8,4,3,9,5,4,5,6,求这组数据的中位数.【分析】首先把这组数据按从小到大的顺序排列1,2,3,4,4,5,5,6,8,9,该组数据共有10个,所以第5个和第6个数据的平均数4.5为中位数.【点评】中位数的求法一定要注意先排序,后根据总数的奇偶来找出中位数,从例3中可以看出中位数4.5并不是原始数据,所以中位数也不一定是原始数据中的一个.一组数据中出现次数最多的数据叫做这组数据的众数.众数可以没有,可以只有一个,也可以有多个.例3 一次数学测验后,老师将全班40名学生的成绩整理后绘制成频数分布直方图,判断下列命题正确的是.①全班成绩的中位数在84~96这一组;②全班成绩的众数在84~96这一组.【分析】命题①正确,命题②在判断众数的时候往往会掉入陷阱,看到84~96这一组最高,所以众数确定就在这一组.举个反例便知错在哪里:84~96之间一共是12人,其中84分,85分,86分,87分各3人,而72~84这一组中的9人分数都是80分,显然全班成绩的众数不在84~96这一组,所以这题正确的只有命题①.极差概念简单,通俗地说就是最大数据与最小数据的差,反映了一组数据的变化范围.例4 某位射击运动员射击5次命中的环数分别为6,7,9,10,8,求极差.【分析】找出最大值和最小值即可,最大值为10环,最小值为6环,所以极差为10-6=4.描述一组数据的离散程度还有方差,方差的计算公式:s2=[ (x1-x)2+(x2-x)2+…+(xn-x)2n].例6 为了从甲、乙两人中选拔一人参加射击比赛,现对他们的射击成绩进行了测试,5次打靶命中的环数如下:甲:8,7,10,7,8;乙:9,5,10,9,7.(1)将下表填写完整:(2)根据以上信息,若你是教练,选择谁参加射击比赛,理由是什么?(3)若乙再射击一次,命中8环,则乙这6次射击成绩的方差会 .(填变大或变小或不变)【分析】通过计算得出甲乙两人的平均数都是8环,但是甲的极差比乙小,更重要的是甲的方差也比乙小,方差越小越稳定,所以教练会选择发挥较为稳定的甲参加比赛.第(3)问的解决需要用到方差的计算公式,原来5次射击的方差是这样计算的s2(5次)=[ (x1-8)2+(x2-8)2+…+(x5-8)25],增加一次8环的射击后,方差计算变成s2(6次)=[ (x1-8)2+(x2-8)2+…+(x5-8)2+(8-8)5+12].不难发现分子虽然增加了一项,但是分子的值并没有变化,但是分母却变大了,所以分子不变,分母变大,最终方差变小.(作者单位:江苏省常州市武进区湖塘实验中学)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

练习题解答:第五章--集中趋
势与离散趋势
———————————————————————————————— 作者:
———————————————————————————————— 日期:


第五章 集中趋势与离散趋势
练习题:
1. 17名体重超重者参加了一项减肥计划,项目结束后,体重下降的重量分别为:
(单位:千克)
12 10 15 8 2 6 14 12 10 12 10 10 11 10
5 10 16
(1)计算体重下降重量的中位数、众数和均值。
(2)计算体重下降重量的全距和四分位差。
(3)计算体重下降重量的方差和标准差。

解:

(1)错误!中位数:
对上面的数据进行从小到大的排序:
序号 1 2 3 4 5 6 7 8 9 1 16 1

数据 2 5 6 8 1 11 12 12 12 14 15 16

Md的位置=2117=9,数列中从左到右第9个是10,即Md=10。
\o\ac(

,2)众数:

绘制各个数的频数分布表:
数据 2 5 6 8 1
频数 1 1 1 1 6 1 3 1 1 1
“10”的频数是6,大于其他数据的频数,因此众数MO=“10”
错误!
均值:

18.1016521nnxX
n
i
i
(2)错误!全距:R=max(xi)-min(xi)=16-2=14
错误!
四分位差:

根据题意,首先求出Q1和Q3的位置:
Q1的位置=41n=4117=4.5,则Q1=8+0.5×(10-8)=9
Q3的位置=4)1(3n=4)117(3=13.5,则Q3=12+0.5×(12-12)=12
Q= Q3- Q1=12-9=3
(3)错误!方差:
2
2
1222()1(210.18)(510.18)(1610.18) 171 =12.404niixxSn



+?+

错误!
标准差:
2
12.403.52SS

2.下表是武汉市一家公司60名员工的省(市)籍的频数分布:
省(市)籍 频数(个)

湖北
28

河南
12

湖南
6

四川
6

浙江
5

安徽

(1)根据上表找出众值。
(2)根据上表计算出异众比率。

解: (1)“湖北”的频数是28,大于其他省(市)籍的频数,因此众数MO=“湖北”
(2)异众比率的计算公式为:
mo
r

nfVn

( n代表总频数,mof代表众数的频数)

其中n=60,
mo
f

=28,则:

60280.5360rV


3.某个高校男生体重的平均值为58千克,标准差为6千克,女生体重的平均值
为48千克,标准差为5千克。请计算男生体重和女生体重的离散系数,比较男
生和女生的体重差异的程度。
解:计算离散系数的公式:

%100XSCV
男生体重的离散系数:
%34.10%100586CV
女生体重的离散系数:
%42.10%100485CV
男生体重的离散系数为10.34%,女生体重的离散系数为10.42%,男生体重的差异
程度比女生要稍微小一些。

4.在某地区抽取的120家企业按利润额进行分组,结果如下:
按利润额分组(万元) 企业数
200——299 19
300——399 30
400——499 42
500——599 18
600——699 11
合计 120
(1)计算120家企业利润额的中位数和四分位差。
(2)计算120家企业利润额的均值和标准差。

解:

(1) 错误! 中位数Md的位置=5.602112021n,Md位于“400—499”组,
L=399.5,U=499.5,cf(m-1)=49,fm=42,n=120,代入公式得
)(2)1(LUfcfnLMmmd

=

120
492399.5(499.5399.5)425.6942



职工收入的中位数为425.69元。
错误!

336.17)5.2995.399(301941205.299)(4111111LUfcfnLQ
497.12)5.3995.499(
4249412035.399)(43333333LUf

cf
n
LQ

四分位差
31
497.12336.17160.95QQQ

(2)错误!均值:

1199.5299.5299.5399.5399.5499.5499.5599.5599.5699.519304218112222212051140 =120 =426.17kiiiMfXn





\o\ac(○,2)标准差:
48.11611967.1614666112011)17.4265.649(18)17.4265.549(42)17.4265.449(30)17.4265.349(19)17.4265.249(1)(2222212



n

fxM
s

n

i
i

5.根据武汉市初中生日常行为状况调查的数据(data9),运用SPSS统计被调查
的初中生平时一天做作业时间(c11)的众数、中位数和四分位差。

解:《武汉市初中生日常行为状况调查问卷》:
C11 请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时
间大约为(请填写具体时间,没有则填“0”)
平时(非节假日):
1)做作业_______小时

SPSS操作步骤如下:

错误!
依次点击Analyze→Descriptive Statistics→frequencies,打开如

图5-1(练习)所示的对话框。将变量“平时一天做作业时间(c11a1)”,放置在Variab

les栏中。
图5-1(练习) Frequencies对话框

2单击图5-1(练习)中Frequencies对话框中下方的Statistics(统计量)按钮,打开

如图5-2(练习)所示的对话框。选择Quartiles(四分位数)选项,Median(中位数)选
项和Mode(众数)选项。点击Continue按钮,返回到上一级对话框。

图5-2(练习) Frequencies:Statistics统计分析对话框
错误!
点击OK按钮,SPSS将输出如表5-1(练习)所示的结果。

表5-1 平时初中生一天做作业时间的中位数、众值和四分位差

从上表可以看出,平时初中生一天做作业时间的中位数是2.5小时,众数是2小时,四分位
差是1(即3.000-2.000)个小时。

6.根据武汉市初中生日常行为状况调查的数据(data9),运用SPSS分别统计

中生月零花钱的均值和标准差,并进一步解释统计结果。

解:《武汉市初中生日常行为状况调查问卷》:
F1 你每个月的零用钱大致为___________元。
SPSS操作的步骤如下:

错误!
依次点击Analyze→Descriptive Statistics→frequencies,打开

如图5-3(练习)所示的对话框。将变量“每个月的零花钱(f1)”,放置在Variable
s栏中。

N Valid 517
Missing 9
Median 2.500
Mode 2.0
Percentiles 25
2.000

50 2.500
75 3.000
图5-3(练习) Frequencies对话框
错误!
单击图5-3(练习)Frequencies对话框中下方的Statistics(统计量)按钮,

打开如图5-4(练习)所示的对话框。选择Mean(均值)选项和Std.deviation(标准差)选项。
点击Continue按钮,返回到如图5-3(练习)所示的对话框。

图5-4(练习) Frequencies:Statistics统计分析对话框
\o\ac(○,3)点击OK按钮,SPSS将输出如表5-2(练习)所示的结果。
表5-2(练习) 初中生月零用钱的均值和标准差
Statistics
你每个月的零用钱大致为_
498
28
109.80
114.200

ValidMissingN
Mean
Std. Deviation

从表5-2(练习)可以看出,“初中生月零用钱”的均值为109.80元,标准差为114.2
元。

相关文档
最新文档