第三章 集中量数
第三章集中量数,趋中量数(MeasuresofCentralTendency)

第三章集中量數(或趨中量數)(Measures of Central Tendency)壹、本單元的目標1、解釋集中量數的目的,並說明此量數所傳達的訊息2、計算,說明,及比較眾數(mode)、中位數(median)、以及平均數(mean)的差異3、說明平均數的數學特性4、依照測量尺度及偏態(skew)來選擇適當的集中量數貳、各種集中量數上個單元所介紹的次數分配及圖表等是用來描述資料的整體分配情況。
本單元及下個單元則介紹兩類的描述統計,以進一步瞭解資料整體分配的細節。
這兩類統計能告訴我們以下的資訊是:1、代表此分配之典型或平均狀況的個案為何。
與此有關的描述統計就是各種「集中量數」。
2、此分配之變異或異質性的狀況。
與此有關的描述統計就是各種「離散量數」。
所以,集中量數就是以一個數值來描述樣本資料中,那一個分數或數值是最常見的、站在中間的位置、或最具代表性。
最常見的集中量數有三種,即眾數(Mode)、中位數(Median)、和算術平均數(Mean)。
這三種量數雖有共同的目的,但它們測量資料之集中趨勢(central tendency)的作法卻不同,也傳達不同的訊息。
因此,只有在特定的條件下,這三種量數的數值才會相同。
到底用那一個集中量數和the level of measurement(測量尺度)以及研究之目的有關。
集中量數之使用和測量尺度之關係:Nominal -ModeOrdinal -Mode、Median (也可用Mean,但解釋時要小心)Interval-Ratio -Mode、Median、Mean一、眾數(Mode):是指資料中出現最多的數值。
眾數適用於各種測量尺度。
但當變項為名目尺度時,這是唯一可用的集中量數。
在名目尺度變項,或次數分配表中,眾數是指含件數或次數最多的類別。
眾數雖是最簡單之集中量數,但有缺點:1、有些分配不一定有眾數,換言之,分配很平均時或眾數很多時,眾數即失去意義和功能。
心理统计学第三章

第三章第三章集中量数第一节算术平均数 ................................................. 错误!未定义书签。
第二节中位数 ................................................................. 错误!未定义书签。
第三节众数 ....................................................................... 错误!未定义书签。
第四节几何平均数和倒数平均数............................... 错误!未定义书签。
第五节 SPSS实验——均数、中数和众数...................... 错误!未定义书签。
同步练习与思考题 ............................................................... 错误!未定义书签。
学习目标1.识记和理解各种集中量指标的概念2.熟练掌握各种平均指标的计算方法3.掌握均数、中数和众数应用范围4.了解几何平均数和倒数平均数的应用在实验、测量或调查中获得的大量观测数据,具有一种向数据中央某一点靠拢的趋势,这种趋势在统计学中称为集中趋势(central tendency),它是数据分布的特征之一。
用于描述观测数据集中趋势的量数称为集中量数。
集中量数(central measures)是一组数据的代表值,用以说明一组数据分布的典型情况或一般水平,它比个别数据更能反映客观现象或事物的实际情况。
集中量数还可以用于组与组之间的差异比较。
譬如,某教师在两个平行班进行了传统教学法和多媒体教学的实验研究,通过一年实验后,观测到两个班级的平均成绩之间出现较大的差异。
描述客观现象集中趋势的数量指标有算术平均数、加权平均数、中数、众数、几何平均数和倒数平均数。
统计心理-第三章 集中量数

例。
XT
ni X i ni
加权平均数
例1:某小学三年级举行英语测验。甲班32名学生的平均 分为72.6,乙班40名学生平均分为80.2,丙班36名学生的 平均分为75分。求全年级英语测验的总平均分数。
xwN1xN 11NN 2x22N N 33x3
加权平均数
例2:某课题组在8个省区进行一项调查,各省区的取样 人数和平均分数见下表,求该项调查的总平均数。
2
中数;若数据个数为偶数时,则 X N 2 X N 2 1 2为中 数。
①求数列4,6,7,8,12的中数。 ②有2,3,5,7,8,10,15,19共8个数,求其中数。
(二)中数的计算方法
(2)一组数据中有重复数值的情况
①当重复数值没有位于数列中间时 求数列5,5,6,10,12,15,17的中数。
集中趋势与离中趋势
集中趋势是指数据分布中大量数据向某方向集中 的程度。
集中趋势与离中趋势
集中趋势是指数据分布中大量数据向某方向集中 的程度。
离中趋势是指数据分布中数据彼此分散的程度。 集中量数与差异量数:描述一组数据集中趋势和
离中趋势的统计量,共同描述一组数据的全貌及 统计特征。 测度集中趋势即寻找数据水平的代表值或中心值 集中量数包括算术平均数、中数、众数、加权平 均数、几何平均数、调和平均数等。
Mo3Md2M
第三节 其他集中量数
一、加权平均数 所得数据单位权重不相等时要使用加权平均数。
k
M WW 1X W 1 1W W 2X 22 W W nnXni
1
W
k
i
W
X
i
i
i1
W为权数,指各变量在构成总体中的相对重要性。
心理统计学(一) 第三章 集中量数

[学习重点]
集中量数
1.各种集中量数的概念和性质 2.各种集中量数的计算方法 3.各种集中量数的具体应用
第三章
集中量数
集中趋势与离中趋势是次数分布的两个 基本特征。数据的集中趋势就是指数据分布 中大量数据向某方向集中的程度,离中趋势 是指数据分布中数据彼此分散的程度。用来 描述一组数据这两种特点的统计量分别称为 集中量数和差异量数。这两种量数一起共同 描述或反映一组数据的全貌及其各种统计特 征。
算术平均数的计算方法
(1)未分组数据(原始数据)计算法
X X1 X 2 X N X i N N
fX c N
(2)数据分组后(次数分布表)计算法
X
(式中 XC 为各区间的组中值,f 为各区间的次数)
算术平均数的优缺点
算术平均数具备一个良好的集中量数所应具备的一些条件: ① 反应灵敏; ② 严密确定; ③ 简明易懂; ④ 计算简单; ⑤ 适合代数运算; ⑥ 较少受抽样变动的影响。 除此之外,算术平均数还有以下一些特殊的优点: ① 只知一组观察值的总和及总频数就可以求出算术平均数; ② 用加权法可以求出几个平均数的总平均数; ③ 用样本数据推断总体集中量数时,算术平均数最接近总体集中量数的 真值,它是总体平均数的最好估计值; ④ 在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。 但是算术平均数也有一些缺点: ① 易受极端数据的影响; ② 若出现模糊不清的数据时,无法计算平均数。
算术平均数的概念
算术平均数是所有观察值的总和除以总频数所得之商。用
表示。 X
若以 X1,X2,· · · ,XN 表示变量 X 的各个观察值,N 表示 观察值的个数,则算术平均数可表示为:
X1 X 2 X N Xi X N N
第三章集中量数

第三章 集中量数第一节 算术平均数 一、概念及计算公式 (一)概念算术平均数 (mean),是所有观测值(或变量值)的总和除以总数所得的商。
简称平均数、均数或均值。
其符号系统既有表示样本平均数的数学符号X 和英文符号M (M ean ),又有表示总体参数的希腊字符μ。
(二)计算公式1、未分组数据计算平均数方法 公式一:例3—1:现有一组实验观测数据,25,27,28,27,25,29,30,34,32,33.计算它们的平均数。
解:根据题意,已知N=10,根据公式:X = = =29公式二:X =AM+= 2、使用次数分布表计算平均数方法 公式一: 公式二:X =AM+ ×i例3—2:100名学生的数学成绩分布如下,计算平均数。
表3-1 简化平均数计算表组别 c XfdC fXfd96~ 97 2 6 194 12 93~ 94 3 5 282 15 90~ 91 4 4 364 16 87~ 88 83 704 24 84~ 85 11 2 935 22 81~ 82 17 1 1394 17 78~ 79 19 0 1501 0 75~ 76 14 -1 1064 -14 72~ 73 10 —2 730 —20 69~ 707 -3 490 -21 66~673—4201-12∑∑=f fm X Nfd∑Nx ∑'1033...2725+++10290NX X i∑=29102027=+63~ 64 1 -5 64 —5 60~611 —6 61 -6 ∑—100—798428①将∑fm ,N 代入上面第一个公式计算: X = = =79.84②设AM=79,将AM ,∑fd ,N ,i 代入上面第二个公式计算:X =AM + ×i=79+ ×3=79.84这两个公式计算的结果完全相同,但第二个公式更简便.二、平均数的特点1、一组变量值的和等于变量的个数与其平均数的乘积,即∑=X N X2、一组变量值的离均差之和等于零,即()∑=-0X X3、在一组变量值中,每个变量值加上或减去、乘以或除以常数c ,所得的平均数等于原平均数减去或加上,除以或乘以常数c 。
第三章 集中量数

例:某门课程期中考试成绩与期末考试成绩的权数分 别为3和7。已知某个考生期中考了92分,期末考了85分。 若不考虑其他因素,问该生在这门课上的成绩是多少。
W1 X 1 W2 X 2 Wn X n 解: X w W1 W2 Wn 92 3 85 7 = 3 7 =87.10
众数的优缺点
众数虽然简明易懂,但是它并不具备一个良好的集中 量的基本条件。它主要在以下情况下使用:
当需要快速而粗略地找出一组数据的代表值时; 当一组数据出现不同质的情况时 当次数分布中有极端数据时 当粗略估计次数分布的形态时,有时利用平均数与众数之 差,表示次数分布是否偏态的指标。
第二节
中数与众数
一、中数的概念 中位数是位于以一定顺序(从小到大或 从大到小)排列的一组数据中央位置的数值, 在这一数值上、下各有一半频数分布着。用 Md表示。
二、中位数的计算方法
1.总频数为奇数
某项研究调查了 25 名大学教师的月经济收入, 结果如下(单位:元) : 2275, 3300,3326, 3358, 3363, 3394, 3402, 3455, 3467,3485, 3500, 3565, 3587, 3592, 3618, 3633,3646, 3674, 3720, 3734, 3756, 3775, 3820, 5695, 7100
1.原始数据计算法 上学期考试结束后某专业学生的分数: 97,93,71,86,88,78,91,86,90, 47,88,74,78,75,85,98,98,100, 75,85,93,91,81,91,93,96,88, 75,100,98,94,97,97,97,77,98, 95
X 1 X 2 X N X N
第三章集中量数

三、算术平均数的性质
一组变量值的和等于变量的个数与其平均数的乘积, 一组变量值的和等于变量的个数与其平均数的乘积, 即 ∑ X = NX 一组变量值的离均差之和等于零, 一组变量值的离均差之和等于零,即
∑ (X − X ) = 0
在一组变量值中,每个变量值加上或减去 、乘以或 在一组变量值中,每个变量值加上或减去、 除以常数 , 所得的平均数等于原平均数减去或 加上,除以或乘以常数 加上, 。
i N Mdn = La − − Fa f 2
5 57 = 74.5 − − 24 = 74.5 − 1.5 = 73 15 2
分组次数表与重复次数中位数的联系
1N Mdn = Lb + − Fb f 2
三、百分位数与四分位数
(一)百分位数:在任一百分位上的数值。
例3-6:五名学生的物理成绩分别55,64,89,98, 34请问五名学生的平均成绩是多少?
解:1、排序:34、55、64、89、98 2、 N=5,为奇数 为奇数 N +1 3、 中数位置= 2 =3 4、排在第 个位置上的数是 ,所以中位数 排在第3个位置上的数是 排在第 个位置上的数是64, 是64 答:五名同学的的物理平均成绩是64分。 五名同学的的物理平均成绩是 分
Fl →u
Fu→l
Fa = 24
57 54 46 33 18 9 3 1 —
3 11 24 39 48 54 56 57 —
④代入公式计算中数
i N Mdn = Lb + − Fb f 2 5 57 = 69.5 + − 18 = 69.5 + 3.5 = 73 15 2
例3-7:六架直升飞机的最大速度分别为 六架直升飞机的最大速度分别为450km/h、 六架直升飞机的最大速度分别为 、 420km/h、500km/h 、 530km/h 、600km/h 、 、 1100km/h,请问平均速度是多少 ,请问平均速度是多少? 1、排序:420、450、500、530、600、1100 N 2、N=6,为偶数 中数位置= 2
心理统计学第三章集中量数

04 集中量数的计算方法
简单平均数计算方法
总结词
简单平均数是集中量数中最基本的计算方法,它通过将一组数值相加后除以数值 的数量来得出平均值。
详细描述
简单平均数计算公式为 $overline{x} = frac{1}{n} sum_{i=1}^{n} x_i$,其中 $n$ 是数值的数量,$x_i$ 是每一个数值。这种方法适用于数据分布均匀且无异常值的 情况。
对未来研究的展望
01 02
探索新的集中量数
随着数据类型和复杂性的增加,传统的集中量数可能无法满足某些研究 需求。未来研究可以探索新的集中量数,以更准确地描述数据的集中趋 势。
改进现有集中量数的计算方法和性质
现有集中量数的计算方法和性质可能存在一些局限性和不足之处,未来 研究可以尝试改进这些方法和性质,以提高集中量数的准确性和可靠性。
06 总结与展望
总结心理统计学第三章集中量数的要点
集中量数
集中量数是描述数据集中趋势的统计量,用于反映一组 数据的中心位置或典型值。
常见集中量数
常见的集中量数包括算术平均数、中位数和众数等。
算术平均数
算术平均数是所有数值的和除以数值的个数,是最常用 的集中量数之一。它具有线性性和可加性,能够反映数 据的平均水平。
在社集中量数来描述被调查者的社会特征, 例如通过平均年龄和标准差等指标来分析被调查者的社会 经济地位和人口结构。
社会政策制定
政府和社会组织可以利用集中量数来制定社会政策,例如 通过分析不同地区居民的平均收入和收入分布来制定社会 保障政策。
社会问题研究
研究者可以利用集中量数来研究社会问题,例如通过平均 失业率和标准差等指标来分析社会经济不平等和就业状况。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 算数平均数的意义:
• 真值(true score):某一个体在某一特 真值( ) 性上的真实分数或称真实水平(多次测量 的平均分数)。 • 它是真值的最佳估计值(证明见P59) 它是真值的最佳估计值
二、几何平均数
几何平均数(geometeic mean):对一组数据相 几何平均数 乘开n次方所得到的数据
• 众数的优缺点 • 优点 优点:计算简单,容易理解,意义明白。 • 缺点:其大小不受制于全体数据;反应 缺点 不灵敏,不受极端值影响;受抽样影响 较大,不如平均数稳定。
四、平均数、众数、中数的相对位置
平均数、中数、 平均数、中数、众数之间的比较
比较的 项目 意义 适用数 据类型 计算 特性 进一步 运算 受抽样 的影响 受分组 的影响 极端数 的影响 适用场合 平均数(M) 平均数 与其两侧数据距离之 和相等数据的重心 等距、等比 需所有的数据 可以 较少 不大 最严重 一般情况都 用平均数 中数(Md) 中数 其两侧数据 个数相等 顺序 等距 等比 只需中间数据 不可以 较大 较大 最少 ①有极端数据时②当 两端数据或个别数据 不清楚时③快速估计 代表值时 众数(Mo) 众数 出现次数最多的数, 典型 性质 顺序 等距 等比 计算迅速 不可以 较大
第三章 集中量数
• 【教学目标】理解各种集中量数的含义、性 教学目标】理解各种集中量数的含义、 质和作用;熟练掌握集中量数的计算方法; 质和作用;熟练掌握集中量数的计算方法; 恰当地应用集中量数描述一组数据的集中趋 势。 • 【学习重点】各种集中量数的概念和性质; 学习重点】各种集中量数的概念和性质; 各种集中量数的计算方法; 各种集中量数的计算方法;各种集中量数的 具体应用。 具体应用。 • 【难点】重复数据位于中间时,中数的求法 难点】重复数据位于中间时,
• 2.众数(mode)
• 众数 众数又称范数,指次数分布中出现次数最多的 那个数的数值。 • 适用条件 • 当一组数据出现不同质的情况或分布中出现极 极 端数据时;数据分布中出现双众数时,可用众 端数据 数进行粗略 粗略的估计。 粗略
• 计算方法 • (1)直接观察求众数:观察一组数次数 出现最多的就是 • (2)皮尔逊经验法MO=3Md-2M - • 众数的特点:简单明了、容易理解、较 少受极端数据的影响;反映不灵敏,不 稳定,受样本变动的影响,不能做进一 步的代数运算。 • (3)金氏插补法(略)
• 集中量数的概念 • 集中量数是指一组数据(一个样本数据) 集中量数 中哪一个数字最具代表性,或数据的中 中 重心集中于哪一个位置。 心或重心 重心 • 一般包括算术平均数、加权平均数、几 何平均数、中数、众数、调和平均数
一、算数平均数(arithmetic mean) 算数平均数 arithmetic mean
• 计算方法: • (1)未分组数据 • a.将数据依大小次序排列,若数据个数为 奇数,则取数列中间的那个数为中数, 即位于(n+1)/2的那个数 ;若数据个 数为偶数,则取中间两个数的平均数为 中数,即位于n/2和(n+1)/2 这两个数 的均数。
• b.数据重复且位于数列中间,数据个数为 数据个数为 奇数 • 例题见书P63例3-5 • c.数据重复且位于数列中间,数据个数为 数据个数为 偶数 • 例题见书P63例3-6
∑ fX X =
N
C
• f为各组次数,Xc为组中值。 为各组次数, 为组中值 为组中值。 为各组次数
2.加权平均数 2.加权平均数:知道小组平均求总平均,小组 加权平均数 小组 平均数与个数 个数乘积的和除以总个体数 总个体数(总人 平均数 个数 总个体数 数)。
n1 x1 + n2 x 2 + L + nk x k Xw = = n1 + n2 + L + n k
• 算术平均数的性质 • ①一列数据中每一个数与平均数之差(称为离 均差)的总和等于0。
(x1 −x) +(x2 −x) +L+(xn −x) =(x1 + x2 +L+ xn) −nx =∑xi −nx =0
• ②给一列数据中的每一个数加上一个常数C, 则所得到的新数组的平均数为原来数组的平均 数加上常数C。
=
N 1 ∑X i
调和平均数主要用于描述学习速度 学习速度方面的问题 学习速度
1.学习任务的工作量相同,而所用时间不等。先求出单位时间的工作量,再代入 学习任务的工作量相同,而所用时间不等。先求出单位时间的工作量, 学习任务的工作量相同 时间不等 公式所得结果就是学习速度。 公式所得结果就是学习速度。 例1:有一学生15分钟学会生词30个,后又用10分钟学会生词20个。问该生平均 每分钟学会多少个生词? 解:用倒数平均计算,先求出单位时间的工作量
最大 一般 ①有极端数据时②数 据不同质找典型③快 速估计代表值时④估 计分布形态时
五、调和平均数(harmonic mean)
用符号MH表示,在计算中先将各个数据的倒数平均, 倒数平均数。其计算公式如下: 然后再取倒数,故又称倒数平均数 倒数平均数
MH =
1 1 1 1 1 X + X +L+ X N 1 2 n
• ③给一列数据中的每一个数乘以一个常 数C,则所得到的新数组的平均数为原来 数组的平均数乘以常数C。 • ④一列数据中每个数乘以一个常数C,再 加上一常数d,其平均数等于原平均数乘 以常数C再加上常数d。
• ⑤ 一组数据中每个数与任意常数c的离 差平方和,不小于该组数据的离差平方 和。
(xi − c)2 ≥ ∑(xi − x)2 ∑ 证明: Qxi − c = (xi − x) + (x − c) ∴∑(xi − c) = ∑(xi − x) + 2n(x − c)∑(xi − x) + ∑(x − c)2
2 2
= ∑(xi − x) + n(x − c)2.
2
• 算术平均数的特点(简述算数平均数的使用特点,浙大 算术平均数的特点(简述算数平均数的使用特点, 2003,苏大2002 2002试题 2003,苏大2002试题) • ①优点:算术平均数是一个良好的集中量数,具有 优点 反应灵敏、计算严密、简明易解、计算简单、适合 进一步演算和较小受抽样变化的影响 较小受抽样变化的影响等。 较小受抽样变化的影响 • ②缺点:算术平均数易受极端数据 缺点: 极端数据的影响,这是因 极端数据 为平均数反应灵敏,每个数据的或大或小的变化都 会影响到最终结果;出现模糊不清 模糊不清的数据时,无法 模糊不清 计算平均数。 • 注意 注意:不同质的数据不能计算平均数(同质数据 同质数据是 同质数据 指使用同一 同一观测手段,采用相同 相同的观测标准,能反 同一 相同 同一方面特质的数据),因为不同质的 映某一问题同一方面特质 同一方面特质 数据观测手段、测量标准不一致。
学会生 词 30 30 所用 时间 15分钟 10分钟 平均每分钟 学会生词Xi 30÷15=2 30÷10=3 N=2 代入公式得:
MH =
1 = 2.4 1 1 1 + 2 2 3
:
即该生平均每分钟学会生词2.4个
2学习任务的时间相同工作量不同,也先求单位时间的工作量再代入公式计算 学习任务的时间相同工作量不同, 学习任务的时间相同工作量不同 例2:一个学习实验的结果见表
(1)主要适用于一组数据中有少量数据偏大或偏小, 数据分布呈偏态分布。 数据分布呈偏态分布
= lg − 1
∑
n
M
i =1
g
lg x i n
(2)数据按一定的比例关系变化 比例关系变化 直接计算平均变化率的公式
例题P77-81
Mg =
N −1
x2
x1
x3
算数平均数用以度量连续变量次数分布集中趋 算数平均数 势的最常用的集中量数。
1.算数平均数的计算公式:个体的数据之和
除以个体数
n
1 µ= N
∑x
i =1
N
i
1 X = ∑ xi n i =1
• 用估计的平均数计算平均数
∑ x′ , 式中x′ = x − AM X = AM +
N
i
• 对于分组数据其平均数的− Fb Md = Lb + *i f Md N / 2 − Fa = La − *i f Md Lb中数所在组的精确下限 , Fb为该组以下各组的累加 次数, i为组距, La中数所在组的精确上限 , Fa为该组以上各组的累加 次数。
• 特点 • 计算简单、容易理解,不受极端数据的 影响; • 根据数据的相对位置决定,有较大的抽 样误差,不及平均数稳定,反应不灵敏; • 不能作进一步的代数运算。(在一般情 况下不被采用)
被 试
解 题 数 24 20 16 12 8 4
时间 (小 时) 2 2 2 2 2 2
单位时 间 工作量 12 10 8 6 4 2
计算
1 2 3 4 5 6
MH =
6 = 4.9 1 1 1 1 1 1 + + + + + 12 10 8 6 4 2
平均每个被试每小时解题为4.9道
∑n x ∑n
i i
i
训练:某校一些班级某次英语考试的平均分分别为 、 训练:某校一些班级某次英语考试的平均分分别为78、 85、67、90、95,其人数依次为 、48、45、62、40,求该次 、 、 、 ,其人数依次为56、 、 、 、 , 某校英语考试的平均分。 某校英语考试的平均分
3.算术平均数的性质及应用特点
x2
L
xn
x n −1
=
N −1
xn
x1
三、中数与众数
• 1.中数的概念(median)(南开大学2005试题) 1.中数的概念 median) 南开大学2005试题) 2005试题