第三章集中量数和差异量数

合集下载

统计第三章

统计第三章


(二)众数的意义与应用


1、优点:
简单明了,容易理解,不受极端数值的影响。


2、缺点:
(1)不稳定,受分组影响,也受样本变动影响。 (2)计算时不需每一个数据都加入,反应不够灵敏。 (3)用观察法得到的众数,不是经过严格计算而来的, 用公式计算所得众数也只是一个估计值。同时,众数不 能作进一步代数运算。 (4)总数乘以众数,也与数据总和不相等。 (除非众数=平均数)
六、计算和应用平均数的原则

1、同质性原则
2、平均数与个体数值相结合的原则 3、平均数与标准差、方差相结合的原 则


第二节 中数与众数

一、中数(median)
二、众数(mode) 三、平均数、中数、众数三者之间的关 系


一、中数(median)

中数,又称中点数、中位数、中值,符号 为Md或Mdn。中数是按顺序排列在一起的 一组数据中居于中间位置的数,即在这组 数中,有一半的数据比它大,有一半的数 据比它小。这个数可能是数据中的某一个, 也可能根本不是原有的数。如果将数据按 大小顺序排列,中数恰好位于中间,它将 数据的数目分成较大的一半和较小的一半。

2、各观察值与算术平均数之差(离差)的总 和等于0,即 N
(X
i 1
i
X) 0

3、每一个观测值都加上或减去同一个相同常 数C后,计算得到的平均数等于原平均数加 上或减去这个常数C,即 N
(X
i 1
i
C)
N
X C
三、算术平均数的性质

4、每一个观测值都乘以一个相同常数 C后,计算得到的平均数等于原平均数 N 乘以这个常数C,即 CX i

统计心理-第三章 集中量数

统计心理-第三章 集中量数

例。
XT

ni X i ni
加权平均数
例1:某小学三年级举行英语测验。甲班32名学生的平均 分为72.6,乙班40名学生平均分为80.2,丙班36名学生的 平均分为75分。求全年级英语测验的总平均分数。
xwN1xN 11NN 2x22N N 33x3
加权平均数
例2:某课题组在8个省区进行一项调查,各省区的取样 人数和平均分数见下表,求该项调查的总平均数。
2
中数;若数据个数为偶数时,则 X N 2 X N 2 1 2为中 数。
①求数列4,6,7,8,12的中数。 ②有2,3,5,7,8,10,15,19共8个数,求其中数。
(二)中数的计算方法
(2)一组数据中有重复数值的情况
①当重复数值没有位于数列中间时 求数列5,5,6,10,12,15,17的中数。
集中趋势与离中趋势
集中趋势是指数据分布中大量数据向某方向集中 的程度。
集中趋势与离中趋势
集中趋势是指数据分布中大量数据向某方向集中 的程度。
离中趋势是指数据分布中数据彼此分散的程度。 集中量数与差异量数:描述一组数据集中趋势和
离中趋势的统计量,共同描述一组数据的全貌及 统计特征。 测度集中趋势即寻找数据水平的代表值或中心值 集中量数包括算术平均数、中数、众数、加权平 均数、几何平均数、调和平均数等。
Mo3Md2M
第三节 其他集中量数
一、加权平均数 所得数据单位权重不相等时要使用加权平均数。
k
M WW 1X W 1 1W W 2X 22 W W nnXni
1
W
k
i
W
X
i
i
i1
W为权数,指各变量在构成总体中的相对重要性。

第三章集中量数和差异量数

第三章集中量数和差异量数

从以上计算可知,两班平均数都是73分,说
明两班的平均水平相同。但它们的标准差不同,
说明两班成绩的差异程度很不相同。一班的差异
程度较小,平均分数73的代表性就较大;二班的 差异程度较大,平均分数73的代表性就小些。 2、原始数据法 为了减少计算量,可将公式3.1进行转换, 使公式中参与运算的变量皆为原始数据。公式 为
xnxnx表示次数为原始数据总和的平方为原始数据的平方之和式中2222???????????????32例2用原始数据法计算表1的标准差09149657949747222?????????????????????nxnx?解
第三章 集中量数 和差异量数
• 1、对某校学生的思想品德用五级记分法记分, 其人数统计可以用( )表示: • a、直条图 b、直方图 c、多边图 d、线形图 2、从总体中抽取出作为观察对象的一部分个 体,称为: ( ) a、样本 b、总体 c、有限总体 d、无限总体 3、在制作有纵横轴的统计图时,一般来说, 纵轴与横轴比为: ( ) a、1:1 b、3:5 c、5:3 d、6:3
82
77230
616 360 201
60-64
55-59 ∑
62
57
4
2 50
248
114 3915
解:将表中数据代入公式,得
fXc 3915 X 78.3 N 50
说明:利用次数分布求得的算术平均数是 一个近似值。因为我们先假设组内的数据是均
匀分布的,利用各组中值分别代表各组数据,
X

fXc
N
式中Xc为组中值;f为各组次数,即权数;N 为总次数=∑f。
例 某班50人外语期末考试成绩的次数 分布如下,求全班学生的平均成绩。

心理统计学考研历年真题及答案

心理统计学考研历年真题及答案

考研真题和强化习题详解第一章绪论一、单选题1 .三位研究者评价人们对四种速食面品牌的喜好程度。

研究者甲让评定者先挑出最喜欢的品牌,然后挑出剩下三种品牌中最喜欢的,最后再挑出剩下两种品牌中比较喜欢的。

研究者乙让评定者将四种品牌分别给予 l~5 的等级评定, ( l 表示非常不喜欢, 5 表示非常喜欢),研究者丙只是让评定者挑出自己最喜欢的品牌。

研究者甲、乙、丙所使用的数据类型分别是: ( )A .类目型―顺序型―计数型B .顺序型―等距型―类目型C .顺序型―等距型―顺序型D .顺序型―等比型―计数型2 .调查了n =200 个不同年龄组的被试对手表显示的偏好程度,如下:该题自变量与因变量的数据类型分别是: ( )A .类目型―顺序型B .计数型―等比型C .顺序型―等距型D .顺序型―命名型3 .这个数的上限是()。

A . 157 . 75B . 157 . 65C . 157 . 55D . 158 . 54 .随机现象的数量化表示称为()。

A .自变量B .随机变量C .因变量D .相关变量5 .实验或研究对象的全体被称之为()。

A .总体B .样本点C .个体D .元素6 .下列数据中,哪个数据是顺序变量? ( )A .父亲的月工资为 1300 元B .小明的语文成绩为 80 分C .小强 100 米跑得第 2 名D .小红某项技能测试得 5 分7、比较时只能进行加减运算而不能使用乘除运算的数据是【】。

A .称名数据B .顺序数据C .等距数据D .比率数据参考答案: 1 . B 2 . D 3 . C 4 . B 5 . A 6 . C二、概念题1.描述统计(吉林大学 2002 研)答:描述统计指研究如何整理心理教育科学实验或调查的数据,描述一组数据的全貌,表达一件事物的性质的统计方法。

比如整理实验或调查来的大量数据,找出这些数据分布的特征,计算集中趋势、离中趋势或相关系数等,将大量数据简缩,找出其中所传递的信息。

2.特征量---集中量数与差异量数

2.特征量---集中量数与差异量数

1、全距
• 全距 是一组数据中最大值与最小值的 差数,也叫两极差。
• 计算公式
R=Max(X)-Min(X)
式中R为全距, Max(X)、Min(X)分别 为数据中的最大值和最小值。
2、四分位差(对原始数据)
• 四分位数将一组数据按大小顺序排列后,分成次数相 等的四部分,位于个分界点的数据称为四分位数。 • 四分位差是第三四分位数与第一四分位数之差的一半。 Q3 Q1 • 计算公式 QD 2 例1 20名学生英语测试成绩为 52、79、73、60、45、44、89、87、65、81、68、 79、67、80、65、64、72、66、48、83. 求:测验成绩的四分差.
标准分数计算举例
• 例4、 已知A、B两个年级英语考试成绩如下 表。甲生是A年级的学生,成绩70分。乙生是 B年级的学生,成绩也是70分。求甲、乙两人 成绩的标准分数。 •
• 表3-12 A、B两年级英语考试成绩统计表 年 级 平均分 标准差 最高分 最 低 分
A B
80 60
14 12
100 70
几何平均数应用举例
• 例7、 我国普通中学1994-1999年教职工人 数如表3-5,求年平均增长率. • 表3-5 我国普通中学教职工人数统计表

年 份 1994 1995 1996 1997 1998 1999
教职工人数(万人) 逐年发展速度
419.07 429.48 442.44 454.09 462.13 475.36
语文 数学 英语 综合 合计
123 130 115 128
12 14 16 10
甲 125 145 120 130 520
乙 108 140 145 127 520

第三章 集中量数

第三章 集中量数

例:某门课程期中考试成绩与期末考试成绩的权数分 别为3和7。已知某个考生期中考了92分,期末考了85分。 若不考虑其他因素,问该生在这门课上的成绩是多少。
W1 X 1 W2 X 2 Wn X n 解: X w W1 W2 Wn 92 3 85 7 = 3 7 =87.10
众数的优缺点
众数虽然简明易懂,但是它并不具备一个良好的集中 量的基本条件。它主要在以下情况下使用:
当需要快速而粗略地找出一组数据的代表值时; 当一组数据出现不同质的情况时 当次数分布中有极端数据时 当粗略估计次数分布的形态时,有时利用平均数与众数之 差,表示次数分布是否偏态的指标。
第二节
中数与众数
一、中数的概念 中位数是位于以一定顺序(从小到大或 从大到小)排列的一组数据中央位置的数值, 在这一数值上、下各有一半频数分布着。用 Md表示。
二、中位数的计算方法
1.总频数为奇数
某项研究调查了 25 名大学教师的月经济收入, 结果如下(单位:元) : 2275, 3300,3326, 3358, 3363, 3394, 3402, 3455, 3467,3485, 3500, 3565, 3587, 3592, 3618, 3633,3646, 3674, 3720, 3734, 3756, 3775, 3820, 5695, 7100
1.原始数据计算法 上学期考试结束后某专业学生的分数: 97,93,71,86,88,78,91,86,90, 47,88,74,78,75,85,98,98,100, 75,85,93,91,81,91,93,96,88, 75,100,98,94,97,97,97,77,98, 95
X 1 X 2 X N X N

02第三、第四章_集中量数-差异量数解析

02第三、第四章_集中量数-差异量数解析
表示。
百分位数的计算方法
Pp Lb pn f b
i fp
(4.4)
公式中:Lb为百分位数所在组的精确下限
fb为百分位数所在组下限以下的累积频数 p为百分数
n为数据总和
fp为百分位数所在组的频数
i为组距
3.中位数的特点及应用

中位数是根据全部数据的个数来确定其位置的,
意义简明,对按顺序排列的数据来讲,计算中位数
第三章 集中量数

集中量用来表现数据资料的
典型水平或集中趋势(central tendency)。

常用的集中量包括算术平均
数、加权平均数、中位数和众数
等等。
一、算术平均数
算术平均数(arithmetic average )
一般简称为平均数(average)或均 数、均值(mean)。 一般用M,或者用 X 表示。 算术平均数是最常用的集中量。
(5.1)
其中: n f b25 Q1 LQ1 4 i f Q1
3n f b75 Q3 LQ3 4 i f Q3
(5.2a)
(5.2b)
用中位数作集中量时,常用四分位距作差异量。
二、平均差
平均差(average deviation 或者
mean deviation)是指一组数据中,每一
二、中位数
中位数(median)又称为中数,
是按顺序排列的一组数据中位于中 间位置的数。
中位数是常用集中量的一种。 一般用Md或Mdn表示。
1、中位数的计算方法
原始数据计算法

首先将一组数据按顺序排列
n 1 若n为奇数 , 则Md 为第 个数 2
Xn Xn 若n为偶数, 则Md

心理统计学第三章集中量数

心理统计学第三章集中量数

04 集中量数的计算方法
简单平均数计算方法
总结词
简单平均数是集中量数中最基本的计算方法,它通过将一组数值相加后除以数值 的数量来得出平均值。
详细描述
简单平均数计算公式为 $overline{x} = frac{1}{n} sum_{i=1}^{n} x_i$,其中 $n$ 是数值的数量,$x_i$ 是每一个数值。这种方法适用于数据分布均匀且无异常值的 情况。
对未来研究的展望
01 02
探索新的集中量数
随着数据类型和复杂性的增加,传统的集中量数可能无法满足某些研究 需求。未来研究可以探索新的集中量数,以更准确地描述数据的集中趋 势。
改进现有集中量数的计算方法和性质
现有集中量数的计算方法和性质可能存在一些局限性和不足之处,未来 研究可以尝试改进这些方法和性质,以提高集中量数的准确性和可靠性。
06 总结与展望
总结心理统计学第三章集中量数的要点
集中量数
集中量数是描述数据集中趋势的统计量,用于反映一组 数据的中心位置或典型值。
常见集中量数
常见的集中量数包括算术平均数、中位数和众数等。
算术平均数
算术平均数是所有数值的和除以数值的个数,是最常用 的集中量数之一。它具有线性性和可加性,能够反映数 据的平均水平。
在社集中量数来描述被调查者的社会特征, 例如通过平均年龄和标准差等指标来分析被调查者的社会 经济地位和人口结构。
社会政策制定
政府和社会组织可以利用集中量数来制定社会政策,例如 通过分析不同地区居民的平均收入和收入分布来制定社会 保障政策。
社会问题研究
研究者可以利用集中量数来研究社会问题,例如通过平均 失业率和标准差等指标来分析社会经济不平等和就业状况。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(3.2)
例 某年级四个班的学生人数分别为50人,52
ቤተ መጻሕፍቲ ባይዱ
人,48人,51人,期末数学考试各班的平均成绩
分别为90分,85分,88分,92分,求年级的平均
成绩。
解:由公式(3.2)得
Xw
XW 90 * 50 85 * 52 88 * 48 92 * 51 50 52 48 51 W
55-59
50-54 45-49 40-44 ∑
57
52 47 42
42
58 30 5 144
4.20
-0.80 -5.80 -10.80
17.65
0.64 33.62 116.61
=88.74
三、中位数
(一)、中位数的概念及适用条件
概念: 中位数是位于一组有序数据中间位置的量 数。也称中数,用Mdn表示。它是将一组有序数 据的个数分为相等两部分的那个数据。
适用条件:
1、当一组数据有极端值出现时。
2、当一组有序数据两端有个别数据模糊不清
或分组资料有不确定组限时。
3、当需要快速估计一组数据的代表值时。
MG N a N 5 700 1.03 a0 594
故年平均增长率为(10.3-1)*100%=3%
例 某校办工厂在1984年创产值10万元,该厂
计划以年平均增长率为5%的速度递增,试估计到
2004年该厂可创产值多少万元。
解:由 平均增长率=平均发展速度-1
得:aN=a0(1+平均增长率)N =10×(1+0.05)20=26.53(万元)
一、 标准差
(一)、标准差的概念及适用条件 概念: 标准差是一组数据中每个数据与其算术 平均数之差的平方的算术平均数的算术平 方根。用符号σ 表示。

X
i
X n

2
(3.1)
X 其中Xi为原始数据;N为数据个数; 的算术平均数。
为一组数据
适用条件: 1、一组数据的一般水平适合用算术平均
X

fXc
N
式中Xc为组中值;f为各组次数,即权数;N 为总次数=∑f。
例 某班50人外语期末考试成绩的次数 分布如下,求全班学生的平均成绩。
表 某班50人外语成绩次数分布表
组别 90-94 85-89
组中值Xc 92 87
次数f 3 10
fXc 276 870
80-84
75-79 70-74 65-69
中位数。 例如求80,93,90,81,85,88,92,84的 中位数时,先排序:80,81,84,85,88,90, 92,93,再求(N+1)/2=4.5,这说明中位数的位
置在第四个和第五个数的中间,即(85+88)
/2=86.5。
(二)分组数据中位数的计算方法 对分组数据常将N/2位置对应的数据看 成中位数。
概念: 是一组同质数据值的总和除以数据总个数所得的 商。亦称均数,均值,用 X(读X杠)表示。
计算公式为: X 1 X 2 X n X n
X
n
i
(3.1)
n为数据个数。
• (二)计算方法: 1、原始数据计算法: 定义公式一般适用于原始数据较少 的情况下,其计算方法可用于原始数据 计算公式中。
(一)、几何平均数的概念及应用时机
概念:
它是N个数值连乘积的N次方根,用符号MG 表示
几何平均数M g n X 1 X 2 X n X 1 X n 为n个数据
(3.5)
应用时机:
1、求一组等比或近似等比数据的平均数
时。
2、一组数据中,有少数偏大或偏小的数
据,数据分布呈现偏态,求平均数时。
数描述时,其离散程度宜用标准差描述。
2、计算其它统计量时,如相关系数等, 要用到标准差。 3、在推断统计中,尤其是进行方差分析 时,常用方差(标准差的平方)表示数据 的离散程度。
(二)、标准差的计算方法 1、基本公式法 例1 某校四年级举行数学竞赛,一班、二班分别派九 名选手参加,如下表。试比较两个班的成绩。
思考题
某一团体成员的年龄分布如下表所示。试问 表示它们集中趋势的恰当指标是什么?为 什么?并计算出你所选定的指标。 • 年龄分布表 • 25岁以下 25-34岁 35-44岁 45-54岁 55-64岁 64岁以上
• f 45 40 30 55 28 15
第二节 差异量数
一、 标准差 二 、 四分差 三 差异系数
计算步骤: (1)求N/2; (2)确定中位数所在组,由下向上累积 次数,直到大于或等于N/2一组为止,该组 就是中位数所在组; (3)求出中位数所在组的精确下限; (4)求出中位数所在组以下的累积次数 Fb; (5)确定组距及中位数所在组的次数f; (6)将以上各值代入公式中。
表 某班50人外语成绩次数分布表 求表的中位数。
例如, 某班选八名同学参加年级数学竞赛,成绩分别为82,
90,95,88,90,94,80,93。求其平均成绩。 解:把N=8,X1=82,…,X8=93代入公式(3.1), 得
X 82 90 95 88 90 94 80 93 X 89 N 8
2、频数分布表计算法:对于已列成次数分布 表的分组数据,其算术平均数的计算公式为
求出年平均增长率。
平均增长率=1.09-1=0.09 故所求的年平均增长率为9%。
2、只用首末项求几何平均数 设a0,a1,…,aN是N个年度中各年度某种数量值,
其中a0是初期量, aN是末期量。X1,X2,…,XN为
各年度发展速度,即
aN a1 a2 X 1 , X 2 ,..., X N a0 a1 aN 1
表1 一班成绩统计表 X
X-
92
90
17
83
10 100
80
7 49
75
2 4
70
-3 9
62
-11 121
55
-18 324
50
-23 529
X
19
(X- X )^2
361 289
表2 二班成绩统计表 X 100 97 95 85 80 75 62 40 20
X- X
(X- X )^2
27
729
24
第三章 集中量数 和差异量数
• 1、对某校学生的思想品德用五级记分法记分, 其人数统计可以用( )表示: • a、直条图 b、直方图 c、多边图 d、线形图 2、从总体中抽取出作为观察对象的一部分个 体,称为: ( ) a、样本 b、总体 c、有限总体 d、无限总体 3、在制作有纵横轴的统计图时,一般来说, 纵轴与横轴比为: ( ) a、1:1 b、3:5 c、5:3 d、6:3
2

49747 657 9 9
14.09
(二)分组资料标准差的计算方法
这里的分组资料指编制成次数分布的资料,此 时以组中值作为各组的代表值。计算公式为

f Xc X
N
2
(3.3)
2


fXc
N
2
fXc N
• 一、集中量的一般意义:
• 定义:集中量就是表示一组数据典型水平或集 中趋势的量。它反映频数分布中大量数据向某 一个量集中的情况。常用的集中量有算术平均 数、几何平均数、调和平均数、加权平均数、 中位数、众数等。
二、集中量的优良代表量之一--算术平均 数(Arithmetic Mean)
(一)、算术平均数的概念
计算公式为:
M dn Lb
n Fb 2 M L i n dn b Fb f 2
i
式中:Lb 表示中位数所在组的精 确下限;Fb为中位数所在组以下的 累积次数;
f :L 表示中位数所在组的精 式中 确下限;Fb为中位数所 b
n为总次数 ;i 为组距;f 为中位数所在组的次数 。 n为总次数;i 为组距;f 为中位数所在组的次数 。
576
22
484
12
144
7
49
2
4
-8
64
-33
1089
-53
2089
解:先求四年一班的平均数和标准差。算得
X 73

X
i
X

2
1786
X
X

2
n
14.09
再求四年一班的平均数和标准差。得
X 73

X X
i
2
5948
X
X

2
n
25.71
从以上计算可知,两班平均数都是73分,说
明两班的平均水平相同。但它们的标准差不同,
说明两班成绩的差异程度很不相同。一班的差异
程度较小,平均分数73的代表性就较大;二班的 差异程度较大,平均分数73的代表性就小些。 2、原始数据法 为了减少计算量,可将公式3.1进行转换, 使公式中参与运算的变量皆为原始数据。公式 为

(二)、中位数的计算方法 1、未分组数据中位数的计算方法 一组数据未分组,先排序,中位数 取决于数据的个数是奇数还是偶数。
当数据的个数为奇数时,则以第(N+1)/2个 位置上的数据作为中位数。
当数据的个数为偶数时,则取居中间的两个
数据的平均数为中位数。即取第(N+1)/2处作为
中位数的位置,其位置左右两数据的平均值即为
3、在教育上,主要应用几何平均数求平
均发展速度或对某项目标进行预测估计。
(二)、几何平均数的计算方法 1、直接公式法 例 求2,8,32,125,502的几何平均数。 解:由于这组数属于近似等比数列,故应 用公式(3.5),得
相关文档
最新文档