教育统计学3

合集下载

3教育统计学第三章

3教育统计学第三章

2.频数分布表计算法
用下列公式计算:
X1 f1 X 2 f 2 X f1 f 2
X k fk 1 X i fi fk n
(3.2)
X1 , X 2 ,
i i
, X k 为第一组到第K组的组中值
X f 各组组中值与频数乘积之和 f n 为频数总和
i
例2:P26
总和
50
3915
解:将表中数据代入公式(3.2),得
fXc 3915 X 78.3 N 50
说明:利用次数分布求得的算术平均数是 一个近似值。因为我们先假设组内的数据是均
匀分布的,利用各组中值分别代表各组数据,
这显然与实际不符,把这一误差叫分组误差
(P26)。
三、算数平均数的应用及其优缺点
1.加权平均数 应 2.离差、相关计算 用 3.统计推断
1.易受极端值的影响 2.数据模糊不清、缺 不 失时无法计算 足 3.数据不同质时无法 计算。
第四节 加权平均数、几何平均数、调和平均数
一、加权平均数
加权平均数的概念 加权平均数是不同比重数据(或平均数)的平均数, 用 X W 或 X t 表示。 加权平均数的应用
3、算术平均数的缺点
(1)易受两极端数值的影响; (2)有个别数据模糊不清时,无法计算
算术平均数的适用条件是:一组数据中所有数据都 比较准确、可靠;无两极端数值的影响。
第二节 中位数
一、中位数的概念及适用条件
1. 概念 中位数是位于一组有序数据中间位置的量数。 也称中数,用Md表示。 它是将一组有序数据的个数分为相等两部分的那 个数据,它可能是原始数据中的一个,也可能是 通过计算得到的一个数。
总和

张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](差异量数)

张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](差异量数)

第4章差异量数1.度量离中趋势的差异量数有哪些?为什么要度量离中趋势?答:(1)度量离中趋势的差异量数有全距、四分位差、百分位差、平均差、标准差与方差。

差异量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称离散量数(measures of dispersion)。

(2)度量离中趋势的必要性在心理和教育研究中,要全面描述一组数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况。

这些特殊性常表现为数据的变异性。

因此,只用集中量数不可能真实地反映出它们的分布情形。

为了全面反映数据的总体情况,除了必须求出集中量数外,这时还需要使用差异量数。

2.各种差异量数各有什么特点?答:(1)标准差计算最严密,它根据全部数据求得,考虑到了每一个样本数据,测量具有代表性,适合代数法处理,受抽样变动的影响较小,反应灵敏。

缺点是较难理解,运算较繁琐,易受极端值的影响。

(2)方差的描述作用不大,但是由于它具有可加性,是对一组数据中造成各种变异的总和的测量,通常采用方差的可加性分解并确定属于不同来源的变异性,并进一步说明各种变异对总结果的影响。

因此,方差是推论统计中最常用的统计量数。

(3)全距计算简便,容易理解,适用于所有类型的数据,但它易受极值影响,测量也太粗糙,只能反映分布两极端值的差值,不能显示全部数据的差异情况,仅作为辅助量数使用。

(4)平均差容易理解,容易计算,能说明分布中全部数值的差异情况,缺点是会受两极数值的影响,但当数据较多时,这种影响较小,因有绝对值也不适合代数方法处理。

(5)百分位差易理解,易计算,不易受极值影响,但不能反映出分布的中间数值的差异情况,也仅用作补助量数。

(6)四分位差意义明确,计算方便容易,对极端值不敏感,较不受极端值影响。

当组距不确定,其他差异量数都无法计算时,可以计算四分位差。

但是,四分位差无法反映分布中所有数据的离散状况,不适合使用代数方法处理,受抽样变动影响较标准差大。

张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](线性回归)

张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](线性回归)

dfR 1
MSR
SSR dfR
=118.95
dfE N 2 =8
MSE
SSE dfE
8.08
F MSR =14.72 MSE
查 F 表, F0.01(1,8) 5.32 , F F0.05(1,8)
5.某研究所 10 名学生研习某教授的高级统计课程,期中与期末考试成绩见下表。请 问该教授是否可以利用期中考试成绩来预测期末考试成绩?
4/6
圣才电子书 十万种考研考证电子书、题库视频学习平台

解:(1)建立回归方程
经计算 X 79.2, Y 84.2, sX 8.75, sY =4.52
dfE N 2 =8
MSE
SSE dfE
230.5
F MSR =9.15 MSE
查 F 表, F0.05(1,8) 5.32 , F F0.05(1,8)
3/6
圣才电子书

方差分析表如下
十万种考研考证电子书、题库视频学习平台
变异来源
自由度
平方和
均方
F
F0.05(1,8)
bYX
Y Y
2
=0.57
X X
a Y bX 23.13
则回归方程为 Yˆ 23.13 0.57X 。
(2)对回归方程进行检验
SST
Y2
Y 2
N
=3952.5
SSR
b2
X
2
X
N
2
=2108.6
SSE SST SSR =1843.9
dfR 1
MSR
SSR dfR
=2108.6
SST SSR N 2
MSE =15.18
2

《教育统计学》名词解释重点

《教育统计学》名词解释重点

第一章绪论1,教育统计学是运用数理统计学的原理来研究教育问题的一门应用科学。

2,教育统计学分为描述统计、推断统计和实验设计三类。

(1)描述统计:计算集中量(算术平均数、中位数、众数、加权算术平均数、几何平均数、调和平均数)来反映集中趋势;计算差异量(全距、四分位距、百分位距、平均差、标准差、差异系数)反映离散程度;计算偏态量及峰态量反映分布形态;计算相关量(积差相关系数、等级、点二列、二列、四分、C相关系数、肯德尔和谐系数、多系列相关系数)反映一致性程度。

(2)推断统计包括总体参数估计和假设检验两部分。

3,随机现象三个特性:一,一次试验有多种可能的结果,其所有结果是已知的;二,试验之前不能预料那一种结果会出现;三,在相同条件下可以重复试验。

随机事件:随机现象的每一种结果。

随机变量:把能表示随机现象各种结果的变量称之4,总体:是我们研究的具有某种共同特性的个体的总和。

样本数目大于30称为大样本,小于等于30称为小样本。

第二章数据的初步整理1,教统资料来源有经常性资料和专题性资料。

专题性资料包括(1)教育调查。

按调查方法分为现情调查、回顾调查和追踪调查;按调查范围分全面调查和非全面调查(抽样调查和典型调查)。

(2)教育实验。

分为单组实验(指对同一实验对象先后实施两种实验处理)、等组实验(指在甲乙两组条件基本相同的情况下,对之实行不同的实验处理)和轮组实验(指在实验组和对照组分别进行两种实验处理,并且每种处理各重复一次,也即每个或多个单组实验的联合)2,数据的分类。

按来源分为点计数据和度量数据;按随机变量取值情况分为间断型随机变量(取值个数有限、独立的、两个单位之间不能再划分细小单位、一般用整数表示,如优劣程度、品德爱好打分)和连续性随机变量(个数无限、单位之间可以再划分、可以用小数表示如身高体重、完成作业的时间等)。

3,频数分布表制作步骤:求全距;决定组数和组距;决定组限;登记频数。

4,用累计频数表示的频数分布表称为累计频数分布表。

张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](多变量统计分析简介)

张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](多变量统计分析简介)

第13章多变量统计分析简介1.探索性因素分析与验证性因素分析有什么区别?答:(1)探索性因素分析(exploratory factor analysis,简写为EFA)就是指传统的因素分析。

这种因素分析方法对于观察变量因子结构的寻找,并未有任何事前的预设假定。

对于因子的抽取、因子的数目、因子的内容以及变量的分类,研究者也没有事前的预期,而是由因素分析的程序去决定。

在典型的EFA中,研究者通过共变关系的分解,找出最低限度的主要成分(principal component)或共同因子(common factor),然后进一步探讨这些主成分或共同因子与个别变量的关系,找出观察变量与其相对应因子之间的强度,也就是因子负荷值(factor loading),以说明因子与所属的观察变量的关系,决定因子的内容,为因子取一个合适的名字。

由于传统的因素分析企图找出最少的因子来代表所有的观察变量,因此研究者必须在因子数目与可解释变异量(explained variance)两者间寻找平衡点。

因为因素分析至多可以抽取出相等于观察变量总数的因子数目,这样,虽然可以解释全部百分之百的变异,但失去因素分析找寻因子结构的目的,但如果研究者企图以少数几个较明显的因子来代表所有的项目,势必然将损失部分可解释变异来作为代价。

因而在EFA中,研究者相当一部分工作是在决定因子数目与提高因子解释的变异(即R square)。

(2)验证性因素分析(confirmatory factor analysis,简写为CFA)是在研究人员积极改善传统因素分析的限制,扩大其应用范围的基础上产生的。

这类因素分析要求,研究者对于潜在变量的内容与性质,在测量之初就必须有非常明确的说明,或有具体的理论基础,并已先期决定相对应的观察变量的组成模式,进行因素分析的目的是为了检验这一先期提出的因子结构的适合性。

这种因素分析方法也可用于理论架构的检验,它在结构方程模型中占有相当重要的地位,有着重要的应用价值,也是近年来心理测量与测验发展中相当重视的内容。

心理与教育统计学第三章 同步练习与思考题

心理与教育统计学第三章  同步练习与思考题

第三章同步练习与思考题1.解释下列名词集中量数集中趋势平均数中数众数几何平均数倒数平均数百分位数四分位数2.平均数、中数、众数三者之间有何关系?如何选用?3.中数与百分位数、四分位数的关系如何?4.为什么说平均数是最具代表性、最好的集中量指标?作为一种优良集中量的指标应具备哪些条件?集中量的各项指标各有什么特殊用途?5.分析平均速度时应如何选择计算方法?6.某校2001级心理班学生的普通心理学的考试成绩如下表。

试问①平均数、中数、众数分别是多少?②百分之40和百分之86位置上的分数是多少?③四分位数分别是多少?表3-11 学生普通心理学考试成绩分布表组别93- 90- 87- 84- 81- 78- 75- 72- 69- 66- 63- 60- 57- 54- 人数 1 2 4 5 7 11 8 7 5 3 2 3 1 1 7.请就下列各组数据选择最佳的集中量指标,并计算出结果。

① 7,10,4,8,9,10,6,8② 8,5,9,10,11,14,11,12,40③ 17,19,12,16,18,10,22,18,178.某一团体成员的年龄分布如下表所示。

试问表示它们集中趋势的恰当指标是什么?为什么?并计算出你所选定的指标。

表3-12 年龄分布表25岁以下25-34岁35-44岁45-54岁55-64岁64岁以上f45 40 30 55 28 159.某院1995年至2004年研究生招生情况如表3-12所示。

①求平均发展速度和平均增长速度。

②估计2010年其研究生招生人数会达到多少?③若要达到500人需要多少年时间?表3-13 某院研究生招生人数发展水平1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 人数11 13 18 26 30 44 78 87 90 10210.某生英语阅读能力的测验分数如下表,求其平均进步率。

表2-14 某生的英语阅读量第1次第2次第3次第4次第5次第6次测验成绩28 39 55 67 77 8311.8名学生参加打字测验,每个学生每分钟打字的数量为18,20,23,25,29,33,37,41,求这8个学生的平均打字速度。

张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](抽样原理及方法)

张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](抽样原理及方法)

第14章抽样原理及方法1.什么是抽样误差?什么是最大允许抽样误差?答:任何一个抽样调查都可能产生误差。

调查的总误差可以分为两部分:非抽样误差和抽样误差。

非抽样误差指漏报、错报、测量误差以及在调查结果的登录、汇总等环节上产生的误差,其误差大小很大程度上取决于调查的组织工作是否完善;抽样误差则是根据样本信息来推断总体信息时产生的随机误差。

确定样本容量时应该考虑的因子(1)参数估计在样本平均数的分布中当或0.01时,或2.58。

此时而因此(公式14.14)可以看到,进行平均数的估计时,当α确定后(0.05或0.01),总体标准差σ和最大允许误差d是决定样本容量的两个因子。

2.什么情况下要进行分层抽样,举例说明或以公式证明分层抽样的优点。

答:1.方法(1)分层随机抽样简称分层抽样(stratified sampling或hierarchical sampling)。

具体做法是按照总体已有的某些特征,将总体分成几个不同的部分(每一部分叫一个层),再分别在每一部分中随机抽样。

它充分利用了总体的已有信息,因而是一种非常实用的抽样方法。

(2)对于一个总体究竟应该如何分层,分几层,要视具体情况而定。

总的一个原则是,各层内的变异要小,而层与层之间的变异越大越好,否则将失去了分层的意义。

(3)设总体为N,所需样本容量为n,则如何合理地将n分配在各层,是分层抽样的一个重要问题。

具体施行过程中有两种方式:①按各层人数比例分配这是在各层内的标准差不知道的情况下常用的分配方式,基本思想是人数多的层多分配,人数少的层少分配。

设各层的人数分别为N1,N2,N3…N k每层应分配的人数为n1,n2,n3…n k。

则如果按人数比例分配,则或任意一层应分配的人数应当为:(公式14.5)②最佳分配(最优配置法)这种分配不但根据各层人数比例,还考虑到了各层标准差。

如果各层内的标准差已知,就应该考虑到标准差大的层要多分配,标准差小的层要少分配。

张厚粲《现代心理与教育统计学》(第3版)【章节题库】(方差分析)

张厚粲《现代心理与教育统计学》(第3版)【章节题库】(方差分析)

5.在随机区组实验设计中,总平方和可以被分解为( )。 A.被试间平方和 B.被试内平方和区组平方和 C.误差项平方和 D.区组平方和 【答案】ACD
6.事后检验常用的方法有( )。 A.F 检验 B.N—K 法 C.HSD 法 D.t 检验
8 / 38
圣才电子书

【答案】BC
8.方差分析中,F(2,24)=0.90。F 检验的结果( )。 A.不显著 B.显著 C.查表才能确定 D.此结果是不可能的 【答案】A
9.如果用方差分析检验一个双组设计的平均数差异,将会得到一个与( )同样的 结果。
3 / 38
圣才电子书

A.F 检验
十万种考研考证电子书、题库视频学习平台
圣才电子书 十万种考研考证电子书、题库视频学习平台

第 9 章 第 9 章 方差分析
一、单选题 1.假设 80 个被试被分配到 5 个不同的实验条件组,那么要考虑各组被试在某症状测 量上的差异,F 比率的 df 各为( )。 A.5,79 B.5,78 C.4,79 D.4,75 【答案】D
15.某研究选取容量均为 5 的三个独立样本,进行方差分析,其总自由度为( )。 A.15 B.12
5 / 38
圣才电子书

C.2
十万种考研考证电子书、题库视频学习平台
D.14
【答案】B
16.当一个实验( )时,我们才能得到交互作用。 A.因变量多于 1 个 B.自变量多于 1 个 C.因变量多于 1 个的水平 D.自变量多于 2 个的水平 【答案】B
17.某研究选取容量均为 5 的三个独立样本,进行方差分析,其总自由度为( )。 A.15 B.12 C.2 D.14 【答案】B
18.完全随机设计的方差分析适用于( )。 A.三个及其以上独立样本平均数差异的显著性检验 B.方差齐性检验 C.三个及其以上相关样本平均数差异的显著性检验
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.频数分布表计算(数据分组后):
f1 X 1 fX 2 fX 3 f k X k fX i X f1 f 2 f 3 f k f i
X表示每组的组中值 f表示每组的频数
三、算术平均数的意义、优缺点



意义:是总体平均数的最佳估计值。当观 测次数无限增加时,算术平均数趋近于真 值。 优:反应灵敏、计算严密、计算简单、简 明易懂、适合代数运算、受抽样变动的影 响小。 缺:易受极端值的影响。 数据不确切时,无法进行计算。
百分位数(percentile)

X%
PX
(100-X)%

50%分位数就是中位数
百分位数的计算方法
Pp表示百分位数 p表示与百分位相对应 的比数 n表示总频数 Lp表示百分位数所在组 的下限 n1表示小于百分位数所 在组下限的频数总和 Fp表示百分位数所在组 的频数 i表示组距
i Pp L p ( pn n1 ) fp
一、算术总和等于 算术平均数的N倍。
X
i
nX

2.各观察值与其算术 平均数之差的总和 等于0。
(X
i
X) 0


3.在一组数据中,每一个数据加上常数C, 则所得的平均数为原来平均数加常数C。 4.在一组数据中,每一个数都乘以一个常 数C所得的平均数为原来的平均数乘以常 数C。
i 5 P30 L30 (0.3n n1 ) 70 (0.3 48 8) 74 f 30 8
三、中数的优缺点



优:计算简单、容易理解、很少受极端 值的影响。 缺:不适合代数计算 在一般情况下,中数不被普遍应用。
第三节 众数



概念:众数(mode)是指在频数分布中出现 次数最多的那个数的数值。常用Mo表示。 例如求1,2,2,3,5,7,8,8,8,9,13, 17,21,21,21的众数。 特点:众数不唯一,也不一定存在。
作业6:求以下资料的第P80,P60,P30百 分位数
组限 140145150155160165170175180185190195和 频数 1 3 2 4 4 6 10 8 5 4 2 1 50 累积频数 1 4 6 10 14 20 30 38 43 47 49 50
(1) p=0.8,n=50,L80=180,n1=38,f80=5,i=5 P80=180+(0.8*50-38)*5/5=182 (2)p=0.6,n=50,L60=170,n1=20,f60=10,i=5 P60=170+(0.6*50-20)*5/10=175 (3)p=0.3,n=50,L30=165,n1=14,f30=6,i=5 P30=165+(0.3*50-14)*5/6=165.83
作业3
对于下列数据,使用何种集中量数表示集 中趋势其代表性更好?并计算它们的值。 (1)4,5,6,6,7,29 (2)3,4,5,5,7,5 (3)2,3,5,6,7,8,9


答案:中数6(众数);众数5;平均数5.71
作业4

某年初中入学考试时语文、数学、英语的 计分比例为4:3:3,一个学生的考试成 绩语文为72分,数学为94分,英语为79分, 求该生总平均分数。



答案: 平均数和中数均为8
作业2.

有三个学校英语测验分数如下:求三个学 校英语测验总平均成绩。
校别 A B C 平均分 72.6 80.2 75 人数 32 40 36

答案: w 72.6 32 80.2 40 75 36 76.21 X
32 40 36

2.频数分布表计算法(分组):
求以下两组数据的中数
(1)14、2、17、9、22、13、1、7、11 (2)1、26、11、9、14、13、7、17、22、2

答案:(1) Md=11 (2)Md=12
二、百分位数的概念


概念:是位于依据一定顺序排列的一组数 据中某一百分位置的数值,用P表示。如第 P70是从小到大排列的一组数据中,有70%的 数值小于此数值,有30%的数值大于此数值。 中数就是第?百分位数

x( n1) / 2 Md xn / 2 x1 n / 2 2
n为奇数 n为偶数
一、中数的计算方法

1.原始数据计算法(未分组):
(1)当数据个数为奇数时,中数为N+1/2位置的那个数。 例如:求4,6,7,8,12的中数 N+1/2=3,中数为数列中排在第3的数据为7。 (2)当数据个数为偶数时,中数为居于中间位置两个数的 平均数,即第N/2与第N/2+1位置的两个数相加除以2。 例如:求2,3,5,7,8,10,15,19的中数 第N/2位置的数是7,第N/2+1位置的数是8,中数为7.5

二、几何平均数:常用 来求增长率
X g n X1 X 2 X n

三、调和平均数:常用 来求速度,如阅读速度, 识字速度等.
1 XH 1 1 1 1 ( ) n X1 X 2 Xn
作业1
求以下三组数据的平均数和中数 (1)7,7,8,8,8,9,9 (2)4,5,7,8,9,11,12 (3)1,4,7,8,9,12,15
W1 X 1 W2 X 2 Wn X n XW W1 W2 Wn
例:某学生某门学科平时测验成绩为72分,期末测验成绩为86 分,平时与期末分数之比为3:7,求该同学学期总平均分数。
XW
W1 X 1 W2 X 2 Wn X n W1 W2 Wn
72 30 86 70 81 .8 100
第三章 集中量数
频数分布的两个基本特征: (1)集中趋势 (2)离散趋势

数据的集中趋势就是指数 据分布中大量数据向某方 向集中的程度。(集中量 数) 数据的离散趋势是指数据 分布中数据彼此分散的程 度。(差异量数)

本章内容


第一节 第二节 第三节 第四节
算术平均数 中数(中位数) 众数 其他集中量数
72 4 94 3 79 3 80.7 4 33

答案:
XW
作业5

有一学生15分钟学会生词30个,后10分钟学会生 词也是30个,问该生每分钟平均学会多少个生 词?(平均学习速度?)
1 1 XH 2.4 1 1 1 1 1 1 1 ( ) ( ) n X1 X 2 Xn 2 2 3
下面为48名学生数学分数的频数分 布表,请计算第30百分位数P30
分数 4550556065707580859095总和 频数 1 2 0 2 3 8 7 7 7 5 6 48 累积频数 1 3 3 5 8 16 23 30 37 42 48
P30
已知:P=30/100=0.3; n=48; L30=70; n1=8; f30=8; i=5
第一节 算术平均数

算术平均数(arithmetic mean),简称平均数(average)或 均值、均数 (mean)。它是统计学中最容易理解最常应 用的一种集中量数。用 X 表示,它代表每组观测值的 重心。如1、4、7、8的均数为5。
1
2
3
4
5
6
7
8
X 1 X 2 X n X 1 4 7 8 X 5 n n 4
只用平均数描述资料的弊病
• 甲组 26 29 30 31 34 • 乙组 24 27 30 33 36 • 丙组 26 28 30 32 34 均数30kg 均数30kg 均数30kg



24 26 28 30 32 34 36
三组儿童体重的离散程度
第二节 中数

中数(median):是按顺序排列在一起的一 组数据中居于中间位置的数,又称中位数、 中值。用Md表示。 中数可能是数据中的某一个数值,也可能 不是这组数据中的某一个数值。
二、算术平均数的计算
1.原始数据计算(未分组数据):
X 1 X 2 X n X X n n
某小组10个学生的数学测验分数为79、62、84、90、71、 76、83、98、77、78。计算其平均数。

79 62 84 90 71 76 83 98 77 78 79.8 答案:X 10
算术平均数、中数、众数三者的关系
正态分布时: 均数=中位数=众数
正偏态分布时:均数>中位数>众数 负偏态分布时:均数<中位数<众数
正态: M d M O X
A
偏 态
正偏: X
A

M
d

M
M
O
负偏: X
A

M
d

O
第四节 其他集中量数

一、加权平均数:是不同比重数据(或平均数)的平 均数。用 X W 表示。 公式:
相关文档
最新文档