现代心理教育与统计学_第三版复习资料(张厚粲)

合集下载

张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](差异量数)

张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](差异量数)

第4章差异量数1.度量离中趋势的差异量数有哪些?为什么要度量离中趋势?答:(1)度量离中趋势的差异量数有全距、四分位差、百分位差、平均差、标准差与方差。

差异量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称离散量数(measures of dispersion)。

(2)度量离中趋势的必要性在心理和教育研究中,要全面描述一组数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况。

这些特殊性常表现为数据的变异性。

因此,只用集中量数不可能真实地反映出它们的分布情形。

为了全面反映数据的总体情况,除了必须求出集中量数外,这时还需要使用差异量数。

2.各种差异量数各有什么特点?答:(1)标准差计算最严密,它根据全部数据求得,考虑到了每一个样本数据,测量具有代表性,适合代数法处理,受抽样变动的影响较小,反应灵敏。

缺点是较难理解,运算较繁琐,易受极端值的影响。

(2)方差的描述作用不大,但是由于它具有可加性,是对一组数据中造成各种变异的总和的测量,通常采用方差的可加性分解并确定属于不同来源的变异性,并进一步说明各种变异对总结果的影响。

因此,方差是推论统计中最常用的统计量数。

(3)全距计算简便,容易理解,适用于所有类型的数据,但它易受极值影响,测量也太粗糙,只能反映分布两极端值的差值,不能显示全部数据的差异情况,仅作为辅助量数使用。

(4)平均差容易理解,容易计算,能说明分布中全部数值的差异情况,缺点是会受两极数值的影响,但当数据较多时,这种影响较小,因有绝对值也不适合代数方法处理。

(5)百分位差易理解,易计算,不易受极值影响,但不能反映出分布的中间数值的差异情况,也仅用作补助量数。

(6)四分位差意义明确,计算方便容易,对极端值不敏感,较不受极端值影响。

当组距不确定,其他差异量数都无法计算时,可以计算四分位差。

但是,四分位差无法反映分布中所有数据的离散状况,不适合使用代数方法处理,受抽样变动影响较标准差大。

张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](线性回归)

张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](线性回归)

dfR 1
MSR
SSR dfR
=118.95
dfE N 2 =8
MSE
SSE dfE
8.08
F MSR =14.72 MSE
查 F 表, F0.01(1,8) 5.32 , F F0.05(1,8)
5.某研究所 10 名学生研习某教授的高级统计课程,期中与期末考试成绩见下表。请 问该教授是否可以利用期中考试成绩来预测期末考试成绩?
4/6
圣才电子书 十万种考研考证电子书、题库视频学习平台

解:(1)建立回归方程
经计算 X 79.2, Y 84.2, sX 8.75, sY =4.52
dfE N 2 =8
MSE
SSE dfE
230.5
F MSR =9.15 MSE
查 F 表, F0.05(1,8) 5.32 , F F0.05(1,8)
3/6
圣才电子书

方差分析表如下
十万种考研考证电子书、题库视频学习平台
变异来源
自由度
平方和
均方
F
F0.05(1,8)
bYX
Y Y
2
=0.57
X X
a Y bX 23.13
则回归方程为 Yˆ 23.13 0.57X 。
(2)对回归方程进行检验
SST
Y2
Y 2
N
=3952.5
SSR
b2
X
2
X
N
2
=2108.6
SSE SST SSR =1843.9
dfR 1
MSR
SSR dfR
=2108.6
SST SSR N 2
MSE =15.18
2

张厚粲《现代心理与教育统计学》(第3版)配套题库【章节题库】第1章~第3章 【圣才出品】

张厚粲《现代心理与教育统计学》(第3版)配套题库【章节题库】第1章~第3章 【圣才出品】

第三部分章节题库第1章绪论一、单选题1.三位研究者评价人们对四种速食面品牌的喜好程度。

研究者甲让评定者先挑出最喜欢的品牌,然后挑出剩下三种品牌中最喜欢的,最后再挑出剩下两种品牌中比较喜欢的。

研究者乙让评定者将四种品牌分别给予1—5的等级评定,(1表示非常不喜欢,5表示非常喜欢),研究者丙只是让评定者挑出自己最喜欢的品牌。

研究者甲,乙,丙所使用的数据类型分别是:()A.类目型---顺序型---计数型B.顺序型---等距型---类目型C.顺序型---等距型---顺序型D.顺序型---等比型---计数型【答案】B2.调查了n=200个不同年龄组的被试对手表显示偏好程度偏好程度年龄组数字显示钟面显示不确定30岁或以下90401030岁以上104010该题自变量与因变量的数据类型分别是:()A.类目型-顺序型B.计数型-等比型C.顺序型-等距型D.顺序型-命名型【答案】D3.157.5这个数的上限是()。

A.157.75B.157.65C.157.55D.158.5【答案】C4.随机现象的数量化表示称为()。

A.自变量B.随机变量C.因变量D.相关变量【答案】B5.实验或研究对象的全体被称之为()。

A.总体B.样本点C.个体D.元素【答案】A6.下列数据中,哪个数据是顺序变量?()A.父亲的月工资为1300元B.小明的语文成绩为80分C.小强100米跑得第2名D.小红某项技能测试得5分【答案】C二、概念题1.描述统计(吉林大学2002研)答:描述统计指研究如何整理心理教育科学实验或调查的数据,描述一组数据的全貌,表达一件事物的性质的统计方法。

比如整理实验或调查来的大量数据,找出这些数据分布的特征,计算集中趋势、离中趋势或相关系数等,将大量数据简缩,找出其中所传递的信息。

2.推论统计(中国政法大学2005研,浙大2000研)答:推论统计又称推断统计,主要研究如何通过局部数据所提供的信息,推论总体或全局的情形;如何对假设进行检验和估计;如何对影响事物变化的因素进行分析;如何对两件事物或多种事物之间的差异进行比较等。

张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](多变量统计分析简介)

张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](多变量统计分析简介)

第13章多变量统计分析简介1.探索性因素分析与验证性因素分析有什么区别?答:(1)探索性因素分析(exploratory factor analysis,简写为EFA)就是指传统的因素分析。

这种因素分析方法对于观察变量因子结构的寻找,并未有任何事前的预设假定。

对于因子的抽取、因子的数目、因子的内容以及变量的分类,研究者也没有事前的预期,而是由因素分析的程序去决定。

在典型的EFA中,研究者通过共变关系的分解,找出最低限度的主要成分(principal component)或共同因子(common factor),然后进一步探讨这些主成分或共同因子与个别变量的关系,找出观察变量与其相对应因子之间的强度,也就是因子负荷值(factor loading),以说明因子与所属的观察变量的关系,决定因子的内容,为因子取一个合适的名字。

由于传统的因素分析企图找出最少的因子来代表所有的观察变量,因此研究者必须在因子数目与可解释变异量(explained variance)两者间寻找平衡点。

因为因素分析至多可以抽取出相等于观察变量总数的因子数目,这样,虽然可以解释全部百分之百的变异,但失去因素分析找寻因子结构的目的,但如果研究者企图以少数几个较明显的因子来代表所有的项目,势必然将损失部分可解释变异来作为代价。

因而在EFA中,研究者相当一部分工作是在决定因子数目与提高因子解释的变异(即R square)。

(2)验证性因素分析(confirmatory factor analysis,简写为CFA)是在研究人员积极改善传统因素分析的限制,扩大其应用范围的基础上产生的。

这类因素分析要求,研究者对于潜在变量的内容与性质,在测量之初就必须有非常明确的说明,或有具体的理论基础,并已先期决定相对应的观察变量的组成模式,进行因素分析的目的是为了检验这一先期提出的因子结构的适合性。

这种因素分析方法也可用于理论架构的检验,它在结构方程模型中占有相当重要的地位,有着重要的应用价值,也是近年来心理测量与测验发展中相当重视的内容。

现代心理与教育统计学复习资料覃瑞

现代心理与教育统计学复习资料覃瑞

现代心理与教育统计学复习资料赵晨鹰老师覃瑞整理(21267529)徐建平和张厚粲主编第三版第一章绪论课程简介:先行课程为数学、普通心理学,后续课程为实验心理学、心理测量学、心理学研究方法、(研究型)毕业论文等。

心理统计可分为三种类别(最常见的分类方法P8):第一部分是“描述统计”,包括数据整理、集中&离中&相关量数的计算等。

第二部分是“推论统计”,包括统计估计、假设检验等(以概率分布为基础)。

第三部分是“实验设计”,包括样本抽取、被试分组等。

描述统计 : 1统计图表 2集中量数3差异量数 4相关关系概率分布(推论统计的基础)推论统计 :1参数估计 2假设检验 3方差分析(涉及部分“实验设计”) 4 χ2检验 5非参数检验线性回归(进而建立“数学模型”)多变量统计分析简介实验设计 :抽样原理及方法心理统计学(Psychological Statistics)是研究在心理实验或调查中如何收集、整理、分析数字资料,以及如何根据这些资料所传递的信息作出科学推论的应用统计学分支。

随机性数据资料~随机现象P3 (vs. 确定现象)①试验之前已知存在多种可能结果,但不能预料哪种结果会出现;②在相同条件下可以重复该试验。

理论统计学 vs. 应用统计学心理科学研究数据的特点 P2 1、分散性:数据结果均以一个个分散的数字形式呈现。

2、变异性/随机性:观测数据总在一定范围内随机波动变化。

3、规律性:通过重复观测可发现其变化具有一定的特征与规律。

心理科学研究的目标就是在分析部分数据的基础上来推测其相应总体的特征。

一、描述统计(descriptive statistics) P8描述统计主要研究如何将实验或调查得到的大量数据进行图表整理或简缩成有代表性的数字(即统计量数),使其能客观、全面地反映这组数据的全貌,将其所提供的信息充分显现出来,为进一步统计分析和推论提供可能。

据分组、图表制作。

②统计量/特征值P21的计算。

张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解(5-7章)【圣才出品】

张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解(5-7章)【圣才出品】
6.代表数据点的相关趋势的直线称为拟合直线。这条直线是用统计方法求得的,因每 个数据点与它的离差最小,所以称为最佳拟合直线。数据与最佳拟合直线之间的离差越小, 拟合直线对数据相关关系预测的可靠度及精确性会越高。
(三)散点图 1.在相关研究中,常用相关散点图表示两个变量之间的关系。在直角坐标系中,以 X、 Y 二列变量中的一列变量(如 X 变量)为横坐标,以另一列变量(如 Y 变量)为纵坐标, 把每对数据 Xi、Yi 当作同一个平面上的 N 个点(Xi、Yi),一一描绘在 XOY 坐标系中,产生 的图形就称为散点图或相关图。 2.散点图通过点的散布形状和疏密程度来显示两个变量的相关趋势和相关程度,能够 对原始数据间的关系做出直观而有效的预测和解释。成对观测值愈多,散点图提供的信息就 越准确。因此,散点图是确定变量之间是否存在相关关系及关系紧密程度的简单而又直观的 方法。 3.不同形状的散点图形显示了两个变量间不同程度的相关关系。假设在直角坐标系中,
1 / 157
圣才电子书 十万种考研考证电子书、题库视频学习平台

哪个是果;也有理由认为这两者并不同时受第三因素的影响,即不存在共变关系。具有相关 关系的两种现象之间的关系是比较复杂的,甚至可能包含有暂时尚未认识的因果关系以及共 变关系在内。
2.相关的类别 统计学中所讲的相关是指具有相关关系的不同现象之间的关系程度,前提是事物之间的 这种联系又不能直接做出因果关系的解释。有时,相关被解释为两种特征相伴随的变化。相 关有以下三种: (1)正相关,两列变量变动方向相同,即一种变量变动时,另一种变量亦同时发生或 大或小与前一种变量同方向的变动。 (2)负相关,两列变量中有一列变量变动时,另一列变量呈现出或大或小但与前一列 变量方向相反的变动。 (3)零相关,两列变量之间没有关系,即一列变量变动时,coefficient of correlation)是两列变量间相关程度的数字表现形式,或者 说是用来表示相关关系强度的指标。作为样本间相互关系程度的统计特征数,常用 r 表示, 作为总体参数,一般用 表示,并且是就线性相关而言。相关系数与 X 、s 一样,也是应用 比较广泛的一个有代表性的统计量。r 的取值范围如下: -1.00≤r≤+1.00 上式表明: 1.相关系数 r 的取值范围介于-1.00 至+1.00 之间,它是一个比率,常用小数形式表 示。

现代心理教育与统计学 第三版复习资料(张厚粲)

现代心理教育与统计学 第三版复习资料(张厚粲)

第一章绪论1.描述统计(descriptive statistics)主要研究如何将实验或调查得到的大量数据进行图表整理或简缩成有代表性的数字(即统计量数),使其能客观、全面地反映这组数据的全貌,将其所提供的信息充分显现出来,为进一步统计分析和推论提供可能。

2.描述统计只限于对试验样本所得观测数据的统计分析,不考察其总体的特性。

3.推论统计(inferential statistics)是以描述统计为基础,从而解决由局部到全体的推论问题,即通过对一组统计量的计算分析,推论该组数据所代表的总体特性。

4.变量(variables):一个可以取不同数值的物体属性/事件。

5.事前无法预期结果的变量——随机变量6.观测值(原始取值):事后测定的某一结果。

7.概念理解:[涉及“实验”] 自变量(及其各水平)& 因变量(及相应的反应指标);[涉及“调查”,粗略对应于] 属性变量& 反应变量8.计数资料(count data):计算个数的数据,(如人口数,学校数,男女数等)9.计量资料(measurement data):借助于一定的测量工具或一定的测量标准而获得的数据(如分数,身高,体重,IQ)10.称名数据(nominal data):只区分属性或类别上的不同,只可计数,不能排序(性别,学科,职业)11.等级/顺序数据(ordinal data):可排序,但无相等单位,不能加减。

(等级评定,受教育程度,职称)12.等距数据(interval data):具有相等单位,无绝对零的数据,能加减不能乘除。

13.比率数据(ratio data):既表明量的大小,又具有相等单位,可以加减乘除,具有绝对零点。

14.称名数据和顺序数据合称为离散数据。

15.等距数据和比率数据合称为连续数据。

16.离散数据(discrete data)又称为不连续数据,这类数据在任何两个数据点之间所取的数据的个数是有限的。

17.连续数据(continuous data)指任意两个数据点之间都可以细分出无限多个大小不同的数值。

张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解(1-4章)【圣才出品】

张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解(1-4章)【圣才出品】

统计图表
1.描述统计
差异量数 集中量数 相关分析
点估计
心理与教育统计
2.推断统计 统计估计
参数估计
区间估计
非参数估计
假设检验
参数检验 非参数检验
样本选择与分配
实验误差分析
3.实验设计
方差分析 协方差分析
回归分析
因子分析 ... ...
1 / 107
圣才电子书 十万种考研考证电子书、题库视频学习平台

(二)心理与教育科学研究数据的特点 1.心理与教育科学研究数据与结果多用数字形式呈现 2.心理与教育科学研究数据具有随机性和变异性 3.心理与教育科学研究数据具有规律性 4.心理与教育科学研究的目标是通过部分数据来推测总体特征 (三)学习心理与教育统计应注意的事项 1.学习心理与教育统计学要注意的几个问题 (1)学习心理与教育统计学时,必须要克服畏难情绪。心理与教育统计学偏重于应用, 只要有中学数学知识就具备了学好心理与教育统计学的前提。 (2)在学习时要注意重点掌握各种统计方法使用的条件。 (3)要做一定的练习。 2.应用心理与教育统计方法时要做到: (1)克服“统计无用”与“统计万能”的思想,注意科研道德。 (2)正确选用统计方法,防止误用和乱用统计。
圣才电子书

第1章 绪 论
十万种考研考证电子书、题库视频学习平台
1.1 复习笔记
本章重点 心理与教育统计的研究内容 选择使用统计方法的基本步骤 统计数据的基本类型 心理与教育统计的基本概念
一、统计方法在心理和教育科学研究中的作用 (一)心理与教育统计的定义与性质 1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理 与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论 找出心理与教育活动规律的一门学科。 2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些 数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理, 最后得出结论的一种研究方法。 3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(applied statistics)两部分。前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各 个实践领域中的应用。心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。 类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章绪论1.描述统计(descriptive statistics)主要研究如何将实验或调查得到的大量数据进行图表整理或简缩成有代表性的数字(即统计量数),使其能客观、全面地反映这组数据的全貌,将其所提供的信息充分显现出来,为进一步统计分析和推论提供可能。

2.描述统计只限于对试验样本所得观测数据的统计分析,不考察其总体的特性。

3.推论统计(inferential statistics)是以描述统计为基础,从而解决由局部到全体的推论问题,即通过对一组统计量的计算分析,推论该组数据所代表的总体特性。

4.变量(variables):一个可以取不同数值的物体属性/事件。

5.事前无法预期结果的变量——随机变量6.观测值(原始取值):事后测定的某一结果。

7.概念理解:[涉及“实验”] 自变量(及其各水平)& 因变量(及相应的反应指标);[涉及“调查”,粗略对应于] 属性变量& 反应变量8.计数资料(count data):计算个数的数据,(如人口数,学校数,男女数等)9.计量资料(measurement data):借助于一定的测量工具或一定的测量标准而获得的数据(如分数,身高,体重,IQ)10.称名数据(nominal data):只区分属性或类别上的不同,只可计数,不能排序(性别,学科,职业)11.等级/顺序数据(ordinal data):可排序,但无相等单位,不能加减。

(等级评定,受教育程度,职称)12.等距数据(interval data):具有相等单位,无绝对零的数据,能加减不能乘除。

13.比率数据(ratio data):既表明量的大小,又具有相等单位,可以加减乘除,具有绝对零点。

14.称名数据和顺序数据合称为离散数据。

15.等距数据和比率数据合称为连续数据。

16.离散数据(discrete data)又称为不连续数据,这类数据在任何两个数据点之间所取的数据的个数是有限的。

17.连续数据(continuous data)指任意两个数据点之间都可以细分出无限多个大小不同的数值。

18.总体(population):具有某种特征的一类事物的全体。

用N表示。

19.个体(individual):构成总体的每个基本单元。

20.样本(sample):从总体中抽取的一部分个体。

21.频数(frequency):某一时间在某一类别中出现的数目22.频率:某一事件数目与此类别所有事件数目之比。

23.概率:用P。

某一事件在无限的观测中所能预料的相对出现的次数。

24.参数(parameter):描述总体特征的统计指标25.样本统计量/特征值:描述样本特征的统计指标。

26.统计量(statistics):样本的特征值第二章统计图表1.统计分组是根据被研究对象的特征,将所得数据划分到时各个级别中去。

2.统计分组应注意的问题:①分组要以被研究对象的本质特性为基础。

②分类标志的确立必须坚持穷尽性和互斥性原则。

3.分组次数分布表编制步骤:①求全距(最大值与最小值之差)②决定组距与组数③列出分组区间(精确组限、组中值):注意核实是否满足穷尽和互斥原则。

④登记并计算次数⑤编制次数分布表。

4.条形图适用资料为离散数据,饼图适用资料是间断性(离散性)资料,线形图、散点图用于连续性资料5.条形图与直方图的区别:①适用资料不同;②横轴标尺不同;③图形形状不同。

6.累加折线图 → 累加曲线图(如,图2-8):分正偏态、正态、负偏态三种(如,图2-9)P.437.第三章 集中量数1.集中趋势:数据向某方向的集中程度。

离中趋势:数据彼此的分散程度。

用来描述一组数据这两种特点的统计量即为集中量数和差异量数。

2.平均数的计算:N fX X c∑=,i N fd AM X ⨯+=∑其中,∑f 为各组数据的总次数(等于N ),X c 为各分组区间的组中值,f 为各组次数,AM 为估计平均数,i 为组距。

p.563.平均数的特点①离均差总和为0。

②每个数加上C ,则所得平均数为原平均数加上C。

③每个数乘以C,则所得平均数为原平均数乘以C。

4.平均数的优缺点1、优点:①反应灵敏。

②计算严密。

③计算简单。

④简明易解。

⑤适合于进一步代数演算。

⑥较少受抽样变动的影响。

2、缺点:①易受极值的影响。

“修剪平均数”②若有数据不够确切,则无法计算该样本平均数。

5.中数又称中位数/中点数,符号为Md(Median),是指一组数据中位于较大一半与较小一半中间位置的那个数。

适用资料:顺序数据及以上6.中数计算方法,p.617.中数优点:计算严密;计算简单;简明易解。

缺点:反应不灵敏;不适合进一步代数演算;受抽样变动影响较大。

8.众数又称范数/密集数/通常数,符号Mo(Mode),是指一组数据中出现次数最多那个数。

适用资料:称名数据及以上9.众数一般计算方法:直接观察10.众数优点:简明易解。

缺点:反应不灵敏;不适合进一步代数演算;受抽样变动影响较大。

11.正态分布中三者相等,正偏态中M > Md > Mo,负偏态中M < Md < Mo。

P.66第四章差异量数1.全距又称两极差,用最大值与最小值之差来表示离中趋势,符号R (range),R=X max-X min适用于等距数据及以上(将就也会用于顺序数据),计算所得数值越大,表明数据越离散/分散。

2.百分位差:用百分位数之间的差值来表示离中趋势,常用的有P90-P10、P93-P7。

3.四分位差(及四分位数)可视为百分位差的一种,符号Q(quartile deviation),公式Q =(P75 - P25)/2(即第三个四分位数与第一个四分位数之差的一半)4.平均差:离均差绝对值的均值,符号A.D.,公式5.平均差优缺点:描述离中趋势/离散程度最为直观,计算简单严密易懂、反应灵敏、受抽样变动影响小;但受限于取绝对值不利于进一步代数运算,因此仍属低效,应用不多。

(与平均数差不多)6.方差:离均差平方的均值,符号S2,公式7.标准差:符号S、s或SD,公式8.方差性质:①方差的可加性和可分解性②每个数加上C,则所得标准差等于原标准差。

③每个数乘以C,则所得标准差为原标准差乘以C。

9.优势①反应灵敏。

②计算严密。

③(还算)计算简单。

④(还算)简明易懂。

⑤适合于进一步代数演算。

⑥较少受抽样变动的影响。

缺点:①受极端数据影响大,若有缺失值,则计算不出标准差10.差异系数(coefficient of variation)用以比较多组数据之间离散程度的大小。

常用于:①同一团体不同观测值离散程度的比较(如,身高vs. 体重);②(各均值相差较大时)不同团体同种观测值离散程度的比较(如,成人体重vs. 小孩体重)11.差异系数计算公式:①适用资料至少是等距,理论要求为比率数据;②尚不能进行统计推论。

12.标准分数(standard score,又称Z分数)是以标准差为单位来表示一个原始分数在团体中所处的相对位置量数。

可用以比较多个数在其所在数组分布中的相对位置的高低(Z分数越大,表明该数据在其分布中取值越大、相对位置越靠前)。

计算公式:13.标准分数的优缺点优点:可比性;可加性;明确性;稳定性。

缺点:计算相对繁琐;常为负数或带有小数,难理解标准分数的应用(适用前提:正态变量)⑴(利用Z分数具有可比性)用于比较几个分属性质不同的观测值在各自数据分布中相对位置的高低。

⑵(再利用Z分数具有可加性)计算不同质的观测值的总和,以表示在团体中的相对位置。

[自习例4-9、4-10]⑶表示标准测验分数。

(如,“离差智商”,自习)⑷极端数据的取舍:M±2S或M±3S标准(即“正负两个或三个标准差原则”)第五章相关关系1.相关关系:变量之间存在相互联系,但不能直接做因果判断。

2.相关系数(coefficient of correlation):变量间相关程度的数字表现形式,即表示相关强度的指标(相关量数)。

符号:样本r ,总体ρ3.取值范围:-1≤r≤1该式表明:①相关系数的取值范围介于-1.00至+1.00之间,他是一个比率,常用小数形式表示。

②正负只表示方向,取值大小表示相关的强弱程度(值越大,相关越高)。

③相关系数r=+1.00时表示完全正相关。

④它只是顺序数据;4.散点图(scatter plot)以点的散布形状和疏密程度来显示两个变量的相关趋势和相关程度。

5.皮尔逊积差相关(Pearson’s product-moment correlation)适用资料适用资料[诸多条件缺一不可!]①(大样本的)成对数据(表现为两组数据存在一一对应关系),每对数据相互独立。

②正态双变量(即两总体服从正态分布或渐近正态的单峰分布)。

[样本咋样就不管了]③两数据类型均为连续数据(即等距/比率数据)。

④两变量呈直线相关(先用散点图预测)6.皮尔逊积差相关计算公式:7.斯皮尔曼等级相关(Spearman’s rank correlation)符号:rR或rS适用资料①两列变量,成对数据,各对数据相互独立;②均为顺序数据(及以上);③直线相关。

8.斯皮尔曼相关(较之积差相关)优点:适用范围大;缺点:精确度低。

因此,凡符合计算积差相关的资料,不要用等级相关计算。

9.斯皮尔曼等级相关计算公式:10.肯德尔W系数(和谐系数,Kendall’s concordance coefficient)P128适用资料:多列等级变量。

采用等级评定法或排序评定法所获得的资料。

(评分者信度)11.肯德尔U系数(一致性系数,Kendall’s consistency coefficient)适用资料:多列等级变量。

采用对偶比较法所获得的资料。

12.点二列相关分为:真正的vs. 人为的二分变量;后者可降级为前者。

13.点二列相关适用资料:连续变量与真正的二分变量,常用以评价是非题之类测验的内部一致性等。

连续数据与人为二分变量常用二列相关.14.求连续变量与顺序变量之间相关系数的降级方法通常为:①连续↘顺序求斯皮尔曼等级相关;②顺序↘称名求质量相关。

(前者居多)15.多列相关适用资料:两列正态变量,连续+人为地分成多组。

16.四分相关适用资料:两个都是人为的二分变量(本来是连续数据),其R ×C表为四格表。

17.Φ相关(系数)适用资料:两个都是真正的二分变量,其R×C表为四格表。

第六章概率分布1.频率:在对随机事件进行n次观测中,事件A出现m次,则m/n称为n 次试验中A出现的频率。

2.后验概率:当n→∞时,m/n将稳定于某个常数P上,P即为概率。

特点:试验之前无法预计,只有借助试验结果来估计。

3.先验概率:如果基本事件的总数为n,事件A包括m个基本事件,则事件A出现的概率记作P(A)=m/n。

相关文档
最新文档