心理统计学重要知识点

心理统计学重要知识点
心理统计学重要知识点

《心理统计学》重要知识点

第二章 统计图表

简单次数分布表的编制:Excel 数据透视表

列联表(交叉表):两个类别变量或等级变量的交叉次数分布,Excel 数据透视表

直方图(histogram ):直观描述连续变量分组次数分布情况,可用Excel 图表向导的柱形图来绘制 散点图(Scatter plot ):主要用于直观描述两个连续性变量的关系状况和变化趋向。 条形图(Bar chart ):用于直观描述称名数据、类别数据、等级数据的次数分布情况。 简单条形图:用于描述一个样组的类别(或等级)数据变量次数分布。 复式条形图:用于描述和比较两个或多个样组的类别(或等级)数据的次数分布。

圆形图(circle graph )、饼图(pie graph ):用于直观描述类别数据或等级数据的分布情况。 线形图(line graph ):用于直观描述不同时期的发展成就的变化趋势;

第三章 集中量数

● 集中趋势和离中趋势是数据分布的两个基本特征。

● 集中趋势:就是数据分布中大量数据向某个数据点集中的趋势。 ● 集中量数:描述数据分布集中趋势的统计量数。 ● 离中趋势:是指数据分布中数据分散的程度。

● 差异量数:描述数据分布离中趋势(离散程度)的统计量数 ● 常用的集中量数有:算术平均数、众数(M O )、中位数(M d ) 1.算术平均数(简称平均数,M 、X 、Y ):n

x X i

∑= Excel 统计函数AVERAGE

算术平均数的重要特性:

(1)一组数据的离均差(离差)总和为0,即0)(=-∑x x i

(2)如果变量X 的平均数为X ,将变量X 按照公式bx a y +=转换为Y 变量后,

那么,变量Y 2.中位数(median ,M d ):在一组有序排列的数据中,处于中间位置的数值。中位数上下的数据

出现次数各占50%。

3.众数(mode ,M O ):一组数据中出现次数最多的数据。 4.算术平均数、中数、众数之间的关系。 5.加权平均数:i

i

i n n n w w w x w w w w x w x w x M ∑∑=++++++=

ΛΛ212211

6.调和平均数(harmonic mean ,M H ):一组数值倒数的平均数的倒数。

∑=

+???++=

i

n

H x

n

n x x x M 1)111(

1

21 Excel 统计函数HARMEAN (1)用于描述同一个体(或一组个体)不同时间段的平均学习速度、平均工作效率。 (2)用于描述不同能力水平个体的平均学习速度、平均工作效率。 7.几何平均数(geometric mean ,Mg )是指n 个观察值连乘积的n 次方根.

(1)一组数据中少部分偏大(或偏小),数据分布呈偏态时,几何平均数比算术平均数更能反映

数据的集中趋势。

n n g x x x M ??=Λ21 Excel 统计函数GEOMEAN

(2)用于计算平均学习进步速度、平均发展速度(平均发展倍数),即环比的几何平均数。

11

1

134

2312---=???=n n n n n g x x x x x x x x x x M Λ (n x x x 、、

、Λ21为各个时间段的成果数据) 平均增长率:1-g M

第四章 差异量数

● 差异量数:描述一组数据离散程度(离中趋势)的统计量数。差异量数较大,说明数据分布得比较分散,数据之间的差异较大;差异量数较小,说明数据分布的比较集中,数据间的差异较小。 ● 差异量数还能反映平均数对一组数据的代表性。差异量数越小,平均数的代表性越好;差异量数越大,平均数的代表性越差。

● 常用的差异量数是标准差、方差、差异系数

标准差s :n X X s i 2

)(∑-=

Excel 统计函数STDEVP (给定样本总体的标准偏差)

标准差s n-1:1

)(2

1--=∑-n X X s i n Excel 统计函数STDEV (给定样本的标准偏差)

方差2s :n

X X s i 22

)(∑-=

Excel 统计函数VARP (给定样本总体的方差)

方差2

1

-n s

:1

)(22

1

--=

∑-n X X s i n Excel 统计函数VAR (给定样本的方差) 差异系数(又称变异系数、离散系数、相对标准差):X

S

CV =

(1)用于比较不同观测工具测量结果(数据单位不同)的离散程度,例如,身高离散程度大,还

是体重离散程度大?

(2)用于比较用同一观测工具测得的、均数差异较大的不同样本数据的离散程度。例如:7岁组

儿童和13组岁儿童的体重离散程度,哪个较大?

● 标准差的重要特性:如果变量X 的标准差为X S ,将变量X 按照公式bx a y +=转换为Y 变量后,

那么,变量Y 的标准差X Y bS S =

● 相对位置量数:反映个体(数据)在团体中相对位置的统计量数。

主要有标准分数及其线性转换分数(Z 分数、T 分数)、百分等级(PR)、正态化标准分数等。 1.标准分数的计算与应用:S X X Z i -=

或:σ

μ

-=i X Z , 5010+=Z T ,500100+=Z CEEB

Z 分数的特点:Z 分数的平均数为0,即0=Z μ,标准差为1,即1Z =σ T 分数的平均数50T =μ,标准差为10T =σ

CEEB 分数的平均数=___________?,标准差=__________?

(1)可用于比较个体各方面水平高低(横向比较,个体内差异评价)。

(2)对被试多方面的测量结果进行综合,如对高考各科成绩的综合,各分测验分数的综合。 (3)可用于对个体或样组某方面水平进行前后比较(纵向比较),判断其水平是提高了,退

步了,还是没有变化。

2.原始分数X 的百分等级的含义与计算

根据简单次数分布表计算:1005.0?+=

N

F f PR b

X 根据分组次数分布表计算:100?+?-=N

F f i L X PR b b

X

第五章 相关关系

● 相关关系的描述方法

(1)相关散点图:适用于直观描述两个连续性数值变量(等距数据、比率数据)之间的关系。

可用Excel 图表向导中的“XY 散点图”绘制。

(2)双向次数分布表(交叉表、列联表):适用于描述两个等级变量(或称名变量、类别变量)

之间的关系。可用Excel 数据透视表编制列联表)。 (3)相关系数(相关关系的特征值)。

● 相关系数:描述两个变量相关关系的统计量数,在~之间取值,绝对值越大,越接近1,说明两个变量之间的关系程度越密切;绝对值越小,越接近0,说明两个变量的关系程度越低。 ● 常用的相关系数: 1.积差相关:y

x i i s ns y y x x r ∑--=

))(( Excel 统计函数CORREL

适用条件:(1)X 、Y 两个变量都是连续性变量(等距数据或比率数据);

(2)X 、Y 两个变量总体上为正态分布或接近正态分布。

2.斯皮尔曼等级相关:是一对(两列)名次变量的积差相关。对数据变量的分布形态没有要求。

(1)等级积差相关法(名次积差相关法)。

Y

X R R Y Y X X R S NS R R R R r )

)((--∑=

Excel 统计函数CORREL

公式中的R X 和R Y 是分别代表两变量中每个数据在变量中的名次。

(2)等级差数法(名次差数法)。

如果每个等级(即名次)变量中没有相同的等级名次,可用下面公式计算:

等级差数法简化公式:)

1(6122

-∑-=N N D r R

如果等级(即名次)变量中有相同的等级名次,需用下面校正公式计算: 等级差数法校正公式:)

)((222222y x D y x r RC ∑∑?∑-∑+∑=

,2x ∑、2

y ∑计算方法参见教材125页

3.肯德尔W 系数(肯德尔和谐系数):描述多个名次变量一致性程度的统计量数。

适用于描述和分析不同评价者(如主考、阅卷者)对同一组个体(考生或答卷)评价结果(名次)的一致性程度,在心理测量与教育评价中称为评分信度。例如,5位阅卷老师对10篇论文评分排名的一致性。如果评价者给出的不是个体的水平名次,而是分数(或等第、符号),可先将其转换成名次,然后再计算W 系数。

)(121)(3222

N N K N R R W i i --=

∑∑ 校正公式:∑∑∑---=T N N K N R R W i i )(12

1)(3222

∑∑-=12)

1(2n n T 公式中:n 为每个名次变量中相同名次的数目。 4.点二列相关(point-biserial correlation ):

用于描述一列续性变量和一列真正二分变量(或非正态二分变量)之间的相关。

真正二变量:指按某种性质或标准将个体划分为两种结果的变量,如对、错,男、女等。

pq s X X r t

q

p pb ?-=

Excel 统计函数CORREL

5.二列相关(biserial correlation):用于描述由一个正态连续变量人为划分成的二分变量与另外一个

正态连续变量之间的相关。或者说,用于描述一正态二分变量与一正态连续变量之间的相关。 人为二分变量?是指由连续变量转换而来的二分变量,例如,将测验或考试分数区分为及格和不

及格,80分以上和80分以下;按中考(或高考)成绩,将考生区分为录取、未录取。

正态二分变量?如果二分变量是根据正态连续变量转换而来,那么,可称之为正态二分变量。 y 为将正态分布面积画分为p 、q 两部分的纵线的高度。 y 的计算方法:利用Excel 统计函数计算

标准正态分布区间点函数NORMSINV(p 值) →区间点Z 值 正态分布函数NORMDIST(区间点Z 值,0,1,0) →Z 值的概率密度y 6.Φ相关(Φ系数):)

)()()((|

|d b c a d c b a bc ad r ++++-=

Φ

用于描述两个真正二分变量的相关程度,也用于描述一个人为二分变量和真正二分变量的相关。 注意:Φ相关计算公式是由皮尔逊积差相关计算公式转换来的。因此,如果两列二分变量转换

为0、1(或1、2)的数值变量时,可以用Excel 统计函数CORREL 计算Φ系数。

第六章 概率分布

1.正态分布的特征(见教材)

2.Excel 软件中正态分布函数和正态分布区间点函数的应用

◆标准正态分布函数NORMSDIST 的应用: (1)P(Z <=? =NORMSDIST= (2)P(Z >=? =1-NORMSDIST=

(3)P <X <=? =NORMSDIST-NORMSDIST= ◆正态分布函数NORMDIST 的应用

例如:已知某次测验的分数呈正态分布,平均分为75分,标准差为10分,试计算: (1)低于80分的考生占多大比例,P(X <80分)=? (2)80分以上的考生占多大比例,P(X ≥80分)=?

(3)80分以上,低于90分的考生占多大比例,P(80≤X <90)=? P(X <80分):“=NORMDIST ,75,10,1)”= P(X ≥80分):“=1-NORMDIST ,75,10,1)”=

P(80≤X <90):“=NORMDIST ,75,10,1)-NORMDIST ,75,10,1)”= ◆标准正态分布区间点函数NORMSINV 的应用

根据给定的向上累积概率P(Z

根据正态变量X 的平均数、标准差和向上累积概率P(X

例:已知某次大规模招聘考试分数呈正态分布,平均分为55分,标准差为12分。现准备录取

10%的考生进行面试,录取分数线大致是多少? P(X >?)=,即P(X <?)==,=NORMINV ,55,12)=,

最低分数线应为70分。

3.测验分数、测评等级的正态化:

根据被试样本原始分或等级的简单次数分布表,计算各个不同分数或等级的正态标准分数 (1)计算每个不同分数X (或等级)以下累计次数F b ;

(2)计算每个不同分数X (或等级)中点以下累积比率CP :N

F f CP b

X +=

5.0 (3)利用Excel 统计函数NORMSINV ,计算CP 对应的正态Z 分数。 (4)根据需要,将正态Z 分数转为其他标准分数形式:

T 分数、CEEB 分数、托福考试分数、离差智商IQ 等,

5010+=Z T ,500100+=Z CEEB ,50070+=Z TOEFL ,10015+=Z IQ

4.偏态系数(SK )和峰态系数(Kurt )的计算与应用

偏态系数:Excel 统计函数SKEW ; 峰态系数:Excel 统计函数KURT 。 偏态系数SK =0,对称分布;SK >0,正偏态分布;SK <0,负偏态分布。

峰态系数Kurt =0,正态分布的峰态;Kurt >0,次数分布的峰度比正态分布峰度低阔;

Kurt <0,次数分布峰度比正态分布峰度高狭。

偏态系数和峰态系数都等于0或接近0时,变量的分布为正态分布。 5.二项分布的定义

二项分布是二项试验验结果的概率分布。进行n 次二项试验,各次试验彼此独立,每次试验时某事件出现的概率都是p ,该事件不出现的概率为q (=1-p ),则该事件出现x 次的概率分布为:

x

n x x n q p C p n x b x X P -===),,,()(。

二项分布的Excel 统计函数:BINOMDIST 6.二项分布函数BINOMDIST 的应用

对20道四选一的单项选择题,如果完全凭猜测答题,那么 (1)猜对5道题的概率是多少? (2)猜对5题以下概率是多少? (3)猜对6题以上的概率是多少? n =20,每题猜对的概率为p =

(1)猜对5道题的概率P (X =5) =BINOMDIST (5,20,,0)= (2)猜对5题以下的概率P (X ≤5) =BINOMDIST (5,20,,1)=

(3)猜对6题以上的概率P (X ≥6)=1-P (X ≤5) =1-BINOMDIST (5,20,,1)= 7.二项分布的形态:随n 、p 的变化具有不同的分布形态

(1)当p =q 时,二项分布是对称分布。 (2)当p =q ,np ≥5时,接近正态分布。

(3)当p ≠q ,np <5或nq <5时,二项分布为偏态分布。 (4)当p ≠q ,np ≥5且nq ≥5时,二项分布接近正态分布。 8.二项分布的平均数和标准差

进行n 次二项试验,每次试验时某事件出现的概率都是p ,则该事件出现次数的理论平均数(μ)、 方差(2σ)和标准差σ分别为:npq npq np =

==σσμ,,2。

如果np ≥5且nq ≥5,成功事件出现结果的概率分布接近np =μ、npq =σ的正态分布。

进行投掷100枚硬币试验,如果进行无数次试验,正面向上的硬币数目会在0~100个之间变化。那么,正面向上次数的理论平均数:μ=np =100×=50,标准差为55.05.0100=??==

npq σ。

20道四选一的单项选择题,如果完全凭猜测答题,那么, 猜对题数的平均数为μ=np =20×1/4=5

猜对题数的理论标准差为94.14/34/120=??==npq σ。

第七章 总体参数估计

1.常用的点估计:

总体均数μ的点估计:用样本平均数X ,Excel 统计函数为AVERAGE 总体方差σ2的点估计:用样本标准差2

1-n S ,或1

2-?

n n

S 。

总体标准差σ的点估计:用样本标准差1-n S ,或1

-?

n n

S 。

2.总体平均数的区间估计

1.若样本均数的抽样分布为正态分布,

总体均数的置信区间为:1

96.105.0-?±=±n S X SE Z X X

总体均数的置信区间为:158.2201.0-?±=±n S X SE Z X X

2.若样本均数的抽样分布为df =n -1的t 分布,那么,

总体均数的置信区间为:12/05.02/05.0-?±=±n S t X SE t X X

总体均数的置信区间为:1

2/01.02/01.0-?

±=±n S t X SE t X X

自由度df =n -1,205.0t =?,205.0t =?,可用Excel 统计函数TINV 计算。 也可查教材453页t 值表

3. 总体方差与标准差的区间估计

总体方差2σ的置信区间为:

2975

.02

2

2025

.02

χσχnS nS <

<,或

2975

.021

2

2025

.021

)1()1(χσχ---<

<-n n S n S n ,

总体方差2σ的置信区间为:

2995

.02

2

2005

.02

χ

σχ

nS nS <

<,或

2995

.021

2

2005

.021

)1()1(χ

σχ

---<

<-n n S n S n

自由度df =n -1的2χ分布右侧概率区间点的计算,也可用Excel 统计函数CHIINV 。 也可查教材475页2χ分布数值表

总体标准差σ的置信区间:取总体方差2σ置信区间上、下限的正平方根。 4.总体积差相关系数的区间估计:

(1)将样本相关系数r 转换为费舍Zr 值,转换方法:Excel 统计函数FISHER (2)计算Zr 的标准误SE Zr :3

1-=

n SE Zr

(3)计算总体Z ρ值的1-α置信区间:Zr r SE Z Z 2α±

置信区间为:396.105.0-±=±n Z SE Z Z r Zr r

置信区间为:3

58.2201.0-±

=±n Z SE Z Z r Zr r

(4)计算总体相关系数ρ值的置信区间:将总体Z ρ值区间上、下限进行费舍逆转换,

转换方法:Excel 统计函数FISHERINV

5.总体比率(比例)的区间估计

5?5?≥≥q n p

n ,时,样本比率p ?的抽样分布渐近正态分布。 总体比率的置信区间为:n

q p

p SE p

p ??96.1?96.1??±=±

总体比率的置信区间为:n

q p

p SE p

p ??58.2?58.2??±=±

第八章 假设检验

在Z 检验中:双侧检验临界值:2/05.0Z = 2/01.0Z =

单侧检验临界值:05.0Z = 01.0Z =

单侧显着性概率P :=1-NORMSDIST (ABS (Z 值)) 双侧显着性概率P :=(1-NORMSDIST(ABS(Z 值)))*2

在t 检验中:单侧显着性概率P :=TDIST (ABS (t 值),df ,1)

双侧显着性概率P :=TDIST (ABS (t 值),df ,2)

1.单个样本Z 检验

主要用途:分析单个样本均数x 与已知的总体均值μ0的有无显着差异, 适用条件:(1)总体呈正态分布,总体方差2σ已知;

(2)总体是正态分布,总体方差2σ虽然未知,但样本容量30≥n ; (3)即使总体非正态分布,总体方差2σ也未知,样本容量30≥n 。

2.单个样本t 检验

主要用途:用于分析单个样本均数x 与已知的总体均数μ0的差异,

适用条件:(1)总体呈正态分布,总体方差2σ未知,样本容量30

(2)总体非正态分布,总体方差2σ未知,样本容量30≥n 的情况下.

3.单个样本比率Z 检验

主要用途:根据一个样本的比率p ?,分析样本所代表的总体比率p 与已知比率0p 有无显着差异。

适用条件:5500≥≥nq np , 4.两独立样本比率差异Z 检验

主要用途:根据两个独立样本的比率21??p p

-,推断两总体比率p 1、p 2有无显着差异 适用条件:两个样本相互独立,22112211????q n q n p n p

n ,,,都≥5 5.两独立样本方差齐性检验

主要用途:根据相互独立的两个样本的方差,推断两个总体的方差是否相等或是否有显着差异。

)

1()

1(222

212112

1

2

121--=

=

--n S n n S n S S F n

n

小的大的 分子方差的自由度df=n 1-1,分母方差的自由度df=n 2-1

双侧显着性概率P 值:=FDIST (F 值,分子自由度,分母自由度)*2

6.相关样本t 检验

主要用途:

(1)根据一组被试前、后两次测评结果,推断两次测验结果的总体均数有无显着差异。 (2)根据实验组和配对对照组测评结果,推断实验组和对照组的总体均数有无显着差异。 适用条件:两个样本的数据有一一对应关系,且有可比性;两总体数据呈正态分布。 7.独立样本Z 检验

主要用途:根据两个独立样本的均数差异21X X -,推断两总体均数21μμ、有无显着差异。 适用条件:(1)两总体为正态分布,总体方差2

1σ、2

2σ已知,不管样本大小

(2)两总体非正态分布,总体方差2

1σ、2

2σ已知,303021≥≥n n ,时 (3)两总体非正态分布,总体方差2

1σ、2

2σ未知,303021≥≥n n ,时

总体2

1σ、2

2σ已知时:2

22

1

21

2

1n n X X Z σ

σ

+

-=

; 总体21σ、2

2σ未知时:2

221

2121n s n s X X Z +-=

8.独立样本等方差假设t 检验

主要用途:根据两个独立样本的均数差异21X X -,推断两总体均数21μμ、有无显着差异? 适用条件:(1)两总体为正态分布,总体2

1σ、2

2σ未知,且2

1σ=2

2σ,不管样本大小

(2)两总体非正态分布,总体2

1σ、2

2σ未知,且2

1σ=2

2σ,303021≥≥n n ,时

两总体方差2

1σ、2

2σ是否相等,需要先做方差齐性检验。 注意:大多数情况下,两总体方差基本相等。 9.独立样本异方差假设t 检验

主要用途:根据两个独立样本的均数差异21X X -,推断两总体均数21μμ、有无显着差异? 适用条件:(1)两总体为正态分布,总体2

1σ、2

2σ未知,且2

1σ≠2

2σ,不管样本大小

(2)两总体非正态分布,总体2

1σ、2

2σ未知,且2

1σ≠2

2σ,303021≥≥n n ,时

2

2

212121n s n s X X t +-=

当n n n ==21时,1-=n df ;当21n n ≠时,()1

)

(1)(22

1

21121212

22

2121

-+-+=n n s n n s n s n s

df 10.积差相关显着性t 检验

主要用途:根据一对变量的样本数据及其积差相关系数r ,推断两变量有无显着关系。 适用条件:两变量为连续性数值变量,且总上正态分布。

第十四章 抽样原理及方法(参见教材)

西南大学《教育与心理统计学》网上作业

1、已知某小学一年级学生的平均体重为26kg,体重的标准差是3.2kg,平均身高2750px,标准差为150px,问体重与身高的离散程度哪个大(a )? A. 体重 B. 身高 C. 离散程度一样 D. 无法比较 2、下列一组数据3,7,2,7,6,8,5,9的中位数是(b) A. 6 B. 6.5 C. 6.83 D. 7 3、设X是正态变量,均值为0,标准差为2,则X的绝对值小于2的概率约为(b )。 A. 5% B. 70% C. 90% D. 95% 4、欲考察考生类型(应届/历届)与研究生录取(录取/不录取)的关系,应该用什么相关方法( d )? A. 二列相关 B. 点二列相关 C. 四分相关 D. Φ相关 5、数值56的精确上下限为(c) A. [55.5-56.5] B. [55.49-56.5] C. [55.5-56.49] D. [55.49-56.49] 6、在假设检验中,同时减少两类错误的最好办法是( b )。 A. 控制β值,使其尽量小 B. 适当加大样本容量 C. 完全随机取样 D. 控制α水平,使其尽量小 7、甲乙两人不知道“本题”的哪一个选项是正确的,只好随机猜测作答。结果两个人答案都正确的概率是( a ) A. 1/16 B. 3/16 C. 1/8 D. 9/16 8、最常用来与中数一起来描述数据特征的差异数量是(d )。 A. 方差 B. 标准差 C. 百分位差 D. 四分位差 9、有一组数据的平均数和标准差分别是8和2。如果给这组数据的每个数都加上2,再乘以3,可以得到一组新数据,那么这组新数据的平均数和标准差分别是(b) A. 30,2 B. 30,6 C. 26,2 D. 26,6 10、设总体服从正态分布,均值是60,标准差是10,有一个样本,容量为100,则样本均值有95%的可能性位于( c )。 A. (40, 80) B. (50, 70) C. (58, 62) D. (57.5, 62.5) 11、当样本容量一定时,置信区间的宽度(c )。 A. 随着显著性水平α的增大而增大 B. 与显著性α无关 C. 随着显著性水平α的增大而减小 D. 与显著性α的平方根成正比 12、用相同大小圆点的多少或疏密来表示统计资料数量大小以及变化趋势的是(d) A. 直方图 B. 线形图 C. 条形图 D. 散点图 13、下列方法中,一定不能用于处理两组均值比较问题的是?(a) A. 中数检验法 B. 方差分析法 C. t检验 D. Z检验 14、下列关于假设检验的描述正确的是?(b) A. 假设检验包括显著性检验与差异显著性检验 B. 非参数检验属于假设检验 C. 假设检验中的α型错误与β型错误两者的概率相加等于1 D. 方差分析不属于假设检验 15、对120位学生家长进行测试得到其家庭教养方式四种类型(如民主型、专制型等)的人数,欲描述其次数分布,应使用的次数分布图是?(c) A. 散点图 B. 线形图 C. 条形图 D. 直方图 16、下列可用于主观题区分度评价的相关系数是?(c) A. 点二列相关 B. 二列相关 C. 皮尔逊相关 D. 斯皮尔曼相关 17、下列描述中,属于零假设的是?(d) A. 少年班大学生的智商高于同龄人 B. 母亲的耐心程度与儿童的问题行为数量呈负相关关系 C. 在高光照条件下的视觉简单反应时优于低光照条件下的视觉简单反应时

0272《心理统计学》2016年6-7月期末考试指导要点

0272《心理统计学》2016年6-7月期末考试指导 一、考试说明 本课程闭卷考试,满分100分,考试时间90分钟。可能的考试题型包括: 1、单项选择题 2、判断题 3、简答题 4、计算题 5、综合应用题 二、重点复习内容 (一)绪论 1、心理学统计学的内容:描述统计、推论统计、实验设计。其中,描述统计的指标包括数据的集中趋势,数据的离散趋势和数据间的相关 2、数据的种类 按照测量的水平,可以划分为称名变量、等级变量、等距变量和比率变量。 (1)称名变量,是指根据事物的某一特征,用来划分、区别事物的不同种类所形成的变量。这类数码并无数量和序列的含义,不能进行数量化分析,不能做加减乘除的运算。 (2)等级变量,在对事物进行分类过程中,依据事物某种属性程度的大小排列顺序形成的变量。等级变量既无相等单位,也无绝对零,不同组的等级变量间不能进行加减乘除的运算。(3)等距变量,是指在观测标识事物某一特定属性时,具有相对参照点、有相等单位的变量。可以进行加减运算,但是由于等距变量的参照点是相对的,即无绝对零点,因此不能进行乘除的运算。例如,测量温度的℃。 (4)比率变量,是指既有相等单位又有绝对零参照点的变量,如身高、体重、反应时、各种感觉阈值的物理量等。这类变量可以进行加减乘除的运算。 (二)统计图表 1、次数分布表:各种次数分布的列表形式和图示形式。次数分布包括简单次数分布、分组次数分布、相对次数分布、累积次数分布等。 2、编制次数分布表的步骤 (1)求全距:从最大值的数据中减去最小值的数据,所得差数就是全距。用符号R表示(2)定组数 (3)求组距:指每一组的间距,用符号i表示。 (4)定组限:指各组数据在数值上的起点值和终点值。 (5)求组中值:各组实际上限数值与实际下限数值的中点数值,即上、下限数值的平均值。(6)归类划记:将原始观测值按照一定的顺序逐一归组。 (7)记录各组次数(f)。 (8)核对,抄录新表。 3、连续变量的单位是无限的,例如整数180的实上限和下限分别为179.5和180.5,而测量数据8.35的下实限是8.345。 4、累加次数分布表:如果想知道某个数值以下或以上的数据的数目,就要用累加次数。 5、次数分布图:编制次数分布表与绘制次数分布图,对于了解一组数据的分布情况,平均水平,差异情况等非常有用。由于数据的性质不同,有时实验结果的次数分布图上会出现双峰。 (三)集中量数 集中量数主要用来描述一组数据的集中趋势,常用的代表性的集中量数有算术平均数、中数、众数。 1、算术平均数:又称平均数,是集中量数中性能最好的一个统计量,一般用M表示。

现代心理与教育统计学第07章习题解答

1. 何谓点估计与区间估计,它们各有哪些优缺点? 点估计就是总体参数不清楚时,用一个特定的值,即样本统计量对总体参数进行估计,但估计的参数为数轴上某一点。 区间估计是用数轴上的一段距离来表示未知参数可能落入的范围,它不具体指出总体参数是多少,能指出总体未知参数落入某一区间的概率有多大。 点估计的优点是能够提供总体参数的估计值,缺点是点估计总以误差的存在为前提,且不能提供正确估计的概率。 区间估计的优点是用概率说明估计结果的把握程度,缺点是不能确定一个具体的估计值。 2以方差的区间估计为例说明区间估计的原理 根据χ2分布: 总体方差的.95或.99置信区间为: 即总体参数(方差)落入上述区间的概率为1-α,其值为95%或99% 3.总体平均数估计的具体方法有哪些? 总体方法为点估计好区间估计,区间估计又分为: (1) 当总体分布正态方差已知时,样本平均的分布为正态分布,故依据正态分布理论估计其区间;(2)当总体分布正态方差未知时,样本平均数的分布为T 分布,依据T 分布理论估计其区间;(3)当总体非分布正态方差未知时,只有在n 大于30时渐近T 分布,样本平均数的分布渐近T 分布,依据T 分布理论估计其区间。 4总体相关系数的置信区间,应根据何种分布计算? 应根据Fisher 的Z 分布进行计算 5.解 依据样本分布理论该样本平均数的分布呈正态 其标准误为: 其置信区间为: 该科成绩的真实分数有95%的可能性在78.55----83.45之间。 6.解:此题属于总体分布正态总体方差未知的情形,故样本平均数的分布呈T 分布 其标准误为: 用df=99差T 值表,然后用直线内插法求得t α/2=1.987 其置信区间为: 该学区教学成绩的平均值有95%的可能在78.61---81.39之间。 7解:此题属于总体分布正态总体方差已知 计算标准误 ()()222212221σσσχnS S n X X n =-=-=-∑()()22/121222/2111)(ααχσχ----<<-n n S n S n 25.116 5===n x σσ45 .8355.7825.1*96.18125.1*96.1812/2/<<+<<-?+<

《教育统计学》超详细知识点及重点笔记

华东师大心理统计学大纲 教材:《教育统计学》 第一章绪论 第一节什么是统计学和心理统计学 一、什么是统计学 统计学是研究统计原理和方法的科学。具体地说,它是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。 统计学分为两大类。一类是数理统计学。它主要是以概率论为基础,对统计数据数量关系的模式加以解释,对统计原理和方法给予数学的证明。它是数学的一个分支。另一类是应用统计学。它是数理统计原理和方法在各个领域中的应用,如数理统计的原理和方法应用到工业领域,称为工业统计学;应用到医学领域,称为医学统计学;应用到心理学领域,称为心理统计学,等等。应用统计学是与研究对象密切结合的各科专门统计学。 二、统计学和心理统计学的内容 统计学和心理统计学的研究内容,从不同角度来分,可以分为不同的类型。从具体应用的角度来分,可以分成描述统计,推断统计和实验设计三部分。 1.描述统计 对已获得的数据进行整理、概括,显示其分布特征的统计方法,称为描述统计。 2.推断统计 根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上,对总体分布特征进行估计、推测,这种统计方法称为推断统计。推断统计的内容包括总体参数估计和假设检验两部分。 3.实验设计 实验者为了揭示试验中自变量和因变量的关系,在实验之前所制定的实验计划,称为实验设计。其中包括选择怎样的抽样方式;如何计算样本容量;确定怎样的实验对照形式;如何实现实验组和对照组的等组化;如何安排实验因素和如何控制无关因素;用什么统计方法处理及分析实验结果,等等。 以上三部分内容,不是截然分开,而是相互联系的。 第二节统计学中的几个基本概念 一、随机变量 具有以下三个特性的现象,成为随机变量。第一,一次试验有多中可能结果,其所有可能结果是已知的;第二,试验之前不能预料哪一种结果会出现;第三,在相同的条件下可以重复试验。随机现象的每一种结果叫做一个随机事件。我们把能表示随机现象各种结果的变量称为随机变量。统计处理的变量都是随机变量。 二、总体和样本 总体是我们所研究的具有共同特性的个体的总和。总体中的每个单位成为个体。样本是从总体中抽取的作为观察对象的一部分个体。当总体所包含的个数有限时,这一总体称为有限总体。而总体所包含的个数无限时,则称为无限总体。样本中包含的个体数目称为样本的容量,一般用n来表示。一般来说,样本中个体数目大于30称为大样本,等于或小于30称为小样本。在对数据进行处理时,大样本和小样本所用的统计方法不一定相同。 三、统计量和参数

西南大学0062]《教育与心理统计学》网上作业及答案

西南大学[0062]《教育与心理统计学》网上作业及答案 1、设X是正态变量,均值为0,标准差为2,则X的绝对值小于2的概率约为()。 1. 5% 2. 70% 3. 95% 4. 90% 2、欲考察考生类型(应届/历届)与研究生录取(录取/不录取)的关系,应该用什么相关方法(1. B. 点二列相关 2.二列相关 3.Φ相关 4.四分相关 3、在假设检验中,同时减少两类错误的最好办法是()。 1. E. 控制α水平,使其尽量小 2.完全随机取样 3.适当加大样本容量 4.控制β值,使其尽量小 4、甲乙两人不知道“本题”的哪一个选项是正确的,只好随机猜测作答。结果两个人答案都 正确的概率是() 1. 1/8 2. 9/16 3. 3/16 4. 1/16

5、最常用来与中数一起来描述数据特征的差异数量是()。 1.四分位差 2.百分位差 3.标准差 4.方差 6、有一组数据的平均数和标准差分别是 8和 2。如果给这组数据的每个数都加上2,再乘以3,可以得到一组新数据,那么这组新数据的平均数和标准差分别是 1. 30,6 2. 26,2 3. 30,2 4. 26,6 7、设总体服从正态分布,均值是60,标准差是10,有一个样本,容量为100,则样本均值有95%的可能性位于()。 1.(58, 62) 2.(57.5, 62.5) 3.(50, 70) 4.(40, 80) 8、当样本容量一定时,置信区间的宽度()。 1. C. 与显著性α无关 2.随着显著性水平α的增大而减小 3.随着显著性水平α的增大而增大 4.与显著性α的平方根成正比

9、当样本平均数落入已知总体抽样分布的拒绝域时,表示正确拒绝零假设的概率的符号是? 1. 1-α 2.α 3.β 4. 1-β 10、下列关于方差分析与t检验的描述中不正确的是? 1.方差分析用于多组比较,比两两t检验有更好的误差估计 2.方差分析用于多组比较,比两两t检验时,α型错误更小 3.方差分析检验结果显著后,可以使用两两t检验进行多重比较 4.方差分析用于多组比较,比两两t检验的检验次数更少 11、下列关于假设检验的描述正确的是? 1.假设检验包括显著性检验与差异显著性检验 2.非参数检验属于假设检验 3.假设检验中的α型错误与β型错误两者的概率相加等于1 4.方差分析不属于假设检验 12、下列可用于主观题区分度评价的相关系数是? 1.点二列相关 2.二列相关 3.皮尔逊相关 4.斯皮尔曼相关 13、下列统计图形中,不能用于描述变量的次数分布的是? 1.圆形图

心理统计学

课程内容 一、绪论 二、数据的搜集、整理与显示 三、数据分布特征的度量(测度) 集中趋势的度量 离中趋势(离散程度)的度量 偏态与峰度的度量 四、相关分析 五、概率与概率分布 六、抽样与总体参数的估计 七、假设检验 八、方差分析 九、列联分析 十、回归分析 十一、非参数检验方法 一、绪论 1.1 统计与统计学含义 1.2 统计学分类 1.3 统计学与其他学科的关系 1.4 统计学的产生与发展 1.5 几个基本概念 1.1 统计与统计学含义 统计: 已被赋予多种含义,不同场合有不同的含义 (1)统计工作:统计数据的搜集活动; (2)统计数据:统计活动的结果; (3)统计学:分析统计数据的方法和技术 统计学: 是一门搜集、整理和分析统计数据的方法的科学,目的是探索数据的内在数量规律性,以达到对客观事物的科学认识。 统计数据的搜集是取得统计数据的过程,是进行统计推断的基础。如何取得准确、可靠的统计数据是统计学研究的内容之一。 统计数据的整理是对统计数据的加工处理过程,目的是使统计数据系统化、条理化,符合统计分析的需要。它是数据搜集与数据分析之间的一个必要环节。 统计数据的分析是统计学的核心内容,是通过统计描述和统计推断的方法探索数据内在规律的过程。 Statistics: 以单数名词出现时表示“统计学”; 以复数名词出现时表示“统计数据”或“统计资料”。 单个数据没有多大意义,但通过多次观察或实验得到大量的统计数据,利用统计方法可以探索出其内在数量规律性。 例如:

新生婴儿的性别比例统计规律是: 男:女=107:100 掷硬币试验中正反面比例的统计规律是: 正面:反面=1:1 1.2 统计学的分类 根据统计方法的构成分为: 描述统计学 推断统计学 根据统计方法的研究与应用分为: 理论统计学 应用统计学 描述统计学 描述统计学主要研究如何整理科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质。具体内容包括:数据如何分组、如何使用各种统计表和统计图的方法去描述一组数据的分组及分布情况,如何通过一组数据计算一些特征数,简缩数据,进一步显示与描述一组数据的全貌。 表示数据集中情况的特征有:算术平均数、中数、众数、几何平均数、调和平均数等;表示数据分散情况的特征有:平均差、标准差、变异系数、标准分数等 表示事物两种以上性质之间关系情况有:相关系数 表示数据分布是否对称、偏斜的程度及扁平程度的特征有:偏度与峰度。 推断统计学 推断统计学是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征作出以概率形式表达的推断。具体说,如何从局部的数据估计全局的情况;如何对假设进行检验与估计;如何对影响事物变化的因素进行分析;如何对两种事物或多种事物之间的差异进行比较等。涉及到的统计方法有: (1)记数资料假设检验方法。包括:百分位检验方法、卡方检验等; (2)假设检验的各种方法。包括:大样本的检验方法(u检验法),小样本的检验方法(t 检验法),方差分析,回归分析方法等;

现代心理与教育统计学的复习资料

第一章心理与教育统计学基础知识 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 比率数据 2、变量、随机变量、观测值 变量是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、总体、个体和样本 需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数

5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章统计图表 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表

将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图(frequency polygon )是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 %100 N f

《教育与心理统计学》自学指导书(精)

《教育与心理统计学》自学指导书 一、选择题 1、中数在一个分布中的百分等级是() A、50 B、75 C、25 D、50-51 2、平均数是一组数据的() A、平均差 B、平均误 C、平均次数 D、平均值 3、两个N=20的不相关样本的平均数差D=2.55,其自由度为() A、39 B、38 C、18 D、19 4、在大样本平均数差异的显著性检验中,当Z≥2.58时,说明() A、P〈.05 B、P〈.01 C、P〉.01 D、P≤.01 )5、在一个二择一实验中,被试挑12次,结果他挑对10次,那么在Z=(X-M B /S 这个公式中X应为() B A、12 B、10 C、9.5 D、10.5 6、当XY间相关程度很小时,从X推测Y的可靠性就() A、很小 B、很大 C、中等 D、大 7、在处理两类刺激实验结果时,在下列哪种情况下不可以用正态分布来表示二 项分布的近似值?() A、N〈10 B、N≥10 C、N〉30 D N〉10 8、在心理实验中,有时安排两组被试分别在不同的条件下做实验,获得的两组 数据是() A、相关的 B、不相关的 C、不一定 D、一半相关,一半不相关 9、运用非参数分析时,要求处理的数据是() A、十分精确的 B、注明单位的 C、大量的 D、等级形式的 10、在X2检验时,遇到下面哪种情况时不宜再用X2检验?() A、F〉10 B、F〈5 C、F〉5 D、F〈10 二、填空题 1、统计是一种(),它要在()正确的前提下才能充分发挥作用 2、用曲线图比较两组的实验结果时,如果两组被试的人数不同,就不能用 ()比较,用()数进行比较 3、在集中趋势的指标中()、()不受极端数值的() 4、当平均数大于中数或()时,曲线向()偏斜 5、当一种变量增加时,另一种变量也随着(增加),说明这两者间有着()关系 6、没有因果关系的事物之间,()系数()等于零 7、正态分布因其M和()不同而各异,M值大,曲线的集中趋势在横轴上越偏() 8、无论总体分布是否正态,从中抽取许多大样本,其平均数的分布都趋于 ()分布 9、统计检验结果的显著与否是()的,它的科学性表现在说明了()可能有多大 10、显著检验要解决的问题是两个()平均数据的差异是否显著地大于()误差 三、名词解释

心理统计学》重要知识点

《心理统计学》重要知识点 第二章 统计图表 简单次数分布表的编制:Excel 数据透视表 列联表(交叉表):两个类别变量或等级变量的交叉次数分布,Excel 数据透视表 直方图(histogram ):直观描述连续变量分组次数分布情况,可用Excel 图表向导的柱形图来绘制 散点图(Scatter plot ):主要用于直观描述两个连续性变量的关系状况和变化趋向。 条形图(Bar chart ):用于直观描述称名数据、类别数据、等级数据的次数分布情况。 简单条形图:用于描述一个样组的类别(或等级)数据变量次数分布。 复式条形图:用于描述和比较两个或多个样组的类别(或等级)数据的次数分布。 圆形图(circle graph )、饼图(pie graph ):用于直观描述类别数据或等级数据的分布情况。 线形图(line graph ):用于直观描述不同时期的发展成就的变化趋势; 第三章 集中量数 ● 集中趋势和离中趋势是数据分布的两个基本特征。 ● 集中趋势:就是数据分布中大量数据向某个数据点集中的趋势。 ● 集中量数:描述数据分布集中趋势的统计量数。 ● 离中趋势:是指数据分布中数据分散的程度。 ● 差异量数:描述数据分布离中趋势(离散程度)的统计量数 ● 常用的集中量数有:算术平均数、众数(M O )、中位数(M d ) 1.算术平均数(简称平均数,M 、X 、Y ):n x X i ∑= Excel 统计函数AVERAGE 算术平均数的重要特性: (1)一组数据的离均差(离差)总和为0,即0)(=-∑x x i (2)如果变量X 的平均数为X ,将变量X 按照公式bx a y +=转换为Y 变量后, 那么,变量Y 2.中位数(median ,M d ):在一组有序排列的数据中,处于中间位置的数值。中位数上下的数据出现 次数各占50%。 3.众数(mode ,M O ):一组数据中出现次数最多的数据。 4.算术平均数、中数、众数之间的关系。 5.加权平均数:i i i n n n w w w x w w w w x w x w x M ∑∑=++++++= 212211

教育与心理统计学自考大纲

Ⅰ课程性质与设置目的 一、课程性质与特点 教育与心理统计学是统计学运用于心理学和教育学领域所产生的一个应用 统计学分支,它的任务就是向心理学和教育学研究者提供分析心理现象和教育现象的数量规律性的统计分析工具。它是为培养和检验考生的教育与心理统计的基本理论知识,基本技能和实际应用能力而设置的专业基础课程,是进一步学习实验心理学、心理测量学、教育测量学等课程的前提。 该课程的特点:(一)逻辑分析性强;(二)概念和公式运用多;(三)运用各种统计分析方法量化地分析、认识教育和心理现象和规律。因此在考生自学及自考命题过程中,应充分地重视本课程的综合性和应用性的特点。 二、课程目的与要求 本课程的设置目的在于使自学应考者理解掌握教育与心理统计的基本概念 与基本原理,培养其描述统计分析能力和推断统计能力,并能用来解决教育教学以及管理研究方面的实际问题。考生应该懂得和掌握一些必要的统计分析方法,以便能独立分析资料、处理数据直至科学决策。 本课程的基本要求是:从总体上把握教育与心理统计学的基本理论,掌握教育与心理统计的基本概念、基本原理和基本方法;能够针对具体的问题按照要求对数据进行描述统计与推断统计分析处理;能够运用统计分析的原理与方法来解决教育、心理方面的实际问题。 三、本课程与相关课程的联系、分工和区别 教育与心理统计学是采用统计学的原理和方法来解决教育学和心理学课程中遇到的问题的一门课程,因此与教育学、心理学和统计学有相对密切的联系。统计学是教育与心理统计学的理论基础,因此具备一些统计学上的预备知识对于学习教育与心理统计学这门课程是必要的。当然,教育与心理统计学在内容上会更注重统计学在教育学和心理学方面的应用,具有更强的针对性和实用性。此课程是一种方法性课程,它为教育学和心理学的学习和研究过程提供了一种很好的工具,而教育学和心理学则为这种方法的学习提供了一种载体,在应用中不断得到理论和方法的完善。 考生在学习本课程应该把握两个要点:一是要全面了解教育与心理统计学的基础知识,以便在具体的应用中选择正确的数据处理方法;二是要注意结合教育学与心理学的理论和实践,在解决问题中理解和掌握数据统计处理的应用条件和操作过程。 《教育与心理统计学》教材的重点是2~8章,介绍教育学与心理学中常采用的数据统计处理方法,第1章是学习相关知识的基础,要求对此有相关的了解;第9~14章是知识的进一步深入,不要求掌握。

心理统计学-课程讲义5

【课程讲义】 第五章相关系数 【教学目标】明确相关是描述两个变量之间关系的量数;掌握相关的种类;掌握各种相关系数的计算、适用条件;掌握相关在教学实践中的运用;掌握对相关系数的解释。 【学习方法】 了解、理解与掌握。 【重点难点】 各种相关系数的使用条件、计算及应用 【讲义内容】 前面章节中研究的问题,基本上都是属于单变量的数量变化关系。而教育和心理现象中的数量关系,并不仅仅是单变量的变化关系,在很多方面体现出的是一个变量与另一个变量或多个变量之间的变化关系。如:学生学习成绩与学生智商的关系;学生学习成绩与学习动机的关系;家庭环境与学生学业成绩之间的关系等等。本章主要讨论两个变量或两列数据之间相关的数量关系。 第一节相关概述 一、相关的含义 事物总是相互联系的,它们之间的关系多种多样。分析起来,大概有以下几种情况:一种是因果关系,即一种现象是另一种现象的因,而另一种现象则是果。例如学习的努力程度是学习成绩好坏的因(至少是部分的因);在一定刺激强度范围内,刺激强度经常是反应强度的因等等。第二种是共变关系,即表面看来有联系的两种事物都与第三种现象有关,这时两种事物之间的关系,便是共变关系。例如春天出生的婴儿与春天栽种的小树,就其高度而言,表面上看来都在增长,好像有关,其实,这二者都是受时间因素影响在发生变化,在它们本身之间并没有直接的关系。第三种是相关关系,即两类现象在发展变化的方向与大小方面存在一定的关系,但不能确定这两类现象之间哪个是因,哪个是果;也有理由认为这两者并不同时受第三因素的影响,即不存在共变关系。具有相关关系的两种现象之间,关系是较

复杂的,甚至可能包含有暂时尚未认识的因果关系及其共变关系在内。例如,同一组学生的语文成绩与数学成绩的关系,即属于相关关系。 二、相关的种类 统计学中所讲的相关是指具有相关关系的不同现象之间的关系程度。相关的种类可以从不同角度划分,从其变化方向来看,两个变量之间的相关可以分为: 1.正相关。 正相关指的是两列变量变动方向相同,即两个变量中,一种变量增大时,另一种变量也随着增大,一个变量减小时,另外一个变量也随着减小。如身高与体重的关系,一般讲身长越长体重就越重。智力和学业成绩之间的关系。 2.负相关。 负相关指的是两列变量变动方向相反,即两个变量中,一种变量增大时,另一种变量就随着减小,一个变量减小时,另外一个变量反而随着增大。如心理压力与工作绩效的关系等。初学打字时练习次数与出现错误量之间的关系。 3.零相关。 两变量值的变化方向无规律,即一个变量值增大,另一个变量对应值或增大或减小,且增大会减小的机会基本相同,这种情况下,这两个变量之间的相关称为零相关。如学习成绩优劣与身高之间的关系,人的相貌和智力的关系等。 若从变量的个数来划分,可以将相关分为: 1.简单相关:两个变量之间的相关; 2.复相关:一个变量与两个或两个以上变量之间的相关; 从变量之间相关关系的程度上划分,可以划分为: 1.高相关 2.中等程度相关 3.低相关 三、相关散点图 相关散点图是用直角坐标系上点的散布形状,来表示两个事物之间的相关性及练习的模式。在坐标系中,以X轴表示一个变量,Y轴表示一个变量,在坐标中描出相应的坐标点,由这些坐标散点组成的图形就称为相关散点图。

现代心理与教育统计学答案

第一章 1名词概念 (1)随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。(2)总体 答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。 (7)概率 答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A 的概率,记为P(A)。 (8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值。 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。

最新自考教育统计与测量复习必看知识点

自考教育统计与测量复习必看知识点 统计:对事物某方面特性的量的取值从总体上加以把握与认识。教育统计:对教育领域各种现象量的取值从总体上的把握与认识,它是为教育工作的良好运行、科学管理、革新发展服务的。统计学内容:描述统计是通过列表归类、描绘图象、计算刻画数据分布特征与变量相依关系的统计量数,如平均数、标准差和相关系数等,把数据的分布特征、隐含信息,概括明确地揭示出来,从而更好地理解对待和使用数据。推断统计是教育统计的核心内容。如何利用实际获得的样本数据资料,依据数理统计提供的理论和方法,来对总体的数量特征与关系作出推论判断,即进行统计估计和统计假设检验。测量:按一定规则给对象在某种性质的量尺上的指定值。教育测量:给所考查研究的教育对象,按一定规则在某种性质量尺上的指定值。比率量尺:是一种有绝对零点的等单位的线性连续体系,其上的数字量化水平最高,全面具有可比可加可除性。标准化测验(测验):测量工具、施测与评分程序、解释分数的参照体系都以科学地实现标准化。即代表性行为样本的客观而标准化的测验。标准化考试:教育条件下的心理特质是学业成就的标准化测量。量表:标准化测验中的测量工具(考试卷或心理测试项目的集合)与解释分数的常模(或标准),都有物化的形态,合在一起称为量表。教育测量的特点是间接性和要抽样进行。理解教育测量抓住:测量的结果就是给所测对象在一定性质的量尺上的指定值。要达到目的就要按照一定规则来进行一系列工作。工作如何进行和能在什么性质量尺上指定值,归根到底取决于所测对象本身的性质。数据:用数量或数字形式表现的事实资料。数据种类:来源分计数数据、测量评估数据、人工编码数据。反应的变量的性质分称名变量、顺序变量、等距变量、比率变量数据。数据特点:离散性、变异性、规律性。计数数据:以计算个数或次数获得的,多表现为整数。测量评估数据:借助测量工具或评估方法对事物的某种属性指派给数字后所得的数据。人工编码数据:以人们按一定规则给不同类别的事物指派适当的数字号码后形成的数据。称名变量:说明某一事物与其他事物在名称、类别或属性上的不同,不说明事物之间差异的大小、顺序的先后及质的有劣。计算次数或个数,不能进行运算。顺序变量:就事物的某一属性的多少或大小按次序将各事物加以排列的变量,具有等级性和次序性的特点。数据之间有次序和等级关系,不具有相等的单位,也不具有绝对的数量大小和零点,进行顺序递推运算。等距变量:表明相对大小,相等的单位,零点相对,不能用乘除法反映数据之间的倍比关系。比率变量:具有量的大小、相等的单位、绝对零点、进行运算,用乘除法处理数据,做比率描述。不同性质的测量量尺:名义量尺(指定数字有类别标志意义,无性质优劣、分量多寡涵义,量化水平最低);顺序量尺(数字量化水平最高,有优劣大小先后之别,单位不等,有可比性无可加性);等距量尺(数量化水平更高,数字是单位相等但零点可任意指定的线形连续体系上的值,有可比可加性无可除性);比率量尺(是一种有绝对零点的等单位的线性连续体系,其上的数字量化水平最高,具有可比可加可除性)。次数分布:一批数据中各个不同数值所出现次数多少的情况,或者是这批数据在数轴上各个区间内所出现的次数多少的情况。编制次数分布表的步骤:求全距:数据中最大值与最小值之间的差距。定组数:确定把整批数据划分为多少个等距的区组,数据个数200个以内,组数取8-18组。定组距:全距与组数的比值取整数就是组距,取奇数或5的倍数。写出组限:每个组的起止点界限,如10-15(9、5 14、5)。求组中组:组中值等于(组实上限加组实下限)除以2,选奇数。归类划记:设计表格记录上述有关结果对数据归纳划记。登记次数。次数分布图—次数直方图:由若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的图形。次数多边图:利用闭合的的折线构成多边形以反映次数变化情况的图示方法。累计次数曲线图绘制步骤。1、纵轴为累计次数的量尺,横轴代表测验的分数量尺。2、对于“以下”分布来讲,各个坐标点的位置,其横坐标是各组的实上限,纵坐标是累计的次数。3、用连续光滑的曲线把点的轨迹连起来,再与横轴上最低组的实下限所在点连起来,形成“S”形曲线。线形图绘制:1、横轴代表自变量,纵轴代表因变量。2、根据有关统计事项的具体数据,在由纵横两轴所决定的平面上画记圆点,用稍粗的线段把相邻的点依次连接。3、在同一个图形中,可画若干条线(不超过3条)不同的线形图,便于比较分析。用不同的折线,在图形的适当位置上标明图例。次数多边图制作:1、画纵轴和横轴。二者长度之比5:3,纵轴为次数的量尺,横轴代表测验的分数量尺,并在横轴上最低组与最高组外各增加一个次数为0的组。2、在两轴所夹的直角坐标平面上,分别以每个组的组中值为横坐标,相应低次数为纵坐标,画出两个点。3、用线段把相邻的点依次连接起来,连同横轴,构成一个闭合的多边形。统计分析图——散点图:用平面直角坐标系上点的散布图形来表示两种事物之间的相关性及联系模式。适应描述二元变量的观测数据。线形图:以起伏的折线表示某种事物的发展变化及演变趋势的统计图。适于描述事物在时间序列上的变化趋势,藐视一种事物随另一事物发展变化的趋势模式,比较不同人物团体在同一心理或教育现象上的变化特征几相互联系。条形图:用宽度相同的长条表示各个统计事项之间数量关系的图形。用于描述离散性的统计事项。圆形图:以单位圆内各扇形面积占整个圆形面积的百分比表示各统计事项在其总体中所占相应比例的图示方法。用于描述具有百分比结构数据。集中量数:观测数据不仅具有离散性的特点,而且在多数情况下具有向某点集中的的趋势,反映次数分布集中趋势的量数。作用—提供整个分布中多数数据的集结点位置,集中反应一批数据在整体上的数量大小,是一批数据的典型代表值。种类—算术平均数、中位数、众数。算术平均数:一批数据总和除以数据总次数所的的商。特点(反应灵敏、确定严密、简明易懂、概括直观、计算简便、代数运算、应用普遍)。性质—数据组全部观测值与其平均数的离差之和为0。每一观测值都加上一个相同常数c计算变换后数据的平均数等于原有数据的平均数加上这个常数。每一观测值都乘上一个相同常数c所得新数据的平均数,其值等于原数据的平均数乘以这个常数。对每个观测值做线性变换,即乘上相同的常数,再加上另一常数d,计算变换数据的平均数,其值等于原数据的平均数做相同线性变化后的结果。中

高校教育与心理统计学试卷附答案

某高校成教学院 教育与心理统计学结业试卷 20XX、X、X 姓名▁▁▁▁▁▁班级▁▁▁▁▁▁学号▁▁▁▁任职单位▁▁▁▁▁▁(说明:以下题目的答案数据一律保留2位小数) 一、4个数据分别为70、60、70、90。填出下表中所缺的统计指标名称、统计学符号、EXCEL函数及计算值。(28分) 注:差异系数以总体标准差为基准。 二、36个学生在一次测验中的得分如下: 606265687071717374757576 767777777879808080808182 828283858586868888888995 请以5分为一组制作简单次数分布表及次数分布多边图。(12分) 三、某年级甲、乙、丙三个班级学生人数分别为50人、55人、55人。期末数学考试各班的平均成绩分别为90分、90分、85分,使用加权平均数求全年级学生的平均成绩,并指出丙班的权数和权重。(10分) 四、在一次测验中,全班学生的成绩平均分为90分,标准差为4分。得94分的学生,他的标准分数为多少?另一个标准分数为-2 的学生,他的原始分数为多少?(6分) 六、分)

1、标准分数的平均数与标准差之和为▁▁▁▁: A、0 B、1 C、2 D、不是一个确定值 2、教育统计学与教育学科其它分支学科相比,其特点之一是通过对教育领域中大量数据进行分析以▁▁▁▁: A、发现其变化规律 B、预测其结局 C、描述相关 D、揭示其原因 3、在统计学书籍中,小写希腊字母一般用来表示▁▁▁▁。 A、集中量数 B、总体参数 C、 差异量数 D、样本统计量 4、下面哪一句话是错误的? A、称名数据即类别数据 B、计数数据是根据称名数据统计出来的 C、比率数据必然是等距数据 D、称名数据是测量水平最高的数据 5、在▁▁▁▁时,中数肯定与某一个原始数据的值相等。 A、原始数据按升序排列 B、原始数据为连续数据 C、原始数据个数为奇数 D、原始数据为顺序数据 6、相关系数的量纲单位▁▁▁▁。 A、与原始数据单位一致 B、无测度单位 C、是原始数据单位的平方 D、以占原始数据总和的百分比来表示 7、在统计分析中应用最为广泛的统计指标是▁▁▁▁。 A、平均数 B、标准分数 C、Z检验 D、相关系数 8、方差属于▁▁▁▁。 A、集中量数 B、差异量数 C、相关系数 D、总体参数 9、使用加权方法计算出来的平均数总是▁▁▁▁不使用加权方法计算出来的平均数。 A、等于 B、大于 C、大于或等于 D、上述答案都不对 10、两极差▁▁▁▁。 A、总是正数 B、总是负数 C、总是非负数 D、总是非零数 11、对几个样本平均数的差异进行统计检验通常使用▁▁▁▁。 A、Z检验B、F检验C、t检验D、Χ2 检验 12、全距为零,意味着全体数据▁▁▁▁。 A、全部相等B全部为零、C、的中数为零D、的平均数为零 13、扇形图又称为▁▁▁▁。 A、象形图 B、圆形图 C、曲线图 D、统计地图 14、几何平均数为零时,▁▁▁▁。 A、变化率为0 B、增长率为0 C、原始数据均为0 D、缺乏实际意义 15、教育统计学包括▁▁▁▁等分支。 A、描述统计B、推断统计C、教育评价D、教育测量

心理统计学重要知识点

心理统计学重要知识点 WTD standardization office【WTD 5AB- WTDK 08- WTD 2C】

《心理统计学》重要知识点 第二章 统计图表 简单次数分布表的编制:Excel 数据透视表 列联表(交叉表):两个类别变量或等级变量的交叉次数分布,Excel 数据透视表 直方图(histogram ):直观描述连续变量分组次数分布情况,可用Excel 图表向导的柱形图来绘制 散点图(Scatter plot ):主要用于直观描述两个连续性变量的关系状况和变化趋向。 条形图(Bar chart ):用于直观描述称名数据、类别数据、等级数据的次数分布情况。 简单条形图:用于描述一个样组的类别(或等级)数据变量次数分布。 复式条形图:用于描述和比较两个或多个样组的类别(或等级)数据的次数分布。 圆形图(circle graph )、饼图(pie graph ):用于直观描述类别数据或等级数据的分布情况。 线形图(line graph ):用于直观描述不同时期的发展成就的变化趋势; 第三章 集中量数 ● 集中趋势和离中趋势是数据分布的两个基本特征。 ● 集中趋势:就是数据分布中大量数据向某个数据点集中的趋势。 ● 集中量数:描述数据分布集中趋势的统计量数。 ● 离中趋势:是指数据分布中数据分散的程度。 ● 差异量数:描述数据分布离中趋势(离散程度)的统计量数 ● 常用的集中量数有:算术平均数、众数(M O )、中位数(M d ) 1.算术平均数(简称平均数,M 、X 、Y ):n x X i ∑ = Excel 统计函数AVERAGE 算术平均数的重要特性: (1)一组数据的离均差(离差)总和为0,即0)(=-∑x x i (2)如果变量X 的平均数为X ,将变量X 按照公式bx a y +=转换为Y 变量后, 那么,变量Y 2.中位数(median ,M d ):在一组有序排列的数据中,处于中间位置的数值。中 位数上下的数据出现次数各占50%。 3.众数(mode ,M O ):一组数据中出现次数最多的数据。 4.算术平均数、中数、众数之间的关系。

相关文档
最新文档