心理统计学-课程讲义3

心理统计学-课程讲义3
心理统计学-课程讲义3

【课程讲义】

第三章集中量数

【教学目标】

明确一批数据的特征包括两个方面的内容:集中趋势、离散性;明确集中量数是描述数据集中趋势的量数,可以作为一批数据的代表值;明确算术平均数是所有集中量数中运用最广泛、最优的量数;明确各种集中量数的含义、计算方法、使用条件、性质及优缺点。【学习方法】

了解、理解、计算与应用。

【重点难点】

算术平均数的概念及适用条件;算术平均数的计算方法;中位数的概念及适用条件;中位数的计算方法。

【讲义内容】

前一章所讲的统计分组、统计表、统计图等,只是对研究工作中所获得的数据进行初步整理,其目的是对数据的性质、分布特征、差异情况及数据的一般规律有一直观和形象的认识。因此说这一步还不是应用统计方法的步骤。为了进一步发现和表示一组数据的规律性,需要计算出一些能够反映这组数据的统计特征的数字——称为统计量或特征数。对于一组数据来讲,最常用的统计量有两类。一类是表现数据集中性质或集中程度的,另一类是表现数据分散性质或分散程度的。数据的集中情况指一组数据的中心位置。集中趋势的度量,即确定一组数据的代表值。描述数据集中情况的统计量有多种,包括算术平均数、中数、几何平均数等。由于这些统计量的作用在于度量数据的集中趋势,因此它们都称为集中量数。本章主要介绍几种常用的集中量数。集中量数只描述数据的集中趋势和典型情况,它还不能说明一组数据的全貌。数据除典型情况之外,还有变异性的特点。对于数据变异性即离中趋势进行度量的一组统计量,称作差异量数,这些差异量数有方差、标准差、全距、平均差、四分差及各种百分差等等,下一章中将对常用的差异量数进行介绍。

第一节 算术平均数

一、算术平均数的概念和适用条件

(一)概念

算术平均数一般简称为平均数或均数(Mean )。只有在与其他几种集中量数如几何平均数、加权平均数相区别的时候,才把它叫做算术平均数。如果平均数是由X 变量计算的,就记为X (读作X 杠),若由Y 变量求得,则记为Y 。由于任何平均数都是由特定的变量计算而来,因此X 或Y 自然人便成为算术平均数的符号了。本书采用X 或Y 表示平均数。

算术平均数是一组同质数据值得总和除以数据总个数所得到的商,其计算公式为:

N

Xi X ∑=

公式中∑X i 表示所有数据的和,即∑X i =X 1+X 2+……+X i ;N 为数据的个数。X 为一组数据的算术平均数。

(二)适用条件

1.适用于同质数据。不同质的数据,不能计算算术平均数。

2.要求一组数据中每个数据都比较准确、可靠,若数据模糊不清,或分组资料又不确定组限时,不能计算算术平均数。

3.无极端值出现。因为算术平均数容易受极端数据的影响。 4.需要得到一个相对精确可靠的集中量数或进一步参与其他运算时。

二、算术平均数的计算方法

(一)、简单算术平均数的计算方法

直接用公式

N

Xi X ∑=

求算术平均数。

算术平均数的计算公式很易理解,就是将所有的数据相加,再被数据的个数除。

例1 某班选八名同学参加年级数学竞赛,成绩分别为82,90,95,88,90,94,80,93。求其平均成绩。

解:将1X =82,2X =90 3X =95 4

X =88 5

X

=90 6

X

=94 7X =80 8X =93,

N=8 代入公式(3.1),得 898

93

8080949088959082=++++++++=∑=N X X

(二)加权算术平均数的计算方法

在实际的教育测量或教育评价中,经常会遇到这样的情况,在计算算术平均数时,每个数据在其整体中的地位并不一样,即各个数据代表的事物在其整体中所占权重(重要程度)不同。像这种考虑到权重的不同而求出的算术平均数,即为加权算术平均数。

加权算术平均数是指一组数据中每个数据与其权重乘积的总和除以权重总和所得的商,用符号w X 表示。公式为:

∑∑=

++++++=

i

i

i n

n

n w W

X W W W W X W X W X W X ΛΛ212211

式中Wi 为权数,所谓权数是指各变量在构成总体中的相对重要性,每个变量的权数大小,由观测者依据一定的理论或实践经验而定,虽然是可变的,但绝不是没有根据的。 在教育工作中,我们时常遇到对测量数据进行加权的情况。例如,在考试时教师共出 10道考题。由于各题的大小不同,难易程度不同.在满分为100的要件下.绝不是每题都以10分为满分,而是有的题5分,有的10分、20分,甚至30分。再如高校入学考试共包括语文、政治、外语、数学、物理、化学及生物7科,而计算总分时并不是各科平等,在语文、政治等科都以100为满分的情况下,数学定120分,生物定50分,也是考虑到各门学科的相对重要性而进行加权的结果。加权的道理不难理解,但有时却容易被人忽略。

由各小组平均数计算总平均数是应用加权平均数的一个特例。在心理与教育研究中,经常会遇到由各个平均数计算总平均数这类实际的统计计算问题。在这个问题中,可以把各小组的平均分数,视为该小组每个个体的分数,而把每个小组的人数,视为权数。

下面通过几个例子来说明家铨所属平均数的应用。

例2 某年级四个班的学生人数分别为50人,52人,48人,51人,期末数学考试各班的平均成

绩分别为90分,85分,88分,92分,求年级的平均成绩。

解:根据本题所给条件,应按公式(3.2)计算。将各数值代入上述公式,得 74.8851

4852505192488852855090=+++?+?+?+?=∑=∑W

W X X W

例3 某小学三年级数学期末总评成绩规定为平时占20%,期中考试占30%,期末考试占50%.某学生数学平时成绩为96分,期中考试成绩为80分,期末考试成绩为92分.求该生期末数学总评成绩为多少分?

解:本题为求加权算术平均数的问题.题中的权数分别为0.2,0.3,0.5。将各数值代入公式(3.2),得

2.895

.03.02.05

.0923.0802.096=++?+?+?=

∑=

∑W

W

X X W

(三)次数分布表中算术平均数的计算

对于已经列成次数分布表的数据,其算术平均数的计算公式为:

N

fX X C

∑=

式中,C X 为各组的组中值,f 为各组的次数,N 为总次数,即∑=

f N 。

例4 某班50人外语期末考试成绩的次数分布表如下,求全班学生的平均成绩.

解:将表中数据代入公式(3.3),得

3.7850

3915

501141230870276==++++=∑=

ΛN fX X C

需要说明的是,利用次数分布表求出的算术平均数是一个近似值。原因在于计算算术平均数时,我们假设各组内的数值是均匀分布的,利用各组的组中值来分别代表各组数据,这显然与实际的情况不完全相符,因此求出的算术平均数与真实的算术平均数之间有一定的差异,也就是分组误差,但是这并不影响以后的统计分析。

三、平均数的意义与应用

算术平均数是应用最普遍的一种集中量数。它是“真值”渐近、最佳的估计值。在科研实验中人们进行观测,是想知道被观测事物真正的值是多少,例如想研究人的反应时间,用计时器进行测量,人们是想测到真正的反应时间是多少。再如,使用某种测验,是想测量某个人或某些人的真实的能力水平到底有多么高。但是由于主客观各种随机因素的影响,如仪器的精密程度,测量方法,实验情景,人的观测力及观测标准等等都不能做到尽善尽美,因此想获得真值是不大可能的,人们只能用一些集中量数作为它的估计值、算术平均数在大多数情况下,是真值的最好的估计值,对这一点概率统计有严密的数学证明。

算术平均数具备一个良好的集中量数应具备的一些条件:

①反应灵敏。观测数据中任何一个数值的或大或小的变化,甚至细微的变化,在计算平均数时,都能反应出来。

②确定严密。计算平均数有确定的公式,不管何人,在何种场合,只要是同一组观测数据,所计算的平均数都是相同的,不凭主观确定。

③简明易解。平均的概念简单明白,容易理解。较少数学抽象。 ④计算简单。计算公式只是用简单的四则运算。

⑤符合代数方法进一步演算。不但平均数的计算过程应用代数方法,而且,还可应用平均数作进一步的数学演算。例如求离均差x ,以及将要讲到的求方差等等。

⑥较少受抽样变动的影响。在进行观测时,样本大小或个体的变化,对计算平均数影响很小。

但是算术平均数也有一些缺点,在一定程度上限制了它的应用,这些缺点是:

①易受极端数据的影响。由于平均数反应灵敏,因此数据中若出现极端数据(或大或小),就要影响平均数。在心理与教育方面的实验观测中,偶然因素十分复杂,经常会出现极端数目,例如,一个重点班的50名水平相当的学生,在通过一项教育测验时,绝大多数学生得分较高,但个别人却由于身体不适或一时性情绪障碍而得到很低的分数,这时若用平均数代表全班学生的知识水平,则肯定偏低,并且不符合实际情况。为此,我们还需要学习,了解其他表示一组事物的典型情况的统计方法和统计值。在心理物理学实验、学习迁移实验和迷津学习实验等观测中,都常有出现极端数目的情况。

②若出现模糊不清的数据时,无法计算平均数,因为计算平均数时需要每一个数据都加入计算。在次数分布中只要有一个数据含糊不清,都无法计算平均数。在这种情况下,一般采用中数作为该组数据的代表值,描述其集中趋势。

此外,必须注意,凡不同质的数据不能计算平均数。所谓同质数据是指使用同一个观测手段,采用相同的观测标准,能反映某一问题的同一方面特质的数据。如果使用了不同质的数据计算平均数,则该平均数,不能作为这一组数据的代表值。不仅如此,有时它反而会造成掩盖事物的本来面貌,使人产生误解等问题。例如在教育方面,计算平均成绩时,如果各科考试的难易水平和评分标准等各不相同,这时若用总平均分数表示一个学生的学习成绩,就是不准确的,因为这是应用不同质的数据计算平均数的结果。即使是同一门课程,通过前后几次不同的考试,亦很难使每次的难易度和评分标准等相同。因此,如果用平均分数表示该门课程的学习成绩,也同样存在着数据是否同质的问题。再如,在研究某个团体中人们的生活水平变化时,如果使用平均工资,常会掩盖所欲研究的问题。因为当大多数人收入少而且在降低,但只有少数人财产急骤增加且数目很大时,计算出来的平均数可能增加,但实际上人们的平均生活水平不是提高而是下降了,这就是由于在计算平均数时,使用了不同质的数据所造成,即工资在人不同人的生活上起作用不同。由上可见,判别数据是否同质,并不是一件容易的事情,需要研究者根据实际情况认真分析,尽管平均数是一个较普遍应用的集中量数,但要用得恰到好处,也并非易事。

根据以上对平均数优缺点的分析,可以明确,如果一组数据是比较准确,可靠又同质,而且需要每一个数据都加入计算,同时还要作进一步代数运算时,这时就要用算术平均数表示其集中趋势。如果一组数据中出现两极端的数目,或有一些数据不清楚,数据不同质时,就不宜使用算术平均数,除此之外还有一些适用几何平均数或调和平均数的情境,也不宜用算术平均数。

【小结】

本节主要涉及到算术平均数的定义以及计算。算术平均数是一组同质数据的数据除以数据总个数所得到的商。对于算术平均数的计算,可以利用定义直接求算术平均数;对于各个数据所占权重不等的情况,用加权平均数;对于次数分布表中的数据,计算算术平均数的方法为:

N

fX X C

∑=

,式中C X 为各组的组中值,f 为各组的次数,N 为总次数,即∑=f N 。

第二节 中位数

一、中位数的概念及适用条件 (一)概念

中位数是位于一组有序数据中间位置的量数。也称中数,用符号dn M 表示。中位数是将一组有序数据的个数分为相等两部分的那个数据,它可能是原始数据中的一个,也可能是通过计算得到的某个数值。

(二)适用条件

中数是根据观测数据计算而来,不能凭主观臆定。计算简单,容易理解,中数的概念简单明白,这是它的优点。但它也有些不足,如:它反应不够灵敏,两极端数目变化,对中数不产生影响;计算中数时,不是每个数据都加人计算,受抽样的影响较大,不如平均数稳定;中数乘以总数与数据的总和不相等(只有少数情况:Md=X 时例外);中数不能作进一步代数运算等等。因此,在一般情况下,中数不被普遍应用。但在一些特殊情况下,它的应用受到重视。这些特殊情况是: 1.当一组数据有极端值出现时;

2.当一组有序数据两端有个别数据模糊不清或分组资料有不确定组限时; 3.当需要快速估计一组数据的代表值时。

二、中位数的计算方法

(一)未分组数据中位数的计算方法

如果一组数据未分组,须先把数据按照其大小顺序排列,然后再确定中位数。中位数的确定取决于一组数据的个数是奇数还是偶数。

当数据的个数为奇数时,则以第(N+1)/2个位置上的数据作为中位数。例如,求7个数据92,80,85,87,91,83,90的中位数。现将这7个数据按照从大到小或者从小到大的顺序排列,如从小到大排列为:80,83,85,87,90,91,92。第(N+1)/2个位置上的数,即第4个数为87,因此这7个数据的中位数为87。

当数据的个数为偶数时,则取据中间两个数据的平均数为中位数。即取第N/2个位置上的数据与第N/2+1个位置上的数据的平均数作为中位数。例如求8个数据:80,93,90,81,85,88,92,84的中位数。现将这8个数据按照从小到大排列为:80,81,84,85,88,90,92,93。第N/2个位置上的数,即第4个数为85,第N/2+1个位置上的数,即第5个数为88,因此这8个数据的中位数为(85+88)/2=86.5。

实际上,对于偶数个数据,中位数所在的位置也可以看成是在(N+1)/2个位置上的数据。

(二)分组数据中位数的计算方法

对于分组数据,因为通常情况下的N 都比较大,N/2与(N+1)/2相差很小,因此在分组数据中粗略地讲中位数所在的位置看成是在N/2的位置。

分组数据中,中位数的计算公式为:i f

F N

L M b b d n

?-+=2 其中dn M 为中位数;b L 为中位数所在组的精确下限;b F 为中位数所在组下限以下的累加次数;f 为中位数所在组的次数;i 为组距;N 为总次数。 具体计算步骤如下: (1) 求N/2;

(2) 确定中数所在的组;具体方法:由下向上计算累加次数,直到大于或等于N/2一组

为止,改组就是中位数所在的组。

(3) 求出中位数所在一组的精确下限; (4) 求出中位数所在组以下的累加次数; (5) 确定组距及中位数所在组的次数;

(6) 将以上各值代入上述分组计算中位数的公式求出中位数。

例5 对50人外语期末考试成绩的次数分布表求学生成绩的中位数

解:(1)

252

2== (2)由下向上积累次数,75∽79组对应的累积次数为22,80∽84组对应的累积次数为37,故中位数在80∽84组

(3) 5.79=b L (4) 228532=+++=b F (5) 15,5==f i

(6) 将以上各值代入公式(3.4),得

5

.805

15

22

255.792=?-+=?-+=i

f

F N

L M b b d n

小结:中位数是位于一组有序数据中间位置的量数。当一组数据有极端值出现时、当一组有序数据两端有个别数据模糊不清或分组资料有不确定组限时、或当需要快速估计一组数据的代表值时,会用到中位数表示一组数据的集中趋势。

当数据的个数为奇数时,则以第(N+1)/2个位置上的数据作为中位数。当数据的个数

为偶数时,则取据中间两个数据的平均数为中位数。即取第N/2个位置上的数据与第N/2+1个位置上的数据的平均数作为中位数。对于已经分组的次数分布表中的数据,中位数的计算

公式为:i f

F N

L M b

b d n

?-+=2,其中dn M 为中位数;b L 为中位数所在组的精确下限;b

F 为中位数所在组下限以下的累加次数;f 为中位数所在组的次数;i 为组距;N 为总次数。

第三节 几何平均数

一、几何平均数的概念及应用时机 (一)概念

几何平均数是N 个数值连乘积的N 次方根,用符号G M 表示,其计算公式为:

N N G X X X M ?????=21 (3.5)

式中:G M 表示几何平均数,N X X X ,,,21Λ表示原始数据,N 为数据的个数。

(二)应用时机

1.求一组等比或近似等比数据的平均数时;

2.一组数据中有少数偏大或偏小的数据,数据分布呈偏态时; 3.教育上,关于平均发展速度或者是对某项目标进行预估。

二、几何平均数的计算方法

(一)直接用定义公式求一组原始数据的几何平均数

例6 求2,8,32,125,502的几何平均数。

解: 由于这组数据属于近似等比数列,因此求平均数时应求其几何平均数。 将各数值代入公式(3.5),得

72.315021253282521=????=?????=N N G X X X M 该组数据的几何平均数为31.72 。

例7 已知某校四年中各年度的学生人数分别为上一年 1.12 倍,1.09倍,1.08倍和1.06倍,

求每年的平均增长率。

解:此问题给出了每年的发展速度。此题应首先计算年平均发展速度,再用公式:平均增长率=平均发展速度-1,求出年平均增长率。

将1X =1.12, 2X =1.09, 3X =1.08, 4X =1.06,代入公式(3.5),得 09.106.108.109.112.14=???=G M

求得的G M =1.09,即为年平均发展速度, 年平均发展速度是各年度发展速度的平均值。 平均增长率=平均发展速度-1=1.09-1=0.09,故所求的年平均增长率为9%。

(二)只用首末项求几何平均数

上面例7种的资料是给出每一年度与上一年度的比值,即年发展速度,故直接用所给的数据求几何平均数;若给出的不是每一年度与上一年度的比值,而是每一年度的数值量,则可以通过首项和末项计算几何平均数。

设N a a a ,,,10Λ是N 个年度中各年度某种数量值,其中0a 为初期量,N a 为末期量。

N X X X ,,,10Λ为各年度发展速度,即:

011a a X =

,122a a X =,…, 1

-=N N N a a

X N X X X ,,,10Λ的几何平均数便为平均发展速度。

N N N

N N N N G a a

a a a a a a X X X M 0

1120121=???=?????=-Λ (3.6) 这个公式只涉及首项和末项及N ,用起来比较方便,但是应该注意,N 为实际跨年度数。 例8 某重点高中1994~1999年招收新生人数如下表,求年平均增长率。 人数统计表

解:由于700,5940

==N a a ,期间跨5个年度,故N=5,所以年平均发展速度为:

03.1594

70050===

N

N G a a M 年平均增长率为(1.03-1)?100%=3%

例8已知某校1980年教育经费是20万元,1997年教育经费是135万元,求该校教育经费的年平均增长率。 解:由于17,135,290

===N a a N ,所以年平均发展速度为

12.120

135170===N

N G a a M 年平均增长率为(1.12—1)?100%=12%。

例10 某校办公厂在1984年创产值10万元该厂计划以年平均增长率为5%的速度递增,试

估计到2004年该厂可创产值多少万元?

解:本题属于求年平均增长率的逆运算题目,所用公式仍为(3.6),只不过需作一些变形。

a a M a a M N N

G N

N

G =

=

从而N a =0a N G M ,又由于G M =1+平均增长率,所以N a =0a (1+平均增长率)N

0a =10,N=20,平均增长率5%代入N a =0a (1+平均增长率)N ,即可估计出2004年该厂

创造的产值为

N a =10?(1+0.05)20

=26.53(万元)

教育事业的发展不是恒速进行的,为了掌握其发展规律,了解它在各个发展阶段的特征,就需要用几何平均数计算其平均发展速度和平均增长率,如学生人数的年平均增长率,学校经费的年平均增长率等。

【思考练习及参考答案】

思考和练习

一、是非题

1 平均数不易受极端数据的影响。

2 中位数是一组数据的中间数值。

3 对于数据较多的资料,其算术平均数与中位数的值不会相差太大。

4 根据次数分布表求平均数亦属加权平均的性质。

5 在教育上常用几何平均数来预测教育现象的发展变化。

二、选择题

1 有8个数据80,90,82,85,91,88,84,92,则它们的中位数是:

A 85

B 88

C 86.5

D 91

2 将一组数据中的每个数据都加上10,则所得平均数比原平均数:

A 多10 B多,但具体多少无法知道 C 相等D多10 数据个数

3 已知有10个数据的平均数是12,另外20个数据的平均数是9,那么全部数据的平均数应为:

A 9

B 10

C 11

D 12

4 某校1990年在校学生为880人,1992年在校学生为1760人。那么从1990年到1992年在校人数平均增长率为:

A 141.4%

B 41.4%

C 126%

D 26%

5 可否用几何平均数求平均下降速度及平均下降率。

A 两者都可以

B 可以求平均下降速度但不能求平均下降率

C两者都不可以D可以求平均下降率但不能求平均下降速度

三、简答题

1 什么是集中量数?在教育中应用最广的是那种集中量数?为什么?

2 简述几何平均数在教育上的作用?

四、计算题

1 求数据67,70,58,64,60,65,71,74的算术平均数。

2 分别求下列两组数据的中位数:

(1)14 2 17 9 22 13 1 7 11

(2)1 26 11 14 13 7 17 22 2

3某班60名学生的外语成绩列成次数分布表如下试求算术平均数和中位数。

4 某市初一组织外语竞赛,甲校32人,平均成绩为72.6分;乙校40人,平均成绩为80.2分;丙校36人,平均成绩为75分。求这三所学校外语竞赛的平均成绩。

5 某县教师人数1990年为2000人,1994年为2880人,求其平均增长率;照此平均速率增长,试估计到2002年该县教师人数为多少? 五、思考题

试比较几种集中量数的优缺点。

参考答案:

一、1 × 2 × 3 √ 4 √ 5 √ 二、1 C 2 A 3 B 4 B 5 A 三、略

四、1.13.66=X

2.(1)11=Md (2)12=Md 3.8.69=X 6.68=Md 4. 21.76=w X

5.平均增长率为9.54%,估计人数为5970人。

五、略

现代心理与教育统计学第07章习题解答

1. 何谓点估计与区间估计,它们各有哪些优缺点? 点估计就是总体参数不清楚时,用一个特定的值,即样本统计量对总体参数进行估计,但估计的参数为数轴上某一点。 区间估计是用数轴上的一段距离来表示未知参数可能落入的范围,它不具体指出总体参数是多少,能指出总体未知参数落入某一区间的概率有多大。 点估计的优点是能够提供总体参数的估计值,缺点是点估计总以误差的存在为前提,且不能提供正确估计的概率。 区间估计的优点是用概率说明估计结果的把握程度,缺点是不能确定一个具体的估计值。 2以方差的区间估计为例说明区间估计的原理 根据χ2分布: 总体方差的.95或.99置信区间为: 即总体参数(方差)落入上述区间的概率为1-α,其值为95%或99% 3.总体平均数估计的具体方法有哪些? 总体方法为点估计好区间估计,区间估计又分为: (1) 当总体分布正态方差已知时,样本平均的分布为正态分布,故依据正态分布理论估计其区间;(2)当总体分布正态方差未知时,样本平均数的分布为T 分布,依据T 分布理论估计其区间;(3)当总体非分布正态方差未知时,只有在n 大于30时渐近T 分布,样本平均数的分布渐近T 分布,依据T 分布理论估计其区间。 4总体相关系数的置信区间,应根据何种分布计算? 应根据Fisher 的Z 分布进行计算 5.解 依据样本分布理论该样本平均数的分布呈正态 其标准误为: 其置信区间为: 该科成绩的真实分数有95%的可能性在78.55----83.45之间。 6.解:此题属于总体分布正态总体方差未知的情形,故样本平均数的分布呈T 分布 其标准误为: 用df=99差T 值表,然后用直线内插法求得t α/2=1.987 其置信区间为: 该学区教学成绩的平均值有95%的可能在78.61---81.39之间。 7解:此题属于总体分布正态总体方差已知 计算标准误 ()()222212221σσσχnS S n X X n =-=-=-∑()()22/121222/2111)(ααχσχ----<<-n n S n S n 25.116 5===n x σσ45 .8355.7825.1*96.18125.1*96.1812/2/<<+<<-?+<

《心理统计学》月期末考试指导

0272《心理统计学》2016年6-7月期末考试指导 一、考试说明 本课程闭卷考试,满分100分,考试时间90分钟。可能的考试卷型包括: 1、单项选择题 2、判断题 3、简答题 4、计算题 5、综合应用题 二、重点复习内容 (一)绪论 1、心理学统计学的内容:描述统计、推论统计、实验设计。其中,描述统计的指标包括数据的集中趋势,数据的离散趋势和数据间的相关 2、数据的种类 按照测量的水平,可以划分为称名变量、等级变量、等距变量和比率变量。 (1)称名变量,是指根据事物的某一特征,用来划分、区别事物的不同种类所形成的变量。这类数码并无数量和序列的含义,不能进行数量化分析,不能做加减乘除的运算。 (2)等级变量,在对事物进行分类过程中,依据事物某种属性程度的大小排列顺序形成的变量。等级变量既无相等单位,也无绝对零,不同组的等级变量间不能进行加减乘除的运算。(3)等距变量,是指在观测标识事物某一特定属性时,具有相对参照点、有相等单位的变量。可以进行加减运算,但是由于等距变量的参照点是相对的,即无绝对零点,因此不能进行乘除的运算。例如,测量温度的℃。 (4)比率变量,是指既有相等单位又有绝对零参照点的变量,如身高、体重、反应时、各种感觉阈值的物理量等。这类变量可以进行加减乘除的运算。 (二)统计图表 1、次数分布表:各种次数分布的列表形式和图示形式。次数分布包括简单次数分布、分组次数分布、相对次数分布、累积次数分布等。 2、编制次数分布表的步骤 (1)求全距:从最大值的数据中减去最小值的数据,所得差数就是全距。用符号R表示(2)定组数 (3)求组距:指每一组的间距,用符号i表示。 (4)定组限:指各组数据在数值上的起点值和终点值。 (5)求组中值:各组实际上限数值与实际下限数值的中点数值,即上、下限数值的平均值。(6)归类划记:将原始观测值按照一定的顺序逐一归组。 (7)记录各组次数(f)。 (8)核对,抄录新表。 3、连续变量的单位是无限的,例如整数180的实上限和下限分别为179.5和180.5,而测量数据8.35的下实限是8.345。 4、累加次数分布表:如果想知道某个数值以下或以上的数据的数目,就要用累加次数。 5、次数分布图:编制次数分布表与绘制次数分布图,对于了解一组数据的分布情况,平均水平,差异情况等非常有用。由于数据的性质不同,有时实验结果的次数分布图上会出现双峰。 (三)集中量数 集中量数主要用来描述一组数据的集中趋势,常用的代表性的集中量数有算术平均数、中数、众数。 1、算术平均数:又称平均数,是集中量数中性能最好的一个统计量,一般用M表示。

现代心理与教育统计学的复习资料

第一章心理与教育统计学基础知识 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 比率数据 2、变量、随机变量、观测值 变量是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、总体、个体和样本 需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数

5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章统计图表 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表

将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图(frequency polygon )是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 %100 N f

心理统计学》重要知识点

《心理统计学》重要知识点 第二章 统计图表 简单次数分布表的编制:Excel 数据透视表 列联表(交叉表):两个类别变量或等级变量的交叉次数分布,Excel 数据透视表 直方图(histogram ):直观描述连续变量分组次数分布情况,可用Excel 图表向导的柱形图来绘制 散点图(Scatter plot ):主要用于直观描述两个连续性变量的关系状况和变化趋向。 条形图(Bar chart ):用于直观描述称名数据、类别数据、等级数据的次数分布情况。 简单条形图:用于描述一个样组的类别(或等级)数据变量次数分布。 复式条形图:用于描述和比较两个或多个样组的类别(或等级)数据的次数分布。 圆形图(circle graph )、饼图(pie graph ):用于直观描述类别数据或等级数据的分布情况。 线形图(line graph ):用于直观描述不同时期的发展成就的变化趋势; 第三章 集中量数 ● 集中趋势和离中趋势是数据分布的两个基本特征。 ● 集中趋势:就是数据分布中大量数据向某个数据点集中的趋势。 ● 集中量数:描述数据分布集中趋势的统计量数。 ● 离中趋势:是指数据分布中数据分散的程度。 ● 差异量数:描述数据分布离中趋势(离散程度)的统计量数 ● 常用的集中量数有:算术平均数、众数(M O )、中位数(M d ) 1.算术平均数(简称平均数,M 、X 、Y ):n x X i ∑= Excel 统计函数AVERAGE 算术平均数的重要特性: (1)一组数据的离均差(离差)总和为0,即0)(=-∑x x i (2)如果变量X 的平均数为X ,将变量X 按照公式bx a y +=转换为Y 变量后, 那么,变量Y 2.中位数(median ,M d ):在一组有序排列的数据中,处于中间位置的数值。中位数上下的数据出现 次数各占50%。 3.众数(mode ,M O ):一组数据中出现次数最多的数据。 4.算术平均数、中数、众数之间的关系。 5.加权平均数:i i i n n n w w w x w w w w x w x w x M ∑∑=++++++= 212211

现代心理与教育统计学复习资料

现代心理与教育统计学 复习资料 Revised as of 23 November 2020

1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。

统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、 次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 %100 N f

心理统计学重点分析

心理统计学重点分析.txt遇事潇洒一点,看世糊涂一点。相亲是经销,恋爱叫直销,抛绣球招亲则为围标。没有准备请不要开始,没有能力请不要承诺。爱情这东西,没得到可能是缺憾,不表白就会有遗憾,可是如果自不量力,就只能抱憾了。心理统计学重点分析 一.描述统计 (一)统计图表 1)统计图 次数分布图: ①直方图:用以矩阵的面积表示连续性随即变量次数分布的图形。 ②次数多边形图:一种表示连续性随机变量次数分布的线形图,属于次数分布图。 ③累加次数分布图:分为:累加直方图和累加曲线图; 其中累加曲线的形状大约有三种:一种是曲线的上枝长于下枝(正偏态),另一种是下枝长于上枝(负偏态),第三种是上枝,下枝长度相当(正态分布)。 其他统计图:条形图:用于离散型数据资料; 圆形图:用于间断性资料; 线形图:更多用于连续性资料,凡预表示两个变量之间的函数关系,或描述某种现象在时间上的发展趋势,或一种现象随另一种现象变化的情况,用这种方法比较好。 散点图: 2)统计表 ①简单次数分布表 ②分组次数分布表 ③相对次数分布表:将次数分布表中各组的实际次数转化为相对次数,即用频数比率表示。 ④累加次数分布表 ⑤双列次数分布表:对有联系的两列变量用同一个表来表示其次数分布。 (二)集中量数 1)算术平均数M 优点:反应灵敏;计算严密;计算简单;简明易解;适合于进一步用代数方法演算;较少受抽样变动的影响; 缺点:受极端数据的影响;若出现模糊不清的数据时,无法计算平均数; 计算和运用平均数的原则:同质性原则;平均数与个体数值相结合的原则;平均数与标准差。方差相结合原则; 性质: ①在一组数据中每个变量与平均数之差的总和等于零 ②在一组数据中,每一个数都加上一个常数C,所得的平均数为原来的平均数加常数C ③在一组数据中,每一个数都乘以一个常数C,所得的平均数为原来的平均数乘以常数C 2)中数:Md按顺序排列在一起的一组数据中居于中间位置的数,即这组数据中,一般数据比它大,一般数据比它小。注意计算方法; 3)众数:Mo是指在次数分布中出现次数最多的那个数值; 三者的关系:正偏态分布中,M>Md>Mo 负偏态分布中,M

现代心理与教育统计学复习资料

第一章 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。

4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 %100 N f

(三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 四、其他统计图表 条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。 圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。

心理统计学重要知识点

心理统计学重要知识点 WTD standardization office【WTD 5AB- WTDK 08- WTD 2C】

《心理统计学》重要知识点 第二章 统计图表 简单次数分布表的编制:Excel 数据透视表 列联表(交叉表):两个类别变量或等级变量的交叉次数分布,Excel 数据透视表 直方图(histogram ):直观描述连续变量分组次数分布情况,可用Excel 图表向导的柱形图来绘制 散点图(Scatter plot ):主要用于直观描述两个连续性变量的关系状况和变化趋向。 条形图(Bar chart ):用于直观描述称名数据、类别数据、等级数据的次数分布情况。 简单条形图:用于描述一个样组的类别(或等级)数据变量次数分布。 复式条形图:用于描述和比较两个或多个样组的类别(或等级)数据的次数分布。 圆形图(circle graph )、饼图(pie graph ):用于直观描述类别数据或等级数据的分布情况。 线形图(line graph ):用于直观描述不同时期的发展成就的变化趋势; 第三章 集中量数 ● 集中趋势和离中趋势是数据分布的两个基本特征。 ● 集中趋势:就是数据分布中大量数据向某个数据点集中的趋势。 ● 集中量数:描述数据分布集中趋势的统计量数。 ● 离中趋势:是指数据分布中数据分散的程度。 ● 差异量数:描述数据分布离中趋势(离散程度)的统计量数 ● 常用的集中量数有:算术平均数、众数(M O )、中位数(M d ) 1.算术平均数(简称平均数,M 、X 、Y ):n x X i ∑ = Excel 统计函数AVERAGE 算术平均数的重要特性: (1)一组数据的离均差(离差)总和为0,即0)(=-∑x x i (2)如果变量X 的平均数为X ,将变量X 按照公式bx a y +=转换为Y 变量后, 那么,变量Y 2.中位数(median ,M d ):在一组有序排列的数据中,处于中间位置的数值。中 位数上下的数据出现次数各占50%。 3.众数(mode ,M O ):一组数据中出现次数最多的数据。 4.算术平均数、中数、众数之间的关系。

现代心理与教育统计学答案

第一章 1名词概念 (1)随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。(2)总体 答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。 (7)概率 答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A 的概率,记为P(A)。 (8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值。 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。

张厚粲现代心理与教育统计学第4版知识点总结课后答案

第1 章绪论 1.1 复习笔记 本章重点 ?心理与教育统计的研究内容 ?选择使用统计方法的基本步骤 ?统计数据的基本类型 ?心理与教育统计的基本概念 一、统计方法在心理和教育科学研究中的作用 (一)心理与教育统计的定义与性质 1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(appliedstatistics)两部分。前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。 (二)心理与教育科学研究数据的特点 1.心理与教育科学研究数据与结果多用数字形式呈现。 2.心理与教育科学研究数据具有随机性和变异性。 3.心理与教育科学研究数据具有规律性。 4.心理与教育科学研究的目标是通过部分数据来推测总体特征。 (三)学习心理与教育统计应注意的事项 1.学习心理与教育统计学要注意的几个问题: (1)学习心理与教育统计学时,必须要克服畏难情绪。心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。 (2)在学习时要注意重点掌握各种统计方法使用的条件。 (3)要做一定的练习。 2.应用心理与教育统计方法时要做到: (1)克服“统计无用”与“统计万能”的思想,注意科研道德。 (2)正确选用统计方法,防止误用和乱用统计。 二、心理与教育统计学的内容 心理与教育统计学的研究内容,可依不同的分类标志划分为不同的类别: (一)分类一 依据统计方法的功能进行分类,统计学可分为下述三种类别,这是由于数理统计的发展历史所决定的,也是最常见的分类方法。如图1-1 所示:

《心理统计学》重要知识点

《心理统计学》重要知识点 第二章统计图表 简单次数分布表的编制:Excel数据透视表 列联表(交叉表):两个类别变量或等级变量的交叉次数分布,Excel数据透视表 直方图(histogram ):直观描述连续变量分组次数分布情况,可用Excel图表向导的柱形图来绘制散点图(Scatter plot):主要用于直观描述两个连续性变量的关系状况和变化趋向。 条形图(Bar chart):用于直观描述称名数据、类别数据、等级数据的次数分布情况。 简单条形图:用于描述一个样组的类别(或等级)数据变量次数分布。 复式条形图:用于描述和比较两个或多个样组的类别(或等级)数据的次数分布。 圆形图(circle graph )、饼图(pie graph ):用于直观描述类别数据或等级数据的分布情况。 线形图(line graph ):用于直观描述不同时期的发展成就的变化趋势; 第三章集中量数 集中趋势和离中趋势是数据分布的两个基本特征。 集中趋势:就是数据分布中大量数据向某个数据点集中的趋势。 集中量数:描述数据分布集中趋势的统计量数。 离中趋势:是指数据分布中数据分散的程度。 差异量数:描述数据分布离中趋势(离散程度)的统计量数 常用的集中量数有:算术平均数、众数( M O )、中位数(M d) 1.算术平均数(简称平均数,M、X、Y ) :X X Excel统计函数AVERAGE i n 算术平均数的重要特性: (1)一组数据的离均差(离差)总和为0,即(X i x) 0 (2)如果变量X的平均数为X,将变量X按照公式y a bx转换为Y变量后, 那么,变量Y的平均数Y a bX 2. 中位数(median , M d):在一组有序排列的数据中,处于中间位置的数值。中位数上下的数据出现次数各 占50%。 3. 众数(mode, M O):一组数据中出现次数最多的数据。

现代心理与教育统计学课后题完整版14145

第一章绪论 1.名词解释 随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量 总体:又称为母全体、全域,指据有某种特征的一类事物的全体 样本:从总体中抽取的一部分个体,称为总体的一个样本 个体:构成总体的每个基本单元称为个体 次数:指某一事件在某一类别中出现的数目,又成为频数,用f表示 频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。频率通畅用比例或百分数表示 概率:又称机率。或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率 统计量:样本的特征值叫做统计量,又叫做特征值 参数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标 观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据 2.何谓心理与教育统计学学习它有何意义 心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。整理。分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 3.选用统计方法有哪几个步骤 首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的 其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要 第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件 4.什么叫随机变量心理与教育科学实验所获得的数据是否属于随机变量 随机变量的定义:①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量 5.怎样理解总体、样本与个体 总体N:据有某种特征的一类事物的全体,又称为母体、样本空间,常用N表示,其构成的基本单元为个体。特点:①大小随研究问题而变(有、无限)②总体性质由组成的个体性质而定 样本n:从总体中抽取的一部分交个体,称为总体的一个样本。样本数目用n表示,又叫样本容量。 特点:①样本容量越大,对总体的代表性越强②样本不同,统计方法不同 总体与样本可以相互转化。 个体:构成总体的每个基本单元称为个体。有时个体又叫做一个随机事件或样本点 6.统计量与参数之间有何区别和关系 参数:总体的特性称参数,又称总体参数,是描述一个总体情况的统计指标 统计量:样本的特征值叫做统计量,又称特征值 二者关系:参数是一个常数,统计量随样本而变化 参数常用希腊字母表示,统计量用英文字母表示 当试验次数=总体大小时,二者为同一指标 当总体无限时,二者不同,但统计量可在某种程度上作为参数的估计值 7.试举例说明各种数据类型之间的区别 8.下述一些数据,哪些是测量数据哪些是计数数据其数值意味着什么 千克厘米秒分是测量数据 17人25本是计数数据 9.说明下面符号代表的意义 μ反映总体集中情况的统计指标,即总体平均数或期望值 X反映样本平均数 ρ表示某一事物两个特性总体之间关系的统计指标,相关系数 r 样本相关系数 σ反映总体分散情况的统计指标标准差 s样本标准差 β表示两个特性中体之间数量关系的回归系数

现代心理与教育统计学(张厚粲)课后习题答案

现代心理与教育统计学(张厚粲)课后习题答案 第一章绪论(略) 第二章统计图表(略) 第三章集中量数 4、平均数约为36.14;中位数约为36.63 5、总平均数为91.72 6、平均联想速度为5.2 7、平均增加率约为11%;10年后的毕业人数约有3180人 8、次数分布表的平均数约为177.6;中位数约为177.5;原始数据的平均数约为176.7 第四章差异量数 5、标准差约为1.37;平均数约为1.19 6、标准差为26.3;四分位差为16.03 7、5cm组的差异比10cm组的离散程度大 8、各班成绩的总标准差是6.03 9、次数分布表的标准差约为11.82;第一四分位为42.89;第三四分位为58.41;四分位差为7.76 第五章相关关系 5、应该用肯德尔W系数。 6、r=0.8;r R=0.79;这份资料只有10对数据,积差相关的适用条件是有30对以上数据,因此这份资料适用等级相关更合适。 7、这两列变量的等级相关系数为0.97。 8、上表中成绩与性别有很强的相关,相关系数为0.83。 9、r b=0.069小于0.2.成绩A与成绩B的相关很小,成绩A与成绩B的变化几乎没有关系。 10、测验成绩与教师评定之间有一致性,相关系数为0.87。 11、9名被试的等级评定具有中等强度的相关,相关系数为0.48。 12、肯德尔一致性叙述为0.31。 第六章概率分布 4、抽得男生的概率是0.35 5、出现相同点数的概率是0.167 6、抽一黑球与一白球的概率是0.24;两次皆是白球与黑球的概率分别是0.36和0.16 7、抽一张K的概率是4/54=0.074;抽一张梅花的概率是13/54=0.241;抽一张红桃的概率是13/54=0.241;抽一 张黑桃的概率是13/54=0.241;抽不是J、Q、K的黑桃的概率是10/54=0.185

现代心理与教育统计学

心理统计学 第一章概述 描述统计 定义:研究如何把心理与教育科学实验或调查得来得大量数据科学得科学得加以整理概括与表述 作用:使杂乱无章得数字更好得显示出事物得某些特征,有助于说明问题得实质。 具体内容:1数据分组:采用图与表得形式。 2计算数据得特征值:集中量数(平均数中数)离散量数(方差) 3计算量事物间得相关关系:积差相关(2列 3列多列) 推断统计 定义:主要研究如何利用局部数据(样本数据)所提供得信息,依据数理统计提供得理论与方法,推论总体情形。 作用:用样本推论总体。 具体内容:1如何对假设进行检验。 2如何对总体参数特征值进行估计。 3各种非参数得统计方法。 心理与教育统计基础概念 数据类型 一从数据来源来划分 1计数数据:计算个数或次数而获得得数据。(都就是离散数据) 2测量数据:借助一定测量工具或测量标准而获得得数据。(连续数据) 二根据数据所反映得测量水平 1称名数据(分类) 定义:指用数字代表事物或数字对事物进行分类得数据。

特点:数字只就是事物得符号,而没有任何数量意义。 统计方法:百分数次数众数列联相关卡方检验等。(非参检验) 2顺序数据(分类排序) 定义:指代事物类别,能够表明不同食物得大小等级或事物具有得某种特征得程度得数据。(年级) 特点:没有相等单位没有绝对零点。不表示事物特征得真正数量。 统计方法:中位数百分位数等级相关肯德尔与谐系数以及常规得非参数检验方法。3等距数据(分类排序加减(相等单位))(真正应用最广泛得数据) 定义:不仅能够指代物体得类别等级,而且具有相等得单位得数据。(成绩温度) 特点:真正得数量,能进行加减运算,没有绝对零点,不能进行乘除计算。 统计方法:平均数标准差积差相关 Z检验 t检验 F检验等。 4比率数据(分类排序加减法乘除法(绝对零点)) 定义:表明量得大小,也具有相等单位,同时具有绝对零点。(身高反应时) 特点:真正得数字,有绝对零点,可以进行加减乘除运算。 在统计中处理得数据大多就是顺序数据与等距数据。 三按照数据就是否具有连续性 离散数据连续数据 变量观测值随机变量 变量:指心理与教育实验观察调查种想要获得得数据。数据获得前用“x”表示,即为一个可以取不同熟知得物体得属性或事件,其数值具有不确定性,因而称为变量。观测值:就是研究中确定得某一变量得取值。 随机变量:表示随机现象各种结果得变量称为随机变量 三总体样本个体 总体:具有某种共同特质得一类事物。(欲研究得研究范围) 样本:构成总体得每个基本单元。

现代心理与教育统计学课后题完整版

第一章绪论 1. 名词解释 随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量 总体:又称为母全体、全域,指据有某种特征的一类事物的全体 样本:从总体中抽取的一部分个体,称为总体的一个样本 个体:构成总体的每个基本单元称为个体 次数:指某一事件在某一类别中出现的数目,又成为频数,用f表示 频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。频率通畅用比例或百分数表示 概率:又称机率。或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率 统计量:样本的特征值叫做统计量,又叫做特征值 参数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据 2. 何谓心理与教育统计学学习它有何意义 心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。整理。分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 3. 选用统计方法有哪几个步骤 首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的 其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要 第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件 4. 什么叫随机变量心理与教育科学实验所获得的数据是否属于随机变量 随机变量的定义:①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量5. 怎样理解总体、样本与个体 总体N据有某种特征的一类事物的全体,又称为母体、样本空间,常用N表示,其构成的基本单元为个体。特点:①大小随研究问题而变(有、无限)②总体性质由组成的个体性质而定 样本n:从总体中抽取的一部分交个体,称为总体的一个样本。样本数目用n表示,又叫样本容量。 特点:①样本容量越大,对总体的代表性越强②样本不同,统计方法不同 总体与样本可以相互转化。 个体:构成总体的每个基本单元称为个体。有时个体又叫做一个随机事件或样本点 6. 统计量与参数之间有何区别和关系 参数:总体的特性称参数,又称总体参数,是描述一个总体情况的统计指标 统计量:样本的特征值叫做统计量,又称特征值二者关系:参数是一个常数,统计量随样本而变化参数常用希腊字母表示,统计量用英文字母表示当试验次数=总体大小时,二者为同一指标当总体无限时,二者不同,但统计量可在某种程度上作为参数的估计值 7. 试举例说明各种数据类型之间的区别 8. 下述一些数据,哪些是测量数据哪些是计数数据其数值意味着什么 17.0千克89.85厘米199.2秒93.5分是测量数据 17人25本是计数数据 9. 说明下面符号代表的意义 卩反映总体集中情况的统计指标,即总体平均数或期望值 X反映样本平均数 P表示某一事物两个特性总体之间关系的统计指标,相关系数 r样本相关系数 b反映总体分散情况的统计指标标准差 s样本标准差 B表示两个特性中体之间数量关系的回归系数第三章集中量数 1. 应用算术平均数表示集中趋势要注意什么问题 应用算术平均数必须遵循以下几个原则: ①同质性原则。数据是用同一个观测手段采用相同的观测标准,能反映某一问题的同一方面特质的数据。 ②平均数与个体数据相结合的原则 ③平均数与标准差、方差相结合原则 2. 中数、众数、几何平均数、调和平均数个适用于心理与教育研究中的哪些资料 中数适用于:①当一组观测结果中出现两个极端数目时② 次数分布表两端数据或个别数据不清楚时 ③要快速估计一组数据代表值时

心理和教育统计学课后题答案解析

张厚粲现代心理与教育统计学第一章答案 1名词概念 (1)随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量. (2)总体 答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。(7)概率 答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A)。(8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值. 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系.它的研究对象存在于现实世界各个领域的客观事实之中。它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。统计学正是提供了这样一种科学方法。统计方法是从事科学研究的一种必不可少的工具。 ②心理与教育统计学是心理与教育科研定量分析的重要工具。 凡是客观存在事物,都有数量的表现。凡是有数量表现的事物,都可以进行测量。心理与教育现象是一种客观存在的事物,它也有数量的表现.虽然心理与教育测量具有多变性而且旨起它发生变化的因素很多,难以准确测量。但是它毕竟还是可以测量的。因此,在进行心理与教育科学研究时,在一定条件下,是可以对心理与教育现象进行定量分析的。心理与教育统计就是对心理与教育问题进行定量分析的重要的科学工具. ③广大心理与教育工作者学习心理与教育统计学的具体意义. a.可经顺利阅读国内外先进的研究成果。

现代心理与教育统计学第05章习题解答

1. 解释相关系数时应注意什么? 相关系数的值表示两个变量之间的关联程度,但只说明其大概的趋势,不存在精确的数值关系。 相关系数的数值大小,表示两个变量关联的强弱。 相关系数即使是1,也不能推出因果关系的结论。 要能区分虚假相关,不能仅依据相关系数的大小确定变量的相关。 在纯理论研究中,即使有很小的相关,如果在统计上有显著性,也能说明心理规律。 2. 假设两变量为线性关系,计算下列各种相关应用什么方法? (1)积差相关(2)斯皮尔曼等级相关(3)二列相关 (4)多列相关(5)点二列相关(6)等级相关(斯皮尔曼或肯德尔和谐系数) 3.如何区别点二列和二列相关? 主要看是人为的划分还是自然划分,而为为二列相关,自然为点二列相关 4.品质相关有几种?各种品质相关的条件? 主要有四分相关、φ相关、列联表相关 四分相关:当两个变量都是连续变量,且每一个变量的变化都被人为地分为两种类型时, 求两个变量之间的相关。 Φ相关:当两变量是真正(自然)的二分变量时,求两变量之间的相关。 列联相关:当两个变量都是计数数据时,求它们的相关。 5. 用肯德尔和谐系数 6.将数据带入公式计算得: 解 7.此题的数据为非正态的等距数据,故用斯皮尔曼等级相关求相关系数 8.解此题符合点二列相关的条件 85=男X 91=女X 8.3=X S 成绩与性别有关,即男女生的成绩存在显著差异 9.此题该用二列相关求解 2.88=奇X 8.87=偶X 8.3=X S )(() 819 .022 22=∑ ∑∑ ∑ ∑∑∑---=Y Y N X X N Y X XY N r ()()794.011413=++??? ?????-?-=∑ n n n R R n r y x R ()()972.011413 =++??? ?????-?-=∑ n n n R R n r y x R 789.04/1*8 .385 91=-=-=pq S X X r x q P pb

心理统计学概述

心理统计学概述 心理统计学是统计学方法在心理学以及教育学测量领域的应用统计学分支。它的目的是测量人的能力、知识、态度、性格特征等,并且发展相应的工具。 心理统计学是心理学研究的有效工具之一。心理学发展的历史证明,科学心理学离不开科学实验或调查,而心理实验或调查又必然要面临处理数字资料的问题。例如:怎样收集资料才能使数字最有意义、最能反映所研究的课题;采用什么方法整理和分析所得数据,才能最大限度地显现这些数据所反映的信息,从而对实验或调查结果作出科学的解释;怎样才能从所得局部结果推论到总体,作出一般规律性的科学结论等等。要解决这些问题就必须依靠科学的统计方法。 心理统计学与教育统计学、生物统计学、医学统计学等相似,都是数理统计学在某一学科的具体应用。数理统计学提供了许多处理数字资料的一般方法,心理统计学则针对心理学的特点,研究如何应用这些方法去解决心理实验或调查中的数据问题,两者既有密切联系又不等同。随着心理学的发展,必然会有更多的数理统计方法被引进心理统计学中来,这样也会促进心理统计学的发展。 心理统计学的起源与背景 在心理统计学早期的理论和应用之中,重点集中在测量人的智力。Francis Galton经常被认为是心理统计学之父。他设计和应用了一系列的心理测试。但是,心理统计学的起源经常和心理物理学联系到一起。心理统计学的先驱Charles Spearman曾经从师于心理物理学家Wilhelm Wundt。Spearman设计了测量智力的早期方法之一。著名的心理统计学家L.L.Thurstone曾经发展了后来被称为比较判断法则的测量方法,这个方法被认为和由Ernst Heinrich Weber 与Gustav Fechner这两位心理物理学家所发明的测量方法有紧密联系。他们所发展的统计测量方法现在也在心理统计学界广泛应用。 近几十年,心理统计学被广泛应用于测量人的性格、态度和信仰、教育产出、以及健康相关的领域。测量这些不可观察的特征是非常困难的,在理论界,许多的研究都致力于准确的定义这些概念并且把他们量化。于是对此的评批也聚集于对于这些定义和量化工作的怀疑。很多批评来自于物理学界以及社会科学的激进分子,他们认为很多时候这种测量是不准确的,而且被滥用了。但心理统计学的倡导者认为这些滥用数据往往来自于对于心理统计学准则的忽视。他们也反驳到,物理学所研究的很多无法被观测到的属性比方力的作用和热能,也是依靠推

相关文档
最新文档