现代心理与教育统计学课后题

现代心理与教育统计学课后题
现代心理与教育统计学课后题

第一章绪论

1.名词解释

随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量

总体:又称为母全体、全域,指据有某种特征的一类事物的全体

样本:从总体中抽取的一部分个体,称为总体的一个样本

个体:构成总体的每个基本单元称为个体

次数:指某一事件在某一类别中出现的数目,又成为频数,用f表示

频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。频率通畅用比例或百分数表示概率:又称机率。或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率统计量:样本的特征值叫做统计量,又叫做特征值

参数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标

观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据

2.何谓心理与教育统计学?学习它有何意义

心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。整理。分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。

3.选用统计方法有哪几个步骤?

首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的

其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要

第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件

4.什么叫随机变量?心理与教育科学实验所获得的数据是否属于随机变量

随机变量的定义:①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量

5.怎样理解总体、样本与个体?

总体N:据有某种特征的一类事物的全体,又称为母体、样本空间,常用N表示,其构成的基本单元为个体。特点:①大小随研究问题而变(有、无限)②总体性质由组成的个体性质而定

样本n:从总体中抽取的一部分交个体,称为总体的一个样本。样本数目用n表示,又叫样本容量。特点:①样本容量越大,对总体的代表性越强②样本不同,统计方法不同

总体与样本可以相互转化。

个体:构成总体的每个基本单元称为个体。有时个体又叫做一个随机事件或样本点

6.何谓次数、频率及概率

次数f:随机事件在某一类别中出现的数目,又称为频数,用f表示

频率:即相对次数,即某个事件次数被总事件除,用比例、百分数表示

概率P:又称机率或然率,用P表示,指某事件在无限管侧重所能预料的相对出现次数。

估计值(后验):几次观测中出现m次,P(A)=m/n

真实值(先验):特殊情况下,直接计算的比值(结果有限,出现可能性相等)

7.统计量与参数之间有何区别和关系?

参数:总体的特性称参数,又称总体参数,是描述一个总体情况的统计指标

统计量:样本的特征值叫做统计量,又称特征值

二者关系:参数是一个常数,统计量随样本而变化

参数常用希腊字母表示,统计量用英文字母表示

当试验次数=总体大小时,二者为同一指标

当总体无限时,二者不同,但统计量可在某种程度上作为参数的估计值

8.试举例说明各种数据类型之间的区别?

9.下述一些数据,哪些是测量数据?哪些是计数数据?其数值意味着什么?

17.0千克 89.85厘米 199.2秒 93.5分是测量数据

17人 25本是计数数据

10.说明下面符号代表的意义

μ反映总体集中情况的统计指标,即总体平均数或期望值

X反映样本平均数

ρ表示某一事物两个特性总体之间关系的统计指标,相关系数

r 样本相关系数

σ反映总体分散情况的统计指标标准差

s样本标准差

β表示两个特性中体之间数量关系的回归系数

N

n

第二章统计图表

1.统计分组应注意哪些问题?

①分类要正确,以被研究对象的本质为基础

②分类标志要明确,要包括所有数据

③如删除过失所造成的变异数据,要遵循3σ原则

2.直条图适合哪种资料?

条形图也叫做直条图,主要用于表示离散型数据资料,即计数资料。

3.圆形图适合哪种资料

又称饼图,主要用于描述间断性资料,目的是为显示各部分在整体中所占的比重大小,以及各部分之间的比较,显示的资料多以相对数(如百分数)为主

4.将下列的反应时测定资料编制成次数分布表、累积次数分布表、直方图、次数多边形。

177.5 167.4 116.7 130.9 199.1 198.3 225.0 212.0 180.0 171.0 144.0 138.0 191.0 171.5 147.0 172.0 195.5 190.0 206.7 153.2 217.0 179.2 242.2 212.8 171.0 241.0 176.5 165.4 201.0 145.5 163.0 178.0 162.0 188.1 176.5 172.2 215.0 177.9 180.5 193.0 190.5 167.3 170.5 189.5 180.1 217.0 186.3 180.0 182.5 171.0 147.0 160.5 153.2 157.5 143.5 148.5 146.4 150.5 177.1 200.1 137.5 143.7 179.5 185.5 181.6

最大值242.2 最小值116.7 全距为125.5

N=65 代入公式K=1.87(N-1)2/5=9.8 所以K取10

定组距13 最低组的下限取115

表2-1 次数分布表

分组区间组中值(Xc)次数(f)频率(P)百分次数(%)232~ 238 2 0.03 3 219~ 225 1 0.02 2 206~ 212 6 0.09 9 193~ 199 6 0.09 9 180~ 186 14 0.22 22 167~ 173 16 0.25 25 154~ 160 5 0.08 8 141~ 147 11 0.17 17 128~ 134 3 0.05 5 115~ 121 1 0.02 2 合计65 1.00 100

表2-2 累加次数分布表

分组区间次数(f)

向上累加次数向下累加次数

实际累加次数(cf)

相对累加次

实际累加次数(cf)

相对累加次

232~ 2 65 1.00 2 0.03 219~ 1 63 0.97 3 0.05 206~ 6 62 0.95 9 0.14 193~ 6 56 0.86 15 0.23 180~ 14 50 0.77 29 0.45 167~ 16 36 0.55 45 0.69 154~ 5 20 0.31 50 0.77 141~ 11 15 0.23 61 0.94 128~ 3 4 0.06 64 0.98 115~ 1 1 0.02 65 1.00

7.下面是一项美国高中生打工方式的调查结果。根据这些数据用手工方式和计算方式个制

作一个条形图。并通过自己的体会说明两种制图方式的差别和优缺点

打工方式高二(%)高三(%)

看护孩子26.0 5.0 商店销售7.5 22.0 餐饮服务11.5 17.5 其他零工8.0 1.5

左侧Y轴名称为:打工人数百分比

下侧X轴名称为:打工方式

第三章集中量数

1.应用算术平均数表示集中趋势要注意什么问题?

应用算术平均数必须遵循以下几个原则:

①同质性原则。数据是用同一个观测手段采用相同的观测标准,能反映某一问题的同

一方面特质的数据。

②平均数与个体数据相结合的原则

③平均数与标准差、方差相结合原则

2.中数、众数、几何平均数、调和平均数个适用于心理与教育研究中的哪些资料?

中数适用于:①当一组观测结果中出现两个极端数目时②次数分布表两端数据或个别数据不清楚时③要快速估计一组数据代表值时

众数适用于:①要快速且粗略的求一组数据代表值时②数据不同质时,表示典型情况

③次数分布中有两极端的数目时④粗略估计次数分布的形态时,用M-Mo作为表示次数

分布是否偏态的指标(正态:M=Md=Mo;正偏:M>Md>Mo; 负偏:M

几何平均数适用于①少数数据偏大或偏小,数据的分布成偏态②等距、等比量表实验

③平均增长率,按一定比例变化时

调和平均数适用于①工作量固定,记录各被试完成相同工作所用时间②学习时间一定,记录一定时间内各被试完成的工作量

3.对于下列数据,使用何种集中量数表示集中趋势其代表性更好?并计算它们的值。

⑴ 4 5 6 6 7 29 中数=6

⑵ 3 4 5 5 7 5 众数=5

⑶ 2 3 5 6 7 8 9 平均数=5.71

4.求下列次数分布的平均数、中数。

解:组中值由“精确上下限”算得;设估计平均值在35~组,即AM=37;中数所在组为35~,f MD =34,其精确下限Lb=34.5,该组以下各组次数累加为Fb=21+16+11+9+7=64

fd 27X AM+

37536.14N

157

i -=?=+?=∑

MD N 157Fb 64

22Md=Lb+i=34.5+536.6f 34

--??=

5. 求下列四个年级的总平均成绩。

年级

一 二 三 四 x

90.5 91 92 94 n

236

318

215

200

解:i i

T i

n X 90.5236913189221594200

X 91.72n

236318215200

?+?+?+?=

=

=+++∑∑

6. 三个不同被试对某词的联想速度如下表,求平均联想速度

被试 联想词数 时间(分)

词数/分(Xi )

A 13 2 13/2

B 13 3 13/3 C

13

25 -

解:C 被试联想时间25分钟为异常数据,删除

H i

1

1M 5.211123()N X 21313

=

==+∑调和平均数

7. 下面是某校几年来毕业生的人数,问平均增加率是多少?并估计10年后的毕业人数有

多少。

年份 1978 1979 1980 1981 1982 1983 1984 1985 毕业人数 542 601 750 760 810 930 1050 1120

解:用几何平均数变式计算:

Mg= 1.10925== 所以平均增加率为11% 10年后毕业人数为1120×1.1092510

=3159人

8. 计算第二章习题4中次数分布表资料的平均数、中数及原始数据的平局数。

解:组中值由“精确上下限”算得;设估计平均值在167~组,即设AM=173;中数所在组为167~,f MD =16,其精确下限Lb=166.5,该组以下各组次数累加为Fb=1+3+11+5=20

分组区间 组中值(Xc )

次数(f )

d=(Xi-AM)/i

fd 232~ 238 2 5 10 219~ 225 1 4 4 206~ 212 6 3 18 193~ 199 6 2 12 180~ 186 14 1 14 167~ 173 16 0 0 154~ 160 5 -1 -5 141~ 147 11 -2 -22 128~ 134 3 -3 -9 115~ 121 1 -4 -4 合计

∑N=65

∑fd=18

平均值fd 18X AM+

i=173+13176.6N

65

=??=∑ 中数Md N 65Fb 20

22Md=Lb+i=166.5+167.3f 16

--?= 原始数据的平均数=176.8

第四章 差异量数

1. 度量离中趋势的差异量数有哪些?为什么要度量离中趋势?

度量离中趋势的差异量数有全距、四分位差、百分位差、平均差、标准差与方差等等。 在心理和教育研究中,要全面描述一组数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况。这些特殊性常表现为数据的变异性。如两个样本的平均数相同但是整齐程度不同,如果只比较平均数并不能真实的反映样本全貌。因此只有集中量数不可能真实的反映出样本的分布情况。为了全面反映数据的总体情况,除了必须求出集中量数外,这时还需要使用差异量数。 2. 各种差异量数各有什么特点?

见课本103页“各种差异量数优缺点比较”

3. 标准差在心理与教育研究中除度量数据的离散程度外还有哪些用途?

可以计算差异系数(应用)和标准分数(应用)

4. 应用标准分数求不同质的数据总和时应注意什么问题?

要求不同质的数据的次数分布为正态 5. 计算下列数据的标准差与平均差

11.0 13.0 10.0 9.0 11.5 12.2 13.1 9.7 10.5

Xi 11.013.010.09.011.512.213.19.710.5X 11.1N

9

++++++++===∑

Xi-X 10.7

A.D.=

1.19n

9

=

=∑ 6. 计算第二章习题4所列次数分布表的标准差、四分差Q

设估计平均值在167~组,即AM=173, i=13 分组区间 Xc f d=(Xc-AM)/i

fd fd 2 232~ 238 2 5 10 50 219~ 225 1 4 4 16 206~ 212 6 3 18 54 193~ 199 6 2 12 24 180~ 186 14 1 14 14 167~ 173 16 0 0 0 154~ 160 5 -1 -5 5 141~ 147 11 -2 -22 44 128~ 134 3 -3 -9 27 115~ 121 1 -4 -4 16 合计

65

18

250

13=25.2 N=65 65×25%=16.25 65×75%=48.75 所以Q1、Q3分别在154~组(小于其组精确下限

的各组次数和为15)和180~组(小于其组精确下限的各组次数和为36),其精确下限分别为153.5和179.5,所以有:

b11b1111N-F 6515

44Q L i=153.5+13=156.75f 5??-=+??

b33b3333N-F 653644Q L i=179.5+13=191.34f 14??-=+??

31Q Q 191.34-156.75Q ==17.3022

-=

7. 今有一画线实验,标准线分别为5cm 和10cm ,实验结果5cm 组的误差平均数为1.3cm ,标准差为0.7cm ,10cm 组的误差平均数为4.3cm ,标准差为1.2cm ,请问用什么方法比较其离散程度的大小?并具体比较之。 用差异系数来比较离散程度。

CV1=(s1/1X )×100%=(0.7/1.3)×100%=53.85% CV2=(s2/2X )×100%=(1.2/4.3) ×100%=27.91%

班级 平均数 标准差 人数 di 1 90.5 6.2 40 0.3 2 91.0 6.5 51 -0.2 3 92.0 5.8 48 -1.2 4 89.5 5.2 43 1.3

i

N

40514843182=+++=∑

i

i T i

N X 90.54091.05192.04889.54316525.5

X 90.80N

182182

?+?+?+?=

=

==∑∑

T i i d X X =- 其值见上表

2

2222i i

N s

40 6.251 6.548 5.843 5.26469.79=?+?+?+?=∑ 2

2222i i

N d

400.351(0.2)48(1.2)43 1.3147.43=?+?-+?-+?=∑

T s 6.03=

=

= 即各班成绩的总标准差是6.03

9. 求下表数据分布的标准差和四分差

设估计平均数AM=52,即在50~组,d=(Xc-AM)/I 计算各值如下表所示:

分组 f Xc 累加次数 d d 2

fd 2

fd 75~80

1

77

55

5

25

25

5

70~ 2 72 54 4 16 32 8 65~ 4 67 52 3 9 36 12 60~ 5 62 48 2 4 20 10 55~ 8 57 43 1 1 8 8 50~ 10 52 35 0 0 0 0 45~ 9 47 25 -1 1 9 -9 40~ 7 42 16 -2 4 28 -14 35~ 4 37 9 -3 9 36 -12 30~ 2 32 5 -4 16 32 -8 25~ 2 27 3 -5 25 50 -10 20~ 1 22 1 -6 36 36 -6 合计

55

312

-16

511.82= 55×25%=13.75 55×75%=41.25 所以Q1在40~组,其精确下限Lb1=39.5,小于其组的次数

为Fb1=9,其组次数f1=7;Q2在55~组,其精确下限Lb2=54.5,小于其组的次数为Fb2=35,其组次数f2=8。计算Q1、Q2如下:

b11b1111N-F 559

44Q L i=39.5+5=42.89f 7??-=+??

b33b3333N-F 553544Q L i=54.5+5=58.41f 8??-=+??

31Q Q 58.41-42.89Q ==7.7622

-=

即四分位差为7.76 第五章 相关关系

1. 解释相关系数时应注意什么?

(1) 相关系数是两列变量之间相关成都的数字表现形式,相关程度指标有统计特征数r

和总体系数ρ

(2) 它只是一个比率,不是相关的百分数,更不是等距的度量值,只能说r 大比r 小相关

密切,不能说r 大=0.8是r 小=0.4的两倍(不能用倍数关系来解释)

(3) 当存在强相关时,能用这个相关关系根据一个变量的的值预测另一变量的值 (4) -1≤r ≤1,正负号表示相关方向,值大小表示相关程度;(0为无相关,1为完全正

相关,-1为完全负相关)

(5) 相关系数大的事物间不一定有因果关系

(6) 当两变量间的关系收到其他变量的影响时,两者间的高强度相关很可能是一种假象 (7) 计算相关要成对数据,即每个个体有两个观测值,不能随便2个个体计算 (8) 非线性相关的用r 得可能性小,但并不能说不密切

2. 假设两变量为线性关系,计算下列各情况的相关时,应用什么方法? (1) 两列变量是等距或等比的数据且均为正态分布(积差相关) (2) 两列变量是等距或等比的数据且不为正态分布(等级相关)

(3) 一变量为正态等距变量,另一列变量也为正态变量,但人为分为两类(二列相关) (4) 一变量为正态等距变量,另一列变量也为正态变量,但人为分为多类(多列相关) (5) 一变量为正态等距变量,另一列变量为二分称名变量(点二列相关) (6) 两变量均以等级表示(等级相关、交错系数、相容系数) 3. 如何区分点二列相关与二列相关?

主要区别在于二分变量是否为正态。二列相关要求两列数据均为正态,其中一列被人为地分为两类;点二列相关一列数据为等距或等比测量数据,且其总体分布为正态,另一列变量是二分称名变量,且两列数存在一一对应关系。 4. 品质相关有哪几种?各种品质相关的应用条件是什么?

品质相关分析的总条件是两因素多项分类之间的关联程度,分为一下几类:

(1) 四分相关,应用条件是:两因素都为正态连续变量(eg.学习能力,身体状态))

人为分为两个类别;同一被试样品中,分别调查两个不同因素两项分类情况

(2) Φ系数:除四分相关外的2×2表(最常用) (3) 列联表相关C :R ×C 表的计数资料分析相关程度

5. 预考查甲乙丙丁四人对十件工艺美术品的等级评定是否具有一致性,用哪种相关方法?

等级相关

6. 下表是平时两次考试成绩分数,假设其分布成正态,分别用积差相关与等级相关方法计

算相关系数,并回答,就这份资料用哪种相关法更恰当?

被试 A B A 2 B 2 AB R A R B R A R B D=R A -R B D 2 1 86 83 7396 6889 7138 2 3 6 -1 1 2 58 52 3364 2704 3016 7 8 56 -1 1 3 79 89 6241 7921 7031 4 1 4 3 9 4 64 78 4096 6084 4992 6 4 24 2 4 5 91 85 8281 7225 7735 1 2 2 -1 1 6 48 68 2304 4624 3264 9 6 54 3 9 7 55 47 3025 2209 2585 8 9 72 -1 1 8 82 76 6724 5776 6232 3 5 15 -2 4 9 32 25 1024 625 800 10 10 100 0 0 10 75 56 5625 3136 4200 5 7 35 -2 4 ∑

670

659

48080 47193 46993

55 55

368

34

N XY X Y

0.82-=

=

2R 22

6D 634

r 110.794N(N -1)

10(101)

?=-

=-

=?-∑或 X Y R 4R R 334368r [(N+1)]110.794N-1N(N+1)9110???=

-=?-= ???

∑ 用积差相关的条件成立,故用积差相关更精确

7. 下列两列变量为非正态,选用恰当的方法计算相关 本题应用等级相关法计算,且含有相同等级

X 有3个数据的等级相同,等级3.5的数据中有2个数据的等级相同,等级为6.5和8.5的数据中也分别有2个数据相同;Y 有3个数据等级相同,等级为3的数据中有3个数据等级

相同,等级为5.5的数据中有2个数据等级相同,等级为9的数据中有3个数据等级相同。

被试 X Y R X R Y D=R X -R Y D 2 1 13 14 1 1 0 0 2 12 11 2 3 -1 1 3 10 11 3.5 3 0.5 0.25 4 10 11 3.5 3 0.5 0.25 5 8 7 5 5.5 -0.5 0.25 6 6 7 6.5 5.5 1 1 7 6 5 6.5 7 -0.5 0.25 8 5 4 8.5 9 -0.5 0.25 9 5 4 8.5 9 -0.5 0.25 10 2 4 10 9 1 1 N=10 4.5

2222X n(n -1)2(21)2(21)2(21)

C 1.512121212---==++=∑∑ 2222Y n(n -1)3(31)2(21)3(31)

C 4.512121212---==++=∑∑ 332

X N N 1010

x C 1.5811212--=-=-=∑∑

332

Y N N 1010

y C 4.5781212--=-=-=∑∑

2

22

RC

x y D r 0.972+-=

=

=

8. 问下表中成绩与性别是否相关?

被试 性别 成绩 男成绩 女成绩 成绩的平方 1 男 83 83 6889 2 女 91 91 8281 3 女 95 95 9025 4 男 84 84 7056 5 女 89 89 7921 6 男 87 87 7569 7 男 86 86 7396 8 男 85 85 7225 9 女 88 88 7744 10 女 92 92 8464 ∑ 880 425 455 77570

适用点二列相关计算法。p 为男生成绩,q 为女生成绩,p X 为男生的平均成绩,q X 为女生

的平均成绩,t s 为所有学生成绩的标准差

从表中可以计算得:p=0.5 q=0.5

p 425X 855=

= q 455

X 915

==

t s 3.6==

=

p q pb t X X 8591

r 0.83s 3.6

--=

=- 相关系数为-0.83,相关较高

9. 第8题的性别若是改为另一成绩A ()正态分布的及格、不及格两类,且知1、3、5、7、

9被试的成绩A 为及格,2、4、6、8、10被试的成绩A 为不及格,请选用适当的方法计算相关,并解释之。

被试 成绩A 成绩B 及格成绩 不及格成绩 成绩的平方 1 及格 83 83 6889 2 不及格 91 91 8281 3 及格 95 95 9025 4 不及格 84 84 7056 5 及格 89 89 7921 6 不及格 87 87 7569 7 及格 86 86 7396 8 不及格 85 85 7225 9 及格 88 88 7744 10 不及格 92 92 8464 ∑ 880 441 439 77570

适用二列相关。t s 和t X 分别为成绩B 的标准差和平均数,p X 和q X 分别是成绩A 及格和不及格时成绩B 的平均数,p 为成绩A 及格的比率,y 为标准正态曲线中p 值对应的高度

t s 3.6=

=

= t 880X 8810== p 441X 88.25== q 439

X 87.85

=

= p =0.5 查正态表得y=0.39894 所以p q b t X X pq 88.287.80.50.5

r 0.070s y 3.60.39894

--?=

?=?= 或者 p t b t X X p 88.2880.5r 0.070s y 3.60.39894

--=

?=?=相关不大 10. 下表是某新编测验的分数与教师的评价等级,请问测验成绩与教师的评定间是否有一致性?0.871

11. 下表是9名被试评价10名著名的天文学家的等级评定结果,问这9名被试的等级评定

是否具有一致性?

被评价者 被试 ∑R i ∑R i 2 1 2 3 4 5 6 7 8 9 A 1 1 1 1 1 1 1 1 1 9 81 B 2 4 3 3 9 4 3 3 2 33 1089 C 4 2 4 4 2 9 5 5 8 43 1849 D 3 5 5 5 5 2 10 7 4 46 2116 E 9 6 2 2 6 5 2 6 9 47 2209 F 6 7 8 6 3 6 6 4 6 52 2704 G 5 3 9 10 4 7 9 8 3 58 3364 H 8 10 6 8 8 3 7 10 7 67 4489 I 7 8 10 7 10 10 8 2 5 67 4489 J 10 9 7 9 7 8 4 9 10 73 5329 ∑

495 27719

适用肯德尔W 系数。

2

2

i 2i

(R )495s=R 277193216.5N

10

-

=-=∑∑

2

323s 3216.5W=

0.48111

K N(N -N)9(10-10)12

12

=

=?? 即存在一定关系但不完全一致

12. 将11题的结果转化为对偶比较结果,并计算肯德尔一致性系数

A B C D E F G H I J 已知2ij

r

294=∑

ij r

94=∑ 2ij ij 8(r K r )8(294994)

U 110.319N(N-1)K(K-1)

10(10-1)9(9-1)

--?=

+=

+=??∑∑

或者选择对角线上的择优分数

2ij ()

r

2247=∑上

ij r

311=∑(上)

2ij ij ()8(r K r )8(22479311)

U 110.319N(N-1)K(K-1)

10(10-1)9(9-1)

--?=

+=

+=??∑∑上(上)

13.

第六章 概率分布

1.概率的定义及概率的性质

表明随机事件发生可能性大小的客观指标就是概率

2.概率分布的类型有哪些?简述心理与教育统计中常用的概率分布及其特点

概率分布是指对随机变量取值的概率分布情况用数学方法(函数)进行描述。概率分布依据不同的标准可以分为不同的类型:

(一)离散分布与连续分布

连续分布指连续随机变量的概率分布,即测量数据的概率分布,如正态分布

离散分布是指离散随机变量的概率分布,即计数数据的概率分布,如二项分布

(二)经验分布与理论分布

经验分布指根据观察或试验所获得的数据而编制的次数分布或相对频率分布

理论分布有两个含义,一是随机变量概率分布的函数-数学模型,二是指按某种数学模型计算出的总体的次数分布

(三)基本随机变量分布与抽样分布

基本随机变量分布指理论分布中描述构成总体的基本变量的分布,常用的有二项分布与正态分布

抽样分布是样本统计量的理论分布,又称随机变量函数的分布,如平均数,方差等3.何谓样本平均数的分布

所谓样本平均数的分布是指从基本随机变量为正态分布的总体(又称母总体)中,采用有放回随机抽样方法,每次从这个总体中抽取大小为n的一个样本,计算出它的平均数

X,然后将这些个体放回去,再次取n个个体,又可计算出一个2X,……再将n个个1

体放回去,再抽取n个个体……,这样如此反复,可计算出无限多个X,理论及实验证明这无限多个平均数的分布为正态分布。

4.从N=100的学生中随即抽样,已知男生人数为35,问每次抽取1人,抽的男生的概率

是多少?(35/100=0.35)

5.两个骰子掷一次,出现相同点数的概率是多少?

11

0.028

?=

66

6.从30个白球20个黑球共50个球中随机抽取两次(放回抽样),问抽一黑球与一白球的

概率是多少?两次皆是白球与两次皆是黑球的概率各是多少?

30202030

0.48

?+?=(一黑一白)

50505050

2020

?=(皆是黑球)

0.16

5050

3030

0.36

?=(皆是白球)

5050

7.自一副洗好的纸牌中每次抽取一张。抽取下列纸牌的概率是多少?

(1)一张K 4/54

(2)一张梅花13/54

(3)一张红桃13/54

(4)一张黑心13/54

(5)一张不是J、Q、K牌的黑桃10/54

8.掷四个硬币时,出现一下情况的概率是多少?

服从二项分布b (4, 0.5)

(1) 两个正面两个反面 2

2

2

4113C ()()2

2

8

= (2) 四个正面 4

404111C (

)()2216

= (3) 三个反面 113

4111C ()()

224

= (4) 四个正面或三个反面 115

41616+

= (5) 连续掷两次无一正面 1111616256

?= 9. 在特异功能试验中,五种符号不同的卡片在25张卡片中各重复5次,每次实验自25张

卡片中抽取一张,记下符号,将卡片送回。共抽25次,每次正确的概率是1/5.写出实验中的二项式。问这个二项式分布的平均数和标准差各等于多少? 服从二项分布b (25, 0.2)

np 250.25==?=μ

2==σ

10. 查正态表求:

(1) Z=1.5以上的概率 0.5-0.43319=0.06681 (2) Z=-1.5以下的概率 0.5-0.43319=0.06681 (3) Z =±1.5之间的概率 0.43319×2=0.86638 (4) P=0.78 Z=? Y=? Z=0.77 Y=0.29659 (5) P=0.23 Z=? Y=? Z=-0.74 Y=0.30339

(6) Z 为1.85至2.10之间的概率?0.48214-0.46784=0.0143 11. 在单位正态分布中,找出有下列个案百分数的标准测量Z 的分值

(1)85 (2)55 (3)35 (4)42.3 (5)9.4

12. 在单位正态分布中,找出有下列个案百分数的标准测量的Z 值

(1)0.14 (2)0.62 (3)0.375 (4)0.418 (5)0.729

13. 今有1000人通过一数学能力测验,欲评为六个等级,问各个等级评定人数应是多少?

解:6σ÷6=1σ,要使各等级等距,每一等级应占1个标准差的距离,确定各等级的Z 分数界限,查表计算如下:

分组 各组界限 比率p 人数分布p ×N

1 2σ以上 0.02275 23

2 1σ~2σ 0.13591 136

3 0~1σ 0.3413

4 341 4 -1σ~0 0.34134 341

5 -2σ~-1σ 0.13591 13

6 6 -2σ以下 0.02275 23

14. 将下面的次数分布表正态化,求正态化T 分数

分组 组中值 f 上限以下累加 各组中

点以下累加次

累积

百分比 Z 正态化T 分数 T=10Z+50

55~ 52 2 100 99 99% 2.33 73.3 50~ 47 2 98 97 97% 1.88 68.8 45~ 42 6 96 93 93% 1.48 64.8 40~ 37 8 90 86 86% 1.08 60.8 35~ 32 12 82 76 76% 0.71 57.1 30~ 27 14 70 63 63% 0.33 53.3 25~ 22 24 56 44 44% -0.15 48.5 20~ 17 12 32 26 26% -0.64 43.6 15~ 12 16 20 12 12% -1.175 38.25 10~

7

4

4 2

2%

-2.05

29.5

15. 掷骰子游戏中,一个骰子掷6次,问3次及3次以上6点向上的概率各是多少?

服从二项分布:

3次:33

35116666b(3, 6, )=C ()()0.054

??= 3次以上:

4425516603555111111666666666666b(4, 6, )b(5, 6, )b(6, 6, )=C ()()C ()()C ()()8.710

-++??+??+??=?或者用006115224333555511116666666666661C ()()C ()()C ()()C ()()-??-??-??-??

16. 今有四择一选择测验100题,问答对多少题才能说是真的会答而不是猜测?

解:服从二项分布,p=1/4, q=3/4, np=100×1/4=25>5,此二项分布接近正态,故:

np 25==μ

4.33

=σ 根据正态分布概率,当Z=1.645时,该点以下包含了全体的95%。如果用原是分数表示,

则为 1.645

25 1.645 4.3332.1233+=+?==μσ,即完全凭猜测,100题中猜对33题以下的可能性为95%,猜对33题及以上的概率仅为5%。所以答对33题才能说是真的会而不是猜测。

17. 一张考卷中有15道多重选择题,每题有4个可能的回答,其中至少有一个是正确答案。

一考生随机回答,(1)答对5至10题的概率,(2)答对的平均题数是多少?

18. E 字形试标检查儿童的视敏度,每种视力值(1.0,1.5)有4个方向的E 字各有两个(共

8个),问:说对几个才能说真看清了而不是猜测对的?

解:服从二项分布,n=8,p=1/4,np=2<5,所以不能用正态分布概率算,而直接用二项分布算:

8803118444b(8, 8, )=C ()()0.000015??= 77

13118444b(7, 8, )=C ()()0.000366??= 6623118444b(6, 8, )=C ()()0.003845??= 5533118444b(5, 8, )=C ()()0.023071??= 44

43118444b(4, 8, )=C ()()0.0865

??=

由以上计算可知说对5个及5个以上的概率总和为

0.000015+0.000366+0003845+0.023071=0.027297=2.73%<5%

而说对4个及以上概率总和为0.027297+0.0865=0.1138=11.38% 大大超过5%的误差范围,不可取。所以至少说对5个才能才能认为是看清了而不是猜测对的,作此结论犯错误的概率为2.73%。

19. 一学生毫无准备参加一项测验,其中有20道是非题,他纯粹是随机地选择“是”和“非”,

试计算:(1)该学生答对5题的概率;(2)该学生至少答对8题的概率 解:服从二项分布 n=20, p=0.5 np=10>5,可用正态分布概率作近似值。

答对5题的概率是5515

11120222b(5, 20, )=C ()()0.0148

??= 至少答对8题的概率用正态分布概率近似计算如下:

np 200.510==?=μ

0.5 2.236==σ 所以答对8题的Z 分

数为X 8Z 0.894--=

==-μ10

σ 2.236

所以答对至少8题的概率即为Z=-0.894以上的概率。当Z=0.894时查正态表的概率为0.31327,所以Z=-0.894以上的概率为

0.5+0.31327=0.81327,即至少答对8题的概率为0.81327

20. 设某城市大学录取率是40%,求20个参加高考的中学生中至少有10人被录取的概率。

解:服从二项分布 n=20,p=0.4,q=0.6。因为np=5,可以用正态分布概率作近似计算。

μ=np=5

,2σ 2.19= 10人被录取时的Z 分数为X 10Z 2.283--=

==μ5

σ 2.19

,至少10人被录取的概率即为Z=2.283以上的概率,查表得Z=2.283时p=0.48870,所以Z=2.283以上的概率为0.5-0.48870=0.0113,即至少10人被录取的概率为1.13% 解2:设X 为录取人数,则

5105105

{10}{

}1()1(2.28)0.01132.19 2.19 2.19

X P X P φφ---≥=≥=-=-= 21. 已知一正态总体μ=10,σ=2。今随机取n=9的样本,X 12=,求Z 值,及大于该Z 以

上的概率是多少?

解:属于样本分布中总体正态,方差已知的情况:

μ=μ

,X σ

X X

X μZ 3σ-===10,查表得Z=3时p=0.49865,所以大于Z=3的概率是0.5-0.49865=0.00135

22. 从方差未知的正态总体(μ=50)中抽取n=10的样本,算得平均数X 53=,1S 6n -=,

问大于该平均数以上的概率?

解:总体正态方差未知,服从t 分布

1.581== df=9

查表当df=9时没有准确的p 对应,采用内插法单侧界限概率:

t=1.383以上概率为p=0.1,t=1.833以上概率为p=0.05,令t=1.581以上概率为p ,则:

1.83 1.5810.05p

1.581 1.383p 0.1

--=

-- 解得p=0.078 所以大于该平均数以上的概率是0.078

23. 已知212=χ,df 7=,问该2

χ以上及以下的概率是多少?

解,查表得df=7时,2

12=χ以上的概率是0.100,以下概率为1-0.100=0.900

24. 已知从正态总体210σ=,抽取样本n=15计算的样本方差2n 1S 12-=,问其

2

χ是多少?并求小于该2

χ值以下的概率是多少? 解:不知总体平均数时,df=n-1=14

2

22i 2

n-12

22

(X -X)

(n-1)s ns 1412χ

=

==16.8σ

σσ10

?==∑ 查表得df=14时,2χ13.3=以上概率为0.5,2χ17.1=以上概率为0.25,采用内插法,令2χ16.8=以上概率为p ,则

17.116.80.25p 16.813.3p 0.5

--=-- 解得p=0.27,所以小于该2

χ值以下的概率是1-p=0.73

25. 从2

25σ=的正态总体中,随机抽取n=10的样本为:10、20、17、19、25、24、22、

31、26、26,求其2

χ值,并求大于该值的概率?

解:正态总体平均数未知,df=n-1=9,2

2

2ns χ=σ

计算22

2

2

N X -(X)s 30.8N =

=∑∑,代入22

2ns 1030.8

χ=12.32σ25

?=

= 查df=9时,2

χ=12.32以上概率用内插法得14.712.320.1p

12.3211.4p 0.25

--=-- p=0.208,即大于

该值的概率为0.208

26. 若上题μ23=已知,其2

χ又是多,大于该值以上的概率又是多少?

解,正态总体平均数已知,2

2

2

(X-μ)χ

=

σ

∑,df=n=10

代入数据得2

2

2

(X-μ)318

χ

=

12.72σ25

=

=∑ 查表计算df 1016.012.720.1p 12.7212.5p 0.25

=??

--?=?--?

得出p=0.241,即大于该值以上的概率为0.241

27. 已知从一正态总体中抽取两样本1n 15=,12n 1S 20-=;2n 16=,22

n 1S 17-=,问两样本

方差之比是否小于0.05F ? 解:同一总体方差相等

样本方差比为

第七章 参数估计 第八章 假设检验 第九章 方差分析 第十章 X 2检验

第十一章 非参数检验 第十二章 线性回归

第十三章 多变量统计分析简介 第十四章 抽样原理及方法

现代心理与教育统计学第07章习题解答

1. 何谓点估计与区间估计,它们各有哪些优缺点? 点估计就是总体参数不清楚时,用一个特定的值,即样本统计量对总体参数进行估计,但估计的参数为数轴上某一点。 区间估计是用数轴上的一段距离来表示未知参数可能落入的范围,它不具体指出总体参数是多少,能指出总体未知参数落入某一区间的概率有多大。 点估计的优点是能够提供总体参数的估计值,缺点是点估计总以误差的存在为前提,且不能提供正确估计的概率。 区间估计的优点是用概率说明估计结果的把握程度,缺点是不能确定一个具体的估计值。 2以方差的区间估计为例说明区间估计的原理 根据χ2分布: 总体方差的.95或.99置信区间为: 即总体参数(方差)落入上述区间的概率为1-α,其值为95%或99% 3.总体平均数估计的具体方法有哪些? 总体方法为点估计好区间估计,区间估计又分为: (1) 当总体分布正态方差已知时,样本平均的分布为正态分布,故依据正态分布理论估计其区间;(2)当总体分布正态方差未知时,样本平均数的分布为T 分布,依据T 分布理论估计其区间;(3)当总体非分布正态方差未知时,只有在n 大于30时渐近T 分布,样本平均数的分布渐近T 分布,依据T 分布理论估计其区间。 4总体相关系数的置信区间,应根据何种分布计算? 应根据Fisher 的Z 分布进行计算 5.解 依据样本分布理论该样本平均数的分布呈正态 其标准误为: 其置信区间为: 该科成绩的真实分数有95%的可能性在78.55----83.45之间。 6.解:此题属于总体分布正态总体方差未知的情形,故样本平均数的分布呈T 分布 其标准误为: 用df=99差T 值表,然后用直线内插法求得t α/2=1.987 其置信区间为: 该学区教学成绩的平均值有95%的可能在78.61---81.39之间。 7解:此题属于总体分布正态总体方差已知 计算标准误 ()()222212221σσσχnS S n X X n =-=-=-∑()()22/121222/2111)(ααχσχ----<<-n n S n S n 25.116 5===n x σσ45 .8355.7825.1*96.18125.1*96.1812/2/<<+<<-?+<

现代心理与教育统计学的复习资料

第一章心理与教育统计学基础知识 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 比率数据 2、变量、随机变量、观测值 变量是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、总体、个体和样本 需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数

5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章统计图表 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表

将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图(frequency polygon )是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 %100 N f

现代心理与教育统计学复习资料

现代心理与教育统计学 复习资料 Revised as of 23 November 2020

1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。

统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、 次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 %100 N f

现代心理与教育统计学复习资料

第一章 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。

4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 %100 N f

(三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 四、其他统计图表 条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。 圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。

现代心理与教育统计学答案

第一章 1名词概念 (1)随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。(2)总体 答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。 (7)概率 答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A 的概率,记为P(A)。 (8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值。 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。

张厚粲现代心理与教育统计学第4版知识点总结课后答案

第1 章绪论 1.1 复习笔记 本章重点 ?心理与教育统计的研究内容 ?选择使用统计方法的基本步骤 ?统计数据的基本类型 ?心理与教育统计的基本概念 一、统计方法在心理和教育科学研究中的作用 (一)心理与教育统计的定义与性质 1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(appliedstatistics)两部分。前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。 (二)心理与教育科学研究数据的特点 1.心理与教育科学研究数据与结果多用数字形式呈现。 2.心理与教育科学研究数据具有随机性和变异性。 3.心理与教育科学研究数据具有规律性。 4.心理与教育科学研究的目标是通过部分数据来推测总体特征。 (三)学习心理与教育统计应注意的事项 1.学习心理与教育统计学要注意的几个问题: (1)学习心理与教育统计学时,必须要克服畏难情绪。心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。 (2)在学习时要注意重点掌握各种统计方法使用的条件。 (3)要做一定的练习。 2.应用心理与教育统计方法时要做到: (1)克服“统计无用”与“统计万能”的思想,注意科研道德。 (2)正确选用统计方法,防止误用和乱用统计。 二、心理与教育统计学的内容 心理与教育统计学的研究内容,可依不同的分类标志划分为不同的类别: (一)分类一 依据统计方法的功能进行分类,统计学可分为下述三种类别,这是由于数理统计的发展历史所决定的,也是最常见的分类方法。如图1-1 所示:

现代心理与教育统计学课后题完整版14145

第一章绪论 1.名词解释 随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量 总体:又称为母全体、全域,指据有某种特征的一类事物的全体 样本:从总体中抽取的一部分个体,称为总体的一个样本 个体:构成总体的每个基本单元称为个体 次数:指某一事件在某一类别中出现的数目,又成为频数,用f表示 频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。频率通畅用比例或百分数表示 概率:又称机率。或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率 统计量:样本的特征值叫做统计量,又叫做特征值 参数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标 观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据 2.何谓心理与教育统计学学习它有何意义 心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。整理。分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 3.选用统计方法有哪几个步骤 首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的 其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要 第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件 4.什么叫随机变量心理与教育科学实验所获得的数据是否属于随机变量 随机变量的定义:①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量 5.怎样理解总体、样本与个体 总体N:据有某种特征的一类事物的全体,又称为母体、样本空间,常用N表示,其构成的基本单元为个体。特点:①大小随研究问题而变(有、无限)②总体性质由组成的个体性质而定 样本n:从总体中抽取的一部分交个体,称为总体的一个样本。样本数目用n表示,又叫样本容量。 特点:①样本容量越大,对总体的代表性越强②样本不同,统计方法不同 总体与样本可以相互转化。 个体:构成总体的每个基本单元称为个体。有时个体又叫做一个随机事件或样本点 6.统计量与参数之间有何区别和关系 参数:总体的特性称参数,又称总体参数,是描述一个总体情况的统计指标 统计量:样本的特征值叫做统计量,又称特征值 二者关系:参数是一个常数,统计量随样本而变化 参数常用希腊字母表示,统计量用英文字母表示 当试验次数=总体大小时,二者为同一指标 当总体无限时,二者不同,但统计量可在某种程度上作为参数的估计值 7.试举例说明各种数据类型之间的区别 8.下述一些数据,哪些是测量数据哪些是计数数据其数值意味着什么 千克厘米秒分是测量数据 17人25本是计数数据 9.说明下面符号代表的意义 μ反映总体集中情况的统计指标,即总体平均数或期望值 X反映样本平均数 ρ表示某一事物两个特性总体之间关系的统计指标,相关系数 r 样本相关系数 σ反映总体分散情况的统计指标标准差 s样本标准差 β表示两个特性中体之间数量关系的回归系数

现代心理与教育统计学(张厚粲)课后习题答案

现代心理与教育统计学(张厚粲)课后习题答案 第一章绪论(略) 第二章统计图表(略) 第三章集中量数 4、平均数约为36.14;中位数约为36.63 5、总平均数为91.72 6、平均联想速度为5.2 7、平均增加率约为11%;10年后的毕业人数约有3180人 8、次数分布表的平均数约为177.6;中位数约为177.5;原始数据的平均数约为176.7 第四章差异量数 5、标准差约为1.37;平均数约为1.19 6、标准差为26.3;四分位差为16.03 7、5cm组的差异比10cm组的离散程度大 8、各班成绩的总标准差是6.03 9、次数分布表的标准差约为11.82;第一四分位为42.89;第三四分位为58.41;四分位差为7.76 第五章相关关系 5、应该用肯德尔W系数。 6、r=0.8;r R=0.79;这份资料只有10对数据,积差相关的适用条件是有30对以上数据,因此这份资料适用等级相关更合适。 7、这两列变量的等级相关系数为0.97。 8、上表中成绩与性别有很强的相关,相关系数为0.83。 9、r b=0.069小于0.2.成绩A与成绩B的相关很小,成绩A与成绩B的变化几乎没有关系。 10、测验成绩与教师评定之间有一致性,相关系数为0.87。 11、9名被试的等级评定具有中等强度的相关,相关系数为0.48。 12、肯德尔一致性叙述为0.31。 第六章概率分布 4、抽得男生的概率是0.35 5、出现相同点数的概率是0.167 6、抽一黑球与一白球的概率是0.24;两次皆是白球与黑球的概率分别是0.36和0.16 7、抽一张K的概率是4/54=0.074;抽一张梅花的概率是13/54=0.241;抽一张红桃的概率是13/54=0.241;抽一 张黑桃的概率是13/54=0.241;抽不是J、Q、K的黑桃的概率是10/54=0.185

现代心理与教育统计学

心理统计学 第一章概述 描述统计 定义:研究如何把心理与教育科学实验或调查得来得大量数据科学得科学得加以整理概括与表述 作用:使杂乱无章得数字更好得显示出事物得某些特征,有助于说明问题得实质。 具体内容:1数据分组:采用图与表得形式。 2计算数据得特征值:集中量数(平均数中数)离散量数(方差) 3计算量事物间得相关关系:积差相关(2列 3列多列) 推断统计 定义:主要研究如何利用局部数据(样本数据)所提供得信息,依据数理统计提供得理论与方法,推论总体情形。 作用:用样本推论总体。 具体内容:1如何对假设进行检验。 2如何对总体参数特征值进行估计。 3各种非参数得统计方法。 心理与教育统计基础概念 数据类型 一从数据来源来划分 1计数数据:计算个数或次数而获得得数据。(都就是离散数据) 2测量数据:借助一定测量工具或测量标准而获得得数据。(连续数据) 二根据数据所反映得测量水平 1称名数据(分类) 定义:指用数字代表事物或数字对事物进行分类得数据。

特点:数字只就是事物得符号,而没有任何数量意义。 统计方法:百分数次数众数列联相关卡方检验等。(非参检验) 2顺序数据(分类排序) 定义:指代事物类别,能够表明不同食物得大小等级或事物具有得某种特征得程度得数据。(年级) 特点:没有相等单位没有绝对零点。不表示事物特征得真正数量。 统计方法:中位数百分位数等级相关肯德尔与谐系数以及常规得非参数检验方法。3等距数据(分类排序加减(相等单位))(真正应用最广泛得数据) 定义:不仅能够指代物体得类别等级,而且具有相等得单位得数据。(成绩温度) 特点:真正得数量,能进行加减运算,没有绝对零点,不能进行乘除计算。 统计方法:平均数标准差积差相关 Z检验 t检验 F检验等。 4比率数据(分类排序加减法乘除法(绝对零点)) 定义:表明量得大小,也具有相等单位,同时具有绝对零点。(身高反应时) 特点:真正得数字,有绝对零点,可以进行加减乘除运算。 在统计中处理得数据大多就是顺序数据与等距数据。 三按照数据就是否具有连续性 离散数据连续数据 变量观测值随机变量 变量:指心理与教育实验观察调查种想要获得得数据。数据获得前用“x”表示,即为一个可以取不同熟知得物体得属性或事件,其数值具有不确定性,因而称为变量。观测值:就是研究中确定得某一变量得取值。 随机变量:表示随机现象各种结果得变量称为随机变量 三总体样本个体 总体:具有某种共同特质得一类事物。(欲研究得研究范围) 样本:构成总体得每个基本单元。

现代心理与教育统计学课后题完整版

第一章绪论 1. 名词解释 随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量 总体:又称为母全体、全域,指据有某种特征的一类事物的全体 样本:从总体中抽取的一部分个体,称为总体的一个样本 个体:构成总体的每个基本单元称为个体 次数:指某一事件在某一类别中出现的数目,又成为频数,用f表示 频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。频率通畅用比例或百分数表示 概率:又称机率。或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率 统计量:样本的特征值叫做统计量,又叫做特征值 参数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据 2. 何谓心理与教育统计学学习它有何意义 心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。整理。分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 3. 选用统计方法有哪几个步骤 首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的 其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要 第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件 4. 什么叫随机变量心理与教育科学实验所获得的数据是否属于随机变量 随机变量的定义:①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量5. 怎样理解总体、样本与个体 总体N据有某种特征的一类事物的全体,又称为母体、样本空间,常用N表示,其构成的基本单元为个体。特点:①大小随研究问题而变(有、无限)②总体性质由组成的个体性质而定 样本n:从总体中抽取的一部分交个体,称为总体的一个样本。样本数目用n表示,又叫样本容量。 特点:①样本容量越大,对总体的代表性越强②样本不同,统计方法不同 总体与样本可以相互转化。 个体:构成总体的每个基本单元称为个体。有时个体又叫做一个随机事件或样本点 6. 统计量与参数之间有何区别和关系 参数:总体的特性称参数,又称总体参数,是描述一个总体情况的统计指标 统计量:样本的特征值叫做统计量,又称特征值二者关系:参数是一个常数,统计量随样本而变化参数常用希腊字母表示,统计量用英文字母表示当试验次数=总体大小时,二者为同一指标当总体无限时,二者不同,但统计量可在某种程度上作为参数的估计值 7. 试举例说明各种数据类型之间的区别 8. 下述一些数据,哪些是测量数据哪些是计数数据其数值意味着什么 17.0千克89.85厘米199.2秒93.5分是测量数据 17人25本是计数数据 9. 说明下面符号代表的意义 卩反映总体集中情况的统计指标,即总体平均数或期望值 X反映样本平均数 P表示某一事物两个特性总体之间关系的统计指标,相关系数 r样本相关系数 b反映总体分散情况的统计指标标准差 s样本标准差 B表示两个特性中体之间数量关系的回归系数第三章集中量数 1. 应用算术平均数表示集中趋势要注意什么问题 应用算术平均数必须遵循以下几个原则: ①同质性原则。数据是用同一个观测手段采用相同的观测标准,能反映某一问题的同一方面特质的数据。 ②平均数与个体数据相结合的原则 ③平均数与标准差、方差相结合原则 2. 中数、众数、几何平均数、调和平均数个适用于心理与教育研究中的哪些资料 中数适用于:①当一组观测结果中出现两个极端数目时② 次数分布表两端数据或个别数据不清楚时 ③要快速估计一组数据代表值时

心理和教育统计学课后题答案解析

张厚粲现代心理与教育统计学第一章答案 1名词概念 (1)随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量. (2)总体 答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。(7)概率 答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A)。(8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值. 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系.它的研究对象存在于现实世界各个领域的客观事实之中。它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。统计学正是提供了这样一种科学方法。统计方法是从事科学研究的一种必不可少的工具。 ②心理与教育统计学是心理与教育科研定量分析的重要工具。 凡是客观存在事物,都有数量的表现。凡是有数量表现的事物,都可以进行测量。心理与教育现象是一种客观存在的事物,它也有数量的表现.虽然心理与教育测量具有多变性而且旨起它发生变化的因素很多,难以准确测量。但是它毕竟还是可以测量的。因此,在进行心理与教育科学研究时,在一定条件下,是可以对心理与教育现象进行定量分析的。心理与教育统计就是对心理与教育问题进行定量分析的重要的科学工具. ③广大心理与教育工作者学习心理与教育统计学的具体意义. a.可经顺利阅读国内外先进的研究成果。

现代心理与教育统计学第05章习题解答

1. 解释相关系数时应注意什么? 相关系数的值表示两个变量之间的关联程度,但只说明其大概的趋势,不存在精确的数值关系。 相关系数的数值大小,表示两个变量关联的强弱。 相关系数即使是1,也不能推出因果关系的结论。 要能区分虚假相关,不能仅依据相关系数的大小确定变量的相关。 在纯理论研究中,即使有很小的相关,如果在统计上有显著性,也能说明心理规律。 2. 假设两变量为线性关系,计算下列各种相关应用什么方法? (1)积差相关(2)斯皮尔曼等级相关(3)二列相关 (4)多列相关(5)点二列相关(6)等级相关(斯皮尔曼或肯德尔和谐系数) 3.如何区别点二列和二列相关? 主要看是人为的划分还是自然划分,而为为二列相关,自然为点二列相关 4.品质相关有几种?各种品质相关的条件? 主要有四分相关、φ相关、列联表相关 四分相关:当两个变量都是连续变量,且每一个变量的变化都被人为地分为两种类型时, 求两个变量之间的相关。 Φ相关:当两变量是真正(自然)的二分变量时,求两变量之间的相关。 列联相关:当两个变量都是计数数据时,求它们的相关。 5. 用肯德尔和谐系数 6.将数据带入公式计算得: 解 7.此题的数据为非正态的等距数据,故用斯皮尔曼等级相关求相关系数 8.解此题符合点二列相关的条件 85=男X 91=女X 8.3=X S 成绩与性别有关,即男女生的成绩存在显著差异 9.此题该用二列相关求解 2.88=奇X 8.87=偶X 8.3=X S )(() 819 .022 22=∑ ∑∑ ∑ ∑∑∑---=Y Y N X X N Y X XY N r ()()794.011413=++??? ?????-?-=∑ n n n R R n r y x R ()()972.011413 =++??? ?????-?-=∑ n n n R R n r y x R 789.04/1*8 .385 91=-=-=pq S X X r x q P pb

(完整版)现代心理与教育统计学练习卷3附答案(共八套)

练习3 1.按照数据的获得方式,找出下列数据中与其它不同类的数据。( ) A.72克 B.65分 C.10米 D.3台 2.测量数据10.000的下实限是:( ) A.10.999 B.9.999 C.9.9995 D.10.0005 3.欲从某重点中学720名高一学生中随机抽取120名调查其视力情况。首先按原有视力记录,将他们的视力情况分为上、中、下三等,各等人数分别为108人、360人、252人。若用分层按比例抽样法,则中等视力水平的学生中应抽取:( ) A.18人 B.60人 C.42人 D. 72人 4.某班期末考试,语文平均成绩为82分,标准差为6.5分;数学平均成绩为75分,标准差为5.9分;外语平均成绩为66分,标准差为8分,问哪一科成绩的离散程度大?( ) A.语文 B.数学 C.外语 D.无法比较5.假如某班成绩服从正态分布,在按优、良、中、及格、不及格评定学生成绩时,良等成绩z分数应取值在哪个区间?( ) A.-0.6--0.6 B.-1--1 C.0.6--1.8 D.0.5--2.5 6.在正态分布中,标准差反映了:( ) A.随机变量的波动性 B.正态曲线的对称位置 C.随机变量的平均水平 D.正态曲线的陡峭程度 7.下列数据1,26,11,9,14,13,7,17,22,2的中位数是:( ) A.14 B.13 C.17 D.12 8. 某校1970年的教育经费是10万元,2002年的教育经费是121万元,问该校2010 年的教育经费是多少?( ) A.225.63万元 B.278.32万元 C.321.56万元 D.210.00万元 9. 有研究者调查了358名不同性别的学生对某项教育措施的评价态度,结果如下: 男性拥护66人,反对106人;女性拥护28人,反对158人,那么性别与评价态度的相关系数为( )

教育与心理统计学

《教育与心理统计学》试题一、 选择题:绪论 1、教育统计学是社会科学中的一门(B),是数理统计学、教育学、心理学交叉学科。 A、数据统计 B、应用统计 C、测量统计 D、推断统计 2、教育统计学是对教育领域各种现象(A)的取值从总体上的把握和认识。 B、质 C、物 D、数 A、量 3、教育统计学的内容包括(D)。 A、数理统计 B、生物统计 C、试验设计 D、描述统计与推断统计。 4、计算统计特征量数,属于(A) A、描述统计 B、推断统计 D、实验设计 C、多元分析 5、列表归类属于(A)。 A、描述统计 B、推断统计 D、实验设计 C、多元分析 6、预测某地的教育规模,属于(B)。 B、推断统计 A、描述统计 C、多元分析 D、实验设计 7、检验普通班与实验班的成绩有无显著差异,属于(B)。 B、推断统计 A、描述统计 C、多元分析 D、实验设计 8、通过抽查成绩来判断某校体育达标情况,属于(B)。 A、描述统计 B、推断统计 C、多元分析 D、实验设计。 9、预测某地教育规模,属于(B) A、描述统计 B、推断统计 C、教育统计 D、心理统计第一章常用的统计表与图 10、相对次数分布表与简单次数分布表各有不同的用途,如何使用它们?(C) A、单独使用 B、联合使用 C、既可单独使用又可联合使用 D、A,B,C,都不对 11、能很快地看出各组次数之间的相对大小及结构形态的图为(D)。 A、次数分布图 B、次数多边图 D、次数直方图 C、相对次数直方图 1 12、要求在横轴上最低组与最高组外各增加一个次数 f 为 0 的组的图为(A)。 A、次数多边图 B、次数分布图 D、相对次数直方图 C、次数直方图 13、适合于描述二元变量的观测数据的图为(B)。 A、线形图 B、散点图 C、圆形图 D、条形图 14、适合于描述离散性变量的统计事项的图为(D)。 B、圆形图 A、散点图 C、直方图 D、条形图 15、适合于描述具有百分比结构的分类数据的图为(A)。 A、圆形图 B、散点图 C、条形图 D、线形图用线段把相邻的点依次边接起来,边同横轴,构成一个闭合的多边 16、形,这是(B)。 A、条形图 B、次数多边图 C、次数直方图 D、线形图 17、有若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的、图形为(C)。 B、次数多边图 A、条形图 C、次数直方图 D、线形图 18、根据累积相对次数分布可绘制出(C)。 B、累积次数分布图 A、累积次数曲线图 C、累积相对次数曲线图 D、累积百分数曲线图根据累积百分数分布可绘制出(D)。 19、 A、累积次数曲线图 B、累积次数分布图 C、累积相对次数曲线图 D、累积百分数曲线图根据累积次数分布可绘制出(B)。 20、 A、累积次数曲线图 B、累积次数分布图 C、累积相对次数曲线图 D、累积百分数曲线图 21、以起伏的折线来表示某种事物的发展变化及演变趋势的统计图是(B)。 B、线形图 A、散点图 C、条形图 D、直方图 22、用平面直角坐标系上点的散布图形来表示两种事物之间的相关性及联系的图形为(A)。 A、散点图 B、线形图 C、条形图 D、直方图 23、用宽度相同的长条来表示各个统计事项之间的数量关系的图形是(C)。 A、散点图 B、线形图 C、条形图 D、直方图 24、适用于描述某种事物在时间序列上的变化趋势的图形(B)。 B、线形图 A、散点图 2 C、条形图 D、直方图第二章常用的统计参数 25、使用最普遍的一个集中量数是(A)。 A、算术平均数 B、中位数 C、加权平均数 D、众数 26、

现代心理与教育统计学的复习重点

一二章、绪论 现代统计学之父:皮尔逊 描述统计与推断统计 描述统计主要研究如何整理、描述数据的特征。 推断统计主要研究如何通过局部数据所提供的信息推论总体特征。 变量类型 定类变量:如,性别、学号、颜色类别、教学方法。 特征:没有绝对零点,没有测量单位。变量值之间有“相等”和“不等”的关系,但没有大小之分,不能比较大小,更不能进行加、减、乘、除四则运算。 定序变量:程度、等级和水平。如,比赛名次、品质等级、喜爱程度 特征:既无零点、又无测量单位。变量的值之间具有“等于”或“不等于”关系、序关系(优于、先于、劣于、后于等),四则运算没有意义。 定比变量:除了可以说出名称和排出大小,还能算出差异大小量的变量。 如温度、测验成绩、智商。 特征:有相等的测量单位,无绝对零点。考试成绩为零不表示没有一点知识。可进行加减运算,乘除运算则无意义。 定距变量:如身高、重量、学生人数。既有测量单位,又有绝对零点,可进行计算。 降低偏差:利用随机抽样 降低变异性:用大一点的样本 三、描述统计 一、频数:某一事件在某一类别中出现的次数。 频数分布类型:正态,正(负)偏态,正(反)J 形,U 形分布。 分布性质;集中(分散)程度,偏度和峰度不同。 偏态系数:数据的对称性 峰态系数:数据的峰度 二、集中量数: 包括算术平均数M 、中位数d M 、众数0M (用众数代表一组数据,可靠性较差,不过,众数不受极端数据的影响,并且求法简便)、加权平均数W M 、几何平均数g M 、调和平均数H M 。 组数据中有少数数据偏大或偏小,数据的分布呈偏态时,应用几何平均数。 算数平均数的性质(算法必须会):

现代心理与教育统计学课后题完整版

第一章 绪论 1. 名词解释 随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量总体:又称为母全体、全域,指据有某种特征的一类事物的全体 样本:从总体中抽取的一部分个体,称为总体的一个样本 个体:构成总体的每个基本单元称为个体 次数:指某一事件在某一类别中出现的数目,又成为频数,用 f 表示 频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组 数据总个数去除。频率通畅用比例或百分数表示 概率:又称机率。或然率,用符号 P 表示,指某一事件在无限的观测中所能预料的相对出现的次数, 也就是某一事物或某种情况在某一总体中出现的比率 统计量:样本的特征值叫做统计量,又叫做特征值 参 数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标 观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据 2. 何谓心理与教育统计学? 学习它有何意义 心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。整理。分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 3. 选用统计方法有哪几个步骤? 首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的 其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要 第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件 4. 什么叫随机变量? 心理与教育科学实验所获得的数据是否属于随机变量 随机变量的定义:①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量 5. 怎样理解总体、样本与个体? 总体 N :据有某种特征的一类事物的全体,又称为母体、样本空间,常用 N 表示,其构成的基本单元 为个体。特点:①大小随研究问题而变(有、无限)②总体性质由组成的个体性质而定 样本 n :从总体中抽取的一部分交个体,称为总体的一个样本。样本数目用 n 表示,又叫样本容量。 特点:①样本容量越大,对总体的代表性越强②样本不同,统计方 法不同 总体与样本可以相互转化。 个体:构成总体的每个基本单元称为个体。有时个体又叫做一个随机事件或样本点 6. 统计量与参数之间有何区别和关系? 参数:总体的特性称参数,又称总体参数,是描述一个总体情况的统计指标统计量:样本的特征值叫做统计量,又称特征值 二者关系:参数是一个常数,统计量随样本而变化 参数常用希腊字母表示,统计量用英文字母表示当试验次数 =总体大小时,二者为同一指标 当总体无限时,二者不同,但统计量可在某种程度上作为参数的估计值 7. 试举例说明各种数据类型之间的区别? 8. 下述一些数据,哪些是测量数据?哪些是计数数据?其数值意味着什么 ? 17.0 千克 89.85 厘米 199.2 秒 93.5 分是测量数据 17 人 25 本是计数数据 9. 说明下面符号代表的意义 μ 反映总体集中情况的统计指标,即总体平均数或期望值 X 反映样本平均数 ρ 表示某一事物两个特性总体之间关系的统计指标,相关系数 r 样本相关系数 σ 反映总体分散情况的统计指标标准差

现代心理与教育统计学第06章习题解答

1.概率的定义与性质 反应随机事件出现可能性大小的统计指标即为概率。概率有两类: 后验概率(统计概率):指对随机事件进行n次观测时,其中某一事件出现的次数m与总的次数n的比值。 先验概率是指在特殊情况下,直接计算的比值。这种特殊情况是: (1)试验(基本事件)的每一种可能结果是有限的;(2)每一个基本事件出现的可能性相等。如果基本事件的总数为n,事件A包括m个基本事件,则事件A的概率为:P(A)=m/n 概率的性质有关概率的一些公理 (1)任何随机事件A的概率都是非负的。 (2)必然事件的概率为1,但是概率等于1的某个事件,并不能断定它是必然事件,只能说它出现的可能性非常大。 (3)不可能事件的概率为0,但是概率为0的事件,也不能说它是不可能事件,只能说它出现的可能性非常小,几乎接近于0。 (4)随机事件的概率介于0到1之间,越接近1说明发生的可能性很大,越接近0说明发生的可能性很小。 概率的加法定理:是指两个互不相容事件A和B之和的概率,等于这两个事件的概率的和。写作P(A+B)=P(A)+P(B)。互不相容(非独立相关)事件:是指在一次试验或者调查中,若事件A发生,事件B就一定不会发生,则事件A和B为互不相容事件。由此可以推到出n个互不相容事件中去:P(A1+A2+A3+…+An)=P(A1)+P(A2)+P(A3)+…+P(An) 概率的乘法定理:两个独立事件同时出现的概率,等于两个事件概率的乘积。独立(相容无关)事件是指一个事件的出现对另一个事件的出现不发生影响。若A和B是两个相互独立的事件,则A和B同时发生的概率为:P(A*B)=P(A)×P(B)。由此推到n个独立事件同时发生的概率为:P(A1A2…An)=P(A1)P(A2)…P(A3)。 2概率分布的类型简述其特点 概率分布是指对随机变量取值的概率分布情况用数学方法进行描述。 1.离散分布与连续分布 离散分布的随机变量是计数数据(离散数据)。常用的离散分布为二项分布、泊松分布、超几何分布。 连续分布的随机变量是连续数据(测量数据)。常见的连续分布为正态分布、负指数分布、威布尔分布。 2.经验分布与理论分布 经验分布是指根据观察和实验所得的数据而编制的次数分布或相对频数分布。 理论分布①指随机变量概率分布的函数(数学模型);②指依据某种数学模型推算出的总体的次数分布。 3.基本随机变量分布和抽样分布 基本随机变量分布有正态分布和二项分布。 抽样分布是样本统计量的理论分布。 3.何谓样本平均数的分布 样本平均数的分布是指从基本随机变量为正态分布的总体中,采用放回式随机抽样的方法,每次从这个总体中抽取大小为n的一个样本计算出它的平均数(x1),然后将这些样本放回

相关文档
最新文档