罗心理与教育统计学的复习重点

罗心理与教育统计学的复习重点
罗心理与教育统计学的复习重点

一二章、绪论

现代统计学之父:皮尔逊

描述统计与推断统计

描述统计主要研究如何整理、描述数据的特征。

推断统计主要研究如何通过局部数据所提供的信息推论总体特征。

变量类型

称名变量:如,性别、学号、颜色类别、教学方法。

特征:没有绝对零点,没有测量单位。变量值之间有“相等”和“不等”的关系,但没有大小之分,不能比较大小,更不能进行加、减、乘、除四则运算。

顺序变量:程度、等级和水平。如,比赛名次、品质等级、喜爱程度

特征:既无零点、又无测量单位。变量的值之间具有“等于”或“不等于”关系、序关系(优于、先于、劣于、后于等),四则运算没有意义。

等距变量:除了可以说出名称和排出大小,还能算出差异大小量的变量。 如温度、测验成绩、智商。

特征:有相等的测量单位,无绝对零点。考试成绩为零不表示没有一点知识。可进行加减运算,乘除运算则无意义。

比率变量:如身高、重量、学生人数。既有测量单位,又有绝对零点,可进行算。

图表

条形图,用于定性数据。

直方图与多边图:用于定量数据

(圆形图)饼图:定性数据的多少或构成比例 散点图:两个变量的变化关系和变化方向。 茎叶图:保留小样本连续变量的原貌。

三、描述统计

一、频数:某一事件在某一类别中出现的次数。

频数分布类型:正态,正(负)偏态,正(反)J 形,U 形分布。 分布性质;集中(分散)程度,偏度和峰度不同。 偏态系数:数据的对称性 峰态系数:数据的峰度

二、集中量数:

包括算术平均数M 、中位数d M 、众数0M (用众数代表一组数据,可靠性较差,不过,众数不受极端数据的影响,并且求法简便)、加权平均数W M 、几何平均数g M 、调和平均数H M 。

组数据中有少数数据偏大或偏小,数据的分布呈偏态时,应用几何平均数。 算数平均数的性质(算法必须会):

三、离散量数:全距R 、平均差A.D 、方差(样本统计量,2S 总体参数2σ)、标准差(s 或者SD)、百分位差

全距:全部数据中的最大值与最小值的差 ,描述了数据分布的范围 。 平均差:全部数据与均值绝对离均差的均值。

方差:各个数据偏离中心的程度。方差越大,数据波动越大。 标准差:方差的算术平方根。

自由度:自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数。

标准分数:以标准差为单位表示一个原始分数在团体中所处的相对位置,即原始分数在均值以上或以下几个标准差的位置。

性质:标准分数的均值为0,标准差为1。没有实际单位。 应用: (1)、比较不同性质的观测值在各自数据分布中相对位置的高低。如身高与体重。 (2)计算不同质的观测值的总和或者均值,以表示在团体中的相对位置。如高考的标准分。

(3)做线性转换后,表示标准测验分数。如IQ 。

五、随机变量分布

正态分布),(2σμN X ≈------------------样本均值的分布

正态分布曲线下的面积:曲线高度是频数(Y ),曲线下面积则是累积频数P (也视作随机变量出现的概率)。X 轴上的截距为Z 。

其中,μ决定曲线的位置,σ决定曲线的“胖瘦”。

无论各分布的均值与标准差的值是多少,x 取值以下特定区域的概率(面积)是确定的,即:

正负一个标准差,占68.27%,两个95.45% ,三个99.73% 标准正态分布:均值为0,标准差为1.

总体服从正态分布N ~ (μ,2σ )时,来自该总体的所有容量为n 的样本的均值X 也服从正态分布,

X 的期望为μ,方差为σ2/n 。即

X ~N(μ,n

2

σ)

平均数的标准误N

X σ

σ=

标准误衡量了抽样误差(sampling error)的大小。所谓抽样误差是指由抽样引起的样本统计量与总体参数间的差异。

标准误越小,统计量与参数越接近,样本对总体越有代表性,用统计量推断参数的可靠度越大,所以,标准误是推断统计可靠性的重要指标。

卡方分布:变量相互独立,且服从)1,0(N 分布的随机变量。称随机变量服从自由度为为n 的卡方分布。记做)(2

2n x x ?,∑==n

i i x x 1

22

卡方分布:样本方差的分布(样本方差的分布)

T 分布:随机变量X 服从N(0,1),Y 服从)(2n x ,且相互独立,则随机变量服从自由度为n 的t 分布,记做t t(n).n

Y X

t =.

来自一个正态总体:1

)

(),1()

(2

--=-≈-=∑N X X S N t N

S X t 其中,μ

来自两个正态总体

2

)1()1(),

2()()(2122

221

1212

12

12121

-+-+-=

-+≈+---=N N S

N S N S N N t N N N N S X X t P P

其中,μμP S 为两样本的混合标准差。

T 分布的均值为0,方差为n/(n-2).

t 统计量是参数估计与假设检验的基础。

特点:当样本容量趋于∞,t 分布为正态分布,方差为1,

随自由度的减少,离散程度(方差)增大,分布中间变低,尾部变高。

F 分布:)1,1(21222

1--≈=N N F S S F ----------两样本方差的比

F 统计量主要用于方差分析、协方差分析、回归分析等。

六、参数估计

参数估计:当在研究中从样本获得一组数据后,如何通过这组信息,对总体特征进行估计,也就是如何从局部结果推论总体的情况,称为总体参数估计。总体参数估计问题可以分为点估计与区间估计。

点估计:用某一样本统计量的值来估计相应总体参数的值。 优良的估计量具有的性质:无偏性、有效性、一致性。

区间估计:按一定概率要求,由样本统计量的值估计总体参数值的所在范围。 原理:抽样分布理论。抽样分布的标准误的大小决定置信区间的长度。

置信区间:指在某一置信度时,总体参数所在的区域长度。

置信度:是作出某种推断时正确的可能性(概率)。通常用(1-a)表示。

显著性水平:即 a ,是指估计总体参数落在某一区间时可能犯错误的概率。 两个要素:可靠性(置信水平的高低)和精确度(区间长度)。

置信水平为95%的置信区间的确切含义:重复抽样N 次,所得到的N 个置信区间中有95%个包含了总体参数。 影响区间估计精确度的因素: (1)置信度(1-a)(反比) (2)样本容量(正比)

(3)总体数据的变异程度(反比)

0.95的置信区间:个标准误96.1±X

单总体均值的区间估计: 方差已知,正态分布;)1,0(N n

X Z ≈-=

σ

μ

方差未知,t 分布。

两总体均值差异的区间估计:T 分布。相关样本与独立样本都为T 分布。 其中,独立样本时用很长很长的那个公式。

总体均值的区间估计:卡方分布)1(1

222-≈-N x S N σ

七、假设检验

假设检验(显著性检验):事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立。

类型:参数检验和非参数检验(包括分布检验和独立性检验)。 假设检验的原理:

(1)逻辑上为反证法(假设检验首先假定零假设0H 为真,通过否定0H ,来检验备择假设1H 的真实性)

(2)统计上为小概率事件(小概率事件在一次实验或观测中,几乎是不可能发生的。在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设。小概率由研究者事先确定,如0.05, 0.01, 0.001等)。

假设检验的步骤:

(1)提出原假设和备择假设

(2)确定适当的检验统计量,检验统计量(方差已知)的基本形式为:n

x z σ

μ0

-=

(3)规定显著性水平(0.05或0.01) (4)计算检验统计量的值 (5)作出统计决策

拒绝域:拒绝原假设的概率。

两类错误:拒真错误α型错误;取伪错误β型错误。统计效力(统计检验力)β-1。

两类错误的关系: (1)βα+不一定等于1.

(2)其他条件不变,两者不能同时增大或者减小。

(3)两者地位不一样。我们应尽量避免第一类错误。 (4)影响β

错误的因素有总体标准差(正比)和样本容量(反比)。

单侧检验与双侧检验

单侧检验:强调方向性。

双侧检验:只强调差异,不强调方向性。

单总体均值的假设检验: 方差已知,正态分布;)1,0(N n

X Z ≈-=

σ

μ

。用这个统计公式,然后查表。

方差未知,t 分布。1

)

(),1()

(2

--=-≈-=∑N X X S N t N

S X t 其中,μ

两总体均值差异的显著性检验: (1)相关样本,使用 t 分布统计量

(2)独立样本,方差已知,使用正态分布统计量;2

22

1

21

2121)

()(N N X X Z σ

σ

μμ+

---=

(3)独立样本,方差未知,但是齐性,使用 t 分布统计量

2

)1()1(),

2()()(212

2

2211212

1212121-+-+-=

-+≈+---=N N S N S N S N N t N N N N S X X t P P 其中,μμ

总体分布的假设检验(属于非参数检验):卡方检验

设有N 个被试,按变量X 的取值可以分成k 类,第i 类有Oi 个观测值,则检验统

计量为:)1()(21

2

2

-≈-=∑=K x E E O x k

i i i i

八、方差分析

方差分析的逻辑:把观察值的总变异分解为两个或多个部分,除随机误差外,其

余各部分变异可由某个或某几个因素或它们的交互作用来解释。F 分布的统计推断可阐明某一或某些因素或因素间交互作用是否对观察值有影响。

单因素方差分析的逻辑与步骤: (1)模型与假设

(2)平方和的分解与F 检验 (3)关联强度与效应值 (4)多重比较 (5)前提假设

方差分析的前提条件:总体服从正态分布;变异可加性;方差齐性;独立性。

单因素完全随机设计的方差分析: 关联强度与效应值:

实验处理引致的效应的大小或者数据的变异有多少部分是由实验处理造成的。 关联强度:因变量的变异被自变量解释的百分比。

事后比较:F 检验显著说明各组均值并不相同(至少两组不同),但不能回答到底哪几组不同。通过对各组均值之间的配对比较来进一步检验到底哪些均值之间存在差异。

两因素完全随机设计的方差分析:

适用情形:有2个自变量,自变量A 有p 个水平,自变量B 有q 个水平,共有p*q 种处理。

比单因素多了一个交互作用的离均差平方和。 交互作用:

交互作用显著以后,还要做进一步的简单主效应的检验。 多重比较: 小结:

F 检验:主效应与交互作用是否显著。

多重比较:对显著的主效应进行多重比较。

简单主效应检验:检验因素A(B)在B(A)各个水平上的简单主效应,若显著,继续就简单主效应进行多重比较。

九、相关

相关量数

相关系数:两列变量间相关程度的数字表现形式

作为样本的统计量用r表示,作为总体参数一般用ρ表示。

正相关:两列变量变动方向相同

负相关:两列变量中有一列变量变动时,另一列变量呈现出与前一列变量方向相反的变动

零相关:两列变量之间没有关系,各自按照自己的规律或无规律变化

1.积差相关也就是Pearson相关。

(1)前提

①数据要成对出现,即若干个体中每个个体都有两种不同的观测值,并且每队数据与其它对子相互独立

②两列变量各自总体的分布都是正态的,至少接近正态

③两个相关的变量是连续变量,也即两列数据都是测量数据

④两列变量之间的关系应是直线性的

2.等级相关也就是Spearman相关

(1)适用范围

①当研究考察的变量为顺序型数据时,若原始数据为等比货等距,则先转化为顺序型数据

②当研究考察的变量为非线性数据时

(2)公式

将原始数据转化为顺序型数据,仍然用Pearson相关公式计算即可。

3.肯德尔等级相关

(1)肯德尔W系数

也叫肯德尔和谐系数,原始数据资料的获得一般采用等级评定法,即让K个被试对N件实物进行等级评定。其原理是评价者评价的一致性除以最大变异可能性。(2)肯德尔U系数#

其与肯德尔W系数所处理的问题相同,但评价者采用对偶比较法,即将N件事物两两配对分别进行比较

4.点二列相关与二列相关

(1)点二列相关

适用于一列数据为等距正态变量,另一列为离散型二分变量。

是与二分称名变量的一个值对应的连续变量的平均数

是与二分称名变量的另一个值对应的连续变量的平均数

p与q是二分称名变量两个值各自所占的比率

st是连续变量的标准差

(2)二列相关

适用于两列变量都是正态等距变量,但其中一列变量被人为地分成两类。 y 为标准正态曲线中p 值对应的高度,查正态分布表能得到

相关系数:度量两个变量相关程度大小的数字特征。

变量类型与该用的相关方法:

两个定序变量--------斯皮尔曼等级相关 两定类变量-------------------卡方独立性检验 一定类,一个定序--------卡方独立性检验 定类(序),定距----------点二列相关,单因素方差分析 两定距----------------------皮尔逊相关(积差相关)

各种统计方法的适用条件: T 检验:(1)总体正态分布(2)方差齐性(3)变量相互独立 方差分析:(1)正态(2)方差齐性(3)独立性(4)变异可加性 积差相关:(1)两个变量都是连续的(2)正态分布(3)变量之间为线性关系 回归:(1)正态(2)线性关系(3)独立性(4)误差等分散

卡方检验:为理论频数为实际频数,e ,)(2

2

f e

e f x ∑-=, 理论频数=所占比率*人数

点二列相关:一个连续变量与另一个二分称名变量的相关程度。(男女,高低) 二列相关:两列数据均为正态分布(男女两个类别);

十、回归

回归:指由一个变量的变化去预测另一个变量的变化,描述一个变量随另一变量做不同程度变化的单向关系。

回归分析的目的就是要找出一个错误最小的方法来用X 预测Y 。

回归分析的步骤:

(1)建立并求解回归模型的方程 (2)检验与评价回归方程的有效性 针对整个回归方程 针对各个回归系数

(3)利用回归方程作出预测与控制

建立回归方程:Y=a+bX b 为回归系数,Y 为实际的Y 的预测值。

X

b Y a -=

多元回归:考察两个或两个以上的自变量对同一个因变量的影响。

因变量:连续变量

自变量:连续变量或间断变量

基本与一元回归一样,但自由度不再是N-2.而是N-p-1.

自变量的选择:向前(向后)剔除法,逐步回归法

如何理解标准误:

标准误,即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度,反映的是样本均数之间的变异。标准误不是标准差,是多个样本平均数的标准差。

标准误用来衡量抽样误差。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。因此,标准误是统计推断可靠性的指标。

计算公式为:

需要注意的是,标准误差不是测量值的实际误差,也不是误差范围,它只是对一组测量数据可靠性的估计。标准误差小,测量的可靠性大一些,反之,测量就不大可靠。

1.、标准误是描述抽样情况的参数,反应了抽样样本和总体样本之间的差异。

2、由于通常我们无法对所有数据进行检测,只能进行抽样检测,所以就应该有一个参数来反应抽样质量的高低。

现代心理与教育统计学第07章习题解答

1. 何谓点估计与区间估计,它们各有哪些优缺点? 点估计就是总体参数不清楚时,用一个特定的值,即样本统计量对总体参数进行估计,但估计的参数为数轴上某一点。 区间估计是用数轴上的一段距离来表示未知参数可能落入的范围,它不具体指出总体参数是多少,能指出总体未知参数落入某一区间的概率有多大。 点估计的优点是能够提供总体参数的估计值,缺点是点估计总以误差的存在为前提,且不能提供正确估计的概率。 区间估计的优点是用概率说明估计结果的把握程度,缺点是不能确定一个具体的估计值。 2以方差的区间估计为例说明区间估计的原理 根据χ2分布: 总体方差的.95或.99置信区间为: 即总体参数(方差)落入上述区间的概率为1-α,其值为95%或99% 3.总体平均数估计的具体方法有哪些? 总体方法为点估计好区间估计,区间估计又分为: (1) 当总体分布正态方差已知时,样本平均的分布为正态分布,故依据正态分布理论估计其区间;(2)当总体分布正态方差未知时,样本平均数的分布为T 分布,依据T 分布理论估计其区间;(3)当总体非分布正态方差未知时,只有在n 大于30时渐近T 分布,样本平均数的分布渐近T 分布,依据T 分布理论估计其区间。 4总体相关系数的置信区间,应根据何种分布计算? 应根据Fisher 的Z 分布进行计算 5.解 依据样本分布理论该样本平均数的分布呈正态 其标准误为: 其置信区间为: 该科成绩的真实分数有95%的可能性在78.55----83.45之间。 6.解:此题属于总体分布正态总体方差未知的情形,故样本平均数的分布呈T 分布 其标准误为: 用df=99差T 值表,然后用直线内插法求得t α/2=1.987 其置信区间为: 该学区教学成绩的平均值有95%的可能在78.61---81.39之间。 7解:此题属于总体分布正态总体方差已知 计算标准误 ()()222212221σσσχnS S n X X n =-=-=-∑()()22/121222/2111)(ααχσχ----<<-n n S n S n 25.116 5===n x σσ45 .8355.7825.1*96.18125.1*96.1812/2/<<+<<-?+<

现代心理与教育统计学的复习资料

第一章心理与教育统计学基础知识 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 比率数据 2、变量、随机变量、观测值 变量是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、总体、个体和样本 需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数

5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章统计图表 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表

将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图(frequency polygon )是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 %100 N f

现代心理与教育统计学复习资料

现代心理与教育统计学 复习资料 Revised as of 23 November 2020

1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。

统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、 次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 %100 N f

现代心理与教育统计学复习资料

第一章 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。

4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 %100 N f

(三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 四、其他统计图表 条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。 圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。

现代心理与教育统计学答案

第一章 1名词概念 (1)随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。(2)总体 答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。 (7)概率 答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A 的概率,记为P(A)。 (8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值。 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。

张厚粲现代心理与教育统计学第4版知识点总结课后答案

第1 章绪论 1.1 复习笔记 本章重点 ?心理与教育统计的研究内容 ?选择使用统计方法的基本步骤 ?统计数据的基本类型 ?心理与教育统计的基本概念 一、统计方法在心理和教育科学研究中的作用 (一)心理与教育统计的定义与性质 1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(appliedstatistics)两部分。前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。 (二)心理与教育科学研究数据的特点 1.心理与教育科学研究数据与结果多用数字形式呈现。 2.心理与教育科学研究数据具有随机性和变异性。 3.心理与教育科学研究数据具有规律性。 4.心理与教育科学研究的目标是通过部分数据来推测总体特征。 (三)学习心理与教育统计应注意的事项 1.学习心理与教育统计学要注意的几个问题: (1)学习心理与教育统计学时,必须要克服畏难情绪。心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。 (2)在学习时要注意重点掌握各种统计方法使用的条件。 (3)要做一定的练习。 2.应用心理与教育统计方法时要做到: (1)克服“统计无用”与“统计万能”的思想,注意科研道德。 (2)正确选用统计方法,防止误用和乱用统计。 二、心理与教育统计学的内容 心理与教育统计学的研究内容,可依不同的分类标志划分为不同的类别: (一)分类一 依据统计方法的功能进行分类,统计学可分为下述三种类别,这是由于数理统计的发展历史所决定的,也是最常见的分类方法。如图1-1 所示:

现代心理与教育统计学课后题完整版14145

第一章绪论 1.名词解释 随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量 总体:又称为母全体、全域,指据有某种特征的一类事物的全体 样本:从总体中抽取的一部分个体,称为总体的一个样本 个体:构成总体的每个基本单元称为个体 次数:指某一事件在某一类别中出现的数目,又成为频数,用f表示 频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。频率通畅用比例或百分数表示 概率:又称机率。或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率 统计量:样本的特征值叫做统计量,又叫做特征值 参数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标 观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据 2.何谓心理与教育统计学学习它有何意义 心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。整理。分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 3.选用统计方法有哪几个步骤 首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的 其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要 第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件 4.什么叫随机变量心理与教育科学实验所获得的数据是否属于随机变量 随机变量的定义:①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量 5.怎样理解总体、样本与个体 总体N:据有某种特征的一类事物的全体,又称为母体、样本空间,常用N表示,其构成的基本单元为个体。特点:①大小随研究问题而变(有、无限)②总体性质由组成的个体性质而定 样本n:从总体中抽取的一部分交个体,称为总体的一个样本。样本数目用n表示,又叫样本容量。 特点:①样本容量越大,对总体的代表性越强②样本不同,统计方法不同 总体与样本可以相互转化。 个体:构成总体的每个基本单元称为个体。有时个体又叫做一个随机事件或样本点 6.统计量与参数之间有何区别和关系 参数:总体的特性称参数,又称总体参数,是描述一个总体情况的统计指标 统计量:样本的特征值叫做统计量,又称特征值 二者关系:参数是一个常数,统计量随样本而变化 参数常用希腊字母表示,统计量用英文字母表示 当试验次数=总体大小时,二者为同一指标 当总体无限时,二者不同,但统计量可在某种程度上作为参数的估计值 7.试举例说明各种数据类型之间的区别 8.下述一些数据,哪些是测量数据哪些是计数数据其数值意味着什么 千克厘米秒分是测量数据 17人25本是计数数据 9.说明下面符号代表的意义 μ反映总体集中情况的统计指标,即总体平均数或期望值 X反映样本平均数 ρ表示某一事物两个特性总体之间关系的统计指标,相关系数 r 样本相关系数 σ反映总体分散情况的统计指标标准差 s样本标准差 β表示两个特性中体之间数量关系的回归系数

现代心理与教育统计学(张厚粲)课后习题答案

现代心理与教育统计学(张厚粲)课后习题答案 第一章绪论(略) 第二章统计图表(略) 第三章集中量数 4、平均数约为36.14;中位数约为36.63 5、总平均数为91.72 6、平均联想速度为5.2 7、平均增加率约为11%;10年后的毕业人数约有3180人 8、次数分布表的平均数约为177.6;中位数约为177.5;原始数据的平均数约为176.7 第四章差异量数 5、标准差约为1.37;平均数约为1.19 6、标准差为26.3;四分位差为16.03 7、5cm组的差异比10cm组的离散程度大 8、各班成绩的总标准差是6.03 9、次数分布表的标准差约为11.82;第一四分位为42.89;第三四分位为58.41;四分位差为7.76 第五章相关关系 5、应该用肯德尔W系数。 6、r=0.8;r R=0.79;这份资料只有10对数据,积差相关的适用条件是有30对以上数据,因此这份资料适用等级相关更合适。 7、这两列变量的等级相关系数为0.97。 8、上表中成绩与性别有很强的相关,相关系数为0.83。 9、r b=0.069小于0.2.成绩A与成绩B的相关很小,成绩A与成绩B的变化几乎没有关系。 10、测验成绩与教师评定之间有一致性,相关系数为0.87。 11、9名被试的等级评定具有中等强度的相关,相关系数为0.48。 12、肯德尔一致性叙述为0.31。 第六章概率分布 4、抽得男生的概率是0.35 5、出现相同点数的概率是0.167 6、抽一黑球与一白球的概率是0.24;两次皆是白球与黑球的概率分别是0.36和0.16 7、抽一张K的概率是4/54=0.074;抽一张梅花的概率是13/54=0.241;抽一张红桃的概率是13/54=0.241;抽一 张黑桃的概率是13/54=0.241;抽不是J、Q、K的黑桃的概率是10/54=0.185

现代心理与教育统计学

心理统计学 第一章概述 描述统计 定义:研究如何把心理与教育科学实验或调查得来得大量数据科学得科学得加以整理概括与表述 作用:使杂乱无章得数字更好得显示出事物得某些特征,有助于说明问题得实质。 具体内容:1数据分组:采用图与表得形式。 2计算数据得特征值:集中量数(平均数中数)离散量数(方差) 3计算量事物间得相关关系:积差相关(2列 3列多列) 推断统计 定义:主要研究如何利用局部数据(样本数据)所提供得信息,依据数理统计提供得理论与方法,推论总体情形。 作用:用样本推论总体。 具体内容:1如何对假设进行检验。 2如何对总体参数特征值进行估计。 3各种非参数得统计方法。 心理与教育统计基础概念 数据类型 一从数据来源来划分 1计数数据:计算个数或次数而获得得数据。(都就是离散数据) 2测量数据:借助一定测量工具或测量标准而获得得数据。(连续数据) 二根据数据所反映得测量水平 1称名数据(分类) 定义:指用数字代表事物或数字对事物进行分类得数据。

特点:数字只就是事物得符号,而没有任何数量意义。 统计方法:百分数次数众数列联相关卡方检验等。(非参检验) 2顺序数据(分类排序) 定义:指代事物类别,能够表明不同食物得大小等级或事物具有得某种特征得程度得数据。(年级) 特点:没有相等单位没有绝对零点。不表示事物特征得真正数量。 统计方法:中位数百分位数等级相关肯德尔与谐系数以及常规得非参数检验方法。3等距数据(分类排序加减(相等单位))(真正应用最广泛得数据) 定义:不仅能够指代物体得类别等级,而且具有相等得单位得数据。(成绩温度) 特点:真正得数量,能进行加减运算,没有绝对零点,不能进行乘除计算。 统计方法:平均数标准差积差相关 Z检验 t检验 F检验等。 4比率数据(分类排序加减法乘除法(绝对零点)) 定义:表明量得大小,也具有相等单位,同时具有绝对零点。(身高反应时) 特点:真正得数字,有绝对零点,可以进行加减乘除运算。 在统计中处理得数据大多就是顺序数据与等距数据。 三按照数据就是否具有连续性 离散数据连续数据 变量观测值随机变量 变量:指心理与教育实验观察调查种想要获得得数据。数据获得前用“x”表示,即为一个可以取不同熟知得物体得属性或事件,其数值具有不确定性,因而称为变量。观测值:就是研究中确定得某一变量得取值。 随机变量:表示随机现象各种结果得变量称为随机变量 三总体样本个体 总体:具有某种共同特质得一类事物。(欲研究得研究范围) 样本:构成总体得每个基本单元。

现代心理与教育统计学课后题完整版

第一章绪论 1. 名词解释 随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量 总体:又称为母全体、全域,指据有某种特征的一类事物的全体 样本:从总体中抽取的一部分个体,称为总体的一个样本 个体:构成总体的每个基本单元称为个体 次数:指某一事件在某一类别中出现的数目,又成为频数,用f表示 频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。频率通畅用比例或百分数表示 概率:又称机率。或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率 统计量:样本的特征值叫做统计量,又叫做特征值 参数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据 2. 何谓心理与教育统计学学习它有何意义 心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。整理。分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 3. 选用统计方法有哪几个步骤 首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的 其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要 第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件 4. 什么叫随机变量心理与教育科学实验所获得的数据是否属于随机变量 随机变量的定义:①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量5. 怎样理解总体、样本与个体 总体N据有某种特征的一类事物的全体,又称为母体、样本空间,常用N表示,其构成的基本单元为个体。特点:①大小随研究问题而变(有、无限)②总体性质由组成的个体性质而定 样本n:从总体中抽取的一部分交个体,称为总体的一个样本。样本数目用n表示,又叫样本容量。 特点:①样本容量越大,对总体的代表性越强②样本不同,统计方法不同 总体与样本可以相互转化。 个体:构成总体的每个基本单元称为个体。有时个体又叫做一个随机事件或样本点 6. 统计量与参数之间有何区别和关系 参数:总体的特性称参数,又称总体参数,是描述一个总体情况的统计指标 统计量:样本的特征值叫做统计量,又称特征值二者关系:参数是一个常数,统计量随样本而变化参数常用希腊字母表示,统计量用英文字母表示当试验次数=总体大小时,二者为同一指标当总体无限时,二者不同,但统计量可在某种程度上作为参数的估计值 7. 试举例说明各种数据类型之间的区别 8. 下述一些数据,哪些是测量数据哪些是计数数据其数值意味着什么 17.0千克89.85厘米199.2秒93.5分是测量数据 17人25本是计数数据 9. 说明下面符号代表的意义 卩反映总体集中情况的统计指标,即总体平均数或期望值 X反映样本平均数 P表示某一事物两个特性总体之间关系的统计指标,相关系数 r样本相关系数 b反映总体分散情况的统计指标标准差 s样本标准差 B表示两个特性中体之间数量关系的回归系数第三章集中量数 1. 应用算术平均数表示集中趋势要注意什么问题 应用算术平均数必须遵循以下几个原则: ①同质性原则。数据是用同一个观测手段采用相同的观测标准,能反映某一问题的同一方面特质的数据。 ②平均数与个体数据相结合的原则 ③平均数与标准差、方差相结合原则 2. 中数、众数、几何平均数、调和平均数个适用于心理与教育研究中的哪些资料 中数适用于:①当一组观测结果中出现两个极端数目时② 次数分布表两端数据或个别数据不清楚时 ③要快速估计一组数据代表值时

心理和教育统计学课后题答案解析

张厚粲现代心理与教育统计学第一章答案 1名词概念 (1)随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量. (2)总体 答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。(7)概率 答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A)。(8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值. 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系.它的研究对象存在于现实世界各个领域的客观事实之中。它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。统计学正是提供了这样一种科学方法。统计方法是从事科学研究的一种必不可少的工具。 ②心理与教育统计学是心理与教育科研定量分析的重要工具。 凡是客观存在事物,都有数量的表现。凡是有数量表现的事物,都可以进行测量。心理与教育现象是一种客观存在的事物,它也有数量的表现.虽然心理与教育测量具有多变性而且旨起它发生变化的因素很多,难以准确测量。但是它毕竟还是可以测量的。因此,在进行心理与教育科学研究时,在一定条件下,是可以对心理与教育现象进行定量分析的。心理与教育统计就是对心理与教育问题进行定量分析的重要的科学工具. ③广大心理与教育工作者学习心理与教育统计学的具体意义. a.可经顺利阅读国内外先进的研究成果。

现代心理与教育统计学第05章习题解答

1. 解释相关系数时应注意什么? 相关系数的值表示两个变量之间的关联程度,但只说明其大概的趋势,不存在精确的数值关系。 相关系数的数值大小,表示两个变量关联的强弱。 相关系数即使是1,也不能推出因果关系的结论。 要能区分虚假相关,不能仅依据相关系数的大小确定变量的相关。 在纯理论研究中,即使有很小的相关,如果在统计上有显著性,也能说明心理规律。 2. 假设两变量为线性关系,计算下列各种相关应用什么方法? (1)积差相关(2)斯皮尔曼等级相关(3)二列相关 (4)多列相关(5)点二列相关(6)等级相关(斯皮尔曼或肯德尔和谐系数) 3.如何区别点二列和二列相关? 主要看是人为的划分还是自然划分,而为为二列相关,自然为点二列相关 4.品质相关有几种?各种品质相关的条件? 主要有四分相关、φ相关、列联表相关 四分相关:当两个变量都是连续变量,且每一个变量的变化都被人为地分为两种类型时, 求两个变量之间的相关。 Φ相关:当两变量是真正(自然)的二分变量时,求两变量之间的相关。 列联相关:当两个变量都是计数数据时,求它们的相关。 5. 用肯德尔和谐系数 6.将数据带入公式计算得: 解 7.此题的数据为非正态的等距数据,故用斯皮尔曼等级相关求相关系数 8.解此题符合点二列相关的条件 85=男X 91=女X 8.3=X S 成绩与性别有关,即男女生的成绩存在显著差异 9.此题该用二列相关求解 2.88=奇X 8.87=偶X 8.3=X S )(() 819 .022 22=∑ ∑∑ ∑ ∑∑∑---=Y Y N X X N Y X XY N r ()()794.011413=++??? ?????-?-=∑ n n n R R n r y x R ()()972.011413 =++??? ?????-?-=∑ n n n R R n r y x R 789.04/1*8 .385 91=-=-=pq S X X r x q P pb

(完整版)现代心理与教育统计学练习卷3附答案(共八套)

练习3 1.按照数据的获得方式,找出下列数据中与其它不同类的数据。( ) A.72克 B.65分 C.10米 D.3台 2.测量数据10.000的下实限是:( ) A.10.999 B.9.999 C.9.9995 D.10.0005 3.欲从某重点中学720名高一学生中随机抽取120名调查其视力情况。首先按原有视力记录,将他们的视力情况分为上、中、下三等,各等人数分别为108人、360人、252人。若用分层按比例抽样法,则中等视力水平的学生中应抽取:( ) A.18人 B.60人 C.42人 D. 72人 4.某班期末考试,语文平均成绩为82分,标准差为6.5分;数学平均成绩为75分,标准差为5.9分;外语平均成绩为66分,标准差为8分,问哪一科成绩的离散程度大?( ) A.语文 B.数学 C.外语 D.无法比较5.假如某班成绩服从正态分布,在按优、良、中、及格、不及格评定学生成绩时,良等成绩z分数应取值在哪个区间?( ) A.-0.6--0.6 B.-1--1 C.0.6--1.8 D.0.5--2.5 6.在正态分布中,标准差反映了:( ) A.随机变量的波动性 B.正态曲线的对称位置 C.随机变量的平均水平 D.正态曲线的陡峭程度 7.下列数据1,26,11,9,14,13,7,17,22,2的中位数是:( ) A.14 B.13 C.17 D.12 8. 某校1970年的教育经费是10万元,2002年的教育经费是121万元,问该校2010 年的教育经费是多少?( ) A.225.63万元 B.278.32万元 C.321.56万元 D.210.00万元 9. 有研究者调查了358名不同性别的学生对某项教育措施的评价态度,结果如下: 男性拥护66人,反对106人;女性拥护28人,反对158人,那么性别与评价态度的相关系数为( )

教育与心理统计学

《教育与心理统计学》试题一、 选择题:绪论 1、教育统计学是社会科学中的一门(B),是数理统计学、教育学、心理学交叉学科。 A、数据统计 B、应用统计 C、测量统计 D、推断统计 2、教育统计学是对教育领域各种现象(A)的取值从总体上的把握和认识。 B、质 C、物 D、数 A、量 3、教育统计学的内容包括(D)。 A、数理统计 B、生物统计 C、试验设计 D、描述统计与推断统计。 4、计算统计特征量数,属于(A) A、描述统计 B、推断统计 D、实验设计 C、多元分析 5、列表归类属于(A)。 A、描述统计 B、推断统计 D、实验设计 C、多元分析 6、预测某地的教育规模,属于(B)。 B、推断统计 A、描述统计 C、多元分析 D、实验设计 7、检验普通班与实验班的成绩有无显著差异,属于(B)。 B、推断统计 A、描述统计 C、多元分析 D、实验设计 8、通过抽查成绩来判断某校体育达标情况,属于(B)。 A、描述统计 B、推断统计 C、多元分析 D、实验设计。 9、预测某地教育规模,属于(B) A、描述统计 B、推断统计 C、教育统计 D、心理统计第一章常用的统计表与图 10、相对次数分布表与简单次数分布表各有不同的用途,如何使用它们?(C) A、单独使用 B、联合使用 C、既可单独使用又可联合使用 D、A,B,C,都不对 11、能很快地看出各组次数之间的相对大小及结构形态的图为(D)。 A、次数分布图 B、次数多边图 D、次数直方图 C、相对次数直方图 1 12、要求在横轴上最低组与最高组外各增加一个次数 f 为 0 的组的图为(A)。 A、次数多边图 B、次数分布图 D、相对次数直方图 C、次数直方图 13、适合于描述二元变量的观测数据的图为(B)。 A、线形图 B、散点图 C、圆形图 D、条形图 14、适合于描述离散性变量的统计事项的图为(D)。 B、圆形图 A、散点图 C、直方图 D、条形图 15、适合于描述具有百分比结构的分类数据的图为(A)。 A、圆形图 B、散点图 C、条形图 D、线形图用线段把相邻的点依次边接起来,边同横轴,构成一个闭合的多边 16、形,这是(B)。 A、条形图 B、次数多边图 C、次数直方图 D、线形图 17、有若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的、图形为(C)。 B、次数多边图 A、条形图 C、次数直方图 D、线形图 18、根据累积相对次数分布可绘制出(C)。 B、累积次数分布图 A、累积次数曲线图 C、累积相对次数曲线图 D、累积百分数曲线图根据累积百分数分布可绘制出(D)。 19、 A、累积次数曲线图 B、累积次数分布图 C、累积相对次数曲线图 D、累积百分数曲线图根据累积次数分布可绘制出(B)。 20、 A、累积次数曲线图 B、累积次数分布图 C、累积相对次数曲线图 D、累积百分数曲线图 21、以起伏的折线来表示某种事物的发展变化及演变趋势的统计图是(B)。 B、线形图 A、散点图 C、条形图 D、直方图 22、用平面直角坐标系上点的散布图形来表示两种事物之间的相关性及联系的图形为(A)。 A、散点图 B、线形图 C、条形图 D、直方图 23、用宽度相同的长条来表示各个统计事项之间的数量关系的图形是(C)。 A、散点图 B、线形图 C、条形图 D、直方图 24、适用于描述某种事物在时间序列上的变化趋势的图形(B)。 B、线形图 A、散点图 2 C、条形图 D、直方图第二章常用的统计参数 25、使用最普遍的一个集中量数是(A)。 A、算术平均数 B、中位数 C、加权平均数 D、众数 26、

现代心理与教育统计学的复习重点

一二章、绪论 现代统计学之父:皮尔逊 描述统计与推断统计 描述统计主要研究如何整理、描述数据的特征。 推断统计主要研究如何通过局部数据所提供的信息推论总体特征。 变量类型 定类变量:如,性别、学号、颜色类别、教学方法。 特征:没有绝对零点,没有测量单位。变量值之间有“相等”和“不等”的关系,但没有大小之分,不能比较大小,更不能进行加、减、乘、除四则运算。 定序变量:程度、等级和水平。如,比赛名次、品质等级、喜爱程度 特征:既无零点、又无测量单位。变量的值之间具有“等于”或“不等于”关系、序关系(优于、先于、劣于、后于等),四则运算没有意义。 定比变量:除了可以说出名称和排出大小,还能算出差异大小量的变量。 如温度、测验成绩、智商。 特征:有相等的测量单位,无绝对零点。考试成绩为零不表示没有一点知识。可进行加减运算,乘除运算则无意义。 定距变量:如身高、重量、学生人数。既有测量单位,又有绝对零点,可进行计算。 降低偏差:利用随机抽样 降低变异性:用大一点的样本 三、描述统计 一、频数:某一事件在某一类别中出现的次数。 频数分布类型:正态,正(负)偏态,正(反)J 形,U 形分布。 分布性质;集中(分散)程度,偏度和峰度不同。 偏态系数:数据的对称性 峰态系数:数据的峰度 二、集中量数: 包括算术平均数M 、中位数d M 、众数0M (用众数代表一组数据,可靠性较差,不过,众数不受极端数据的影响,并且求法简便)、加权平均数W M 、几何平均数g M 、调和平均数H M 。 组数据中有少数数据偏大或偏小,数据的分布呈偏态时,应用几何平均数。 算数平均数的性质(算法必须会):

现代心理与教育统计学课后题完整版

第一章 绪论 1. 名词解释 随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量总体:又称为母全体、全域,指据有某种特征的一类事物的全体 样本:从总体中抽取的一部分个体,称为总体的一个样本 个体:构成总体的每个基本单元称为个体 次数:指某一事件在某一类别中出现的数目,又成为频数,用 f 表示 频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组 数据总个数去除。频率通畅用比例或百分数表示 概率:又称机率。或然率,用符号 P 表示,指某一事件在无限的观测中所能预料的相对出现的次数, 也就是某一事物或某种情况在某一总体中出现的比率 统计量:样本的特征值叫做统计量,又叫做特征值 参 数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标 观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据 2. 何谓心理与教育统计学? 学习它有何意义 心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。整理。分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 3. 选用统计方法有哪几个步骤? 首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的 其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要 第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件 4. 什么叫随机变量? 心理与教育科学实验所获得的数据是否属于随机变量 随机变量的定义:①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量 5. 怎样理解总体、样本与个体? 总体 N :据有某种特征的一类事物的全体,又称为母体、样本空间,常用 N 表示,其构成的基本单元 为个体。特点:①大小随研究问题而变(有、无限)②总体性质由组成的个体性质而定 样本 n :从总体中抽取的一部分交个体,称为总体的一个样本。样本数目用 n 表示,又叫样本容量。 特点:①样本容量越大,对总体的代表性越强②样本不同,统计方 法不同 总体与样本可以相互转化。 个体:构成总体的每个基本单元称为个体。有时个体又叫做一个随机事件或样本点 6. 统计量与参数之间有何区别和关系? 参数:总体的特性称参数,又称总体参数,是描述一个总体情况的统计指标统计量:样本的特征值叫做统计量,又称特征值 二者关系:参数是一个常数,统计量随样本而变化 参数常用希腊字母表示,统计量用英文字母表示当试验次数 =总体大小时,二者为同一指标 当总体无限时,二者不同,但统计量可在某种程度上作为参数的估计值 7. 试举例说明各种数据类型之间的区别? 8. 下述一些数据,哪些是测量数据?哪些是计数数据?其数值意味着什么 ? 17.0 千克 89.85 厘米 199.2 秒 93.5 分是测量数据 17 人 25 本是计数数据 9. 说明下面符号代表的意义 μ 反映总体集中情况的统计指标,即总体平均数或期望值 X 反映样本平均数 ρ 表示某一事物两个特性总体之间关系的统计指标,相关系数 r 样本相关系数 σ 反映总体分散情况的统计指标标准差

现代心理与教育统计学第06章习题解答

1.概率的定义与性质 反应随机事件出现可能性大小的统计指标即为概率。概率有两类: 后验概率(统计概率):指对随机事件进行n次观测时,其中某一事件出现的次数m与总的次数n的比值。 先验概率是指在特殊情况下,直接计算的比值。这种特殊情况是: (1)试验(基本事件)的每一种可能结果是有限的;(2)每一个基本事件出现的可能性相等。如果基本事件的总数为n,事件A包括m个基本事件,则事件A的概率为:P(A)=m/n 概率的性质有关概率的一些公理 (1)任何随机事件A的概率都是非负的。 (2)必然事件的概率为1,但是概率等于1的某个事件,并不能断定它是必然事件,只能说它出现的可能性非常大。 (3)不可能事件的概率为0,但是概率为0的事件,也不能说它是不可能事件,只能说它出现的可能性非常小,几乎接近于0。 (4)随机事件的概率介于0到1之间,越接近1说明发生的可能性很大,越接近0说明发生的可能性很小。 概率的加法定理:是指两个互不相容事件A和B之和的概率,等于这两个事件的概率的和。写作P(A+B)=P(A)+P(B)。互不相容(非独立相关)事件:是指在一次试验或者调查中,若事件A发生,事件B就一定不会发生,则事件A和B为互不相容事件。由此可以推到出n个互不相容事件中去:P(A1+A2+A3+…+An)=P(A1)+P(A2)+P(A3)+…+P(An) 概率的乘法定理:两个独立事件同时出现的概率,等于两个事件概率的乘积。独立(相容无关)事件是指一个事件的出现对另一个事件的出现不发生影响。若A和B是两个相互独立的事件,则A和B同时发生的概率为:P(A*B)=P(A)×P(B)。由此推到n个独立事件同时发生的概率为:P(A1A2…An)=P(A1)P(A2)…P(A3)。 2概率分布的类型简述其特点 概率分布是指对随机变量取值的概率分布情况用数学方法进行描述。 1.离散分布与连续分布 离散分布的随机变量是计数数据(离散数据)。常用的离散分布为二项分布、泊松分布、超几何分布。 连续分布的随机变量是连续数据(测量数据)。常见的连续分布为正态分布、负指数分布、威布尔分布。 2.经验分布与理论分布 经验分布是指根据观察和实验所得的数据而编制的次数分布或相对频数分布。 理论分布①指随机变量概率分布的函数(数学模型);②指依据某种数学模型推算出的总体的次数分布。 3.基本随机变量分布和抽样分布 基本随机变量分布有正态分布和二项分布。 抽样分布是样本统计量的理论分布。 3.何谓样本平均数的分布 样本平均数的分布是指从基本随机变量为正态分布的总体中,采用放回式随机抽样的方法,每次从这个总体中抽取大小为n的一个样本计算出它的平均数(x1),然后将这些样本放回

相关文档
最新文档