张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解(回归分析)【圣才出品】

合集下载

张敏强《教育与心理统计学》【课后习题】(抽样理论与参数估计)【圣才出品】

张敏强《教育与心理统计学》【课后习题】(抽样理论与参数估计)【圣才出品】

第4章抽样理论与参数估计
1.试述点估计和区间估计的定义,并叙述其优缺点。

答:(1)点估计
①定义
点估计是指用一个样本值来估计总体参数值的过程。

判断估计量优劣的标准是无偏性、有效性和一致性。

如:通常用样本平均数来作为总体平均数的估计,而总体标准差的估计则要用n-1的标准差来估计。

②优缺点
a.优点:计算简单,容易理解。

b.缺点:因为点估计值是由样本数据计算出的一个单一数值,由于是随机抽样的,因此由计算样本统计量而得到的点估计值,就有可能不是总体参数的真正值。

且当用点估计去估计总体参数的真值时,其误差大小及可靠程度如何都不知道。

(2)区间估计
①定义
区间估计是指在一定的置信度水平下,用置信区间来对总体参数进行估计的过程。

②优缺点
a.优点:克服了点估计的缺点,它不仅告诉了总体参数估计的值范围,而且还给出了可靠程度。

b.缺点:点估计是一个精确的值,但区间估计是一个大致的范围。

2.已知某中学一次数学考试成绩的分布为正态分布,总体标准差为σ=5,从这个总体中抽取n=16,并计算得到81X =,6S =,试问该次考试中全体考生成绩均值μ的95%的置信区间。

解:因为成绩的分布为正态分布,总体标准差已知,置信度为95%, 且题目已知:σ=5,0.052
1.96Z =,n=16,81X =
1.96/81 1.96 1.2578.55X n σ-=-⨯=
1.96/81 1.96 1.2583.45X n σ+=+⨯=
故μ的置信度为0.95时,置信区间是[78.55,83.45]。

张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解(聚类分析)【圣才出品】

张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解(聚类分析)【圣才出品】

张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解第13章聚类分析【本章重点】☆Q型与R型聚类☆聚类分析中距离的六种定义13.1复习笔记一、聚类分析的基本原理(一)聚类分析1.聚类分析的概念聚类分析是分类学与多元统计分析相结合的一种方法。

它将分类对象置于一个多维空间中,按照它们空间关系的亲疏程度进行分类。

其与一般分类方法的不同之处在于:(1)一般分类法往往从专业知识出发进行分析归类,而聚类分析先是仅凭变量指标进行定量分析,整理出分类的谱系追踪图,然后再据专业知识确定最终类型数目和类型命名;(2)一般的分类允许在不同层次上有不同的分类依据或分类准则,而聚类分析在所有层次上的分类依据和分类准则都是一样的;(3)一般分类不要求被分对象一次性完备,允许分类后继续补充样品甚至建立新类,而聚类分析要求被分类对象一次性完备,不允许中间插入新样品,否则要重复聚类分析的全过程。

2.聚类分析的分类依据(1)聚类分析作为一种数值分类法,分类依据是数据指标,要进行聚类分析必须建起一个描写事物本质属性的指标体系,或者一个变量组合。

(2)入选的指标需满足的要求:①指标必须能刻画事物属性的某个侧面,所有指标组合起来形成一个完备的指标体系,互相配合共同刻画事物的本质特征。

②要求每一个入选指标都与所研究的问题紧密联系,并且都有较强的分辨能力。

③指标本身还必须可测和稳定,可测是分类得以进行的先决条件,稳定是分类准确的前提。

如果分类指标间还具有直交性,那么还可提高聚类的效率。

若有N个样品、有M个指标,称为M维空间上N个样本点,测值X ik表示第i个样本点在第k维指标上的测量值。

空间N个样本点的所有测值可以矩阵X记之:(13.1)④在聚类分析中,要求入选的所有指标变量有统一的量纲。

(3)常用的整理原始数据的方法有以下几种:①数据中心化变换。

如果一批数据指标由于各自的分布中心有显著差异而导致量纲不一致,可以对数据作中心化变换,新的指标中心皆为0。

张敏强《教育与心理统计学》【课后习题】(x2检验)【圣才出品】

张敏强《教育与心理统计学》【课后习题】(x2检验)【圣才出品】
圣才电子书 十万种考研考证电子书、题库视频学习平台

第 8 章 x2 检验
1.就本章所述的每一 2 检验,你认为是作单尾检验还是双尾检验?为什么? 答:本章所述的每一 2 检验都是双尾检验。判断的依据是单尾检验和双尾检验的区别。 (1)问题的提法。本章所述的每一 2 检验主要处理以下两类问题,一是通过实际调 查不观测所得的一批数据,检验其次数分布是否服从理论上所假定的某一概率分布;二是对 一批观测数据迚行双向多项分类后,检验这两个分类特征之间是独立无关的还是具有相关关 系。这种问题的提法满足双侧检验的问题提法。 (2)提出假设的形式。本章所述的每一 2 检验的原假设包括两种,一是观测数据和理 论次数无显著差异,二是 A 特征和 B 特征之间是独立无关的。这满足双侧检验的假设形式。 (3)否定域。 2 检验法查 2 表得到的概率是双尾概率。这满足双尾检验的否定域形 式。
H1:226 名智力落后的学生他们在三种性格类型上的人数分布存在显著差异。
②计算 统计量的实得指标
因为虚无假设为三者没有差异,因此理论次数为
fe
226 3
75.33
由公式
可得,
2
(46-75.33)2 (92-75.33)2 (88-75.33)2
17.24
75.33
75.33
75.33
③叏 α=0.01,查附表 2 值;自由度 df 3 1 2 ,故 02.0(1 2) 9.210
—6 所示,现在需要迚一步研究的问题有以下一些。其中第二个问题是:从表 8—5 中的双
向分类数据来看,智力水平不学校区域是否有连带关系?)
试问:在日常化妆问题上,年龄不态度之间是否具有连带关系? 解:由题意可知判断年龄不态度在化妆问题上的态度差异检验属亍独立性检验,检验过 程: ①建立假设 H0:性别不态度之间是独立无关的; H1:性别不态度之间具有显著的连带关系。 ②根据 2×2 列联表 2 检验的公式直接计算 2 值

张敏强《教育与心理统计学》(第3版)章节题库(1-4章)【圣才出品】

张敏强《教育与心理统计学》(第3版)章节题库(1-4章)【圣才出品】

第 1 章 常用的统计表与图
一、单项选择题 1.运用相对累加次数分布曲线,可以快速计算出与学生原始分数相对应的统计量是 ( )。[统考 2010 研] A.百分等级 B.Z 分数 C.T 分数 D.频次 【答案】A 【解析】运用相对累加次数分布曲线,可以根据横坐标的原始分数,从纵坐标上读出对 应的百分等级。
2.适用于描述某种心理属性在时间上变化趋势的统计分析图是( )。[统考 2010 研]
A.茎叶图 B.箱形图 C.散点图 D.线形图 【答案】D 【解析】茎叶图是将数据中的数按位数进行比较,将数的大小基本不变或变化不大的位 作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚
4.用于描述两个变量之间相关关系的统计图是( )。[统考 2007 研] A.直方图 B.线形图 C.条形图 D.散点图 【答案】D
2 / 45

【解析】散点图是用来表示两种事物之间的相关性及联系模式的点散布的图形,适用于 描述二元变量的观测数据;直方图是由若干宽度相等、高度不等的直方条紧密排列在同一基 线上构成的图形;线形图是以起伏的折线来表示某种事物的发展变化趋势及演变趋势的统计 图,适用于描述某种事物在时间序列上的变化趋势,也适用于描述一种事物随另一事物发展 变化的趋势模式,还可以适用于比较不同的人物团体在同一心理或教育现象上的变化特征及 相互联系;条形图是用宽度相同的长条来表示各个统计事项之间的数量关系,通常应用描述 离散性变量的统计事项。
6 坐标代表各组数据的( )。 A.上限 B.中点 C.下限 D.平均值 【答案】B 【解析】在次数分布曲线中,横坐标代表各组数据的中点。直方图中,横坐标代表各组 数据的精确下限和精确上限。
15.特别适用于描述具有百分比结构的分类数据的统计图是( )。 A.散点图 B.圆形图 C.条形图 D.线形图 【答案】B 【解析】圆形图主要用于描述间断性资料,目的是为显示各部分在整体中所占的比重大 小,以及各部分之间的比较。又称饼图,迅速直观有效的反映数据情况。

张敏强《教育与心理统计学》(第3版)课后习题(回归分析)【圣才出品】

张敏强《教育与心理统计学》(第3版)课后习题(回归分析)【圣才出品】

第7章回归分析1.线性回归分析中,下列哪个表述是不正确的?()A.自变量是可控制量,因变量是随机的B.两个变量不是对等的关系C.利用一个回归方程,两个变量可以互相推算D.根据回归系数可判定相关的方向【答案】C【解析】回归分析主要是通过自变量的值去估计和预测因变量的发展变化,因此不能互相推算。

2.进行回归分析,因变量y和自变量X()。

A.X是连续变量,y是称名变量B.X是称名变量,y是连续变量C.X是连续变量,y也是连续变量D.X是连续变量,y是顺序变量【答案】C【解析】回归分析是借助数学模型对事物间不确定关系的一种数量化描述,是相关关系的延伸,因此,自变量和因变量都为连续变量。

3.在回归直线,表示()。

A.当X增加一个单位时,Y增加中的数量B.当Y增加一个单位时,X增加的数量C.当X增加一个单位时,Y的平均增加量D.当Y增加一个单位时,X的平均增加量【答案】C【解析】一元线性回归方程记为y=α+βx,称为变量y对变量x的一元线性回归方程,α是这条直线在y轴上的截距,系数β是这条直线的斜率,实际上也是y的变化率,它表示当x增加1个单位时y的平均增加或减少的数量,即当x变化一个单位时,y将变化b 个单位。

4.估计标准误差说明回归直线的代表性,因此()。

A.估计标准误差数值越大,说明回归直线的代表性越大B.估计标准误差数值越大,说明回归直线的代表性越小C.估计标准误差数值越小,说明回归直线的代表性越小D.估计标准误差数值越小,说明回归直线的实用价值越小【答案】B【解析】估计标准误差是说明实际值与其估计值之间相对偏离的程度的指标,主要用来衡量回归方程的代表性。

估计标准误差的值越大,则估计量与其真实值的近似误差越大,回归直线的代表性就越小。

5.回归估计的估计标准误差的计算单位与()。

A.自变量相同B.因变量相同C.自变量及因变量相同D.相关系数相同【答案】C【解析】回归分析中称为回归估计标准误差,简记为:,由公式可看出,回归估计的估计标准误差的计算单位与自变量及因变量相同。

张敏强《教育与心理统计学》笔记和课后习题(含考研真题)详解-常用的统计表与图【圣才出品】

张敏强《教育与心理统计学》笔记和课后习题(含考研真题)详解-常用的统计表与图【圣才出品】
1 / 22
圣才电子书 十万种考研考证电子书、题库视频学习平台

全距也称为极差,是指一批数据中最大值与最小值之间的差距。观察全部数据,找出其 中的最大值(Max)和最小值(Min),以符号 R 表示全距,则全距的计算公式为:
R Max Min
(2)定组数 定组数就是要确定把整批数据划分为多少个等距的区组。组数用符号 K 表示。 ①组数大小依据数据的多少而定 组数太多,往往会削弱对数据分组整理的功用;太少,又可能会湮没数据内含的重要信 息。一般来说,当一批数据的个数在 200 个以内时,组数可取 8~18 组。如果数据来自一个 正态的总体,则可利用下述经验公式来确定组数,即:
4 / 22
圣才电子书 十万种考研考证电子书、题库视频学习平台

构成一个累积百分数分布表。 (3)说明 累积相对次数分布和累积百分数分布均有“以下”分布和“以上”分布两种。在应用时,应
根据具体情况决定选用其中的一种。 (三)次数分布图的绘制 次数分布图通常有两种表达方式,包括次数直方图和次数多边图两种。 1.次数直方图 (1)含义 次数直方图是由若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的图形。 (2)制作步骤 ①以细线条标出横轴和纵轴(取正半轴即可),使其垂直相交 a.为使图形美观,通常使横轴与纵轴的长度比为 5:3。 b.以纵轴为次数的量尺,按比例等间隔地标出刻度。 c.横轴代表测验分数的量尺,也按适当的比例等间隔地标出次数分布中各组的组中值。 d.一般说来,纵轴和横轴的尺度比例不一样。纵轴刻度往往从 0 开始,而横轴刻度则
2
K 1.87(N1)5
公式中的 N 为数据个数。 ②注意 事先计划的组数可能与实际分组时因考虑组距取整以及最低一组的起点位置不同而略 有差异,这种差异是正常的,最终结果应以实际划归的组数为准。 (3)定组距 组距用符号 i 表示,其一般原则是取奇数或 5 的倍数,如 1,3,5,7,9,10……等等。 具体的取值过程可通过全距 R 与组数 K 的比值来取整确定。 (4)写出组限 组限是每个组的起始点界限。例如,表 1-1 中列出的就是关于组限的几种不同表述方式。

张敏强《教育与心理统计学》(第3版)配套模拟试题及详解(一)

张敏强《教育与心理统计学》(第3版)配套模拟试题及详解(一)

张敏强《教育与心理统计学》(第3版)配套模拟试题及详解(一)一、单项选择题1.笔为剑做的一个方差分析,F (12,760)=0.415。

F 检验的结果( )A .不显著B .显著C .查表才能确定D .此结果是不可能的【答案】A【解析】这是笔为剑的硕士学位论文里的一个数据。

F 小于l ,所以不显著。

2.对某中学初中一年级学生实施了标准化的数学考试,全体学生成绩的平均分为83分,某一学生得了80分,他数学成绩的z 值为-0.5,问全体考生数学成绩的标准差为( )。

A .12B .6C .8D .10【答案】B【解析】z X /μσ-=(),其中X μ-为离均差,σ表示标准差。

则有0.5(8083)/σ-=-,6σ=。

3.格林夫妇先后生了两个孩子,已知第一个是男孩,那么第二个孩子也是男孩的概率(不考虑双胞胎因素)为()。

A.1/2B.1/3C.2/3D.无法计算【答案】A【解析】两个事件属于独立事件,所以概率无关。

4.格林夫妇先后生了两个孩子,已知有一个是男孩,那么另一个孩子也是男孩的概率(不考虑双胞胎因素)为()。

A.1/2B.1/3C.2/3D.无法计算【答案】B【解析】当一对夫妇先后生了两个孩子的时候,存在以下四种等可能性事件:(1)第一个是男孩,第二个也是男孩;(2)第一个是男孩,第二个是女孩;(3)第一个是女孩,第二个是男孩;(4)第一个是女孩,第二个也是女孩。

已知“有一个是男孩”,那么第四种情况排除,只剩下前三种情况。

前三种情况中,只有(1)使得“另一个也是男孩”成立。

5.下列属于等距变量数据的是()A.笔为剑身高l.63米B.笔为剑的考研成绩为全省第2名C.今日气温25摄氏度D.笔为剑是男性,这用数字“1”表示【答案】C【解析】C项,等距变量可以比较大小,可以进行加减运算,有相同的测量单位。

但只有相对参照点,没有绝对参照点(绝对零点),所以不能进行乘除运算。

A项,有绝对零点,可以进行乘除运算,因此为比率变量。

《教育与心理统计学》考研张敏强版配套名校考研真题库

《教育与心理统计学》考研张敏强版配套名校考研真题库

《教育与心理统计学》张敏强版配套名校考研真题库第一部分名校考研真题说明:从指定张敏强《教育与心理统计学》(第3版)为考研参考书目的名校历年考研真题以及心理学专业基础综合历年统考真题中挑选具有代表性的考研真题,并对其进行了详细的解答。

通过这一部分的练习,可以帮助学员巩固基础知识、夯实专业基础,从而做到全方位备考。

一、单项选择题1.关于分层随机抽样的特点,表述正确的是()。

[统考2011年研] A.总体中的个体被抽取的概率相同B.所有被试在一个层内抽取C.层间异质,层内同质D.层间变异小于层内变异【答案】C查看答案【解析】分层随机抽样是按照总体已有的某些特征,将总体分成几个不同的部分(每一部分叫一个层),再分别在每一部分中随机抽样。

层间变异大于层内变异。

2.一组服从正态分布的分数,平均数是27,方差是9。

将这组数据转化为Z分数后,Z分数的标准差为()。

[统考2011年研]A.OB.1C.3D.9【答案】B查看答案【解析】根据标准分数的性质,若原始分数呈正态分布,则转换得到的所有Z分数的均值为0,标准差为1的标准正态分布。

3.下列关于样本量的描述,正确的是()。

[统考2011年研]A.样本量需要等于或大于总体的30%B.样本量大小不是产生误差的原因C.总体差异越大,所需样本量就越小D.已知置信区间和置信水平可以计算出样本量【答案】D查看答案【解析】一般最小样本量为30个,样本越大,真实情况越接近总体,误差越小。

总体差异越大,所需样本量越大。

4.已知r1=-0.7,r2=0.7。

下列表述正确的是()。

[统考2011年研]A.r1和r2代表的意义相同B.r2代表的相关程度高于r1C.r1和r2代表的相关程度相同D.r1和r2的散点图相同【答案】D查看答案【解析】相关系数中,“+”表示正相关,“-”表示负相关。

相关系数取值的大小表示相关的强弱程度。

r1和r2的相关强弱程度相等,但方向不同,r1为负相关,r2为正相关。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(7.1)
其中,ε指的是随机误差。
称为回归的主值,称(7.2)式为回归方程。
(7.2)
2.回归分析的任务
回归分析的一个重要任务是求出回归方程右边的函数表达式。实际求回归方程的步骤
为:首先进行试验与调查;其次在大量试验与调查的数据资料基础上,按照对实际数据作最
佳拟合的原则求取具体的回归方程。
3.回归分析的种类
一、回归分析的基本原理 (一)意义 1.回归分析是借助于数学模型对客观世界所存在的事物间的不确定关系的一种数量化 描写,其目的在于为不确定现象的研究提供更为科学、精细的手段,以应用于相关随机变量 的估计、预测和控制。 2.回归分析是统计分析中的一种重要手段,首先发现回归现象的是英国生物学家高尔 顿和皮尔逊,其根本目的是要借助于因变量和自变量的分类,在概率统计的意义上,把变量
若把观测数据描成散点图,则其形状基本组成一个椭圆,也就是说这些点基本上是围绕一根 直线振动,这根直线就是椭圆的长轴所在位置。必须注意的是,一般来说所求一元线性回归 方程并不是椭圆的长轴,要求这条直线方程,必须按照最佳拟合的原则用最小二乘法。
1.一元线性回归的模型
Hale Waihona Puke 其中的一元线性回归方程记为: y=α+βx
4.计算均方
回归均方: MSU U dfU
剩余均方: MSQ Q dfQ
5.检验统计量: F MSU MSQ
6.将所求数据填入方差分析表
(7.5)
5 / 29
圣才电子书 十万种考研考证电子书、题库视频学习平台

7.查表,做出统计决断。
称为变量 y 对变量 x 的一元线性回归方程。 2.一元线性回归模型的性质
(7.4)
在一元线性回归模型 线在 y 轴上的截距。
(二)一元线性回归方程的建立
中,系数β是这条直线的斜率,α是这条直
要建立一元线性回归方程
,实际上就是要确定方程中的两个参数α与β。
由 n 对样本数据建立因变量 y 对自变量 x 的一元线性回归方程的步骤如下:
(1)根据所求回归方程函数类型的不同,可分为线性回归分析和非线性回归分析。
(2)根据内含自变量个数为一个还是多个而分为一元回归分析和多元回归分析。
(三)主要内容
回归分析包括三部分内容:建立回归方程、检验和评价所建回归方程的有效性、利用所
建回归方程进行预测和控制。
1.建立回归方程
(1)依据专业知识调查所研究现象可能涉及到的变量的种类和个数。
7.1 复习笔记
以相关关系描述两个变量之间的不确定性关系,只能对它们之间的密切程度作描述。回 归分析可以在描述变量之间不确定关系的基础上,进一步通过自变量去估计和预测因变量的 发展及变化,并且能较好地以回归系数表现各自变量对因变量的影响。回归分析既可以应用 于有明确因果关系的变量研究,也可以应用于无明确因果关系的变量研究。
二、一元线性回归分析 (一)一元线性回归的模型及其性质 一元线性回归研究的是具有线性相关关系的因变量和一个自变量之间的回归问题。确认 因变量 Y 只受一个自变量或者主要受一个自变量 X 的影响,并且确认两者之间的线性关系。
3 / 29
圣才电子书 十万种考研考证电子书、题库视频学习平台

(2)进行实验或调查以获取实际数据。
(3)结合以往的经验,对所获数据进行分析研究,确定回归方程的函数形式。
2 / 29
圣才电子书 十万种考研考证电子书、题库视频学习平台

(4)根据最佳拟合原则估计回归方程中的所有参数。 (5)建立一个回归方程。 2.检验和评价所建回归方程的有效性 (1)对所建立的回归方程作有效性检验,检验方程有无使用价值。 (2)找到评价回归方程有效性高低的统计指标来评价所建回归方程使用价值的高低。 (3)必要时必须检验各个自变量的统计显著性,以鉴别已选自变量中是否夹杂了与因 变量无关或可以忽略不计的变量,把它们从回归方程中剔除出去,以便简化方程形式,提高 使用效率。 (4)在实际计算分析过程中,建立一个回归方程后,为了追求它的高效和实用,往往 要在第一和第二两部分的计算中往返进行,直至真正建立起一个既高效又实用的“最佳”方 程。 3.利用所建回归方程进行预测和控制 根据已获得的研究结果对研究或实验的发展变化作出预测和控制,是研究回归现象、进 行回归分析的根本目的所在。在建立起回归方程之后,利用方程所揭示的变量间的关系,对 因变量进行估计或预测。估计或预测因变量的主值,估计或预测因变量的取值范围,或者利 用回归方程所揭示的变量间的发展变化和互相制约的关系,通过控制或调整自变量的值而达 到控制因变量变化趋势的目的。
(5)列出回归方程:y=a+bx。
(三)一元线性回归方程的有效性检验 1.建立假设:H0:所建回归方程无效;
H1:所建回归方程有效。 2.计算离差平方和
总离差平方和:
n
回归平方和:U =b2 (xi x )2 i 1
剩余平方和: Q lyy U
3.计算自由度
df总 n 1, dfU 1, dfQ n 2 。
圣才电子书 十万种考研考证电子书、题库视频学习平台

张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解 第 7 章 回归分析
【本章重点】 ☆ 回归分析的基本原理 ☆ 一元线性回归方程的建立 ☆ 检验和评价所建回归方程的有效性 ☆ 用所建回归方程进行预测和控制
(1)由自变量数据列 x,求得 x 的均值 和离均差平方和 ;
(2)由因变量数据列 y,求得 y 的均值 和离均差平方和 ;
(3)列 x 和 y,求得 x 与 y 的协方差 ;
4 / 29
圣才电子书 十万种考研考证电子书、题库视频学习平台

(4)由
,求出 a 和 b;
1 / 29
圣才电子书 十万种考研考证电子书、题库视频学习平台

间的相关关系用精确的数学公式伴以其他手段加以进一步的定量刻画。在回归分析中,自变
量可以是精确变量,也可以是随机变量,但在计算分析的过程中,都是作为精确变量处理的。
(二)基本原理
1.回归分析的数学模型:
y=f(x1,x2,x3,…,xk)+ε
相关文档
最新文档