教育与心理统计学 第八章 X2检验考研笔记-精品
教育与心理统计学第八章:假设检验

临界值
H0值
样本统计量
左侧检验示意图
(显著性水平与拒绝域 )
抽样分布
置信水平
拒绝域
1- 接受域
临界值
H0值
样本统计量
观察到的样本统计量
右侧检验示意图 (显著性水平与拒绝域 )
抽样分布
置信水平
1- 接受域
拒绝域
H0值 观察到的样本统计量
临界值
样本统计量
双侧检验原假设与备择假设的确定
▪ 双侧检验属于决策中的假设检验。即不论是拒绝H0还 是接受H0,都必需采取相应的行动措施。
1、原假设真实, 并接受原假设,判断正确; 2、原假设不真实,且拒绝原假设,判断正确; 3、原假设真实, 但拒绝原假设,判断错误; 4、原假设不真实,却接受原假设,判断错误。
假设检验是依据样本提供的信息进行判断,有犯错误 的可能。所犯错误有两种类型:
第一类错误是原假设H0为真时,检验结果把它当成不 真而拒绝了。犯这种错误的概率用α表示,也称作α错 误(αerror)或弃真错误。
型错误
β错误(取伪错误) 1-β(正确决策)
要使犯这两类错误的概率α 和β都尽可能小, α也不能定
的过低 。
在一般研究中,我们总是控制犯型错误
为什么???
假设检验中人们普遍执行同一准则:首先控制弃真错误(α错 误)。假设检验的基本法则以α为显著性水平就体现了这一原
则。
两个理由: 统计推断中大家都遵循统一的准则,讨论问题会比较方便。
0.076mm。试问新机床加工零件 的椭圆度均值与以前有无显著差
异?(=0.05)
属于决策中 的假设!
解:已知:X0=0.081mm, =.25,n=200,
x 0.076
张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解(聚类分析)【圣才出品】

张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解第13章聚类分析【本章重点】☆Q型与R型聚类☆聚类分析中距离的六种定义13.1复习笔记一、聚类分析的基本原理(一)聚类分析1.聚类分析的概念聚类分析是分类学与多元统计分析相结合的一种方法。
它将分类对象置于一个多维空间中,按照它们空间关系的亲疏程度进行分类。
其与一般分类方法的不同之处在于:(1)一般分类法往往从专业知识出发进行分析归类,而聚类分析先是仅凭变量指标进行定量分析,整理出分类的谱系追踪图,然后再据专业知识确定最终类型数目和类型命名;(2)一般的分类允许在不同层次上有不同的分类依据或分类准则,而聚类分析在所有层次上的分类依据和分类准则都是一样的;(3)一般分类不要求被分对象一次性完备,允许分类后继续补充样品甚至建立新类,而聚类分析要求被分类对象一次性完备,不允许中间插入新样品,否则要重复聚类分析的全过程。
2.聚类分析的分类依据(1)聚类分析作为一种数值分类法,分类依据是数据指标,要进行聚类分析必须建起一个描写事物本质属性的指标体系,或者一个变量组合。
(2)入选的指标需满足的要求:①指标必须能刻画事物属性的某个侧面,所有指标组合起来形成一个完备的指标体系,互相配合共同刻画事物的本质特征。
②要求每一个入选指标都与所研究的问题紧密联系,并且都有较强的分辨能力。
③指标本身还必须可测和稳定,可测是分类得以进行的先决条件,稳定是分类准确的前提。
如果分类指标间还具有直交性,那么还可提高聚类的效率。
若有N个样品、有M个指标,称为M维空间上N个样本点,测值X ik表示第i个样本点在第k维指标上的测量值。
空间N个样本点的所有测值可以矩阵X记之:(13.1)④在聚类分析中,要求入选的所有指标变量有统一的量纲。
(3)常用的整理原始数据的方法有以下几种:①数据中心化变换。
如果一批数据指标由于各自的分布中心有显著差异而导致量纲不一致,可以对数据作中心化变换,新的指标中心皆为0。
张厚粲《现代心理与教育统计学》配套题库【课后习题(第8~14章)】【圣才出品】

接受 H0),而前提 H1 为真,因而犯了错误,这就是Ⅱ型错误,其概率为 β。很显然,当 α
=0.05 时,β 不一定等于 0.95。
3.影响 β 错误的因素有哪些,什么叫统计检验能力?
2 / 84
圣才电子书 十万种考研考证电子书、题库视频学习平台
答:β 错误,即Ⅱ型错误,指虚无假设 H0 本来不正确但却接受了 H0。 (1)影响 β 错误的因素主要有 3 个 ①显著性水平即 α 值,二者成负相关,即 α 增大时 β 减小,但是二者之和不为 1。 ②样本统计量。 ③样本容量,增大样本容量会减小 β。 (2)统计检验力,又称假设检验的效力,是指假设检验能够正确侦察到真实的处理效 应的能力,也指假设检验能够正确地拒绝一个错误的虚无假设的概率,因此效力可以表示为 1-β。检验的效力越高,侦察能力越强。影响统计检验力的因素有: ①处理效应大小,处理效应越明显,越容易被侦查到,假设检验的效力也就越大。 ②显著性水平 α,α 越大,假设检验的效力也就越大。 ③检验的方向性,单侧检验侦察处理效应的能力高于双侧检验。 ④样本容量,样本容量越大,标准误越小,样本均值分布越集中,统计效力越高。
图 8-1 α 与 β 的关系示意图
_
如果 H0∶μ1=μ0 为真,关于Xi 与 μ 的差异就要在图 8-1 中左边的正态分布中讨论。对
_
_
于某一显著性水平 α,其临界点为Xα。(将两端各 α/2 放在同一端)。Xα 右边表示 H0 的拒绝
区,面积比率为 α;左边表示 H0 的接受区,面积比率为 1-α。在“H0 为真”的前提下随
4 / 84
2.从 α 与 β 两类错误的关系分析,为什么 α 与 β 的和不一定等于 1? 答:α 与 β 是在两个前提下的概率。α 是拒绝 H0 时犯错误的概率(这时前提是“H0 为真”);β 是接受 H0 时犯错误的概率(这时“H0 为假”是前提),所以 α+β 不一定等于 1。
张厚粲《现代心理与教育统计学》(第4版)配套题库【考研真题精选+章节题库】

目 录第一部分 考研真题精选一、单项选择题二、多项选择题三、简答题四、综合题第二部分 章节题库第1章 绪 论第2章 统计图表第3章 集中量数第4章 差异量数第5章 相关关系第6章 概率分布第7章 参数估计第8章 假设检验第9章 方差分析第10章 χ2检验第11章 非参数检验第12章 线性回归第13章 多变量统计分析简介第14章 抽样原理及方法第一部分 考研真题精选一、单项选择题1已知某小学一年级学生的体重平均数21kg,标准差3.2kg,身高平均数120cm,标准差6.0cm,则下列关于体重和身高离散程度的说法正确的是( )。
[统考2019研]A.体重离散程度更大B.身高离散程度更大C.两者离散程度一样D.两者无法比较【答案】A【解析】计算体重和身高的变异系数,CV体重=(3.2/21)×100%=15.2%,CV身高=(6/120)×100%=5%。
由此可知体重离散程度更大。
2已知某正态总体的标准差为16,现从中随机抽取一个n=100的样本,样本标准差为16,则样本平均数分布的标准误为( )。
[统考2019研]A.0.16B.1.6C.4D.25【答案】B【解析】总体正态,且方差已知,则样本平均数的分布为正态分布,标准误SE=σ/sqr(n)=16/10=1.6。
3如果学生参加压力量表测试的分数服从正态分布,平均数为5,标准差为2,那么分数处在5和9之间的学生百分比约为( )。
[统考2019研]A.34%B.48%C.50%D.68%【答案】B【解析】计算原始分数为5的标准分数Z1=0,原始分数为9的标准分数Z2=2,已知±1.96包含95%的个体,则可估计p(0<Z<2)=0.48。
4对样本平均数进行双尾假设检验,在α=0.10水平上拒绝了虚无假设。
如果用相同数据计算总体均值的置信区间,下列描述正确的是( )。
[统考2019研]A.置信区间不能覆盖总体均值B.置信区间覆盖总体均值为10%C.置信区间覆盖总体均值为90%D.置信区间覆盖总体均值为0.9%【答案】C【解析】置信度即置信区间覆盖总体均值的概率,题干说明置信度为1-α=0.90。
心理学考研之心理统计学笔记

心理统计学笔记(1)基本概念总体:具有某些共同的、可观测特征的一类事物的全体,构成总体的每个基本单元称为个体样本:由于不能或没必要对整个总体进行研究,我们只能从总体中选择出一些个体代表总体,这些个体的集合叫样本变量:本身是变化的或者对于不同个体有不同值得特征或条件常量:本身不变且对不同的个体的值也相同参数:描述总体的数值,它可以从一次测量中获得,也可以从总体的一系列测量中推论得到比例:全组中取值为X的比例,p=f/N插值法:一种求两个已知数值之间中间值的方法,其假设所求解点附近数据呈线性变化统计量:描述样本的数值,与参数的获得方式相同随机取样:从总体抽取样本的一种策略,要求总体中的每一个个体被抽到的机会均等取样误差:样本统计量与相应的总体参数之间的差距偏态分布:分数堆积在分布的一端,而另一端成为比较尖细的尾端,其与对称分布对应次数分布:一批数据在某一量度的每一个类目所出现的次数情况离散型变量:由分离的、不可分割的范畴组成,临近范畴之间没有值存在连续型变量:在任何两个观测值之间都存在无限多个可能值,它可被分割成无限多个组成部分(2)学习建议①将注意放在概念上,心理统计应该是一门概念性的科学,而非纯数学。
②一定要将统计方法与心理学研究的情景结合起来学习。
③弄懂一个概念再开始学习下一个,心理统计中的概念应用性较差却是之后做题的基础。
④做题按照推荐格式能避免出错几率。
(3)统计检验总表数据类型单样本问题独立样本比较相关样本比较多组样本的比较相关问题独立样本重复测量等距型总体正态分布单样本t/z检验独立样本t/z检验相关样本t检验独立样本方差分析重复测量方差分析Pearson积差相关分布形态未知大样本下的相应的t/z检验大样本下的相应的t/z检验大样本下的相应的t检验转化为顺序型转化为顺序型顺序型符号检验法曼-惠特尼U检验维尔克松T检验克-瓦氏单向方差分析弗里德曼双向等级方差分析Spearman等级相关命名型χ2匹配度检验χ2独立性检验符号检验法χ2独立性检验χ2独立性检验一、描述统计描述统计是指用来整理、概括、简化数据的统计方法,侧重于描述一组数据的全貌,表达一件事物的性质。
张敏强《教育与心理统计学》【课后习题】(x2检验)【圣才出品】

第 8 章 x2 检验
1.就本章所述的每一 2 检验,你认为是作单尾检验还是双尾检验?为什么? 答:本章所述的每一 2 检验都是双尾检验。判断的依据是单尾检验和双尾检验的区别。 (1)问题的提法。本章所述的每一 2 检验主要处理以下两类问题,一是通过实际调 查不观测所得的一批数据,检验其次数分布是否服从理论上所假定的某一概率分布;二是对 一批观测数据迚行双向多项分类后,检验这两个分类特征之间是独立无关的还是具有相关关 系。这种问题的提法满足双侧检验的问题提法。 (2)提出假设的形式。本章所述的每一 2 检验的原假设包括两种,一是观测数据和理 论次数无显著差异,二是 A 特征和 B 特征之间是独立无关的。这满足双侧检验的假设形式。 (3)否定域。 2 检验法查 2 表得到的概率是双尾概率。这满足双尾检验的否定域形 式。
H1:226 名智力落后的学生他们在三种性格类型上的人数分布存在显著差异。
②计算 统计量的实得指标
因为虚无假设为三者没有差异,因此理论次数为
fe
226 3
75.33
由公式
可得,
2
(46-75.33)2 (92-75.33)2 (88-75.33)2
17.24
75.33
75.33
75.33
③叏 α=0.01,查附表 2 值;自由度 df 3 1 2 ,故 02.0(1 2) 9.210
—6 所示,现在需要迚一步研究的问题有以下一些。其中第二个问题是:从表 8—5 中的双
向分类数据来看,智力水平不学校区域是否有连带关系?)
试问:在日常化妆问题上,年龄不态度之间是否具有连带关系? 解:由题意可知判断年龄不态度在化妆问题上的态度差异检验属亍独立性检验,检验过 程: ①建立假设 H0:性别不态度之间是独立无关的; H1:性别不态度之间具有显著的连带关系。 ②根据 2×2 列联表 2 检验的公式直接计算 2 值
心理与教育统计学课件(张厚粲版)ch8(2)假设检验

5
2 2 2 2 解:①建立假设: H 0 : σ 1 = σ 2 , H1 : σ 1 ≠ σ 2 ②计算统计量: S 2 = n1 S 2 = 12 × 1.752 = 3.34
n1 −1
㈠独立样本 例17的计算
n1 − 1
1
11
2 S n2 −1
n2 8 2 = S 2 = × 1.732 = 3.42 n2 − 1 7 3.42 = = 1.02 3.34
两样本方差的差异显著性检验的目的是想了解样 本抽自的两个总体的方差的一致情况,或两个总 体方差是否相等,因此也称为方差的齐性检验。 ㈠独立样本 2 2 设有两个总体X和Y, X ~ N ( µ1 , σ 1 ), Y ~ N ( µ 2 , σ 2 ) 且X和Y相互独立,从X和Y两总体中抽取样本容量分 2 别为n1,n2的两个样本,计算其方差分别为 S12和S 2 , 2 2 2 2 假如 σ 1 = σ 2 , 那么σ 1 σ 2 = 1 。当两样本的总体 2 方差未知,则可用总体方差的无偏估计量 S n1 −1 和 2 2 2 来代替 σ 1 和σ 2 。这两个估计量的比的抽样分 S n2 −1 布服从df1=n1-1,df2=n2-1的 F分布。
SE Dr
1 1 = + K(9 − 26 ) n1 − 3 n2 − 3
检验公式为 : Z =
(Z r
1
− Z r2 ) − (Z ρ1 − Z ρ 2 ) K(9 − 27 ) SE Dr
15
二、双总体相关系数差异显著性检验
㈠两样本相关系数分别由两组相互独立的被试得 到。 例22 从某重点中学中抽取学生30名,从一般中学 中抽取35名学生,分别计算他们的数学成绩与 瑞文测验分数的相关系数为0.72和0.51,试问能 否认为重点中学学生在数学成绩与瑞文推理能 力之间比一般中学学生有更高的相关。
张敏强《教育与心理统计学》笔记和课后习题(含考研真题)详解-常用的统计表与图【圣才出品】

圣才电子书 十万种考研考证电子书、题库视频学习平台
全距也称为极差,是指一批数据中最大值与最小值之间的差距。观察全部数据,找出其 中的最大值(Max)和最小值(Min),以符号 R 表示全距,则全距的计算公式为:
R Max Min
(2)定组数 定组数就是要确定把整批数据划分为多少个等距的区组。组数用符号 K 表示。 ①组数大小依据数据的多少而定 组数太多,往往会削弱对数据分组整理的功用;太少,又可能会湮没数据内含的重要信 息。一般来说,当一批数据的个数在 200 个以内时,组数可取 8~18 组。如果数据来自一个 正态的总体,则可利用下述经验公式来确定组数,即:
4 / 22
圣才电子书 十万种考研考证电子书、题库视频学习平台
构成一个累积百分数分布表。 (3)说明 累积相对次数分布和累积百分数分布均有“以下”分布和“以上”分布两种。在应用时,应
根据具体情况决定选用其中的一种。 (三)次数分布图的绘制 次数分布图通常有两种表达方式,包括次数直方图和次数多边图两种。 1.次数直方图 (1)含义 次数直方图是由若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的图形。 (2)制作步骤 ①以细线条标出横轴和纵轴(取正半轴即可),使其垂直相交 a.为使图形美观,通常使横轴与纵轴的长度比为 5:3。 b.以纵轴为次数的量尺,按比例等间隔地标出刻度。 c.横轴代表测验分数的量尺,也按适当的比例等间隔地标出次数分布中各组的组中值。 d.一般说来,纵轴和横轴的尺度比例不一样。纵轴刻度往往从 0 开始,而横轴刻度则
2
K 1.87(N1)5
公式中的 N 为数据个数。 ②注意 事先计划的组数可能与实际分组时因考虑组距取整以及最低一组的起点位置不同而略 有差异,这种差异是正常的,最终结果应以实际划归的组数为准。 (3)定组距 组距用符号 i 表示,其一般原则是取奇数或 5 的倍数,如 1,3,5,7,9,10……等等。 具体的取值过程可通过全距 R 与组数 K 的比值来取整确定。 (4)写出组限 组限是每个组的起始点界限。例如,表 1-1 中列出的就是关于组限的几种不同表述方式。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第八章X2检验(卡方检验)
一、基本概念
(一)X2检验[一级]
X2检验是一种非参数检验方法,适用于心理研究中的计数数据(即命名变量),应用卡方检验分析计数数据时,对计数数据总体的分布形 态不作任何假设,它能处理一个因素两项或多项分类的实际观察频数与理论频数分布是否相一致问题,或说无显著差异问题。
又称为列联 表分析或交叉表分析、百分比检验等。
(二)实际频数[一级]
简称实计数或实际数,是指在实验或调查中得到的计数资料,又称为观察频数。
(三)理论次数[一级]
是指根据概率原理、某种理论、某种理论次数分布或经验次数分布计算出来的次数,又称为期望次数。
二.简述X2检验的主要用途
卡方检验主要可以用于处理计数数据的拟合问题。
具体说,它可以检验单变量多项分类上的实计数和理论次数分布之间的差异显著性,称 为配合度检验;也可以检验两个变量各项分类上的次数之间是否存在显著关联,称为独立性检验。
卡方检验主要是处理计数费 法,由于其对数据的分布不像参数检验那样通常要求正态,因此也被认为属于非参数检验法。
三;X2检验的假设(使用条件)卡方检验的适用条件[苏大15]卡方检验的假定与限定。
[一级「 (1)分类相互排斥,互不包容:检验中的分类必须相互排斥,这样每一个观测值就会被划分到一个类别或另一个类别之中。
(2)观测值相互独立:各个被试的观测值之间彼此独立,这是X2检验最基本的一个假定。
在实验研究中,让观测值的总数等于实验中不同 被试的总数,要求每个被试只有一个观测值,这是确保观测值相互独立最安全的做法。
(3)期里次数的大小:为了努力使X2分布成为X2值合理准确的近似估计,每一个单元格中的期望次数应该至少在5个以上。
拟合度(配合度)检验、独立性检验、同质性检验。
广型合度检验
Q )拟合度检验的定义
拟合度检验的定义:
即总体分布的假设检验,也称为总体分布的拟合优度检验,简称拟合度检验、拟合检验,也称为无差假说检验。
拟合度检验的主要原理是借助X2统计量的实得指标来考察实际观测次数fO 与某一理论假定下的次数fe 之间的差异是否显著。
若两者的差 异越小,检验的结果越不容易达到显著性水平;两者的差异越大,检验的结果越可能达到显著性水平。
拟合度检验主要用途是用来检验一个因素多项分类的实际观察数与某理论次数是否接近,这种X2检验方法有时也称为无差假说检验。
(2)拟合度检验的用途
主要用来检验一个因素多项分类的实际观察数与某理论次数是否接近,由于它检验的内容仅涉及一个因素多项分类的计数资料,也算是单 因素检验。
这里主要是考虑某总体分布和某种分布相符合,不涉及总体参数的问题。
所以卡方检验的本质就是检验实测次数与期望次数是 否一致。
应拟合度检验的应用
[1]检验无差假设:[各项分类间的概率相等,理论次数=总数x1/(分类项数)]。
[2]检验假设分布的概率:[如,观测次数是否按某种概率分布,某因素各项分类的次数分布是否正态]。
(二)独立性检验 的统计方
X2检验的类别。