第六章教育统计学

合集下载

教育与心理统计学 第六章 方差分析五 重复测量实验设计的方差分析考研笔记-精品

教育与心理统计学  第六章 方差分析五 重复测量实验设计的方差分析考研笔记-精品

第六章方差分析(五)[测量实验设计的方差分析一、重复测量的方差分析(一)重复测量实验设计的相关含义⑴重复测量实验设计的定义又叫:被试内设计、受试者内设计、单组实验设计、相关样本设计。

是每个被试或每组被试必须接受自变量的所有情况的处理(每个被试接受所有的实验处理水平或处理水平的结合)。

由于被试的行为是重复测量的,所以被试内实验设计也称重复测量实验设计。

(2)重复测量设计的基本原理每个被试者参与所有的实验处理,然后比较相同被试者在不同处理下的行为变化。

这种实验设计下的同一被试者既为实验组提供数据,也为控制组提供数据。

因此,被试者内设计无需另找控制组的被试者。

被试内设计不但节省了被试人数,而且不同组的被试个体差异也得到了最好的控制,被试内设计比被试间设计更有力,能更好的考察实验组和控制组之间的差异,这个优点使得许多研究者更倾向于使用被试内设计。

和被试间设计相反,被试内设计不会受到来自被试个体差异的困扰但却必需面对实验处理之间相互污染的问题。

可以采用平衡技术来控制这些差异。

(3)使用重复测量设计的主要目的重复测量实验设计的目的是所有被试自已做控制,使被试的各方面特点在该因素所有水平上保持恒定,克服被试间设计中存在的被试不同质的问题,以最大限度地控制由被试的个体差异带来的变异。

如果实验者主要想研究一个被试者对实验处理所引起的行为上的变化,一般可以考虑采用被试者内设计。

(二)重复测量实验设计的方差分析的条件重复测量实验设计方差分析是一般方差分析的深化,也具有正态性、变异的可加性和方差齐性等先决条件,还要求各重复测量数据组成的协方差矩阵满足球形性假设。

博克斯指出,若球状性假设得不到满足,则方差分析的F值是有偏的,会增加犯I类错误的可能。

(三)重复测量实验设计的方差分析的过程①建立检验假设;②计算离差平方和与均方;③进行F检验;④列出方差分析表。

二、单因素重复测量的方差分析(一)重复测量实验设计的基本方法实验中每个被试接受所有的处理水平。

教育与心理统计学第六章:概率分布

教育与心理统计学第六章:概率分布
生活中有很多这样的事例
举例:
1、我们队将可能赢得今晚的这场比赛。 2、今天下午下雨的机会有40%。 3、这个冬天的周末我很可能有个约会。 4、我有50比50的机会通过今年的英语四
级考试。
概率的分类
1、后验概率(empirical definition of Probability)
以随机事件A在大量重复试验中出现的稳定频率值作 为随机事件A的概率估计值,这样求得的概率称为 后验概率。
进行推论,从而确定推论正确或错误的概率。
一、正态分布及渐近正态分布
(一)样本平均数的分布
1、总体分布为正态, δ2已知,样本平均数 的分布为正 态分布
标准误,即样本均数的标准差,是描述均数抽样分布的 离散程度及衡量均数抽样误差大小的尺度,反映的是 样本均数之间的变异。
标准误用来衡量抽样误差。标准误越小,表明样本统计 量与总体参数的值越接近,样本对总体越有代表性, 用样本统计量推断总体参数的可靠度越大。
第六章 概率分布
第一节 概率的基本概念 第二节 正态分布 第三节 二项分布 第四节 样本分布
第一节 概率的基本概念
一、什么是概率 随机现象(或随机事件)——在心理学研究中,通过实
验、问卷调查所获得的数据,常因主试、被试、施测 条件等因素的随机变化而呈现出不确定性,即使是相 同的被试在相同的观测条件下,多次重复测量结果也 还是上下波动,我们一般都无法事先确定每一次测量 的结果。 概率(probability):随机事件出现可能性大小的客观 指标
2、计算概率时 ,每一个正态分布都需要有自己 的正态概率分布表,这种表格是无穷多的
3、若能将一般的正态分布转化为标准正态分布, 计算概率时只需要查一张表
(三)标准正态分布表的编制与使用

教育统计学

教育统计学

第一章绪论一、什么是教育统计学1.什么是统计学统计学是研究统计原理和方法的科学。

它是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。

统计学的分为数理统计学和应用统计学两类。

2.什么是教育统计学教育统计学是运用数理统计的原理和方法研究教育问题的一门应用科学。

教育统计学的主要任务是研究如何搜集、整理、分析由教育调查和教育实验等途径所获得的数字资料,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律。

3.统计学和教育统计学的内容(1)描述统计对已获得的数据进行整理、概括,显现其分布特征的统计方法,称为描述统计。

包括归组、编表、绘图等数据整理工作和计算各种特征量反映其分布特征。

(2)推断统计根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上对总体分布特征进行估计、推测,这种统计方法称为推断统计。

包括总体参数估计和假设检验两部分。

(3)实验设计实验者为了揭示实验中自变量与因变量的关系,在实验之前所制订的实验计划,称为实验设计。

包括抽样设计、样本容量计算、确定实验对照形式、实现实验组和对照组的等组化、安排实验因素、控制无关因素以及用什么统计方法处理及分析实验结果等等。

(4)三者的关系描述统计是推断统计的基础,推断统计通过样本信息估计、推测总体,从已知情况估计、推测未知情况。

良好的实验设计才能使我们获得真实的有价值的数据,对这样的数据进行统计处理才能得出正确的结论。

二、统计学中的几个基本概念与符号1.随机变量(1)随机现象与随机事件:随机现象具有以下三个特征:一次试验有多种可能结果,其所有可能结果是已知的;试验之前不能预料哪一种结果会出现;在相同的条件下可以重复试验。

随机现象的每一种结果叫做一个随机事件。

(2)随机变量:这些随机事件在一次试验中,可能出现,也可能不出现,而在大量重复试验中,它们的发生却具有一定的规律性。

我们把能表示随机现象各种结果的变量称为随机变量。

王孝玲《教育统计学》第六章课后练习题超详细解答步骤

王孝玲《教育统计学》第六章课后练习题超详细解答步骤

15 答: 错误:拒绝了属于真实的零假设,犯这类错误的可能性的大小为α值的大小。通过选择 适当的显著性水平加以控制,加大保留区范围。 错误:保留了属于不真实的零假设,犯这类错误的可能性的大小为β值的大小。(1)利
用已知的实际总体参数值有假设参数之间的大小关系,合理安排拒绝区的位置,尽量减小 β值;(2)将样本容量增大,这样的话,形态高狭,两侧面积小,β值小。 16 答: 采用右侧检验,控制β 错误的发生。 H0:µ ≤ ,H1:µ > 3

7䁤 − 7 䁤 − 䁤 = =− 䁤 8 䁤4 䁤 4 − 朴− 根据假设,采用双侧检验 显著性水平临界值为 t(14)0.05=2.145, t(14)0.01=2.977
由于|t|= 䁤 8 < 2.145= t(14)0.05 , P>0.05,因此保留 H0 假设,拒绝 H1 假设,即该校测验成绩与全 区之间没有显著差异。 20. 答: 由于总体标准差未知,且样本容量小 n<30,因此可按 t 分布计算 ≥ 朴 䁤8,H1: 提出假设 H0: 计算统计量 t = 49䁤朴, = 7䁤8,n= 28,μ = 朴 䁤8 < 朴 䁤8
由于总体标准差未知,且样本量小 n<30, 因此置信区间可按 t 分布计算
=(92+94+96+66+84+71+45+98+94+67)/10= 807/10=80.7
P 8 䁤7 −
P

t 䁤 朴
9 䁤 朴
7䁤
<μ<
< μ < 8 䁤7 + 4
+
t 䁤 朴 9 䁤 朴
7䁤

《教育统计学》优秀教案

《教育统计学》优秀教案

《教育统计学》优秀教案教案概述:本教案旨在帮助学生掌握教育统计学的基本概念、原理和方法,培养学生运用统计学知识分析和解决教育问题的能力。

通过本课程的学习,学生将能够熟练运用教育统计学方法对教育数据进行收集、整理、分析和解释,为教育决策提供科学依据。

教学目标:1. 了解教育统计学的基本概念、原理和方法;2. 掌握教育统计学的基本技能,如数据收集、整理、分析和解释;3. 能够运用教育统计学方法解决实际教育问题;4. 培养学生的逻辑思维能力和实证研究能力。

教学内容:1. 教育统计学的基本概念和术语;2. 教育统计学的基本原理和方法;3. 教育数据的收集和整理;4. 描述性统计分析;5. 推断性统计分析;6. 教育统计软件的使用。

教学过程:1. 导入:通过引入实际教育问题,引发学生对教育统计学的兴趣和思考;2. 讲解:讲解教育统计学的基本概念、原理和方法,结合实际案例进行说明;3. 实践:让学生运用教育统计学方法解决实际问题,如分析学生成绩、教育质量等;4. 讨论:分组讨论,分享各自的结果和心得,互相学习和交流;5. 总结:总结本节课的重点内容,强调注意事项和操作技巧;6. 作业:布置相关练习题,巩固所学知识。

教学评价:1. 课堂参与度:观察学生在课堂上的发言和提问情况,评估学生的积极性;2. 练习完成情况:检查学生完成的练习题,评估学生对知识的掌握程度;3. 小组讨论:评估学生在小组讨论中的表现,包括合作态度、沟通能力和创新思维;4. 课后作业:评估学生完成的课后作业,检查学生对课堂内容的消化和运用能力。

教学资源:1. 教材:选用权威、实用的教育统计学教材;2. 课件:制作精美、清晰的课件,辅助讲解;3. 案例:收集实际教育问题案例,用于分析和讨论;4. 教育统计软件:安装并提供学生使用的教育统计软件,如SPSS、EXCEL等;5. 网络资源:提供相关的网络资源,如学术文章、视频教程等,供学生自主学习。

教育与心理统计学 第六章 方差分析考研笔记-精品

教育与心理统计学  第六章 方差分析考研笔记-精品

第六章方差分析第一节方差分析概述一.方差分析的定义[用途]定义:用途方差分析也称为变异数分析,是在教育与心理研究中最常用的变量分析方法,其主要功能在于分析测量或实验数据中不同来源的变异对总变异的贡献大小,从而确定测量或实验中因素对反应变量是否存在显著影响。

即用于置信度不变情况下的多组平均数之间的差异检验。

它既可以比较两个以上的样本平均数的差异检验,也可以应用于一个因素多种水平以及多个因素有多种水平的数据分析。

二.方差分析的作用方差分析主要应用于两种以上实验处理的数据分析,同时匕徽两个以上的样本平均数,推断多组资料的总体均数是否相同,也即检验多组数据之间的均数差异是否有统计意义。

在这个意义,也可以将其理解为平均数差异显著性检验的扩展。

当我们用多个t检验来完成这一过程时,相当于从t分布中随机抽取多个t值,这样落在临界范围之外的可能大大增加,从而增加了I型错误的概率,我们可以把方差分析看作t检验的增强版。

方差分析一次检验多组平均数的差异,降低了多次进行两组平均数检验所带来的误差。

在进行方差分析时,设定的假设是综合虚无假设,即假设样本所归属的所有总体的平均数都相等。

如果检验的结果是存在显著性差异,只能说明多组平均数之间存在显著性差异,但是无法确定究竟哪些组之间存在显著性差异,此时需要运用事后检验的方法来确定。

三.方差分析的相关概念一(一)数据的变异(1)变异:统计中的变异是普遍存在的7一般意义上的变异是指标志(包括品质标志和数量标志)在总体单位之间的不同表现。

可变标志的属性或数值表现在总体各单位之间存在的差异,统计上称之为变异,这是广义上的变异,即包括了品质标志和数量标志,有时仅指品质标志和在总体单位之间的不同表现。

注:随机性,即变异性。

(2)组间变异[组间差异]:组间变异表示处理间变异,主要指由于接受不同的实验处理(实验处理效应)而造成的各组之间的变异,可以用两个平均数之间的离差来表示,可将组间离差平方和记为SS AO组间差异可用组间方差来表征,用符号MS B表示。

教育统计学定义

教育统计学定义

教育统计学定义教育统计学是一门研究教育现象的数量特征和规律的学科,它运用数理统计方法对教育数据进行分析和研究,旨在为教育决策提供科学依据。

教育统计学广泛应用于各级各类教育机构、政府部门、社会组织等领域,为教育管理、政策制定、评估和研究提供重要支持。

一、教育统计学的概念和背景1. 教育统计学的概念2. 教育统计学的发展历程3. 教育统计学的研究内容二、教育数据的收集与处理1. 教育数据来源及其特点2. 教育数据收集方法3. 教育数据处理方法三、统计分析在教育中的应用1. 描述性统计分析在教育中的应用2. 探索性因子分析在教育中的应用3. 方差分析在教育中的应用四、国内外主要教育统计指标及其解释1. 国内外主要基础教育指标及其解释2. 国内外主要高等教育指标及其解释3. 教育经费指标及其解释五、教育统计学的应用与挑战1. 教育决策中的应用2. 教育评估中的应用3. 教育研究中的应用4. 教育统计学面临的挑战六、结论一、教育统计学的概念和背景1.教育统计学的概念教育统计学是一门研究教育现象的数量特征和规律的学科。

它通过运用数理统计方法对教育数据进行分析和研究,从而为教育管理、政策制定、评估和研究提供科学依据。

简单来说,教育统计学就是将数理统计方法运用到教育领域,对各种与教育相关的数据进行收集、整理、分析和解释。

2.教育统计学的发展历程早在19世纪初期,就有人开始使用数理方法对各种社会现象进行分析和研究。

但是,直到20世纪初期,才出现了专门研究社会现象数量特征和规律的学科——统计学。

随着教育事业的发展,人们开始意识到教育数据的重要性,并逐渐将统计学方法运用到教育领域,从而形成了教育统计学。

20世纪50年代后期,随着电子计算机技术的发展,人们可以更加方便地处理大量数据,这进一步推动了教育统计学的发展。

现在,教育统计学已经成为一门独立的学科,并广泛应用于各级各类教育机构、政府部门、社会组织等领域。

3.教育统计学的研究内容教育统计学主要研究以下内容:(1)教育数据的收集和处理方法;(2)教育数据的描述性分析方法;(3)探索性因子分析方法;(4)方差分析方法;(5)教育指标体系及其解释;(6)教育决策、评估和研究中应用数理统计方法。

教育与心理统计学 第六章 方差分析六 多因素方差分析、事后检验、协方差分析、统计功效与效果量、重要

教育与心理统计学  第六章 方差分析六 多因素方差分析、事后检验、协方差分析、统计功效与效果量、重要

第六章方差分析(六)第五节多因素方差分析一、多因素方差分析的定义多因素方差分析是用来研究两个及两个以上控制变量是否会对观测变量产生显著影响。

多因素方差分析不仅能够分析多个因素对观测变量 的独立影响,更能够分析多个控制因素的交互作用是否对观测变量的分布产生显著影响,进而最终找到利于观测变量的最优组合。

多因素 方差分析包括完全随机设出随机区组设计。

二、平均数差异检验、单因素方差分析、多因素方差分析比较当需要比较两个以上平均数的差异时,要使用单因素方差分析,而不进行多次平均数差异检验,这样就可以降低统计误差。

如果单次进行 平均数比较率,即显著性水平是a ,进行两两平均数比较的次数是N ,多次两两平均数差异的错误率:P N =l-(l-a)n o 同理多因素方差由于 同时进行两个因素以上的方差分析,亦能降低统计误差,同时,也能处理交互作用。

第六节事后检验(多个平均数之间的比较)一、事后检验[事后多重比较]事后检验的定义:方差分析所要检验的零假设是所有k 个处理的总体平均数没有显著性差异,相应的备择假设是k 个处理中至少有2个处 理的总体平均数之间存在显著差异。

但方差分析不拒绝零假设时,表明至少有2个处理的总体平均数不等,若方差分析F 检验的结果表明 差异显著就必须对各实验处理组的多对平均数进一步分析,做深入比较,判断究竟哪一对或哪几对的差异显著,确定两变量关系的本质。

事后检验也被称作事后多重比较,在这也叫做多个平均数之间的比较。

事后检验的目的:当方差分析表明一个主效应显著时,它只能提供几个变量之间是否存在显著差异的结果,又因为多重t 检验会使得I 型 错误发生的概率大大增加[吃1-Q :业L 因而我们只能采取事后检验。

二、事后检验的方法[1]N-K 法,也叫q 检验法;[2]HSD 检验(又叫Turkey 真实检验,更敏感,统计检验力更强,要求各组容量相等);[3]Scheffe 检验(匕啜保守,适用于样本容量不等,最大限降低了第一类误差a 水平,可能最安全);⑷费舍的最小显著差异法(LSD);一、协方差分析协方差分析的定义:协方差表示的是交互效应项,将处理引起的变异分解为处理在变量x 上引起的变异、在变量y 上引起的变异和在交互效应项xy 上引起的 变异。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第六章 抽样分布及总体平均数的推断教学目的:通过本章学习,同学们应理解抽样分布、小概率事件、显著性水平、统计推断的两类错误等基本概念,并熟练掌握总体参数估计和总体平均数的显著性检验的方法。

第一节 抽样分布一、抽样分布的基本概念三种不同性质的分布:1.总体分布:总体内数据的频数分布;2.样本分布:样本内数据的频数分布;3.抽样分布:某种统计量的概率分布。

平均数的抽样分布:从某一总体中抽出的,容量为n 的一切可能样本平均数的分布。

【如】:样本平均数的抽样分布、相关系数的抽样分布。

二、平均数抽样分布的几个定理1.从总体中随机抽出容量为n 的一切可能样本平均数之平均数等于总体平均数。

)()(1.6μ=X EE 表示平均的符号.2.容量为n 的样本平均数在其抽样分布上的标准差,与总体标准差成正比,与样本容量n 的方根成反比。

)(2.6nx σσ=x σ:是平均数抽样分布上的标准差(一般称作平均数的标准误)。

3.从正态总体中,随机抽取的容量为n 的一切可能样本平均数的分布也呈正态分布。

4.虽然总体不是正态分布,如果样本容量n 很大,平均数的抽样分布也近似正态分布。

※:标准误越小,表明统计量与参数值越接近。

三、样本平均数与总体平均数离差统计量的形态1.总体为正态分布,总体标准差σ已知时,平均数的离差统计量呈标准正态分布。

可写作)(3.6nX Z σμ-=2.总体为正态分布,但总体σ未知,平均数的离差统计量呈t 分布。

(1)总体标准差的估计量:)(14.6xn nS σ⋅-=。

:为贝塞尔氏校正系数.1-n n(2)平均数的标准误的估计量:)(1/15.6-=⋅-==n n n nnS S x x X σσ(3)平均数的离差统计量:)(16.6--=-=n X S X t x Xσμμ注:。

而变化和随着x X t σ(4)t 分布的特点① 单峰对称,曲线与基线永不相交; ② t 值有正有负,也可为零;③ t 分布是随d f =n -1而变化的一簇分布; 参看教材86页。

图例6.1和表6.1图6.1 自由度为1,2,5, t 分布曲线与正态曲线比较图表6.1 中央面积为0.95不同自由度t 的临界值自由度2 4 6 20 30 ∞ t 值 ±4.30±2.78±2.45±2.09±2.04±1.96中央面积不变,d f 不同,t 的临界值不同。

d f 无限大时t 分布与正态分布重合。

※ 自由度:公式(6.6)中的n -1统计学中称为自由度(用d f 表示,即d f =n -1)。

自由度:是指总体参数估计量中变量值能独立自由变化的个数。

【例如】:中,1)()(1122--=-⋅-=⋅-=∑∑n x x nx x n n n nS x δ 。

可以自由变化个的限制,只有因受到)(10)(x x n x x --=-∑第二节总体平均数的估计推断统计有两种形式:参数估计和假设检验。

一、总体平均数估计的基本原理1.点估计点估计:用一个样本统计量的值估计出一个具体的总体参数值,就称作点估计。

如把样本平均数当作总体平均数。

点估计的评价标准:(1)无偏性:一切可能样本统计量与总体参数的离差和为零。

【如】:∑=-的无偏估计量。

该统计量就为总体参数,0)(μxx :为无偏估计量,x σ:为有偏估计量。

所以x n ns σ•-=1(2)有效性:当总体参数不止有一种无偏估计量时,某一统计量的一切可能样本值的方差小者为有效性高,方差大者为有效性低。

【如】:x 的有效性高, M 0、M d 的有效性低。

(3)一致性:当n 无限增大时,估计量的值越来越接近它所估计的总体参数值,则这种估计量是总体参数的一致性估计量。

注:点估计既不能指明估计误差大小,也不能说明正确估计的概率大小。

2、区间估计(1)区间估计:是指以统计量的抽样分布为理论依据,按一定概率要求,由样本统计量的值估计出总体参数值的所在范围。

(2)平均数区间的估计原理:当总体σ已知时,根据平均数抽样分布定理,在95%的置信度上估计:)()(7.695.096.196.1=<-<-nx P σμ将括号内的不等式整理可得:)()(8.695.096.196.1=+<<-nX nX P σμσnX nX σσ96.196.1+-为置信下限,为置信上限。

的区间估计已知条件下总体平均数二、σ。

可按标准正态分布处理较大)时,(或总体不呈正态,但已知,总体为正态分布n σ【例】:某区高一学生的英语统考成绩的标准差为6分,从此次考试的试卷中随机抽出100份试卷,算得平均分为71分。

试求全区平均成绩的95%和99%的置信区间:解:∵布估计,所以可按标准整态分已知,且总体为正态,30100>=n σ1.95%的置信区间为:95.018.7282.6995.0100696.171100696.17195.096.196.1)()()(=<<=⨯+⨯-=+<<-<<μσμσμP P nX nX P2. 99%的置信区间为:99.058.258.2)(=+<<-nX nX P σμσ99.0)55.7245.69(99.0)100658.271100658.271().58.299.0(==⨯+⨯-±<<<<μμP P Z 时临界值为分布下中央面积为※:置信度越高,置信区间就越大。

三、σ未知条件下总体平均数的区间估计1.基本原理当σ已知时,用Z 估计;当σ未知时,其原理与σ已知时基本相同,只是临界值不固定。

95%置信度的临界值可写作:t (df )0.05/2;99%置信度的临界值可写作:t (df )0.01/2。

)()()()(11.699.010.695.02/01.0)(2/01.0)(2/05.0)(2/05.0)(=⋅+<<⋅-=⋅+<<⋅-X df X df X df X df S t X S t X P S t X S t X P μμXS 为标准误,有不同的计算公式。

公式的三种不同形式2.小样条件下的估计【例】:某研究人员对红星小学五年级学生进行智力测查,从测查结果中随机抽出16个学生的智力分数,求得平均智力为106分,标准差为5分,试计算该校五年级学生智力分数的99%的置信区间.分布估计。

,所以应按未知,且解:总体为正态,t n 3016<=σ99%的置信区间为:99.082.10918.10299.0116596.2106116596.210696.2116599.0)()(1)(2/01.0)15()(2/01.0)(=<<=-⨯+<<-⨯-∴=-=-==⋅+<<⋅-μμσμP P t n S S t X S t X P xX X df X df 且查表知,)(12.6nS S X =)(113.6-=n S xX σ)()1(/)(14.622--=∑∑n n n X X S X页。

请参看教材:表示样本的标准差。

:表示样本容量;计量;:表示总体标准差的估9190-x n S σ我们有99%的把握说该校五年学生的平均智力在102.18至109.82之间. 3.大样本条件下的估计总体为正态,σ未知,但n 较大,t 分布接近z 分布,在这种条件下,既可按t 分布估计,也可按z 分布估计。

t 估计准确性高,而z 估计简便。

【例】:从某大学的四级英语试卷中随机抽出200份,算出7,68==x X δ。

求该校四级英语平均成绩的95%的置信区间。

%的置信区间为:分布估计,,可按但未知当9530200,Z n >=σ95.096.196.1)11(=-+<<--n X n X P xxσμσ95.0199796.168199796.168)(=⨯+<<⨯-μP95.0976803.67).(=<<μP:。

中也可不减11-n第三节假设检验的基本原理以平均数为例,看假设检验的基本原理。

从已知总体抽出的容量为n 的一切可能样本的平均数形成的分布如右图,现有一个随机样本,其平均数为X ,这个样本是来自0μ这一已知总体吗?原理,视其在以0μ为中心的平均数抽样分布上出现的概率大小而定。

若样本平均数在抽样分布中出现的概率较大,则认为样本所属总体和已知总体为同一总体;若样本在抽样分布中出现的概率较小,则认为样本所属总体与已知总体有显著性差异。

一、假设假设有两种:研究假设和统计假设统计假设:是指对样本所属总体的参数水平或分布形态的推测。

假设检验中一般有两个相互对立的假设:零假设(虚无、消解假设)和备择假设(期望假设),分别用H0和H1表示。

零假设的实质:无差异。

备择假设的实质:有差异。

假设检验是从零假设出发的。

二、小概率事件样本统计量的值在其抽样分布上出现的概率小于或等于事先规定的水平,则该事件就为小概率事件。

小概率事件是否发生,是对零假设做出取舍的依据。

三、显著性水平统计学中把拒绝零假设的概率称为显著性水平,用α表示。

常用α=0.05和α=0.01两个水平。

显著性水平与α值成反序关系。

单侧与双侧(参看教材96页)。

四、统计决断的两类错误1、I型错误:零假设为真而被拒绝。

这类错误也称α错误。

2、Ⅱ型错误:零假设为假而被保留,即备择假设为真而被拒绝(参看教材117页图6.3b)。

这类错误也称β错误。

3、减少两类错误的方法减小α值,会增大β值。

(1)α错误由研究者对差异标准的要求决定。

(2)在α值不变的情况下,减小β错误的方法有两种:一是合理安排拒绝区域;二是增大样本容量。

用图示说明。

第四节总体平均数的显著性检验根据一个样本信息推断样本所属总体与已知总体是否有差异的检验就称为平均数的显著性检验。

检验的基本过程:1.提出假设;三种常见的假设形式:(1)00:μμ=H01:μμ≠H (2)00:μμ≤H01:μμ>H (3)00:μμ≥H 01:μμ<H2.选择检验统计量并计算其值;3.确定检验形式;4.统计决断。

一、σ已知条件下总体平均数的显著性检验【例】:某校初一年级英语测验的平均成绩为78分,标准差为7分。

实验班40名学生的平均成绩为79.5分,问实验班成绩与全年级的成绩有无显著性差异?检验:其值选择检验统计量并计算)()提出假设:(::27878110≠=μμH H假定总体为正态分布,总体σ已知,所以采用z 检验36.1407785.79=-=-=n X Z σμ(3)确定检验形式没有资料说明实验班的成绩过去是高于还是低于全年级的成绩,所以采用双侧检验。

(4)统计决断05.096.136.12/05.0||>∴=<=P Z Z因此,在0.05水平上保留零假设,拒绝备择假设,结论为实验班的成绩与全年级的成绩差异不显著。

相关文档
最新文档