《统计学—基于SPSS》((06)第6章 假设检验(S3)
【SPSS初级教程】6-1(假设检验概念和方法)

假设检验中的两类错误 (决策结果)
H0: 无罪 假设检验就好像一场审判过程
统计检验过程
陪审团审判
裁决
实际情况
之所以用零来修饰原假设,其原因是原假设 的内容总是没有差异或没有改变,或变量间 没有关系等等 零假设总是一个与总体参数有关的问题,所 以总是用希腊字母表示。关于样本统计量如 样本均值或样本均值之差的零假设是没有意 义的,因为样本统计量是已知的,当然能说 出它们等于几或是否相等
提出原假设和备择假设
什么是备择假设?(alternative hypothesis) 与原假设对立的假设,也称“研究假设” 研究者想收集证据予以支持的假设总是有不等号:
5. 建立的原假设与备择假设应为
6.
H0: = 10 H1:
10
双侧检验 (显著性水平与拒绝域 )
抽样分布
拒绝域
置信水平 拒绝域
a/2
1-
a/2
临界值
H0值
样本统计量 临界值
双侧检验 (显著性水平与拒绝域)
抽样分布
置信水平
拒绝域
拒绝域
a/2
1-
a/2
临界值
H0值 临界值 样本统计量
双侧检验 (显著性水平与拒绝域)
1. 总体参数的真值 随着假设的总体参数的减少而增大 2. 显著性水平 当 减少时增大 3. 总体标准差 当 增大时增大 4. 样本容量 n 当 n 减少时增大
什么是P 值? (P-value)
1. 是一个概率值 2. 如果原假设为真,P-值是抽样分布中大于或小于样本统计量的
spss假设检验

SPSS假设检验1. 简介SPSS(Statistical Package for the Social Sciences)是一种非常常用的统计软件,被广泛应用于社会科学研究中。
其中,假设检验是SPSS中常用的统计方法之一,用于验证研究者对总体或样本的某种假设。
2. 假设检验的概念假设检验是统计学中的一种重要方法,用于判断一个统计推断是否与样本数据一致。
在假设检验中,通常会提出一个原假设(H0)和一个备择假设(H1),然后根据样本数据对两个假设进行检验,以确定是否拒绝原假设,从而对总体进行推断。
3. SPSS中的假设检验SPSS中提供了丰富的假设检验方法,涵盖了多种统计推断的情况。
下面将介绍几种常见的假设检验方法。
3.1 单样本 t 检验单样本 t 检验用于判断一个样本的均值是否与一个已知的常数有显著性差异。
在SPSS中,进行单样本 t 检验的步骤如下:1.导入数据:在SPSS中打开或导入数据文件。
2.选择变量:选择要进行 t 检验的变量。
3.进行检验:选择菜单栏上的“分析”-“比较均值”-“单样本 t 检验”。
4.设置参数:选择相关的变量和检验参数,点击“确定”进行分析。
5.查看结果:SPSS将显示 t 检验的结果,包括均值、标准差、t 值、自由度和显著性等。
3.2 独立样本 t 检验独立样本 t 检验用于判断两个独立样本的均值是否存在显著性差异。
在SPSS中,进行独立样本 t 检验的步骤如下:1.导入数据:在SPSS中打开或导入数据文件。
2.选择变量:选择需要进行对比的两个变量。
3.进行检验:选择菜单栏上的“分析”-“比较均值”-“独立样本 t 检验”。
4.设置参数:选择相关的变量和检验参数,点击“确定”进行分析。
5.查看结果:SPSS将显示独立样本 t 检验的结果,包括均值、标准差、t 值、自由度和显著性等。
3.3 配对样本 t 检验配对样本 t 检验用于判断同一组个体在两个不同时间点或条件下的均值是否存在显著性差异。
SPSS-假设检验

Ⅰ类错误又称为 错误,就是把真实的
差异错判为是非真实的差异,即实际上H0正 确,检验结果为否定H0。犯Ⅰ类型错误的可
能性一般不会超过所选用的显著水平 ;
Ⅱ类错误又称为 错误 ,就是把非真实
的差异错判为是真实的差异 ,即实际上HA 正确,检验结果却未能否定H0 。 犯Ⅱ类型
错误的可能性记为 ,一般是随着 0 的 减小或试验误差的增大而增大,所以 0
越小或试验误差越大,就越容易将试验的真
实差异错判为试验误差。
显著性检验的两类错误归纳如下:
表3-1 显著性检验的两类错误
客观实际
H0 成立 H0 不成立 即 H1 成立
假设检验的结果
拒绝 H0
I 型错误( ) 推 断 正 确 (1 )
把这一检验结果表述为:“总体平均数
与0
u
差异显著 ”,在计算所得的 值的右上
方标记“*”;
u 若| |≥2.58,则说明试验的表面差异属
于试验误差的概率 p 不超过 0.01 ,即 p
≤0.01 ,表面差异属于试验误差的可能性更小,
应否定H0: ,接0受HA: 。统0 计学
上把这一检验结果表述为: “总体平均数
▪ 而在这一章中,我们所要做的工作是,先对要
研究的参数作一个假设,然后去检验这个假设 是否正确。因此假设检验对于所研究的参数总 是先有一个假设的值。
▪ 这也是这两种方法最基本的区别。
假设检验又叫显著性检验是统计学中的一 个重要内容 。
显著性检验的方法很多 ,常用的有u检
验、t检验、F检验和2检验等。尽管这些
反过来,如果要证明这个人说过 谎很容易,只要有一次被抓住就 足够了。
SPSS假设检验

SPSS假设检验实验⽬的::实验⽬的1、学会使⽤SPSS的简单操作。
2、掌握假设检验。
:实验内容:实验内容1.⼀个总体均值的检验(⼩样本);2.两个总体均值之差的检验;3.绘制正态概率图;4.S—W检验。
实验步骤: 1.⼀个总体均值的检验(⼩样本):单总体的Z检验和t检验。
设是取⾃正态总体的⼀个样本,要检验。
其中为已知的常数。
为了说明如何构造检验统计量和拒绝域,先看⼀个简单的情形。
设总体⽅差是已知的,记为,设为样本均值,则。
设为真,即,对作标准化,得到上述的Z就是要构造的检验统计量。
设定显著性⽔平为0.05,因为,的概率为0.05,所以检验的拒绝域是。
如果由样本计算得到,与⼩概率原理⽭盾,从⽽拒绝原假设。
在实际应⽤中,总体的⽅差是未知的。
因⽽需要样本⽅差代替总体⽅差,相应地,检验统计量编程了t统计量。
设与分别为样本的均值和样本⽅差,当为真时,可知统计量对于给定的显著性⽔平,检验的拒绝域是。
其中临界值满⾜条件。
它就是⾃由度为(N-1)的t分布的双侧分为点。
如果由样本观测值代⼊,计算得到的t值满⾜,则拒绝原假设。
SPSS检验结果不给出临界值,⽽是在给出t值的同时给出它的显著性概率(也成为p值或相伴概率,记为p或Sig)。
计算⼀个双侧检验问题,SPSS操作如下:“分析”→“⽐较均值”→“单样本T检验”,在打开的对话框中填好“检验变量”列表框和“检验值”⽂本框。
单击“确定”。
输出结果中的Sig.(双侧)就是p值。
⽐较p值与检验⽔准。
1 T-TEST2 /TESTVAL=803 /MISSING=ANALYSIS4 /VARIABLES=score5 /CRITERIA=CI(.95).⼀个总体的均值检验 差齐性检验:Sig=0.397>0.05,⽅差不显著,可以认为两个独⽴样本的⽅差⼀致。
均值之差t检验:在⽅差相等的条件下,Sig=0.004<0.05,均值之差显著,可以认为两个独⽴样本均值有显著差异。
SPSS假设检验

SPSS数据统计分析与实践主讲:周涛副教授北京师范大学资源学院2007 -10 -16教学网站:/Courses/SPSS第六章假设检验(Hypothesis Testing)本章内容:一、单样本假设检验z基本统计原理z SPSS应用实例二、独立双样本假设检验z基本原理z SPSS应用实例三、配对双样本假设检验z基本原理z SPSS应用实例几个基本常识z统计分析常常采取抽样的研究方法。
即从总体中抽取一定数量的样本进行研究来推论总体的特征。
z由于总体中的每个个体间存在差异,即使严格遵守随机抽样原则也会有样本统计量与总体参数之间有所不同。
z实验者测量技术的差别或测量仪器精确程度的差别等也会造成一定的偏差,使样本统计量与总体参数之间存在差异。
几个基本常识Cont. z均值不相等的两个样本不一定来自均值不同的总体?(从均值相等的总体等抽样的均值可能不相等,这是抽样造成的)z两个样本的均值不同,其差异是否具有统计意义,能否说明总体差异?(只有样本均值的差异具有统计意义时,才能推断总体均值有差异)z校验假设的基本思想是统计学的“小概率反证法”一、单样本假设检验z基本统计原理z SPSS应用实例单样本假设检验的用途z The goal in a one-sample t test is to test if the mean ofa single sample differs from a hypothesized populationvalue.z e.g. You read that in the U.S., the average IQ is 100and you know that the average IQ for your coworkers is127.5. Are you coworkers smarter than the averageperson in the U.S.?z To answer this type of question in SPSS, request a one-sample t test to compare the mean of the sample IQvalue with the constant 100.单样本假设检验的基本统计原理主要内容:•Hypothesis Testing Methodology (假设检验的方法论)•Z Test for the Mean (σ Known) (Z检验方法,σ已知)•p-Value Approach to Hypothesis Testing(P-值检验方法)•t Test of Hypothesis for the Mean (t检验方法)z A hypothesis is an assumption about the population parameter.z A parameter is a Populationmean or proportionz The parameter must beidentified before analysis.I assume the mean GPA(总平均成绩) of this class is 3.5!What is a Hypothesis?The Null Hypothesis (零假设),H0z States the Assumption (numerical) to be testede.g. The average # TV sets in US homes is atleast 3(H: µ ≥3)z Begin with the assumption that the nullhypothesis is TRUE.(Similar to the notion of innocent until proven guilty)•Refers to the Status Quo (现状)•Always contains the‘= ‘sign•The Null Hypothesis may or may not be rejected.z Is the opposite of the null hypothesise.g. The average # TV sets in US homes isless than 3(H 1: µ< 3)z Challenges the Status Quo (现状)z Never contains the ‘=‘signz The Alternative Hypothesis may or may not be accepted The Alternative Hypothesis (备择假设),H 1Identify the ProblemSteps:z State the Null Hypothesis (H0: µ≥3)z State its opposite, the Alternative: µ< 3)Hypothesis (H1z Hypotheses are mutually exclusive (互斥的)&exhaustive(无遗漏的)z Sometimes it is easier to form thealternative hypothesis first.PopulationAssume the populationmean age is 50.(Null Hypothesis)REJECT The Sample Mean Is 20SampleNull Hypothesis50?20=≅=µX Is Hypothesis Testing ProcessNo, not likely!Sample Meanµ= 50Sampling DistributionIt is unlikely that we would get a sample mean of this value ...... if in fact this were the population mean.... Therefore, we reject the null hypothesis thatµ= 50.20H 0Reason for Rejecting H 0zDefines Unlikely Values of Sample Statistic if Null Hypothesis Is TruezCalled Rejection Region of Sampling DistributionzDesignated α(alpha)zTypical values are 0.01, 0.05, 0.10z Selected by the Researcher at the Start zProvides the Critical Value(s)of the TestLevel of Significance,α(临界值)Level of Significance,α and the Rejection RegionH 0:µ≥3 H 1: µ< 30H 0: µ≤3 H 1: µ> 3H 0: µ= 3 H 1: µ≠3ααα/2Critical Value(s)Rejection RegionsErrors in Making Decisionsz Type I Errorz Reject True Null Hypothesisz Has Serious Consequencesz Probability of Type I Error Isαz Called Level of Significance(显著性水平)z Type II Errorz Do Not Reject False Null Hypothesis(没有拒绝错误的零假设)z Probability of Type II Error Is β(Beta)α &β Have anInverse RelationshipReduce probability of one errorand the other one goes up.βαzConvert Sample Statistic (e.g., ) to Standardized Z VariablezCompare to Critical Z Value(s)zIf Z test Statistic falls in Critical Region , Reject H 0; Otherwise Do Not Reject H 0Z-Test Statistics (σ Known)Test StatisticX nX X Z XXσµσµ−=−=p Value Testz Probability of Obtaining a Test Statistic More Extreme than Actual Sample Value Given H0 Is Truez Called Observed Level of Significancez Smallest Value of a H0Can Be Rejectedz Used to Make Rejection Decisionz If p value ≥α,Do Not Reject H0z If p value <α, Reject H01.State H 0H 0:µ ≥32.State H 1H 1: µ < 33.Choose αα= .054.Choose n n = 1005.Choose Test:Z Test (or p Value)Hypothesis Testing: StepsTest the Assumption that the true mean # ofTV sets in US homes is at least 3.6. Set Up Critical Value(s)Z = -1.6457. Collect Data100 households surveyed 8. Compute Test Statistic Computed Test Stat.= -29. Make Statistical Decision Reject Null Hypothesis10. Express DecisionThe true mean # of TV set is less than 3 in the US households.Hypothesis Testing: StepsTest the Assumption that the average # ofTV sets in US homes is at least 3.(continued)zAssumptionsz Population is normally distributedz If not normal , only slightly skewed & a large sample taken zParametric test procedurezt test statistict-Test: σ UnknownnSX t µ−=Example: One Tail t-TestA random sample of 36boxes showed X = 372.5, and S =15. Test at the α=0.01level.368 gm.H 0: µ ≤368 H 1: µ >368σ is not given,Does an average box of cereal contain more than 368grams of cereal?z α = 0.01z n = 36, df= 35z Critical Value: 2.4377Test Statistic:Decision:Conclusion:Do Not Reject at α = .01No Evidence that True Mean Is More than 368Z02.4377.01Reject Example Solution: One TailH 0: µ ≤368 H 1: µ >36880.136153685.372=−=−=nSX t µSPSS单样本T检验实例SPSS单样本T检验实例A manufacturer of high-performance automobiles produces discbrakes (盘式制动器)that must measure 322 millimeters(毫米)in diameter. Quality control randomly draws 16 discs made by each of eight production machines(总计128个观测量)and measures their diameters.Use One Sample T Test to determine whether or not the mean diameters of the brakes in each sample significantly differ from 322 millimeters.A nominal variable, Machine Number, identifies the productionmachine used to make the disc brake. Because the data from each machine must be tested as a separate sample, the file must first be split into groups by Machine Number.数据文件:brakes.sav操作步骤1. 以变量“Machine Number”分割文件操作步骤2. 调用“One-Sample T Test”过程操作步骤3. 在One-Sample T Test的主对话框中输入要检验的变量,并输入要检验的值(322),并在“Options”中设置置信区间(90%)操作步骤4. 对输出结果进行解释One-Sample Test-.53315.602-.0014858-.006375.0034045.33615.000.0142629.009577.018948-.65515.522-.0017174-.006311.002876-2.61315.020-.0045649-.007628-.0015021.84715.085.0042486.000216.0082821.13415.274.0024516-.001337.0062402.65015.018.0061813.002092.010270-1.71315.107-.0033014-.006680.000077Disc Brake Diameter (mm)Disc Brake Diameter (mm)Disc Brake Diameter (mm)Disc Brake Diameter (mm)Disc Brake Diameter (mm)Disc Brake Diameter (mm)Disc Brake Diameter (mm)Disc Brake Diameter (mm)Machine Number 12345678tdfSig. (2-tailed)Mean Difference Lower Upper 90% Confidence Interval of the Difference Test Value = 3221. The columnlabeled Sig. (2-tailed)displays a probability from the t distribution with 15 degrees of freedom.2.The 90%Confidence Interval of the Differenceprovides an estimate of the boundaries between which the true mean difference lies in 90% of all possible random samples of 16 disc brakes produced by this machine.3. Since their confidence intervals lie entirely above 0.0, you can safely say that machines 2, 5and 7are producing discs that are significantly wider than 322mm on the average.4. Similarly, because its confidenceinterval lies entirely below 0.0, machine 4is producing discs that are not wide enough .二、独立双样本假设检验z基本原理z SPSS应用实例独立双样本假设检验—基本原理主要内容:Comparing Two Independent Samples (两个独立样本的比较): Z Test for the Difference in Two Means (Z检验方法)t Test for Difference in Two Means (t检验方法)•F Test for Difference in two Variances (方差相等检验,F检验)Independent Samples•Different Data Sources:Unrelated (不相关)Independent (独立)Sample selected from one population has no effector bearing on the sample selected from the otherpopulation.•Use Difference Between the 2 Sample Means •Use Pooled Variance(合并方差)t TestzAssumptions (前提假设):zSamples are Randomly and Independentlydrawnz Data Collected are Numerical z Population Variances Are Known zSamples drawn are LargezTest Statistic:Z Test for Differences in Two Means (Variances Known)2221122121n n )()X X (Z σσµµ+−−−=zAssumptions (前提假设):z Both Populations Are Normally Distributed zOr, If Not Normal, Can Be Approximated byNormal DistributionzSamples are Randomly and IndependentlydrawnzPopulation Variances Are Unknown ButAssumed Equalt Test for Differences in Two Means (Variances Unknown)Pooled-Variance t Test (Part 1) 1. Setting Up the Hypothesis:H0: µ 1≤µ 2 H1: µ 1> µ 2H0: µ 1-µ 2= 0 H1: µ 1-µ 2 ≠0H0: µ 1= µ 2 H1: µ 1≠µ 2H0: µ 1≥µ 2H0: µ 1-µ 2≤0H1: µ 1-µ 2> 0H0: µ 1-µ 2≥0H1: µ 1-µ 2 < 0OROROR LeftTailRightTailTwoTailH1: µ 1< µ 2Pooled-Variance t Test (Part 2)2. Calculate the Pooled Sample Variances as an Estimate of the Common Populations Variance:)n ()n (S )n (S )n (Sp1111212222112−+−−+−=2pS 21S 22S 1n 2n = Pooled-Variance = Variance of Sample 1= Variance of sample 2= Size of Sample 1= Size of Sample 2t X X S n S n S n n df n n P=−−−=−×+−×−+−=+−12122112222121211112µµHypothesizedDifference Pooled-Variance t Test (Part 3)3. Compute the Test Statistic:())(()()()()⎟⎟⎠⎞⎜⎜⎝⎛+•112p S n 1n 2__Pooled-Variance t Test: Examplez You’re a financial analyst for Charles Schwab. Isthere a difference in dividend (股息)yield between stocks listed on the NYSE(纽约证券交易所)& NASDAQ? You collect the following data:NYSE NASDAQNumber2125Mean 3.27 2.53Std Dev 1.30 1.16z Assuming equal variances, isthere a difference in averageyield (α = 0.05)?t X X S n n S n S n S n n PP=−−−=−−==−×+−×−+−=−×+−×−+−=1212212211222212223272530151********11112111302511162112511510µµ.......Calculating the Test Statistic:((((((((((()))))))))))⎟⎟⎠⎞⎜⎜⎝⎛+•11⎟⎟⎠⎞⎜⎜⎝⎛+•11z H 0: µ1 -µ2= 0 (µ1 = µ2)z H 1: µ1 -µ2≠0 (µ1≠µ2)z α = 0.05z df = 21 + 25 -2 = 44z Critical Value(s):Test Statistic:Decision:Conclusion:Reject at a = 0.05There is evidence of a difference in means.t0 2.0154-2.0154.025Reject H 0Reject H 0.025t =−=327253151********....Solution⎟⎟⎠⎞⎜⎜⎝⎛+•11F Test for Differences in Two Variances•The F test Statistic:F == Variance of Sample 1n 1 -1 = degrees of freedomn 2 -1 = degrees of freedomF0 21S 21S 22S 22S = Variance of Sample 2zTests for Differences in 2 Independent Population Variances z Parametric Test Procedure zAssumptionszBoth Populations Are Normally DistributedzTest Is Not Robust to ViolationsF Test for the Difference in Two Population VarianceszHypotheses z H 0:σ12= σ22z H 1: σ12≠σ22zTest Statistic z F = S 12/S 22zTwo Sets of Degrees of Freedom z df 1= n 1-1;df 2= n 2-1zCritical Values:F L ( )and F U ()F L = 1/F U *(* degrees of freedom switched)F Test for the Difference in Two Population VariancesReject H 0Reject H 0α/2α/2Do Not Reject F0F LF Un 1-1, n 2-1n 1 -1 , n 2 -1F Test: An Examplez Assume you are a financial analyst for Charles Schwab. You want to compare dividend yields between stocks listed on the NYSE & NASDAQ. You collect the following data:NYSE NASDAQNumber2125Mean 3.27 2.53Std Dev 1.30 1.16z Is there a difference in thevariances between the NYSE& NASDAQ at the 0.05level?z H 0:σ12= σ22z H 1: σ12≠σ22z α=.05z df 1=20 df 2=24z Critical Value(s):Test Statistic:Decision:Conclusion:Do not reject at a = 0.05There is no evidence of a difference in variances.0F2.330.415.025Reject Reject .025F ===22130116125...F Test: Example Solution21S 22SH 0: σ12≥σ22H 1: σ12< σ22F Test: One TailH 0: σ12≤σ22H 1: σ12> σ22Reject α =.05F0FReject α =.05α= .05F LF UF L =F U 1or (n 2 -1, n 1-1)Degrees of freedom switchedSPSS双独立样本T检验实例SPSS双独立样本T检验z An analyst at a department store(百货公司) wants to evaluate a recent credit card promotion. To this end, 500 cardholders wererandomly selected. Half received an ad promoting a reduced interest rate on purchases made over the next three months, and halfreceived a standard seasonal ad.z Use Independent-Samples T Test to compare the spending of the two groups.操作步骤:1.打开数据文件(creditpromo.sav)2.调用Independent-Samples T Test。
应用统计学 第六章 假设检验

v (s12
s12 n1
s22 n2
2
n1)2 (s22 n2 )2
n1 1
n2 1
(6-13)
31
第三节 两个总体参数的检验
第 六 章
假
设
检 验
这时,检验统计量t的计算公式为:
t (x1 x2 ) (1 2 )
s12 s22 n1 n2
10
第一节 假设检验的基本问题
第 六 章
假 设
(五) 根据样本数据计算检验统计量的值
检
验
在提出原假设和备择假设,选取适当显著性水平 和检验统计量以后,接下来就要根据样
本观测值计算检验统计量的值,具体计算方法将在本章第二节进行详细介绍。例如,例6-1中检
验统计量的值为:
z x 0 2.21 2 2.67
t x 0 (6-3)
s/ n
18
第二节 一个总体参数的检验
第 六 章
假
综上所述,不同情况下总体均值的检验统计量如表6-3所示。
设
检
验
19
第二节 一个总体参数的检验
第 六 章
二、总体比例的检验
假
设 检
在实际应用中,常常需要检验总体比例是否为某个假设值 0 。例如,检验某课程的
验 考试通过率、产品的合格率、种子的发芽率等,民意调查中也经常用到总体比例检验。
样本条件下,要求总体服从正态分布,且总体标准差 已知时,可以使用z统计量。当
总体标准差 已知时,z统计量的计算公式为:
z x 0 / n
(6-1)
15
第二节 一个总体参数的检验
第 六 章 假 设 检 验
16
第6章 假设检验

×
样本均数 分布未知
样本均数服从 t分布
( X-t / 2 ( ) .S X, X+t / 2 ( ) .S X )
样本均数服从 正态分布
N ( , 2 / n)
N ( , S 2 / n)
( X-u / 2 . X, X+u / 2 . X )
( X-u / 2 .S X, X+u / 2 .S X )
时,当P值在检验水准α 附近时,应慎重做结论。
α 是犯Ⅰ型错误的最大概率,P是犯Ⅰ型错误的实际概率。
3.假设检验的统计意义
假设检验的实际意义
不管是接受还是拒绝零假设都未必有实际意义; 拒绝零假设时,即使P值很小,总体之间差异可能很小,不具有
实际意义;
接受零假设时,不代表总体之间没有差异,可能由于样本量过 小,“证据不足”,“补充证据”后,仍可能拒绝零假设;
样本均数 分布未知
×
样本均数服从 正态分布
Ⅳ N
σ 已知? Y
u
X
X
X X / n S/ n
样本均数服从 t分布
样本均数服从 正态分布
N ( , / n)
2
N ( , S 2 / n)
样本均数与总体 均数比较 (大样本:u检验) (小样本:?检验)
两样本均数比较
若小概率事件发生了,则我们犯了经验主义错误;
因为小概率事件发生可能性为α ,则我们犯经验主义错 误的概率为α ,这种错误称为Ⅰ型ห้องสมุดไป่ตู้误。
若小概率事件没有发生,接受零假设时,还是有可能犯错
误,这时候错误是教条主义,称为Ⅱ型错误。
统计学基础厦门大学06假设检验

• 对原始数据中包含的信息利用不够充分,检验的功 效相对较弱
• 符号检验——只考虑样本间差数的符号
– 单样本场合的符号检验,其步骤如下:
• 作出假设; • 计数; • 确定拒绝域; • 选择n+,n-较大者,再与临界值比较 • 判断
• 例6-11(P172):假设随机抽取20名工人,他们 一天生产的产品件数如下:
– 所谓p-值检验就是拒绝原假设所需的最低显著 性水平
– p-值的判断原则是:如果p值小于给定的显著 性水平,则拒绝原假设;否则,接受原假设。 或:如果p值很小,拒绝H0,否则接受H0。
– p-值实际上是检验统计量超过(大于或小于) 由样本数据所得数值的概率。
• z检验的p-值;
– 步骤:
• 作出假设; • 构造检验统计量; • 计算样本统计的数值; • 计算p-值; • 判断
z 双侧检验
两个正态总体参数的均值检验
2. 方差未知,但两个总体的方差相等,检验均值相等
问题:X ~ NXຫໍສະໝຸດ ,2 XY~N
Y
,
2 Y
未知
2 X
,
Y2,但知
2 X
Y2,检验H0:X
Y
设 X1, X 2 ,......X n1 是X的一个样本, Y1,Y2 ,......Yn2 是Y的一个样本,
• 符号检验
– 配对样本场合的符号检验,其步骤如下:
• 作出假设 • 计数 • 确定拒绝域 • 比较正号个数与临界值的大小 • 判断
• 例6-12(P173):假定在体操比赛中,甲乙两位 裁判分别对该项赛事中的11位运动员打分,并且 记分制为10分,分值如下表:
1 2 3 4 5 6 7 8 9 10 11 裁判甲 8.1 9.0 8.8 9.3 7.9 9.1 8.6 8.8 8.4 9.2 9.1 裁判乙 7.3 8.8 8.6 9.4 8.4 9.0 8.9 8.7 8.0 9.2 9.5 差值符号 + + + - - + - + + 0 -
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6 - 10
2020-5-25
统计学
基于SPSS (第 3 版)
双侧检验与单侧检验
1. 备择假设没有特定的方向性,并含有符号 “”的假设检验,称为双侧检验或双尾 检验(two-tailed test)
2. 备择假设具有特定的方向性,并含有符号 “>”或“<”的假设检验,称为单侧检验或 单尾检验(one-tailed test)
6 -
基于SPSS (第 3 版)
提出假设
(例题分析)
【例6-1】一种零件的生产标准是直径应为15cm,为 对生产过程进行控制,质量监测人员定期对一台加 工机床检查,确定这台机床生产的零件是否符合标 准要求。如果零件的平均直径大于或小于15cm, 则表明生产过程不正常,必须进行调整。试陈述用 来检验生产过程是否正常的原假设和被择假设
可能犯错误
2. 原假设和备择假设不能同时成立,决策的结果要么拒绝 H0,要么不拒绝H0。决策时总是希望当原假设正确时没 有拒绝它,当原假设不正确时拒绝它,但实际上很难保 证不犯错误
3. 第Ⅰ类错误(错误)
原假设为正确时拒绝原假设
第Ⅰ类错误的概率记为,被称为显著性水平
2. 第Ⅱ类错误(错误)
原假设为错误时未拒绝原假设
4. 因研究目的不同,对同一问题可能提出不同 的假设(也可能得出不同的结论)
6 - 15
2020-5-25
6.1 假设检验的基本原理 6.1.2 怎样做出决策
统计学
基于SPSS (第 3 版)
两类错误与显著性水平
1. 研究者总是希望能做出正确的决策,但由于决策是建立 在样本信息的基础之上,而样本又是随机的,因而就有
就一个总体而言,总体参数包括总体均值、 比例、方差等
分析之前必需陈述
6-7
2020-5-25
统计学
基于SPSS (第 3 版)
什么是假设检验?
(hypothesis test)
1. 先对总体的参数(或分布形式)提出某种假设, 然后利用样本信息判断假设是否成立的统计方 法
2. 有参数检验和非参数检验
备择假设的方向为“<”,称为左侧检验 备择假设的方向为“>”,称为右侧检验
6 - 11
2020-5-25
统计学
基于SPSS (第 3 版)
双侧检验与单侧检验
(假设的形式)
以总体均值的检验为例
假设
双侧检验
单侧检验 左侧检验 右侧检验
原假设 H0 : =0 H0 : 0 H0 : 0
备择假设 H1 : ≠0 H1 : <0 H1 : >0
备择假设
(alternative hypothesis)
1. 也称“研究假设”,研究者想收集证据予以支持的 假设,用H1或Ha表示
2. 所表达的含义是总体参数发生了变化或变量之间 有某种关系
3. 备择假设通常用于表达研究者自己倾向于支持的 看法,然后就是想办法收集证据拒绝原假设,以 支持备择假设
4. 总是有符号 , 或
第Ⅱ类错误的概率记为 (Beta)
6 - 17
2020-5-25
统计学
基于SPSS (第 3 版)
两类错误的控制
1. 一般来说,对于一个给定的样本,如果犯第Ι类错误 的代价比犯第Ⅱ类错误的代价相对较高,则将犯第Ⅰ 类错误的概率定得低些较为合理;反之,如果犯第Ι 类错误的代价比犯第Ⅱ类错误的代价相对较低,则将 犯第Ⅰ类错误的概率定得高些
统计学
统计学 基于SPSS
(第二版)
—基于SPSS
课程内容 描述统计、推断统计、其他常 用方法
使用软件 SPSS
学分与课时 3学分,1~17周,每周3课时
1-1
第 6 章 假设检验
6.1 假设检验的基本原理 6.2 总体均值的检验 6.3 总体比例的检验 6.4 总体方差的检验
统计学
基于SPSS (第 3 版)
6-4
2020-5-25
第 6 章 假设检验
6.1 假设检验的基本原理
6.1.1 怎样提出假设 6.1.2 怎样做出决策 6.1.3 怎样表述决策结果
6.1 假设检验的基本原理 6.1.1 怎样提出假设
统计学
基于SPSS (第 3 版)
什么是假设?
(hypothesis)
☺在参数检验中,对总体参数的具体数值 所作的陈述
2. 所表达的含义总是指参数没有变化或变量之间没 有关系
3. 最初被假设是成立的,之后根据样本数据确定是否 有足够的证据拒绝它
4. 总是有符号 , 或
H0 : = 某一数值 H0 : 某一数值 H0 : 某一数值
例如, H0 : 10cm
6-9
2020-5-25
统计学
基于SPSS (第 3 版)
3. 逻辑上运用反证法,统计上依据小概率原理
小概率是在一次试验中,一个几乎不可能发生的 事件发生的概率
在一次试验中小概率事件一旦发生,我们就有理 由拒绝原假设
6-8
2020-5-25
统计学
基于SPSS (第 3 版)
原假设
(null hypothesis)
1. 又称“0假设”,研究者想收集证据予以反对的假 设,用H0表示
H0 : 400 H1 : < 400
6 - 14
2020-5-25
统计学
基于SPSS (第 3 版)
提出假设
(结论与建议)
1. 原假设和备择假设是一个完备事件组,而且 相互对立
在一项假设检验中,原假设和备择假设必有一 个成立,而且只有一个成立
2. 先确定备择假设,再确定原假设
3. 等号“=”总是放在原假设上
解:研究者想收集证据予以证明的假设应该是 “生产过程不正常”。建立的原假设和备择假 设为
H0 : 15cm H1 : 15cm
6 - 13
2020-5-25
统计学
基于SPSS (第 3 版)
提出假设
(例题分析)
【例6-2】饮用水瓶子上的标签
解:研究者抽检的意图是倾向于证实瓶子上标 签的说法并不属实 。建立的原假设和备择假设 为
学习目标
假设检验的基本思想和原理 假设检验的步骤 总体均值的检验 总体比例的检验 总体方差的检验 P值的计算与应用 用SPSS进行检验
6-3
2020-5-25
统计学
基于SPSS (第 3 版)
问题与思考 你相信饮用水瓶子标签上的说法吗
➢ 产品的外包装 上都贴有标签, 标签上通常标 有该产品的性 能说明、成分 指标等信息。 下面是农夫山 泉500ml瓶装饮 用天然水外包 装标签上给出 的“特征性指 标”信息