第六章 假设检验(2)
作业:正态概率纸

累计频率
0.02 0.04 0.20 0.44 0.66 0.80 0.90 0.96 1.00
第六章 假设检验
(2)正态概率纸
以各组右端点值为横坐标,累计频率为纵坐标值。 在正态概率纸上描点,如下图:
由图是可正见态,分9布个。点且近似=在35直.4线0,上,=所44以.8,-3可5以.40认=为9.总4。体
1
5
43 45 31 46.3 42.8 52.1 49 49 40 52.7 39
48.1 35 58 32 31.5 37 28 19 34. 38 59.5 3
试32.在8 显43著水33平α5=0 0.0458下,46用正态概率纸对该市家 庭人均收入的分布进行假设检验。
第六章 假设检验
(2)正态概率纸
第六章 假设检验
正态概率纸
正态概率纸就是一种检验总体是否为正态分布 的较直观易行的工具。
正态概率纸是由垂直于横轴,纵轴的若干条直 线构成的格纸。
横轴是按等份刻度,表示观测值x
( X )
1
t2
e 2 dt2Leabharlann 纵轴表示正态分布累积概率值
纵轴是按非等分刻度,其目的是使服从正态分 布的观测值在正态概率纸上的图形呈一条直线。
第六章 假设检验
(2)正态概率纸
正态概率纸的使用步骤:
将样本观测值分组,且求 出各组的频率和累积频率
每组区间右端点为横坐 标,累积频率为纵坐标
在正态概率纸 上画出相应的点
如果这些点基本在一条直 线上,则可以认为样本来 自正态总体。
用直线连接各点
中间的点应尽量地靠近直 线,两端的点可以稍有些 偏离。
第六章 假设检验
作业:在单轴六角车床上加工一批小轴,从中随机抽 取25件,进行测量,测量结果如下:
第六章 假设检验2006

第六章参数假设检验假设检验(test of hypothesis)亦称显著性检验(test of statistical significance),就是先对总体的参数或分布做出某种假设,如假设两个总体均数相等,总体服从正态分布或两总体分布相同等,然后用适当的统计方法计算某检验统计量,根据检验统计量的大小来推断此假设应当被接受或拒绝,它是统计推断的另一重要方面。
假设检验可以分为两类:一类是已知总体分布类型,对其未知总体参数的假设作假设检验,称为参数检验(parametric test),主要讨论总体参数(均值、方差、总体率等)的检验;另一类是对未知总体分布类型的总体假设作假设检验,称为非参数检验(non-parametric test),主要包括总体分布形式的假设检验、随机变量独立性的假设检验等。
本章主要介绍有关总体参数(均值、方差、总体率等)的参数检验问题。
第一节假设检验的基本概念一、假设检验问题及基本原理(一)假设检验问题我们先来看个具体的例子。
例6.1某药厂用自动包装机包装葡萄糖,按规定每袋葡萄糖的标准重量为500克,若已知包装机包装的每袋葡萄糖重量服从正态分布,且按以往标准知总体方差σ2=6.52,某日开工后,为检验包装机工作是否正常,随机抽取6袋葡萄糖,测得其平均重量x=504.5(克),问该日自动包装机包装的平均重量是否还是500克?某日随机抽取的6袋葡萄糖的平均重量x=504.5(克),与标准重量500克相比差4.5克,造成该差异的原因有两种可能:①这日自动包装机工作正常,其包装的总体平均重量μ=500克,此6袋葡萄糖的平均重量这一样本均值与总体均值不同,是随机抽样误差造成的;②这日自动包装机工作不正常,其包装的总体平均重量μ≠500克,故从此总体中随机抽取的6袋葡萄糖的平均重量与标准重量存在实质性差异,而不仅仅是抽样误差造成的。
上述两种可能是相互对立的、互不相容的,究竟哪一种可能是对的,可用假设检验的方法来判断。
《医学统计学》第六章+参数估计与假设检验

2、该地所有人收缩压的均数可能在什么范围?
医学统计学(第7版)
三、总体均数的区间估计
(一)σ 已知
➢ 如果变量 X 服从均数为 μ、标准差为 的正态分布,则: z
服从标准正态分布。则:
P X 1.96
X 1.96
0.95
(二)σ 未知
1. t 分布
➢ 事实上,总体标准差 通常是未知的,这时我们可以用其估计量S代替 ,但
在这种情况下,( X ) / ( S /
n)
已不再服从标准正态分布,而是服从著名的 t 分布。
William Gosset
不同自由度的t分布图
医学统计学(第7版)
2. 可信区间的计算
S12 S22
n1 n2
2 ,v
医学统计学(第7版)
例题
➢ 例6-4 评价复方缬沙坦胶囊与缬沙坦胶囊对照治疗轻中度高血压的有效性,将102名患
者随机分为两组,其中试验组和对照组分别为54例和48例。经六周治疗后测量收缩压,
试验组平均下降15.77mmHg,标准差为13.17mmHg;对照组平均下降9.53mmHg,标准
样本率的标准差称为率的标准误(standard error of rate),可用来描述样
本率抽样误差的大小。率的标准误越小,则率的抽样误差越小,率的标
准误越大,则率的抽样误差越大。公式为:
p
(1 )
n
2. 率的标准误的估计
在一般情况下,总体率 π 往往是未知的,此时可用样本率 P 来估计总体
标准差与标准误的比较
标 准 差
标 准 误
第六章 假设检验.

n 即 z A,没有落入拒绝域内 , 所以没有足够的理由 来拒绝原假设 H 0,该样本的信息说明生 产正常
检验统计量的 P 值为: P( Z 1.8) 1 - P( Z 1.8) 1 - 0.9281 0.0719 0.05 因此,拒绝原假设的证 据也不强。
2.单侧检验 对于单侧检验,以左侧检验为例,要检验的 假设: H0 : 0对H1 : 0 1)假定原假设 H 0 : 0成立, 并令
S是样本标准方差,即检验统计量服从自 由度为n-1的t分布,我们称之为t检验统 计量,n>30, 可用z检验代替
例6.6 解:根据问题的要求,确定原假设与备择假设
H0 : 1000 对H1 : 1000
这是一个双侧检验 , S 24 已知, 可用t检验。 x 986, 0.05, 查表,t / 2 (n 1) t / 2 (8) 2.306, 因此,拒绝域A {t ; t 2.306}, 计算t检验统计量的值
P( Z za)
2)通过查标准正态分布表求出临界值za.由此临界 值确定由检验统计量表示的拒绝域
A {z; z z / 2 }
3)对于样本 x ( x1 , x2 ,..., xn )计算检验统计量的值
n 不能拒绝原假设
z
x 0
, 若 z A,则拒绝原假设,否则
即 z A {z, z 1.645},落入拒绝域内 , 所以没有充分的理由 接受原假设H 0,接受备择假设,该样 本的数据支持该公司的 自我声称
三、正态总体方差的假设检验
2 2 设原假设H 0 : 2 0 , H1 : 2 0
检验统计量为
第6章假设检验

第6章假设检验一项包括了200个家庭的调查显示,每个家庭每天看电视的平均时间为小时,标准差为小时。
据报道,10年前每天每个家庭看电视的平均时间是小时。
取显着性水平,这个调查能否证明“如今每个家庭每天收看电视的平均时间增加了”?详细答案:,=,,拒绝,如今每个家庭每天收看电视的平均时间显着地增加了。
为监测空气质量,某城市环保部门每隔几周对空气烟尘质量进行一次随机测试。
已知该城市过去每立方米空气中悬浮颗粒的平均值是82微克。
在最近一段时间的检测中,每立方米空气中悬浮颗粒的数值如下(单位:微克):根据最近的测量数据,当显着性水平时,能否认为该城市空气中悬浮颗粒的平均值显着低于过去的平均值详细答案:,=,,拒绝,该城市空气中悬浮颗粒的平均值显着低于过去的平均值。
安装在一种联合收割机的金属板的平均重量为25公斤。
对某企业生产的20块金属板进行测量,得到的重量数据如下:假设金属板的重量服从正态分布,在显着性水平下,检验该企业生产的金属板是否符合要求?详细答案:,,,不拒绝,没有证据表明该企业生产的金属板不符合要求。
在对消费者的一项调查表明,17%的人早餐饮料是牛奶。
某城市的牛奶生产商认为,该城市的人早餐饮用牛奶的比例更高。
为验证这一说法,生产商随机抽取550人的一个随机样本,其中115人早餐饮用牛奶。
在显着性水平下,检验该生产商的说法是否属实详细答案:,,,拒绝,该生产商的说法属实。
某生产线是按照两种操作平均装配时间之差为5分钟而设计的,两种装配操作的独立样本产生如下结果:操作A操作B=100=50====对=,检验平均装配时间之差是否等于5分钟。
详细答案:,=,,拒绝,两种装配操作的平均装配时间之差不等于5分钟。
某市场研究机构用一组被调查者样本来给某特定商品的潜在购买力打分。
样本中每个人都分别在看过该产品的新的电视广告之前与之后打分。
潜在购买力的分值为0~10分,分值越高表示潜在购买力越高。
原假设认为“看后”平均得分小于或等于“看前”平均得分,拒绝该假设就表明广告提高了平均潜在购买力得分。
统计学第六章假设检验

10
即 z 拒绝域,没有落入接受域,所以没有足够理由接受原假设H0, 同
时,说明该类型电子元件的使用寿命确实有了显著的提高。
第六章 假设检验
1. 正态总体均值的假设检验
(2) 总体方差 2 未知的情形
双侧举例:【例 6-6】某厂用生产线上自动包装的产品重量服从正态
分布,每包标准重量为1000克。现随机抽查9包,测得样本平均重量为
100个该类型的元件,测得平均寿命为102(小时), 给定显著水平α=0.05,
问,该类型的电子元件的使用寿命是否有明显的提高?
解:该检验的假设为右单侧检验 H0: u≤100, H1: u>100
已知 z z0.05 1.645
zˆ x u0 n 100 (102 100 ) 2 1.645
986克,样本标准差是24克。问在α=0.05的显著水平下,能否认为生产线
工作正常? 解:该检验的假设为双侧检验 H0: u=0.5, H1: u≠0.5
已知 t /2 (n 1) t0.025 (9 1) 2.306, 而 tˆ x u 986 1000 1.75 可见 tˆ 1.75 2.306
设H0, 同时,说明该包装机生产正常。
其中 P( Z 1.8) 1 P( Z 1.8) 1 0.9281 0.0719 0.05。
第六章 假设检验
单侧举例:【例 6-4】某电子产品的平均寿命达到5000小时才算合格,
现从一批产品中随机抽出12件进行试验,产品的寿命分别为
5059, 3897, 3631, 5050, 7474, 5077, 4545, 6279, 3532, 2773, 7419, 5116
的显著性水平=0.05,试测算该日生产的螺丝钉的方差是否正常?
第6章 假设检验

三、假设检验中的相关概念
(一)原假设和备择假设 1、原假设和备择假设的定义
原假设:假设检验中,通常将所要检验的假 设称为原假设,也称为零假设,用H0表示。 备择假设:原假设的对立假设称为备择假设 或备选假设,用H1表示。
例如:设μ 0为总体均值μ 的某一确定值。
0
1.检验总体均值μ 是否等于某一确定值μ
2、原假设和备择假设的形式
(双侧检验和单侧检验)
若原假设是总体参数等于某一数值,
如H0:μ=μ0 ;H1:μ≠μ0。
这种假设检验称为双侧检验 若原假设是总体参数大于等于或小于等于某一数值, 如H0:μ≥μ0 ;H1:μ<μ0 或H0 :μ≤μ0 ;H1:μ>μ0
这种假设检验称为单侧检验。又分为左侧检验和右侧检验。
一、总体均值的检验
(一)提出假设
1. 双侧检验:H0 : m =m0;H1 : m m0
2. 3.
左侧检验:H0 : m m0;H1 : m <m0 右侧检验:H0 : m m0 ;H1 : m >m0
一、总体均值的检验
(二)选择检验统计量,并确定其分布形式
大
样本容量n
否 是
小(正态总体)
设检验。
一、什么是假设检验
参数假设检验 指对总体分布函数中的未知参数提出某种 假设,然后利用样本信息对所提的假设进 行检验并做出判断的过程。 非参假设检验 指对总体分布函数形式等的假设进行检验 的过程。
参数假设检验实例
例1:某公司进口一批钢筋,根据要求,钢筋的 平均拉力强度不能低于2000克,而供货商强 调其产品的平均拉力强度已达到了这一要求, 这时需要进口商对供货商的说法是否真实作出 判断。进口商可以先假设该批钢筋的平均拉力 强度不低于2000克,然后用样本的平均拉力 强度来检验假设是否正确。
第六章假设检验

α也称为生产者风险:在生产者将产品售给消费者时,通常 要进行产品的质量检验,原假设总是产品是合格的,但是检验 时生产者总是担心把合格品检验为不合格品,也就是第一类错 误α,所以α也称为生产者风险。 β也称为消费者风险:在消费者一方总恐怕把不合格品检验 不出来而当作合格品接受,因而β也称为消费者风险。
(二)未知总体分布及总体方差,大样本 1.检验总体均值的统计量
(三)总体为正态分布、方差未知、小样本 1. 检验统计量
2. 拒绝域的临界值 可以根据双侧检验还是单侧检验来确定拒绝域的 临界值。当为双侧检验,显著性水平a时,临界值 为 ;当为右侧检验时,显著性水平a,监界值 为 ;当为左侧检验时,显著性水平为a,临界值 为- 。
备择假设,常用H1表示。即原假设被否定之 后而采取的逻辑对立假设。
(二)检验统计量
有了两个假设,就要根据数据来对他们进行判 断。数据的代表是作为其函数的统计量,对样 本数据进行加工并用来判断是否接受原假设的统计 量称作检验统计量 统计量最常用的是Z统计量、t统计量。
统计量的选择要根据研究的参数及其估计量 的分布、抽样的方式、总体方差是否已知等多种 因素来确定
第四步:确定决策规则。拒绝或没有拒绝原假设的决 策是建立在由样本数据来进行统计检验并将其与假设 的抽样分布比较。抽样分布被分成两个部分,拒绝域 和非拒绝域。如果原假设是真实的,那么统计检验不 可能落入拒绝域。因此,如果统计检验落入了拒绝域, 我们拒绝原假设;否则,我们不能拒绝它。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实际频数 来店次数 男性 女性 1-8次 42.2% 57.7% 9次以上 57.8% 42.3% 合计 100.0% 100.0% 合计 51.7% 48.3% 100.0%
检验步骤如下:
假设检验与方差分析
4、两个独立样本t检验
第一步:建立原假设和备选假设: H 0 : 1 2 第二步:建立统计量 ① 总体方差未知且相同
t
2 1
H1 : 1 2
x1 x2
2 2
(n1 1) s (n2 1) s n1 n2 2
1 1 n1 n2
~ t n1 n2 2
来店次数 1-8次 9次以上 合计 实际频数 男性 女性 19 41 26 30 45 71 合计 60 56 116
实际频数 来店次数 男性 女性 1-8次 42.2% 57.7% 9次以上 57.8% 42.3% 合计 100.0% 100.0%
合计 51.7% 48.3% 100.0%
假设检验与方差分析
假设检验与方差分析
【检验步骤如下】
(1)建立原假设和备选假设 原假设H0:p ≤ 0.60
备选假设H1:p>0.60 其中p为年家庭收大于或等于50000美元的顾客比例
(2)设定允许的抽样误差水平 a=0.05时,单侧检验临界值za=1.645 (3)计算检验统计量
z
p=74.29%,n=100,
(4)结论
0.7429 0.6 6.5225 1.645 0.61 0.6 500
应该拒绝原假设,即银行有95%的把握断定有多于60%的顾 客年家庭收高于50000美元。可以实施新的专门服务。
假设检验与方差分析
二、两个总体的比例是否相等的检验
在不少情形下,管理层感兴趣的是两个不同群体中具有某 种行为特征的人的比例是否有差异。 为检验p1和p2是否相等,建立原假设H0:p1=p2=p。在原 假设成立的条件下,当n1和n2都充分大时,下面的检验统计量 近似服从标准正态分布。即
Z
p1 p2 P(1 P)(1 / n1 1 / n2 )
~ N (0,1)
其中 P=(n1p1+n2p2)/(n1+n2)
假设检验与方差分析
【例6】
根据一项调研,便利店的管理层有理由相信,每月来店大 于等于9次的人中,男性百分比大于女性百分比。下面是表达 和检验此假设的过程。 首先样本比例的差异能从实际频数表中计算出来:
( x)
确定拒绝域和接受域
z>Za 1.645 , 拒 绝 H0, 接 受 H1 z<Za 1.645 , 没 有 理 由 拒 绝 H0
1 a 0.95
a 0.05
Za 1.645
x
接受域
拒绝域
假设检验与方差分析
3、单个样本左单边假设检验
若提出原假设和备选假设:
H0 : 0
(5)结论
Z 1.60 Z临界值 1.28
应该拒绝原假设,即银行管理层有90%的把握断定每月 来店大于或等于9次的男性比例大于女性比例。
假设检验与方差分析
(2)设定允许的抽样误差水平
a 0.10时,临界值Z 1.28 (0.10显著水平的单边检验 )
(3)计算两比例间差异的估计标准差
S p m f 1 1 P1 P nm n f P n m Pm n f P f nm n f
假设检验与方差分析
2、单个样本右单边假设检验
若提出原假设和备选假设:
H 0 : 0
H1 : 0
H 0成立的条件下 如设统计量为 Z x 0 在 Z ~ N (0,1)
通常原假设为希 望检验的对立面
n 由给定的显著水平a=0.05确定临界值,Z0.05=1.645
假设检验与方差分析
第三节
总体比例的假设检验
一、单个总体比例的假设检验
二、两个总体的比例是否相等的检验
假设检验与方差分析
一、单个总体比例的假设检验
在许多情形下,调研人员关心的是用百分比表达的情况。 比例假设检验是指检验由于抽样误差造成的比例数之间的差异 是否大于期望差异。 对于假设H0:p=p0。在成立的前提下,当n足够大时,有
所以本例 S p m f
45 0.58 71 0.41 P 0.48 45 71 1 1 0.48 1 0.48 0.10 45 71
假设检验与方差分析 (4)计算检验统计量
Z
0.58- 0.42 - 0 1.60 样本比例差- 原假设比例差 两比例间差异的估计标 准差(S pm f ) 0.10
H 0 : 0 1000 H1 : 1000 x 0 在H 0成立的条件下 t (n 1) 第二步:设统计量为 t s n
第三步:由给定的显著水平a=0.05确定临界值ta (25-1)=-1.711
x 0 950 1000 t 2.5 1.711 第四步:求样本观测值 s 100 n 25 结论:拒绝原假设,即有95%的可信度可以确定该批元件是不合格的。
z
~
p p0 p0 (1 p0 ) n
~ N 0,1
【案例】
一家大银行对500名顾客所做的调查结果表明,稍高于74%的人 其家庭年收高于50000美元。如果这符合事实,该公司将为这个群体 开发一套专门服务。在开发和推出新的服务之前,管理层想确定真 实的百分比是否大于60%。调查结果显示,在被调查的顾客中, 74.29%的年家庭收大于或等于50000美元。用比例检验法检验该假 设是否成立。
a 0.05
1 a 0.95
Za 1.645
拒绝域
接受域
假设检验与方差分析
【例】
注:因为希望检验是否低于1000小时,用单边检验
要求一种元件使用寿命不得低于1000小时,今从一批这种元件 中随机抽取25件,测得其寿命的平均值为950小时。已知该种元件 寿命服从标准差为 =100 小时的正态分布,试在显著水平 a=0.05 下确定这批元件是否合格?
第三步:由给定的显著水平a=0.05确定临界值Za/2=-1.645
950 1000 t 2.5 1.645 第四步:求样本观测值 100 n 25 结论:拒绝原假设,即有95%的可信度可以确定该批元件是不合格的。
假设检验与方差分析
【另例】
如果其它条件不变。样本标准差为s=100小时,试在显著水平 a=0.05下确定这批元件是否合格? 第一步:提出假设:
设统计量为
H1 : 0
H 0成立的条件下 在 Z ~ N (0,1)
Z
x 0
n 由给定的显著水平a=0.05确定临界值,Z0.05=-1.645
( x)
确定拒绝域和接受域
z Za 1.645 接 受 H1 拒 绝 H0 z Za 1.645 , 没 有 理 由 拒 绝 H0
(1)建立原假设和备选假设 原假设H0:pm-pf ≤ 0
每月来店大于或等于9次的男性比例≤每月来店大于或等于9次的 女性比例 备选假设H1: pm-pf >0 每月来店大于或等于9次的男性比例>每月来店大于或等于9次的女 性比例 26 30 Pm 0.58 Pf 0.42 45 71 Pm Pf 0.58 0.42 0.16
第三步:由给定的显著水平a,确定临界值za/2或ta/2(n-1) 第四步:确定拒绝域和接受域
t> 临 界 值 或伴随概率p<0.05 拒绝域
t 临 界 值 或伴随概率p>0.05 接受域
第五步:求样本观测值,并判定 t落在接受域内,没有理由拒绝原假设; t落在拒绝域内, 就拒绝原假设,接受备选假设。
假设检验与方差分析上节小结:假设检验
1、单样本双边假设检验步骤如下
第一步:建立假设
H 0 : 0 H1 : 0
n≥30时,其服从正态分布
第二步:设统计量为
X 0
在H 0成 立 的 条 件 下
X 0 在H 0成立的条件下 t ~ t (n 1) t N (0,1) 或 t s n n
② 总体方差未知且不等
t x1 x2 s s n1 n2
2 1 2 2
~t f
其 中f
s
s
2 1
2 1
n1 sห้องสมุดไป่ตู้n2
n1 n1
s
2
2 2
2
2 2
n2 n2
2
f 第三步:给定的显著水平a,确定临界值 ta n1 n2 2 或 ta 2
2
第四步:求样本观测值并决策
第一步:提出假设: 有两种选择
H 0 : 0 1000 H1 : 1000 H 0 : 0 1000 H1 : 1000 x 0 在H 0成立的条件下 第二步:设统计量为 t N (0,1) n
x 0
选哪种?选希望检验的对立面。