正态总体及二项分布百分数的假设检验

合集下载

正态总体参数的假设检验

正态总体参数的假设检验

的样本,EX

1 , DX


2 1
,
EY

2 , DY


2 2
,
则由中心极限定理知,
当n1和n2 较大时
U

X
Y
(1
2)
近似
~ N (0,1)

其中

2 1
n1


2 2
n2
故对大样本(n1和n2较大), 仍可用U检验法,这时拒绝条件仍如上表 所示.
如果
2 1
,
2 2
2

2 /2
2 (n 1)
2 2
0


2

2 1
概率统计(ZYH)
例1 某车间生产铜丝, 据经验知该车间生产的铜丝折 断力X~N(570,82).今换了一批质量较好的原材料,从性能上 看,估计折断力的方差不变,但不知折断力是否有所增强.故 从新生产的铜丝中抽取了十个样品,测得折断力(单位:N)为
n1


2 2
n2
T法



2 1
=
2 2
但未知


1 2 1 2 1 2
1 2 T
X Y
1 2
Sw 1 n1 1 n2
1 2 Sw
(n1 1)S12 (n2 1)S22 ) (n1 n2 2)
N (0,1)
N (0,1) t (n 1)
| U | u / 2 U u U u
| T | t / 2 T t T t
2法
2


2 0

数理统计17:正态总体参数假设检验

数理统计17:正态总体参数假设检验

数理统计17:正态总体参数假设检验现在,我们对正态分布的参数假设检验进⾏讨论,这也是本系列的最后⼀部分内容。

由于本系列为我独⾃完成的,缺少审阅,如果有任何错误,欢迎在评论区中指出,谢谢!⽬录Part 1:基本步骤正态总体N (µ,σ2)参数的假设检验不外乎遵循以下的步骤:找到合适的统计量,⽤统计量的取值范围设计拒绝域。

假定原假设为真,考虑这个条件下统计量的分布。

根据统计量的分布,根据检验的⽔平要求设置拒绝域的边界值。

设计检验的核⼼在于假定原假设为真,这是因为检验的⽔平是基于弃真概率定义的,也就是说,要在第三步中写出检验的⽔平,就必须在H 0成⽴的情况下找出⼩概率事件的发⽣条件。

⽐如,对于均值的检验⼀共有三种:1.H 0:µ=µ0↔H 1:µ≠µ0;2.H 0:µ≥µ0↔H 1:µ<µ0;3.H 0:µ≤µ0↔H 1:µ>µ0.每⼀种⼜可以细分为⽅差σ2已知和⽅差σ2未知两种情况,但显然不论⽅差是否已知,最核⼼的统计量都应该是¯X,如果⽅差未知可能还要⽤到⽅差的替代:S 2。

以下,对于这三种问题,拒绝域分别应该是这样的:如果H 0被接受,则¯X 既不应该太⼤,也不应该太⼩,拒绝域的基础形式应该是{¯X >c 1}∪{¯X <c 2}.如果H 0被接受,则¯X 不应该太⼩,⽆论多⼤都可以,拒绝域的基础形式应该是{¯X <c }.如果H 0被接受,则¯X 不应该太⼤,⽆论多⼩都可以,拒绝域的基础形式应该是{¯X>c }.当然,这只是拒绝域的基础形式,实际情况下可能不⽌使⽤¯X,但基本思想应该是这样的。

对于⽅差的检验,则将检验统计量换成了S 2,或者均值已知情况下的离差平⽅和Q 2,步骤也和上⾯的差不多。

正态总体的假设检验

正态总体的假设检验
(Xi μ)2
n
(Xi μ)2
P { i1
σ
2 0
χ
2 1
α 2
(
n)}
P{
i 1
σ
2 0
χ
2
α
(
n)}
α
2
所以拒绝域为: W
{
χ2
χ
2 1
α 2
(
n)
,χ
2
χ
2
α
(n)
}
2
2. μ未知时,总体方差σ2的假设检验 χ2 检验法
类型 原假设 备择假设
H0
H1
检验统计量
双边 检验
σ2
σ
2 0
σ2
得s=0.007欧姆.设总体服从正态分布,参数均未知,
问在显著性水平α=0.05下,能否认为这批导线的
标准差显著地偏大?
解: s2 0.0072 0.0052
原假设 H 0 : σ 2 0.0052,备择假设 H1 : σ 2 0.0052
检验统计量: χ 2 (n 1)S 2
σ2
拒绝域:
第二节 正态总体的假设检验
一、单一正态总体均值μ的假设检验
二、单一正态总体方差σ2的假设检验 三、两个正态总体均值的假设检验 四、两个正态总体方差的假设检验
一、单一正态总体均值μ的假设检验
设总体X~N (, 2). X1 , X2 , … , Xn是取自X的样本,
样本均值 X样,本方差S2
1.已知
T t(α n 1)
例1. 设某次考试的考生的成绩服从正态分布,从中随
机地抽取36位考生的成绩,算得平均成绩为66.5分,标 准差为15分,问在显著性水平0.05下,是否可以认为在 这次考试中全体考生的平均成绩为70分?

正态总体参数假设检验

正态总体参数假设检验
, xn ) W c
犯第一类 错误 正确
正确 犯第二类 错误
Page 23
Chapter 7 假设检验
犯第一类错误的概率 和犯第二类错误的概率 可以用同一个函数表示,即所谓的势函数。定义 如下: 定义7.1.1 设检验问题 H0 : 0 vs H1 : 1
的拒绝域为W,则样本观测值落在拒绝域内 的概率称为该检验的势函数,记为
Page 20
Chapter 7 假设检验
正如在数学上我们不能用一个例子去证明一个 结论一样,用一个样本(例子)不能证明一个 命题(假设)是成立的,但可以用一个例子 (样本)推翻一个命题。因此,从逻辑上看, 注重拒绝域是适当的。
Page 21
Chapter 7 假设检验
三、选择显著性水平
检验可能犯以下两类错误: 其一是 H 0为真但样本观测值落在拒绝域中, 从而拒绝原假设 H 0 ,这种错误称为第一类错 误,其发生的概率称为犯第一类错误的概率, 或称拒真概率,通常记为.
用参数估计 的方法处理
用假设 检验的 方法来 处理
Page 4
Chapter 7 假设检验
假设检验的一般问题
一、什么是假设检验 二、假设检验的基本思想 三、双侧检验和单侧检验 四、假设检验中的拒绝域和接受域 五、假设检验的两类错误 六、假设检验中的P值 七、假设检验的步骤
Page 5
Chapter 7 假设检验
参数估计和假设检验

参数估计和假设检验是统计推断的两个 组成部分,都是利用样本对总体进行某 种推断,但推断的角度不同。参数估计 讨论的是用样本统计量估计总体参数的 方法。假设检验讨论的是用样本信息去 检验对总体参数的某种假设是否成立的 程序和方法。
Page 3

正态总体参数的假设检验

正态总体参数的假设检验
n
W1 ( 12 , )
统计量
2
(X
i 1
i
0 )
2 0
2

~ (n)
2
2、单个总体,未知, 的检验
统计量
2
2 (n 1) Sn 1

2 0
2
~ (n 1)
2
2
2 2 和 双侧检验:临界值 1
2 单侧检验:临界值 或 12
a) H 0 : 0 , H1 : 0 ; b) H 0 : 0 , H1 : 0
a), b) 为左单侧检验
x 0 H 0成立 统计量U ~ N (0,1) 0 / n
临界值为 u1 u
拒绝域W1 (, U 1 ) ,接受域 W0 [ U 1 , )
例 7.1.1 某药厂包装硼酸粉,规定每袋净重为 0.5 ( kg ) ,设每袋重量服从正态分布,标准差
0.014 (kg) 。为检验包装机的工作是否正常,随
机抽取 10 袋,称得净重分别为: 0.496 0.510 0.515 0.506 0.518 0.512 0.524 0.497 0.488 0.511 问这台包装机的工作是否正常
解:1)检验假设 H0 : 0; H1 : 0
2)统计量 t x 0 s/ n 3)计算观测值
H 0 成立
~ t (4)
x 45 . 98 , s 1 . 535
| 45 . 98 48 | | t | 2 . 942 1 . 535 / 5
4)与临界值比较 | t | 2 . 942 2 . 7764 t 0 .025 ( 4 ) (统计量的值落在拒绝域内) 结论:拒绝原假设,即认为 48 。

正态分布假设检验

正态分布假设检验

正态分布假设检验一、概述正态分布假设检验是统计学中常用的一种方法,用于判断一个数据集是否符合正态分布。

正态分布是指在统计学中,当数据集的频率分布呈钟形曲线时,称其为正态分布。

正态分布在实际应用中非常广泛,因为许多自然现象都遵循这种分布规律。

对于一个数据集而言,如果它符合正态分布,则可以使用一系列的统计方法进行进一步的研究和分析。

二、检验方法1. 假设检验假设检验是指通过样本数据来推断总体参数的方法。

在正态分布假设检验中,我们需要对总体均值和标准差进行假设检验。

具体而言,我们需要提出原假设和备择假设两个假设:原假设:样本数据符合正态分布;备择假设:样本数据不符合正态分布。

在进行实际计算时,我们需要根据样本数据来计算出样本均值和标准差,并使用这些数据来推断总体均值和标准差是否符合正态分布。

2. 正态概率图正态概率图是判断一个数据集是否符合正态分布的常用方法之一。

它通过将数据集的分位数与正态分布的分位数进行比较,来判断数据集是否符合正态分布。

具体而言,正态概率图将数据集的每个值按照从小到大的顺序排列,并计算出每个值对应的标准化值(即该值与样本均值之间的差除以样本标准差)。

然后,将这些标准化值按照从小到大的顺序排列,并绘制在图表上。

如果数据集符合正态分布,则这些标准化值应当近似于一个直线。

3. 偏度和峰度检验偏度和峰度是用来描述一个数据集形态特征的指标。

在正态分布中,偏度为0,峰度为3。

因此,在进行正态分布假设检验时,我们可以通过计算样本偏度和峰度来判断样本是否符合正态分布。

具体而言,如果样本偏度和峰度与正态分布相差不大,则可以认为样本符合正态分布。

三、实例演示以下是一个实例演示,在Python中使用scipy库进行正态分布假设检验:```pythonimport numpy as npfrom scipy import stats# 生成100个随机数data = np.random.normal(0, 1, 100)# 进行正态性检验k2, p = stats.normaltest(data)alpha = 0.05# 输出检验结果print("p = {}".format(p))if p < alpha:print("数据不符合正态分布")else:print("数据符合正态分布")```在上述代码中,我们首先生成了一个包含100个随机数的数据集。

百分数的假设检验

百分数的假设检验
分 (1)2个样本频率的假设检验; 析
(2) np 和 nq > 30 ,无需连续矫正,用u检验;
(3)事先不知两块麦田的锈病发病率孰高孰低, 用双尾检验。
(1)假设 H0: p1=p2 即两块麦田锈病发病率没有显著差异。 HA: p1 ≠ p2
(2)水平 选取显著水平α=0.01
(3)检验
pˆ1
u>2.58,P<0.01
(4)推断
在0.01显著水平上,否定H0,接受HA; 认为两块麦田锈病发病率有极显著差异,即地 势对小麦锈病的发生有极显著影响作用,低洼 地小麦锈病的发病率极显著高于高坡地。
例:某鱼场发生了药物中毒,
抽查甲池中的29尾鱼,有20尾死亡
抽查乙池中的28尾鱼,有21尾死亡
检验甲、乙两池发生药物中毒以后,鱼的死亡率 是否有显著性差异。
(3)检验
pˆ1
x1 n1
20 29
0.690
pˆ 2
x2 n2
21 28
0.750
p x1 x2 20 21 0.719 n1 n2 29 28
q 1 p 0.281
s pq( 1 1 ) 0.119pˆ1 pˆ 2n来自 n2tc pˆ1
pˆ 2
0.5 0.5 n1 n2
(1)2个样本频率的假设检验;
分 (2) 5 < np 和 nq < 30 ,需进行连续矫正,

因n1<30,n2<30,用t检验;
(3)事先不知两池鱼的死亡率孰高孰低,用双尾检验。
(1)假设 (2)水平
H0: p1=p2 即甲乙两池鱼的死亡率没有显著差异 HA: p1 ≠ p2 选取显著水平α=0.05
n

§6.4正态总体的假设检验

§6.4正态总体的假设检验
F= (∑( Xi − µ1)2 ) m (∑(Yi − µ2 )2 ) n
i=1 i=1 n
2. 两个总体方差的假设检验: 两个总体方差的假设检验
~ F(m, n)
P{F ≤ F−α 2 (m, n)} = P{F ≥ F 2 (m, n)} = α 1 α
拒绝域为: 拒绝域为 {F ≤ F −α 2 (m, n)}∪{F ≥ F 2 (m, n)} 1 α
2
P{χ ≤ χ
2
2 1−α
2
(n −1)} = P{χ ≥ χα (n −1)} = α
2 2 2
2
2
2
2 拒绝域为: 拒绝域为 {χ 2 ≤ χ 2 α (n −1)}∪{χ 2 ≥ χα (n −1)} 1−
判断: 的观测值落入拒绝域, 拒绝H 否则, 接受H 判断 χ2 的观测值落入拒绝域 拒绝 0 , 否则 接受 0.
2
2 0.975
( 9 ) = 2.70
χ2 的观测值为 χ2=15.20 的观测值为:
2 0.975
(10 ) ≤ χ ≤ χ
2 0.025
(10 )
所以在显著性水平α=0.05 下接受 0. 下接受H 所以在显著性水平
独立, 设X~N(μ1,σ12), Y~N(μ2,σ22) 独立 X1 , … , Xm , Y1 , …, Yn分别是取自X, Y 的样本, 分别是取自 的样本 H0: σ12=σ22, H1: σ12≠σ22 均已知: (1) μ1, μ2 均已知: m H0 为真时 取 为真时,取
2 2 2
2 2 1−α 2 2
2
2 2
拒绝域为
{χ ≤ χ
(n)}∪{χ ≥ χα (n)}
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 2
d Sd / n
教材中使用矫正 t 值的方法, excel 中使用了公式对自由度进行了重新计算。 在 excel 中方差相不相等得出的 t 值不变,但是方差不同时,其自由度有计算公 式:
S S (S / n ) 2 (S / n2 ) 2 f ( 1 2 ) 2 /( 1 1 2 ) n1 n2 n1 1 n2 1
2
x −μ 0
0/ n
或u =
x −μ 0 S/ n

1)提出假设 H0,HA; 2)统计量 t 计算: t= H0 成立时,t~t(n-1) 3)依据所给显著水平α ,确定临界值 t0.5α 或 tα ; 4)比较所得统计量 t 与临界值,判断 H0 或 HA 成立。 TINV()返回 tα ,给出的为双尾概率。即显著水平为α ,单尾检验时应使用双 倍所给显著水平概率 2α 为参数。metlab 中给出为单尾概率。 1.1.2 单正态总体方差的假设检验 1)提出假设 H0,HA;
2
x1 x 2 ~ N (1 2 ,
1)提出假设; 2)计算统计量: u
( x1 x 2 ) ( 1 2 )
12
n1

22
n2
)
12 / n1 2 2 / n2
~ N (0,1) ;
3)依据显著水平得临界值; 4)判断。 Excel 中使用数据分析工具中的“Z-检验:双样本平均差检验” 。 (2)两样本方差未知且为小样本时,H0:μ 1=μ a、方差未知但可确定其相等 1 2 2 时
计算公式为: S p ˆ1 p ˆ2
p (1 p )(
1 1 ) n1 n2
p 为合并样本百分数
p x1 x2 n1 n2
则统计量为:
u
ˆ1 p ˆ2 p Sp ˆ1 p ˆ2
当 np 或 nq 小于或等于 5 时,
uc
ˆ1 p ˆ 2 0.5 / n1 0.5 / n2 p Sp ˆ1 p ˆ2
ˆ 1 x1 / n1 ,p ˆ 2 x2 / n2 为两个样本百分数,S p 其中 p ˆ1 p ˆ 2 为样本百分数差异标准误,
Sp ˆ p0 (1 p0 ) n
2.2 两个样本 一般的假设为: H0 : p1 p2 , H A : p1 p2
p1 p2 ~ N[ p1 p2 , p1 (1 p1 ) / n1 p2 (1 p2 ) / n2 ] ,当零假设成立时
p1 p2 ~ N[0, p(1 p)(1/ n1 1/ n2 )],
x −μ 0 S/ n
2)H0 成立前提下统计量计算: χ2 =
(n −1)S 2 σ02
~χ2 (n − 1)
3)依据显著水平α 及(n-1)的自由度,取得χ2 的临界值; 4)判断 H0 或 HA 成立: 0 2 210.5 (n 1) 或 2 2 0.5 (n 1) 时,拒绝 H0;
2 2
2
检验统计量为
t
x1 x 2 S1 / n1 S 22)
Excel 中使用“t-检验:双样本等方差检验” 。 b、配对样本: 令 di x1i x2i
其平均数用μ d 来表示, 方差为 Sd , 样本方差 Sd 。 此时μ d=0 di 为新的差数总体, t= 进行 t 检验 t ~ t(n-1) 。 使用 excel 中的“t-检验:平均值的成对二样本分析” 。 c、方差未知但可确定 1 2
p ~ N ( p0 , p0 (1 p0 ) / n) ,因此 u 的计算公式为
u ˆ p0 p , Sp ˆ
当 np 或 nq<或=5 时,应采用矫正 u 值 uc:
uc
ˆ p0 0.5 / n p Sp ˆ
ˆ 为样本百分数, p0 为总体百分数, S p p ˆ 为样本百分数标准误,计算公式为:
2 2 (n 1) 时拒绝 H0; 2 21 (n 1) 时拒绝 H0。
Excel 中用 CHIINV()返回单尾概率,故双尾检验时概率应使用 0.5α ,另需使 用自由度 f 为第二参数。χ2 1.2 两个正态总体参数的假设检验 1.2.1 两个正态总体均值差的假设检验 (1)已知两样本方差条件下,假设检验 H0:μ 1=μ
1 正态总体参数的假设检验 1.1 单个正态总体参数的假设检验 1.1.1 单个正态总体均值的假设检验 (1)已知方差 0 或已知样本为大样本时,对均值 的检验。
2
样本为正态总体中抽取,方差已知; 样本从正态总体中抽取,方差未知,但样本容量大于 30。 1) 提出假设 H0,HA; 2) 统计量 u 计算: u=σ H0 成立时,u~N(0,1) 3) 依据所给显著水平α ,确定临界值 u0.5α 或 uα ; 4) 比较所得统计量 u 与临界值,判断 H0 或 HA 成立。 Excel 中用 NORMSINV()返回 uα , 双尾检验中该函数中所用概率应为 1-0.5α , 单尾检验所用概率为 1-α 。 (2)方差 0 未知且已知样本为小样本时对均值 的假设检验。
S1 ~ F (n1 1, n2 1) 。 S12
2
1 F10.5 (n1 1, n2 1) F F0.5 (n1 1, n2 1) 成立,则认为可 F0.5 (n2 1, n1 1)
接受 H 0 。 当 H0 : 1 2 , H A : 1 2 时:
2 2 2 2
F F (n1 1, n2 1) ,则拒绝 H 0 。
当 H0 : 1 2 , H A : 1 2 时:
2 2 2 2
F
1 F1 (n1 1, n2 1) 时,接受 H 0 。 F (n2 1, n1 1)
2 二项分布百分数的假设检验 2.1 单个样本 一般假设为: H 0 : p p0 , H A : p p0
得出,使用该自由度得到临界值。 1.2.2 两个正态总体方差比的假设检验 两个正态总体, x2 ~ N (2 , 2 ) ,x1 与 x2 相互独立,且 1 、 1 、 2 、 2 都
2
2
2
2
2
未知。 假设检验 H0 : 1 2 。
2 2
在 H 0 成立时,检验统计量 F 判断:
相关文档
最新文档