分类变量资料的假设检验共61页文档

合集下载

管理统计学第六章 分类的资料的假设检验071105-PPT精选文档

管理统计学第六章 分类的资料的假设检验071105-PPT精选文档

一分公司 二分公司 三分公司 四分公司 合计
赞成该方案 68
75
57
79 279
反对该方案 32
45
33
31 141
合计 100 120 90 110 420
列联表的分布
观察值的分布
1. 边缘分布
– 行边缘分布
• 行观察值的合计数的分布 • 例如,赞成改革方案的共有279人,反对改革方案的141人
6.1 分类数据与列联表
一. 分类数据 二. 列联表的构造 三. 列联表的分布
列联表的构造
列联表
(contingency table)
1. 由两个以上的变量交叉分类的频数分布表 2. 行变量的类别用 r 表示, ri 表示第 i 个类别 3. 列变量的类别用 c 表示, cj 表示第 j 个类别 4. 每种组合的观察频数用 fij 表示 5. 表中列出了行变量和列变量的所有可能的组
赞成该方案 68
75
57
79 279
反对该方案 32
45
33
31 141
合计 100 120 90 110 420
列边缘分布
百分比分布
(概念要点)
1. 条件频数反映了数据的分布,但不适合对比
2. 为在相同的基数上进行比较,可以计算相应
的百分比,称为百分比分布
– 行百分比:行的每一个观察频数除以相应的行 合计数(fij / ri)
(r c 列联表的一般表示)
列(cj)
列(cj)
行(ri)
j =1
j=2

i =1
f11
f12

i=2
f21
f22

:
:

假设检验(完整)

假设检验(完整)
H0 : ≤ 30% H1 : 30%
2、设计检验统计量
1. 根据样本观测结果计算得到的,并据以对原假设 和备择假设作出决策的某个样本统计量
2、 标准化的检验统计量
Z x / n
t( n 1)

x
s/ n
总体分布 样本容 量
σ已知
σ未知
正态分布
大样本 x ~ N (0,1) / n
裁决
实际情况
无罪
有罪
有罪
错误
正确
无罪
正确
错误
H0 检验
决策
实际情况 H0为真 H0为假
拒绝H0
第Ⅰ类错 正确决策
误( ) (1- )
未拒绝H0
正确决策
(1 – )
第Ⅱ类错
误( )
假设检验中的两类错误之间的关系
H0: 药品为真药
H0: 某次面试为好机会
真药
拒绝
拒绝域大 大弃真
不拒绝 正确
假药
•【例1】一种罐装饮料采用自动生产线生产,每罐 的容量是255ml,标准差为5ml,服从正态分布。 为检验每罐容量是否符合要求,质检人员在某天 生产的饮料中随机抽取了16罐进行检验,测得每
罐平均容量为257.2ml。取显著性水平=0.05 ,检
验该天生产的饮料容量是否符合标准要求?
双侧检验
绿色
健康饮品
他在抽样分布理论、相关回归 分析、多元统计分析、最大似然 估计理论,方差分析和假设检验 有很多的建树。
女士品茶
• 20世纪20年代后期在英国剑桥一个夏日的下午, 一群大学的绅士和他们的夫人以及来访者,正围 坐在户外的桌旁享用下午的奶茶。
• 奶茶一般是由牛奶和茶混合而成的,调制时候可 以先倒茶后倒牛奶,也可以先倒牛奶后倒茶。这 时候,一名女士说她能区分这两种不同做法的调 制出来的奶茶。

分类资料的假设检验课件

分类资料的假设检验课件

实例一:卡方检验的应用
01
02
03
04
卡方检验是一种常用的分类资 料假设检验方法,用于比较两 个或多个分类变量的关联性。
卡方检验的适用条件是样本量 足够大,且观察频数不能太小

卡方检验的结果通常以卡方统 计量、自由度和显著性水平来
表示。
卡方检验可以用于分析分类变 量之间的独立性、一致性和差
异性等。
实例二
Fisher's exact 检验是一种适用于小 样本或极端情况下的分类资料假设检 验方法。
Fisher's exact 检验的结果通常以P值 来表示,如果P值小于显著性水平, 则拒绝原假设。
Fisher's exact 检验适用于分析两个 分类变量的关联性,特别是当期望频 数小于5时。
Fisher's exact 检验在遗传学、流行 病学等领域应用广泛。
等级变量
对于等级变量,应选择适 合的秩和检验、方差分析 等方法。
连续变量
对于连续变量,应选择适 合的t检验、方差分析等方 法。
多因素分析的复杂性
交互作用
在多因素分析中,各因素之间可能存在交互作用,导致分析结果复杂化。
多元比较
多因素分析需要进行多元比较,增加了分析的复杂性。
05
分类资料假设检验的未 来发展与展望
与未发生组的比值。
风险比和优势比的检验在医学 、社会学等领域应用广泛,用 于评估疾病风险、治疗效应等 。
04
分类资料假设检验的注 意事项与挑战
样本量与检验效能
样本量
样本量的大小直接影响检验效能 ,样本量过小可能导致检验效能 不足,无法准确判断差异是否存 在。
检验效能
检验效能是指假设检验能够正确 判断差异存在的概率,检验效能 越高,判断正确的可能性越大。

分类资料的假设检验(ppt 41页)

分类资料的假设检验(ppt 41页)

H0:两种药物的总体有效率相等, π1=π2;
H1:两种药物的总体有效率不相 等,π1≠π2,
α=0.05。
16
计算理论频数
处理 试验药 对照药 合计
有效例数 无效例数 合计 有效率(%)
100( 91.6) 13 113
88.5
80
29 109
73.4
180
42
222
81.1
TRC

R×C表的卡方检验
理论数不能小于1; 理论数大于1小于5的格子数不超过总格子数的1/5。 增加样本含量;Fisher确切概率法;删去;合并
33
多个率或构成比的比较
多个率的比较 多个构成比的比较 行列表检验的注意事项
34
8.3多个率的比较
表8.5 三个剂量失眠药物治疗失眠有效率比较
bc 4 215
29
Fisher精确概率法(exact test)
表8.4 两种剂型妥布霉素治疗细菌性结膜炎结果比较
组别 即型凝胶
眼药水
合计
有效数 10(a) 9(c)
19(a+c)
无效数 4(b) 7(d)
11(b+d)
合计 14(a+b) 16(c+d)
30(n)
有效率(%) 71.43 56.25
处理 试验药 对照药 合计
有效例数 无效例数 合计 有效率(%)
100( a) 13(b) 113
88.5
80(c) 29(d) 109
73.4
180
想 Basic logic
一个正常的骰子,抛 出后得到六个面的概 率均为1/6。因此, 要判定一个骰子是否 合格,可以通过抛骰 子的方法来进行;

统计理论5_分类变量的假设检验

统计理论5_分类变量的假设检验

组 别 有效
无效
合 计 有效率(%)
试验组 99(90.48) a 对照组 75(83.52) c 合 计 174(a+c)
5(13.52) b 21(12.48) d 26(b+d)
104 (a+ b) 96 (c+d) 200 (n)
95.20 78.13 87.00
版权所有:多多医善
四格表χ 检验
组 别 有效
无效
试验组 对照组
99(90.48) a 75(83.52) c
5(13.52) b 21(12.48) d
合 计 174(a+c)
26(b+d)
合 计 有效率(%)
104 (a+ b)
95.20
96 (c+d)
78.13
200 (n)
87.00
T11 104174 / 200 90.48 ,T12 104 90.48 13.52 T21 174 90.48 83.52 ,T22 26 13.52 12.48
u | p 0 | | p 0 |
p
0 (1 0 ) n
版权所有:多多医善
率的u检验
根据以往经验,一般胃溃疡病患者有20%(总体率)发生胃出血症状。现某医生观察65岁以上胃 溃疡病人152例,其中48例发生胃出血,占31.6%(样本率)。问老年胃溃疡病患者是否较一般胃溃 疡病患者易发生胃出血。
对照组的96例颅内压增高症患者中:有效者为96(174/200)=83.52;无效者为96(26/200)=12.48。
版权所有:多多医善
四格表χ 检验
某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组)降低颅内压的疗效。将200例 颅内压增高症患者随机分为两组,结果见下表。问两组降低颅内压的总体有效率有无差别?

17 第十三章 分类数据的假设检验

17 第十三章 分类数据的假设检验
死亡
新措施
存活 18
36 54
合计 150
150 300
治愈率 88%
76% 82/%
10
132
114 246
传统措施
合计
独立性检验
列联表(contingency table)
处理 1 2 r 合计 1 n11 n21 nr1 C1 类别 2 n12 n22 nr2 C2 k n1k n2k nrk Ck 合计 R1 R2 Rr G
2

(| b c | 1) 2 2 c bc
22
对分布类型的检验
对总体是否服从某种分布进行检验 检验统计量
k (O E ) 2 i 2 i Ei i 1 近似 2 ~ (k c 1 )
c:用样本资料估计的总体参数的个数
23
分布的假设检验
二项分布的假设检验
检验在不同处理中不同类别的频率分布是否相同 不同类别的分布与处理无关(独立)
11
独立性检验
卡方检验
H0:不同类别的分布与处理无关 HA:不同类别的分布与处理有关 检验统计量
2
r k (Oij Eij ) 2
近似
i 1 j 1
Eij
~
2[(r 1) k 1)] (
X ~ P()
27
分布的假设检验
例:现有在不同显微镜视野内观察到的酵母菌数资料 如下,试利用该资料检验视野内的酵母菌数是否服从 泊松分布。 视野内的酵母菌数(X ) 视野频数(f )
i i
ˆ X fi X i fi 720 1.8 400
H0: X ~ P(1.8)
0 1 2 3 4 5 6 7 8 9 合计

假设检验完整版

假设检验完整版

几个重要的分布介绍 标准正态分布 定义: 设 X1,X2,......Xn相互独立, 都服从标准正态分布N(0,1), 则称 随机变量χ2=X12+X22+......+Xn2所服从的分布为自由度为 n 的χ2 分布.
几个重要的分布介绍
几个重要的分布介绍
双侧检验与单侧检验的假设形式
假设 原假设
计算检验统计量值:
t 986 1000 1.75 24 9
∵t值落入接受域,∴在 a =0.05的显著性水平上 接受H0
例四(和spss结合)
正常人的脉搏平均 数为72次/分。现测得15名患者的脉搏:71,55,76,68,
72,69,56,70,79,67,58,77,63,66,78 试问这15名患者的脉搏与正
描述统计
推断统计
参数估计 假设检验
假设检验一般问题
1、假设问题的提出和基本思想 2、几个重要的分布介绍 3、双侧检验和单侧检验 4、假设检验的步骤 5,总体均值的检验 6,举例
假设问题的提出
根据1989年的统计资料,某地女性新生儿的平均体重为 3190克,现从1990年的女性新生儿中随机抽取30人,测得 其平均体重为3210克,问1990年的女性新生儿和1989年的 新生儿相比,体重有无显著性差异?
显著性为0.088>0.05,接受原假设,无明显差异。
态分布,其总体均值为X0=0.081mm,总体标准差为 =0.025 。今换一 种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度均值为
0.076mm。试问新机床加工零件的椭圆度均值与以前有无显著差异?(a=
0.05)
解:已知:X0=0.081mm, =0.025,n=200,

05分类变量资料的假设检验

05分类变量资料的假设检验

二项分布资料
1、样本率与总体率的比较
2)正态近似法
正态近似法 当n足够大,π与1-π均不太小, 如nπ≥ 5 且n(1-π ) ≥ 5
P~N( ,
(1 ) ), n

u
p (1 ) n
例:
经全国高血压病发病率调查,城市 人口高血压发病率为19.6%。某医师 调查某市父母均经确诊为高血压病 患者的子女358人,其中高血压发病 127人,问父母双亲家族史均阳性者 高血压发病率是否高于一般人群?
P<0.01, 按单侧 =0.05水准,拒绝H0,接受H1, 可认为父项分布资料
2、两样本率比较
适用于: n1p1 ≥ 5 , n1(1-p1) ≥ 5 n2p2 ≥ 5 , n2(1-p2) ≥ 5
公式见P82
POSSION分布资料
1、样本阳性事件数与总体阳性事件数的比较 1)直接计算概率法:
卡方检验
主要适用于:阳性事件数<20 P86 例7-14
POSSION分布资料
1、样本阳性事件数与总体阳性事件数的比较
2)正态近似法 主要适用于:阳性事件数>=20 P87 例7-15
POSSION分布资料
2、两样本阳性事件数比较
1)、两个样本观察单位相同 P88 例7-16
2)、两个样本观察单位不同 P88 例7-17
H0:父母双亲家族史均阳性者高血压发病率 与 一般人群相同 ,= 0 H1:父母双亲家族史均阳性者高血压发病率高 于一般人群, > 0 =0.05 p 127 0.3547 358
u p (1 ) n 0.3547 0.196 7.5665 0.196(1 0.196) 358
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档