分类资料的统计推断资料

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
P值等于实际样本出现的概率及更极端事件
(即更背离无效假设的事件)的概率之和,即 P=P(X=k)+ΣP(X=i),其中i满足
P(X =i)<P(X =k)
14
6.3 两样本率的比较
6.3.1 两样本率比较的u检验
当两个样本的含量n1与n2较大,且 p1,(1-p1),p2, (1-p2)均不太小,且n1(1-p1),n1p1,n2(1-p2),
α =0.05(单侧)
u
p0 0 (10 ) / n
0.316 0.2 0.2(1 0.2) / 304
5.06
u 0.001,单侧
3.09
P<0.001,拒绝H0,接受H1,差别有统计学意义,可认 为老年胃溃疡病患者较容易出血
11
6.2.2 直接计算概率法
(1)单侧检验
A:若是回答“差”或“低”的问题,则计算 出现“阳性”次数至多为k次的概率,即
第六章 分类资料 的统计推断
1
统计资料分类
type of data
资料类别
定性数据 qualitative data
定量数据 quantitative data
身高 ,体重
无序分类 nominal data
有序分类 ordered data
化验结果
两项分类
多项分类
binary data
polytomous data
6.3.2 两个样本率比较的2检验
17
例6.5 某医生在用蛙王露口服液治疗贫血的临床试验中, 将109名受试者随机分为两组,一组为试验组,接受蛙 王露口服液的治疗,结果为有效43人,无效10人;另 一组为对照组,接受复方阿胶浆的治疗,结果为有效 40人,无效16人,问两组有效率有无差别?
组别 试验组 对照组 合计
表6.1 两药治疗贫血有效率的比较
有效人数 无效人数
合计
43(a) 10(b)
53(a+b)
40(c) 16(d)
56(c+d)ቤተ መጻሕፍቲ ባይዱ
83(a+c) 26(b+d) 109(n=a+b+c+d)
有效率(%) 81.13 71.43 76.15
18
四格表资料
❖ 表6.1中,43、10、40、16是整个表的基 本数据,其余数据都是从这四个基本数据 相加而得的,这种资料是两组两分类资料, 称为四格表(fourfold table) ,亦称2×2表 (contingency table)
➢ 率的抽样误差用率的标准误σp表示
p
(1 )
n
➢ 总体率π未知时,以样本资料计算的p=X/n作为
π的估计值,σp的估计值为 Sp p(1 p) / n
5
6.1.2 总体率π的区间估计 (1) 精确概率法
例6.1 有人调查29名非吸毒妇女,出狱时有1名 HIV(人免疫缺陷病毒)阳性,试问HIV阳性 率的95%的可信区间是多少? n=29,X=1,查附表7得0.1~17.8, 即该HIV 阳性率的95%的可信区间是0.1%~17.8% 。
性别,是否吸烟
血型
2
定量资料的基本统计分析方法 统计描述:
均数、几何均数、中位数、百分位数 全距、四分位数间距、方差、标准差和变异系数
统计推断:
可信区间
假设检验:t检验、u检验、方差分析
3
定性资料的统计描述
❖ 相对数(率、构成比、比) ❖ 分类资料的频数表
4
6.1 率的区间估计
6.1.1 率的抽样误差及标准误
u | p 0 | 0 (1 0 ) / n
10
例6.3 根据以往经验,一般胃溃疡病患者有20%发生胃出血 症状,现某医院观察65岁以上溃疡病人304例,有31.6%发 生胃出血症状,问老年胃溃疡病患者是否较一般患者容易
出血?
H0:老年胃溃疡病患者胃出血率= 0=0.2;
H1:老年胃溃疡病患者胃出血率 > 0=0.2;
k
k
P(X k) P(X )
n!
X (1 )n X
X 0
X 0 X !(n X )!
B:若是回答“优”或“高”的问题,则计算
出现“阳性”次数至少为k次的概率,即
n
n
P(X k) P(X )
n!
X (1 )nX
X k
X k X !(n X )!
12
❖ 例6.4 据以往经验,新生儿染色体异常率一般为1%, 某医院观察了当地400名新生儿,只有1例异常,问 该地新生儿染色体异常率是否低于一般?
H0:两组有效率无差别,π1 = π2; H1:两组有效率有差别,π1 ≠ π2 α =0.05
p1=43/53=0.8113,p2=40/56=0.7143 Pc=(43+40)/(53+56)=0.7615
u=1.188,查附表1,得P=0.234>0.05,不拒绝H0,差别无统计
学意义,尚不能认为两组有效率有差别。 16
Sp 0.0903(1 0.0903) /144 0.0239 2.39%
因此该地人群的乙型肝炎表面抗原阳性率的95%可 信区间为:4.35%~13.71%
8
6.1.3 两总体率之差π1-π2的区间估计(略)
9
6.2 样本率与总体率的比较
6.2.1 正态近似法
当n较大,且p和1-p均不太小,即np和n(1-p)均大 于5时,利用样本率近似正态分布原理,可作样 本率p与已知总体率π0的比较,检验统计量
6
(2) 正态近似法 当n足够大(如n>50),且p和1-p均不太小,即np和 n(1-p)均大于5时,总体率的1- α可信区间为: pu/2sp 如当α=0.05时,u=1.96, 当α=0.01时,u=2.58
7
例6.2 从某地人群中随机抽取144人,检查乙型肝炎 表面抗原携带状况,阳性率为9.03%,求该地人群 的乙型肝炎表面抗原阳性率的95%可信区间。 n=144,p= 9.03%
n2p2均大于5时,可用u检验:
u
| p1 p2 |
pc (1
pc )
1 n1
1 n2
15
例6.5 某医生在用蛙王露口服液治疗贫血的临床试验中,将109 名受试者随机分为两组,一组为试验组,接受蛙王露口服液的治 疗,结果为有效43人,无效10人;另一组为对照组,接受复方 阿胶浆的治疗,结果为有效40人,无效16人,问两组有效率有 无差别?
H0:该地新生儿染色体异常率与一般相同,即异常率
= 0= 0.01
H1:该地新生儿染色体异常率低于一般,即<0.01
α=0.05(单侧)
P(X≤1)=P(X=0)+P(X=1) =0.0905>0.05
不拒绝H0,差别无统计学意义,尚不能认为该地新
生儿染色体异常率低于一般
13
(2)双侧检验(不要求):
相关文档
最新文档