【选修2-3课件】3.5独立性检验的思想及应用(二)
合集下载
3.2独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)PPT课件

患肺癌有关系;否则,就判断 H
成立,即认为吸烟
0
与患肺癌有关系。
在该规则下,把结论“H 0 成立”错判成H“0 不
成立”的概率不会差P 过(K26.635)0.01,
即有99%的把握认为 H 0 不成立。
独立性检验的定义
上面这种利用随机变量K2来确定在多大程度上 可以认为“两个分类变量有关系”的方法,称为两 个分类变量的独立性检验。
2021
4
两种变量:
定 量 变 量 : 体 重 、 身 高 、 温 度 、 考 试 成 绩 等 等 。
变 量 分 类 变 量 : 性 别 、 是 否 吸 烟 、 是 否 患 肺 癌 、
宗 教 信 仰 、 国 籍 等 等 。
在日常生活中,我们常常关心分类变量之间是否有关系: 例如,吸烟是否与患肺癌有关系? 性别是否对于喜欢数学课程有影响等等?
16
上面我们通过分析数据和图形,得到的直观印象是吸烟和 患肺癌有关,那么事实是否真的如此呢?这需要用统计观点 来考察这个问题。
现在想要知道能够以多大的把握认为“吸烟与患肺癌有关”, 为此先假设
H0:吸烟与患肺癌没有关系.
用A表示不吸烟,B表示不患肺癌,则“吸烟与患肺癌没有关系”
等价于“吸烟与患肺癌独立”,即假设H0等价于 P(AB)=P(A)P(B).
C.52、59
D.54、52
[答案] C
2021
13
2.用K2统计量进行独立性检验时,使用的 表 称 为 ____________ , 要 求 表 中 的 四 个 数 据____________.
[答案] 2×2列联表 均大于5
2021
14
某学校对学生课外活动内容进行调查,结 果整理成下表:
高中数学选修2-3优质课件:独立性检验的基本思想及其初步应用

C.52,54
D.54,52
解析:由aa+ +221==b7,3, 得ab= =5524, .
答案:C
3.独立性检验所采用的思路是:要研究A,B两类型变量彼 此相关,首先假设这两类变量彼此________,在此假设下 构造随机变量K2,如果K2的观测值较大,那么在一定程度 上说明假设________. 答案:无关 不成立
4.在吸烟与患肺病是否相关的判断中,有下面的说法: ①若K2的观测值k>6.635,则在犯错误的概率不超过0.01的 前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人 中必有99人患有肺病; ②从独立性检验可知在犯错误的概率不超过0.01的前提 下,认为吸烟与患肺病有关系时,若某人吸烟,则他有 99%的可能患有肺病; ③从独立性检验可知在犯错误的概率不超过0.05的前提 下,认为吸烟与患肺病有关系时,是指有5%的可能性使得 推断错误.其中说法正确的是________.
立性检验的方法判断.
附:
P(K2≥k0)
0.10
0.05 0.025
k0
2.706 3.841 5.024
[解] 根据题目所给数据建立如下 2×2 列联表:
肯定
否定
总计
男生
22
88
110
女生
22
38
60
总计
44
126
170
根据 2×2 列联表中的数据得到:
k=1701×10×226×0×384-4×221×26882≈5.622>3.841.
[对点训练] 在一次天气恶劣的飞机航程中,调查了男女乘客在飞机上晕机
的情况:男乘客晕机的有 24 人,不晕机的有 31 人;女乘客晕
机的有 8 人,不晕机的有 26 人.请你根据所给数据判定:在
人教新课标版数学高二-选修2-3课件3.2独立性检验的基本思想及其初步应用

小结作业
列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有关
联关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推
断它们之间是否具有关联关系.
2.对独立性检验思想的理解
独立性检验的基本思想类似于数学中的反证法.先假设“两个分类变量没
有关系”成立,计算随机变量K2的值,如果K2的值很大,说明假设不合
试根据上述数据比较这两种手术对病人又发作过心脏病的影响有没有差别.
反思与感悟 解析答案
跟踪训练2 在研究某种药物对“H1N1”病毒的治疗效果时,进行动物试验, 得到以下数据,对150只动物服用药物,其中132只动物存活,18只动物死亡, 对照组150只动物进行常规治疗,其中114只动物存活,36只动物死亡. (1)根据以上数据建立一个2×2列联表; 解 2×2列联表如下:
常用等高条形图展示列联表数据的 频率 特征.
2.观察等高条形图发现a+a b和
c c+d
相差很大,就判断两个分类变量之间有关系.
知识点三 独立性检验
1.定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检
验. nad-bc2
2.K2= a+bc+da+cb+d .
其中n=a+b+c+d为样本容量.
跟踪训练3 某地区甲校高二年级有1 100人,乙校高二年级有900人,为了 统计两个学校高二年级在学业水平考试中的数学学科成绩,采用分层抽样
的方法在两校共抽取了200名学生的数学成绩,如下表:(已知本次测试合 格线是50分,两校合格率均为100%) 甲校高二年级数学成绩:
分组 [50,60) [60,70) [70,80) [80,90) [90,100]
理.K2越大,两个分类变量有关系的可能性越大.
高中数学人教课标版选修2-3《独立性检验的基本思想及其初步应用(第2课时)》课件

但只可以粗略判断两个分类变量是否有关系,一般在通过图表判断后 还需要用独立性检验来确认.
知识回顾
问题探究
课堂小结
随堂检测
重点、难点知识★▲
探究二:什么是独立性检验?
利用独立性检验判断两个分类变量的是否有关系的一般过程是什么?
●活动一 理论学习,提升高度 1.定义: 利用随机变量 独立性检验. ●活动二 对比学习,提炼方法
检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?
解:根据题中所给数据列出列联表
பைடு நூலகம்
相应的等高条形图如图所示:
比较来说,秃顶的病人中患心脏病的比例大一些,可以在某种程 度上认为“秃顶与患心脏病有关”.
知识回顾
问题探究
课堂小结
随堂检测
探究一:我们主要从几个方面来研究两个分类变量之间有无关系?
●活动二 对比学习,提炼优缺点 根据数据有多大把握判断秃顶与患心脏病是否有关系? 在假设的前提下,
1437 (214 597 175 451) 2 k 16.373 6.635 389 1048 665 772
所以有99%的把握认为“秃顶与患心脏病有关”. 这里的数据来自于医院的住院病人,因此题目中的结论能够很好 地适用于住院的病人群体,而把这个结论推广到其他群体则可能会出 现错误,除非有其它的证据表明可以进行这种推广.
3.2 独立性检验的基本思想及其初步 应用(第2课时)
知识回顾
问题探究
课堂小结
随堂检测
变量的不同“值”表示个体所属的不同类别,像这样的变量
成为分类变量. 列出两个分类变量的频数表,称为列联表. 等高条形图是用来分析两个分类变量之间是否具有相关关系, 可以形象、直观地反映两个分类变量之间的总体状态和差异大小,
知识回顾
问题探究
课堂小结
随堂检测
重点、难点知识★▲
探究二:什么是独立性检验?
利用独立性检验判断两个分类变量的是否有关系的一般过程是什么?
●活动一 理论学习,提升高度 1.定义: 利用随机变量 独立性检验. ●活动二 对比学习,提炼方法
检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?
解:根据题中所给数据列出列联表
பைடு நூலகம்
相应的等高条形图如图所示:
比较来说,秃顶的病人中患心脏病的比例大一些,可以在某种程 度上认为“秃顶与患心脏病有关”.
知识回顾
问题探究
课堂小结
随堂检测
探究一:我们主要从几个方面来研究两个分类变量之间有无关系?
●活动二 对比学习,提炼优缺点 根据数据有多大把握判断秃顶与患心脏病是否有关系? 在假设的前提下,
1437 (214 597 175 451) 2 k 16.373 6.635 389 1048 665 772
所以有99%的把握认为“秃顶与患心脏病有关”. 这里的数据来自于医院的住院病人,因此题目中的结论能够很好 地适用于住院的病人群体,而把这个结论推广到其他群体则可能会出 现错误,除非有其它的证据表明可以进行这种推广.
3.2 独立性检验的基本思想及其初步 应用(第2课时)
知识回顾
问题探究
课堂小结
随堂检测
变量的不同“值”表示个体所属的不同类别,像这样的变量
成为分类变量. 列出两个分类变量的频数表,称为列联表. 等高条形图是用来分析两个分类变量之间是否具有相关关系, 可以形象、直观地反映两个分类变量之间的总体状态和差异大小,
人教A版数学选修2-3全册课件:第三章 3.2 独立性检验的基本思想及其初步应用

50
100
(6分)
此处易犯错误有两点: ①计算失误;②将公 式中的数据搞错.
解析:在四幅图中,D图中两个深色条的高相差最明显,说 明两个分类变量之间关系最强. 答案:D
答案:C
3.独立性检验所采用的思路是:要研究A,B两类型变量彼 此相关,首先假设这两类变量彼此________,在此假设下 构造随机变量K2,如果K2的观测值较大,那么在一定程度 上说明假设________. 答案:无关 不成立
答案:③
P(K2≥k0) k0
0.025 5.024
0.010 6.635
0.005 7.879
[课时达标检测]
假设结论不成立
列联表和等高条形图的应用
考查独立性检验的原理
[解题流程]
[规范解答]
(2)根据所给的数据可以完成列联表,如下表所示:
生产能力分组 [110,130) [130,150) 总 计
工人类别
A类 工人
20
5
25
B类 工人
30
45
75
总计
பைடு நூலகம்
50
[导入新知]
个体所属
{y1,y2}
{x1,x2}
a+b+c+d 类变量有关系
两个分
[化解疑难]
独立性检验的思想
吸烟与患肺癌“列联表”中,事件A表示不吸烟,B表示不患肺癌. 问题1:事件A,B发生的频率可求吗? 提示:可以. 问题2:通常情况下,为研究问题方便,常用什么近似于概率? 提示:频率. 问题3:事件A,B无关有怎样的概率公式? 提示:P(AB)=P(A)P(B).
3.2
独立
第
性检 验的
三 基本
章 思想
高中数学选修2-3精品课件5:3.2 独立性检验的基本思想及其初步应用

人数如下表所示,则我们能否在犯错误的概率不超过 0.001
的前提下认为数学成绩优秀与物理、化学、总分优秀有关
系?
数学优秀 数学非优秀
物理优秀 228 143
化学优秀 225 156
总分优秀 267 99
【思路探究】 首先分别列出数学成绩与物理、化学、
总分的 2×2 列联表,再正确计算 K2 的观测值,然后由 K2 的
总计
360 880 1 240
代入公式可得 K2 的观测值 k3≈486.123. 由于 K2 的观测值都大于 10.828,由此说明都能在犯错误 的概率不超过 0.001 的前提下认为数学成绩优秀与物理、化 学、总分优秀有关系.
规律方法 1.本题的关键是多次 K2 的计算. 2.解决独立性检验问题的基本步骤是:①指(求)出相关
类型3 独立性检验的综合应用
例 3 研究人员选取 170 名青年男女大学生的样本,对他们 进行一种心理测验,发现有 60 名女生对该心理测验中的最 后一个题目的反应是:作肯定的 18 名,否定的 42 名;110 名男生在相同的题目上作肯定的有 22 名,否定的有 88 名.问:性别与态度之间是否存在某种关系?用独立性检验 的方法判断.
【思路探究】 解答本题可先列出表格,然后计算 K2 的观测值,再与临界值比较,判断两个变量是否相互独立.
解 根据题目所给数据列出下列表格:
态度 性别
男生 女生 总计
肯定
22 18 40
否定
88 42 130
总计
【思路探究】 画等高条形图 → 分析图中数据差异 → 作出结论
解 等高条形图如图所示:
其中两个浅色条的高分别代表铅中毒病人和对照组样 本中尿棕色素为阳性的频率.
人教课标版高中数学选修2-3《独立性检验的基本思想及其初步应用》名师课件2

“锻炼时间与性别有关”?
解:(2)根据 2×2 列联表,得到 K2 的观测值为
k=50×2(0×5×301×0-252×0×2515)2≈8.333>7.879,
所以在犯错误的概率不超过 0.005 的前提下,可以认为“锻炼时间与性别有关”.
巩固训练
3、为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人进行了 调查,结果是:患胃病者生活不规律的共60人,患胃病者生活规律的共20人, 未患胃病者生活不规律的共260人,未患胃病者生活规律的共200人. (1)根据以上数据列出2×2列联表; (2)能够以99%的把握认为40岁以上的人患胃病与否和生活规律有关系吗? 为什么?
方法归纳 解决独立性检验问题的基本步骤
(1)根据已知的数据作出列联表. (2)求K2的观测值. (3)判断可能性:与临界值比较,得出事件有 关的可能性大小.
巩固训练
2、某大学开展阳光体育活动,为了研究锻炼时间与性别是否有关,对全校 大学生的锻炼时间进行随机抽样调查,从中随机抽取男、女生各25名进行了 问卷调查,得到如下列联表:
有关系"
新课讲解
一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类 取值,即类A和B(如吸烟与不吸烟);Ⅱ也有两类 取值,即类1和2(如患病与不患病)。于是得到 下列联表所示的抽样数据:
类1 类2
总计
类A
a
b
a+b
类B
c
d
c+d
总计
a+c
b+d
a+b+c+d
新课讲解
要推断“Ⅰ和Ⅱ有关系”,可按下面的步骤进行: (1)提出假设H0 :Ⅰ和Ⅱ没有关系;
归纳小结
人教版高中数学选修2-3课件:3.2 独立性检验的基本思想及其初步应用(共38张PPT)

P(K2≥k0) 0.05 0.025 0.010 0.005 0.001
例如:
k0
3.841 5.024 6.635 7.879 10.828
①如果k≥10.828,就有99.9%的把握认为“X与Y有关系”;
②如果k≥7.879,就有99.5%的把握认为“X与Y有关系”;
③如果k≥6.635,就有99%的把握认为“X与Y有关系”;
≈7.8.
备课素材
附表:P(K2≥k0) k0
0.050 3.841
0.010 6.635
0.001 10.828
参照附表,得到的正确结论是 (A ) A.有99%以上的把握认为“爱好该项运动与性别有关” B.有99%以上的把握认为“爱好该项运动与性别无关” C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
表(称为2×2列联表)为
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计 a+c
b+d a+b+c+d
若要推断的论述为H1:“X与Y有关系”,则可以按如下步骤判断H1成立的可能性:
预习探究
预习探究
P(K2≥k0) 0.50 0.40 0.25 0.15 0.10
k0
0.455 0.708 1.323 2.072 2.706
考点类析
考点一 两分类变量之间关联关系的定性分析
例1 为考察某种药物预防某种疾病的效果,进行了一 项动物试验,得到如下列联表:
服用药 未服用药
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
临界值表
P(K 2 ≥ k0 ) 0.50
0.40 0.708
其 n = a + b + c + d为 中 样本 量 容 。
0.25 1.323 0.15 2.072 0.10 2.706 0.05 3.841 0.025 5.024 0.010 6.635 0.005 7.879 0.001 10.828
k0
0.455
K 2 > 10.828
0.1%把握认为A 0.1%把握认为A与B无关 把握认为
1%把握认为A 1%把握认为A与B无关 把握认为
99.9%把握认A 99.9%把握认A与B有关 把握认 99%把握认为A 99%把握认为A与B有关 把握认为 90%把握认为A 90%把握认为A与B有关 把握认为
在某医院,因为患心脏病而住院的665名男性病人中,有214 名男性病人中, 例1 在某医院,因为患心脏病而住院的 名男性病人中 人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有 人秃顶; 而另外 名不是因为患心脏病而住院的男性病人中有 175人秃顶。 分别利用图形和独立性检验方法判断秃顶与患心脏 人秃顶。 人秃顶 病是否有关系?你所得的结论在什么范围内有效? 病是否有关系?你所得的结论在什么范围内有效? 解:根据题目所给数据得到如下列联表: 根据题目所给数据得到如下列联表:
秃顶 不秃顶 总计
患心脏病 600 500 400 300 200 100 0 214 175 451
患心脏病 214 451 665
患其他病 597
不患心脏病 175 597 772
总计 389 1048 1437
患其他病
秃头 不秃头
患心脏病
相应的三维柱形图如图所 比 较来 副对 示 , 比较 来 说 , 底 面 副对 角线 上两 个 柱 体高 度 的乘 上 两个 的乘 大 一些 以在 积要 大一 些 , 因此 可 以在 程 度上 顶与 某种 程度 上 认 为 “ 秃 顶与 患心脏病有关” 患心脏病有关”。
反证法原理与假设检验原理 反证法原理:
在一个已知假设 下,如果推出一 个矛盾,就证明 了这个假设不成 立。
假设检验原理:
在一个已知假设 下,如果一个与 该假设矛盾的小 概率事件发生, 就推断这个假设 不成立。
在某医院,因为患心脏病而住院的665名男性病人中,有214 名男性病人中, 例1 在某医院,因为患心脏病而住院的 名男性病人中 人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有 人秃顶; 而另外 名不是因为患心脏病而住院的男性病人中有 175人秃顶。 分别利用图形和独立性检验方法判断秃顶与患心脏 人秃顶。 人秃顶 病是否有关系?你所得的结论在什么范围内有效? 病是否有关系?你所得的结论在什么范围内有效? 解:根据题目所给数据得到如下列联表: 根据题目所给数据得到如下列联表:
c+d
≈
a c ad − bc − = a+b c+d (a + b)(c + d )
n(ad − bc) 2 ⇒K = , (a + b)(c + d )(a + c)(b + d )
2
为考察高中生的性别与是否喜欢数学课程之间的关系, 例2 为考察高中生的性别与是否喜欢数学课程之间的关系,在 某城市的某校高中生中随机抽取300名学生,得到如下联表: 某城市的某校高中生中随机抽取 名学生,得到如下联表: 名学生
感冒与是否使用该血清没有关系。 解:设H0:感冒与是否使用该血清没有关系。
1000(252× 276 − 224× 248) 2 K = ≈ 7.075 476×524×500×500
2
因当H 成立时, 的概率约为0.01,故有 因当 0成立时,K2≥6.635的概率约为 的概率约为 ,故有99%的把握认 的把握认 为该血清能起到预防感冒的作用。 为该血清能起到预防感冒的作用。
男 女 总计 喜欢数学课程 不喜欢数学课程 37 85 35 143 72 228 总计 122 178 300
由表中数据计算K 的观测值k 4.514。能够以 由表中数据计算 2的观测值 。能够以95%的把握认为高 的把握认为高 中生的性别与是否喜欢数学课程之间有关系吗? 中生的性别与是否喜欢数学课程之间有关系吗?请详细阐述得出 结论的依据。 结论的依据。
K 2 > 6.635
K 2 > 2.706
K 2 ≤ 2.706
10%把握认为A 10%把握认为A与B无关 把握认为
没有充分的依据显示A 没有充分的依据显示A与B有关,但也不能显示A与B无关 有关,但也不能显示A
6、独立性检验的步骤 、
第一步: 吸烟和患病之间没有关系 第一步:H0: 吸烟和患病之间没有关系 第二步:列出2 第二步:列出2×2列联表
使用血清 未使用血清 合计 252 224 476 248 276 524 500 500 1000
试画出列联表的条形图,并通过图形判断这种血清能否起到预 试画出列联表的条形图, 防感冒的作用?并进行独立性检验。 防感冒的作用?并进行独立性检验。
P(k≥k0) 0.50 0.40 0.25 0.15 k0 0.10 0.05 0.025 0.010 0.005 0.001 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
秃顶 不秃顶 总计 患心脏病 214 451 665 不患心脏病 175 597 772 总计 389 1048 1437
根据联表1-13中的数据,得到 中的数据, 根据联表 中的数据
1437×(214×597 −175×451)2 2 K = ≈16.373 > 6.635. 389×1048×665×772
患病 吸烟 不吸烟 总计 a c a+c 不患病 b d b+d 总计 a+b c+d a+b+c+d
n(ad −bc)2 第三步: 第三步:计算 K2 = (a + c)(b + d)(a + b)(c + d)
第四步:查对临界值表,作出判断。 第四步:查对临界值表,作出判断。
P(κ≥k0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
4、等高条形图
1 0.9
0.8
患肺癌 比例
0.7
0.6
0.5
0.4
0.3
0.2
不患肺癌 比例 不吸烟
不不不
0.1
0
吸烟
不不
等高条形图更清晰地表达了两种情况下患肺癌的比例。
5、独立性检验 独立性检验
n(ad − bc)2 随机变量-----卡方统计量 K2 = 随机变量 , (a + b)(c + d)(a + c)(b + d)
3、二维条形图
8000 7000 6000 5000 4000 不患肺癌 患肺癌
不吸烟 不患肺癌 患肺癌 吸烟
3000 2000 1000
0 从三维柱形图能清晰看出 各个频数的相对大小。 各个频数的相对大小。
不吸烟
吸烟
从二维条形图能看出, 从二维条形图能看出,吸烟者中 患肺癌的比例高于不患肺癌的比例。 患肺癌的比例高于不患肺癌的比例。
由表中数据计算K 的观测值k 4.514。能够以 由表中数据计算 2的观测值 。能够以95%的把握认为高 的把握认为高 中生的性别与是否喜欢数学课程之间有关系吗? 中生的性别与是否喜欢数学课程之间有关系吗?请详细阐述得出 结论的依据。 结论的依据。
以上的把握认为“ 解:可以有95%以上的把握认为“性别与喜欢数学课程之间有关系”。 可以有95%以上的把握认为 性别与喜欢数学课程之间有关系” 分别用a,b,c,d表示样本中喜欢数学课的男生人数、不喜欢数学课的男生 表示样本中喜欢数学课的男生人数、 分别用 表示样本中喜欢数学课的男生人数 人数、喜欢数学课的女生人数、不喜欢数学课的女生人数。 人数、喜欢数学课的女生人数、不喜欢数学课的女生人数。 a 如果性别与是否喜欢数学课有关系, 如果性别与是否喜欢数学课有关系,则男生中喜欢数学课的比例 a + b c 应该相差很多, 与女生中喜欢数学课的比例 应该相差很多,即
500人身上试验某种血清预防感冒作用 人身上试验某种血清预防感冒作用, 例 3. 在 500 人身上试验某种血清预防感冒作用 , 把他们一年中的 感冒记录与另外500名未用血清的人的感冒记录作比较, 500名未用血清的人的感冒记录作比较 感冒记录与另外 500 名未用血清的人的感冒记录作比较 , 结果如 表所示。 表所示。 未感冒 感冒 合计
例5:气管炎是一种常见的呼吸道疾病,医药研究人 :气管炎是一种常见的呼吸道疾病, 员对两种中草药治疗慢性气管炎的疗效进行对比, 员对两种中草药治疗慢性气管炎的疗效进行对比, 所得数据如表所示, 它们的疗效有无差异? 所得数据如表所示,问:它们的疗效有无差异?
例1.秃头与患心脏病
为考察高中生的性别与是否喜欢数学课程之间的关系, 例2 为考察高中生的性别与是否喜欢数学课程之间的关系,在 某城市的某校高中生中随机抽取300名学生,得到如下联表: 某城市的某校高中生中随机抽取 名学生,得到如下联表: 名学生
男 女 总计 喜欢数学课程 不喜欢数学课程 37 85 35 143 72 228 总计 122 178 300
3.5独立性检验的 独立性检验的 基本思想及其初 步应用( 步应用(二)高二数学 选修2-3第三章统计案例
通过图形直观判断两个分类变量是否相关: 通过图形直观判断两个分类变量是否相关: 1、列联表 2、三维柱形图
P(K 2 ≥ k0 ) 0.50
0.40 0.708
其 n = a + b + c + d为 中 样本 量 容 。
0.25 1.323 0.15 2.072 0.10 2.706 0.05 3.841 0.025 5.024 0.010 6.635 0.005 7.879 0.001 10.828
k0
0.455
K 2 > 10.828
0.1%把握认为A 0.1%把握认为A与B无关 把握认为
1%把握认为A 1%把握认为A与B无关 把握认为
99.9%把握认A 99.9%把握认A与B有关 把握认 99%把握认为A 99%把握认为A与B有关 把握认为 90%把握认为A 90%把握认为A与B有关 把握认为
在某医院,因为患心脏病而住院的665名男性病人中,有214 名男性病人中, 例1 在某医院,因为患心脏病而住院的 名男性病人中 人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有 人秃顶; 而另外 名不是因为患心脏病而住院的男性病人中有 175人秃顶。 分别利用图形和独立性检验方法判断秃顶与患心脏 人秃顶。 人秃顶 病是否有关系?你所得的结论在什么范围内有效? 病是否有关系?你所得的结论在什么范围内有效? 解:根据题目所给数据得到如下列联表: 根据题目所给数据得到如下列联表:
秃顶 不秃顶 总计
患心脏病 600 500 400 300 200 100 0 214 175 451
患心脏病 214 451 665
患其他病 597
不患心脏病 175 597 772
总计 389 1048 1437
患其他病
秃头 不秃头
患心脏病
相应的三维柱形图如图所 比 较来 副对 示 , 比较 来 说 , 底 面 副对 角线 上两 个 柱 体高 度 的乘 上 两个 的乘 大 一些 以在 积要 大一 些 , 因此 可 以在 程 度上 顶与 某种 程度 上 认 为 “ 秃 顶与 患心脏病有关” 患心脏病有关”。
反证法原理与假设检验原理 反证法原理:
在一个已知假设 下,如果推出一 个矛盾,就证明 了这个假设不成 立。
假设检验原理:
在一个已知假设 下,如果一个与 该假设矛盾的小 概率事件发生, 就推断这个假设 不成立。
在某医院,因为患心脏病而住院的665名男性病人中,有214 名男性病人中, 例1 在某医院,因为患心脏病而住院的 名男性病人中 人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有 人秃顶; 而另外 名不是因为患心脏病而住院的男性病人中有 175人秃顶。 分别利用图形和独立性检验方法判断秃顶与患心脏 人秃顶。 人秃顶 病是否有关系?你所得的结论在什么范围内有效? 病是否有关系?你所得的结论在什么范围内有效? 解:根据题目所给数据得到如下列联表: 根据题目所给数据得到如下列联表:
c+d
≈
a c ad − bc − = a+b c+d (a + b)(c + d )
n(ad − bc) 2 ⇒K = , (a + b)(c + d )(a + c)(b + d )
2
为考察高中生的性别与是否喜欢数学课程之间的关系, 例2 为考察高中生的性别与是否喜欢数学课程之间的关系,在 某城市的某校高中生中随机抽取300名学生,得到如下联表: 某城市的某校高中生中随机抽取 名学生,得到如下联表: 名学生
感冒与是否使用该血清没有关系。 解:设H0:感冒与是否使用该血清没有关系。
1000(252× 276 − 224× 248) 2 K = ≈ 7.075 476×524×500×500
2
因当H 成立时, 的概率约为0.01,故有 因当 0成立时,K2≥6.635的概率约为 的概率约为 ,故有99%的把握认 的把握认 为该血清能起到预防感冒的作用。 为该血清能起到预防感冒的作用。
男 女 总计 喜欢数学课程 不喜欢数学课程 37 85 35 143 72 228 总计 122 178 300
由表中数据计算K 的观测值k 4.514。能够以 由表中数据计算 2的观测值 。能够以95%的把握认为高 的把握认为高 中生的性别与是否喜欢数学课程之间有关系吗? 中生的性别与是否喜欢数学课程之间有关系吗?请详细阐述得出 结论的依据。 结论的依据。
K 2 > 6.635
K 2 > 2.706
K 2 ≤ 2.706
10%把握认为A 10%把握认为A与B无关 把握认为
没有充分的依据显示A 没有充分的依据显示A与B有关,但也不能显示A与B无关 有关,但也不能显示A
6、独立性检验的步骤 、
第一步: 吸烟和患病之间没有关系 第一步:H0: 吸烟和患病之间没有关系 第二步:列出2 第二步:列出2×2列联表
使用血清 未使用血清 合计 252 224 476 248 276 524 500 500 1000
试画出列联表的条形图,并通过图形判断这种血清能否起到预 试画出列联表的条形图, 防感冒的作用?并进行独立性检验。 防感冒的作用?并进行独立性检验。
P(k≥k0) 0.50 0.40 0.25 0.15 k0 0.10 0.05 0.025 0.010 0.005 0.001 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
秃顶 不秃顶 总计 患心脏病 214 451 665 不患心脏病 175 597 772 总计 389 1048 1437
根据联表1-13中的数据,得到 中的数据, 根据联表 中的数据
1437×(214×597 −175×451)2 2 K = ≈16.373 > 6.635. 389×1048×665×772
患病 吸烟 不吸烟 总计 a c a+c 不患病 b d b+d 总计 a+b c+d a+b+c+d
n(ad −bc)2 第三步: 第三步:计算 K2 = (a + c)(b + d)(a + b)(c + d)
第四步:查对临界值表,作出判断。 第四步:查对临界值表,作出判断。
P(κ≥k0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
4、等高条形图
1 0.9
0.8
患肺癌 比例
0.7
0.6
0.5
0.4
0.3
0.2
不患肺癌 比例 不吸烟
不不不
0.1
0
吸烟
不不
等高条形图更清晰地表达了两种情况下患肺癌的比例。
5、独立性检验 独立性检验
n(ad − bc)2 随机变量-----卡方统计量 K2 = 随机变量 , (a + b)(c + d)(a + c)(b + d)
3、二维条形图
8000 7000 6000 5000 4000 不患肺癌 患肺癌
不吸烟 不患肺癌 患肺癌 吸烟
3000 2000 1000
0 从三维柱形图能清晰看出 各个频数的相对大小。 各个频数的相对大小。
不吸烟
吸烟
从二维条形图能看出, 从二维条形图能看出,吸烟者中 患肺癌的比例高于不患肺癌的比例。 患肺癌的比例高于不患肺癌的比例。
由表中数据计算K 的观测值k 4.514。能够以 由表中数据计算 2的观测值 。能够以95%的把握认为高 的把握认为高 中生的性别与是否喜欢数学课程之间有关系吗? 中生的性别与是否喜欢数学课程之间有关系吗?请详细阐述得出 结论的依据。 结论的依据。
以上的把握认为“ 解:可以有95%以上的把握认为“性别与喜欢数学课程之间有关系”。 可以有95%以上的把握认为 性别与喜欢数学课程之间有关系” 分别用a,b,c,d表示样本中喜欢数学课的男生人数、不喜欢数学课的男生 表示样本中喜欢数学课的男生人数、 分别用 表示样本中喜欢数学课的男生人数 人数、喜欢数学课的女生人数、不喜欢数学课的女生人数。 人数、喜欢数学课的女生人数、不喜欢数学课的女生人数。 a 如果性别与是否喜欢数学课有关系, 如果性别与是否喜欢数学课有关系,则男生中喜欢数学课的比例 a + b c 应该相差很多, 与女生中喜欢数学课的比例 应该相差很多,即
500人身上试验某种血清预防感冒作用 人身上试验某种血清预防感冒作用, 例 3. 在 500 人身上试验某种血清预防感冒作用 , 把他们一年中的 感冒记录与另外500名未用血清的人的感冒记录作比较, 500名未用血清的人的感冒记录作比较 感冒记录与另外 500 名未用血清的人的感冒记录作比较 , 结果如 表所示。 表所示。 未感冒 感冒 合计
例5:气管炎是一种常见的呼吸道疾病,医药研究人 :气管炎是一种常见的呼吸道疾病, 员对两种中草药治疗慢性气管炎的疗效进行对比, 员对两种中草药治疗慢性气管炎的疗效进行对比, 所得数据如表所示, 它们的疗效有无差异? 所得数据如表所示,问:它们的疗效有无差异?
例1.秃头与患心脏病
为考察高中生的性别与是否喜欢数学课程之间的关系, 例2 为考察高中生的性别与是否喜欢数学课程之间的关系,在 某城市的某校高中生中随机抽取300名学生,得到如下联表: 某城市的某校高中生中随机抽取 名学生,得到如下联表: 名学生
男 女 总计 喜欢数学课程 不喜欢数学课程 37 85 35 143 72 228 总计 122 178 300
3.5独立性检验的 独立性检验的 基本思想及其初 步应用( 步应用(二)高二数学 选修2-3第三章统计案例
通过图形直观判断两个分类变量是否相关: 通过图形直观判断两个分类变量是否相关: 1、列联表 2、三维柱形图