独立性检验的基本思想及其初步应用.ppt

合集下载

3.2独立性检验的基本思想及其初步应用

3.2独立性检验的基本思想及其初步应用
9000 8000 7000 6000 5000 4000 3000 2000 1000
0
a
b
c
d
a+c b+d
不吸烟
总计 a+b c+d a+b+c+d
不吸烟 吸烟 总计
不患肺癌 a c
a+c
患肺癌 b d
b+d
总计 a+b c+d a+b+c+d
患肺癌 不患肺癌
吸烟
(2)在二维条形图中,两个比例的值相差越大,H1成立的可 能性就越大
到如下结果:
类变量的频数表
不患肺癌 患肺癌 总计 比例
不吸烟 7775
42
7817 0.54%
吸烟
2099
49
2148 2.28%
总计
9874
91
9965
问:吸烟是否对患肺癌有影响?
解 从图表的比例可以看出:吸烟与不吸烟 可能对患肺癌的可能存在差异,我们再通 过不同的图表来分析
三维柱形图
不吸烟 吸烟 总计
3.2独立性检验的基 本思想及其初步应用
两种变量:
定量变量:体重、身高、温度、考试成绩等等。
变量 分类变量:性别、是否吸烟、是否患肺癌、
宗教信仰、国籍等等。
研究两个变量的相关关系:
定量变量——回归分析(画散点图、相关系数r、
变量
相关指数R2、残差分析)
分类变量—— 独立性检验
分类变量:变量的不同”值”表示个体所属 的不同类别.
患肺癌 b d
b+d
总计 a+b c+d a+b+c+d

2020学年高中数学第3章统计案例3.2独立性检验的基本思想及其初步应用课件新人教A版选修2_3

2020学年高中数学第3章统计案例3.2独立性检验的基本思想及其初步应用课件新人教A版选修2_3

返回目录
(2)独立性检验(精确判断) 具体实施步骤如下: ①根据实际问题需要的可信程度确定临界值 k0; ② 根 据 观 测 数 据 计 算 随 机 变 量 K2 = a+bcn+add-ab+cc2b+d的观测值 k,其中 n=a+b+c+ d 为样本容量;
返回目录
③查临界值表(以K2的观测值k的大小作为检验在多 大程度上可以认为“两个变量有关系”的标准),如果 k≥k0,就以(1-P(K2≥k0))×100%的把握认为“两分类 变量有关系”;否则,就认为根据样本数据没有充分的 理由说明“两分类变量有关系”.
返回目录
2.(独立性检验)有人发现,多看电视容易使人变冷 漠,下表是一个调查机构对此现象的调查结果.
冷漠 不冷漠 总计 多看电视 68 42 110 少看电视 20 38 58
总计 88 80 168
返回目录
则大约有多大的把握认为多看电视与人变冷漠有关
系( )
A.99%
B.97.5%
C.95%
D.90%
返回目录
要点三 独立性检验
定义 利用随机变量K2来判断“两个分类变量有关系” 的方法称为独立性检验 nad-bc2
公式 K2=_____a_+__b__c_+__d__a_+__c___b_+__d_____,其中n= ___a_+_b_+__c_+__d___
返回目录
①认真读题,取出相关数据,作出2×2列联表; 具体 ②根据2×2列联表中的数据,计算K2的观测值k; 步骤 ③通过观测值k与临界值k0比较,得出事件有关的
返回目录
P(K2≥k0) 0.100 0.050 0.010 k0 2.706 3.841 6.635
思维导引:根据列联表直接代入K2公式可得南方学 生和北方学生的差异与是否喜欢甜品的相关程度.

1.2 独立性检验的基本思想及其初步应用

1.2 独立性检验的基本思想及其初步应用

2.下列是一个2×2列联表:
y1
x1
a
x2
2
总计
b
则该表中a,b的值分别为( C )
A.94,96
B.52,50
y2
总计
21
73
25
27
46
100
C.52,54
解析:a=73-21=52,b=a+2=52+2=54.
D.54,52
——能力提升——
14.(5分)假设两个分类变量X与Y,它们的取值分别为{x1,x2},
样方法在校园内调查了 120 位学生,得到如下 2×2 列联表:
男 女 总计
爱好
a
b
73
不爱好
c
25
总计
74
则 a-b-c 等于( D )
A.6
B.7
C.8
D.9
13.(13分)某校为了了解学生对紧急避险常识的了解情况,从高 一年级和高二年级各选取100名同学参加紧急避险常识知识竞赛.图 ①和图②分别是对高一年级和高二年级参加竞赛的学生成绩按 [40,50),[50,60),[60,70),[70,80]分组后得到的频率分布直方图.
高二年级学生竞赛的平均成绩为(45×15+55×35+65×35+ 75×15)÷100=60(分).
(2)补全2×2列联表如下:
成绩小于60分 成绩不小于60
总计
的人数
分的人数
高一年级
70
30
100
高二年级
50
50
100
总计
120
80
200
∴K2的观测值k=20100×0×501×007×0-12500××83002≈8.333>7.879,

1.2独立性检验的基本思想及其初步应用

1.2独立性检验的基本思想及其初步应用
值越大. (× )
(2)在假设条件下,计算构造的随机变量K2,如果由观测数据 计算得到的K2很大,则在一定程度上说明假设不合理.
(3)根据随机变量K2的含义,可以通过(2)式评价假设不合理 的程度,由实际计算出的k>6.635,说明假设不合理的程度约为 99%,即“两个分类有关系”这一结论成立的可信程度约为99%.
反证法原理与独立性检验原理
x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
独立性检验的定义
上面这种利用随机变量K2来确定在多大 程度上可以认为“两个分类变量有关系”的 方法,称为两个分类变量的独立性检验。
例1.在500人身上试验某种血清预防感冒作用,把他们 一P(年χ≥x中0) 的0.5感0 冒0.4记0 录0.与25 另0.1外5 500.100名0未.05用0血.02清5 0的.01人0 的0.0感05 冒0.0记01 录作x0 比较0.4,55结0.7果08如1.3表23所2.0示72。2.7问06:3.该841种5血.02清4 6能.63否5 起7.8到79 预10.防828 感冒的作用?
99.9%把握认 为A与B有关
K 2 6.635
1%把握认为A与B无 关
99%把握认 为A与B有关
K 2 2.706 10%把握认为 A与B无关
90%把握认 为A与B有关
K 2.706 2 没有充分的依据显示A与B有关,但也不能显示A与B无关
独立性检验的步骤
第一步:H0: 吸烟和患肺癌没有关系
未感冒
感冒
合计
使用血清
258
242
500
未使用血清
216

独立性检验的基本思想及其初步应用说课课件

独立性检验的基本思想及其初步应用说课课件

二、课堂教学引入
2、研究人员记录下他们在这12个月内有无手机的情况,同时教师记 下这些学生出现的注意力不集中的问题,统计获得下列数据:
注意力不集中 有手机 无手机 总计 489 268 757 注意力集中 209 357 566 总计 698 625 1323
(1)在有手机的学生中,注意力不集中的比重为 多少? 设计意图: 在无手机的学生中,注意力不集中的比重为 多少? 通过解决实际中的问题,学生更加清楚数学的重要性。该 (2)根据网上收集到的新闻,利用上述统计结果进行推测。从这则 新闻来看,手机是否对注意力有影响?有多大的把握认为你所得的结论正 研究问题对学生而言很有实际意义,这个新闻从学生的切身实 确?
三、课程内容创新设计
5、卡方统计量公式的合理性说明
方式2 类比方差公式的结构特征
S
2
x E x
2 1

2
E … xn E
2
2
x E
i
2
n

防止正负抵消,掩盖事实的真相 防止因样本容量的不同而使方差的
值差异太大,意在取平均值
1 n
三、课程内容创新设计
5、卡方统计量公式的合理性说明
方式1 类比随机事件概率的来之不易
随机事件 :掷一枚硬币,正面向上。 在经过大量的重复试验之后,频率在常数0.5附近 摆动并趋于稳定,这时称0.5为随机事件的概率。 类比到卡方统计量公式
统计学中的结论公式都是在大量重复试验之后并结合 我们现在还不知道的统计学相关知识后得出的”因为学生对于 这个问题,一直与家长和学校有不同的想法和观点, 探讨时让具有相同看法的学生组成一组,给他们一个 “机会”证明自己的观点,有利于提高学生的积极性。

独立性检验课件

独立性检验课件
四、独立性检验 的基本步骤 1) 2) 3) 五、布置作业
一、概念 三、例题 1)分类变量 1)练习1 2)列联表 二、独立性检验 2)练习2 的概念
34
这就是我本节课的设计思路,恳请各 位老师批评、指正。
35
26
操 作 步 骤
(三)深入探究,加深理解
问题3:应用独立性检验的方法解决实际问题会 犯错吗?为什么?
27
(四)、强化训练,巩固双基 练习1、在某医院,因为患心脏病而住院的665 名男性病人中,有214人秃顶,而另外772名 不是因为患心脏病而住院的男性病人中有175 人秃顶。 (1)利用图形判断秃顶与患心脏病是否有关系; (2)能否在犯错误的概率不超过0.01的前提下认 为秃顶与患心脏病有关?
3、情感目标
培养学生实事求是的科学态度,提高学生对信 息的整合能力,感受数学在现实生活中是“有用的”.
6
三、教学重点和难点
教学重点:如何用 性检验. 对2×2列联表进行独立
教学难点:独立性检验的思想和应用.
7
二 教法和学法
1、教学特点: ① 用学案辅助教学 由于本节内容较散,理论部分较难,所以我 精心设计了导学案,提前发放给学生,以提高 学生的预习效率. ② “问题串”为主,“讲授式”为辅的教学模 式
独立性检验的基本思想 及其初步应用
濮阳市第一高级中学 宋玉芳
1
说课思路
教材 分析

教法 学法

教学 过程
板书 设计
2
一、教材分析
(一)教材的地位和作用 本节课是人教A版(选修)2—3第三章第 二节第一课时的内容.是在学习了回归分析的 基本思想及初步应用之后,利用独立性检验进 一步分析两个分类变量之间是否有关系,也为 以后学习统计理论奠定了基础.在近几年各省新 课标高考试题中,本节内容屡屡出现,而且多 以解答题的形式命题,其重要性可见一斑.

3.2独立性检验的基本思想及初步应用


解:根据题目所给数据得到如下列联表:
秃顶 不秃顶
总计
患心脏病 不患心脏病
214
175
451
597
665
772
总计 389 1048 1437
根据联表1-13中的数据,得到
K2
1437 (214597 175 451)2
16.373 6.635.
3891048 665 772
所以有99%的把握认为“秃顶患心脏病有关”。
物理优秀 物理非优秀
数学优秀
228
132
数学非优秀 143
737
合计
371
869
代入公式可得 K 2 270.1143.
合计 360 880 1240
数学优秀 数学非优秀
物理 228 143
化学 225 156
其中n a b c d
若H0成立,K 2越小,则吸烟与患肺癌越没有关系
独立性检验有关数据:
P(K2 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 ≥k0)
k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
总计
患病 a c
a+c
不患病 b d
b+d
总计 a+b c+d a+b+c+d
第三步:计算 K 2
n(ad bc)2
(a c)(b d)(a b)(c d)
第四步:查对临界值表,作出判断。
P(k≥k0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001

独立性检验PPT课件

用“假设检验”解决此问题
Page 3
请看下面的表格
表(一)
表(二)
Page 4
(一)反证法思想
结论如下:
︱ad – bc ︱越小,说明吸 烟与患肺癌之间的关系越 弱。
︱ad – bc ︱越大,说明吸 烟与患肺癌之间的关系越 强。
Page 5
(二)统一的评判标准
一般认为,小概率事件在一次 试验中不会发生,据此原则, 如果在某种假设下小概率事件 在一次试验中发生了,则认为 此假设不成立。(即H0不成立)
谢 谢 !ຫໍສະໝຸດ Page 6表(三) K2检验的临界值表
Page 7
(三) 假设检验的基本步骤:
(1)假设H0:两个分类变量没有关系; (2)求K2的观测值k; (3)⒈给定显著性水平α ,查表(三)定出临界值k0,与k进行 比较;⒉未给定显著性水平α,根据实际问题的需要确定容 许推断“两个分类变量有关系”犯错误概率的上界α,然后查 表(三)确定临界值k0 与k进行比较;
(4)若k≥k0,则拒绝H0,认为两个分类变量有关系; 若k<k0, 则接受H0,认为两个分类变量没有关系。
Page 8
小结: 反证法原理与假设检验原理
反证法原理
在一个已知假 设下,如果推 出一个矛盾, 就证明了这个 假设不成立。
Page 9
假设检验原理
在一个已知假设 下,如果推出一 个小概率事件发 生,则推断这个 假设不成立的可 能性很大。
1.2 独立性检验的基本 思想及其初步应用
樊永丽
樊永丽
-
1
有一个颠扑不破的真理,那就是当我 们不能确定什么是真的时候,我们就
应该去探求什么是最可能的。 ----------笛卡尔

高二数学独立性检验的基本思想及其初步应用


不吸烟
吸烟
为了更清晰地表达这个 特征, 我们还可用如下的等 高条形图表示两种情况 下患肺癌的比例.如图3.2 3 所示, 在等高条形图中 , 绿色的条高表示不患肺 癌 的百分比 ;黑色的条高表示患肺癌 的百分比 .
图3.2 3
上面我们通过分析数据 和图形 , 得到的直观印 象是吸烟和患肺癌有关 .那么事实是否真的如 此呢 ? 或者说我们能够以多大 的把握认为 "吸 烟与患肺癌有关 "呢 ? 为了回答上述问题, 我们先假设 H0 : 吸烟与患肺癌没有关系. 用A表示不吸烟,B表示不患肺癌, 则" 吸烟与患 肺 癌没有关系 " 等价于" 吸烟与患肺癌独立" , 即H0等价于 PAB PA PB .
分别用 a, b, c, d表示样本中喜欢数学课 的男生人数、 不喜欢数学课的男生人 数、喜欢 数学课的女生人 数、不喜欢数学课的女 生人数 .如果性别与是否喜 欢 数 学 课 有关 系 , 则男 生中喜 欢 数 学 课 的比 例 a c 与女生中喜欢 数学课的人数比例 应该 ab cd a c ac bd 相差很多, 即 应很大. a b c d a b c d
nad bc K a bc da c b d 其中n a b c d为样本容量.
2 2
1
若H0成立, 即" 吸烟与肺癌没有关系" , 则K 2应该 很小.现在, 根据表3 7中的数据, 利用公式1计 算得K 2的观测值为 9965 7775 49 42 2099 k 56.632, 7817 2148 9874 91 这个值是不是很大呢 ? 在H0成立的情况下, 统计学家估算出如下概率 2 PK 2 6.635 0.01. 即在H0成立的情况下K 2的值大于6.635的概率 非常小.近似于0.01.也就是说.在H0成立的情况

1.2 独立性检验的基本思想及其初步应用



根据题目所给数据得到如下列联表
患心脏病 患其他病 214 175 451 597 665 772 总计 389 1048 1437
表1 11 秃顶与患心脏病列联表
秃顶 不秃顶 总计
相应的三 维柱形图 如图1.2 4 所示.比 较来说, 底面副对角 线上两个柱 体 高度 的乘积要大一些, 可 以在 某种程度上认 为" 秃顶与患心脏病有关". 根据列联表1 11中的数据, 得到
1.2 独立性检验的基本 思想及其初步应用
对于性别变量 其取值为男和女两种这 , . 种变量的不同 值" 表示个体所属的不同 " 类 别 , 像这类变量称为 分类变量 .在现实 生活中, 分类变量是大量存在的例如 是 , 否吸烟 宗教信仰国籍, 等等. , , 在日常生活中我们常常关心两个分类 , 变 量之间是否有关系 .例如, 吸烟与肺癌是否 有关系? 性 别对于是否喜欢数学课 程 有 影响? 等等.
患其他病
秃顶
不秃顶
患心脏病
图1.2 4
2 为考察高中生的性别与 是否喜欢数学课程 之间的关系 , 在某城市的某校高中生 中随机 抽出 300名学生, 得到如下列联表 :
表1 12 性别与喜欢数学课程列联表
男 女 总计
喜欢数学课程 不喜欢数学课程 总计 37 85 122 35 143 178 72 228 300
2.可以利用独立性检验来考察两个分类变量是否 有关系, 并且能较精确地给出这种判断的可靠程度. 具体做法是 : 根据 观测数据计算则 1 式给出的检 验随机变量K 2的值k , 其值越大, 说明 " X与Y有关系" 成立的可能性越大.当得到的观测数据 a, b, c, d 都不 小于5时, 可以通过查阅下表 (表1 10 ) 来确定结论 " X与Y有关系"的可信程度.
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档