3.2独立性检验的基本思想及其初步应用

合集下载

3.2独立性检验的基本思想及其初步应用

3.2独立性检验的基本思想及其初步应用
9000 8000 7000 6000 5000 4000 3000 2000 1000
0
a
b
c
d
a+c b+d
不吸烟
总计 a+b c+d a+b+c+d
不吸烟 吸烟 总计
不患肺癌 a c
a+c
患肺癌 b d
b+d
总计 a+b c+d a+b+c+d
患肺癌 不患肺癌
吸烟
(2)在二维条形图中,两个比例的值相差越大,H1成立的可 能性就越大
到如下结果:
类变量的频数表
不患肺癌 患肺癌 总计 比例
不吸烟 7775
42
7817 0.54%
吸烟
2099
49
2148 2.28%
总计
9874
91
9965
问:吸烟是否对患肺癌有影响?
解 从图表的比例可以看出:吸烟与不吸烟 可能对患肺癌的可能存在差异,我们再通 过不同的图表来分析
三维柱形图
不吸烟 吸烟 总计
3.2独立性检验的基 本思想及其初步应用
两种变量:
定量变量:体重、身高、温度、考试成绩等等。
变量 分类变量:性别、是否吸烟、是否患肺癌、
宗教信仰、国籍等等。
研究两个变量的相关关系:
定量变量——回归分析(画散点图、相关系数r、
变量
相关指数R2、残差分析)
分类变量—— 独立性检验
分类变量:变量的不同”值”表示个体所属 的不同类别.
患肺癌 b d
b+d
总计 a+b c+d a+b+c+d

3.2《独立性检验》

3.2《独立性检验》

(这是“反证法”采用的假 设)
1. ad bc 越小说明吸烟与患肺癌之间关系越弱; 2. ad bc 越大说明吸烟与患肺癌之间关系越强;
这就是用数量来刻画“有关”程度的一种 方法
为了使不同样本容量的数据有一个统一的标准,我们构造一个随机变量K 2,
2 n ( ad bc ) k2的观测值为 K ,其中n=a+b+c+d为样本容量 (a b)(c d )(a c)(b d )
在假设H0成立的前提下,K 2的观测值k应该比较小。
当k很小时,H0成立的理由很充分,即没有足够的理由拒绝H0成立。 k很大时,说明没有充分的证据说明H0成立。 “假设H ”成立的概率
k大小的“标准”是什么呢?
P(K 2 k0 ) 0.50
0.40 0.708 0.25 1.323
0
临界值表
0.10 2.706
k0
在吸烟与患肺病这两个分类变量的计算中,下列说法正确
的是( c

A、若K的观测值为k=6.635,我们有99%的把握认为吸烟与患 肺病有关系,那么在100个吸烟的人中必有99个患肺病 B、从独立性检验可知有99%的把握认为吸烟与患肺病有关 系时,我们说某人吸烟,那么他有99%的可能患肺病
C、若从统计量中求出有95%的把握认为吸烟与患肺病有关
9965(7775 49 42 2099)2 K 的观测值为 k 56.632 7817 2148 9874 91
2
根据临界值表可知P( K 2 10.828) 0.001 只有0.1%的理由说明H0成立,所以有99.9%的理由判断H0不成立, 所以吸烟与患癌症有关系。
这种判断可能有错误,但是犯错误的概率不会超过0.001,这 是个小概率事件,我们有99.9%的把握认为“吸烟与患癌症有 关系”

3.2独立性检验的基本思想及其初步应用教学设计4

3.2独立性检验的基本思想及其初步应用教学设计4

第三章统计案例3.2独立性检验的基本思想及其初步应用(一)主备教师:王天君课时计划:2节课一、内容及其解析:本节是人教A版高中数学选修3--2回归分析的基本思想及其初步应用的教学内容。

通过探究“吸烟是否与患肺癌有关系”,了解样本数据的列联表、柱形图和条形图。

二、目标及其解析目标:1、与列联表相关的概念①什么是分类变量?②什么是列联表2、三维柱形图和二维条形图与列联表相比有什么优点?解析:1、①变量的不同“值”表示个体所属的不同类别的变量称为分类变量。

②:分类变量的汇总统计表(频数表)。

2、与表格相比,三维柱形图和二维条形图能更直观地反映出相关数据的总体状况。

可以粗略地判断两个变量是否有关系。

三、问题诊断与分析本节课通过探究“吸烟是否与患肺癌有关系”,了解样本数据的列联表、柱形图和条形图。

学生易于理解,基本不会有多大问题。

四、教学过程问题一:与列联表相关的概念有哪些?设计意图:直接提出问题,让学生了解样本数据的列联表。

师生活动:以问题串的形式完成。

问题1:什么是分类变量?变量的不同“值”表示个体所属的不同类别的变量称为分类变量。

分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女两个值,商品的等级变量只取一级、二级、三级,等等. 分类变量的取值有时可用数字来表示,但这时的数字除了分类以外没有其他的含义. 如用“0”表示“男”,用“1”表示“女”。

77752099问题2:什么是列联表:分类变量的汇总统计表(频数表)。

一般我们只研究每个分类变量只取两个值,这样的列联表称为22⨯. 如吸烟与患肺癌的列联表:象这样的两个分类变量的频数表叫列联表. 在不吸烟者中,有0.54%患有肺癌;在吸烟者中,有2.28%患有肺癌。

因此,直观上可以得到结论: 吸烟者和不吸烟者患肺癌的可能性存在差异。

问题二:三维柱形图和二维条形图与列联表相比有什么优点? 设计意图:直接提出问题,让学生明确思想。

2020学年高中数学第3章统计案例3.2独立性检验的基本思想及其初步应用课件新人教A版选修2_3

2020学年高中数学第3章统计案例3.2独立性检验的基本思想及其初步应用课件新人教A版选修2_3

返回目录
(2)独立性检验(精确判断) 具体实施步骤如下: ①根据实际问题需要的可信程度确定临界值 k0; ② 根 据 观 测 数 据 计 算 随 机 变 量 K2 = a+bcn+add-ab+cc2b+d的观测值 k,其中 n=a+b+c+ d 为样本容量;
返回目录
③查临界值表(以K2的观测值k的大小作为检验在多 大程度上可以认为“两个变量有关系”的标准),如果 k≥k0,就以(1-P(K2≥k0))×100%的把握认为“两分类 变量有关系”;否则,就认为根据样本数据没有充分的 理由说明“两分类变量有关系”.
返回目录
2.(独立性检验)有人发现,多看电视容易使人变冷 漠,下表是一个调查机构对此现象的调查结果.
冷漠 不冷漠 总计 多看电视 68 42 110 少看电视 20 38 58
总计 88 80 168
返回目录
则大约有多大的把握认为多看电视与人变冷漠有关
系( )
A.99%
B.97.5%
C.95%
D.90%
返回目录
要点三 独立性检验
定义 利用随机变量K2来判断“两个分类变量有关系” 的方法称为独立性检验 nad-bc2
公式 K2=_____a_+__b__c_+__d__a_+__c___b_+__d_____,其中n= ___a_+_b_+__c_+__d___
返回目录
①认真读题,取出相关数据,作出2×2列联表; 具体 ②根据2×2列联表中的数据,计算K2的观测值k; 步骤 ③通过观测值k与临界值k0比较,得出事件有关的
返回目录
P(K2≥k0) 0.100 0.050 0.010 k0 2.706 3.841 6.635
思维导引:根据列联表直接代入K2公式可得南方学 生和北方学生的差异与是否喜欢甜品的相关程度.

第三章--统计案例-3.2-独立性检验的基本思想及其初步应用

第三章--统计案例-3.2-独立性检验的基本思想及其初步应用

解:由列联表中的数据,得 K2 的观测值为 1 633×30×1 355-224×242 k= ≈68.033>10.828. 254×1 379×54×1 579 因此,在犯错误的概率不超过 0.001 的前提下,认为每 一晚都打鼾与患心脏病有关.
为了调查某生产线上,某质量监督员甲对产
品质量好坏有无影响,现统计数据如下:质量监督员在现 场时,990件产品中合格品为 982 件,次品数为 8 件,甲不 在现场时,510件产品中合格品为493件,次品数为17件, 试分别用列联表、等高条形图、假设检验的方法对数据进
的方法来判断色盲与性别是否有关?你所得的结论在什么
范围内有效? 解:根据题目所给的数据作出如下的列联表: 色盲 不色盲 合计
男 女 合计
38 6 44
442 514 956
480 520 1 000
根据列联表作出相应的等高条形图,如图所示:
38 从等高条形图来看在男人中患色盲的比例480比在女人
38 6 6 中患色盲的比例520要大,其差值为480-520 ≈0.068,差
位统一,图形准确,但它不能给我们两个分类变量有关或
无关的精确的判断,若要作出精确的判断,可以进行独立 性检验的有关计算.
本题应首先作出调查数据的列联表,再根据列联表画
出等高条形图,并进行分析,ห้องสมุดไป่ตู้后利用独立性检验作出判 断.
在调查 480 名男士中有 38 名患有色盲, 520名女士中有6名患有色盲,分别利用图形和独立性检验


③如果 k≥k0 ,就推断“X与Y有关系”,这种推断
犯错误的概率不超过α;否则,就认为在犯错误的概 率不超过α的前提下不能推断“X与Y有关系”,或者 在样本数据中没有发现足够证据支持结论“X与Y有 关系”.

独立性检验的基本思想及其初步应用

独立性检验的基本思想及其初步应用

如果“吸烟与患肺癌没有关系”,那么吸烟样
本中不患肺癌的比例应该与不吸烟样本中相应的比
例差不多.
所以
a a+
b

c
c +d
,
所以 a c + d ca + b,
ad bc
即 ad bc 0.
︱ad-bc︱越小,说明吸烟与患肺癌之间的关系越弱;
︱ad-bc︱越大,说明吸烟与患肺癌之间的关系越强.
患心脏病 患其他病 总计
秃顶
214
175
389
不秃顶
451
597
1 048
总计
665
772
1 437
(1)相应的等高条形图如下所示,
不患心脏病 患心脏病
秃顶
不秃顶
由图可认为秃顶与患心脏病有关系
吸烟与患肺癌列联表(单位:人)
不患肺癌
患肺癌
总计
不吸烟
7 775
42
7 817
吸烟
2 099
49
2 148
总计
9 874
91
9 965
在不吸烟者中患肺癌的比重是__0_._5_4_%_,
在吸烟者中患肺癌的比重是__2_._2_8_%_.
说明:吸烟者和不吸烟者患肺癌的可能性存在差异, 吸烟者患肺癌的可能性大.
K2
(n ad bc)2
(a b)(c d )(a c)(b d )
临界值表:
P ( K 2 k 0 ) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k 0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828

3.2独立性检验的基本思想及其初步应用 课件(人教A版选修2-3)


3. 独立性检验临界值表
P(K2 ≥k 0 ) k0
0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
想一想:在K2运算时,在判断变量相关时,若K2的观测值k= 56.632,则P(K2≥6.635)≈0.01和P(K2≥10.828)≈0.001, 哪种说法是正确的? 提示 两种说法均正确.
兴趣不浓厚的
总计

86
73
103
95
189
判断学生的数学成绩好坏与对学习数学的兴趣是否有关?
解 由公式得 K 的观测值
解 由公式得 K 的观测值 86×103×95×94
2
189× 64×73-22×30 k189 = ×64×73-22×302 ≈38.459. 86 × 103 × 95 × 94 k= ≈38.459.
想一想:如何理解分类变量?
提示
(1)这里的“变量”和“值”都应作为“广义”的变量和值
来理解.例如:对于性别变量,其取值有“男”和“女”两 种,这里的“变量”指的是“性别”,这里的“值”指的是“男”
或“女”.因此,这里说的“变量”和“值”不一定是取具体的
数值. (2)分类变量是大量存在的.例如:吸烟变量有吸烟与不 吸烟两种类别,而国籍变量则有多种类别.
2.独立性检验 利用随机变量K2来判断“两个分类变量有关系”的方法 定义 称为独立性检验
公式
n ad-bc2 a+bc+da+c b+d K2=_______________________ 其中n=___________ a+b+c+d

高中数学人教A版选修2-3课件:3.2独立性检验的基本思想及其初步应用

x
).
问题导学
当堂检测
一、用列联表和等高条形图分析两变量间的关系
活动与探究 问题 1:怎样从列联表判断两个分类变量有无关系? 提示:|ad-bc|越小,说明两个分类变量 x,y 之间的关系越弱;|ad-bc|越 大,说明 x,y 之间的关系越强.
x
问题 2:等高条形图对分析两个分类变量是否有关系,有何帮助? 提示:通过画等高条形图,我们可以通过观察两个变量的比例关系, 直观判断两个变量是否有关系.
问题导学
当堂检测
(1)利用列联表直接计算 分类变量之间有关系.
������ ������ 和 ,如果两者相差很大,就判断两个 ������+������ ������+������
(2)在等高条形图中展示列联表数据的频率特征,比较图中两个深 色条的高可以发现两者频率不一样而得出结论 ,这种直观判断的不足 之处在于不能给出推断“两个分类变量有关系”犯错误的概率.
问题导学
当堂检测
相应的等高条形图如图所示.
图中两个深色条的高分别表示甲在生产现场和甲不在生产现场样 本中次品数的频率.从图中可以看出,甲不在生产现场样本中次品数的 频率明显高于甲在生产现场样本中次品数的频率 .因此可以认为质量 监督员甲在不在生产现场与产品质量好坏有关系 .
问题导学
当堂检测
迁移与应用 某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格 内向的学生 426 人中有 332 人在考前心情紧张,性格外向的学生 594 人 中有 213 人在考前心情紧张,作出等高条形图,利用图形判断考前心情 紧张与性格类别是否有关系. 解:作列联表如下:
2
其中 n=a+b+c+d 为样本容量.

《3.2独立性检验的基本思想及其初步应用》教学案5

《3.2独立性检验的基本思想及其初步应用》教学案5一.教学目标:1,理解独立性检验的基本思想; 2,理解独立性检验的实施步骤; 3,了解随机变量K 2的含义。

二.教学重点:理解独立性检验的基本思想实施步骤。

教学难点;1、理解独立性检验的基本思想及实施步骤2、了解随机变量K 2的含义。

三.知识链接独立性检验原理:四.新课学习1. 独立性检验的概念:利用随机变量2K 来确定在多大程度上可以认为“__________”的方法,称为两个分类变量的独立性检验。

2. 独立性检验的步骤:设有两个分类变量X 与Y ,他们的取值分别为 和 其样本频数列联表(称2⨯2列联表)为:引入随机变量2K , ____________________2=K ,(其中d c b a n +++=为样本容量)推断X 与Y 有关系可按下列步骤进行: (1)假设0H : X 与Y 没有关系(2)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界a ,然后查表1-11确定临界值o k(3)利用公式(1),计算随机变量2K 的观测值k 。

(4)如果,就判断“X 与Y 有关系”,这种判断犯错误的概率不超过a ,否则,就认为在犯错误的概率不超过a 的前提下不能推断“X 与Y 有关系”,或则在样本数据中没有发现足够证据支持结论“X 与Y 有关系”,3. 为了使不同样本容量的数据有统一的评判标准,我们利用统计量2K 的观测值k来判断x 与y 有关系的程度。

如果828.10>k ,就有_____的把握认为“x 与y 有关系”; 如果879.7>k ,就有_____的把握认为“x 与y 有关系”; 如果_____>k ,就有99%的把握认为“x 与y 有关系”; 如果_____>k ,就有97.5%的把握认为“x 与y 有关系”;如果841.3>k ,就有_____的把握认为“x 与y 有关系”; 如果706.2>k ,就有_____的把握认为“x 与y 有关系”; 如果706.2≤k,就认为没有充分证据显示“x 与y 有关系” 。

人教版高中数学选修2-3课件:3.2 独立性检验的基本思想及其初步应用(共38张PPT)


P(K2≥k0) 0.05 0.025 0.010 0.005 0.001
例如:
k0
3.841 5.024 6.635 7.879 10.828
①如果k≥10.828,就有99.9%的把握认为“X与Y有关系”;
②如果k≥7.879,就有99.5%的把握认为“X与Y有关系”;
③如果k≥6.635,就有99%的把握认为“X与Y有关系”;
≈7.8.
备课素材
附表:P(K2≥k0) k0
0.050 3.841
0.010 6.635
0.001 10.828
参照附表,得到的正确结论是 (A ) A.有99%以上的把握认为“爱好该项运动与性别有关” B.有99%以上的把握认为“爱好该项运动与性别无关” C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
表(称为2×2列联表)为
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计 a+c
b+d a+b+c+d
若要推断的论述为H1:“X与Y有关系”,则可以按如下步骤判断H1成立的可能性:
预习探究
预习探究
P(K2≥k0) 0.50 0.40 0.25 0.15 0.10
k0
0.455 0.708 1.323 2.072 2.706
考点类析
考点一 两分类变量之间关联关系的定性分析
例1 为考察某种药物预防某种疾病的效果,进行了一 项动物试验,得到如下列联表:
服用药 未服用药
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

k2≥6.635
4.某班主任对全班50名学生进行了作业量多 少的调查,数据如下表: 认为作业多 玩游戏 不玩游戏 总 计 18 8 26 认为作业不多 总计 9 15 24 27 23 50
则认为喜欢玩游戏与认为作业量多少有关系的 把握大约为( B ) A. 99% B. 97.5% C. 90% D.无充分依据
2. 下面是一个
2 2
21 25 46
列联表 总计
不健康 健 康
不优秀 a 优 秀 2 总 计 b
73 27 100
则表中a,b的值分别是( c ) A. 94,96 B. 52,50 C. 52,54 D. 54,52
3. 在独立性检验中,当统计量满足 时, 我们有99%的把握认为这两个分类变量有 关系.
枣庄市第十八中学
主讲人 秦真
一、目标展示
1、了解独立性检验的基本思想、方法及其初 步应用。 2、会从列联表(只要求2×2列联表)、条形 图直观分析两个分类变量是否有关
3.会用公式判断两个分类变量在某种程度上的 相关性
问题: 数学家庞加莱每天都从一家
面包店买一块1000g 的面包,并记 录下买回的面包的实际质量。一年 后,这位数学家发现,所记录数据 的均值为950g。于是庞加莱推断这 家面包店的面包分量不足。
思想方法上: 数形结合的思想, 类比的思想
作业:教材习题3.2 1,2
当堂达标
1.在吸烟与患肺病这两个分类变量的计算中,下 列说法正确的是 ( c ) A. 若k=6.635,则有99%的把握认为吸烟与患肺病 有关,那么100名吸烟者中,有99个患肺病. B. 从独立性检验可知,有99%的把握认为吸烟与 患肺病有关时,可以说某人吸烟,那么他有99%的可 能性患肺病. C. 若从统计量中求出有95%的把握认为吸烟与患 肺病有关,是指有5%的可能性使推断出现错误. D. 以上三种说法都不对.
第四步:查临界值表,作出判断。
独立性检验的基本思想类似于数学上的反证法.
要确认”两个分类变量有关系”这一结论成立 的可信程度,首先假设该结论不成立,即假设结论” 两个分类变量没有关系”成立.在该假设下我们 构造的随机变量K2应该很小.如果由观测数据计 算得到的K2的观测值k很大,则断言H0不成立,即 认为“两个分类变量有关系”;如果观测值k很 小,则说明在样本数据中没有发现足够证据拒 绝H0 .
2
所以在犯错误的概率不超过0.01的前提下认为 “秃顶患心脏病有关”。 链接
(试一试)为考察高中生的性别与是否喜欢数 学课程之间的关系,在某城市的某校高中生中 随机抽取300名学生,得到如下列联表:
喜欢数学课程 不喜欢数学 总 计
男 女 总计
37 35 72
85 143 228
122 178 300
4、独立性检验的步骤 第一步:H0: 吸烟和患肺癌之间没有关系 第二步:列出2×2列联表
不吸烟 吸烟 总计
不患肺癌 a c a+c
2
患肺癌 b d b+d
总计 a+b c+d a+b+c+d
2
n(ad bc) 第三步:计算 K (a c)(b d )( a b)(c d )
引入一个随机变量
2
n(ad - bc) K = (a + b)(c+d)(a +c)(b+d)
P(k2≥k0) k0 0.010 0.005 0.001 6.635 7.879 10.828
2
作为检验在多大程度上可以认为“两个变量有 关系”的标准 。
临界值表
若K2≥10.828则有99.9%的把握认为A与B有关若 K2≥6.635则有99%的把握认为A与B有关 上面这种利用随机变量K2来判断“两个分类变量 有关系”的方法称为独立性检验.
• 假设“面包分量足”,则一年购买面包的质量 数据的平均值应该不少于1000g ; • “这个平均值不大于950g”是一个与假设“面包 分量足”矛盾的小概率事件; • 这个小概率事件的发生使庞加莱得出推断结果。
相关概念
分类变量
性别变量,取值为:男、女
0
1
这种变量的不同“值”表示个体所属的 不同类别,这类变量称为分类变量
试一试
请举出几个分类变量的例子
为了调查吸烟是否对肺癌有影 响,某肿瘤研究所随机地调查了9965人, 得到如下结果(单位:人)
吸烟与患肺癌列联表(列出两个分类变量的频数 表): 不患肺癌 患肺癌 不吸烟 7775 42 吸烟 2099 49 总计 9874 91 总计 7817 2148 9965
那么吸烟是否会对患肺癌有影响?
1.估计该地区老年人中,需要志愿者提供帮 助的老年人的比例; 2.能否有99%的把握认为该地区的老年人是 否需要志愿者提供帮助与性别有关?
链接
(1)调查的500位老年人中有70位需要志愿者 提供帮助,因此该地区老年人中,需要帮助的 老年人的比例的估算值为 70 14%
500
男 40 160 200 女 30 270 300
n(ad - bc) 3.独立性检验 K = (a + b)(c + d)(a + c)(b + d)
2
2
不患肺癌 患肺癌 不吸烟 7775 42 吸烟 2099 49 总计 9874 91
通过公式计算
2
总计 7817 2148 9965
2
9965(7775 49 42 2099) K 7817 2148 9874 91 56.632 6.635 因此我们有99%的把握认为”吸烟与患肺癌 有关系”
我们能有多大把握认为
“患病与吸烟有关”呢?
三、探究解疑——独立性检验
将问题一般化
不吸烟 吸烟 总计 不患肺癌 a c a+c 患肺癌 b d b+d 总计 a+b c+d a+b+c+d
不患肺癌 患肺癌 总计 假设H0: 吸烟和患肺癌之间没有关系 不吸烟 a b a+b 用 A 表示“不吸烟”, B d 表示“不患肺癌” 吸烟 c c+d a+c b+d a+b+c+d 则 总计 吸烟和患肺癌之间没有关系 H 0:
解:根据题目所给数据得到如下列联表: 患心脏病 不患心脏病 秃顶 不秃顶 总计 214 451 66ຫໍສະໝຸດ 175 597 7722
总计 389 1048 1437
根据列联表中的数据,得到
1437 (214 597 175 451) K 16.373 6.635. 389 1048 665 772
二、自主合作 1.列联表
不患肺癌 患肺癌 不吸烟 7775 42 吸烟 2099 49 总计 9874 91 总计 7817 2148 9965
0.54%
在不吸烟者中患肺癌的比重是
在吸烟者中患肺癌的比重是 2.28% 直观上的结论:吸烟者和不吸烟者患肺癌 的可能性存在差异,吸烟者患肺癌的可能 性大
等价于
P(AB)= P(A)P(B)
a+b a+c a P(A)≈ ,P(B)≈ ,P(AB)≈ n n n 其中n = a + b + c + d
a a+b a+c ≈ × n n n

ad bc ad bc 0.
ad - bc 越小,说明吸烟与患肺癌之间的关系越弱,
ad - bc 越大,说明吸烟与患肺癌之间的关系越强
例题分析 例1. 在某医院,因为患心脏病而住院的665
名男性病人中,有214人秃顶,而另外772名 不是因为患心脏病而住院的男性病人中有 175人秃顶. (1)利用图形判断秃顶与患心脏病是否有 关系 (2)能否在犯错误概率不超过0.01的前提 下认为秃顶与患心脏病有关系?
利用excel做出图形判断
5. 某市为调查全市高中生学习状况是否对生理 健康有影响,随机进行调查并得到如下的列联表:
不健康 不优秀 优 秀 总 计 41 37 78 健 626 296 922 康 总计 667 333 1000
请问有多大把握认为“高中生学习状况与生 理健康有关”? 2 7.6109 6.635 K 因此有99%的把握认为高中生学习状况与生理 健康有关
2
(2) 做出列联表
需要 不需要 总计
总计 70 430 500

500 (40 270 30 160) K 9.967 200 300 70 430
2
由于9.967>6.635,所以有99%的把握认为该 地区的老年人是否需要帮助与性别有关。 链接
课堂小结
知识层面上: 独立性检验的基本思想,实施步骤
2.等高条形图
100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 不吸烟 吸烟
患肺癌 不患肺癌
等高条形图更清晰地表达了两种情况下患肺癌的 比例,可以直观地得出吸烟与患肺癌有关
有一个颠扑不破的真理,那就是当 我们不能确定什么是真的时,我们就 应该去探求什么是最可能的。 笛卡尔
由表中数据计算得到 K 2 的观察值 k 4.513 在多大程度上可以认为高中生的性别与是否 喜欢数学课程之间有关系? 由于4.513>3.841,故有95%的把握认为二者有关
链接
四、反思提高——体验高考 (2010新课标全国卷) 为调查某地区老人是否需 要志愿者提供帮助,用简单随机抽样方法从该地 区调查了500位老年人,结果如下: 需要 不需要 男 40 160 女 30 270
相关文档
最新文档