3.2独立性检验的基本思想及其初步应用(2课时选修2-3)

合集下载

2020学年高中数学第3章统计案例3.2独立性检验的基本思想及其初步应用课件新人教A版选修2_3

2020学年高中数学第3章统计案例3.2独立性检验的基本思想及其初步应用课件新人教A版选修2_3

返回目录
(2)独立性检验(精确判断) 具体实施步骤如下: ①根据实际问题需要的可信程度确定临界值 k0; ② 根 据 观 测 数 据 计 算 随 机 变 量 K2 = a+bcn+add-ab+cc2b+d的观测值 k,其中 n=a+b+c+ d 为样本容量;
返回目录
③查临界值表(以K2的观测值k的大小作为检验在多 大程度上可以认为“两个变量有关系”的标准),如果 k≥k0,就以(1-P(K2≥k0))×100%的把握认为“两分类 变量有关系”;否则,就认为根据样本数据没有充分的 理由说明“两分类变量有关系”.
返回目录
2.(独立性检验)有人发现,多看电视容易使人变冷 漠,下表是一个调查机构对此现象的调查结果.
冷漠 不冷漠 总计 多看电视 68 42 110 少看电视 20 38 58
总计 88 80 168
返回目录
则大约有多大的把握认为多看电视与人变冷漠有关
系( )
A.99%
B.97.5%
C.95%
D.90%
返回目录
要点三 独立性检验
定义 利用随机变量K2来判断“两个分类变量有关系” 的方法称为独立性检验 nad-bc2
公式 K2=_____a_+__b__c_+__d__a_+__c___b_+__d_____,其中n= ___a_+_b_+__c_+__d___
返回目录
①认真读题,取出相关数据,作出2×2列联表; 具体 ②根据2×2列联表中的数据,计算K2的观测值k; 步骤 ③通过观测值k与临界值k0比较,得出事件有关的
返回目录
P(K2≥k0) 0.100 0.050 0.010 k0 2.706 3.841 6.635
思维导引:根据列联表直接代入K2公式可得南方学 生和北方学生的差异与是否喜欢甜品的相关程度.

第三章--统计案例-3.2-独立性检验的基本思想及其初步应用

第三章--统计案例-3.2-独立性检验的基本思想及其初步应用

解:由列联表中的数据,得 K2 的观测值为 1 633×30×1 355-224×242 k= ≈68.033>10.828. 254×1 379×54×1 579 因此,在犯错误的概率不超过 0.001 的前提下,认为每 一晚都打鼾与患心脏病有关.
为了调查某生产线上,某质量监督员甲对产
品质量好坏有无影响,现统计数据如下:质量监督员在现 场时,990件产品中合格品为 982 件,次品数为 8 件,甲不 在现场时,510件产品中合格品为493件,次品数为17件, 试分别用列联表、等高条形图、假设检验的方法对数据进
的方法来判断色盲与性别是否有关?你所得的结论在什么
范围内有效? 解:根据题目所给的数据作出如下的列联表: 色盲 不色盲 合计
男 女 合计
38 6 44
442 514 956
480 520 1 000
根据列联表作出相应的等高条形图,如图所示:
38 从等高条形图来看在男人中患色盲的比例480比在女人
38 6 6 中患色盲的比例520要大,其差值为480-520 ≈0.068,差
位统一,图形准确,但它不能给我们两个分类变量有关或
无关的精确的判断,若要作出精确的判断,可以进行独立 性检验的有关计算.
本题应首先作出调查数据的列联表,再根据列联表画
出等高条形图,并进行分析,ห้องสมุดไป่ตู้后利用独立性检验作出判 断.
在调查 480 名男士中有 38 名患有色盲, 520名女士中有6名患有色盲,分别利用图形和独立性检验


③如果 k≥k0 ,就推断“X与Y有关系”,这种推断
犯错误的概率不超过α;否则,就认为在犯错误的概 率不超过α的前提下不能推断“X与Y有关系”,或者 在样本数据中没有发现足够证据支持结论“X与Y有 关系”.

独立性检验的基本思想及其初步应用

独立性检验的基本思想及其初步应用

如果“吸烟与患肺癌没有关系”,那么吸烟样
本中不患肺癌的比例应该与不吸烟样本中相应的比
例差不多.
所以
a a+
b

c
c +d
,
所以 a c + d ca + b,
ad bc
即 ad bc 0.
︱ad-bc︱越小,说明吸烟与患肺癌之间的关系越弱;
︱ad-bc︱越大,说明吸烟与患肺癌之间的关系越强.
患心脏病 患其他病 总计
秃顶
214
175
389
不秃顶
451
597
1 048
总计
665
772
1 437
(1)相应的等高条形图如下所示,
不患心脏病 患心脏病
秃顶
不秃顶
由图可认为秃顶与患心脏病有关系
吸烟与患肺癌列联表(单位:人)
不患肺癌
患肺癌
总计
不吸烟
7 775
42
7 817
吸烟
2 099
49
2 148
总计
9 874
91
9 965
在不吸烟者中患肺癌的比重是__0_._5_4_%_,
在吸烟者中患肺癌的比重是__2_._2_8_%_.
说明:吸烟者和不吸烟者患肺癌的可能性存在差异, 吸烟者患肺癌的可能性大.
K2
(n ad bc)2
(a b)(c d )(a c)(b d )
临界值表:
P ( K 2 k 0 ) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k 0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828

选修2-3《独立检验的基本思想及其应用》教案

选修2-3《独立检验的基本思想及其应用》教案

教材:普通高中课程标准实验教科书数学选修32 人教A版章节:2.3独立性检验的基本思想及其初步应用一、内容和内容解析本节课是人教A版(选修)2—3第三章第二单元第一课时的内容.理论性比较强,很多教师为了图省事,在教学过程中采用学生看书自学的方式,我认为不妥。

结合课本内容,拟用两节课的时间完成整节的教学内容,本节为第一节。

山东省教育厅在2010年9月15日“关于印发山东省普通高中学科教学内容调整意见二、教学目标分析1.目标:①知识与技能目标通过生活中案例的探究,理解独立性检验的基本思想,明确独立性检验的基本步骤,会对两个分类变量进行独立性检验,并能利用独立性检验的基本思想来解决实际问题。

②过程与方法目标通过探究引出独立性检验的问题,借助样本数据的列联表分析独立性检验的实施步骤。

③情感态度价值观目标通过本节课的学习,加强数学与现实生活的联系。

以科学的态度评价两个分类变量有关系的可能性。

培养学生运用所学知识,解决实际问题的能力。

教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性。

2.目标解析:在学习中通过对统计案例的分析,理解和掌握独立性检验的方法,体会独立性检验的基本思想在解决实际问题的应用,以提高我们处理生活和工作中的某些问题的能力.新课标指出:学生的数学学习内容应当是现实的、有趣的和富有挑战性的。

从心理学的角度看,青少年有一种好奇的心态、探究的心理。

因此,紧紧地抓住学生的这一特征,利用学生身边的问题设计教学情境,使学生在观察、讨论等活动中,逐步提高数学能力。

本节课学生应该了解的几个问题:1、判断两个分类变量是否有关的几种方法及其不同点⑴列联表⑵三维柱形图⑶二维条形图⑷等高条形图⑸独立性检验的思想及应用2、独立性检验的思想与反证法思想的比较3、k2表达式及k2值表的含义三、教学问题诊断分析1.课本上k2的结构比较复杂,来的也比较突然,学生可能会提出疑问.关于这个问题,可借助两件事独立的定义以及样本容量较大时可以用频率近似表示概率来解决。

3.2独立性检验的基本思想及其初步应用 课件(人教A版选修2-3)

3.2独立性检验的基本思想及其初步应用 课件(人教A版选修2-3)

3. 独立性检验临界值表
P(K2 ≥k 0 ) k0
0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
想一想:在K2运算时,在判断变量相关时,若K2的观测值k= 56.632,则P(K2≥6.635)≈0.01和P(K2≥10.828)≈0.001, 哪种说法是正确的? 提示 两种说法均正确.
兴趣不浓厚的
总计

86
73
103
95
189
判断学生的数学成绩好坏与对学习数学的兴趣是否有关?
解 由公式得 K 的观测值
解 由公式得 K 的观测值 86×103×95×94
2
189× 64×73-22×30 k189 = ×64×73-22×302 ≈38.459. 86 × 103 × 95 × 94 k= ≈38.459.
想一想:如何理解分类变量?
提示
(1)这里的“变量”和“值”都应作为“广义”的变量和值
来理解.例如:对于性别变量,其取值有“男”和“女”两 种,这里的“变量”指的是“性别”,这里的“值”指的是“男”
或“女”.因此,这里说的“变量”和“值”不一定是取具体的
数值. (2)分类变量是大量存在的.例如:吸烟变量有吸烟与不 吸烟两种类别,而国籍变量则有多种类别.
2.独立性检验 利用随机变量K2来判断“两个分类变量有关系”的方法 定义 称为独立性检验
公式
n ad-bc2 a+bc+da+c b+d K2=_______________________ 其中n=___________ a+b+c+d

高中数学选修2-3-独立性检验的基本思想及初步应用

高中数学选修2-3-独立性检验的基本思想及初步应用

独立性检验的基本思想及初步应用知识集结知识元独立性检验知识讲解1.独立性检验【知识点的知识】1、分类变量:如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.2、原理:假设性检验(类似反证法原理).一般情况下:假设分类变量X和Y之间没有关系,通过计算K2值,然后查表对照相应的概率P,发现这种假设正确的概率P很小,从而推翻假设,最后得出X和Y之间有关系的可能性为(1﹣P),也就是“X和Y有关系”.(表中的k就是K2的观测值,即k=K2).其中n=a+b+c+d(考试给出)3、2×2列联表:4、范围:K2∈(0,+∞);性质:K2越大,说明变量间越有关系.5、解题步骤:(1)认真读题,取出相关数据,作出2×2列联表;(2)根据2×2列联表中的数据,计算K2的观测值k;(3)通过观测值k与临界值k0比较,得出事件有关的可能性大小.例题精讲独立性检验例1.'新高考方案的实施,学生对物理学科的选择成了焦点话题.某学校为了了解该校学生的物理成绩,从A,B两个班分别随机调查了40名学生,根据学生的某次物理成绩,得到A班学生物理成绩的频率分布直方图和B班学生物理成绩的频数分布条形图.(Ⅰ)估计A班学生物理成绩的众数、中位数(精确到0.1)、平均数(各组区间内的数据以该组区间的中点值为代表);(Ⅱ)填写列联表,并判断是否有99.5%的把握认为物理成绩与班级有关?附:;'例2.'党的第十九次全国代表大会上,习近平总书记指出:“房子是用来住的,不是用来炒的”,为了使房价回归到收入可支撑的水平,让全体人民住有所居,近年来全国各一、二线城市打击投机购房,陆续出台了住房限购令,某市一小区为了进一步了解已购房民众对市政府出台楼市限购令的认同情况,随机抽取了本小区50户住户进行调查,各户人平均月收入(单位:千元)的户数频率分布直方图如图,其中赞成限购的户数如表:(1)若从人平均月收入在[9,11)的住户中再随机抽取两户,求所抽取的两户至少有一户赞成楼市限购令的概率;(2)若将小区人平均月收入不低于7千元的住户称为“高收入户”,人平均月收入低于7千元的住户称为“非高收入户”,根据已知条件完成如图所给的2×2列联表,并说明能否在犯错误的概率不超过0.01的前提下认为“收入的高低”与“赞成楼市限购令”有关.附:临界值表参考公式:K2=,n=a+b+c+d.'例3.'2022年北京冬季奥运会即第24届冬季奥林匹克运动会将在2022年2月4日至2月20日在北京和张家口举行.某研究机构为了了解大学生对冰壶运动的兴趣,随机从某大学学生中抽取了120人进行调查,经统计男生与女生的人数比为11:13,男生中有30人表示对冰壶运动有兴趣,女生中有15人对冰壶运动没有兴趣.(1)完成2×2列联表,并判断能否有99%的把握认为“对冰壶运动是否有兴趣与性别有关”?(2)用分层抽样的方法从样本中对冰壶运动有兴趣的学生中抽取8人,求抽取的男生和女生分别为多少人?若从这8人中选取两人作为冰壶运动的宜传员,求选取的2人中恰好有1位男生和1位女生的概率.附:K2=,其中n=a+b+c+d.'。

高中数学人教A版选修2-3课件:3.2独立性检验的基本思想及其初步应用

高中数学人教A版选修2-3课件:3.2独立性检验的基本思想及其初步应用
x
).
问题导学
当堂检测
一、用列联表和等高条形图分析两变量间的关系
活动与探究 问题 1:怎样从列联表判断两个分类变量有无关系? 提示:|ad-bc|越小,说明两个分类变量 x,y 之间的关系越弱;|ad-bc|越 大,说明 x,y 之间的关系越强.
x
问题 2:等高条形图对分析两个分类变量是否有关系,有何帮助? 提示:通过画等高条形图,我们可以通过观察两个变量的比例关系, 直观判断两个变量是否有关系.
问题导学
当堂检测
(1)利用列联表直接计算 分类变量之间有关系.
������ ������ 和 ,如果两者相差很大,就判断两个 ������+������ ������+������
(2)在等高条形图中展示列联表数据的频率特征,比较图中两个深 色条的高可以发现两者频率不一样而得出结论 ,这种直观判断的不足 之处在于不能给出推断“两个分类变量有关系”犯错误的概率.
问题导学
当堂检测
相应的等高条形图如图所示.
图中两个深色条的高分别表示甲在生产现场和甲不在生产现场样 本中次品数的频率.从图中可以看出,甲不在生产现场样本中次品数的 频率明显高于甲在生产现场样本中次品数的频率 .因此可以认为质量 监督员甲在不在生产现场与产品质量好坏有关系 .
问题导学
当堂检测
迁移与应用 某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格 内向的学生 426 人中有 332 人在考前心情紧张,性格外向的学生 594 人 中有 213 人在考前心情紧张,作出等高条形图,利用图形判断考前心情 紧张与性格类别是否有关系. 解:作列联表如下:
2
其中 n=a+b+c+d 为样本容量.

人教版高中选修2-33.2独立性检验的基本思想及其初步课程设计

人教版高中选修2-33.2独立性检验的基本思想及其初步课程设计

人教版高中选修2-33.2独立性检验的基本思想及其初步课程设计一、独立性检验概述在概率论和数理统计中,独立性检验是指检验两个离散随机变量之间是否独立的方法。

在实际问题中,常常需要研究两个随机变量之间的关系,是否存在关联。

例如,对于一个大学招生的案例,一个人的高中成绩和大学录取情况可以是两个随机变量,我们需要使用独立性检验来判断这两个随机变量是否有关联。

二、独立性检验方法独立性检验方法有很多种,其中最常用的是卡方检验。

2.1 卡方检验卡方检验是一种统计检验方法,用于检验分类资料之间的独立性。

它的基本思想是,将观察结果与理论期望作比较,确定两者之间是否有显著差异来判断两个随机变量之间是否独立。

卡方检验的基本步骤包括:1.假设零假设为两个随机变量独立,对这个假设建立尽可能充分的理论模型。

2.将实际观察值与理论值进行比较,计算出统计量。

3.利用卡方分布表来获得临界值,以判断是否拒绝零假设。

2.2 其他方法在实际应用中,除了卡方检验,还有很多独立性检验的方法。

例如,t检验中的独立样本t检验,ANOVA中的多元卡方检验等等。

这些方法在不同的领域和场合有不同的应用。

三、课程设计建议针对高中选修2-33.2独立性检验,可以设计以下课程教学内容:3.1 概念讲解在课程开头,可以先为学生介绍独立性检验的基本概念,包括随机变量、独立性、检验方法等。

这部分内容可以通过举例子、讲解理论、使用模拟仿真等方式进行,让学生对独立性检验有一个初步的认识。

3.2 卡方检验的具体操作在学生掌握了基本概念之后,可以进一步教授卡方检验的具体操作方法。

在讲解过程中,教师可采取课堂讲解方式,为学生演示计算过程和判断方法。

并且可以为学生演示如何使用统计软件完成卡方检验。

同时,为了让学生更好的掌握卡方检验的操作,可以设计一些实际案例,让学生进行计算和判断实验。

3.3 讨论与总结在课程结束时,可以组织学生进行小组讨论和总结。

讨论的主题可以是卡方检验的应用与展望,或是针对课程内容的总结与反思。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
P(k≥k0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
解:假设H 0 : 吸烟与患肺癌没有关系 K 的观测值为 9965(7775 49 42 2099) 2 k 56.632 7817 2148 9874 91 根据临界值表可知P( K 2 10.828) 0.001 56.631远大于10.828,所以有理由判断H 0不成立, 所以吸烟与患癌症有关系。
这一结论只适用于被调查的学校





练习: 1 .调查男女学生购买食品时是否看出厂 日期与性别有无关系时,最有说服力的是 ( ) A.期望 B.方差 C.正态分布 D.独立性检验 [答案] D

2.10名学生在一次数学考试中的成绩如 下表:
分数 人数 100 2 115 4 120 3 125 1
男生 女生 合计 关心 182 176 358 不关心 18 24 42 合计 200 200 400
[解析]
假设 H0:学生对国家大事关心与否与性别无
400×(182×24-18×176)2 关,则由公式及数据得 k= 358×42×200×200 ≈0.9577,因为 k≈0.9577<2.706,所以不能拒绝 H0,因此 我们没有充分理由说学生是否关心国家大事与性别有关.
不吸烟 吸烟 总计 不患肺癌 7775 2099 9874 患肺癌 42 49 91 总计 7817 2148 9965
等高条形图更清晰地表达了两种情况下患肺癌的比例。
从上面数据和图形可以看出吸烟和患肺癌有关
我们能够有多大的把握认为“吸烟与患 肺癌有关”?
吸烟
患肺癌
假设
H0:吸烟与患肺癌没有关系 A:不吸烟 B:不患肺癌
4、独立性检验的步骤
第一步:H0: 吸烟和患病之间没有关系 第二步:列出2×2列联表
患病
吸烟 不吸烟 总计 a c a+c
2
不患病
b d b+d
2
总计
a+b c+d a+b+c+d
第三步:计算
n(ad bc) K (a c)(b d )( a b)(c d )
第四步:查对临界值表,作出判断。

[点评] 根据随机变量K2的值判断两分类 变量是否有关的步骤:第一,假设两分类 变量无关,第二,由数据及公式计算K2的 观测值k,第三,将k的值与临界值比较得 出结论.
1、能够通过等高条形图估计两个分类变量
之间是否有关系
2 K 2、利用 判断处两个分类变量之间是否有
关系
3、了解独立性检验的思想
作业P97
( 2)
那么这个值到底能告诉我们什么呢?
在H0成立的情况下,统计学家估算出如下的概率
即在H0成立的情况下, K2的值大于 6.635的概率非常小,近似 于0.01。 也就是说,在H0成立的情况下,对随机变量 K2进行多次观 测,观测值超过6.635的频率约为0.01。
P( K 6.635) 0.01.


要研究这10名学生成绩的平均情况,则最 能说明问题的是( ) A.概率 B.期望 C.方差 D.独立性检验 [答案] B

练习:3.下面是一个2×2列联表 y1 y2 合计 x1 a 21 73
x2

7
20
27
( )

41 100 合计 b 则表中a、b处的值分别为 A.94、96 B.52、50 C.52、59 D.54、52 [答案] C
系,是指有5%的可能性使得推理出现错误
D、以上三种说法都不对
反证法原理与假设检验原理 反证法原理:
在一个已知假设 下,如果推出一 个矛盾,就证明 了这个假设不成 立。
假设检验原理:
在一个已知假设 下,如果一个与 该假设矛盾的小 概率事件发生, 就推断这个假设 不成立。
例1:在某医院,因为患心脏病而住院的665名男 性病人中,有214人秃顶,而另外772名不是因为 患心脏病而住院的男性病人中有175人秃顶.分 别利用图形和独立性检验方法判断秃顶与患心 脏病是否有关系?能否在犯错误的概率不超过 0.01的前提下认为秃顶与患心脏病有关系?
这种判断可能有错误,但是犯错误的不会超过 0.001,这是个小概率时间,我们有99.9%的把 握认为“吸烟与患癌症有关系”
2
在吸烟与患肺病这两个分类变量的计算中,下列说法正确
的是(
c

A、若K的观测值为k=6.635,我们有99%的把握认为吸烟与患 肺病有关系,那么在100个吸烟的人中必有99个患肺病 B、从独立性检验可知有99%的把握认为吸烟与患肺病有关 系时,我们说某人吸烟,那么他有99%的可能患肺病 C、若从统计量中求出有95%的把握认为吸烟与患肺病有关
两种变量:
定量变量:体重、身高、温度、考试成绩等等。 变量 分类变量:性别、是否吸烟、是否患肺癌、 宗教信仰、国籍等等。
.
在日常生活中,我们常常关心分类变量之间是否有关系: 这种变量的不同" 值" 表示个体所属的不同 例如,吸烟是否与患肺癌有关系? 类 性别是否对于喜欢数学课程有影响?等等。 别 , 像这类变量称为分类变量 .
课本习题3.2 题1,2
3、独立性检验
2 n ( ad bc ) 随机变量-----卡方统计量 K 2 , (a b)(c d )(a c)(b d )
临界值表
P(K2 k0 ) 0.50
0.40 0.708
其中n a b c d为样本容量。
0.25 1.323 0.15 2.072 0.10 2.706 0.05 3.841 0.025 5.024 0.010 6.635 0.005 7.879 0.001 10.828
吸烟与肺癌列联表
不患肺癌 患肺癌 总计
列联表 .
不吸烟
吸烟 总计
7775
2099 9874
42
49 91
7817
2148 9965
Hale Waihona Puke 在不吸烟者中患肺癌的比重是 0.54% 在吸烟者中患肺癌的比重是 2.28%
说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患 肺癌的可能性大。
通过图形直观判断两个分类变量是否相关: 1、列联表 2、等高条形图
2 2
其中n a b c d为样本容量。
根据表3-7中的数据,利用公式(1)计算得到K2的观测值为:
若 H0成立,即“吸烟与患肺癌没有关系”,则K2应很小。
9965(7775 49 42 2099) k 56.632 7817 2148 9874 91
2
(n=a+b+c+d)
(a+b+c+d)a≈(a+b)(a+c) ad-bc≈0
|ad-bc|越小
|ad-bc|越大
吸烟与患肺癌之间的关系越弱 吸烟与患肺癌之间的关系越强
独立性检验
为了使不同样本容量的数据有统一的评判标准,基于上述分 析,我们构造一个随机变量-----卡方统计量
n(ad bc) K , (1) (a b)(c d )(a c)(b d )
解 根据数据得到如下列联表 秃顶与患心脏病列联表
秃顶 不秃顶 总计 患心脏病 214 451 665 患其他病 175 597 772 总计 389 1048 1437
等高条形图如图3.2.2所示,起其中两个深色条的高分别表示 秃顶和不秃顶样本中患心脏病的频率。比较图中两个深色条 的高可以发现,秃顶样本中患心脏病的频率明显高于不秃顶 样本中患心脏病的频率,因此认为秃顶与患心脏病有关系。
k0
0.455
K 2 10.828
0.1%把握认为A与B无关
1%把握认为A与B无关
99.9%把握认A与B有关 99%把握认为A与B有关 90%把握认为A与B有关
K 2 6.635
K 2 2.706
K 2 2.706
10%把握认为A与B无关
没有充分的依据显示A与B有关,但也不能显示A与B无关
H0 等价于A,B独立等价于P(AB)=P(A) P(B)
吸烟与患肺癌列联表
不吸烟 吸烟 总计 不患肺癌 a c a+c 患肺癌 b d b+d 总计 a+b c+d a+b+c+d
a:事件AB发生的频数 a+b:事件A发生的频数 a+c:事件B发生的频数
H0成立时
a ab ac n n n
等高条形图
1437 214 597 175 451 2 K 16.373 6.635 3891048 665 772
2
有99%的把握认为“秃顶与患心脏病有关”, 因此,在犯错误不超过0.01的前提下认为 秃顶与患心脏病有关。 这组数据来自住院的病人,因此所 得到的结论适合住院的病人群体.
研究两个变量的相关关系:
定量变量——回归分析(画散点图、相关系数r、 变量 相关指数R 2、残差分析) 分类变量—— 独立性检验
本节研究的是两个分类变量的独立性检验问题。
探究
像 这 样列出的两个分类变量的 频数表 , 称为
为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机 地调查了9965人,得到如下结果(单位:人)
温馨提示
研究人员表示,掉头发在很 大程度上是由日渐增大的工 作压力、不能充分休息、不 正确饮食和睡眠不足等因素 引起的。在接受调查的人群 中,有41%的受秃头威胁的 人表示,他们一日睡觉时间 不足4小时.
相关文档
最新文档