1.2独立性检验的基本思想及其初步应用1

合集下载

1.2独立性检验的基本思想及其应用,安徽省定远中学 赵艳丽说课稿

1.2独立性检验的基本思想及其应用,安徽省定远中学  赵艳丽说课稿

1.2独立性检验的基本思想及其应用(第1课时)说课稿定远中学赵艳丽各位老师:你们好!我今天说的课题是《1.2独立性检验的基本思想及其应用(第1课时)》,下面我从教材、教学目标、教学重点、教学难点、教学方法、学生学法、教学过程等几个方面说说我对这堂课的设计:一、说教材:《1.2独立性检验的基本思想及其应用(第1课时)》是人教A版高中数学选修1-2第一章的内容,本属大学《数理统计》里的内容,难度较大。

本节内容只是力求让学生对独立性检验思想有个初步了解,并会简单应用。

二、说教学目标:根据这部分内容的特征,制定本课的教学目标是:(1)知识与技能:理解分类变量的含义;会根据收集的数据列出2×2列联表,并会阅读三维柱形图和二维条形图,并粗略判断两个分类变量是否有关系;理解假设检验思想,会利用独立性检验精确判断两个分类变量是否有关系;(2)过程与方法:利用学生身边熟悉的问题引入分类变量是否相关的问题;运用统计学解决问题的一般思路引导学生;让学生经历假设检验思想的形成及运用过程,领会分析、总结的方法;(3)情感态度与价值观:通过提供适当的情境资料,吸引学生的注意力,激发学生的学习兴趣;通过实际问题的解决和从不同角度对问题的解决,可提高学生应用数学能力。

三、说教学重点:根据本节的教学目标、学习重点,并结合学生实际,确定本节课的教学重点是独立性检验思想的初步认识和其简单应用。

四、说教学方法:为了达到目标、突出重点、突破难点、解决疑点,我本着以教师为主导,学生参与其中的原则,再结合本节内容的实际特点,确定本节课教学方法。

这些教学方法想方设法引起学生注意,引导他们积极思考,热情参与,独立自主地解决问题。

具体做法如下:1、情景设置法——激发感情,引起兴趣。

2、提问法——逐步引导,逐渐深入。

3、点拨法——展开联想,拓展思路。

4、讲授法——讲授法教师可以系统的传授知识,充分发挥教师的主导作用。

5、多媒体辅助教学。

其中点拨法是最基本的方法。

【全程复习14-2015学年高中数学 1.2 独立性检验的基本思想及其初步应用课堂达标效果检测 新人教A版选修1-2

【全程复习14-2015学年高中数学 1.2 独立性检验的基本思想及其初步应用课堂达标效果检测 新人教A版选修1-2

"【全程复习方略】2014-2015学年高中数学 1.2 独立性检验的基本思想及其初步应用课堂达标效果检测新人教A版选修1-2 "1.在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是( )A.散点图B.等高条形图C.2×2列联表D.以上均不对【解析】选B.等高条形图可以粗略地判断两个分类变量之间是否有关.2.对于分类变量A与B的随机变量K2,下列说法正确的是( )A.K2越大,说明“A与B有关系”的可信度越小B.K2越大,说明“A与B无关”的程度越大C.K2越小,说明“A与B有关系”的可信度越小D.K2接近于0,说明“A与B无关”的程度越小【解析】选C.由独立性检验的定义及K2的意义可知C正确.3.想要检测天气阴晴与人心情好坏是否相关,应该检测()A.H0:晴天心情好B.H0:阴天心情好C.H0:天气与心情有关系D.H0:天气与心情无关【解析】选D.根据假设检验的意义,要先假设两个分类变量之间没有关系.4.若由一个2×2列联表中的数据计算得K2的观测值k为7.22,那么在犯错误的概率不超过的前提下认为两个变量有关系.【解析】因为K2的观测值k=7.22>6.635,故在犯错误的概率不超过0.01的前提下认为两个变量有关系. 答案:0.015.某校文理合卷期中考试后,按照学生的数学考试成绩优秀和不优秀统计,得到如下的列联表:(1)画出列联表的等高条形图,并通过图形判断数学成绩与文理分科是否有关.(2)利用独立性检验,分析文理分科对学生的数学成绩是否有影响.【解析】(1)等高条形图如图所示.(2)由列联表中的数据得到K2的观测值k==科对学生的数学成绩有影响.。

2014年人教A版选修1-2课件 1.2 独立性检验的基本思想及其初步应用

2014年人教A版选修1-2课件 1.2  独立性检验的基本思想及其初步应用

问题1. 下表是对吸烟和不吸烟的人中患肺癌的调 查数据, 你能从中分析吸烟对患肺癌的影响程度吗?
不吸烟 吸烟 总计 不患肺癌 7775 2099 9874 患肺癌 42 49 91 总计 7817 2148 9965
对于某种变量取不同的 “值” 表示不同的类别, 这样的变量称为分类变量. 如: 是否吸烟, 是否信仰宗教, 男性或女性等. 如上表这样, 列出两个分类变量的频数表, 称为 列联表.
不患肺癌 患肺癌 总计 不吸烟 a b a+ b 即 |ad -bc| 越小, 吸烟与患肺癌之间的关系越弱 ; 吸烟 c d c+d 反之越强.总计 a+ c b+ d a+b+c+d
为了使不同容量的数据有统一的评判标准, 我们 我们把列联表中的数字用字母代替, 并计算: 把检查 |ad-bc| 的大小转换成检查 a ; “不吸烟” 样本中 “不患肺癌” 的比例 : n(ad - bc)2 a+ b 2 K , (a + b)(c + d )(a的比例 + c)(b +c “吸烟” 样本中 “不患肺癌” :d ) . c+d 其中 na+b+c+d 为样本容量. 假设 H0: 吸烟与患肺癌没有关系 , 则需 2 若 H0 成立, a则 K c 应该很小. , ad-bc≈0. a + b c + d H0 成立与否呢? 小到什么程度来判断
0.4
0.2 0 不吸烟 吸烟
问题1. 下表是对吸烟和不吸烟的人中患肺癌的调 查数据, 你能从中分析吸烟对患肺癌的影响程度吗?
不吸烟 吸烟 总计 不患肺癌 7775 2099 9874
1

1.2独立性检验的基本思想及其初步应用

1.2独立性检验的基本思想及其初步应用

试用图形判断服用药和患病之间是否有关系?
解析:相应的等高条形图如下:
从图形可以看出,服用药的样本中患病的比例明显低于 没有服用药的样本中患病的比例,因此可以认为:服用药和 患病之间有关系.
独立性检验方法——K2公式
在调查的480名男士中有38名患有色盲,520名女 士中有6名患有色盲,能否在犯错误的概率不超过0.001的前 提下认为性别与患色盲有关系? 分析:
4.下面是一个2×2列联表: x1 x2 总计 y1 a 2 b y2 21 25 46 总计 73 27 100
则表中a、b的值分别为( C ) A.94、96 C.52、54 B.52、50 D.54、52
5.性别与身高列联表如下: 男 女 总计 高(165 cm以上) 37 6 43 矮(165 cm以下) 4 13 17 总计 41 19 60
作出2×2列联表 → 计算随机变量K2的值 → 对照临界值作出结论 解析:根据题目所给的数据作出如下的列联表:
色盲 不色盲 总计

女 总计
38
6 44
442
514 956
480
520 1 000
根据列联表中所给的数据可以得: a=38,b=442,c=6,d=514,a+b=480,c+d= 520,a+c=44,b+d=956,n=1 000.
3.独立性检验. 利用随机变量K2来判断“两个分类变量有关系”的方法 定义 称为独立性检验.
nad-bc2 公式 K2=_____________________ a+bc+da+cb+d ,其中n=______________. a+b+c+d
①根据实际问题的需要确定容许推断“两个分类变量有 临界值 k0 .② 关系”犯错误概率的上界α,然后查表确定 ________ k________ ≥k0 利用公式计算随机变量K2的 ________ , 观测值 k .③如果 具体 就推断“X与Y有关系”,这种推断犯错误的概率不超过 步骤 α;否则,就认为在犯错误的概率不超过α的前提下不能 推断“X与Y有关系”,或者在样本数据中没有发现足够 证据支持结论“X与Y有关系”.

1-2 独立性检验的基本思想及其初步应用

1-2 独立性检验的基本思想及其初步应用

基础巩固强化一、选择题1.在2×2列联表中,两个比值________相差越大,两个分类变量之间的关系越强( )A.a a +b 与c c +dB.a c +d 与c a +bC.a a +d 与c b +cD.a b +d 与c a +c[答案] A[解析] a a +b 与cc +d 相差越大,说明ad 与bc 相差越大,两个分类变量之间的关系越强.2.独立性检验中,不需要精确计算就可以粗略地判断两个分类变量是否有关的是( )A .散点图B .等高条形图C .假设检验的思想D .以上都不对 [答案] B[解析] 等高条形图可以粗略地判断两个分类变量是否有关,但无法精确地给出结论的可靠程度,故选B.3.假设有两个分类变量X 与Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其2×2列联表为:最大的一组为( )A .a =5,b =4,c =3,d =2B .a =5,b =3,c =4,d =2C .a =2,b =3,c =4,d =5D .a =2,b =3,c =5,d =4 [答案] D[解析] 比较|a a +b -cc +d |.选项A 中,|59-35|=245; 选项B 中,|58-46|=124; 选项C 中,|25-49|=245; 选项D 中,|25-59|=745.故选D.4.某卫生机构对366人进行健康体检,其中某项检测指标阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,有______的把握认为糖尿病患者与遗传有关系.( )A .99.9%B .99.5%C .99%D .97.5%[答案] D[解析] 可以先作出如下列联表(单位:人):糖尿病患者与遗传列联表k=366×(16×240-17×93)2109×257×33×333≈6.067>5.024.故我们有97.5%的把握认为糖尿病患者与遗传有关系.5.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()①若K2的观测值满足K2≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误A.①B.①③C.③D.②[答案] C[解析]①推断在100个吸烟的人中必有99人患有肺病,说法错误,排除A,B,③正确.排除D,选C.二、填空题6.为了调查患慢性气管炎是否与吸烟有关,调查了339名50岁以下的人,调查结果如下表:[答案]7.4697.调查者通过随机询问72名男女中学生喜欢文科还是理科,得到如下列联表(单位:名)性别与喜欢文科还是理科列联表“没有”)[答案]有[解析]通过计算K2的观测值k=72×(16×8-28×20)2 36×36×44×28≈8.42>7.879.故我们有99.5%的把握认为中学生的性别和喜欢文科还是理科有关系.三、解答题8.某地区有关部门调查该地区的一种传染病与饮用不干净水的关系,得到如下列联表(单位:人):传染病与饮用不干净水列联表[解析]由已知列联表中数据计算得K2的观测值为k=830×(52×218-94×466)2≈54.21,518×312×146×684因为54.21>10.828,所以我们有99.9%的把握认为该地区的这种传染病与饮用不干净水是有关的.[点评]对数据作统计分析推断实质上是让我们来判断得这种传染病是否与饮用不干净的水有关系,即根据数据求K2的观测值,再利用其与临界值的大小关系来判断.。

独立性检验基本思想及应用

独立性检验基本思想及应用

独立性检验基本思想及应用独立性检验是一种用于确定两个变量之间是否存在关联的统计方法。

其基本思想是通过比较观察到的数据与预期的数据之间的差异来推断这两个变量之间的关系。

独立性检验的应用非常广泛。

在社会科学中,独立性检验常被用于研究两个分类变量之间是否存在关联,例如性别和职业、教育水平和政治倾向等。

在医学研究中,独立性检验也可以用来检查某种治疗方法是否与疾病的发展有关,以及风险因素和某种疾病之间的关系。

此外,独立性检验还被广泛应用于市场调查、品牌定位以及质量控制等领域。

独立性检验的基本思想是建立一个零假设(H0)和一个备择假设(H1)。

零假设认为两个变量是独立的,即它们之间没有关联;备择假设则认为两个变量之间存在关联。

独立性检验的步骤可以分为以下几步:1. 收集数据:需要收集两个分类变量的数据,例如通过问卷调查或观察获得数据。

2. 建立列联表:将数据整理成列联表形式,列联表是一种用于描述两个或多个分类变量之间关系的矩阵。

表格的行表示一个变量的不同类别,列表示另一个变量的不同类别,表格中的每个单元格表示两个类别的交叉数量。

3. 计算期望频数:在独立性检验中,我们假设两个变量是独立的,因此可以基于各类别的边际总数以及样本总数来计算期望频数。

期望频数是在两个变量独立情况下,各个类别的交叉数量。

4. 计算卡方统计量:卡方统计量用于衡量观察到的数据与期望数据之间的差异程度。

计算公式为:χ2 = Σ((观察频数- 期望频数)^2 / 期望频数)。

其中,Σ表示对所有单元格进行求和。

5. 设定显著性水平:显著性水平α为决策的临界点,用于决定是否拒绝零假设。

通常,α的常见选择为0.05或0.01。

6. 判断和解释结果:根据计算出的卡方统计量与临界值进行比较,如果计算出的卡方值大于临界值,拒绝零假设,认为两个变量之间存在关联;反之,接受零假设,认为两个变量是独立的。

独立性检验的结果常常以卡方统计量和p值的形式呈现。

p值是在零假设成立的条件下,观察到的数据与期望数据之间差异的概率。

人教A版 选修1-2 独立性检验的基本思想及其初步应用(一) 教案

人教A版  选修1-2 独立性检验的基本思想及其初步应用(一) 教案
如果k>=6.635,就判断H0不成立,即认为“吸烟与患肺癌没有关系”
在该规则下,把结论h0错判成H0不成立的概率不会超过P(K2>=)=0.010这里计算的前提是H0成立。上面解决问题的想法类似于反正法,要判断“两个分类变量有关系”,首现假设该结论不成立。即H0:两个变量没有关系成立,在该假设下我们所构造的随机变量K2应该很小,如果由观测值数据计算得到的K2的观测值k很大,则断言H0不成立即认为“两个分类变量有关系”;如果观测值k很小,则说明在样本数据组没有发现足够理由拒绝H0。怎么样判断K2的观测值k是大还是小?这仅需要一个确定的整数k0,当k>=k0时就认为K2的观测值k大。此时相应于k0的判断规则:如果k>=k0,就认为“两个分类变量有关系”;否则就认为“两个分类变量没有关系”,我们称这样的一个k0为临界值。
上述利用随机变量K2判断“两个随机分类变量有关系”的方法称为独立性检验
目标三导
学做思一:独立性检验原理
列联表:列出两个变量的频数表。解决问题的想法类似于反正法,要判断“两个分类变量有关系”,首现假设该结论不成立。
即H0:两个变量没有关系成立,在该假设下我们所构造的随机变量K2应该很小,如果由观测值数据计算得到的K2的观测值k很大,则断言H0不成立即认为“两个分类变量有关系”;如果观测值k很小,则说明在样本数据组没有发现足够理由拒绝H0。怎么样判断K2的观测值k是大还是小?这仅需要一个确定的整数k0,当k>=k0时就认为K2的观测值k大。此时相应于k0的判断规则:如果k>=k0,就认为“两个分类变量有关系”;否则就认为“两个分类变量没有关系”,我们称这样的一个k0为临界值。
独立性检验原理
在假设H0下,如果推出了一个与H0相矛盾的小概率事件,就推断H0不成立,且该推论犯错误的概率不超过这个小概率。

36741_《独立性检验的基本思想及其应用》同步练习1

36741_《独立性检验的基本思想及其应用》同步练习1

3.2独立性检验的基本思想及其初步应用A卷(课堂针对训练六)1.2双基再现1.★下列变量中不是分类变量的是()A.近视B.成绩C.性别D.饮酒2.★★下列说法中错误的是()A.有时可以把分类变量的不同取值用数字表示,但这时的数字除了分类以外没有其它含义B.在统计学中,独立性检验就是检验两个分类变量是否有关系的一种方法C.在进行独立性检验时,可以先利用三维柱形图和二维条形图粗略地判断两个分类变量是否有关系D.通过三维柱形图和二维条形可以精确的给出所得结论的可靠程度3.★★某高校《统计》课程的教师随机给出了选该课程的一些情况,具体数据如下:为了判断选修统计专业是否与性别有关,根据表中数据,得2 4.844K≈,因为2 3.841K>,所以可以判定选修统计专业与性别有关.那么这种判断出错的可能性为()A.5%B.95%C.1%D.99%4.★★某大学要研究性别与职称之间是否有关系,你认为该收集哪些数据?5.★★在三维柱形图中,主对角线的两个柱形高度的乘积bc相关越大,X与Y有关系的可能性就.6.★★★为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同的剂量的电离辐射照射小白鼠.在照射14天内的结果如下:进行统计分析时的统计假设是变式活学7.★★★(教材1.2例1变式)研究人员选取170名青年男女大学生的样本,对他(她)们进行一种心理测验,发现有60名女生对该心理的最后一个题目的反应是:作肯定的18名,否定42名;男生110名在相同的项目上作出肯定的有22名,否定的有88名.请问性别与态度之间是否存在某种关系?请分别用图形与独立性检验的方法进行判断.8.★★★★(教材1.2例1变式)在研究某种新措施对猪白痢的防治效果问题时,得到了以下治猪白痢是否有效?实践演练9.★★★★如何对草莓、橙子、桃子、苹果、梨等5种水果进行分类?10.★★★★★在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,分别利用图形和独立性检验的方法来判断色盲与性别是否有关?你所得到的结论在什么范围内有效?。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如何看待这个值呢?
合作预习 教学新课
合作运用
当堂作业
合作指导
结束教学
P( K 6.635) 0.01. (2) 在H0成立的情况下,统计学家研究出如下的概率
2
即在H0成立的情况下,K2的值大于6.635的概率非常小,近似于 0.01。而现在K2的值56.632远大于6.635, 故它是小概率事件,所以
教学新课
合作运用
当堂作业
合作指导
结束教学
一般化:
如果吸烟与患病没有关系,那么在吸烟中患病和不患 病相应的比例差不多 a c » ? a(c d ) ? c(a b) ? ad bc 0 a+ b c+ d
合作预习 教学新课
合作运用
当堂作业
合作指导
结束教学

一般地,假设两个分类变量 X 和 Y,它们的值域分别为{x1, y1 x1 x2 a c y2 b d 总计 a+b c+d a+b+c+d
合作指导
结束教学
独立性检验的基本思想:
类似于数学上的反证法,要确认“两个分类变量有关系” 这一结论成立的可信程度, 首先,假设该结论不成立,即假设结论“两个分类变量 没有关系”成立。 其次,在假设下,计算构造的随机变量K2,如果有观 测数据计算得到的K2≥k0,则我们有[1-P(K2≥k0)]*100%把 握说明假设不合理(即两个分类变量有关系)。 当K2≤k0,则我们没有[1-P(K2≥k0)]*100%把握说明假设不 合理。
等 高 条 形 图
结束教学
合作预习
教学新课
合作运用
当堂作业
合作指导
解决问题:直观方法
吸烟的患病率 不吸烟的患病率
37/220 16.82%
21/295 7.12%
根据统计分析的思想,用频率估计概率 可知,吸烟者与不吸烟者患病的可能性 存在差异。 你能有多大把握认为“患病与吸烟有关”呢?
合作预习
解:根据题目所给数据得到如下列联表1-13:
秃顶 不秃顶 总计
患心脏病 214 451 665
不患心脏病 175 597 772
总计 389 1048 1437
根据联表1-13中的数据,得到
2 1437 (214 597 175 451) K2 16.373 6.635. 389 1048 665 772
所以有99%的把握认为“秃顶患心脏病有关”。(因此在犯错误的 概率不超过0.010的前提下,认为秃顶与患心脏病有关系)
合作预习 教学新课
因为这组数 据来自住院 的病人,因 此所得到的 结论适合住 院的病人群 体.
结束教学
合作运用
当堂作业
合作指导
例2.性别与喜欢数学课
为考察高中生的性别与是否喜欢数学课程之间的关系,在 某城市的某校高中生中随机抽取300名学生,得到如下联表: 喜欢数学课程 不喜欢数学课程 总计 37 85 122 男 35 143 178 女 72 228 300 总计
合作预习
患心脏病 不患心脏病 214 175 451 597 665 772
教学新课
总计 389 1048 1437
合作指导
合作运用
当堂作业
结束教学
例1.秃头与患心脏病
在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶; 而 另外772名不是因为患心脏病而住院的男性病人中有175人秃顶。分别 利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的 结论在 什么范围内有效?(能否在犯错误的概率不超过0.010的前提下认 为秃顶与患心脏病有关系?)
合作预习 教学新课
合作运用
当堂作业
合作指导
结束教学
为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机 地调查了9965人,得到如下结果(单位:人):
表1-9 吸烟与患肺癌列联表
不吸烟 吸烟 总计
不患肺癌 7775 2099 9874
患肺癌 42 49 91
总计 7817 2148 9965
那么吸烟是否对患肺癌有影响?
x2}和{y1,y2},列出两个变量的频数表,称为列联表(如下图)
总计 a+c b+d
|ad-bc|越小,说明两个分类变量 x、y 之间的关系越弱;
|ad-bc|越大,说明两个分类变量 x、y 之间的关系越强.
合作预习
教学新课
合作运用
当堂作业
合作指导
结束教学
探究点二 问题 1
独立性检验 利用列联表及等高条形图判断两个分类变量是否有关
(3)如果k>2.706,就有90%的把握认为“X与Y有关系”;
(4)如果k<=2.706,就认为没有充分的证据显示“X与Y有关系”。
合作预习 教学新课
合作运用
当堂作业
合作指导
结束教学
例1.秃头与患心脏病
在某医院,因为患心脏病而住院的665名男性病人中, 有214人秃顶;而另外 772名不是因为患心脏病而住院的男 性病人中有175人秃顶。分别利用图形和独立性检验方法判 断秃顶与患心脏病是否有关系?你所得的结论在什么范围 内有效? 解:根据题目所给数据得到如下列联表1-13: 秃顶 不秃顶 总计
合作预习 教学新课
合作运用
当堂作业
合作指导
结束教学
具体作法是:
根据观测数据计算随机变量 K2的值k,其值越大,说 明“X与 Y有关系”成立的可能性越大。可以通过查阅 下表(表 1-12 )来确定断言“ X 与 Y 有关系”的可信程 1-12 表 度。
P( K k )
2
0.50
0.40
0.5
0.15
知识改变人生 品质铸就未来
1.2-1独立性检验的基本思想及 其初步应用
授课:XXX
合作预习 教学新课
合作运用
当堂作业
合作指导
结束教学
1.分类变量和列联表 (1)分类变量 变量的不同“值”表示个体所属的 不同类别 ,像这样的变 量称为分类变量. (2)列联表 ①定义:列出的两个分类变量的 称为列联表.
合作预习 教学新课
合作运用
当堂作业
合作指导
结束教学
知识结构图
独立性检验
分类变量
检验的方法
独立性检验的应用
合作预习
教学新课
合作运用
当堂作业
合作指导
结束教学
n(ad bc) K , (a b)(c d )(a c)(b d ) (1)
2 2
其中n a b c d为样本容量。
因此:若 H0成立,则K2应很小。
利用公式(1)计算得到 K2 的观测值为
9965(7775 49 42 2099)2 k 56.632. 7817 2148 9874 91
我们认为H0
是不成立的 .但这种判断会犯错误,犯错误的概率
是不成立的!(即吸
不会超过0.01,即我们有99%的把握认为H0
烟与患肺癌有关系)
独立性检验的定义:
上面这种利用随机变量K2来确定在多大程度上可以认 为“两个分类变量有关系”的方法称为两个分类变量 的独立性检验。
合作预习 教学新课
合作运用
当堂作业
由表中数据计算K2的观测值k≈4.513。在多大程度上可以认为高中生的性别与 是否喜欢数学课程之间有关系?为什么?
解:在假设“性别与是否喜欢数学课程之间没有关系” 的前提下K2应该很小。 而我们所得到的K2的观测值 k≈4.513超过3.841,这就意味 着“性别与是否喜欢数学课程之间有关系”这一结论错 误的可能性约为0.05,即有95%的把握认为“性别与是否 喜欢数学课程之间有关系”。
合作预习
教学新课
合作运用
当堂作业
合作指导
结束教学
案 例:某医疗机构为了了解呼吸道疾病与吸烟是否有 关,进行了一次抽样调查,共调查了515个成年人,其 中吸烟者220人,不吸烟者295人。
调查结果:吸烟的220人中有37人患呼吸道疾病,183人 未患呼吸道疾病;不吸烟的295人中有21人患病,274人 未患病。
合作指导
结束教学
吸烟与不吸烟,患病的可能性的大小是否有 差异? 频率估计概率 患 病 未患病 合 计(n)
吸 烟 不吸烟
16.82% 83.18% 100%(220) 7.12% 92.88% 100%(295)
合作预习
教学新课
合作运用
当堂作业
合作指导
结束教学
通过图形直观判断
不患病 比例
患病 比例
合作预习 教学新课
合作运用
当堂作业
合作指导
结束教学
上面我们通过分析数据和图形,得到的直观印 象是吸烟和患肺癌有关,那么事实是否真的如此呢? 你得到这个结论有多大的把握呢?
为此先假设
H0:吸烟与患肺癌没有关系,
看看能够推出什么样的结论。
合作预习
教学新课
合作运用
当堂作业
合作指导
结束教学
为了统一评判标准,我们构造一个随机变量
0.10
0.05 0.025 0.010 0.005 0.001
k
0.445 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
例如:
(1)如果k>10.828,就有99.9%的把握认为“X与Y有关系”; (2)如果k>6.635,就有99%的把握认为“X与Y有关系”;
根据这些数据,能否断定:患呼吸道疾病与吸 烟有关?
合作预习 教学新课
合作运用
当堂作业
合作指导
结束教学
数据整理
患病
吸烟 不吸烟 合计 37 21 58
未患病 183 274
相关文档
最新文档