苏教版高中数学选修独立性检验教案
苏教版选修1-2高中数学1.1《独立性检验》

甲厂 乙厂 合计 优质品 非优质品 合计
2 n ad - bc 附:χ2= , a+bb+ca+cb+d
P(χ2≥x0) x0
0.05
0.01
3.841 6.635
课前探究学习
课堂讲练互动
解 (1)甲厂抽查的产品中有 360 件优质品,从而甲厂生产的零件 360 的优质品率估计为500=72%; 乙厂抽查的产品中有 320 件优质品,从而乙厂生产的零件的优质 320 品率估计为500=64%. (2) 甲厂 乙厂 合计 优质品 360 320 680
课前探究学习 课堂讲练互动
【题后反思】 统计的基本思维模式是归纳,通过部分数据的性质 来推测全部数据的性质,从数据上体现的只是统计关系,而不是 因果关系.
课前探究学习
课堂讲练互动
【训练3】 某企业有两个分厂生产某种零件,按规定内径尺寸(单 位: mm) 的值落在 [29.94,30.06) 的零件为优质品.从两个分 厂生产的零件中各抽出了 500 件,量其内径尺寸,得结果如
(4)若χ2≤2.706,则认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,
但也不能作出结论“H0成立”,即不能认为Ⅰ与Ⅱ没有关 系.
课前探究学习
课堂讲练互动
题型一 利用χ2判定两个变量间的关系 【例1】 某电视台联合相关报社对“男女同龄退休”这一公众关
注的问题进行了民意调查,数据如下表所示:
赞同 男 女 合计 198 476 674
可能性为1%.
课前探究学习 课堂讲练互动
名师点睛 1.独立性检验
2 n ad - bc (1)利用随机变量 χ2= ,(其中 n=a+b a+bc+da+cb+d
+c+d 为样本容量),来确定在多大程度上可以认为“两个分 类变量有关系”的方法称为两个分类变量的独立性检验.
苏教版选修(2-3)3.1《独立性检验》word学案

独立性检验
教学目标:
1、通过对典型案例的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用
2、通过对数据的收集、整理和分析,增强学生的社会实践能力,培养学生分析问题、解决问题的能力。
教学重点:独立性检验的基本思想与方法 教学难点:独立性检验的初步应用 一、课前自主学习:
1、事件A 与B 独立,则P(AB)= ,=)(B A P =)(B A P ,=)(B A P
2、用2×2列联表进行独立性检验,2χ= 。
当2χ> 时,有 把握说事件A 与B 有关,当2χ> 时,有 把握说事件A 与B 有关,当≤2χ 时,认为事件A 与B 是无关的。
有95﹪的把握说事件A 与B 有关,是指推断犯错误的可能性为
3、使用2χ统计量作2×2列联表的独立性检验时,要求表中的4个数据都要 思考:
1、 用卡方检验的步骤是什么?
2、独立性检验的基本思想是什么?
3、用2
χ进行独立性检验作出的推断一定正确吗?
二、典例分析:
例1、为了探究患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调查结果如
试问:50岁以上的人患慢性气管炎与吸烟有关吗?
例2、对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟
试根据上述数据比较这两种手术对病人又发作心脏病的影响有没有差别。
例3、某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随
对于人力资源部的研究项目,根据上述数据能得出什么结论?
三.巩固练习:P81 A
四、小结:(写出本节的所学所思)。
高中数学3.1《独立性检验》教学设计苏教版选修2_3

第(1)课时课题:书法---写字基本知识课型:新授课教学目标:1、初步掌握书写的姿势,了解钢笔书写的特点。
2、了解我国书法发展的历史。
3、掌握基本笔画的书写特点。
重点:基本笔画的书写。
难点:运笔的技法。
教学过程:一、了解书法的发展史及字体的分类:1、介绍我国书法的发展的历史。
2、介绍基本书体:颜、柳、赵、欧体,分类出示范本,边欣赏边讲解。
二、讲解书写的基本知识和要求:1、书写姿势:做到“三个一”:一拳、一尺、一寸(师及时指正)2、了解钢笔的性能:笔头富有弹性;选择出水顺畅的钢笔;及时地清洗钢笔;选择易溶解的钢笔墨水,一般要固定使用,不能参合使用。
换用墨水时,要清洗干净;不能将钢笔摔到地上,以免笔头折断。
三、基本笔画书写1、基本笔画包括:横、撇、竖、捺、点等。
2、教师边书写边讲解。
3、学生练习,教师指导。
(姿势正确)4、运笔的技法:起笔按,后稍提笔,在运笔的过程中要求做到平稳、流畅,末尾处回锋收笔或轻轻提笔,一个笔画的书写要求一气呵成。
在运笔中靠指力的轻重达到笔画粗细变化的效果,以求字的美观、大气。
5、学生练习,教师指导。
(发现问题及时指正)四、作业:完成一张基本笔画的练习。
板书设计:写字基本知识、一拳、一尺、一寸我的思考:通过导入让学生了解我国悠久的历史文化,激发学生学习兴趣。
这是书写的起步,让学生了解书写工具及保养的基本常识。
基本笔画书写是整个字书写的基础,必须认真书写。
课后反思:学生书写的姿势还有待进一步提高,要加强训练,基本笔画也要加强训练。
总第(2)课时课题:书写练习1课型:新授课教学目标:1、教会学生正确书写“杏花春雨江南”6个字。
2、使学生理解“杏花春雨江南”的意思,并用钢笔写出符合要求的的字。
重点:正确书写6个字。
难点:注意字的结构和笔画的书写。
教学过程:一、小结课堂内容,评价上次作业。
二、讲解新课:1、检查学生书写姿势和执笔动作(要求做到“三个一”)。
2、书写方法是:写一个字看一眼黑板。
苏教版选修1-2高中数学1.1《独立性检验》ppt课件

【训练2】 某大型企业人力资源部为了研究企业员工工 作积极性和对待企业改革态度的关系,随机抽取了 189名员工进行调查,所得数据如下表所示:
积极支持 不太赞成 企业改革 企业改革
合计
工作 积极
54
40
94
工作 一般
32
63
95
对于人合力计 资源部86 的研究项10目3 ,根据上1述89数据能得出 什么结论?
解 提出假设 H0:工作积极性与是否积极支持企业改革无关. χ2=1899×4×549×5×638-6×401×03322≈10.759. 当 H0 成立时,χ2>6.635 的概率约为 0.010, 因为 10.759>6.635,所以有 99%的把握说:抽样员工对待企业改 革的态度与工作积极性是有关的,可以认为企业的全体员工对待 企业改革的态度与其工作积极性是有关的.
44
合计 480 520 1 000
依据公式得
χ2=1
000×442×6-38×5142 480×520×956×44
≈27.139.
当 H0 成立时,χ2≥10.828 的概率约为 0.001, 因为 χ2≈27.139>10.828,
所以我们有 99.9%的把握认为色盲与性别是有关的.
题型二 独立性检验的基本思想
如P(χ2≥6.635)≈0.01,由实际计算得χ2>6.635说明假设不 合理的程度约为99%,即两个分类变量有关系这一结论 成立的可信程度为99%.
2.利用χ2的值判定两个研究对象Ⅰ和Ⅱ之间的关系
(1)若χ2>10.828,则有99.9%的把握认为“Ⅰ与Ⅱ有 关系”;
(2)若χ2>6.635,则有99%的把握认为“Ⅰ与Ⅱ有关 系”;
最新2020高中数学 第3章 统计案例 3.1 独立性检验教学案 苏教版选修2-3

3.1 独立性检验1.2×2列联表的定义对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B;Ⅱ也有两类取值,即类1和类2.这些取值可用下面的2×2列联表表示.2.χ2统计量的求法公式χ2=n(ad-bc)2(a+c)(b+d)(a+b)(c+d).3.独立性检验的概念用统计量χ2研究两变量是否有关的方法称为独立性检验.4.独立性检验的步骤要判断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行:(1)提出假设H0:Ⅰ与Ⅱ没有关系;(2)根据2×2列联表及χ2公式,计算χ2的值;(3)查对临界值,作出判断.其中临界值如表所示:P(χ2≥x0)0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001χ00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.82 8表示在H0成立的情况下,事件“χ≥x0”发生的概率.5.变量独立性判断的依据(1)如果χ2>10.828时,那么有99.9%的把握认为“Ⅰ与Ⅱ有关系”;(2)如果χ2>6.635时,那么有99%的把握认为“Ⅰ与Ⅱ有关系”;(3)如果χ2>2.706时,那么有90%的把握认为“Ⅰ与Ⅱ有关系”;(4)如果χ2≤2.706时,那么就认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,但也不能作出结论“H0成立”,即Ⅰ与Ⅱ没有关系.1.在2×2列联表中,通常要求a,b,c,d的值均不小于5.2.表中|ad-bc|越小,Ⅰ与Ⅱ关系越弱;|ad-bc|越大,Ⅰ与Ⅱ关系越强.同时要记准表中a,b,c,d四个数据是交叉相乘然后再作差取绝对值,一定不要乘错.3.表中类A与类B,以及类1与类2的关系:对于对象Ⅰ来说,类A与类B是对立的,也就是说类A发生,类B一定不发生,类A不发生,则类B一定发生;同样对于对象Ⅱ来说,类1与类2的关系也是如此.[例1] 在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.[思路点拨] 在2×2列联表中,共有两类变量,每一类变量都有两个不同的取值,然后找出相应的数据,列表即可.[精解详析] 作列联表如下:喜欢甜食不喜欢甜食合计男117413530女492178670合计609591 1 200[一点通] 分清类别是列联表的作表关键步骤.表中排成两行两列的数据是调查得来的结果.1.下面是2×2y1y2合计x1 a 2173x222527合计 b 46则表中a,b的值分别为________,________.解析:∵a+21=73,∴a=52.又∵a+2=b,∴b=54.答案:52 542.某学校对高三学生作一项调查后发现:在平时的模拟考试中,性格内向的426名学生中有332名在考前心情紧张,性格外向的594名学生中在考前心情紧张的有213人 .作出2×2列联表.性格内向 性格外向 合计 考前心情紧张 332 213 545 考前心情不紧张94 381 475 合计4265941 020[例2] 下表是某地区的一种传染病与饮用水的调查表:得病 不得病 合计 干净水 52 466 518 不干净水 94 218 312 合计146684830(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.[思路点拨] (1)根据表中的信息计算χ2的值,并根据临界值表来分析相关性的大小,对于(2)要列出2×2列联表,方法同(1).[精解详析] (1)假设H 0:传染病与饮用水无关.把表中数据代入公式,得χ2=830×(52×218-466×94)2146×684×518×312≈54.21,因为当H 0成立时,χ2≥10.828的概率约为0.001,所以我们有99.9%的把握认为该地区这种传染病与饮用不干净水有关. (2)依题意得2×2列联表:得病 不得病 合计 干净水 5 50 55 不干净水 9 22 31 合计147286此时,χ2=86×(5×22-50×9)214×72×55×31≈5.785.由于5.785>2.706,所以我们有90%的把握认为该种疾病与饮用不干净水有关.两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有90%的把握肯定.[一点通] 解决独立性检验问题的基本步骤是:①指出相关数据,作列联表;②求χ2的值;③判断可能性,注意与临界值作比较,得出事件有关的可能性大小.3.某保健药品,在广告中宣传:“在服用该药品的105人中有100人未患A 疾病”.经调查发现,在不使用该药品的418人中仅有18人患A 疾病,请用所学知识分析该药品对患A 疾病是否有效?解:依题意得2×2的列联表:患病 不患病 合计 使用 5 100 105 不使用 18 400 418 合计23500523要判断该药品对患A 疾病是否有效,即进行独立性检验提出假设H 0:该药品对患A 疾病没有效.根据列联表中的数据可以求得χ2=523×(5×400-100×18)223×500×418×105≈0.041 45<0.455,而查表可知P (χ2≥0.455)≈0.5,故没有充分的理由认为该保健药品对预防A 疾病有效.4.在国家未实施西部开发战略前,一新闻单位在应届大学毕业生中随机抽取1 000人问卷,只有80人志愿加入西部建设.而国家实施西部开发战略后,随机抽取1 200名应届大学毕业生问卷,有400人志愿加入国家西部建设.实施西部开发战略是否对应届大学毕业生的选择产生了影响?志愿者 非志愿者 合计 开发战略公布前 80 920 1 000 开发战略公布后400 800 1 200 合计4801 7202 200提出假设H 0:实施西部开发战略的公布对应届大学毕业生的选择没有产生影响,根据列联表中的数据,可以求得χ2=2 200×(80×800-920×400)2480×1 720×1 000×1 200≈205.22.因为当H 0成立时,χ2≥10.828的概率约为0.001,所以有99.9%的所握认为西部开发战略的实施对应届大学毕业生的选择产生了影响.独立性检验的基本思想与反证法的思想比较反证法 独立性检验要证明结论A要确认“两个对象有关系”在A 不成立的前提下进行推理 假设该结论不成立,即假设结论“两个对象没有关系”成立,在该假设下计算χ2推出矛盾意味着结论A 成立由观测数据计算得到的χ2的观测值很大,则在一定可信程度上说明假设不合理 没有找到矛盾,不能对A 下任何结论,即反根据随机变量χ2的含义,可以通过概率P (χ2证法不成立≥x0)的大小来评价该假设不合理的程度有多大,从而得出“两个对象有关系” 这一结论成立的可信程度有多大课下能力提升(十八)一、填空题1.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的.(有关,无关) 解析:由χ2值可判断有关.答案:有关2.若两个研究对象X和Y的列联表为:y1y2x1515x24010则X与Y之间有关系的概率约为________.解析:因为χ2=(5+15+40+10)×(5×10-40×15)2(5+15)×(40+10)×(5+40)×(15+10)≈18.8,查表知P(χ2≥10.828)≈0.001.答案:99.9%3.在吸烟与患肺病这两个对象的独立性检验的计算中,下列说法正确的是________.(填序号)①若χ2=6.635,则我们认为有99%的把握认为吸烟与患肺病有关系.那么在100个吸烟的人中必有99人患肺病.②从独立性检验的计算中求有99%的把握认为吸烟与患肺病有关系时,我们认为如果某人吸烟,那么他有99%的可能患肺病.③若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误.④以上三种说法都不正确.解析:由独立性检验的意义可知,③正确.答案:③4.调查者询问了72名男女大学生在购买食品时是否观看营养说明得到如下2×2列联表:看营养说明不看营养说明总计男大学生28836从表中数据分析大学生的性别与看不看营养说明之间的关系是________.(填“有关”或“无关”)解析:提出假设H 0:大学生的性别与看不看营养说明无关,由题目中的数据可计算χ2=72×(28×20-16×8)244×28×36×36≈8.42,因为当H 0成立时,P (χ2≥7.879)≈0.005,这里的χ2≈8.42>7.879,所以我们有99.5%的把握认为大学生的性别与看不看营养说明有关.答案:有关5.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:则由表可知大约有解析:由公式得χ2=168×(68×38-42×20)2110×58×88×80≈11.377>10.828,所以我们有99.9%的把握说,多看电视与人变冷漠有关.答案:99.9% 二、解答题6.为研究学生的数学成绩与对学习数学的兴趣是否有关,对某年级学生作调查,得到如下数据:学生的数学成绩好坏与对学习数学的兴趣是否有关?解析:提出假设H 0:学生数学成绩的好坏与对学习数学的兴趣无关.由公式得χ2的值为χ2=189×(64×73-22×30)286×103×95×94≈38.459.∵当H 0成立时,χ2≥10.828的概率约为0.001,而这里χ2≈38.459>10.828,∴有99.9%的把握认为学生数学成绩的好坏与对学习数学的兴趣是有关的.7.考察小麦种子经过灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下列联表.试按照原试验目的作统计推断.解:提出假设H 0:种子是否灭菌与有无黑穗病无关.由公式得,χ2=460×(26×200-184×50)2210×250×76×384≈4.804.由于4.804>3.841,即当H 0成立时,χ2>3.841的概率约为0.05,所以我们有95%的把握认为种子是否灭菌与有无黑穗病是有关系的.8.为了调查某生产线上质量监督员甲是否在生产现场对产品质量好坏有无影响,现统计数据如下:甲在生产现场时,990件产品中有合格品982件,次品8件;甲不在生产现场时,510件产品中有合格品493件,次品17件.试用独立性检验的方法分析监督员甲是否在生产现场对产品质量好坏有无影响.解:2×2列联表如下提出假设H 0根据χ2公式得χ2=1 500(982×17-493×8)2990×510×1 475×25≈13.097.因为H 0成立时,χ2>10.828的概率约为0.001,而这里χ2≈13.097>10.828,所以有99.9%的把握认为质量监督员甲是否在生产现场与产品质量的好坏有关系.。
《独立性检验》教案苏教版选修

《独立性检验》教案2(苏教版选修2-3)3.1 独立性检验(2)教学目标通过对典型案例的探究,进一步巩固独立性检验的基本思想、方法,并能运用χ2统计量进行独立性检验.教学重点,难点:独立性检验的基本方法是重点.基本思想的领会及方法应用是难点.教学过程一.学生活动练习:(1)某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集哪些数据?.(2)某高校"统计初步"课程的教师随机调查了选该课的一些学生情况,具体数据如下表:非统计专业统计专业男1310女720为了判断主修统计专业是否与性别有关系,根据表中的数据,得到χ2,∵χ2,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为.(答案:5%)附:临界值表(部分):(χ2)0.100.050.0250.0102.7063.8415.0246.635二.数学运用1.例题:例1.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人。
女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动。
(1)根据以上数据建立一个2× 2列联表;(2)判断性别与休闲方式是否有关系。
解:(1)2× 2的列联表:休闲方式性别看电视运动总计女432770男213354总计6460124(2)假设"休闲方式与性别无关"χ2因为χ2,所以有理由认为假设"休闲方式与性别无关"是不合理的,即有97.5%的把握认为"休闲方式与性别有关"。
例2.气管炎是一种常见的呼吸道疾病,医药研究人员对两种中草药治疗慢性气管炎的疗效进行对比,所得数据如表所示.问它们的疗效有无差异(可靠性不低于99%)?有效无效合计复方江剪刀草18461245胆黄片919100合计27570345分析:由列联表中的数据可知,服用复方江剪刀草的患者的有效率为,服用胆黄片的患者的有效率为,可见,服用复方江剪刀草的患者与服用胆黄片的患者的有效率存在较大差异.下面用进行独立性检验,以确定能有多大把握作出这一推断.解:提出假设:两种中草药的治疗效果没有差异,即病人使用这两种药物中的何种药物对疗效没有明显差异.由列联表中的数据,求得当成立时,的概率约为,而这里所以我们有的把握认为:两种药物的疗效有差异.例3.下表中给出了某周内中学生是否喝过酒的随机调查结果,若要使结论的可靠性不低于95%,根据所调查的数据,能否作出该周内中学生是否喝过酒与性别有关的结论?喝过酒没喝过酒合计男生77404481女生16122138合计93526619 解:提出假设:该周内中学生是否喝过酒与性别无关.由列联表中的数据,求得,当成立时,的概率约为,而这里,所以,不能推断出喝酒与性别有关的结论.三.回顾小结:1.独立性检验的思想方法及一般步骤.四.课外作业:补充。
高中数学 1.1.1《独立性检验一》教学案 苏教版选修1-2

独立性检验(一)
教学目标:
1, 了解独立性检验的含义,理解22⨯列联表。
2, 会用统计量判断两系。
3, 通过典型案例,掌握独立性检验的基本思想。
课前预习
1用样本估计总体时,由于抽样的随机性,由样本得到的推断不一定正确。
利用2
x 进行独立性检验,可以对推断的正确性的概率作出估计,样本量n 越大,这个估计越 . 2.一般地,对于两个研究对象I 和Ⅱ,Ⅰ有两类取值类A 和类B ,Ⅱ也有两类取值类1和类2,可列联表如下:
则2
χ= 其中n= 为 样本量。
3.2
χ 临界值表
例1. 在500人身上试验某种,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表1—1—5所示。
问:该种血清能否起到预防感冒的作用?
表1—1—5
例2.考查人的高血压是否与食盐摄入量有关,对某地区人群进行跟踪调查,得到以下数据:
1.某桑场为了了解职工发生工作人员进行了一次调查,结果如下表。
试问:发生皮炎是否与
采桑有关?
2.为了鉴定新疫苗的效力,将60只豚鼠随机地分成两组,在其中一组接种疫苗后,两组都注射了病源菌,结果列于下表。
问:能否有90%的把握认为疫苗有效?
3某医疗研究机构为了了解关系,进行了一次抽样调查,得到如下数据。
问:打鼾与患心脏病是否有关?。
《 独立性检验》示范课教案【高中数学苏教版】

第九章 统计9.2.1 独立性检验1. 通过实例,理解2×2列联表的统计意义;2. 通过实例,了解2×2列联表独立性检验的基本思想、方法和初步应用.重点:理解2×2列联表的统计意义.难点:了解2×2列联表独立性检验及其应用.一、新课导入情境:某医疗机构为了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人,调查结果是:吸烟220人中,有37人患呼吸道疾病(以下简称患病),183人未患呼吸道疾病(以下简称未患病),不吸烟的295人中 ,有21人患病,274人未患病.我们能根据上面的数据,得到怎样的结论呢? 二、新知探究问题1:根据这些数据,是否能断定:患呼吸道疾病与吸烟有关? 为了研究这个问题,我们将上述数据用下表表示.患病 未患病 合计 吸烟 37 183 220 不吸烟 21 274 295 合计58457515形如上表的表格称为2×2列联表.答案:根据表中的数据可知,在吸烟的人中,有37220≈16.82%的人患病;在不吸烟的人中,有21295≈7.12%的人患病,可知吸烟者与不吸烟者患病的可能性存在差异,所以有患病与吸烟有关这一推论.◆教学目标◆教学重难点 ◆◆教学过程列联表是一个描述两个分类变量分布的频数表.一般地,假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(也称为2×2列联表)如下:设计意图:先利用频率估计概率的思想,由吸烟者与不吸烟者患病的可能性的差异程度直观地做出判断.问题2:上述结论给我们的印象是患病与吸烟有关,事实果真如此吗?究竟能有多大的把握认为“患病与吸烟有关”呢?答案:我们可以对两者的关系进行检验.若将事件“某成年人吸烟”记为A ,事件“某成年人患病”记为B ,则事件“某成年人不吸烟”记为A ,事件“某成年人不患病”记为 B ̅̅̅̅,这样,回答“患病与吸烟是否有关?”其实就是需要回答“事件A 与事件B 是否独立?”为了回答这个问题,我们先做出判断“患病与吸烟没有关系”,即提出如下假设H 0:患病与吸烟没有关系.由两个事件相互独立的充要条件,又可将上述假设记为H 0:P (AB )=P (A )P (B ) ,这里的P (A ),P (B )和P (AB )的值都不知道,我们可以用频率来代替概率,估计出P (A ),P (B )和P (AB )的值. 为了便于研究一般情况,我们将原表中的数据用字母代替,得到字母表示的2×2列联表,若设n =a +b +c +d ,则有()a b P A n +≈ ()a cP B n+≈, 故()a b a cP AB n n++≈⋅. 因此在H 0成立的条件下,吸烟且患病的人数为()a b a cn P AB n n n++⋅≈⋅⋅. 同理可得:吸烟但未患病的人数为()a b b d n P AB n n n++⋅≈⋅⋅,不吸烟但患病的人数为()c d a c n P AB n n n++⋅≈⋅⋅,不吸烟且未患病的人数为n ∙P (A B ̅)=n ∙c+d n∙b+d n.如果实际观测值与在事件A ,B 独立的假设下的估计值相差不“大”,那么我们就可以认为这些差异是由随机误差造成的,假设H 0不能被所给数据否定,否则应认为假设H 0不能接受. 追问1:怎样描述实际观测值与估计值的差异呢?答案:考虑实际观测值与在事件A ,B 独立的假设下的估计值的差(如下表):为了避免正负相消及消除样本容量对差异大小的影响,可以将它们分别平方并除以对应的估计频数(即估计值),最后相加,得到22222()()()()a b a c a b b d c d a c c d b d a n b n c n d n n n n n n n n n a b a c a b b d c d a c c d b d n n n n n n n n n n n nχ++++++++-⋅⋅-⋅⋅-⋅⋅-⋅⋅=+++++++++++⋅⋅⋅⋅⋅⋅⋅⋅化简得:22()()()()()n ad bc a b c d a c b d χ-=++++(其中n =a +b +c +d )统计学中通常采用统计量χ2(读作“卡方”)来刻画这个差异. 追问2:如何利用χ2进行推断呢?统计学中已有明确的结论:在H 0成立的情况下,随机事件“χ2≥ 6.635”发生的概率约为0.01,即P (χ2≥ 6.635)≈0.01,也就是说,在H 0成立的情况下,对统计量χ2进行多次观测,观测值超过6.635的概率约为0.01.通过计算,本例中χ2 =11.8634>6.635”,由P (χ2≥ 6.635)≈0.01可知,出现这样的观测值χ2的概率不超过0.01,因此,我们有99%的把握认为H 0不成立,即有99%的把握认为“患呼吸道疾病与吸烟有关系” . 统计量χ2的计算公式:22()()()()()n ad bc a b c d a c b d χ-=++++(其中n =a +b +c +d )独立性检验的定义利用统计量χ2来判断“两个分类变量有关系”的方法称为独立性检验.推断两个分类变量“Ⅰ与Ⅱ有关系”的步骤:一般地,对于两个分类变量Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B,Ⅱ也有两类取值,即类1和类2 ,我们得到如下列联表所示的样本数据:要推断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行:(1)提出假设H0:Ⅰ与Ⅱ没有关系;(2)根据2×2列联表与公式计算χ2的值;(3)根据临界值表,做出判断.独立性检验临界值表:(1)若χ2>10.828,则有99.9%的把握认为“Ⅰ与Ⅱ有关系”;(2)若χ2>6.635,则有99%的把握认为“Ⅰ与Ⅱ有关系”;(3)若χ2>2.706,则有90%的把握认为“Ⅰ与Ⅱ有关系”;(4)若χ2≤2.706,则认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,但也不能得出结论“H0成立”,即Ⅰ与Ⅱ没有关系.三、应用举例例1 在500人身上试验某种血清预防感冒的作用,把他们1年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如下表所示.问:该种血清对预防感冒是否有作用?χ2=1000×(258×284−242×216)2500×500×474×526≈7.075因为当H0成立时,χ2≥6.635的概率约为0.01,所以我们有99%的把握认为,该种血清能起到预防感冒的作用.方法总结:独立性检验的注意点:在2×2列联表中,如果两个分类变量没有关系,那么应满足ad-bc≈0,因此|ad-bc|越小,关系越弱;|ad-bc|越大,关系越强.例2为研究不同的给药方式(口服与注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查结果如下表所示,根据所选择的193个病人的数据,能否做出药的效果与给药方式有关的结论?χ2=193×(58×31−40×64)298×95×122×71≈1.3896<2.072因为当H0成立时,χ2≥1.389 6的概率大于15%,这个概率比较大,所以根据目前的调查数据,不能否定假设H0,即不能作出药的效果与给药方式有关的结论.例3 气管炎是一种常见的呼吸道疾病,医药研究人员对两种中草药治疗慢性气管炎的疗效进行了对比,所得数据如下表所示.问:它们的疗效有无差异?解:提出假设H0没有明显差异,根据列联表中的数据可以求得χ2=345×(184×9−61×91)2245×100×275×70≈11.098因为当H0成立时,P(χ2≥10.828)≈0.001,这里的χ2≈11.098>10.828,所以我们有99.9%的把握认为,两种药物的疗效有差异.四、课堂练习1.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A .平均数与方差 B .回归分析 C .独立性检验D .概率2.分类变量X 和Y 的列表如下,则下列说法判断正确的是( )A .ad -bcB .ad -bc 越大,说明X 和Y 关系越强C .(ad -bc )2越大,说明X 与Y 关系越强 D .(ad -bc )2越接近于0,说明X 与Y 关系越强3.若由一个2×2列联表中的数据计算得χ2=8.013,那么是否有99.5%的把握认为两个随机事件之间有关系:________.(填“是”或“否”)4. 为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人进行了调查,结果是:患胃病者生活不规律的共60人,患胃病者生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病者生活规律的共200人. (1)根据以上数据列出2×2列联表;(2)在犯错误的概率不超过0.01的前提下能否认为40岁以上的人患胃病与否和生活规律有关系?为什么? 参考答案:1.解析:选C .判断两个分类变量是否有关的最有效方法是进行独立性检验.2. 解析:选C .列联表可以较为准确地判断两个变量之间的相关关系程度,由()22()()()()()a b c d ad bc a b c d a c b d χ+++-=++++,当(ad -bc )2越大,χ2越大,表明X 与Y 的关系越强.(ad -bc )2越接近0,说明两个分类变量X 和Y 无关的可能性越大.3.解析:因为χ2=8.013>7.879=x 0.005,查阅χ2表知有99.5%的把握认为两个随机事件之间有关系. 答案:是.4. (1)由已知可列2×2列联表:(2)χ2=540×(20×260-200×60)2220×320×80×460≈9.638>6.635=x 0.01,因此在犯错误的概率不超过0.01的前提下认为40岁以上的人患胃病与否和生活规律有关. 五、课堂小结 1.统计量χ2的计算公式:22()()()()()n ad bc a b c d a c b d χ-=++++(其中n =a +b +c +d )2. 推断两个分类变量“Ⅰ与Ⅱ有关系”的步骤: (1)提出假设H 0:Ⅰ与Ⅱ没有关系; (2)根据2×2列联表与公式计算χ2的值; (3)根据临界值表,做出判断.3.独立性检验临界值表:(1)若χ2>10.828,则有99.9%的把握认为“Ⅰ与Ⅱ有关系”; (2)若χ2>6.635,则有99%的把握认为“Ⅰ与Ⅱ有关系”; (3)若χ2>2.706,则有90%的把握认为“Ⅰ与Ⅱ有关系”;(4)若χ2≤2.706,则认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,但也不能得出结论“H 0成立”,即Ⅰ与Ⅱ没有关系. 六、布置作业教材第164页练习第1,2题.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.1 独立性检验(1)
教学目标
(1)通过对典型案例的探究,了解独立性检验(只要求22⨯列联表)的基本思想、方
法及初步应用;
(2)经历由实际问题建立数学模型的过程,体会其基本方法.
教学重点、难点:独立性检验的基本方法是重点.基本思想的领会及方法应用是难点. 教学过程 一.问题情境
5月31日是世界无烟日。
有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手。
这些疾病与吸烟有关的结论是怎样得出的呢?我们看一下问题:
1. 某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515
个成年人,其中吸烟者220人,不吸烟者295人.调查结果是:吸烟的220人中有37人患呼吸道疾病(简称患病),183人未患呼吸道疾病(简称未患病);不吸烟的295人中有21人患病,274人未患病.
问题:根据这些数据能否断定“患呼吸道疾病与吸烟有关”? 二.学生活动
为了研究这个问题,(1)引导学生将上述数据用下表来表示:
(2)估计吸烟者与不吸烟者患病的可能性差异:
在吸烟的人中,有
37
16.82%220≈的人患病,在不吸烟的人中,有217.12%295
≈的人患病.
问题:由上述结论能否得出患病与吸烟有关?把握有多大?
三.建构数学 1.独立性检验:
(1)假设0H :患病与吸烟没有关系.
(近似的判断方法:设n a b c d =+++,如果0H 成立,则在吸烟的人中患病的比例与
不吸烟的人中患病的比例应差不多,由此可得
a c
a b c d
≈
++,即()()0a c d c a b ad bc +≈+⇒-≈,因此,||ad bc -越小,患病与吸烟之间的关系越
弱,否则,关系越强.)
设n a b c d =+++,
在假设0H 成立的条件下,可以通过求 “吸烟且患病”、“吸烟但未患病”、“不吸烟但患病”、“不吸烟且未患病”的概率(观测频率),将各种人群的估计人数用,,,,a b c d n 表示出来.
例如:“吸烟且患病”的估计人数为()a b a c
n P AB n n n ++⨯≈⨯
⨯
; “吸烟但未患病” 的估计人数为()a b b d
n P AB n n n ++⨯≈⨯⨯
; “不吸烟但患病”的估计人数为()c d a c
n P AB n n n
++⨯≈⨯⨯
; “不吸烟且未患病”的估计人数为()c d b d
n P AB n n n
++⨯≈⨯⨯
. 如果实际观测值与假设求得的估计值相差不大,就可以认为所给数据(观测值)不能
否定假设0H .否则,应认为假设0H 不能接受,即可作出与假设0H 相反的结论. (2)卡方统计量:
为了消除样本对上式的影响,通常用卡方统计量(χ2
2
()-=∑
观测值预期值预期值
)来进
行估计.
卡方χ2
统计量公式:
χ22
2
a b a c a b b d a n b n n n n n a b a c a b b d
n n n n n n
++++⎛⎫⎛⎫-⨯⨯-⨯⨯ ⎪ ⎪⎝⎭⎝⎭=+
++++⨯⨯⨯⨯
22
c d a c c d b d c n d n n n n n c d a c c d b d n n n n n n ++++⎛⎫⎛⎫-⨯⨯-⨯⨯ ⎪ ⎪⎝
⎭⎝⎭++++++⨯⨯⨯⨯ ()()()()()
2
n ad bc a b c d a c b d -=
++++(其中n a b c d =+++) 由此若0H 成立,即患病与吸烟没有关系,则χ2
的值应该很小.把
37,183,21,274a b c d ====代入计算得χ211.8634=,统计学中有明确的结论,在
0H 成立的情况下,随机事件“2 6.635χ≥”
发生的概率约为0.01,即2
( 6.635)0.01P χ≥≈,也就是说,在0H 成立的情况下,对统计量χ2
进行多次观测,观测值超过6.635的频率约为0.01.由此,我们有99%的把握认为0H 不成立,即有99%的把握认为“患病与吸烟有关系”.
象以上这种用2
χ统计量研究吸烟与患呼吸道疾病是否有关等问题的方法称为独立性检验.
说明:
(1)估计吸烟者与不吸烟者患病的可能性差异是用频率估计概率,利用χ2进行独立
性检验,可以对推断的正确性的概率作出估计,观测数据,,,
a b c d取值越大,效果越
好.在实际应用中,当,,,
a b c d均不小于5,近似的效果才可接受.
(2)这里所说的“呼吸道疾病与吸烟有关系”是一种统计关系,这种关系是指“抽烟的人患呼吸道疾病的可能性(风险)更大”,而不是说“抽烟的人一定患呼吸道疾病”.
(3)在假设
H下统计量χ2应该很小,如果由观测数据计算得到χ2的观测值很大,则在一定程度上说明假设不合理(即统计量χ2越大,“两个分类变量有关系”的可能性就越大).
2.独立性检验的一般步骤:
一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值:类A和类B(如吸烟与不吸烟),Ⅱ也有两类取值:类1和类2(如患呼吸道疾病与不患呼吸道疾病),得到如下表所示:
推断“Ⅰ和Ⅱ有关系”的步骤为:
第一步,提出假设
H:两个分类变量Ⅰ和Ⅱ没有关系;
第二步,根据2×2列联表和公式计算χ2统计量;
第三步,查对课本中临界值表,作出判断.
3.独立性检验与反证法:
反证法原理:在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立;
独立性检验(假设检验)原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立.
四.数学运用
1.例题:
例1.在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示.问:该种血清能否起到预防感冒的
分析:在使用该种血清的人中,有48.4%
500
=的人患过感冒;在没有使用该种血清
的人中,有284
56.8%
500
=的人患过感冒,使用过血清的人与没有使用过血清的人的患
病率相差较大.从直观上来看,使用过血清的人与没有使用过血清的人的患感冒的可能性存在差异.
解:提出假设0H :感冒与是否使用该种血清没有关系.由列联表中的数据,求得
2
2
1000(258284242216)7.075474526500500
χ⨯⨯-⨯=≈⨯⨯⨯
∵当0H 成立时,2
6.635χ≥的概率约为0.01,∴我们有99%的把握认为:该种血清能起到预防感冒的作用.
例2.为研究不同的给药方式(口服或注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查结果如表所示.根据所选择的193个病人的数据,能否作出
分析:在口服的病人中,有
59%98≈的人有效;在注射的病人中,有67%95
≈的人有效.从直观上来看,口服与注射的病人的用药效果的有效率有一定的差异,能否认为
用药效果与用药方式一定有关呢?下面用独立性检验的方法加以说明. 解:提出假设0H :药的效果与给药方式没有关系.由列联表中的数据,求得
2
2
193(58314064) 1.3896 2.072122719895
χ⨯⨯-⨯=≈<⨯⨯⨯
当0H 成立时,2
1.3896χ≥的概率大于15%,这个概率比较大,所以根据目前的调查数据,不能否定假设0H ,即不能作出药的效果与给药方式有关的结论.
说明:如果观测值2
2.706χ≤,那么就认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,但也不能作出结论“0H 成立”,即Ⅰ与Ⅱ没有关系. 2.练习:课本第91页 练习第1、2、3题. 五.回顾小结:
1.独立性检验的思想方法及一般步骤; 2.独立性检验与反证法的关系. 六.课外作业:
课本第93页 习题3.1 第1、2、3题.。