高中数学 第三章 统计案例 3.1 独立性检验 卡方检验素材 苏教版选修2-3
高中数学第三章统计案例3.1独立性检验学案苏教版选修2-3(2021年整理)

2018版高中数学第三章统计案例3.1 独立性检验学案苏教版选修2-3 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2018版高中数学第三章统计案例3.1 独立性检验学案苏教版选修2-3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2018版高中数学第三章统计案例3.1 独立性检验学案苏教版选修2-3的全部内容。
3.1 独立性检验学习目标1。
了解2×2列联表的意义。
2。
了解统计量χ2的意义。
3。
通过对典型案例分析,了解独立性检验的基本思想和方法.知识点一2×2列联表思考山东省教育厅大力推行素质教育,增加了高中生的课外活动时间,某校调查了学生的课外活动方式,结果整理成下表:体育文娱合计男生210230440女生60290350合计270520790如何判定“喜欢体育还是文娱与性别是否有联系”?梳理(1)2×2列联表的定义对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B;Ⅱ也有两类取值,即类1和类2。
我们得到如下列联表所示的抽样数据:Ⅱ类1类2合计Ⅰ类A a b类B c d合计a+b+c+d(2)χ2统计量的求法公式χ2=错误!.知识点二独立性检验独立性检验的概念用χ2统计量研究两变量是否有关的方法称为独立性检验.知识点三独立性检验的步骤1.独立性检验的步骤要判断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行:(1)提出假设H0:__________________;(2)根据2×2列联表及χ2公式,计算________的值;(3)查对临界值,作出判断.其中临界值如表所示:P(χ2≥x0)0。
数学选修23第三章统计案例教案

第三章统计案例§独立性检验〔1〕1.某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人.调查结果是:吸烟的220人中有37人患呼吸道疾病〔简称患病〕,183人未患呼吸道疾病〔简称未患病〕;不吸烟的295人中有21人患病,274人未患病.问题:根据这些数据能否断定“患呼吸道疾病与吸烟有关〞?为了研究这个问题,〔1〕引导学生将上述数据用下表来表示:患病未患病合计吸烟37183220不吸烟21274295合计58457515一.建构数学1.独立性检验:〔1〕假设H0:患病与吸烟没有关系.假设将表中“观测值〞用字母表示,那么得下表:患病未患病合计吸烟a b a b不吸烟c d c d合计ac b d ab cd如果实际观测值与假设求得的估计值相差不大,就可以认为所给数据〔观测值〕不能否认假设H0.否那么,应认为假设H0不能接受,即可作出与假设H0相反的结论.〔2〕卡方统计量:为了消除样本对上式的影响,通常用卡方统计量〔2(观测值预期值)2χ〕来进行估计.预期值2卡方χ统计量公式:2χ2nad bc〔其中n a b c d〕a b c d a c b d由此假设H0成立,即患病与吸烟没有关系,那么2183,c21,d274代入计算得χ的值应该很小.把a37,b2H0成立的情况下,随机事件“2〞χ,统计学中有明确的结论,在发生的概率约为,即P(26.635)2,也就是说,在H0成立的情况下,对统计量χ进行屡次观测,观测值超过的频率约为.由此,我们有99%的把握认为H0不成立,即有99%的把握认为“患病与吸烟有关系〞.2象以上这种用统计量研究吸烟与患呼吸道疾病是否有关等问题的方法称为独立性检验.2.独立性检验的一般步骤:一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值:类A和类B〔如吸烟与不吸烟〕,Ⅱ也有两类取值:类1和类2〔如患呼吸道疾病与不患呼吸道疾病〕,得到如下表所示:Ⅱ类1类2合计类A a b a bⅠc d c d类B合计ac bd ab cd 推断“Ⅰ和Ⅱ有关系〞的步骤为:第一步,提出假设H0:两个分类变量Ⅰ和Ⅱ没有关系;第二步,根据2×2列联表和公式计算χ2统计量;第三步,查对课本中临界值表,作出判断.3.独立性检验与反证法:反证法原理:在一个假设下,如果推出一个矛盾,就证明了这个假设不成立;独立性检验〔假设检验〕原理:在一个假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立.四.数学运用1.例题:例1.在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比拟,结果如表所示.问:该种血清能否起到预防感冒的作用?未感冒感冒合计使用血清258242500未使用血清216284500合计4745261000分析:在使用该种血清的人中,有24248.4%的人患过感冒;在没有使用该种血清的人中,有28456.8%的500500人患过感冒,使用过血清的人与没有使用过血清的人的患病率相差较大.从直观上来看,使用过血清的人与没有使用过血清的人的患感冒的可能性存在差异.解:提出假设H0:感冒与是否使用该种血清没有关系.由列联表中的数据,求得21000(258284242216)2474526500500∵当H0成立时,2的概率约为,∴我们有99%的把握认为:该种血清能起到预防感冒的作用.例2.为研究不同的给药方式〔口服或注射〕和药的效果〔有效与无效〕是否有关,进行了相应的抽样调查,调查结果如表所示.根据所选择的193个病人的数据,能否作出药的效果与给药方式有关的结论?有效无效合计口服584098注射643195合计12271193分析:在口服的病人中,有586459%的人有效;在注射的病人中,有67%的人有效.从直观上来看,口服9895与注射的病人的用药效果的有效率有一定的差异,能否认为用药效果与用药方式一定有关呢?下面用独立性检验的方法加以说明.解:提出假设H0:药的效果与给药方式没有关系.由列联表中的数据,求得2193(58314064)2122719895当H0成立时,2的概率大于15%,这个概率比拟大,所以根据目前的调查数据,不能否认假设H0,即不能作出药的效果与给药方式有关的结论.说明:如果观测值2,那么就认为没有充分的证据显示“Ⅰ与Ⅱ有关系〞,但也不能作出结论“H0成立〞,即Ⅰ与Ⅱ没有关系.§独立性检验〔2〕二.数学运用1.练习题:1.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人。
最新2020高中数学 第3章 统计案例 3.1 独立性检验教学案 苏教版选修2-3

3.1 独立性检验1.2×2列联表的定义对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B;Ⅱ也有两类取值,即类1和类2.这些取值可用下面的2×2列联表表示.2.χ2统计量的求法公式χ2=n(ad-bc)2(a+c)(b+d)(a+b)(c+d).3.独立性检验的概念用统计量χ2研究两变量是否有关的方法称为独立性检验.4.独立性检验的步骤要判断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行:(1)提出假设H0:Ⅰ与Ⅱ没有关系;(2)根据2×2列联表及χ2公式,计算χ2的值;(3)查对临界值,作出判断.其中临界值如表所示:P(χ2≥x0)0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001χ00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.82 8表示在H0成立的情况下,事件“χ≥x0”发生的概率.5.变量独立性判断的依据(1)如果χ2>10.828时,那么有99.9%的把握认为“Ⅰ与Ⅱ有关系”;(2)如果χ2>6.635时,那么有99%的把握认为“Ⅰ与Ⅱ有关系”;(3)如果χ2>2.706时,那么有90%的把握认为“Ⅰ与Ⅱ有关系”;(4)如果χ2≤2.706时,那么就认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,但也不能作出结论“H0成立”,即Ⅰ与Ⅱ没有关系.1.在2×2列联表中,通常要求a,b,c,d的值均不小于5.2.表中|ad-bc|越小,Ⅰ与Ⅱ关系越弱;|ad-bc|越大,Ⅰ与Ⅱ关系越强.同时要记准表中a,b,c,d四个数据是交叉相乘然后再作差取绝对值,一定不要乘错.3.表中类A与类B,以及类1与类2的关系:对于对象Ⅰ来说,类A与类B是对立的,也就是说类A发生,类B一定不发生,类A不发生,则类B一定发生;同样对于对象Ⅱ来说,类1与类2的关系也是如此.[例1] 在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.[思路点拨] 在2×2列联表中,共有两类变量,每一类变量都有两个不同的取值,然后找出相应的数据,列表即可.[精解详析] 作列联表如下:喜欢甜食不喜欢甜食合计男117413530女492178670合计609591 1 200[一点通] 分清类别是列联表的作表关键步骤.表中排成两行两列的数据是调查得来的结果.1.下面是2×2y1y2合计x1 a 2173x222527合计 b 46则表中a,b的值分别为________,________.解析:∵a+21=73,∴a=52.又∵a+2=b,∴b=54.答案:52 542.某学校对高三学生作一项调查后发现:在平时的模拟考试中,性格内向的426名学生中有332名在考前心情紧张,性格外向的594名学生中在考前心情紧张的有213人 .作出2×2列联表.性格内向 性格外向 合计 考前心情紧张 332 213 545 考前心情不紧张94 381 475 合计4265941 020[例2] 下表是某地区的一种传染病与饮用水的调查表:得病 不得病 合计 干净水 52 466 518 不干净水 94 218 312 合计146684830(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.[思路点拨] (1)根据表中的信息计算χ2的值,并根据临界值表来分析相关性的大小,对于(2)要列出2×2列联表,方法同(1).[精解详析] (1)假设H 0:传染病与饮用水无关.把表中数据代入公式,得χ2=830×(52×218-466×94)2146×684×518×312≈54.21,因为当H 0成立时,χ2≥10.828的概率约为0.001,所以我们有99.9%的把握认为该地区这种传染病与饮用不干净水有关. (2)依题意得2×2列联表:得病 不得病 合计 干净水 5 50 55 不干净水 9 22 31 合计147286此时,χ2=86×(5×22-50×9)214×72×55×31≈5.785.由于5.785>2.706,所以我们有90%的把握认为该种疾病与饮用不干净水有关.两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有90%的把握肯定.[一点通] 解决独立性检验问题的基本步骤是:①指出相关数据,作列联表;②求χ2的值;③判断可能性,注意与临界值作比较,得出事件有关的可能性大小.3.某保健药品,在广告中宣传:“在服用该药品的105人中有100人未患A 疾病”.经调查发现,在不使用该药品的418人中仅有18人患A 疾病,请用所学知识分析该药品对患A 疾病是否有效?解:依题意得2×2的列联表:患病 不患病 合计 使用 5 100 105 不使用 18 400 418 合计23500523要判断该药品对患A 疾病是否有效,即进行独立性检验提出假设H 0:该药品对患A 疾病没有效.根据列联表中的数据可以求得χ2=523×(5×400-100×18)223×500×418×105≈0.041 45<0.455,而查表可知P (χ2≥0.455)≈0.5,故没有充分的理由认为该保健药品对预防A 疾病有效.4.在国家未实施西部开发战略前,一新闻单位在应届大学毕业生中随机抽取1 000人问卷,只有80人志愿加入西部建设.而国家实施西部开发战略后,随机抽取1 200名应届大学毕业生问卷,有400人志愿加入国家西部建设.实施西部开发战略是否对应届大学毕业生的选择产生了影响?志愿者 非志愿者 合计 开发战略公布前 80 920 1 000 开发战略公布后400 800 1 200 合计4801 7202 200提出假设H 0:实施西部开发战略的公布对应届大学毕业生的选择没有产生影响,根据列联表中的数据,可以求得χ2=2 200×(80×800-920×400)2480×1 720×1 000×1 200≈205.22.因为当H 0成立时,χ2≥10.828的概率约为0.001,所以有99.9%的所握认为西部开发战略的实施对应届大学毕业生的选择产生了影响.独立性检验的基本思想与反证法的思想比较反证法 独立性检验要证明结论A要确认“两个对象有关系”在A 不成立的前提下进行推理 假设该结论不成立,即假设结论“两个对象没有关系”成立,在该假设下计算χ2推出矛盾意味着结论A 成立由观测数据计算得到的χ2的观测值很大,则在一定可信程度上说明假设不合理 没有找到矛盾,不能对A 下任何结论,即反根据随机变量χ2的含义,可以通过概率P (χ2证法不成立≥x0)的大小来评价该假设不合理的程度有多大,从而得出“两个对象有关系” 这一结论成立的可信程度有多大课下能力提升(十八)一、填空题1.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的.(有关,无关) 解析:由χ2值可判断有关.答案:有关2.若两个研究对象X和Y的列联表为:y1y2x1515x24010则X与Y之间有关系的概率约为________.解析:因为χ2=(5+15+40+10)×(5×10-40×15)2(5+15)×(40+10)×(5+40)×(15+10)≈18.8,查表知P(χ2≥10.828)≈0.001.答案:99.9%3.在吸烟与患肺病这两个对象的独立性检验的计算中,下列说法正确的是________.(填序号)①若χ2=6.635,则我们认为有99%的把握认为吸烟与患肺病有关系.那么在100个吸烟的人中必有99人患肺病.②从独立性检验的计算中求有99%的把握认为吸烟与患肺病有关系时,我们认为如果某人吸烟,那么他有99%的可能患肺病.③若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误.④以上三种说法都不正确.解析:由独立性检验的意义可知,③正确.答案:③4.调查者询问了72名男女大学生在购买食品时是否观看营养说明得到如下2×2列联表:看营养说明不看营养说明总计男大学生28836从表中数据分析大学生的性别与看不看营养说明之间的关系是________.(填“有关”或“无关”)解析:提出假设H 0:大学生的性别与看不看营养说明无关,由题目中的数据可计算χ2=72×(28×20-16×8)244×28×36×36≈8.42,因为当H 0成立时,P (χ2≥7.879)≈0.005,这里的χ2≈8.42>7.879,所以我们有99.5%的把握认为大学生的性别与看不看营养说明有关.答案:有关5.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:则由表可知大约有解析:由公式得χ2=168×(68×38-42×20)2110×58×88×80≈11.377>10.828,所以我们有99.9%的把握说,多看电视与人变冷漠有关.答案:99.9% 二、解答题6.为研究学生的数学成绩与对学习数学的兴趣是否有关,对某年级学生作调查,得到如下数据:学生的数学成绩好坏与对学习数学的兴趣是否有关?解析:提出假设H 0:学生数学成绩的好坏与对学习数学的兴趣无关.由公式得χ2的值为χ2=189×(64×73-22×30)286×103×95×94≈38.459.∵当H 0成立时,χ2≥10.828的概率约为0.001,而这里χ2≈38.459>10.828,∴有99.9%的把握认为学生数学成绩的好坏与对学习数学的兴趣是有关的.7.考察小麦种子经过灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下列联表.试按照原试验目的作统计推断.解:提出假设H 0:种子是否灭菌与有无黑穗病无关.由公式得,χ2=460×(26×200-184×50)2210×250×76×384≈4.804.由于4.804>3.841,即当H 0成立时,χ2>3.841的概率约为0.05,所以我们有95%的把握认为种子是否灭菌与有无黑穗病是有关系的.8.为了调查某生产线上质量监督员甲是否在生产现场对产品质量好坏有无影响,现统计数据如下:甲在生产现场时,990件产品中有合格品982件,次品8件;甲不在生产现场时,510件产品中有合格品493件,次品17件.试用独立性检验的方法分析监督员甲是否在生产现场对产品质量好坏有无影响.解:2×2列联表如下提出假设H 0根据χ2公式得χ2=1 500(982×17-493×8)2990×510×1 475×25≈13.097.因为H 0成立时,χ2>10.828的概率约为0.001,而这里χ2≈13.097>10.828,所以有99.9%的把握认为质量监督员甲是否在生产现场与产品质量的好坏有关系.。
高中数学第3章统计案例3.1独立性检验课件新人教B版选修2_3

例2 某校订学生课外活动进行调查,结果整理成下表:
用你所学过的知识进行分析,能否在犯错误的概率不超过
0.01的前提下,认为“喜欢体育还是文娱与性别有关系”?
男生 女生 总计
体育 21 6 27
文娱 23 29 52
合计 44 35 79
解 判断方法如下: 假设H0“喜欢体育还是喜欢文娱与性别没有关系”,若H0 成立,则χ2应该很小. ∵n11=21,n12=23,n21=6,n22=29,n=79,
跟踪演练1 已知列联表:药物效果与动物实验列联表
患病 未患病 合计
服用药 10
45
55
未服药 20 总计 30
30
50
75
105
则χ2≈________.(结果保留3位小数)
105×10×30-20×452 解析 χ2= 30×75×55×50 ≈6.109. 答案 6.109
要点二 有关“相关的检验”
第三章——
3.1 独立性检验
[学习目标] 1.理解列联表的意义,会根据列联表中数据大致判断两个变 量是否独立. 2.理解统计量χ2的意义和独立性检验的基本思想.
1 预习导学 2 课堂讲义 3 当堂检测
挑战自我,点点落实 重点难点,个个击破 当堂训练,体验成功
[知识链接] 1.什么是列联表,它有什么作用? 答 一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值类A 和类B,Ⅱ也有两类取值类1和类2,得如下列联表中的抽样 数据:
理
文
合计
有兴趣
138
73
211
无兴趣
98
52
150
总计
236
125
361
代入公式得
361×138×52-73×982 χ2= 236×125×211×150 ≈1.871×10-4. ∵1.871×10-4≤3.841,可以认为学生选报文、理科与对外 语的兴趣无关.
【优文档】数学:《独立性检验》课件(苏教版选修)PPT

,调查结果是:吸烟的220人中37人患病, 183人不患病;
37/220≈16.82% 21/295 ≈ 7.12%
上述结论能说明吸烟与患病有关吗?能有多大把 握认为吸烟与患病有关呢?
为便于研究,用字母代替数据,得2×2列联表
吸烟 不吸烟
总计
患病 a c a+c
不患病 b d
b+d
总计 a+b c+d a+b+c+d
如果“吸烟与患病没有关系””,则在吸烟者中不患病
2
n n
nn
nabac
n a b bd
nn
nn
(c n c d a c)2 (d nc d bd )2
n n
nn
n c d a c
nc d bd
化 简 2得n n (an d b)2 c
n
n
(ac)b (d)a (b)c (d)
若H0成立,即“吸烟与患病没有关系””,则χ2应很小
独立性检验
列出2×2列联表
设n=a+b+c+d
患病 不患病 总计 为样本量 H0成立可能性只有1%,因此我们有99%的把握认为H0不成立,即有99%的把握认为“吸烟与患病有关系”
在H0成立的情况下,统计学家估算出如下的概率:
吸烟 a b a+b 某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人
这种利用随机变量 2来确定在多大程度上
可以认为“两个分类变量有关系”的方法称为 两个分类变量的独立性检验.
独立性检验的思想类似于数学上的反证法. 要确认“两个分类变量有关系”这一结论成立, 首先假设该结论不成立,即假设结论“两个分类 变量没有关系”成立.
高中数学 第三章 统计案例 3.1 独立性检验 假设检验(h

假设检验(hypothesis testing)方法演变:t检验、z检验、F检验、卡方检验,方差分析( ANOVA)➢概述假设检验是分析数据的一种方法。
回答此类问题:“随机发生的事件的概率是多少?”另一方面的问题是:“我们从数据中发现的结果是真的吗?”当问题是有关大的总体而只能得到总体的一个样本时用假设检验。
这种方法被用来回答在质量改进中一系列重要的问题,如“我们在过程中所做的改变对产出创造了有意义的差别吗?”或”顾客对场地A的满意度是不是比其他场地高?”最常用的检验是:z检验、t检验、F检验、卡方(χ2)检验和方差分析。
这些检验和其他的检验都是基于均值、方差、比例及其他统计量所形成的具有常见模式的频率分布。
最有名的分布就是正态分布,它是:检验的基础。
t检验、F检验和卡方(χ2)检验是基于t分布、F分布和卡方分布。
➢适用场合·想知道一组或更多组数据的平均值、比例、方差或其他特征时;·当结论是基于更大总体中所取得的样本时。
例如:·想确定一个过程的均值或方差有否改变;·想确定很多数据集的均值或方差是否不同:·想确定两组不同的数据集的比例是否不同;·想确定真正的比例、均值或方差是否和一个定值相等(或大于或小于)。
➢实施步骤假设检验的步骤由三部分组成:理解要解决的问题并安排检验(以下步骤1~3);数字计算通常由计算机完成(步骤4和步骤5);应用数值结果到实际问题中(步骤6)。
虽然计算机能处理数字,但理解假没检验隐含的观念对第1部分和第3部分至关重要。
如果第一次接触假设检验,那么从看“注意事项”中的术语和定义开始。
这些定义解释了假设检验的慨念,然后再回来看这个步骤。
本书不可能详细地涉及假设检验。
这个步骤是个综述和快速参考。
要得到更多的信息,查阅统计学参考书或请教统计学家。
1确定要从数据中获得的结论。
选择适当的检验方法。
用哪种检验取决于检验的目的和数据的种类。
苏教版选修2-3高中数学3.1《独立性检验》ppt课件

变式训练3 网络对现代人的生活影响较大,尤其 对青少年,为了解网络对中学生学习成绩的影响, 某地区教育主管部门从辖区初中生中随机抽取了 1000 人 调 查 , 发 现 其 中 经 常 上 网 的 有 200 人 , 这 200人中有80人期末考试不及格,而另外800人中 有120人不及格,问:中学生经常上网是否影响学 习,为什么?
4000×1820×240-180×17602 2000×2000×3580×420
≈9.577
>
6.635,
所以我们有 99%的把握认为学生是否关心国家大事与
性别有关.
(3)依题意男、女生人数分别是250人和200人,男生 中关心国家大事的人数为235人,女生中关心国家大 事的人数为170人; 列出2×2列联表如下:
2.独立性检验 (1)定义:我们用随机变量 χ2 来确定在多大程度上 可以认为“两个分类变量有关系”的方法称为两
个分类变量的独立性检验. (2)公式:χ2=a+bnc+add- ab+cc2b+d (3)步骤:①提出假设 H0:_Ⅰ__与__Ⅱ__没__有__关__系____; ②根据 2×2 列联表及 χ2 公式,计算的__χ2__值;
方法感悟
1.画列联表时要把两个分类变量分别作为第一行 和第一列,把数据填在相应的交叉点上,最右面一 列为对行的合计,最下面一行为对列的合计. 2.对卡方公式要从结构上结合列联表记忆,分母 分别是四个合计的积,分子是列联表主对角线之积 与副对角线之积的差的平方再乘样本容量.注意: 一是不要漏乘了样本容量,二是用公式时要细心计 算,防止出错.
【规范解答】 根据题目所给数据列出下列表格:
态度 性别
男生 女生 合计
肯定
22 18 40
高中数学苏教版选修2-3:3.1 独立性检验

遇上你是缘分,愿您生活愉快,身
7
体健康,学业有成,金榜题名!
[精解详析] 作列联表如下:
喜欢甜食 不喜欢甜食 合计
男
117
413
530
女
492
178
670
合计 609
591 1 200
[一点通] 分清类别是列联表的作表关键步骤.表中排成两行 两列的数据是调查得来的结果.
遇上你是缘分,愿您生活愉快,身
遇上你是缘分,愿您生活愉快,身
17
体健康,学业有成,金榜题名!
4.在国家未实施西部开发战略前,一新闻单位在应届大学毕业
生中随机抽取 1 000 人问卷,只有 80 人志愿加入西部建设.而
国家实施西部开发战略后,随机抽取 1 200 名应届大学毕业生
问卷,有 400 人志愿加入国家西部建设.实施西部开发战略
考前心情不紧张 94
381 475
合计
426
594 1 020
遇上你是缘分,愿您生活愉快,身
10
体健康,学业有成,金榜题名!
[例 2] 下表是某地区的一种传染病与饮用水的调查表:
得病 不得病 合计
干净水 52 466 518
不干净水 94 218 312
合计 146 684 830
(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;
遇上你是缘分,愿您生活愉快,身
19
体健康,学业有成,金榜题名!
独立性检验的基本思想与反证法的思想比较
反证法
独立性检验
要证明结论 A
要确认“两个对象有关系”
假设该结论不成立,即假设结论 在 A 不成立的前
“两个对象没有关系”成立,在该 提下进行推理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2χ检验(一) 掌握内容 1. 2χ检验的用途。
2. 四格表的2χ检验。
(1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2χ检验。
3. 行⨯列表的2χ检验。
(二) 熟悉内容频数分布拟合优度的2χ检验。
(三) 了解内容 1.2χ分布的图形。
2.四格表的确切概率法。
(一) 2χ检验的用途2χ检验(Chi-square test )用途较广,主要用途如下:1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2χ检验的基本思想1.2χ检验的基本思想是以2χ值的大小来反映理论频数与实际频数的吻合程度。
在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2χ值不应该很大,若实际计算出的2χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。
2. 基本公式:()∑-=TT A 22χ,A 为实际频数(Actual Frequency ),T 为理论频数(Theoretical Frequency )。
四格表2χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2χ值是一致的。
(三)率的抽样误差与可信区间 1.率的抽样误差与标准误样本率与总体率之间存在抽样误差,其度量方法:np )1(ππσ-=,π为总体率,或 (8-1)np p S p )1(-=, p 为样本率; (8-2)2.总体率的可信区间当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。
总体率的可信区间:(p p S u p S u p ⨯+⨯-2/2/,αα)。
(8-3) (四)2χ检验的基本计算见表8-1。
表8-1 2χ检验的用途、假设的设立及基本计算公式资料形式 用途 0H 、1H 的设立与计算公式自由度 四格表①独立资料两 样本率的比较②配对资料两 样本率的比较0H :两总体率相等 1H :两总体率不等①专用公式))()()(()(22d b c a d c b a nbc ad ++++-=χ②当n ≥40但1≤T<5时,校正公式))()()(()2/(22d b c a d c b a n n bc ad ++++--=χ ③配对设计cb c b +--=22)1(χ1R ⨯C 表①多个样本率、 构成比的比较②两个变量之 间关联性分析 0H :多个总体率(构成比)相等(0H :两种属性间存在关联)1H :多个总体率(构成比)不全相等 (0H :两种属性间存在关联))1(22-=∑CR n n A n χ(R-1)(C-1)频数分布表频数分布的拟合优度检验0H :资料服从某已知的理论分布 1H :资料不服从某已知的理论分布∑-TT A 2)(据频数表的组数而定(五)四格表的确切概率法当四格表有理论数小于1或n <40时,宜用四格表的确切概率法。
(六)2χ检验的应用条件及注意事项1.分析四格表资料时,应注意连续性校正的问题,当1<T <5,n >40时,用连续性校正2χ检验;T ≤1,或n ≤40时,用Fisher 精确概率法。
2.对于R ⨯C 表资料应注意以下两点:(1)理论频数不宜太小,一般要求:理论频数<5的格子数不应超过全部格子的1/5; (2)注意考察是否有有序变量存在。
对于单向有序R ⨯C 表资料,当指标分组变量是有序的时,宜用秩和检验;对于双向有序且属性不同的R ⨯C 表资料,若希望弄清两有序变量之间是否存在线性相关关系或存在线性变化趋势,应选用定性资料的相关分析或线性趋势检验;对于双向有序且属性相同的R ⨯C 表资料,为考察两种方法检测的一致性,应选用Kappa 检验。
典型试题分析(一)单项选择题1.下列哪项检验不适用2χ检验( )A . 两样本均数的比较B . 两样本率的比较C . 多个样本构成比的比较D . 拟合优度检验 答案:A[评析] 本题考点:2χ检验的主要用途。
2χ检验不能用于均数差别的比较。
2.分析四格表时,通常在什么情况下需用Fisher 精确概率法( )A .1<T <5,n>40B .T <5C .T 1≤或n 40≤D .T 1≤或n 100≤ 答案: C[评析] 本题考点:对于四格表,当T 1≤或n 40≤时,不宜用2χ检验,应用Fisher 精确概率法。
3.2χ值的取值范围为A .∞-<2χ<∞+B .+∞≤≤20χC .12≤χ D .02≤≤∞-χ答案: B[评析]根据2χ分布的图形或2χ的基本公式可以判断2χ值一定是大于等于零且没有上界的,故应选B 。
(二)是非题 两样本率的比较可以采用2χ检验,也可以采用双侧u 检验。
答案:正确。
[评析]就两个样本率的比较而言,双侧u 检验与2χ检验是等价的。
(三)简答题1.四格表的2χ检验和u 检验有何联系与区别?答案:相同点:凡是能用u 检验进行的两个率比较检验的资料,都可用2χ检验,两者是等价的,即22χ=u ;相异点:(1)u 检验可进行单侧检验;(2)满足四格表u 检验的资料,计算两个率之差的可信区间,可从专业上判断两率之差有无实际意义;(3)2χ检验可用于2⨯2列联表资料有无关联的检验。
2.R ⨯C 表2χ检验的适用条件及当条件不满足时可以考虑的处理方法是什么? 答案:R ⨯C 表2χ检验的适用条件是理论频数不宜过小,否则有可能产生偏性。
当条件不满足时有三种处理方法:①增大样本例数使理论频数变大;②删去理论数太小的行或列;③将理论数太小的行或列与性质相近的邻行或邻列合并,使重新计算的理论频数变大。
但②、③法都可能会损失信息或损害样本的随机性,因此应慎用。
(四)计算题1.为研究静脉曲张是否与肥胖有关,观察122对同胞兄弟,每对同胞兄弟中有一个属肥胖,另一个属正常体重,记录得静脉曲张发生情况见表8-2,试分析之。
表8-2 122对同胞兄弟静脉曲张发生情况正常体重 肥胖合计 发生 未发生 发 生19 5 24 未发生 12 86 98 合 计31 91122[评析]这是一个配对设计的资料,因此用配对2χ检验公式计算。
H 0:肥胖者与正常体重者的静脉曲张发生情况无差别 H 1:肥胖者与正常体重者的静脉曲张发生情况不同 05.0=α cb c b +--=22)1(χ=()12.212511252=+--,1=ν2χ=2.11<21,05.0χ,P >0.05,尚不能认为静脉曲张与肥胖有关。
2.某卫生防疫站在中小学观察三种矫正近视眼措施的效果,近期疗效数据见表8-3。
试对这三种措施的疗效作出评价。
表8-3 三种措施的近期有效率比较 矫治方法 有效人数 无效人数 合计有效率(%)夏天无眼药水 51 84 135 37.78 新医疗法 6 26 32 18.75 眼保健操 5 13 18 27.78 合计62 123 18533.51[评析]0H :三种措施有效率相等1H :三种措施有效率不相等或不全相等 05.0=α)1(22-=∑cr n n A n χ=185⨯⎪⎪⎭⎫ ⎝⎛-⨯+⨯+⨯+⨯+⨯+⨯1181231318625321232632626135123841356251222222=4.498,ν=(2-1)(3-1)=2查表得0.25>P >0.10,按0.05α=水准不拒绝0H ,尚不能认为三种措施有效率有差别。
3.某医院以400例自愿接受妇科门诊手术的未产妇为观察对象,将其分为4组,每组100例,分别给予不同的镇痛处理,观察的镇痛效果见表8-4,问4种镇痛方法的效果有无差异?表8-4 4种镇痛方法的效果比较 镇痛方法 例数 有效率(%) 颈麻 100 41 注药 100 94 置栓 100 89 [评析] 为了应用2χ检验,首先应计算出有效和无效的实际频数,列出计算表,见表8-5。
表8-5 4种镇痛方法的效果比较镇痛方法 有效例数 无效例数 合计 颈麻 41 59 100 注药 94 6 100 置栓 89 11 100 对照 27 73 100 合计 251 149 400 0H :4种镇痛方法的效果相同 1H :4种镇痛方法的效果不全相同05.0=α)1(22-=∑c r n n A n χ=400⎪⎪⎭⎫ ⎝⎛-⨯++⨯+⨯⨯110014973...1001495910025141222=146.175, ν=(4-1)(2-1)=3查表得P <0.05,按0.05α=水准拒绝0H ,接受1H ,即4种镇痛方法的效果不全相同。
四、习 题(一) 单项选择题1. 关于样本率p 的分布正确的说法是: A . 服从正态分布 B . 服从2χ分布C . 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布D . 服从t 分布 2. 以下说法正确的是: A . 两样本率比较可用u 检验 B . 两样本率比较可用t 检验 C . 两样本率比较时,有2χ=u D . 两样本率比较时,有22χ=t 3. 率的标准误的计算公式是: A .)1(p p - B .n p p )1(- C.1-n p D.np p )1(- 4. 以下关于2χ检验的自由度的说法,正确的是: A .拟合优度检验时,2-=n ν(n 为观察频数的个数) B .对一个43⨯表进行检验时,11=ν C .对四格表检验时,ν=4D .若2,05.02,05.0ηνχχ>,则ην>5. 用两种方法检查某疾病患者120名,甲法检出率为60%,乙法检出率为50%,甲、乙法一致的检出率为35%,问两种方法何者为优?A .不能确定B .甲、乙法一样C .甲法优于乙法D .乙法优于甲法 6.已知男性的钩虫感染率高于女性。
今欲比较甲乙两乡居民的钩虫感染率,适当的方法是:A .分性别比较B .两个率比较的2χ检验C .不具可比性,不能比较D .对性别进行标准化后再做比较 7.以下说法正确的是A .两个样本率的比较可用u 检验也可用2χ检验B .两个样本均数的比较可用u 检验也可用2χ检验C .对于多个率或构成比的比较,u 检验可以替代2χ检验D .对于两个样本率的比较,2χ检验比u 检验可靠 (二) 名词解释1. 实际频数与理论频数 2. 2χ界值表 3. 拟合优度 4. 配对四格表5. 双向有序分类资料 6. 率的标准误7. 多个率的两两比较 8. Fisher 精确概率 9. McNemar 检验 10. Yates 校正 (三) 是非题四个样本率做比较,2)3(05.02χχ> ,可认为各总体率均不相等。