32独立性检验的基本思及其初步应用

合集下载

高中数学必修2-3第三章3.2独立性检验的基本思想及其初步应用讲解

高中数学必修2-3第三章3.2独立性检验的基本思想及其初步应用讲解

3.2独立性检验的基本思想及其初步应用1.问题导航(1)分类变量的概念是什么?什么是列联表?什么是2×2列联表?(2)等高条形图的优点是什么?如何利用等高条形图判断两个变量之间的关系?(3)独立性检验的概念是什么?怎样进行独立性检验?2.例题导读例1是利用等高条形图和K2值的计算判断秃顶与患心脏病是否有关,请试做教材P97练习.1.分类变量和列联表(1)分类变量变量的不同“值”表示个体所属的_______不同类别,像这样的变量称为分类变量.(2)列联表①定义:列出的两个分类变量的_______频数表称为列联表.②2×2列联表一般地,假设有两个分类变量X和Y,它们的取值分别为_______{x1,x2_______}和_______{y1,y2.2.等高条形图(1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否_______相互影响,常用等高条形图展示列联表数据的_______频率特征.(2)观察等高条形图发现aa+b和cc+d相差很大,就判断两个分类变量之间_______有关系.3.独立性检验(1)定义利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.(2)K2=_______n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d为样本容量.(3)独立性检验的具体做法①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定_______临界值k0.②利用公式计算随机变量K2的_______观测值k.③如果_______k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则,就认为在_______犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中_______没有发现足够证据支持结论“X与Y有关系”.1.判断(对的打“√”,错的打“×”)(1)列联表中的数据是两个分类变量的频数.()(2)事件A与B的独立性检验无关,即两个事件互不影响.()(3)K2的大小是判断事件A与B是否相关的统计量.()答案:(1)√(2)×(3)√2.在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是()A.散点图B.等高条形图C.2×2列联表D.以上均不对答案:B3.分类变量X和则下列说法中正确的是()A.ad-bc越小,说明X与Y关系越弱B.ad-bc越大,说明X与Y关系越强C.(ad-bc)2越大,说明X与Y关系越强D.(ad-bc)2越接近于0,说明X与Y关系越强答案:C4.若由一个2×2列联表中的数据计算K2的观测值k=4.013,那么在犯错误的概率不超过________的前提下认为两个变量有关系.答案:0.05详析独立性检验(1)独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握认为两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系.(2)列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此,独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论.(3)独立性检验原理:在假设H0下,如果出现一个与H0相矛盾的小概率事件,就推断H0不成立,且该推断犯错误的概率不超过这个小概率.等高条形图的应用(2015·青岛高二检测)某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.[解]作列联表如下:相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例大,可以认为考前紧张与性格类别有关.利用等高条形图判断两个分类变量是否相关的步骤1.(1)观察下列各图,其中两个分类变量X,Y之间关系最强的是()解析:选D.在四幅图中,D图中两个阴影条的高度相差最明显,说明两个分类变量之间的关系最强.(2)在一次恶劣气候的飞行航程中,调查男女乘客在机上晕机的情况如下表所示,据此解:由数据的列联表可以得到等高条形图为:从图中可以发现男性中晕机的频率与女性中晕机的频率相差较大,故我们认为性别和是否晕机有关系,且在恶劣气候飞行中男性比女性更容易晕机.独立性检验(2014·高考辽宁卷节选)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.[解]将2×2列联表中的数据代入公式计算,得K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=100×(60×10-20×10)2 70×30×80×20=10021≈4.762.因为4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.解决独立性检验问题的基本步骤:(1)根据已知的数据作出列联表.(2)作出相应的等高条形图,可以利用图形做出相应判断.(3)求K2的观测值.(4)判断可能性:与临界值比较,得出事件有关的可能性大小.2.(1)为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.分析学生选报文、理科与对外语的兴趣是否有关?解:列出2×2列联表代入公式得K 2的观测值k =361×(138×52-73×98)2236×125×211×150≈1.871×10-4.∵1.871×10-4<2.706,∴可以认为学生选报文、理科与对外语的兴趣无关. (2)①这种传染病是否与饮用水的卫生程度有关,请说明理由;②若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.解:①假设H 0:传染病与饮用水无关,把表中数据代入公式得K 2=830×(52×218-466×94)2146×684×518×312≈54.21,∵54.21>10.828,所以拒绝H 0.因此我们有99.9%的把握认为该地区这种传染病与饮用不干净水有关. ②依题意得2×2列联表:此时,K 2的观测值k =86×(5×22-50×9)214×72×55×31≈5.785.由于5.785>5.024,所以我们有97.5%的把握认为该种疾病与饮用不干净水有关.两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但①中我们有99.9%的把握肯定结论的正确性.②中我们只有97.5%的把握肯定.(本题满分12分)调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据:出生时间在晚上的男婴为24人,女婴为8人;出生时间在白天的男婴为31人,女婴为26人.(1)将下面的2×2(2)能否在犯错误的概率不超过0.1的前提下认为婴儿性别与出生时间有关系? [解] (1)4分(2)由所给数据计算K 2的观测值 k =89×(24×26-31×8)255×34×32×57≈3.689>2.706.8分根据临界值表知P (K 2≥2.706)≈0.10.9分因此在犯错误的概率不超过0.1的前提下认为婴儿的性别与出生的时间有关系.12分 [规范与警示] (1)解答过程中的表格经常因为不认真仔细,把数据填写错误,会直接导致总计出错,也会导致k值求错,另外在利用公式求K2的观测值时经常因为公式用错,数据代入计算错误,而使得独立性检验出错.(2)在解答独立性检验题目中,数据有时比较多,一定不要混淆,要分辨清楚,否则会影响解题的下一步,如本例2×2列联表中数据极易混淆.(3)计算中,有时公式复杂,要记忆准确,同时计算不能失误,如K2的公式很复杂,计算中也不要粗心.1.对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是()A.k越大,“X与Y有关系”的可信程度越小B.k越小,“X与Y有关系”的可信程度越小C.k越接近于0,“X与Y没有关系”的可信程度越小D.k越大,“X与Y没有关系”的可信程度越大解析:选B.k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大,k越小,“X与Y有关系”的可信程度越小.2.下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出()A.性别与喜欢理科无关B.女生中喜欢理科的比为80%C.男生比女生喜欢理科的可能性大些D.男生不喜欢理科的比为60%解析:选C.由图知女生中喜欢理科的比为20%,男生不喜欢理科的比为40%,故B、D 不正确.由图知,男生比女生喜欢理科的可能性大些.3.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名由表中数据直观分析,收看新闻节目的观众与年龄________.(填“有关”或“无关”) 解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即b a +b =1858,d c +d =2742,两者相差较大,所以,经直观分析,收看新闻节目的观众与年龄有关.答案:有关4.高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”.下表是一次针对高三文科学生的调查所得的数据.(1)计算a ,(2)文科学生总成绩不好与数学成绩不好有关系吗? 解:(1)由478+a =490,得a =12. 由a +24=c ,得c =12+24=36. 由b +c =913,得b =913-36=877. (2)计算随机变量K 2的观测值:k =913×(478×24-399×12)2490×423×877×36≈6.233>5.024,∵P (k ≥5.024)≈0.025,∴在犯错误的概率不超过0.025的前提下,认为文科学生总成绩不好与数学成绩不好有关系.[A.基础达标]1.下面是2×2则表中a ,b 的值分别为A .94,72 B .52,50 C .52,74 D .74,52 解析:选C.根据列联表的特点,可知:⎩⎪⎨⎪⎧a +21=73,a +22=b ,解得⎩⎪⎨⎪⎧a =52,b =74. 2.下列关于等高条形图的叙述正确的是( )A .从等高条形图中可以精确地判断两个分类变量是否有关系B .从等高条形图中可以看出两个变量频数的相对大小C .从等高条形图中可以粗略地看出两个分类变量是否有关系D .以上说法都不对解析:选C.在等高条形图中仅能粗略判断两个分类变量的关系,故A 错.在等高条形图中仅能够找出频率,无法找出频数,故B 错.3.在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.下列说法中正确的是( )A .100个心脏病患者中至少有99人打鼾B .1个人患心脏病,则这个人有99%的概率打鼾C .100个心脏病患者中一定有打鼾的人D .100个心脏病患者中可能一个打鼾的人都没有解析:选D.这是独立性检验,犯错误的概率在不超过0.01的前提下认为“打鼾与患心脏病有关”.这只是一个概率,即打鼾与患心脏病有关的可能性为99%.根据概率的意义可知答案应选D.4.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中由以上数据,计算得到K 的观测值k ≈9.643,根据临界值表,以下说法正确的是( ) A .没有充足的理由认为课外阅读量大与作文成绩优秀有关 B .有0.5%的把握认为课外阅读量大与作文成绩优秀有关 C .有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关解析:选D.根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.5.对两个分类变量A、B的下列说法中正确的个数为()①A与B无关,即A与B互不影响;②A与B关系越密切,则K2的值就越大;③K2的大小是判定A与B是否相关的唯一依据A.1 B.2C.3 D.0解析:选A.①正确,A与B无关即A与B相互独立;②不正确,K2的值的大小只是用来检验A与B是否相互独立;③不正确,也可借助等高条形图等.故选A.6.独立性检验所采用的思路是:要研究X,Y两个分类变量彼此相关,首先假设这两个分类变量彼此________,在此假设下构造随机变量K2.如果K2的观测值较大,那么在一定程度上说明假设________.解析:独立性检验的前提是假设两个分类变量无关系,然后通过随机变量K2的观测值来判断假设是否成立.答案:无关系不成立7.在吸烟与患肺病是否相关的判断中,有下面的说法:①若K2的观测值k>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.解析:K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.答案:③8根据上述数据分析,我们得出的K 的观测值k 约为________. 解析:由公式可计算得k =102×(27×29-34×12)239×63×61×41≈2.334.答案:2.3349.某生产线上,质量监督员甲在生产现场时,990件产品中有合格品982件,次品8件;不在生产现场时,510件产品中有合格品493件,次品17件.试利用列联表和等高条形图判断监督员甲在不在生产现场对产品质量好坏有无影响.解:根据题目所给数据得如下2×2列联表:∵ad -bc =982×17-8×493=12 750,|ad -bc |比较大,说明甲在不在生产现场与产品质量好坏有关系.相应的等高条形图如图所示.图中两个阴影部分的高分别表示甲在生产现场和甲不在生产现场时样品中次品数的频率.从图中可以看出,甲不在生产现场时样本中次品数的频率明显高于甲在生产现场时样本中次品数的频率.因此可以认为质量监督员甲在不在生产现场与产品质量好坏有关系.10.研究人员选取170名青年男女大学生作为样本,对他们进行一种心理测验,发现60名女生对该心理测验中的最后一个题目的反应是:作肯定的有22名,作否定的有38名;110名男生在相同的题目上作肯定的有22名,作否定的有88名,问:性别与态度之间是否存在某种关系?试用独立性检验的方法判断.解:根据题意,得如下2×2列联表:根据列联表中的数据,得k=170×(22×38-22×88)2110×60×44×126≈5.622>5.024,所以可以在犯错误的概率不超过0.025的前提下认为“性别与态度有关”.[B.能力提升]1.假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表如下:对于以下数据,对同一样本能说明X与Y有关的可能性最大的一组为()A.a=5,b=4,c=3,d=2B.a=5,b=3,c=4,d=2C.a=2,b=3,c=4,d=5D.a=2,b=3,c=5,d=4解析:选D.对于A,|ad-bc|=|10-12|=2;对于B,|ad-bc|=|10-12|=2;对于C,|ad-bc|=|10-12|=2;对于D,|ad-bc|=|8-15|=7.2.有两个分类变量X,Y,其一组的列联表如下所示,其中a,15-a均为大于50.05的前提下认为X,Y有关,则a 的值为( )A .8B .9C .8,9D .6,8解析:选 C.根据公式,得K 2的观测值k =65×[a (30+a )-(15-a )(20-a )]220×45×15×50=13×(13a -60)220×45×3×2>3.841,根据a >5且15-a >5,a ∈Z ,求得a =8,9满足题意.3.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:K 2的观测值:k =50×(13×20-10×7)223×27×20×30≈4.844>3.841.因此,判定主修统计专业与性别有关系,那么这种判断出错的概率为________. 解析:根据k >3.841,可判断在犯错误的概率不超过0.05的前提下,认为主修统计专业与性别有关系.故出错的概率为0.05.答案:0.054试说明心理障碍与性别的关系:________. 解析:由表可知,a =10,b =20,c =10,d =70,a +b =30,c +d =80,a +c =20,b +d =90,n =110,ad =700,bc =200, 把以上数值代入K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=110×(700-200)230×80×20×90≈6.365 7.因为6.365 7>5.024,所以在犯错误的概率不超过0.025的前提下认为心理障碍与性别有关系.答案:在犯错误的概率不超过0.025的前提下认为心理障碍与性别有关系5.某学生对其30位亲属的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数,如图所示.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数大于等于70的人,饮食以肉类为主.)(1)根据茎叶图,帮助这位同学说明其30位亲属的饮食习惯; (2)(3)能否在犯错误的概率不超过0.010的前提下认为“其亲属的饮食习惯与年龄有关”?并写出简要分析.解:(1)30位亲属中50岁以上的人饮食多以蔬菜为主,50岁以下的人饮食多以肉类为主.(2)列联表如表所示:(3)K 2=30×(4×2-8×16)212×18×20×10=10>6.635,所以在犯错误的概率不超过0.010的前提下认为“其亲属的饮食习惯与年龄有关”. 6.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否在犯错误的概率不超过0.010的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.附:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ).解:(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为70500×100%=14%.(2)K 2的观测值k =500×(40×270-30×160)2200×300×70×430≈9.967.由于9.967>6.635,所以在犯错误的概率不超过0.010的前提下认为该地区的老年人是否需要帮助与性别有关.(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.。

第三章--统计案例-3.2-独立性检验的基本思想及其初步应用

第三章--统计案例-3.2-独立性检验的基本思想及其初步应用

解:由列联表中的数据,得 K2 的观测值为 1 633×30×1 355-224×242 k= ≈68.033>10.828. 254×1 379×54×1 579 因此,在犯错误的概率不超过 0.001 的前提下,认为每 一晚都打鼾与患心脏病有关.
为了调查某生产线上,某质量监督员甲对产
品质量好坏有无影响,现统计数据如下:质量监督员在现 场时,990件产品中合格品为 982 件,次品数为 8 件,甲不 在现场时,510件产品中合格品为493件,次品数为17件, 试分别用列联表、等高条形图、假设检验的方法对数据进
的方法来判断色盲与性别是否有关?你所得的结论在什么
范围内有效? 解:根据题目所给的数据作出如下的列联表: 色盲 不色盲 合计
男 女 合计
38 6 44
442 514 956
480 520 1 000
根据列联表作出相应的等高条形图,如图所示:
38 从等高条形图来看在男人中患色盲的比例480比在女人
38 6 6 中患色盲的比例520要大,其差值为480-520 ≈0.068,差
位统一,图形准确,但它不能给我们两个分类变量有关或
无关的精确的判断,若要作出精确的判断,可以进行独立 性检验的有关计算.
本题应首先作出调查数据的列联表,再根据列联表画
出等高条形图,并进行分析,ห้องสมุดไป่ตู้后利用独立性检验作出判 断.
在调查 480 名男士中有 38 名患有色盲, 520名女士中有6名患有色盲,分别利用图形和独立性检验


③如果 k≥k0 ,就推断“X与Y有关系”,这种推断
犯错误的概率不超过α;否则,就认为在犯错误的概 率不超过α的前提下不能推断“X与Y有关系”,或者 在样本数据中没有发现足够证据支持结论“X与Y有 关系”.

独立性检验的基本思想及其初步应用

独立性检验的基本思想及其初步应用

如果“吸烟与患肺癌没有关系”,那么吸烟样
本中不患肺癌的比例应该与不吸烟样本中相应的比
例差不多.
所以
a a+
b

c
c +d
,
所以 a c + d ca + b,
ad bc
即 ad bc 0.
︱ad-bc︱越小,说明吸烟与患肺癌之间的关系越弱;
︱ad-bc︱越大,说明吸烟与患肺癌之间的关系越强.
患心脏病 患其他病 总计
秃顶
214
175
389
不秃顶
451
597
1 048
总计
665
772
1 437
(1)相应的等高条形图如下所示,
不患心脏病 患心脏病
秃顶
不秃顶
由图可认为秃顶与患心脏病有关系
吸烟与患肺癌列联表(单位:人)
不患肺癌
患肺癌
总计
不吸烟
7 775
42
7 817
吸烟
2 099
49
2 148
总计
9 874
91
9 965
在不吸烟者中患肺癌的比重是__0_._5_4_%_,
在吸烟者中患肺癌的比重是__2_._2_8_%_.
说明:吸烟者和不吸烟者患肺癌的可能性存在差异, 吸烟者患肺癌的可能性大.
K2
(n ad bc)2
(a b)(c d )(a c)(b d )
临界值表:
P ( K 2 k 0 ) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k 0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828

《3.2独立性检验的基本思想及其初步应用》教学案5

《3.2独立性检验的基本思想及其初步应用》教学案5

《3.2独立性检验的基本思想及其初步应用》教学案5一.教学目标:1,理解独立性检验的基本思想; 2,理解独立性检验的实施步骤; 3,了解随机变量K 2的含义。

二.教学重点:理解独立性检验的基本思想实施步骤。

教学难点;1、理解独立性检验的基本思想及实施步骤2、了解随机变量K 2的含义。

三.知识链接独立性检验原理:四.新课学习1. 独立性检验的概念:利用随机变量2K 来确定在多大程度上可以认为“__________”的方法,称为两个分类变量的独立性检验。

2. 独立性检验的步骤:设有两个分类变量X 与Y ,他们的取值分别为 和 其样本频数列联表(称2⨯2列联表)为:引入随机变量2K , ____________________2=K ,(其中d c b a n +++=为样本容量)推断X 与Y 有关系可按下列步骤进行: (1)假设0H : X 与Y 没有关系(2)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界a ,然后查表1-11确定临界值o k(3)利用公式(1),计算随机变量2K 的观测值k 。

(4)如果,就判断“X 与Y 有关系”,这种判断犯错误的概率不超过a ,否则,就认为在犯错误的概率不超过a 的前提下不能推断“X 与Y 有关系”,或则在样本数据中没有发现足够证据支持结论“X 与Y 有关系”,3. 为了使不同样本容量的数据有统一的评判标准,我们利用统计量2K 的观测值k来判断x 与y 有关系的程度。

如果828.10>k ,就有_____的把握认为“x 与y 有关系”; 如果879.7>k ,就有_____的把握认为“x 与y 有关系”; 如果_____>k ,就有99%的把握认为“x 与y 有关系”; 如果_____>k ,就有97.5%的把握认为“x 与y 有关系”;如果841.3>k ,就有_____的把握认为“x 与y 有关系”; 如果706.2>k ,就有_____的把握认为“x 与y 有关系”; 如果706.2≤k,就认为没有充分证据显示“x 与y 有关系” 。

32独立性检验的基本思想及其初步应用精品文档

32独立性检验的基本思想及其初步应用精品文档

由公式计算得 K2 的观测值 k=2 428000××18702×0×8010-00902×0×1 2400002≈205.22. ………10 分 因为 205.22>10.828,因此在犯错误的概率不超过 0.001 的前提下认为实施西部开发战略的公布对应届大学毕业生 的选择产生了影响. …………………………………………………………12 分
≈325.635.
因为 325.635>6.635,因此,在犯错误的概率不超过 0.01
的前提下认为官员在经济上是否清廉与他们寿命的长短之
间是有关系的.
工具
第三章 统计案例
工具
第三章 统计案例
(2019·湖南高考)通过随机询问110名性别不同的大学生是否 爱好某项运动,得到如下的列联表:
男 女 总计
肠道中有寄生 虫
肠道中没有寄生 虫
合计
每晚都磨牙
224
30
254
不磨牙
24
1 355
1 379
合计
248
1 385
1 633
工具
第三章 统计案例
解析: 根据题意计算得 K2=a+bcn+add-ab+cc2b+d
=1
633×224×1 355-30×242 254×1 379×248×1 385
成绩不小于90分 70 75 145
合计 100 100 200
据此资料是否认为男生比女生成绩差.
工具
第三章 统计案例
工具
第三章 统计案例
[解题过程] 根据列联表中数据,由公式计算得 K2=20505××3104×5×751-002×5×107002≈0.627 ∵0.627<2.706,所以据目前的数据不能认为男生比女 生成绩差,即没理由说男生比女生成绩差.

293.2独立性检验的基本思想及其初步应用

293.2独立性检验的基本思想及其初步应用

3.2独立性检验的基本思想及其初步应用(1)教材分析本节内容是数学选修2-3第三章统计案例的其次节,是在学习了回来分析的基本思想及其初步应用的学问后,对统计案例的再学习.可以看作是与前面学习过的相关关系的并列学问,是统计案例的另一类体现.在统计学中,独立性检验就是检验两个分类变量是否有关系的一种统计方法.在探讨两个分类变量关系时,要把重点放在独立性检验的统计学原理上,使学生初步驾驭独立性检验的基本步骤,体会独立性检验的基本思想.独立性检验的步骤是相对固定的,仿照教科书的例题,学生不难完成书后的习题,但独立性检验的统计思想对学生来说是比较难理解的,所以在教学中结合例题介绍独立性检验的思想是特别重要的,要求特殊留意学生思维的严密性品质的培育.课时安排本节内容用3课时完成,这是第1节,主要讲解独立性检验的基本思想及实施步骤.教学目标重点:理解独立性检验的基本思想及实施步骤.难点:了解独立性检验的基本思想;了解随机变量/的含义.学问点:独立性检验的解题步骤.实力点:正确理解独立性检验的基本思想.教化点:通过大量的实例,体会探究的乐趣,激发学生的学习热忱.自主探究点:如何利用求出的数据正确解读分类变量的关系.考试点:独立性检验的解题步骤.易错易混点:反证法和独立性检验的区分.拓展点:完成思索的解答后,引导学生总结独立性检验的基本思想.教具打算多媒体课件、三角板课堂模式学案导学一、引入新课【师生活动】师:为探讨吸烟是否对患肺癌有影响,某肿瘤探讨所随机地调查了9965人,得到如下结果(单位:人)表1那么吸烟是否对患肺癌有影响?生:探讨回答.师:要想解决这个问题,这就须要了解假设检验的基本原理.我们这节课就来学习一种假设检验一一独立性检验的基本思想及其初步应用.【设计意图】通过实例,引出独立性检验的原理,假设检验.既激发了学生的学习热忱,又让学生体会到学习数学的好用性.二、探究新知1、分类变量:对于性别变量,其取值为男和女两种.这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.在现实生活中,分类变量是大量存在的,例如是否吸烟,宗教信仰,国籍,产品等级,是否喜爱数学,等等.2、列联表:像表1这样列出的两个分类变量的频数表,称为列联表.师:从表格中的数据能反映出两个分类变量间是否相互影响? 生:不是很明显.师:图形更能直观地反映出两个分类变量间是否相互影响,常用等富条形图展示列联表数据的频率特征.【设计意图】通过问题来引导学生明确:等高条形图可以直观反映出两个分类变量间是否相互影响,过渡自然,顺理成章.3、等高条形图【师生活动】师:图1就是一个等高条形图,其中两个浅色条的高分别表示吸烟和不吸烟样本中不患肺癌的频率;两个深色条的高分别表示吸烟和不吸烟样本中患肺癌的频率.我们能有什么结论?生:在吸烟样本中患肺癌的频率要高一些,因此直观上可以认为吸烟更简洁引发肺癌.【设计意图】通过提问,要学生明确后续学问学习的必要性,对引出下一个问题起到很好的铺垫.4、独立性检验我们先假设 H 0:吸烟与患肺癌没有关系,把表1中的数字用字母代替,得到表2表2不患肺癌患肺癌 总计不吸烟 a b a+b 吸烟 C d c+d总计a+c b+dα+6+c+d为了使不同样本容量的数据有统•的评判标准,我们构造一个随机变量κι= ________M d-be? ________ (a+b)(c÷d){a+c)(b+d)'其中〃=α+8+c+d 为样本容量.若HO 成立,即“吸烟与患肺癌没有关系”,则K2应当很小.依据表1的数据,计算得K2的观测值为II 不患肺癌患肺癌2k_9965×(7775×49-42×2099)≈56.632.7817×2148×9874×91统计学家经过探讨发觉,在HO成立的状况下,P(∕C2≥6.635)≈0.010.即在HO成立的状况下,K?的观测值大于6.635的概率特别小,近似为0.010,是一个小概率事务.现在K2的观测值&≈56.632,远远大于6.635,所以有理由断定HO不成立,即认为“吸烟与患肺癌有关系”.但这种推断会犯错误,犯错误的概率不会超过0.010.上面这种利用随机变量K?来推断“两个分类变量”的方法称为独立性检验.【设计意图】通过吸烟与患肺癌之间的关系的探讨过程体现了假设检验的思想,其目的是让学生通过实例初步体会一下假设检验的思想.可以从反证法的思想说明上面介绍的假设检验原理.表3(1)依据实际问题的须要确定容许推断“两个分类变量有关系”犯错误的上界α,然后查表确定临界值即.(2)利用公式(1),计算随机变量K?的观测值h(3)假如Z≥%,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过。

3.2独立性检验的基本思想及其初步应用

3.2独立性检验的基本思想及其初步应用

k2≥6.635
4.某班主任对全班50名学生进行了作业量多 少的调查,数据如下表: 认为作业多 玩游戏 不玩游戏 总 计 18 8 26 认为作业不多 总计 9 15 24 27 23 50
则认为喜欢玩游戏与认为作业量多少有关系的 把握大约为( B ) A. 99% B. 97.5% C. 90% D.无充分依据
2. 下面是一个
2 2
21 25 46
列联表 总计
不健康 健 康
不优秀 a 优 秀 2 总 计 b
73 27 100
则表中a,b的值分别是( c ) A. 94,96 B. 52,50 C. 52,54 D. 54,52
3. 在独立性检验中,当统计量满足 时, 我们有99%的把握认为这两个分类变量有 关系.
枣庄市第十八中学
主讲人 秦真
一、目标展示
1、了解独立性检验的基本思想、方法及其初 步应用。 2、会从列联表(只要求2×2列联表)、条形 图直观分析两个分类变量是否有关
3.会用公式判断两个分类变量在某种程度上的 相关性
问题: 数学家庞加莱每天都从一家
面包店买一块1000g 的面包,并记 录下买回的面包的实际质量。一年 后,这位数学家发现,所记录数据 的均值为950g。于是庞加莱推断这 家面包店的面包分量不足。
思想方法上: 数形结合的思想, 类比的思想
作业:教材习题3.2 1,2
当堂达标
1.在吸烟与患肺病这两个分类变量的计算中,下 列说法正确的是 ( c ) A. 若k=6.635,则有99%的把握认为吸烟与患肺病 有关,那么100名吸烟者中,有99个患肺病. B. 从独立性检验可知,有99%的把握认为吸烟与 患肺病有关时,可以说某人吸烟,那么他有99%的可 能性患肺病. C. 若从统计量中求出有95%的把握认为吸烟与患 肺病有关,是指有5%的可能性使推断出现错误. D. 以上三种说法都不对.

29-3.2独立性检验的基本思想及其初步应用(1)

29-3.2独立性检验的基本思想及其初步应用(1)

3.2 独立性检验的基本思想及其初步应用(1)教材分析本节内容是数学选修2-3 第三章统计案例的第二节,是在学习了回归分析的基本思想及其初步应用的知识后,对统计案例的再学习.可以看作是与前面学习过的相关关系的并列知识,是统计案例的另一类体现.在统计学中,独立性检验就是检验两个分类变量是否有关系的一种统计方法.在讨论两个分类变量关系时,要把重点放在独立性检验的统计学原理上,使学生初步掌握独立性检验的基本步骤,体会独立性检验的基本思想.独立性检验的步骤是相对固定的,仿照教科书的例题,学生不难完成书后的习题,但独立性检验的统计思想对学生来说是比较难理解的,所以在教学中结合例题介绍独立性检验的思想是十分重要的,要求特别注重学生思维的严密性品质的培养.课时分配本节内容用3课时完成,这是第1节,主要讲解独立性检验的基本思想及实施步骤.教学目标重点: 理解独立性检验的基本思想及实施步骤.K的含义.难点:了解独立性检验的基本思想;了解随机变量2知识点:独立性检验的解题步骤.能力点:正确理解独立性检验的基本思想.教育点:通过大量的实例,体会探究的乐趣,激发学生的学习热情.自主探究点:如何利用求出的数据正确解读分类变量的关系.考试点:独立性检验的解题步骤.易错易混点:反证法和独立性检验的区别.拓展点:完成思考的解答后,引导学生总结独立性检验的基本思想.教具准备多媒体课件、三角板课堂模式学案导学一、引入新课【师生活动】师:为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)表1 吸烟与患肺癌列联表生:讨论回答.师:要想解决这个问题,这就需要了解假设检验的基本原理.我们这节课就来学习一种假设检验——独立性检验的基本思想及其初步应用.【设计意图】通过实例,引出独立性检验的原理,假设检验.既激发了学生的学习热情,又让学生体会到学习数学的实用性.二、探究新知1、分类变量:对于性别变量,其取值为男和女两种. 这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.在现实生活中,分类变量是大量存在的,例如是否吸烟,宗教信仰,国籍,产品等级,是否喜欢数学,等等.2、列联表:像表1这样列出的两个分类变量的频数表,称为列联表. 师:从表格中的数据能反映出两个分类变量间是否相互影响? 生:不是很明显.师:图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.【设计意图】通过问题来引导学生明确:等高条形图可以直观反映出两个分类变量间是否相互影响,过渡自然,顺理成章.3、等高条形图图1【师生活动】师:图1就是一个等高条形图,其中两个浅色条的高分别表示吸烟和不吸烟样本中不患肺癌的频率;两个深色条的高分别表示吸烟和不吸烟样本中患肺癌的频率.我们能有什么结论?生:在吸烟样本中患肺癌的频率要高一些,因此直观上可以认为吸烟更容易引发肺癌.【设计意图】通过提问,要学生明确后续知识学习的必要性,对引出下一个问题起到很好的铺垫. 4、独立性检验我们先假设 0H :吸烟与患肺癌没有关系, 把表1中的数字用字母代替,得到表2表222()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++为样本容量.若0H 成立,即“吸烟与患肺癌没有关系”,则2K 应该很小 .根据表1的数据,计算得2K 的观测值为29965(777549422099)56.63278172148987491k ⨯⨯-⨯=≈⨯⨯⨯.统计学家经过研究发现,在0H 成立的情况下,2( 6.635)0.010P K ≥≈ .即在0H 成立的情况下,2K 的观测值大于6.635的概率非常小,近似为0.010,是一个小概率事件.现在2K 的观测值56.632k ≈,远远大于6.635,所以有理由断定0H 不成立,即认为“吸烟与患肺癌有关系”. 但这种判断会犯错误,犯错误的概率不会超过0.010.上面这种利用随机变量2K 来判断“两个分类变量”的方法称为独立性检验.【设计意图】通过吸烟与患肺癌之间的关系的讨论过程体现了假设检验的思想,其目的是让学生通过实例初步体会一下假设检验的思想.可以从反证法的思想解释上面介绍的假设检验原理. 表35、独立性检验的具体步骤(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误的上界α,然后查表确定临界值0k . (2)利用公式(1),计算随机变量2K 的观测值k .(3)如果0k k ≥,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“两个分类变量有关系”,或者在样本数据中,没有足够证据支持结论“两个分类变量有关系”.【设计意图】在介绍完独立性检验的思想以后,对独立性检验的具体实施步骤进行总结、归纳.为学生的下一步应用起到奠基的作用,对解决下面的例题有很大的帮助.三、理解新知判断两个分类变量有关系的思路1、等高条形图可以直观地判断出两个分类变量是否有关系,但是这种判断不可靠, 并且不能提供所得结论犯错误的概率.因此需要用独立性检验的方法来提供有用数据.2、独立性检验的具体步骤(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误的上界α,然后查表确定临界值0k . (2)利用公式(1),计算随机变量2K 的观测值k .(3)如果0k k ≥,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“两个分类变量有关系”,或者在样本数据中,没有足够证据支持结论“两个分类变量有关系”.【设计意图】为准确地运用新知,作必要的铺垫.培养学生的归纳概括能力.四、运用新知例1、某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是患心脏病而住院的男性病人中,有175人秃顶.利用图形判断秃顶与患心脏病是否有关系.能否在犯错误的概率不超过0.010的前提下认为秃顶与患心脏病有关系?解 :根据题目所给数据得到如下列联表:表4 秃顶与患心脏病列联表图2相应的等高条形图如图2所示,可以看出秃顶样本中患心脏病的频率明显高于不秃顶样本中患心脏病的频率.因此可以认为秃顶与患心脏病有关系.根据列联表4中的数据,得到1437=16.373 6.635k ⨯⨯⨯≈>⨯⨯⨯2(214597-175451)3891048665772.因此,在犯错误的概率不超过0.010的前提下,认为秃顶与患心脏病有关系.【设计说明】教学中要先直观后计算,要注意引导学生运用已经学过的统计知识解决问题.解答中给出列联表,目的是复习列联表的制作.讲完例题解答后,需要向学生说明:在熟悉独立检验的基本原理后,可以通过直接计算2K 的观测值(不画等高条形图)来解决两个分类变量的独立性检验问题.但是,借助于图形可以更直观地向专业人士解释所得到的统计分析结果. 变式训练:在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人,女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个22⨯的列联表; (2)判断性别与休闲方式是否有关系. 答案:(2)因为,所以在犯错误的概率不超过0.025的前提下,认为休闲方式与性别有关系.五、课堂小结独立性检验的具体步骤(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误的上界α,然后查表确定临界值0k . (2)利用公式(1),计算随机变量2K 的观测值k .(3)如果0k k ≥,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“两个分类变量有关系”,或者在样本数据中,没有足够证据支持结论“两个分类变量有关系”.【设计意图】增强学生的归纳概括意识,培养学生整体看待问题的能力.通过课堂小结,加深学生对本节课所学内容的印象.六、布置作业1.阅读教材 P91—94;2.书面作业 教材P97 1 、2必做题:1. 研究人员选取170名青年男女大学生的样本,对他们进行一种心理测验,发现对该心理测中的最后一个题目的反应得以下数据:问:性别与态度之间是否存在某种关系?2. 在研究某种新措施对“非典”的防治效果问题时,得以下数据:试问新措施对防治防治“非典”是否有效?答案: 1. 22170(22421888) 2.158 3.8411106040130K ⨯⨯-⨯=≈<⨯⨯⨯,因此没有充分的证据显示“性别与态度有关” .2. 22300(1323611418)7.317 6.63524654150150K ⨯-⨯=≈>⨯⨯⨯,故在犯错误的概率不超过0.010的前提下,认为“新措施对防治非典有效” .选做题:某企业有两个分工厂生产某种零件,按规定内径尺寸(单位:mm )的值落在 [)29.94,30.06的零件为优质品. 从两个分厂生产的零件中各抽出500件,量其内径尺寸,的结果如下表: 甲厂:(2)由以上统计数据填写下面的22⨯列联表,并问是否有99﹪的把握认为“两个分厂生产的零件的质量有差异”.【设计意图】设计作业1,2,是引导学生先复习,再作业,培养学生良好的学习习惯.书面作业的布置,是为了让学生能够根据独立性检验的思想,算出随机变量2K 的观测值来解决简单的数学问题;并注意巩固独立性检验的步骤.选做题是2009辽宁文科高考题,本题涉及到统计的多个知识点,可以说是一个综合题,在统计这一模块中的高考题不是太多,一方面让学生了解一下题型,另一方面引起学生对统计知识的重视.七、教后反思本教案通过实例引入,在教学中,向学生介绍多个知识点;分类变量、列联表、等高条形图、独立性检验、独立性检验的步骤.在例1的教学中,要注重强调独立性检验的的重要性,要求学生会解释这里“犯错误的概率”,提高了学生的解题能力.八、板书设计。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3.2独立性检验的基本思想及其初步应用
1.2独立性检验的基本思想及其初步应用(
1)
双基再现
1.
★下列变量中不是分类变量的是

A .近视
B .成绩
C .性别
D .饮酒 2. ^ ★下列说法中错误的是(
A .有时可以把分类变量的不同取值用数字 表示,
但这时的数字除了分类以外没有其它
含义
B .在统计学中,独立性检验就是检验两个 分类变
量是否有关系的一种方法
C .在进行独立性检验时,可以先利用三维 柱形图和
二维条形图粗略地判断两个分类 变量是否有关系
如下:
变式活学
7. ★★★(教材1.2例1变式)研究人员选 取170名青年男女大学生的样本,
对他(她)
们进行一种心理测验,发现有 60名女生对
该心理的最后一个题目的反应是:
作肯定的
18名,否定42名;男生110名在相同的项 目上作
出肯定的有 22名,否定的有 88名. 请问性别与态度之间是否存在某种关系? 请分别用图形与独立性检验的方法进行判 断.
据表中数据,得K 2 4.844,因为K 2 3.841 所以可以判定选修统计专业与性别有关 •那
么这种判断出错的可能性为(

A .5%
B . 95%
C . 1%
D . 99%
4. ★★某大学要研究性别与职称之间是否 有关系,你认为该收集哪些数据?
5. ★★在三维柱形图中,主对角线的两个 柱形高度的乘积be 相关越大,X 与Y 有关 系的可能性就 . 6 .★★★为了探究电离辐射的剂量与人体 的受损程度是否有关,用两种不同的剂量的 电离辐射照射小白鼠•
在照射14天内的结果
&★★★★(教材1.2例1变式)在研究某种新措施对猪白痢的防治效果问题时,得到了以下数据:
试利用图形和独立性检验来判断新措施对防治猪白痢是否有效?10. ★★★ ★★在调查的480名男人中有38
名患有色盲,520名女人中有6名患有色盲,分别利用图形和独立性检验的方法来判断色盲与性别是否有关?你所得到的结论在什么范围内有效?
实践演练
9 ★★如何对草莓、橙子、桃子、苹果、梨等5种水果进行分类?。

相关文档
最新文档