【全程复习方略】高中数学-1.2-独立性检验的基本思想及其初步应用课时提升作业-新人教A版选修1-2

合集下载

高中数学 独立性检验的基本思想及其初步应用 Word版含解析

高中数学 独立性检验的基本思想及其初步应用 Word版含解析

课时跟踪检测(二)独立性检验的基本思想及其初步应用一、选择题1.判断两个分类变量是彼此相关还是相互独立的常用的方法中,最为精确的是()A.2×2列联表B.独立性检验C.等高条形图D.其他解析:选B A、C只能直观地看出两个分类变量x与y是否相关,但看不出相关的程度.独立性检验通过计算得出相关的可能性,较为准确.2.对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是() A.k越大,“X与Y有关系”的可信程度越小B.k越小,“X与Y有关系”的可信程度越小C.k越接近于0,“X与Y没有关系”的可信程度越小D.k越大,“X与Y没有关系”的可信程度越大解析:选B k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大.即k越小,“X与Y有关系”的可信程度越小.故选B.3.利用独立性检验对两个分类变量是否有关系进行研究时,若在犯错误的概率不超过0.005的前提下认为事件A和B有关系,则具体计算出的数据应该是()A.k≥6.635 B.k<6.635C.k≥7.879 D.k<7.879解析:选C犯错误的概率为0.5%,对应的k0的值为7.879,由独立性检验的思想可知应为k≥7.879.4.(江西高考)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()表1表23表表4A.成绩B.视力C.智商D.阅读量解析:选D因为k1=52×(6×22-14×10)2 16×36×32×20=52×8216×36×32×20,k2=52×(4×20-16×12)2 16×36×32×20=52×112216×36×32×20,k3=52×(8×24-12×8)2 16×36×32×20=52×96216×36×32×20,k4=52×(14×30-6×2)2 16×36×32×20=52×408216×36×32×20,则有k4>k2>k3>k1,所以阅读量与性别关联的可能性最大.5.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由K2=n(ad-bc(a+b)(c+d)(a+c)(b+d)算得,观测值k=110×(40×30-20×20)260×50×60×50≈7.8.附表:A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”解析:选A由k≈7.8及P(K2≥6.635)=0.010可知,在犯错误的概率不超过1%的前提下认为“爱好该项运动与性别有关”,也就是有99%以上的把握认为“爱好该项运动与性别有关”.二、填空题6.下列关于K2的说法中,正确的有________(填序号).①K2的值越大,两个分类变量的相关性越大;②K2的计算公式是K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d);③若求出K2=4>3.841,则有95%的把握认为两个分类变量有关系,即有5%的可能性使得“两个分类变量有关系”的推断出现错误;④独立性检验就是选取一个假设H0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝H0的推断.解析:对于①,K2的值越大,只能说明我们有更大的把握认为二者有关系,却不能判断相关性大小,故①错;对于②,(ad-bc)应为(ad-bc)2,故②错;③④对.答案:③④7.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:________(填“是”或“否”).解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即ba+b=1858,dc+d=2742,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.答案:是8.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表:文化程度与月收入列联表(单位:人)。

【全程复习方略】高中数学 1.2 独立性检验的基本思想及其初步应用课堂达标效果检测 新人教A版选修1-2

【全程复习方略】高中数学 1.2 独立性检验的基本思想及其初步应用课堂达标效果检测 新人教A版选修1-2

"【全程复习方略】高中数学 1.2 独立性检验的基本思想及其初步应用课堂达标效果检测新人教A版选修1-2 "1.在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是( )A.散点图B.等高条形图C.2×2列联表D.以上均不对【解析】选B.等高条形图可以粗略地判断两个分类变量之间是否有关.2.对于分类变量A与B的随机变量K2,下列说法正确的是( )A.K2越大,说明“A与B有关系”的可信度越小B.K2越大,说明“A与B无关”的程度越大C.K2越小,说明“A与B有关系”的可信度越小D.K2接近于0,说明“A与B无关”的程度越小【解析】选C.由独立性检验的定义及K2的意义可知C正确.3.想要检测天气阴晴与人心情好坏是否相关,应该检测()A.H0:晴天心情好B.H0:阴天心情好C.H0:天气与心情有关系D.H0:天气与心情无关【解析】选D.根据假设检验的意义,要先假设两个分类变量之间没有关系.4.若由一个2×2列联表中的数据计算得K2的观测值k为7.22,那么在犯错误的概率不超过的前提下认为两个变量有关系.【解析】因为K2的观测值k=7.22>6.635,故在犯错误的概率不超过0.01的前提下认为两个变量有关系. 答案:0.015.某校文理合卷期中考试后,按照学生的数学考试成绩优秀和不优秀统计,得到如下的列联表:(1)画出列联表的等高条形图,并通过图形判断数学成绩与文理分科是否有关.(2)利用独立性检验,分析文理分科对学生的数学成绩是否有影响.【解析】(1)等高条形图如图所示.(2)由列联表中的数据得到K2的观测值k==科对学生的数学成绩有影响.。

人教课标版高中数学选修1-2《独立性检验的基本思想及其初步应用(第3课时)》教案-新版

人教课标版高中数学选修1-2《独立性检验的基本思想及其初步应用(第3课时)》教案-新版

1.1.2 独立性检验的基本思想及其初步应用第三课时一、教学目标 1.核心素养:通过学习独立性检验的基本思想及其初步应用,初步形成基本的数据分析能力, 培养数学运算能力. 2.学习目标(1)1.1.3.1 巩固复习利用等高条形图、列联表、独立性检验的基本思想判断分类变量的关系(3)1.1.3.2 总结归纳利用独立性检验判断两个分类变量相关关系的一般步骤. 3.学习重点总结归纳利用独立性检验判断两个分类变量相关关系的一般步骤. 4.学习难点对独立性检验基本思想的进一步理解 二、教学设计 (一)课前设计 1.预习任务 任务1阅读教材P10-P15,回顾本节主要知识点有哪些? 任务2利用独立性检验判断两个分类变量相关关系的一般步骤是什么?2.预习自测1.与表格相比,能更直观地反映出相关数据总体状况的是( ) A.列联表 B.散点图 C.残差图D.等高条形图解: D2.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A.若2K 的观测值为635.6 k ,我们有%99的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病.B.从独立性检验可知有%99的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有%99的可能患有肺病.C.若从统计量中求出有%95的把握认为吸烟与患肺病有关系,是指有%5的可能性使得推判出现错误.D.以上三种说法都不正确. 解: C (二)课堂设计 1.知识回顾(1)变量的不同“值”表示个体所属的不同类别,像这样的变量成为分类变量. (2)列出两个分类变量的频数表,称为列联表.(3)独立性检验的基本思想类似于数学中的反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即0H :两个分类变量没有关系成立,在该假设下我们构造的随机变量2K 应该很小,如果由观测数据计算得到2K 的观测值k 很大,则在一定程度上说明假设不合理,即断言0H 不成立,即认为“两个分类变量有关系”;如果观测值k 很小,则说明在样本数据中没有发现足够证据拒绝0H . 2.问题探究问题探究一 我们主要从几个方面来研究两个分类变量之间有无关系?●活动一 回归旧知,巩固复习重点知识例1.为了调查某生产线上,某质量监督员甲对产品质量好坏有无影响,现统计数据如下:质量监督员甲在现场时,990件产品中合格品982件,次品87件;甲不在现场时,510件产品中合格品493件,次品17件.试分别用列联表,等高条形图,独立性检验的方法对数据进行分析. 【知识点:分类变量,独立性检验,变量间的关系】 详解:(1)2×2列联表如下:由列联表看出|ac -bd |=|982×17-493×8|=12750,即可在某种程度上认为“甲在不在场与产品质量有关”.相应的等高条形图如图所示:●活动二对比学习,巩固重点(2)在解答独立性检验题目过程中.数据有时比较多,一定不要混淆,要分辨清楚,否则会影响解题的下一步,同时计算不能失误.问题探究二利用独立性检验判断两个分类变量是否有关系的一般步骤是什么?●活动一实际操作例2.为考察某种药物预防禽流感的效果,进行动物家禽试验,调查了100个样本,统计结果为:服用药的共有60个样本,服用药但患病的仍有20个样本,没有服用药且未患病的有20个样本. (1)根据所给样本数据完成下面2×2列联表;(2)请问能有多大把握认为药物有效?【知识点:分类变量,独立性检验,变量间的关系】详解:(1)(2)由列联表得:706.2778.260404060)20202040(10022>≈⨯⨯⨯⨯-⨯=K所以大概90%认为药物有效. ●活动二 深层思考,得出一般步骤通过上述解答过程,利用独立性检验判断两个分类变量是否有关系的一般步骤是什么? 1.独立性检验的基本步骤①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查临界值表确定临界值0k .②利用公式))()()(()(22d b c a d c b a bd ac n K ++++-=计算随机变量2K 的观测值0k .③如果0k k ≥,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”. 2.独立性检验的基本思想(1)利用2K 进行独立性检验,可以对推断的正确性的概率作出估计,样本容量n 越大,这个估计值越准确,如果抽取的样本容量很小,那么利用2K 进行独立性检验的结果就不具有可靠性. (2)独立性检验的思想就是在假设0H 成立的条件下,如果出现一个与0H 相矛盾的小概率事件,就推断0H 不成立,且该推断犯错误的概率不超过这个小概率. 3.课堂总结【知识梳理】1.独立性检验的基本步骤①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查临界值表确定临界值0k .②利用公式))()()(()(22d b c a d c b a bd ac n K ++++-=计算随机变量2K 的观测值0k .③如果0k k ≥,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”. 2.独立性检验的基本思想(1)利用2K 进行独立性检验,可以对推断的正确性的概率作出估计,样本容量n 越大,这个估计值越准确,如果抽取的样本容量很小,那么利用2K 进行独立性检验的结果就不具有可靠性. (2)独立性检验的思想就是在假设0H 成立的条件下,如果出现一个与0H 相矛盾的小概率事件,就推断0H 不成立,且该推断犯错误的概率不超过这个小概率.【重难点突破】(1)利用三维柱形图、二维条形图、等高条形图直观判断两个分类变量之间是否有关系. (2)利用2×2列联表以及随机变量2K 对两个变量进行独立性检验. 4.随堂检测1.在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是( ) A.散点图 B.等高条形图 C.2×2列联表 D.以上均不对 【知识点:独立性检验】解:B2.性别与身高列联表如下:A.0.043B.0.367C.22D.26.87【知识点:独立性检验】解:C3.给出列联表如下:()A.0.4B.0.5C.0.75D.0.85【知识点:独立性检验】解:B4.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:()A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关【知识点:独立性检验】解:D5.若由一个2×2列联表中的数据计算得K2=4.013,那么在犯错误的概率不超过0.05的前提下认为两个变量______(填“有”或“没有”)关系.【知识点:独立性检验】解:有(三)课后作业基础型自主突破1.在吸烟与患肺病是否有关的研究中,下列属于两个分类变量的是()A.吸烟,不吸烟B.患病,不患病C.是否吸烟、是否患病D.以上都不对【知识点:独立性检验】解:C“是否吸烟”是分类变量,它的两个不同取值;吸烟和不吸烟;“是否患病”是分类变量,它的两个不同取值:患病和不患病.可知A、B都是一个分类变量所取的两个不同值.故选C.【知识点:独立性检验】解:C 由题设知:a=45,b=10,c=30,d=15,=-255×45×75×25≈3.030由附表可知,有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”,故选C. 3.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )① 若K 2的观测值满足K 2≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误A.①B.① ③C.③D.②【知识点:独立性检验】解:C ①推断在100个吸烟的人中必有99人患有肺病,说法错误,排除A ,B ,③正确.排除D.4.在一个2×2列联表中,由其数据计算得K 2的观测值679.7 k ,则这两个变量间有关系的可能性为( ) A.99%B.99.5%C.99.9%D.无关系【知识点:独立性检验】解:A K 2的观测值6.635<k <7.879,所以有99%的把握认为两个变量有关系.5. 在600人身上实验某种新药预防感冒的作用,把一年中的记录与另外600个未用新药的人作比较,结果如下问该种新药起到预防感冒的作用的可能性为( ) A. 99%B. 90%C.99.9%D.小于90%【知识点:独立性检验】 解:D6.分析两个分类变量之间是否有关系的常用方法有________;独立性检验的基本思想类似于____.【知识点:独立性检验】解:.频率比较法、图形分析法(三维柱形图、二维条形图、等高条形图)、独立性检验;反证法能力型 师生共研7.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:则有多少的把握认为多看电视与人变冷漠有关系( )A.95%B.99%C. 5%D. 99.9%【知识点:独立性检验】解:B8. 两个分类变量X 和Y 可能的取值分别为{}21,x x 和{}21,y y ,其样本频数满足10=a ,21=b ,35=+d c .若“X 和Y 有关系”犯错误的概率不超过0.05,则c 的值可能等于( )A. 4B. 5C. 6D. 7【知识点:独立性检验】解:A9. 为了考察长头发与女性头晕是否有关联,随机抽取了301名女性,得到如下列联表.试根据表格中已有数据填空.空格中的数据应分别为①________;②________;③________;④________. 【知识点:独立性检验】解:86; 180; 229; 30110. 为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射14天内的结果如表所示:进行统计分析时的统计假设是_______. 【知识点:独立性检验】解:小白鼠的死亡与剂量无关 探究型 多维突破11.调查339名50岁以上有吸烟习惯与患慢性气管炎的人的情况,获数据如下试问:(1)有吸烟习惯与患慢性气管炎病是否有关? (2)用假设检验的思想给予说明. 【知识点:独立性检验】解:(1)根据列联表的数据,得到 6.6356.674))()()(()(22>=++++-=d b c a d c b a bd ac n K 所以有99%的把握认为“吸烟与患慢性气管炎病有关”.(2)假设“吸烟与患病之间没有关系”,由于事件A ={635.62≥K }的概率P(A)≈0.01,即A 为小概率事件,而小概率事件发生了,进而得假设错误,这种推断出错的可能性约有1%.10. 20国集团峰会于2016年月9日至4日在中国杭州进行,为了搞好接待工作,组委会招幕了16名男志愿者和14名女志愿者,调查发现,男、女志愿者中分别有10人和6人会德语,其余人不会德语.(1)根据以上数据完成以下2×2列联表:(2)根据列联表的独立性检验,能否在犯错误的概率不超过0.10的前提下认为性别与会德语有关?【知识点:独立性检验】解:(1)(2)假设:是否会德语与性别无关,由已知数据可求得:706≈k1575.2.1<因此,在犯错误的概率不超过0.10的前提下不能判断会德语与性别有关.自助餐1.为了评价某个电视栏目改革效果,在改革前后分别从居名点抽取了100居民进行调查,经过计算得2K的观测值99=k.根据这一数据分析,下列说法正确的是().0A.有99%的人认为该栏目优秀B.有99%的人认为该栏目是否优秀与改革无关C.有99%的把握认为该栏目是否优秀与改革有关系D.没有充分理由认为该栏目是否优秀与改革有关系【知识点:独立性检验】解:D2.硕士学位与博士学位的一个随机样本给出了关于所获取学位类别与学生性别的分类数据,如下表所示下列各项说法正确的是()A.在犯错误的概率不超过0.01的前提下认为性别与获取学位类别有关B.在犯错误的概率不超过0.01的前提下认为性别与获取学位类别无关C.性格决定获取学位的类别D.以上都是错误的【知识点:独立性检验】解:A3.经过对随机变量2K的研究,得到了若干临界值,当其观测值072k时,对于两个事件A与B,.2我们认为()A. 有95%的把握认为A与B有关系B. 有99%的把握认为A与B有关系C. 没有充分理由说明事件A与B有关系D. 确定事件A与B没有关系【知识点:独立性检验】解:C4. 以下关于独立性检验的说法中,错误的是()A. 独立性检验依据小概率原理B. 独立性检验得到的结论一定正确C. 样本不同,独立性检验的结论可能有差异D. 独立性检验不是判定两分类变量是否相关的唯一方法【知识点:独立性检验】解:B6.某班主任对全班50名学生进行了作业量多少的调查,数据如下表则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为( ) A. 99% B. 97.5%C. 90%D. 无充分依据【知识点:独立性检验】解:B7. 给出下列实际问题:①一种药物对某种病的治愈率;②两种药物治疗同一种病是否有区别;③吸烟者得肺病的概率;④吸烟人群是否与性别有关系;⑤网吧与青少年的犯罪是否有关系.其中用独立性检验可以解决的问题有_______. 【知识点:独立性检验】 解:②④⑤8.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:250(1320107) 4.84423272030k ⨯⨯-⨯=≈⨯⨯⨯因为2 3.841K ≥,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________. 【知识点:独立性检验】 解:0.059. 为加强素质教育,使学生各方面全面发展,某学校对学生文化课与体育课的成绩进行了调查统计,结果如下:在探究体育课成绩与文化课成绩是否有关时,根据以上数据可以得到2K 的观测值为________.(精确到0.001) 【知识点:独立性检验】 解:1.25510. 某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:由表中数据直观分析,收看新闻节目的观众是否与年龄有关;________(填“是”或“否”) 【知识点:独立性检验】 解:是11. 为了了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对30名六年级学生进行了问卷调查得到如下列联表:(平均每天喝500ml 以上为常喝,体重超过50kg 为肥胖)已知在30人中随机抽取一人,抽到肥胖的学生的概率为154. (1)请将上面的列联表补充完整(2)是否有99.5%的把握认为肥胖与常喝碳酸饮料有关?说明你的理由 参考数据:(参考公式:))()()(()(22d b c a d c b a bd ac n K ++++-=,其中d c b a n +++=)【知识点:独立性检验,古典概型】解:(1)设常喝碳酸饮料肥胖的学生有x 人,154302=+x ,6=x (2)由已知数据可求得: 879.7523.82>≈K ,因此有99.5%的把握认为肥胖与常喝碳酸饮料有关.12. 某大学高等数学老师这学期分别用B A ,两种不同的教学方式试验甲、乙两个大一新班(人数均为60人,入学数学平均分数和优秀率都相同;勤奋程度和自觉性都一样).现随机抽取甲、乙两班各20名的高等数学期末考试成绩,得到茎叶图:(1)依茎叶图判断哪个班的平均分高?(2)现从甲班高等数学成绩不得低于80分的同学中随机抽取两名同学,求成绩为86分的同学至少有一个被抽中的概率;(3)学校规定:成绩不低于85分的为优秀,请填写下面的2×2列联表,并判断“能否在犯错误的概率不超过0.025的前提下认为成绩优秀与教学方式有关”.下面临界值表仅供参考:(参考公式:))()()(()(22d b c a d c b a bd ac n K ++++-=,其中d c b a n +++=)【知识点:独立性检验,简单抽样,概率】解(1)甲班高等数学成绩集中于60-90分之间,而乙班数学成绩集中于80-100分之间,所以乙班的平均分高.(2)记成绩为86分的同学为A,B ,其他不低于80分的同学为C,D,E,F“从甲班高等数学成绩不得低于80分的同学中随机抽取两名同学”的一切可能结果组成的基本事件有:(A,B)、(A,C)、(A,D)、(A,E)、(A,F)、(B,C)、(B,D)、(B,E)、(B,F)、(C,D)、(C,E)、(C,F)、(D,E)、(D,F)、(E,F)一共15个.“抽到至少有一个86分的同学”所组成的基本事件有:(A,B)、(A,C)、(A,D)、(A,E)、(A,F)、(B,C)、(B,D)、(B,E)、(B,F)共9个,故93155P ==. (3)2240(3101017) 5.584 5.024********K ⨯⨯-⨯=≈>⨯⨯⨯,因此在犯错误的概率不超过0.025的前提下可以认为成绩优秀与教学方式有关. 数学视野在实际问题中,经常会面临需要推断的问题,比说研制出一种新药,需要推断此药是否有效;有人怀疑吸烟的人更易患肺癌,需要推断患肺癌是否与吸烟有关;等等.在对类似问题作出推断时,我们不能仅凭主观意愿得出结论,需要通过试验来手机数据,并依据独立性检验的原理作出合理的推断.。

“独立性检验的基本思想及其初步应用”教材与教学解析

“独立性检验的基本思想及其初步应用”教材与教学解析
摘要 :“ 独 立 性 检 验 的基 本 思 想及 其初 步 应 用 ” 是 一 个 教 学 难 点 ,在 反 复 研 究 和 多 次教 学 实践 的 基 础 上 ,从 教 学 内容 、教
二 、教 学 指 导 思 想 分 析
《 普通高 中数学课程标 准 ( 实验 ) 》 对独立性检 验的基本 思 学指 导 思 想 、教 学 目标 、教 学 中 可 能 存 在 的 问题 、 完成 教 学 所 想及其初 步应 用 的教 学要求较低 ,在教学 实践 中,也 未引起重 需的 支持条件 、引导 学生学 习的设 问方式 、达标检测题 的设计 视 , 至 多 是 围 绕 高 考 进 行 ,许 多 教 师 也 不 知 怎 么教 才 好 ,往 往 是教学生 “ 套 用 ”教 材的解题格 式或步骤 ,可是 ,没 过多长 时 间学生就 忘了 !这种 功利性极 强的 “ 应试 教学 ”行 为难 以达 到
步骤 就是顺理成 章的事 了 ,因此 ,核 心在于独立 性检验 的基 本
思想 .

我们在 高 中数学课 程 中教授 统计 内容 ,根本 目的应是通过 些具体 的统 计案 例 ,指导学生 领会统计思 想 ,教 导学生认识
目的 ,还 需 在 今 后 的学 习或 工 作 中加 强 训 练 和应 用 . 四 、教 学 问题 诊 断分 析
1 . 教 学 内容
本节 的教学 内容是 通过 具 体实 例 “ 患 肺 癌 是 否 与 吸 烟 有 人 们 的生 存 ,直 至 推 动 社 会 发展 . 本 部 分 的 教 学 就 应 引 导 学 生 理 关” ,介绍 独立性检验 的基本思想 ,它是用 随机变量 : 判断两 解 独 立 性 检 验 的 含 义 ,探 究 独 立 性 检 验 蕴 含 的统 计 学 思 想 和 基 个 分 类 变 量有 关 的方 法 .独立 性 检 验是 一种 假设 检 验 ,它 的基 本 本 方 法 ,培 养 学 生 学 习 数 学 、研 究 数 学 的 习 惯 和 能 力 ,不 能 只 思想 来 源 于统 计 学 中的 假设 检 验 思想 . 为 了考试而轻视概念的理解 、轻视 阅读 自学能力的培养.

高中数学选修1,2《独立性检验的基本思想及其初步应用》教案

高中数学选修1,2《独立性检验的基本思想及其初步应用》教案

高中数学选修1,2《独立性检验的基本思想及其初步应用》教案高中数学选修1-2《独立性检验的基本思想及其初步应用》教案教学要求:通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示在吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高,让学生亲身体验独立性检验的实施步骤与必要性.教学重点:理解独立性检验的基本思想及实施步骤.教学难点:了解独立性检验的基本思想、了解随机变量的含义.教学过程:教学过程:一、复习准备:独立性检验的基本步骤、思想二、讲授新课:1. 教学例1:例1 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶. 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?① 第一步:教师引导学生作出列联表,并分析列联表,引导学生得出“秃顶与患心脏病有关”的结论;第二步:教师演示三维柱形图和二维条形图,进一步向学生解释所得到的统计结果;第三步:由学生计算出的值;第四步:解释结果的含义.② 通过第2个问题,向学生强调“样本只能代表相应总体”,这里的数据来自于医院的住院病人,因此题目中的结论能够很好地适用于住院的病人群体,而把这个结论推广到其他群体则可能会出现错误,除非有其它的证据表明可以进行这种推广.2. 教学例2:例2 为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:喜欢数学课程不喜欢数学课程总计男3785122女35143178总计72228300由表中数据计算得到的观察值 . 在多大程度上可以认为高中生的性别与是否数学课程之间有关系?为什么?(学生自练,教师总结)强调:①使得成立的前提是假设“性别与是否喜欢数学课程之间没有关系”.如果这个前提不成立,上面的概率估计式就不一定正确;②结论有95%的把握认为“性别与喜欢数学课程之间有关系”的含义;③在熟练掌握了两个分类变量的独立性检验方法之后,可直接计算的值解决实际问题,而没有必要画相应的图形,但是图形的直观性也不可忽视.不健康健康总计不优秀41626667优秀37296333三、课时小结:独立性检验的方法、原理、步骤四、巩固练习:某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表:请问有多大把握认为“高中生学习状况与生理健康有关”?五、课外作业课时练习六、板书设计。

【全程复习方略2014-2015学年高中数学 1.1 回归分析的基本思想及其初步应用课时提升作业 新人教A版选修1-2

【全程复习方略2014-2015学年高中数学 1.1 回归分析的基本思想及其初步应用课时提升作业 新人教A版选修1-2

回归分析的基本思想及其初步应用一、选择题(每小题3分,共12分)1.(2014·渭南高二检测)已知x与y之间的几组数据如下表:则y与x的线性回归方程=x+过点( )A.(0,1)B.(1,4)C.(2,5)D.(5,9)【解析】选C.因为==2,==5,所以根据线性回归方程必过样本中心点,可得=x+必过(2,5).【变式训练】(2014·石家庄高二检测)已知一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(x n,y n)其样本点的中心为(2,3),若其回归直线的斜率估计值为-1.2,则该回归直线方程为( )A.=1.2x+2B.=1.2x+3C.=-1.2x+5.4D.=-1.2x+0.6【解析】选C.由题意可设回归直线为=-1.2x+,由于回归直线过样本中心(2,3),故有3=-1.2×2+,解得=5.4,故回归直线方程为=-1.2x+5.4.2.下列三个命题:(1)随机误差e是衡量预报精确度的一个量,它满足E(e)=0.(2)残差平方和越小的模型,拟合的效果越好.(3)用相关指数R2来刻画回归的效果时,R2的值越小,说明模型拟合的效果越好.其中真命题的个数有( )A.0B.1C.2D.3【解析】选C.(1)(2)是正确的,(3)中R2越接近1,拟合效果越好,所以(3)错误,故选C.3.(2014·济南高二检测)某产品的广告费用x与销售额y的统计数据如下表根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为( )A.63.6万元B.65.5万元C.67.7万元D.72.0万元【解题指南】先求出所给数据的平均数,利用回归方程过样本点的中心求出即得回归方程,然后将自变量为6代入即可.【解析】选B.因为==3.5,==42,由数据的样本点的中心在回归直线上且回归方程中的=9.4,所以42=9.4×3.5+,即=9.1,所以线性回归方程是=9.4x+9.1,所以当广告费为6万元时=9.4×6+9.1=65.5.4.(2013·福建高考)已知x与y之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为=x+,若某同学根据上表中的前两组数据和求得的直线方程为y′=b′x+a′,则以下结论正确的是( ) A.>b′,>a′ B.>b′,<a′C.<b′,>a′D.<b′,<a′【解题指南】审题时,要注意“直线方程”和“回归直线”的区别.【解析】选C.过(1,0)和(2,2)的直线方程为y=2x-2,画出六点的散点图,回归直线的大概位置如图所示,显然b′>,>a′.二、填空题(每小题4分,共8分)5.如果散点图中的所有的点都在一条直线上,则残差为,残差平方和为,相关指数为.【解析】因为散点图中的所有的点都在一条直线上,所以y i =i y ,相应的残差=y i -i y =0,残差平方和n2ii 1e0==∑.相关指数R 2=1-()()n2iii 1n 2ii 1yyyy ==--∑∑=1-0=1.答案:0 0 1【变式训练】(2014·蚌埠高二检测)已知方程=0.85x-85.7是根据女大学生的身高预报体重的回归方程,其中x,的单位分别是cm,kg,则该方程在样本(165,57)处的残差是 . 【解题指南】明确残差的含义,计算出便得(165,57)处的残差.【解析】当x=165时,=0.85×165-85.7=54.55,所以方程在样本(165,57)处的残差是57-54.55=2.45. 答案:2.456.关于x 与y 有如下数据:为了对x,y 两个变量进行统计分析,现有以下两种线性模型:甲=6.5x+17.5,乙=7x+17,则模型 (填“甲”或“乙”)拟合的效果更好.【解题指南】分别计算两个函数模型所对应的R 2,通过比较与的大小来说明哪个函数模型拟合较好.【解析】模型甲可得y i -i y 与y i -的关系如下表:-所以(y i -i y )2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155,(y i -)2=(-20)2+(-10)2+102+02+202=1000,所以=1-521521()()iii iii y y y y ==--∑∑=1-=0.845.由模型乙可得y i -i y 与y i -的关系如下表所以(y i -i y )2=(-1)2+(-5)2+82+(-9)2+(-3)2=180,(y i -)2=(-20)2+(-10)2+102+02+202=1000,所以=1-521521()()iii iii y y y y ==--∑∑=1-=0.82,由=0.845,=0.82知>,所以模型甲的拟合效果比较好.答案:甲三、解答题(每小题10分,共20分)7.在一段时间内,某种商品的价格x(万元)和需求量y(t)之间的一组数据为:(1)画出散点图. (2)求y 对x 的回归方程.(3)若价格定为1.9万元,则预测需求量大约是多少?(精确到0.01t)【解析】(1)如图所示.(2)列表如下:所以=×9=1.8,=×37=7.4,x i y i=62,=16.6,所以===-11.5,=-=7.4+11.5×1.8=28.1,故y对x的回归方程为=+x=28.1-11.5x.(3)当x=1.9时,=28.1-11.5×1.9=6.25,所以价格定为1.9万元时,需求量大约是6.25t.8.(2014·潍坊高二检测)某种书每册的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下:10.15 4.08检验每册书的成本费y与印刷册数的倒数之间是否具有线性相关关系,如有,求出y对x的回归方程. 【解析】把置换为z,则有z=,从而z与y的数据为:所以=×(1+0.5+0.333+…+0.005)=0.2251,=×(10.15+5.52+4.08+…+1.15)=3.14,=12+0.52+0.3332+…+0.012+0.0052=1.415003,=10.152+5.522+…+1.212+1.152=171.803,z i y i=1×10.15+0.5×5.52+…+0.005×1.15=15.22102,所以r=≈0.999 8.因为|r|≈0.9998>0.75,所以z对y具有很强的线性相关关系,所以=≈8.976,=-≈1.120,所以所求的z与y的回归方程为=8.976z+1.120.又z=,所以=+1.120.一、选择题(每小题4分,共12分)y)2如下1.甲、乙、丙、丁4位同学各自对A,B两变量做回归分析,分别得到散点图与残差平方和(y i-i表:哪位同学的试验结果体现拟合A,B两变量关系的模型拟合精度高?( )A.甲B.乙C.丙D.丁【解析】选D.残差平方和越小的模型拟合精度越高.2.(2013·湖北高考)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y与x负相关且=2.347x-6.423;②y与x负相关且=-3.476x+5.648;③y与x正相关且=5.437x+8.493;④y与x正相关且=-4.326x-4.578.其中一定不正确的结论的序号是( )A.①②B.②③C.③④D.①④【解题指南】x的系数的符号决定变量x,y之间的正、负相关关系.【解析】选D.x的系数大于0为正相关,小于0为负相关.【变式训练】(2014·西安高二检测)从某高中随机选取5名高三男生,其身高和体重的数据如下表所示:根据上表可得回归直线方程=0.56x+,据此模型预报身高为172cm的高三男生的体重为( )A.70.09B.70.12C.70.55D.71.05【解析】选B.先求出=170,=69,代入回归直线方程得=-26.2,把x=172代入回归直线方程得=70.12,故选B.3.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了8次试验,收集数据如下:60设回归直线方程为=x+,则点(,)在直线x+45y-10=0的( )A.右上方B.右下方C.左上方D.左下方【解题指南】利用线性回归系数公式求出,的值,从而可确定(,)与直线x+45y-10=0的位置关系. 【解析】选A.由题意,==45,==85,x i y i=33400,=20400,8=16200,8·=30600,所以==,=55.因为55+45×-10=75>0,所以在直线x+45y-10=0的右上方.故选A.二、填空题(每小题4分,共8分)4.(2014·梅州高二检测)在2012年8月15日那天,某物价部门对本市的5家商场的某商品的一天销售量价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示:由散点图可知,销售量y与价格x之间有较强的线性相关关系,其线性回归直线方程是:=-3.2x+40,且m+n=20,则其中的n= .【解析】==,==.因为其线性回归直线方程是:=-3.2x+40,所以=-3.2×+40,即30+n=-3.2(40+m)+200,又m+n=20,解得m=n=10.答案:105.一般来说,一个人脚掌越长,他的身高就越高,现对10名成年人的脚掌长x与身高y进行测量,得到数据(单位均为c m)如表,作出散点图后,发现散点在一条直线附近,经计算得到一些数据:(x i-)(y i-)=577.5,(x i-)2=82.5;某刑侦人员在某案发现场发现一对裸脚印,量得每个脚印长为26.5cm,则估计案发嫌疑人的身高为cm.【解题指南】根据所给的数据,求得回归方程的斜率的值,代入样本中心点求出的值,得到线性回归方程,把所给的x 的值代入预报得出身高. 【解析】经计算得到一些数据:(x i -)(y i -)=577.5,(x i -)2=82.5,所以回归方程的斜率===7,=24.5,=171.5,截距=-=0,即回归方程为=7x,当x=26.5,=7×26.5=185.5,则估计案发嫌疑人的身高为185.5cm. 答案:185.5三、解答题(每小题10分,共20分)6.(2014·海口高二检测)2013年,首都北京经历了59年来雾霾天气最多的一个月.经气象局统计,北京市从1月1日至1月30日这30天里有26天出现雾霾天气,《环境空气质量指数(AQI)技术规定(试行)》将空气质量指数分为六级;其中,中度污染(四级),指数为151~200;重度污染(五级),指数为201~300;严重污染(六级),指数大于300.下面表1是该观测点记录的4天里,AQI 指数M 与当天的空气水平可见度y(千米)的情况,表2是某气象观测点记录的北京1月1日到1月30日AQI 指数频数统计结果. 表1 AQI 指数M 与当天的空气水平可见度y(千米)情况表2 北京1月1日到1月30日AQI指数频数统计(1)设变量x=,根据表1的数据,求出y 关于x 的线性回归方程.(2)根据表2估计这30天AQI 指数的平均值.【解析】(1)由x=结合图表,可得x 1=9,x 2=7,x 3=3,x 4=1,所以=(9+7+3+1)=5,=(0.5+3.5+6.5+9.5)=5,所以x i y i =9×0.5+7×3.5+3×6.5+1×9.5=58,=92+72+32+12=140,所以==-,=5-5=, 所以y 关于x 的线性回归方程是=-x+. (2)由表2知AQI 指数的频率分别为=0.1,=0.2,=0.4,=0.2,=0.1,故这30天AQI 指数的平均值为:100×0.1+300×0.2+500×0.4+700×0.2+900×0.1=500.【变式训练】设三组实验数据(x1,y 1),(x 2,y 2),(x 3,y 3)的回归直线方程是:=x+,使代数式[y1-(x 1+)]2+[y 2-(x 2+)]2+[y 3-(x 3+)]2的值最小时,=-,=,(,分别是这三组数据的横、纵坐标的平均数) 若有七组数据列表如下:(1)求上表中前三组数据的回归直线方程.(2)若|y 1-(x 1+)|≤0.2,即称(x 1,y 1)为(1)中回归直线的拟合“好点”,求后四组数据中拟合“好点”的概率.【解题指南】(1)根据所给的数据得出x 与y 的平均数,代入求线性回归方程系数的公式,利用最小二乘法做出结果,把样本中心点代入求出的值,写出线性回归方程.(2)本题是一个古典概型,试验发生包含的事件个数是4:检验出符合好点的数据,根据所给的表示式检验出符合条件的事件数,根据古典概型概率公式得到结果. 【解析】(1)前三组数的平均数:=3,=5, 根据公式:==,所以=5-×3=,所以回归直线方程是:=x+.(2)由题意知本题是一个古典概型,试验发生包含的事件个数是4:检验出符合好点的数据,|6.2-3.5-0.5×5|=0.2≤0.2,|8-3.5-0.5×6|=1.5>0.2,|7.1-3.5-0.5×7|=0.1<0.2,|8.6-3.5-0.5×8|=1.1>0.2,综上,拟合的“好点”有2组,所以概率P==.7.(2014·西安高二检测)下表是某年美国旧轿车价格的调查资料,以x(年)表示轿车的使用年数,y(美元)表示相应的年均价格,求y关于x的非线性回归方程.【解析】画散点图如图1所示,看出y与x呈指数关系,于是令z=lny.变换后得数据:画散点图如图2所示,由图可知各点基本处于一条直线,由于==5.5,==6.5274,==-0.298,=-=6.5274+0.298×5.5≈8.166,所以表中数据可得线性回归方程为=8.166-0.298x,因此旧轿车的平均价格对使用年数的非线性回归方程为=e8.166-0.298x.。

高中数学第一章1.2独立性检验的基本思想及其初步应用学案含解析新人教A版选修7.doc

高中数学第一章1.2独立性检验的基本思想及其初步应用学案含解析新人教A版选修7.doc

1.2 独立性检验的基本思想及其初步应用[提出问题问题1:观察教材第10页的探究,其中的频数表叫什么?提示:列联表.问题2:由表中数据,你能说吸烟对患肺癌有影响吗?提示:能.问题3:如何用数字分析此类问题?提示:利用随机变量K2进行分析.[导入新知]1.分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.2.2×2列联表假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(也称2×2列联表)为:3.等高条形图将列联表中的数据用高度相同的两个条形图表示出来,其中两列的数据分别对应不同的颜色,这就是等高条形图.4.K2统计量为了使不同样本容量的数据有统一的评判标准,我们构造一个随机变量K2=n ad -bc2,其中n=a+b+c+d为样本容量.a +b c+d a+c b+d5.独立性检验利用随机变量K2来确定是否能以给定把握认为“两个分类变量有关系”的方法,称为两个分类变量独立性检验.[化解疑难]反证法原理与独立性检验原理的比较反证法原理——在假设H0下,如果推出一个矛盾,就证明了H0不成立.独立性检验原理——在假设H0下,如果出现一个与H0相矛盾的小概率事件,就推断H0不成立,且该推断犯错误的概率不超过小概率.[提出问题]问题:利用随机变量K2进行独立性检验需要几步?提示:三步.[导入新知]独立性检验的具体做法(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查右表确定临界值k0.(2)利用公式K2=n ad-bc2a +b c+d a+c b+d,计算随机变量K2的观测值k.(3)如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.[化解疑难]详析独立性检验(1)通过列联表或观察等高条形图判断两个分类变量之间有关系,属于直观判断,不足之处是不能给出推断“两个分类变量有关系”犯错误的概率,而独立性检验可以弥补这个不足.(2)列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此,需要用独立性检验的方法确认所得结论在多大程度上适用于总体.[例1] 生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.[解] 作列联表如下:相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例.从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关.[类题通法]细解等高条形图(1)绘制等高条形图时,列联表的行对应的是高度,两行的数据不相等,但对应的条形图的高度是相同的;两列的数据对应不同的颜色.(2)等高条形图中有两个高度相同的矩形,每一个矩形中都有两种颜色,观察下方颜色区域的高度,如果两个高度相差比较明显即aa +b 和cc +d相差很大,就判断两个分类变量之间有关系.[活学活用]为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:利用等高条形图判断父母吸烟对子女吸烟是否有影响.解:等高条形图如下:由图形观察可以看出子女吸烟者中父母吸烟的比例要比子女不吸烟者中父母吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”.[例2] (在全校一年级学生中进行了抽样调查,调查结果如下表所示:惯方面有差异”?[解] 将2×2列联表中的数据代入公式计算,得k=-270×30×80×20=10021≈4.762.由于4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.[类题通法]解决独立性检验问题的思路解决一般的独立性检验问题,首先由题目所给的2×2列联表确定a,b,c,d,n的值,然后代入随机变量K2的计算公式求出观测值k,将k与临界值k0进行对比,确定有多大的把握认为“两个分类变量有关系”.[活学活用]某医院对治疗支气管肺炎的两种方案A,B进行比较研究,将志愿者分为两组,分别采用方案A和方案B进行治疗,统计结果如下:(1)(2)能否在犯错误的概率不超过0.05的前提下认为治疗是否有效与方案选择有关?解:(1)列联表如下:≈3.571<3.841,(2)K2=120×80×168×32所以不能在犯错误的概率不超过0.05的前提下认为治疗是否有效与方案选择有关.1.独立性检验与统计的综合应用[典例] (12分)某工厂有工人1 000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层抽样的方法(按A类、B类分两层)从该工厂的工人中抽取100名工人,调查他们的生产能力(此处生产能力指一天加工的零件数),结果如下表.表1:A类工人生产能力的频数分布表表2:B类工人生产能力的频数分布表(1)确定x,y的值;(2)完成下面2×2列联表,并回答能否在犯错误的概率不超过0.001的前提下认为工人的生产能力与工人的类别有关系.附:K2=n ad-bc2a +b c+d a+c b+d,[解题流程][规范解答](1)∵从该工厂的工人中抽取100名工人,且该工厂中有250名A类工人,750名B类工人,∴要从A类工人中抽取25名,从B类工人中抽取75名,(2分)∴x=25-8-3-2=12,y=75-6-27-18=24.(4分)(2)根据所给的数据可以完成列联表,如下表所示:由列联表中的数据,得K 2的观测值为k =-225×75×50×50=12>10.828.(10分)因此,在犯错误的概率不超过0.001的前提下,认为工人的生产能力与工人的类别有关系.(12分)[名师批注]要确定x ,y 的值,应先确定A 类工人及B 类工人中应各抽取多少人,此处易误认为x =25,y =75,从而导致解题错误分此处易犯错误有两点:①计算失误;②将公式中的数据搞错[活学活用]电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分的观众称为“体育迷”,已知“体育迷”中有10名女性.根据已知条件完成下面的2×2列联表,据此资料,你是否认为“体育迷”与性别有关?附:解:由频率分布直方图可知,在抽取的100名观众中,“体育迷”有25名,“非体育迷”有75名,又已知100名观众中女性有55名,女“体育迷”有10名,所以男性有45名,男“体育迷”有15名,从而可完成2×2列联表,如下表:由2×2列联表中的数据,得K2的观测值为k=-245×55×75×25≈3.030.因为3.030<3.841,所以没有充分的证据表明“体育迷”与性别有关.[随堂即时演练]1.下面是一个2×2列联表:则表中a,b处的值分别为( )A.94,96 B.52,50C.52,54 D.54,52解析:选C 由⎩⎪⎨⎪⎧a +21=73,a +2=b ,得⎩⎪⎨⎪⎧a =52,b =54.2.博士生和硕士生毕业情况的一个随机样本给出了关于所获取的学位类别与学生性别的分类数据如下表.由表中的数据,可得( )A .性别与获取学位类别有关B .性别与获取学位类别无关C .性别决定获取学位的类别D .以上说法都不正确解析:选 A 由列联表中的数据,得K 2的观测值为k =-2×340305×35×189×151≈7.34>6.635,所以在犯错误的概率不超过0.01的前提下,认为性别与获取学位类别有关.而选项C 中的表述不恰当,因为性别与获取学位类别不是因果关系,只是统计学上的一种非确定性关系,故不能用“决定”二字描述.3.独立性检验所采用的思路是:要研究A ,B 两类变量彼此相关,首先假设这两类变量彼此________.在此假设下构造随机变量K 2,如果K 2的观测值较大,那么在一定程度上说明假设________.答案:无关 不成立4.在吸烟与患肺病是否相关的判断中,有下面的说法:①若K 2的观测值k >6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知,在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知,在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________(填序号).解析:K 2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.答案:③5.在一次天气恶劣的飞机航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人.能否在犯错误的概率不超过0.10的前提下推断在天气恶劣的飞机航程中男乘客比女乘客更容易晕机?解:由已知条件得出下面的2×2列联表:由公式可得K2的观测值k=n ad-bc2a +b c+d a+c b+d=-255×34×32×57≈3.689>2.706.故在犯错误的概率不超过0.10的前提下,认为“在天气恶劣的飞机航程中男乘客比女乘客更容易晕机”.[课时达标检测]一、选择题1.判断两个分类变量是彼此相关还是相互独立的常用的方法中,最为精确的是( ) A.2×2列联表 B.独立性检验C.等高条形图 D.其他解析:选B A、C只能直观地看出两个分类变量x与y是否相关,但看不出相关的程度.独立性检验通过计算得出相关的可能性,较为准确.2.对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是( )A.k越大,“X与Y有关系”的可信程度越小B.k越小,“X与Y有关系”的可信程度越小C.k越接近于0,“X与Y没有关系”的可信程度越小D.k越大,“X与Y没有关系”的可信程度越大解析:选B k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大.即k越小,“X与Y有关系”的可信程度越小.故选B.3.利用独立性检验对两个分类变量是否有关系进行研究时,若在犯错误的概率不超过0.005的前提下认为事件A和B有关系,则具体计算出的数据应该是( )A.k≥6.635 B.k<6.635C.k≥7.879 D.k<7.879解析:选C 犯错误的概率为0.5%,对应的k0的值为7.879,由独立性检验的思想可知应为k≥7.879.4.(江西高考)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )表1表2表3表4A.成绩 B.视力C.智商 D.阅读量解析:选D 因为k 1=-2 16×36×32×20=52×8216×36×32×20,k 2=-2 16×36×32×20=52×112216×36×32×20,k 3=-2 16×36×32×20=52×96216×36×32×20,k 4=-2 16×36×32×20=52×408216×36×32×20,则有k4>k2>k3>k1,所以阅读量与性别关联的可能性最大.5.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由K2=a +b c+d a+c b+d算得,观测值k=-260×50×60×50≈7.8.附表:A .有99%以上的把握认为“爱好该项运动与性别有关”B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” 解析:选A 由k ≈7.8及P (K 2≥6.635)=0.010可知,在犯错误的概率不超过1%的前提下认为“爱好该项运动与性别有关”,也就是有99%以上的把握认为“爱好该项运动与性别有关”.二、填空题6.下列关于K 2的说法中,正确的有________(填序号). ①K 2的值越大,两个分类变量的相关性越大; ②K 2的计算公式是K 2=n ad -bc a +bc +d a +cb +d;③若求出K 2=4>3.841,则有95%的把握认为两个分类变量有关系,即有5%的可能性使得“两个分类变量有关系”的推断出现错误;④独立性检验就是选取一个假设H 0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝H 0的推断.解析:对于①,K 2的值越大,只能说明我们有更大的把握认为二者有关系,却不能判断相关性大小,故①错;对于②,(ad -bc )应为(ad -bc )2,故②错;③④对.答案:③④7.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:填“是”或“否”).解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即ba +b =1858,dc +d =2742,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.答案:是8.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:差别的结论________(填“能”或“不能”).解析:根据列联表中的数据,可以求得K2的观测值k=-2 68×324×196×196≈1.779.K2<2.072的概率为0.85.不能作出这两种手术对病人又发作心脏病的影响有差别的结论.答案:1.779 不能三、解答题9.巴西医生马廷恩收集犯有各种贪污、受贿罪的官员与廉洁官员寿命的调查资料:500名贪官中有348人的寿命小于平均寿命,152人的寿命大于或等于平均寿命;590名廉洁官员中有93人的寿命小于平均寿命,497人的寿命大于或等于平均寿命.这里,平均寿命是指“当地人均寿命”.能否在犯错误的概率不超过0.01的前提下认为官员在经济上是否清廉与他们寿命的长短之间有关系?解:据题意列2×2列联表如下:由公式得K2的观测值k=-2 500×590×441×649≈325.635.因为325.635>6.635,因此,在犯错误的概率不超过0.01的前提下认为官员在经济上是否清廉与他们寿命的长短之间是有关系的.10.某地震观测站对地下水位的变化和发生地震的情况共进行1 700次观测,列联表如下:分的证据显示二者有关系.解:相应的等高条形图如图所示.图中两个阴影条的高分别表示水位有变化和水位无变化的样本中有震的频率.由图可看出,水位有变化样本中有震的频率与水位无变化样本中有震的频率相差不大,因此不能判断地震与水位变化有关系.根据列联表中的数据,得K2的观测值为k=-21 000×700×180×1 520≈1.594<2.072,所以题中数据没有充分的证据显示地下水位的变化与地震的发生有关系,但也不能认为二者无关系.。

高中数学 1-2《独立性检验的基本思想及其初步应用》同步 新人教A版选修1-2

高中数学 1-2《独立性检验的基本思想及其初步应用》同步 新人教A版选修1-2

根据列联表中所给的数据,有 a=38,b=442,c=6,
d=514,a+b=480,c+d=520,a+c=44,b+d=956,n
=1000,得 K2 的观测值
k=(a+b)(cn+(add-)(ab+c)c2)(b+d)

1000×(38×514-442×6)2 480×520×44×956
本节重点:理解独立性检验的基本思想及实 施步骤.
本节难点:(1)了解独立性检验的基本思想.
(2)了解随机变量K2的含义.
在学习中要多从实际问题考虑,对一些典型 案例的数据的处理,了解和使用一些常用的 统计方法,树立应用数学的意识,树立数学 为实践服务的思想.
1.2×2列联表是传统的调查研究中最常用 的方法之一,用于研究两个变量之间相互独 立还是存在某种关联性,它适用于分析两个 变量之间的关系.
一般地,假设两个分类变量X和Y,它们的取值分 别为{x1,x2} 和 {y1,y2},其样本频数列联表(也称 为2×2列联表)为下表.
x1
x2 总计
y1 a
c a+c
y2 b
d b+d
总计 a+b c+d a+b+c+d
2.等高条形图
(1)等高条形图与表格相比,更能直观地反映 出两个分类变量间是否 互相影响 , 常 用 等 高
2.在实际问题中,判断两个分类变量的关 系的可靠性时,一般利用随机变量K2来确定, 而不利用三维柱形图和二维条形图.
1.分类变量和列联表
(1)分类变量
变量的不同“值”表示个体所属的不同类别 , 像 这样的变量称为分类变量.
(2)列联表 ①定义:列出的两个分类变量的 频数表 称 为 列 联表.
②2×2列联表
[例2] 下面2×2列联表的K2的值为________. [答案] 1.780
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

【全程复习方略】高中数学-1.2-独立性检验的基本思想及其初步应用课时提升作业-新人教A版选修1-2独立性检验的基本思想及其初步应用一、选择题(每小题3分,共12分)1.与表格相比,能更直观地反映出相关数据总体状况的是( )A.列联表B.散点图C.残差图D.等高条形图【解析】选D.A只能反映个体数据的情况,B只能反映数据的相关性,C只能反映数据的相关程度,D能直观地反映出相关数据的总体状况.2.分类变量X和Y的列联表如下:Y1Y2总计X1a b a+bX2c d c+d总计a+c b+d a+b+c+d则下列说法中正确的是( )A.ad-bc越小,说明X与Y关系越弱B.ad-bc越大,说明X与Y关系越强C.(ad-bc)2越大,说明X与Y关系越强D.(ad-bc)2越接近于0,说明X与Y关系越强【解析】选C.因为K2=,所以(ad-bc)2越大,则K2越大,X与Y关系越强,故选C.二、填空题(每小题4分,共8分)5.某高校教“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:专业非统计专业统计专业性别男13 10女7 20为了判断主修统计专业是否与性别有关系,根据表中的数据,得到K2的观测值k=≈4.844.因为k≥3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性不超过.【解析】根据K2的临界值表可知,k≥3.841时在犯错误的概率不超过0.05的前提下认为其有关,也就是这种判断出错的可能性不超过5%.答案:5%【变式训练】(2014·安庆高二检测)调查某养殖场某段时间内幼崽出生的时间与性别的关系,得到下面的数据表:晚上白天总计雄性12 8 20雌性 2 8 10总计14 16 30从中可以得出在犯错误的概率不超过的前提下可以认为幼崽出生的时间与性别有关系.附:K2=) 0.050 0.010 0.001 P(K2≥kk3.841 6.635 10.828【解题指南】利用K2=,求出K2的观测值,与临界值比较,即可得到结论.【解析】由题意k==≈4.2857>3.841,所以犯错误的概率不超过0.050.答案:0.0506.在对某小学的学生进行吃零食的调查中,得到如下表数据:吃零食不吃零食总计男学生24 31 55女学生8 26 34总计32 57 89根据上述数据分析,我们得出的K2的观测值k约为.【解析】由公式可计算得k=≈3.689.答案:3.689【举一反三】在题目条件不变的情况下,在犯错误的概率不超过多少时认为吃零食与性别有关.【解析】因为3.689>2.706,且P(K2≥2.706)≈0.10, 所以在犯错误的概率不超过0.10的前提下认为吃零食与性别有关.三、解答题(每小题10分,共20分)7.为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:组别阳性数阴性数总计铅中毒病29 7 36人对照组9 28 37总计38 35 73试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系.【解析】等高条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.由图可以直观地看出铅中毒病人与对照组相比较尿棕色素为阳性差异明显,因此铅中毒病人与尿棕色素为阳性有关系.8.(2014·马鞍山高二检测)某中学共2200名学生中有男生1200名,按男女性别用分层抽样抽出110名学生,询问是否爱好某项运动.已知男生中有40名爱好该项运动,女生中有30名不爱好该项运动.(1)完成如下的列联表:男女总计爱好40不爱好30总计(2)通过计算说明,是否在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别有关”?【解析】(1)男女总计爱好40 20 60不爱好20 30 50总计60 50 110(2)K2的观测值k=≈7.8>6.635.所以在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别有关”.一、选择题(每小题4分,共12分)1.(2014·德州高二检测)假设两个分类变量X与Y,它们的取值分别为{x1,x2},{y1,y2},其2×2列联表如图所示:对于以下数据,对同一样本能说明X与Y有关的可能性最大的一组为( )y1y2总计x1a b a+bx2c d c+d总计a+c b+d a+b+c+dA.a=50,b=40,c=30,d=20B.a=50,b=30,c=20,d=40C.a=50,b=20,c=40,d=30D.a=20,b=30,c=50,d=40【解题指南】ad与bc差距越大,两个变量有关的可能性就越大,检验四个选项中所给的ad与bc的差距,比较即可.【解析】选B.根据观测值求解的公式可以知道,ad与bc 差距越大,两个变量有关的可能性就越大.选项A,|ad-bc|=|1000-1200|=200;选项B,|ad-bc|=|2000-600|=1400;选项C,|ad-bc|=|1500-800|=700;选项D,|ad-bc|=|800-1500|=700.2.(2014·合肥高二检测)在一次独立性检验中得到如下列联表:A 总计B 200 800 1000180 a 180+a 总计380 800+a 1180+a且最后发现,两个分类变量A和B没有关系,则a的可能值是( )A.200B.720C.100D.180【解题指南】将选项中的值代入K2公式,结合临界值表即得答案.【解析】选B.计算K2=,当a=200时,K2=≈103.37>3.841,两个分类变量A和B有关系.当a=720时,K2==0,由K2<2.706知此时两个分类变量无关系.3.(2014·菏泽高二检测)春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下列联表: 做不到“光盘”能做到“光盘”男45 10女30 15由此列联表得到的正确结论是( )A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到′光盘′与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到′光盘′与性别无关”C.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到′光盘′与性别有关”D.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到′光盘′与性别无关”【解析】选 C.由2×2列联表得到a=45,b=10,c=30,d=15.则a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100 .代入K2=得K2的观测值k=≈3.030.因为2.706<3.030<3.841,所以在犯错误的概率不超过0.1的前提下认为“该市居民能否做到′光盘′与性别有关”.故选C.二、填空题(每小题4分,共8分)4.某研究小组为了研究中学生的身体发育情况,在某中学随机抽出20名15至16周岁的男生将他们的身高和体重制成2×2列联表,根据列联表中的数据,可以在犯错误的概率不超过的前提下认为该学校15至16周岁的男生的身高和体重之间有关系.超重不超重总计偏高 4 1 5不偏高 3 12 15总计7 13 20【解析】根据公式K2=得,K2的观测值k=≈5.934,因为k>5.024,因此在犯错误的概率不超过0.025的前提下认为该学校15至16周岁的男生的身高和体重之间有关系.答案:0.0255.对某校小学生进行心理障碍测试得到如下的列联表有心理障碍没有心理障碍总计女生10 20 30男生10 70 80总计20 90 110试说明心理障碍与性别的关系: .【解题指南】根据计算出的临界值,同临界值表进行比较,得到心理障碍与性别是否有关系的判断.【解析】由表可知,a=10,b=20,c=10,d=70,a+b=30,c+d=80,a+c=20,b+d=90,n=110,ad=700,bc=200 ,把以上数值代入K2==≈6.3657.因为6.3657>5.024,所以在犯错误的概率不超过0.025的前提下认为心理障碍与性别有关系.答案:在犯错误的概率不超过0.025的前提下认为心理障碍与性别有关系三、解答题(每小题10分,共20分)6.在500个用血清的人身上试验某种血清预防感冒的作用,把一年中的记录与另外500个未用血清的人作比较,得到如下的列联表:未感冒感冒总计用血清252 248 500未用血清224 276 500总计476 524 1 000由以上数据能否在犯错误的概率不超过0.01的前提下认为血清能对预防感冒起到一定的作用?【解析】由列联表中的数据得k=≈3.14.由于3.14<6.635,故不能在犯错误的概率不超过0.01的前提下认为血清对预防感冒有作用.【方法技巧】利用等高条形图判断两变量相关的方法等高条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可信程度.在等高条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例,也可以估计满足条件X=x2的个体中具有Y=y的个体所占的比例,两个比例的值相2差越大,结论成立的可能性就越大.7.某地区甲校高二年级有1100人,乙校高二年级有900人,为了统计两个学校高二年级在学业水平考试中的数学学科成绩,采用分层抽样的方法在两校共抽取了200名学生的数学成绩,如下表:(已知本次测试合格线是50分,两校合格率均为100%)甲校高二年级数学成绩:分[50,60) [60,70) [70,80) [80,90) [90,100] 组频10 25 35 30 x数乙校高二年级数学成绩:分组[50,60) [60,70) [70,80) [80,90) [90,100]频数15 30 25 y 5(1)计算x,y的值,并分别估计以上两所学校数学成绩的平均分(精确到1分).(2)若数学成绩不低于80分为优秀,低于80分为非优秀,根据以上统计数据写下面2×2列联表,并回答能否在犯错误的概率不超过0.05的前提下认为“两个学校的数学成绩有差异”?甲校乙校总计优秀非优秀总计【解题指南】(1)根据抽取的人数和两个学校的人数,利用分层抽样得到两个学校要抽取的人数,分别得出x,y 的值,利用平均数的公式得出两个学校的平均分. (2)根据数学成绩不低于80分为优秀,低于80分为非优秀,得出优秀的人数和不优秀的人数,填出列联表,根据列联表的数据,写出观测值的计算公式,得到观测值,同临界值进行比较,得到结论.【解析】(1)依题意知甲校应抽取110人,乙校应抽取90人,所以x=10,y=15,估计两个学校的平均分,甲校的平均分为≈75,乙校的平均分为≈71.(2)数学成绩不低于80分为优秀,低于80分为非优秀,得到列联表:甲校乙校总计优秀40 20 60非优秀70 70 140总计110 90 200所以K2的观测值k=≈4.714,又因为4.714>3.841,故能在犯错误的概率不超过0.05的前提下认为“两个学校的数学成绩有差异”.。

相关文档
最新文档