独立性检验26239
独立性检验

独立性检验§1.2独立性检验的基本思想及其初步应用课前热身1.2×2列联表(1)分类变量的定义变量的不同“值”表示__________,像这样的变量称作分类变量.(2)2×2列联表的定义一般地取两个分类变量X和Y,它们的值域分别为__________和__________,其样本频数列联表(也称2×2列联表)为下表:2.二维条形图在二维条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占比例__________,也可以估计满足X=x2的个体中具有Y=y1的个体所占比例为__________,两个比例的值相差越大,则两分类变量有关系的可靠程度越大.3.K2统计量为了消除样本量|ad-bc|的影响,统计学中引入下面的量K2=_____________________________________________________,其中n=__________为样本容量.4.独立性检验的定义及实施步骤(1)独立性检验的定义利用随机变量K2来确定是否能以给定把握认为“________________”的方法,称为两个分类变量的独立性检验.(2)判断“__________________________”的方法有列联表法、__________及K2公式的计算.名师讲解一般地,假设两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(也称为2×2列联表)为下表:若要推断的论述为H1:“X与Y有关系”.可以按如下步骤判断H1成立的可能性.(1)通过二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.在二维条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占比例为aa+b,也可以估计满足条件X=x2的个体中具有Y=y1的个体所占的比例为cc+d,两个比例的值相差越大,H1成立的可能性就越大.(2)可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度,具体的做法是:根据数据代入公式K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)求出随机变量K2的观测值k,其值越大,说明X与Y有关系的可能性越大,当得到的观测数据a、b、c、d都不小于5时,可以得到以下结论用于确定X与Y的可信程度:①如果k>10.828,有99.9%的把握认为X与Y有关系.②如果k>7.879,就有99.5%的把握认为X与Y有关系.③如果k>6.635,就有99%的把握认为X与Y有关系.④如果k>5.024,就有97.5%的把握认为X与Y有关系.⑤如果k>3.841,就有95%的把握认为X与Y有关系.⑥如果k>2.706,就有90%的把握认为X与Y有关系.⑦如果k≤2.706,就认为没有充分的证据显示X与Y有关系.典例剖析题型一概念辨析例1在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A.如果K2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病C.若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推理出现错误D.以上三种说法都不正确误区警示题中所说的“有99%的把握认为吸烟与患肺病有关”是指统计上的关系,而不是因果关系,也不能认为99%是指某人患有肺病的概率.变式训练1下列说法正确的个数为()①对事件A与B的检验无关,说明两事件互不影响;②事件A与事件B关系越密切,K2的值就越大;③K2的大小是判断事件A与B是否相关的唯一数据;④若判断两事件A与B相关,则A发生B一定发生.A.1B.2C.3D.4例2打鼾不仅影响别人休息,而且可能与患某种疾病有关.下表是一次调查所得的数据,试问:每晚都打鼾与患心脏病有关吗?用图表分析.变式训练2在500人身上试验某种血清预防感冒的作用,把一年中的记录与另外500个未用血清的人作比较,结果如下:题型三利用K2公式进行独立性检验例3在研究某种新措施对猪白痢的防治效果问题时,得到以下数据:试问新措施对防治猪白痢是否有效果?分析对于新措施对防治猪白痢是否有效果?可以计算K2的值与临界值进行比较,作出判断.规律技巧虽然二维条形图也能判断新措施对防治猪白痢是否有效果,但不能给出它们关系这一结论的可靠程度,因而我们常用K2公式解答问题.变式训练3调查者询问了72名大学生在购买食品时是否观看营养说明得到下表所示的数据,从表中数据分析看不看说明书与大学生的性别之间有没有关系.题型四独立性检验的应用例4下表是某地区的一种传染病与饮用水的调查表:(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.变式训练4现有两种治疗运动员膝关节损伤的药方,为了比较两药方的疗效收集的数据如下表:(2)哪种药方疗效好?技能演练基础强化1.下列关于K2的说法正确的是()A.K2在任何相互独立问题中都可以用来检验有关还是无关B.K2的值越大,两个事件的相关性越大C.K2是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合D.K2的观测值的计算公式为K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d)2.下面是一个2×2列联表则表中aA.94、96B.52、50 C.52、54 D.54、52 3.观察下列各图,其中两个分类变量x,y之间关系最强的是()4.考察棉花种子经过处理跟生病之间的关系得到如下表数据:A .种子经过处理跟是否生病有关B .种子经过处理跟是否生病无关C .种子是否经过处理决定是否生病D .以上都是错误的 5.分类变量x 和y 的列联表如下,则( )A.ad -bc C .(ad -bc )2越大,说明x 与y 的关系越强 D .(ad -bc )2越小,说明x 与y 的关系越强 6.某班主任对全班50名学生进行了作业量多少的调查,数据如下表:A .99%B .95%C .90%D .无充分依据7.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:k =50(13×20-10×7)220×30×23×27≈4.844,因为k >3.841,所以确定主修统计专业与性别有关系,那么这种判断出错的可能性为__________.8.某大学在研究性别与职称(分正教授,副教授)之间是否有关系,你认为应该收集的数据是__________.能力提升9.利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅下表来确定断言“X 和Y有关系”的可信度.如果k>5.024,那么就有把握认为“X和Y有关系”的百分比为__________.1011.在对人们休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人,女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动,你能否判断性别与休闲方式是否有关系?品味高考12.(2010·新课标)为了调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:(1)(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关;(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由?附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )。
数学独立性检验

独立性检验是统计学中用于判断两个或多个随机变量之间是否存在关联关系的一种方法。
它通常用于假设检验中,以确定观察到的数据是否支持某个假设。
常用的独立性检验方法包括卡方检验、Fisher精确检验、列联表分析等。
其中,卡方检验是最常用的一种方法,适用于分类变量之间的独立性检验。
它通过计算观察频数与期望频数之间的差异,来判断两个分类变量之间是否存在关联关系。
在进行独立性检验时,需要先提出一个原假设和一个备择假设。
原假设通常表示两个随机变量之间不存在关联关系,而备择假设则表示它们之间存在关联关系。
然后,根据样本数据计算出观察频数和期望频数,并计算它们的卡方值。
最后,根据卡方值和自由度的大小,来决定是否拒绝原假设。
独立性检验在各个领域都有广泛的应用,例如医学、社会科学、经济学等。
它可以用来分析因果关系、控制实验误差、预测未来趋势等。
独立性检验教案-高二上学期数学人教B版(2019)选择性必修第二册

【课题】独立性检验
【温故知新】事件A与B独立的充要条件:。
【知识展示】如果随机事件A与B的样本数据的2X2列联表如下
A A总计
B a b a+b
B̅ c d c+d
总计a+c b+d a+b+c+d
独立性检验:
利用随机变量χ2=
n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)
(其中n=a+b+c+d为样本容量)
来判断“两个变量有关系”的方法称为独立性检验.
【典例分析】教材P115 例1.2
【课堂检测】
高铁、网购、移动支付和共享单车被誉为中国的“新四大发明”,彰显出中国式创新的强劲活力.某移动支付公司从我市移动支付用户中随机抽取100名进行调查,得到如下数据:
(1)把每周使用移动支付超过3次的用户称为“移动支付活跃用户”,请完成下列2×2列联表,并判断能否在犯错误的概率不超过0.005的前提下,认为是
否为“移动支付活跃用户”与性别有关?
(2)把每周使用移动支付6次及6次以上的用户称为“移动支付达人”,视频率为概率,在我市所有“移动支付达人”中随机抽取4名用户.
①求抽取的4名用户中,既有男“移动支付达人”,又有女“移动支付达人”的概率;
②为了鼓励男性用户使用移动支付,对抽出的男“移动支付达人”每人奖励300元,记奖励总金额为X,求X的分布列及数学期望.
附公式及表如下:
K2=n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)。
独立性检验基本思想及应用

独立性检验基本思想及应用独立性检验是一种用于确定两个变量之间是否存在关联的统计方法。
其基本思想是通过比较观察到的数据与预期的数据之间的差异来推断这两个变量之间的关系。
独立性检验的应用非常广泛。
在社会科学中,独立性检验常被用于研究两个分类变量之间是否存在关联,例如性别和职业、教育水平和政治倾向等。
在医学研究中,独立性检验也可以用来检查某种治疗方法是否与疾病的发展有关,以及风险因素和某种疾病之间的关系。
此外,独立性检验还被广泛应用于市场调查、品牌定位以及质量控制等领域。
独立性检验的基本思想是建立一个零假设(H0)和一个备择假设(H1)。
零假设认为两个变量是独立的,即它们之间没有关联;备择假设则认为两个变量之间存在关联。
独立性检验的步骤可以分为以下几步:1. 收集数据:需要收集两个分类变量的数据,例如通过问卷调查或观察获得数据。
2. 建立列联表:将数据整理成列联表形式,列联表是一种用于描述两个或多个分类变量之间关系的矩阵。
表格的行表示一个变量的不同类别,列表示另一个变量的不同类别,表格中的每个单元格表示两个类别的交叉数量。
3. 计算期望频数:在独立性检验中,我们假设两个变量是独立的,因此可以基于各类别的边际总数以及样本总数来计算期望频数。
期望频数是在两个变量独立情况下,各个类别的交叉数量。
4. 计算卡方统计量:卡方统计量用于衡量观察到的数据与期望数据之间的差异程度。
计算公式为:χ2 = Σ((观察频数- 期望频数)^2 / 期望频数)。
其中,Σ表示对所有单元格进行求和。
5. 设定显著性水平:显著性水平α为决策的临界点,用于决定是否拒绝零假设。
通常,α的常见选择为0.05或0.01。
6. 判断和解释结果:根据计算出的卡方统计量与临界值进行比较,如果计算出的卡方值大于临界值,拒绝零假设,认为两个变量之间存在关联;反之,接受零假设,认为两个变量是独立的。
独立性检验的结果常常以卡方统计量和p值的形式呈现。
p值是在零假设成立的条件下,观察到的数据与期望数据之间差异的概率。
独立性检验课件

独立性检验课件独立性检验课件独立性检验是统计学中一种常用的方法,用于确定两个或多个分类变量之间是否存在关联或独立性。
在实际应用中,独立性检验可以帮助我们了解两个变量之间的关系,从而为决策和预测提供依据。
本课件将介绍独立性检验的基本概念、常见方法和实际应用。
一、独立性检验的基本概念独立性检验是一种用于检验两个或多个分类变量之间是否存在关联的统计方法。
在独立性检验中,我们通常使用卡方检验来判断两个变量之间的关系。
卡方检验是一种非参数检验方法,不需要对数据的分布做出假设。
在进行独立性检验之前,我们首先需要明确两个变量的测量尺度,通常可以分为名义尺度和有序尺度。
名义尺度的变量是分类变量,没有顺序关系,例如性别、地区等;有序尺度的变量是有一定顺序关系的分类变量,例如教育程度、收入水平等。
二、常见的独立性检验方法1. 卡方检验卡方检验是一种常用的独立性检验方法,用于判断两个分类变量之间是否存在关联。
卡方检验的原理是比较实际观察值与理论期望值之间的差异,通过计算卡方统计量来判断差异是否显著。
卡方检验的步骤包括:建立原假设和备择假设、计算卡方统计量、确定临界值和拒绝域、比较计算值与临界值。
如果计算值大于临界值,则拒绝原假设,认为两个变量之间存在关联。
2. Fisher精确检验Fisher精确检验是一种用于小样本独立性检验的方法,适用于样本量较小或理论期望值较低的情况。
Fisher精确检验通过计算超几何分布的概率来判断两个变量之间的关系。
Fisher精确检验的步骤包括:建立原假设和备择假设、计算超几何分布的概率、确定显著性水平和拒绝域、比较计算值与临界值。
如果计算值小于临界值,则拒绝原假设,认为两个变量之间存在关联。
三、独立性检验的实际应用独立性检验在实际应用中具有广泛的应用价值。
以下是一些常见的实际应用场景:1. 市场调研市场调研是企业决策的重要环节,独立性检验可以帮助企业了解不同市场细分之间的关系。
例如,一家手机厂商想要了解不同性别消费者对手机品牌的偏好是否存在差异,可以通过独立性检验来判断两个变量之间是否存在关联。
高中数学选修2-3-独立性检验的基本思想及初步应用

独立性检验的基本思想及初步应用知识集结知识元独立性检验知识讲解1.独立性检验【知识点的知识】1、分类变量:如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.2、原理:假设性检验(类似反证法原理).一般情况下:假设分类变量X和Y之间没有关系,通过计算K2值,然后查表对照相应的概率P,发现这种假设正确的概率P很小,从而推翻假设,最后得出X和Y之间有关系的可能性为(1﹣P),也就是“X和Y有关系”.(表中的k就是K2的观测值,即k=K2).其中n=a+b+c+d(考试给出)3、2×2列联表:4、范围:K2∈(0,+∞);性质:K2越大,说明变量间越有关系.5、解题步骤:(1)认真读题,取出相关数据,作出2×2列联表;(2)根据2×2列联表中的数据,计算K2的观测值k;(3)通过观测值k与临界值k0比较,得出事件有关的可能性大小.例题精讲独立性检验例1.'新高考方案的实施,学生对物理学科的选择成了焦点话题.某学校为了了解该校学生的物理成绩,从A,B两个班分别随机调查了40名学生,根据学生的某次物理成绩,得到A班学生物理成绩的频率分布直方图和B班学生物理成绩的频数分布条形图.(Ⅰ)估计A班学生物理成绩的众数、中位数(精确到0.1)、平均数(各组区间内的数据以该组区间的中点值为代表);(Ⅱ)填写列联表,并判断是否有99.5%的把握认为物理成绩与班级有关?附:;'例2.'党的第十九次全国代表大会上,习近平总书记指出:“房子是用来住的,不是用来炒的”,为了使房价回归到收入可支撑的水平,让全体人民住有所居,近年来全国各一、二线城市打击投机购房,陆续出台了住房限购令,某市一小区为了进一步了解已购房民众对市政府出台楼市限购令的认同情况,随机抽取了本小区50户住户进行调查,各户人平均月收入(单位:千元)的户数频率分布直方图如图,其中赞成限购的户数如表:(1)若从人平均月收入在[9,11)的住户中再随机抽取两户,求所抽取的两户至少有一户赞成楼市限购令的概率;(2)若将小区人平均月收入不低于7千元的住户称为“高收入户”,人平均月收入低于7千元的住户称为“非高收入户”,根据已知条件完成如图所给的2×2列联表,并说明能否在犯错误的概率不超过0.01的前提下认为“收入的高低”与“赞成楼市限购令”有关.附:临界值表参考公式:K2=,n=a+b+c+d.'例3.'2022年北京冬季奥运会即第24届冬季奥林匹克运动会将在2022年2月4日至2月20日在北京和张家口举行.某研究机构为了了解大学生对冰壶运动的兴趣,随机从某大学学生中抽取了120人进行调查,经统计男生与女生的人数比为11:13,男生中有30人表示对冰壶运动有兴趣,女生中有15人对冰壶运动没有兴趣.(1)完成2×2列联表,并判断能否有99%的把握认为“对冰壶运动是否有兴趣与性别有关”?(2)用分层抽样的方法从样本中对冰壶运动有兴趣的学生中抽取8人,求抽取的男生和女生分别为多少人?若从这8人中选取两人作为冰壶运动的宜传员,求选取的2人中恰好有1位男生和1位女生的概率.附:K2=,其中n=a+b+c+d.'。
人教版高中选修2-33.2独立性检验的基本思想及其初步课程设计

人教版高中选修2-33.2独立性检验的基本思想及其初步课程设计一、独立性检验概述在概率论和数理统计中,独立性检验是指检验两个离散随机变量之间是否独立的方法。
在实际问题中,常常需要研究两个随机变量之间的关系,是否存在关联。
例如,对于一个大学招生的案例,一个人的高中成绩和大学录取情况可以是两个随机变量,我们需要使用独立性检验来判断这两个随机变量是否有关联。
二、独立性检验方法独立性检验方法有很多种,其中最常用的是卡方检验。
2.1 卡方检验卡方检验是一种统计检验方法,用于检验分类资料之间的独立性。
它的基本思想是,将观察结果与理论期望作比较,确定两者之间是否有显著差异来判断两个随机变量之间是否独立。
卡方检验的基本步骤包括:1.假设零假设为两个随机变量独立,对这个假设建立尽可能充分的理论模型。
2.将实际观察值与理论值进行比较,计算出统计量。
3.利用卡方分布表来获得临界值,以判断是否拒绝零假设。
2.2 其他方法在实际应用中,除了卡方检验,还有很多独立性检验的方法。
例如,t检验中的独立样本t检验,ANOVA中的多元卡方检验等等。
这些方法在不同的领域和场合有不同的应用。
三、课程设计建议针对高中选修2-33.2独立性检验,可以设计以下课程教学内容:3.1 概念讲解在课程开头,可以先为学生介绍独立性检验的基本概念,包括随机变量、独立性、检验方法等。
这部分内容可以通过举例子、讲解理论、使用模拟仿真等方式进行,让学生对独立性检验有一个初步的认识。
3.2 卡方检验的具体操作在学生掌握了基本概念之后,可以进一步教授卡方检验的具体操作方法。
在讲解过程中,教师可采取课堂讲解方式,为学生演示计算过程和判断方法。
并且可以为学生演示如何使用统计软件完成卡方检验。
同时,为了让学生更好的掌握卡方检验的操作,可以设计一些实际案例,让学生进行计算和判断实验。
3.3 讨论与总结在课程结束时,可以组织学生进行小组讨论和总结。
讨论的主题可以是卡方检验的应用与展望,或是针对课程内容的总结与反思。
独立性检验的基本思想及其初步应用

间有关系吗?为什么?
17
解:在假设K“2 性别与是否喜欢数学课程之间没有关系” 的前提下,K应2 该很小,并且
P(K 2 3.841) 0.05
而我们所得到的 K的2 观测值 k 超4过.5134.841,这就 意味着“性别与是否喜欢数学课程之间有关系”这一结论 是错误的可能性约为0.05,即有95%的把握认为“性别与 是否喜欢数学课程之间有关系”。
❖ 1、早期皮肌炎患者,还往往伴 有全身不适症状,如-全身肌肉酸 痛,软弱无力,上楼梯时感觉两 腿费力;举手梳理头发时,举高 手臂很吃力;抬头转头缓慢而费 力。
已知在 H0成立的情况下,
P(K 2 6.635) 0.010
即在 H0 成立的情况下,K 2大于6.635概率非常小, 近似为0.010
18
练习: ( P17 )
甲乙两个班级进行一门考试,按照学生考试成绩优秀和 不优秀统计后,得到如下列联表:
甲班 乙班 总计
优秀 10 7 17
不优秀 35 38 73
总计 45 45 90
画出列联表的条形图,并通过图形判断成绩与班级是否 有关.利用列联表的独立性检验估计,认为“成绩与班级 有关系”犯错误的概率是多少。
Байду номын сангаас
ad - bc 越大,说明吸烟与患肺癌之间的关系越强
引入一个随机变量:卡方统计量
K2
a
nad bc2 bc d a cb
d
其中n a b c d
作为检验在多大程度上可以认为“两个变量
有关系”的标准 。
9
吸烟 不吸烟
吸烟与患肺癌列联表
患肺癌 不患肺癌 总计
49
2099
2148
42
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【阅卷人点拨】通过阅卷后分析,对解答本题的失分警示和解题启示总结如 下:(注:此处的①②见规范解答过程).
在解答过程中,若①处和②处插入表格处表中数据
分类变量有关系”.
【典例训练】 1.(2012·武汉高二检测)在独立性检验中,若随机变量K2的观测值k≥6.635,则 () (A)X与Y有关系,犯错的概率不超过1% (B)X与Y有关系,犯错的概率超过1% (C)X与Y没有关系,犯错的概率不超过1% (D)X与Y没有关系,犯错的概率超过1%
2.(2012·厦门高二检测)在对人们休闲方式的一次调查中,共调查120人,其中 女性70人、男性50人.女性中有40人主要的休闲方式是看电视,另外30人主要 的休闲方式是运动;男性中有20人主要的休闲方式是看电视,另外30人主要 的休闲方式是运动. (1)根据以上数据建立一个2×2的列联表; (2)休闲方式与性别是否有关?
而2.706<703.45209<630.84610,
7
因为P(K2>2.706)≈0.10,P(K2>3.841)≈0.05,
所以,在犯错误的概率不超过0.10的前提下,认为休闲方式与
性别有关.
【思考】1.求k的值的关键是什么? 2.k的大小对“两个变量有关”有什么影响? 提示:1.求K2的观测值k的关键是要准确列出2×2列联表,即找准表达式中的 各个量的数值. 2.利用K2的观测值进行独立性检验可以精确地给出这种判断的可靠程度,而 且k的值越大,说明“X与Y有关系”成立的可能性越大.
2.独立性检验与反证法的异同点 独立性检验的思想来自于统计学的假设检验思想,它与反证法类似,假设检 验和反证法都是先假设结论不成立,然后根据是否能够推出“矛盾”来断定 结论是否成立.但二者“矛盾”的含义不同,反证法中的“矛盾”是指不符合 逻辑的事件的发生;而假设检验中的“矛盾”是指不符合逻辑的小概率事件 的发生,即在结论不成立的假设下,推出利用结论成立的小概率事件的发生.
2.列联表中|ad-bc|的值与两个分类变量之间相关的强弱有什么关系? 提示:在列联表中,若两个分类变量没有关系,则|ad-bc| ≈0,所以|ad-bc|的值越小,两个分类变量之间的关系越弱;|ad-bc| 的值越大,两个分类变量之间的关系越强.
3.作散点图的主要目的是_______. 【解析】散点图可以形象地展示两个变量之间的关系,所以它的主要目的就 是直观了解两个变量之间的关系. 答案:直观了解两个变量之间的关系
系,那么这种判断出错的可能性为_______.
2.为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据 如下:甲在生产现场时,990件产品中有合格品982件,次品8件;甲不在生 产现场时,510件产品中有合格品493件,次品17件.试分别用列联表、等高条 形图、独立性检验的方法分析监督员甲对产品质量好坏有无影响.能否在犯错 误的概率不超过0.001的前提下,认为质量监督员甲是否在生产现场与产品质 量有关?
独立性检验的综合应用 【技法点拨】
判断两个变量是否有关的三种方法
列联 表法
数形 结合 法
c 利用列联表,列出2×2列联表,从 c+d 和
a 的大小比较或 ad-bc 的大小进行判断. a +b
利用数形结合,画出等高条形图,从对应面积 的比例粗略估计.
K2观 测值法
利用K2的观测值公式求出K2的观测值k,借助 临界值表准确地判断“X与Y是否有关系”.
等高条形图的应用
【技法点拨】
1.判断两个分类变量是否有关系的两个常用方法
(1)利用数形结合思想,借助等高条形图来判断两个分类变量
是否相关是判断变量相关的常见方法.
(2)一般地,在等高条形图中, 与 相差越大,两个分
类变量有关系的可能性就越大.
a
c
ab cd
2.利用等高条形图判断两个分类变量是否相关的步骤
990 510 1 500
相差较大,可在某种程度上认为“质量监督员甲是否在现场与
产品质量有关系”.
(2)画等高条形图. 如图可知,在某种程度上认为“质量监督员甲是否在生产现场与产品质量有 关系”.
(3)由2×2列联表中数据,计算得到K2的观测值为
k 1 500 (98217 493因此8),2 在1犯3.错09误7 的 10.828, 概率不超99过00.501001的1前4提75下 2,5认为质量监督员甲在不在生产现
4.若由一个2×2列联表中的数据计算得K2的观测值k=4.013,则认为“两个变 量有关系”犯错误的概率不超过_______. 【解析】∵P(K2≥3.841)≈0.05, ∴认为“两个变量有关系”犯错误的概率不超过0.05. 答案:0.05
1.对于“分类变量”的理解 (1)这里的“变量”和“值”都应作为“广义”的变量和值进行理解.例如,对 于性别变量,其取值为男和女两种.那么这里的变量指的是性别,同样这里的 “值”指的是“男”和“女”.因此,这里所说的“变量”和“值”不一定取 的是具体的数值.
【解析】1.根据独立性检验的思想,假设没关系正确的可能性为5%,所 以,判断有关系错误的可能性也为5%. 答案:5%
2.(1)2×2列联表如下:
合格品数 次品数 总计
甲在生产现场
982
8
甲不在生产现场 493
17
由列联表可得|总ad计-bc|=|982×171-44973×58|=12 72550.
2.作列联表如下:
考前心情紧张 考前心情不紧张
总计
性格内向 332 94 426
性格外向 213 381 594
总计 545 475 1 020
相应的等高条形图如图所示,
图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图 中可以看出,考前紧张的样本中性格内向占的比例比考前心情不紧张样本中 性格内向占的比例高,可以认为考前紧张与性格类型有关.
1.2 独立性检验的基本思想及其初步应用
1.掌握2×2列联表的独立性检验,能利用给出的数据列出列联表并会求K2的 观测值. 2.了解独立性检验的基本思想和方法.
1.本节课的重点是理解独立性检验的基本思想及实施步骤. 2.本节课的难点是了解随机变量K2的含义和根据K2的值得出结论的意义.
1.分类变量 变量的不同“值”表示个体所属的_____不,同像类这别样的变量
【典例训练】 1.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体 数据如下表:
专业 性别
男
女
非统计专业 13 7
统计专业 10 20
为了判断主修统计专业是否与性别有关系,根据表中的数据,
得到 k 50(13 20 10 7)2 4.844 因为P(k≥3.8412)3=0.2075, 2所0以 3判0定主修统计专业与性别有关
【典例训练】 1.从发生交通事故的司机中抽取2 000名司机作随机样本,根据他们血液中是 否含有酒精以及他们是否对事故负有责任将数据整理如下:
有酒精 无酒精
总计
有责任 650 700
1 350
无责任 150 500 650
总计 800 1 200 2 000
相应的等高条形图如图所示.试结合等高条形图分析血液中含有酒精与对事故 负有责任是否有关系.
失 ① 填写错误,会直接导致合计出错,也会直接导致k值
分
求错,这种情况最多给3分.
警
在解答中,若③处公式记混,会导致k值出错,使得
示 ② 独立性检验出错,这种情况,只能给第(1)问的分数
6分
解 (1)错误填写2×2列联表,导致出错; 题
(2)记准K2的计算公式,不至于因错记公式而出错; 启
示 (3)正确回答独立性检验的结论.
【归纳】等高条形图的作法及作用小结. 提示:1.首先作2×2列联表,注意对涉及的变量分清类别;其次要注意计算的准 确性;第三画等高条形图,注意各变量的顺序与所画位置. 2.通过等高条形图可以粗略地判断两个分类变量是否有关系,但无法精确地 给出所得结论的可靠程度.
独立性检验 【技法点拨】
解决一般的独立性检验问题的步骤
3.判断两个分类变量是否有关系的两种方法比较 判断两个分类变量是否有关系的两种方法是:等高条形图和独立性检验. (1)通过等高条形图,可以粗略地判断两个分类变量是否有关系,但是这种判 断无法精确地给出所得结论的可靠程度. (2)利用独立性检验来判断两个分类变量是否有关系,能够精确地给出这种判 断的可靠程度,也常与图形分析法结合.
3.独立性检验
(1)定义:利用随机变量K2来判断“两个分类变量有关系”的
方法称为两个分类变量的独立性检验.
(2)公式:K2=
.其中n=_____.
______n(_ad__bc_)2
a+b+c+d
(a b)(c d)(a c)(b d)
1.在独立性检验中,计算得k=29.78,在判断变量相关时,P(K2≥6.635)≈0.01的 含义是什么? 提示:P(K2≥6.635)≈0.01的含义是在犯错误的概率不超过0.01的前提下认为 两个变量相关.
【规范训练】(12分)(2012·大庆高二检测)调查在2~3级风时
的海上航行中男女乘客的晕船情况,共调查了71人,其中女性
(1)将下面的2×2列联表补充完整;
出 生 时
性别 间 男婴 女婴 总计
晚上
白天
总计
(2)能否在犯错误的概率不超过0.1的前提下认为婴儿性别与出生时间有关系?
P(K2≥k) k
0.15 2.072
K2
n(ad bc)2
(a b)(c d)(a c)(b d)
0.10 0.05 2.706 3.841