数学:第一章《统计案例》教案(新人教A版选修1-2)

合集下载

【数学】新课标人教A版选修1-2第一章统计案例教案

【数学】新课标人教A版选修1-2第一章统计案例教案

4
选修 1—2 第一章统计案例
若H0成立 , 则K2应该很小 . 把表中数据代入公式
2
K2 = 9965 7775 49-42 2099
56.632
7817 2148 9874 91
在H0成立的情况下 . 统计学家估算出如下概率
P K2 6.635 0.01
即在H0成立的情况下 ,K 2的值大于 6.635 的概率非常小. 如果K2 6.635, 就断定H 0不成立 , 出错的可能性有多大? 出现K2=56.632 6.635 的概率不超过 1% .
周围 .
令 z=lny , a=lnc1 , b=c2 则 z=bx+a
此时可用线性回归来拟合 z=0.272x-3.843
因此红铃虫的产卵数对温度的非线性回归方程为 Y=e0.272x-3.843
1、1 回归分析的基本思想及其初步应用(习题课) (第五课时 )
目标 :通过习题巩固所学知识
过程 :1、复习有关知识
教学重点: 独立性检验的步骤。 例 2。 教学难点: 对临界值的理解。 教学过程 :1、复习独立性检验的步骤。
2、可信程度。 3、举例。 例 2。略。 补充例题: 对 196 个接受心脏搭桥手术的病人和 196 个接受血管清 障手术的病人进行 3 年跟踪研究, 调查他们是否又发作过心脏病, 调查结果如下 表所示:
尿汞含量 x
2
消光系数 y
64
4
6
8
10
138
205
285
360
连山高级中学高二数学备课组
3
选修 1—2 第一章统计案例
(1)求回归方程。( 2)求相关指数 R2。
解:略 。
3. 练习:选择、填空用小黑板给出。 (题来源于数学天地报) 。 4. 小结。 5. 作业。

高中数学人教版选修1-2全套教案

高中数学人教版选修1-2全套教案

高中数学人教版选修1-2全套教案第一章统计案例第一课时 1.1回归分析的基本思想及其初步应用(一)教学目标1、知识与技能目标 认识随机误差;2、过程与方法目标(1)会使用函数计算器求回归方程; (2)能正确理解回归方程的预报结果. 3、情感、态度、价值观通过本节课的学习,加强数学与现实生活的联系,以科学的态度评价两个变量的相关性,理解处理问题的方法,形成严谨的治学态度和锲而不舍的求学精神.培养学生运用所学知识,解决实际问题的能力.教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性.教学重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法-相关指数和残差分析. 教学难点:解释残差变量的含义,了解偏差平方和分解的思想. 教学过程: 一、复习准备:1. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?2. 复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预报. 二、讲授新课: 1. 教学例题:① 例1 从某大学中随机选取8名女大学生,其身高和体重数据如下表所示: 编 号 1 2 3 4 5 6 7 8 身高/cm165165 157 170 175 165 155 170 体重/kg 4857505464614359求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm 的女大学生的体重. (分析思路→教师演示→学生整理)第一步:作散点图第二步:求回归方程 第三步:代值计算010203040506070150155160165170175180身高/cm体重/k g② 提问:身高为172cm 的女大学生的体重一定是60.316kg 吗? 不一定,但一般可以认为她的体重在60.316kg 左右. ③ 解释线性回归模型与一次函数的不同事实上,观察上述散点图,我们可以发现女大学生的体重y 和身高x 之间的关系并不能用一次函数y bx a =+来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系). 在数据表中身高为165cm 的3名女大学生的体重分别为48kg 、57kg 和61kg ,如果能用一次函数来描述体重与身高的关系,那么身高为165cm 的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果e (即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型y bx a e =++,其中残差变量e 中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.2. 相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.3. 小结:求线性回归方程的步骤、线性回归模型与一次函数的不同.第二课时 1.1回归分析的基本思想及其初步应用(二)教学目标:1知识与技能:会建立回归模型,进而学习相关指数(相关系数r 、总偏差平方和、随机误差的效应即残差、残差平方和、回归平方和、相关指数R2、残差分析) 2过程与方法:通过学习会求上述的相关指数3情感态度价值观:从实际问题发现已有知识不足,激发好奇心、求知欲。

人教版A版高中数学选修1-2课后习题解答

人教版A版高中数学选修1-2课后习题解答

人教版A版高中数学选修1-2课后习题解答高中数学选修1-2课后题答案第一章统计案例1.1 回归分析的基本思想及其初步应用回归分析是一种统计分析方法,用于探究自变量与因变量之间的关系。

它的基本思想是通过建立数学模型,利用已知数据进行拟合,从而预测或解释未知数据。

回归分析的初步应用包括简单线性回归和多元线性回归。

1.2 独立性检验的基本思想及其初步应用独立性检验是一种用于检验两个变量之间是否存在关联的方法。

其基本思想是通过观察两个变量之间的频数或频率分布,来判断它们是否相互独立。

独立性检验的初步应用包括卡方检验和Fisher精确检验。

第二章推理证明2.1 合情推理与演绎推理合情推理是指根据已知事实和常识,推断出可能的结论。

演绎推理是指根据已知的前提和逻辑规则,推导出必然的结论。

两种推理方法都有其适用的场合,需要根据具体情况进行选择。

2.2 直接证明与间接证明直接证明是指通过逻辑推理,直接证明所要证明的命题成立。

间接证明是指采用反证法或归谬法,证明所要证明的命题的否定不成立,从而推出所要证明的命题成立。

第三章数系的扩充与复数的引入3.1 数系的扩充与复数的概念数系的扩充是指在实数系的基础上引入新的数,使得一些原来不可解的方程可以得到解。

复数是指由实部和虚部组成的数,可以表示在平面直角坐标系中的点。

复数的引入扩充了数系,使得一些原本无解的方程可以得到解。

3.2 复数的代数形式的四则运算复数的代数形式是指将复数表示为实部和虚部的和的形式。

复数的四则运算包括加减乘除四种运算,可以通过对实部和虚部分别进行运算来得到结果。

第四章框图4.1 流程图流程图是一种用图形表示算法或过程的方法。

它由各种基本符号和连线构成,用于描述算法或过程的各个步骤及其执行顺序。

流程图可以帮助人们更好地理解算法或过程,从而提高效率。

4.2 结构图结构图是一种用于描述程序结构的图形表示方法。

它包括顺序结构、选择结构和循环结构三种基本结构,可以用来表示程序的控制流程。

数学选修1-2目录

数学选修1-2目录

数学选修1-2目录第一章统计案例
1.1 统计案例的引入
1.2 统计案例的分析与解读
1.3 统计案例的实践应用
1.4 典型案例研究
第二章推理与证明
2.1 推理的基本概念
2.2 演绎推理与归纳推理
2.3 合情推理与类比推理
2.4 数学证明的基本方法
2.5 经典数学问题证明实例
第三章数系的扩充
3.1 数系的历史发展
3.2 实数系的扩充
3.3 复数系的引入
3.4 数系扩充的意义与应用
第四章复数的引入
4.1 复数的历史背景
4.2 复数的定义与性质
4.3 复数的运算
4.4 复数在几何中的应用
4.5 复数在物理与工程领域的应用
第五章流程图
5.1 流程图的基本概念
5.2 流程图的绘制方法
5.3 流程图在数学问题解决中的应用
5.4 流程图在其他学科与日常生活中的应用
第六章结构图
6.1 结构图的基本概念
6.2 结构图的绘制技巧
6.3 结构图在数学知识体系中的应用
6.4 结构图在其他领域的应用与案例分析
此文档仅作为目录框架,详细内容需要根据实际教学材料和学生需求进行补充和完善。

高中数学选修1-2第一章课后习题解答

高中数学选修1-2第一章课后习题解答

新课程标准数学选修1—2第一章课后习题解答第一章统计案例1.1回归分析的基本思想及其初步应用练习(P8)1、画散点图的目的是通过变量的散点图判断两个变量更近似于什么样的函数关系,以确定是否直接用线性回归模型来拟合原始数据.说明:学生在对常用的函数图象比较了解的情况下,通过观察散点图可以判断两个变量的关系更近似于哪种函数.2、分析残差可以帮助我们解决以下两个问题:(1)寻找异常点,就是残差特别大的点,考察相应的样本数据是否有错.(2)分析残差图可以发现模型选择是否合适.说明:分析残差是回归诊断的一部分,可以帮助我们发现样本数据中的错误,分析模型选择是否合适,是否有其他变量需要加入到模型中,模型的假设是否正确等. 本题只要求学生能回答上面两点即可,主要让学生体会残差和残差图可以用于判断模型的拟合效果.3、(1)解释变量和预报变量的关系式线性函数关系.R=.(2)21说明:如果所有的样本点都在一条直线上,建立的线性回归模型一定是该直线,所以每个=+,没有随机误差项,是严样本点的残差均为0,残差平方和也为0,即此时的模型为y bx aR=.格的一次函数关系. 通过计算可得21习题1.1 (P9)1、(1)由表中数据制作的散点图如下:从散点图中可以看出GDP值与年份近似呈线性关系.y表示GDP值,t表示年份. 根据截距和斜率的最小二乘计算公式,得(2)用tˆ14292537.729a≈-,ˆ7191.969b≈从而得线性回归方程ˆ7191.96914292537.729=-.y t残差计算结果见下表.GDP 值与年份线性拟合残差表(年实际GDP 值为117251.9,所以预报与实际相差4275.540-.(4)上面建立的回归方程的20.974R =,说明年份能够解释约97%的GDP 值变化,因此所建立的模型能够很好地刻画GDP 和年份的关系.说明:关于2003年的GDP 值的来源,不同的渠道可能会有所不同.2、说明:本题的结果与具体的数据有关,所以答案不唯一.3、由表中数据得散点图如下:从散点图中可以看出,震级x 与大于或等于该震级的地震数N 之间不呈线性相关关系,随着x 的减少,所考察的地震数N 近似地以指数形式增长. 做变换lg y N =,得到的数据如下表所示.x 和y 的散点图如下:从这个散点图中可以看出x 和y 之间有很强的线性相关性,因此可以用线性回归模型拟合它们之间的关系. 根据截距和斜率的最小二乘计算公式,得ˆ 6.704a≈,ˆ0.741b ≈-, 故线性回归方程为 ˆ0.741 6.704y x =-+. 20.997R ≈,说明x 可以解释y 的99.7%的变化.因此,可以用回归方程 0.741 6.704ˆ10x N-+= 描述x 和N 之间的关系. 1.2独立性检验的基本思想及其初步应用练习(P15)列联表的条形图如图所示.由图及表直观判断,好像“成绩优秀与班级有关系”. 因为2K 的观测值0.653 6.635k ≈<,由教科书中表1-11克重,在犯错误的概率不超过0.01的前提下,不能认为“成绩与班级有关系”.说明:(1)教师应要求学生画出等高条形图后,从图形上判断两个分类变量之间是否有关系. 这里通过图形的直观感觉的结果可能会出错.(2)本题与例题不同,本题计算得到的2K 的观测值比较小,所以没有理由说明“成绩优秀与班级有关系”. 这与反证法也有类似的地方,在使用反证法证明结论时,假设结论不成立的条件下如果没有推出矛盾,并不能说明结论成立也不能说明结论不成立. 在独立性检验中,没有推出小概率事件发生类似于反证法中没有推出矛盾.习题1.2 (P16)1、假设“服药与患病之间没有关系”,则2K 的值应该比较小;如果2K 的值很大,则说明很可能“服药与患病之间没有关系”. 由列联表中数据可得2K 的观测值 6.110 5.024k ≈>,而由教科书表1-11,得2( 5.024)0.025P K ≥≈,所以在犯错误的概率不超过0.025的前提下可以认为“服药与患病之间有关系”. 又因为服药群体中患病的频率0.182小于没有服药群体中患病的频率0.400,所以“服药与患病之间关系”可以解释为药物对于疾病有预防作用. 因此在犯错误的概率不超过0.025的前提下,可以认为药物有效.说明:仿照例1,学生很容易完成此题,但希望学生能理解独立性检验在这里的具体含义,即“服药与患病之间关系”可以解释为“药物对于疾病有预防作用”.2、如果“性别与读营养说明之间没有关系”,由题目中所给数据计算,得2K 的观测值为8.416k ≈,而由教科书中表1-11知2(7.879)0.005P K ≥≈,所以在犯错误的概率不超过0.005的前提下认为“性别与读营养说明之间有关系”.3、说明:需要收集数据,所有没有统一答案. 第一步,要求学生收集并整理数据后得到列联表;第二步,类似上面的习题做出判断.4、说明:需要从媒体上收集数据,学生关心的问题不同,收集的数据会不同. 第一步,要求学生收集并整理数据后得到列联表;第二步,类似上面的习题做出判断.第一章 复习参考题A 组(P19)根据散点图,可以认为中国人口总数与年份呈现很强的线性相关关系,因此选用线性回归模型建立回归方程.由最小二乘法的计算公式,得 2095141.503a ≈-,1110.903b ≈,则线性回归方程为 ˆ1110.9032095141.503yx =-. 由2R 的计算公式,得 20.994R ≈,明线性回归模型对数据的拟合效果很好.根据回归方程,,预计2003年末中国人口总数约为129997万人,而实际情况为129227万人,预测误差为770万人;预计2004年末中国人口总数约为131108万人,而实际情况为129988万人,预测误差为1120万人.说明:数据来源为《中国统计年鉴》(2003). 由于人数为整数,所以预测的数据经过四舍五入的取整运算.2、(1)将销售总额作为横轴,利润作为纵轴,根据表中数据绘制散点图如下:由于散点图中的样本点基本上在一个带形区域内分布,猜想销售总额与利润之间呈现线性相关关系.(2)由最小二乘法的计算公式,得 ˆ1334.5a≈,ˆ0.026b ≈, 则线性回归方程为 ˆ0.0261334.5yx =+ 其残差值计算结果见下表:(3)对于(2)中所建立的线性回归方程,20.457R ≈,说明在线性回归模型中销售总额只能解释利润变化的46%,所以线性回归模型不能很好地刻画销售总额和利润之间的关系. 说明:此题也可以建立对数模型或二次回归模型等,只要计算和分析合理,就算正确.3、由所给数据计算得2K 的观测值为 3.689k ≈,而由教科书中表1-11知2( 2.706)0.10P K ≥=所以在犯错误的概率不超过0.10的前提下认为“婴儿的性别与出生的时间有关系”.第一章 复习参考题B 组(P19)1、因为 21(,)()ni i i Q a b y a bx ==--∑21(()())n i i i y bx y bx a y bx ==--+--+∑ 2211()()n n i i i i y bx y bx a y bx ===--++-+∑∑12()()ni i i y bx y bx a y bx =---+-+∑ 并且221()()n i a y bx n a y bx =-+=-+∑,12()()n i i i y bx y bx a y bx =--+-+∑ 1()(())ni i i a y bx y bx ny nbx ==-+--+∑ ()()0a y b x n y n b xn y n b x=-+--+= 所以 221(,)()()ni i i Q a b y bx y bx n a y bx ==--++-+∑.考察上面的等式,等号右边的求和号中不包含a ,而另外一项非负,所以ˆa和ˆb 必然使得等号右边的最后一项达到最小值,即 ˆˆ0ay bx -+=, 即ˆˆy a bx =+. 2、总偏差平方和21()n i i y y =-∑表示总的效应,即因变量的变化效应;残差平方和21ˆ()ni i y y =-∑表示随机误差的效应,即随机误差的变化效应;回归平方和21ˆ()ni yy =-∑表示表示变量的效应,即自变量的变化效应. 等式 222111ˆˆ()()()n n n i ii i i y y y y y y ===-=-+-∑∑∑ 表示因变量的变化总效应等于随机误差的变化效应与自变量的变化效应之和.3、说明:该题主要是考察学生应用回归分析模型解决实际问题的能力,解答应该包括如何获取数据,如何根据散点图寻找合适的模型去拟合数据,以及所得结果的解释三方面的内容.。

高中数学选修1-2课程纲要

高中数学选修1-2课程纲要

高中数学选修1-2课程纲要课程名称:高中数学选修1-2课程类型:文科选修教学材料:人民教育出版社高中数学选修1-2授课时间:30—35课时授课教师:郑州市第十九中学张振授课对象:郑州市第十九中学高二(11)(12)班课程目标:1.统计案例①通过对典型案例(如“肺癌与吸烟有关吗”)的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用。

②通过对典型案例(如“质量控制”、“新药是否有效”)的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用。

③通过对典型案例(如“昆虫分类”)的探究,了解聚类分析的基本思想、方法及其初步应用。

④通过对典型案例(如“学习成绩与学习时间的关系”)的探究,了解回归的基本思想、方法及其初步应用。

2.推理和证明⑴合情推理与演绎推理①结合已学过的数学实例和生活中的实例,了解合情推理的含义,能利用归纳和类比等进行简单的推理,体会并认识合情推理在数学发现中的作用。

②结合已学过的数学实例和生活中的实例,体会演绎推理的重要性,掌握演绎推理的基本模式,并能运用它们进行一些简单推理。

③通过具体实例,了解合情推理和演绎推理之间的联系和差异。

⑵直接证明与间接证明①结合已经学过的数学实例,了解直接证明的两种基本方法:分析法和综合法;了解分析法和综合法的思考过程、特点。

②结合已经学过的数学实例,了解间接证明的一种基本方法:反证法;了解反证法的思考过程、特点。

数学文化①通过介绍“四色问题”和吴文俊在计算机自动推理领域作出的贡献,体会计算机在数学证明中的作用。

②通过对实例的分析(如欧几里得《几何原本》、马克思《资本论》、杰弗逊《独立宣言》、牛顿三定律),体会公理化思想。

3.框图⑴流程图①通过具体实例,进一步认识程序框图。

②通过具体实例,了解工序流程图即统筹图。

③能绘制简单实际问题的流程图,体会流程图在解决实际问题中的作用。

⑵结构图①通过实例,了解结构图;运用结构图梳理已学过的知识、整理收集到的资料信息。

2020最新人教版高二数学选修1-2电子课本课件【全册】

2020最新人教版高二数学选修1-2电子课本课件【全册】
2020最新人教版高二数学选修1-2 电子课本课件【全册】
பைடு நூலகம்
实习作业
2020最新人教版高二数学选修1-2 电子课本课件【全册】
2020最新人教版高二数学选修1 -2电子课本课件【全册】目录
0002页 0084页 0113页 0202页 0241页 0276页 0352页 0389页 0466页 0513页 0576页 0587页
第一章 统计案例 1.2 独立性检验的基本思想及其初步应用 小结 第二章 推理与证明 阅读与思考 科学发现中的推理 小结 第三章 数系的扩充与复数的引入 3.2 复数代数形式的四则运算 复习参考题 4.1 流程图 信息技术应用 用word2002绘制流程图 复习参考题
第一章 统计案例
2020最新人教版高二数学选修1-2 电子课本课件【全册】
1.1 回归分析的基本思想及其 初步应用
2020最新人教版高二数学选修1-2 电子课本课件【全册】
1.2 独立性检验的基本思想及 其初步应用

人教A版高中数学选修1-2《一章 统计案例 1.2 独立性检验的基本思想及其初步应用》精品课件_33

人教A版高中数学选修1-2《一章 统计案例  1.2 独立性检验的基本思想及其初步应用》精品课件_33

解:根据题目所给数据得到如下列联表:
患心脏病 不患心脏病 总计
秃顶
214
ቤተ መጻሕፍቲ ባይዱ不秃顶
451
总计
665
175
389
597
1048
772
1437
根据列联表中的数据,得到
K 2 1437 (214597 175 451)2 16.373 6.635. 3891048 665 772
案 例:某医疗机构为了了解呼吸道疾病与吸 烟是否有关,进行了一次抽样调查,共调查了 515个成年人,其中吸烟者220人,不吸烟者 295人。
调查结果:吸烟的220人中有37人患呼吸道疾 病,183人未患呼吸道疾病;不吸烟的295人中 有21人患病,274人未患病。
根据这些数据,能否断定:患呼吸道疾 病与吸烟有关?
(2)求k值 (3)下结论
5
8
3
2
6
1
4
5
9
8
(1)如果k 10.828,就有99.9%的把握认为" X 与Y有关系" (2)如果k 7.879,就有99.5%的把握认为" X 与Y有关系"
(3)如果k 6.635,就有99%的把握认为" X 与Y有关系"
(4)如果k 5.024,就有97.5%的把握认为" X 与Y有关系"
练习3:为了调查胃病是否与生活规律有关,在某地对540名40岁以上 的人进行了调查,结果是:患胃病者生活不规律的共60人,患胃病者 生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病者生 活规律的共200人. (1)根据以上数据列出2×2列联表; (2)能够以99%的把握认为40岁以上的人患胃病与否和生活规律有关 系吗?为什么?
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章 统计案例复习教案一、本章知识脉络:二、本章要点追踪:1.样本点的中心(x -,y -)其中x -=1nn ∑i =1x i ,y -= n∑i =1y i .2.线性回归模型的完美表达式 ⎩⎨⎧y =bx +a +e E (e )=0,D (e )=σ2 3.类比样本方差估计总体方差的思想,可以用σ2∧=1n -2 n∑i =1e 2∧i =1n -2 Q (a ∧,b ∧)(n >2)作为σ2的估计量 其中a ∧=y --b ∧x -b ∧= n∑i =1(x i -x -)(y i -y -) n∑i =1(x i -x -)24.我们可以用相关指数R 2来刻画回归的效果,其计算公式是:R 2=1- n∑i =1(y i -y i ∧)2 n ∑i =1(y i -y i -)2R 2取值越大,意味着残差平方和越小,也就是说模型的拟合效果越好.5.建立回归模型的基本步骤:统计案例 回归分析 样本点的中心 随机误差 残差分析建立回归模型的基本步骤 回归分析列联表 K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )判断结论成立可能性的步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y=bx+x);(4)按一定规则估计回归方程中的参数(如最小二乘法);(5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性等等),若存在异常,则检查数据是否有误,或模型是否合适等。

6.作K2来确定结论“X与Y有关系”的可信程度.三、几个典型例题:例1血硒74668869917366965873发硒13101311169714510(1(2)求回归方程;(3)如果某名健康儿童的血硒含量为94(1000ppm)预测他的发硒含量.解(1)散点图如下图所示:(2)利用计算器或计算机,求得回归方程:y∧=0.2358x-6.9803(3)当x=94时,y∧≈15.2因此,当儿童的血硒含量为94(1000ppm)时,该儿童的发硒含量约为15.2(1000ppm).例2某地大气中氰化物测定结果如下:污染源距离50100150200250300400500氰化物浓度0.6870.3980.2000.1210.090.050.020.01(2)求相关指数.(3)作出残差图,并求残差平方和解析(1)选取污染源距离为变量x,氰化物浓度为自因变量y作散点图.从表中所给的数据可以看出,氰化物浓度与距离有负的相关关系,用非线性回归方程来拟合,建立y关于x的指数回归方程.y∧=0.9293e-0.0094x(2)相关指数K 2=1- n∑i =1(y i -y i ∧)2n ∑i =1(y i -y ∧)2=0.9915(3) 编 号 1 2 3 4 5 6 7 8 污染源距离 50 100 150 200 250 300 400 500 氰化物浓度 0.6870.3980.20.1210.090.050.020.01残 差 0.1061857 0.035 -0.027 -0.0210.0014 -0.005 -0.002 0.0015残差平方和 n∑i =1(y i -y i ∧)2=0.0118例3 某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系, 积极支持企业改革不太造成企业改革合 计 工作积极 54 40 94 工作一般 32 63 95 合 计86103189对于人力资源部的研究项目,根据上述数据能得出什么结论?解:根据列联表中的数据,得到K 2=189×(54×63-40×32)294×95×86×103=10.76.因为10.76>6.635,所以有99%的把握说:员工“工作积极”与“积极支持企业改革”是有关的,可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的.例4 有人统计了同一个省的6个城市某一年的人均国内生产总值(即人均GDP )和这一年各城市患白血病的儿童数量,如下表: 人均GDP x (万元) 10 8 6 4 3 1 患白血病的儿童数y351312207175132180(1)画出散点图;(2)求y 对x 的回归直线方程;(3)如果这个省的某一城市同时期年人均GDP 为12万元,估计这个城市一年患白血病的儿童数目;分析:利用公式分别求出∧∧a b ,的值,即可确定回归直线方程,然后再进行预测. 解:(1)作x 与y 对应的散点图,如右图所示;人数••(2)计算得67.1286)()(,17.226,33.561=--==∑=y y x xy x i i i33.55)(612=-∑=i ix x,∴25.2333.5567.1286≈=∧b ,25.10233.525.2317.226≈⨯-=∧a ,∴y 对x 的回归直线方程是25.10225.23+=∧x y ;(3)将12=x 代入25.10225.23+=∧x y 得38125.1021225.23≈+⨯=∧y ,估计这个城市一年患白血病的儿童数目约为381.评注:本题涉及的是一个和我们生活息息相关,也是一个愈来愈严峻的问题——环保问题.本题告诉了我们一个沉痛的事实:现如今,一个城市愈发达,这个城市患白血病的儿童愈多.原因在于,城市的经济发展大都以牺牲环境为代价的,经济发展造成了大面积的环境污染,空气、水源中含有的大量的有害物质是导致白血病患者增多的罪魁祸首,所以,我们一定要增强自我保护意识和环境保护意识.例5 寒假中,某同学为组织一次爱心捐款,于2008年2月1日在网上给网友发了张帖子,并号召网友转发,下表是发帖后一段时间的收到帖子的人数统计: 天数x 1 2 3 4 5 6 7 人数y711212466115325(1)作出散点图,并猜测x 与y 之间的关系; (2)建立x 与y 的关系,预报回归模型并计算残差;(3)如果此人打算在2008年2月12日(即帖子传播时间共10天)进行募捐活动,根据上述回归模型,估计可去多少人.分析:先通过散点图,看二者是否具有线性相关关系,若不具有,可通过相关函数变换,转化为线性相关关系.解:(1)散点图略.从散点图可以看出x 与y 不具有线性相关关系,同时可发现样本点分布在某一个指数函数曲线mx ke y =的周围,其中m k 、是参数;(2)对mx ke y =两边取对数,把指数关系变成线性关系.令y z ln =,则变换后的样本点分布在直线),ln (m b k a a bx z ==+=的周围,这样就可以利用线性回归模型来建立x 与y 之间的非线性回归方程了,数据可以转化为: 天数x 1 2 3 4 5 6 7 人数y1.9462.3983.0453.1784.1904.7455.784求得回归直线方程为133.1620.0+=∧x z ,∴133.1620.0+∧=x e y .(3)截止到2008年2月12日,10=x ,此时1530133.110620.0≈=+⨯∧e y (人).∴估计可去1530人.评注:现如今是网络时代,很多同学都会通过互联网发帖子,所以此类问题为同学们司空见惯.但如何预测发帖后的效果,这却是个新课题,通过本题你是否已明确.例6 有人发现了一个有趣的现象,中国人的邮箱名称里含有数字的比较多,而外国人邮箱名称里含有数字的比较少.为了研究国籍和邮箱名称里是否含有数字的关系,他收集了124个邮箱名称,其中中国人的70个,外国人的54个,中国人的邮箱中有43个含数字,外国人的邮箱中有27个含数字.(1)根据以上数据建立一个2×2的列联表;(2)他发现在这组数据中,外国人邮箱名称里含数字的也不少,他不能断定国籍和邮箱名称里含有数字是否有关,你能帮他判断一下吗?分析:按题中数据建列联表,然后根据列联表数据求出k 值,即可判定.解:(1)2×2的列联表中国人 外国人 总计 有数字 43 27 70 无数字 21 33 54 总计6460124(2)假设“国籍和邮箱名称里是否含有数字无关”.由表中数据得201.660645470)21273343(1242≈⨯⨯⨯⨯-⨯⨯=k ,因为024.5>k ,所以有理由认为假设“国籍和邮箱名称里是否含有数字无关”是不合理的,即有005.97的把握认为“国籍和邮箱名称里是否含有数字有关”.评注:独立性检验类似于反证法,其一般步骤为:第一步:首先假设两个分类变量几乎没有关系(几乎独立);第二步:求随机变量k 的值;第三步.判断两个分类变量有关的把握(即概率)有多大.例7 针对时下的“韩剧热”,某校团委对“学生性别和是否喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的21,男生喜欢韩剧的人数占男生人数的61,女生喜欢韩剧人数占女生人数的32. (1)若有0095的把握认为是否喜欢韩剧和性别有关,则男生至少有多少人; (2)若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有多少人.分析:有0095的把握认为回答结果对错和性别有关,说明841.3>k ,没有充分的证据显示回答结果对错和性别有关,说明706.2≤k .设出男生人数,并用它分别表示各类别人数,代入2K 的计算公式,建立不等式求解即可.解:设男生人数为x ,依题意可得列联表如下:(1)若有0095的把握认为回答结果的对错和性别有关,则841.3>k ,由841.38322)66365(2322>=⋅⋅⋅⨯-⨯=x x x x x x x x x x K ,解得24.10>x , ∵6,2xx 为整数,∴若有0095的把握认为回答结果的对错和性别有关,则男生至少有12人;(2)没有充分的证据显示回答结果的对错和性别有关,则706.2≤k ,由706.28322)66365(2322≤=⋅⋅⋅⨯-⨯=x x x x x x x x x x K ,解得216.7≤x , ∵6,2xx 为整数,∴若没有充分的证据显示回答结果的对错和性别有关,则男生至多有6人.评注:这是一个独立性检验的创新问题,解答时要注意理解“至少”、“至多”的含义. 通过上面几例,大家是否已体会到了回归分析和独立性检验思想方法的应用的广泛性和重要性.其实,这两种思想方法并不神秘,你身边有很多问题可信手拈来,用它们处理,这一点还请同学们多思考、勤尝试..。

相关文档
最新文档