人教版数学选修1-2第一章 统计案例章末复习提升课
【数学】新课标人教A版选修1-2第一章统计案例教案

4
选修 1—2 第一章统计案例
若H0成立 , 则K2应该很小 . 把表中数据代入公式
2
K2 = 9965 7775 49-42 2099
56.632
7817 2148 9874 91
在H0成立的情况下 . 统计学家估算出如下概率
P K2 6.635 0.01
即在H0成立的情况下 ,K 2的值大于 6.635 的概率非常小. 如果K2 6.635, 就断定H 0不成立 , 出错的可能性有多大? 出现K2=56.632 6.635 的概率不超过 1% .
周围 .
令 z=lny , a=lnc1 , b=c2 则 z=bx+a
此时可用线性回归来拟合 z=0.272x-3.843
因此红铃虫的产卵数对温度的非线性回归方程为 Y=e0.272x-3.843
1、1 回归分析的基本思想及其初步应用(习题课) (第五课时 )
目标 :通过习题巩固所学知识
过程 :1、复习有关知识
教学重点: 独立性检验的步骤。 例 2。 教学难点: 对临界值的理解。 教学过程 :1、复习独立性检验的步骤。
2、可信程度。 3、举例。 例 2。略。 补充例题: 对 196 个接受心脏搭桥手术的病人和 196 个接受血管清 障手术的病人进行 3 年跟踪研究, 调查他们是否又发作过心脏病, 调查结果如下 表所示:
尿汞含量 x
2
消光系数 y
64
4
6
8
10
138
205
285
360
连山高级中学高二数学备课组
3
选修 1—2 第一章统计案例
(1)求回归方程。( 2)求相关指数 R2。
解:略 。
3. 练习:选择、填空用小黑板给出。 (题来源于数学天地报) 。 4. 小结。 5. 作业。
高中数学人教版选修1-2全套教案

高中数学人教版选修1-2全套教案第一章统计案例第一课时 1.1回归分析的基本思想及其初步应用(一)教学目标1、知识与技能目标 认识随机误差;2、过程与方法目标(1)会使用函数计算器求回归方程; (2)能正确理解回归方程的预报结果. 3、情感、态度、价值观通过本节课的学习,加强数学与现实生活的联系,以科学的态度评价两个变量的相关性,理解处理问题的方法,形成严谨的治学态度和锲而不舍的求学精神.培养学生运用所学知识,解决实际问题的能力.教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性.教学重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法-相关指数和残差分析. 教学难点:解释残差变量的含义,了解偏差平方和分解的思想. 教学过程: 一、复习准备:1. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?2. 复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预报. 二、讲授新课: 1. 教学例题:① 例1 从某大学中随机选取8名女大学生,其身高和体重数据如下表所示: 编 号 1 2 3 4 5 6 7 8 身高/cm165165 157 170 175 165 155 170 体重/kg 4857505464614359求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm 的女大学生的体重. (分析思路→教师演示→学生整理)第一步:作散点图第二步:求回归方程 第三步:代值计算010203040506070150155160165170175180身高/cm体重/k g② 提问:身高为172cm 的女大学生的体重一定是60.316kg 吗? 不一定,但一般可以认为她的体重在60.316kg 左右. ③ 解释线性回归模型与一次函数的不同事实上,观察上述散点图,我们可以发现女大学生的体重y 和身高x 之间的关系并不能用一次函数y bx a =+来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系). 在数据表中身高为165cm 的3名女大学生的体重分别为48kg 、57kg 和61kg ,如果能用一次函数来描述体重与身高的关系,那么身高为165cm 的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果e (即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型y bx a e =++,其中残差变量e 中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.2. 相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.3. 小结:求线性回归方程的步骤、线性回归模型与一次函数的不同.第二课时 1.1回归分析的基本思想及其初步应用(二)教学目标:1知识与技能:会建立回归模型,进而学习相关指数(相关系数r 、总偏差平方和、随机误差的效应即残差、残差平方和、回归平方和、相关指数R2、残差分析) 2过程与方法:通过学习会求上述的相关指数3情感态度价值观:从实际问题发现已有知识不足,激发好奇心、求知欲。
高中数学人教A版选修1-2 第一章 统计案例章末复习学案

第一章统计案例复习教案一、本章知识脉络:二、本章要点追踪: 1.样本点的中心(x -,y -) 其中x -=1nn ∑i =1x i ,y -= n ∑i =1 y i .2.线性回归模型的完美表达式 ⎩⎨⎧y =bx +a +e E (e )=0,D (e )=σ23.类比样本方差估计总体方差的思想,可以用 σ2∧=1n -2 n∑i =1e 2∧i =1n -2Q (a ∧,b ∧)(n >2)作为σ2的估计量 其中a ∧=y --b ∧x -b ∧= n∑i =1(x i -x -)(y i -y -) n∑i =1(x i -x -)24.我们可以用相关指数R 2来刻画回归的效果,其计算公式是: R 2=1- n∑i =1(y i -y i ∧)2 n∑i =1(y i -y i -)2R 2取值越大,意味着残差平方和越小,也就是说模型的拟合效果越好.5.建立回归模型的基本步骤:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y =bx +x );(4)按一定规则估计回归方程中的参数(如最小二乘法);(5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性等等),若存在异常,则检查数据是否有误,或模型是否合适等。
6.作K 2来确定结论“X 与 Y 有关系”的可信程度. 三、几个典型例题:例1 某地区10名健康儿童头发和全血中的硒含量(1000ppm )如下,(1)画出散点图; (2)求回归方程;(3)如果某名健康儿童的血硒含量为94(1000ppm )预测他的发硒含量.例2 某地大气中氰化物测定结果如下:(1)试建立氰化物浓度与距离之间的回归方程.(2)求相关指数.(3)作出残差图,并求残差平方和例3某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机制取了189名员工进行调查,所得数据如下表所示:对于人力资源部的研究项目,根据上述数据能得出什么结论?例4有人统计了同一个省的6个城市某一年的人均国内生产总值(即人均GDP)和这一年各城市患白血病的儿童数量,如下表:(1)画出散点图;(2)求y对x的回归直线方程;(3)如果这个省的某一城市同时期年人均GDP为12万元,估计这个城市一年患白血病的儿童数目;例5寒假中,某同学为组织一次爱心捐款,于2008年2月1日在网上给网友发了张帖子,并号召网友转发,下表是发帖后一段时间的收到帖子的人数统计:(1)作出散点图,并猜测x 与y 之间的关系; (2)建立x 与y 的关系,预报回归模型并计算残差;(3)如果此人打算在2008年2月12日(即帖子传播时间共10天)进行募捐活动,根据上述回归模型,估计可去多少人.例6 有人发现了一个有趣的现象,中国人的邮箱名称里含有数字的比较多,而外国人邮箱名称里含有数字的比较少.为了研究国籍和邮箱名称里是否含有数字的关系,他收集了124个邮箱名称,其中中国人的70个,外国人的54个,中国人的邮箱中有43个含数字,外国人的邮箱中有27个含数字.(1)根据以上数据建立一个2×2的列联表;(2)他发现在这组数据中,外国人邮箱名称里含数字的也不少,他不能断定国籍和邮箱名称里含有数字是否有关,你能帮他判断一下吗?例7 针对时下的“韩剧热”,某校团委对“学生性别和是否喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的21,男生喜欢韩剧的人数占男生人数的61,女生喜欢韩剧人数占女生人数的32. (1)若有0095的把握认为是否喜欢韩剧和性别有关,则男生至少有多少人; (2)若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有多少人.。
高中数学选修1-2第一章课后习题解答

新课程标准数学选修1—2第一章课后习题解答第一章统计案例1.1回归分析的基本思想及其初步应用练习(P8)1、画散点图的目的是通过变量的散点图判断两个变量更近似于什么样的函数关系,以确定是否直接用线性回归模型来拟合原始数据.说明:学生在对常用的函数图象比较了解的情况下,通过观察散点图可以判断两个变量的关系更近似于哪种函数.2、分析残差可以帮助我们解决以下两个问题:(1)寻找异常点,就是残差特别大的点,考察相应的样本数据是否有错.(2)分析残差图可以发现模型选择是否合适.说明:分析残差是回归诊断的一部分,可以帮助我们发现样本数据中的错误,分析模型选择是否合适,是否有其他变量需要加入到模型中,模型的假设是否正确等. 本题只要求学生能回答上面两点即可,主要让学生体会残差和残差图可以用于判断模型的拟合效果.3、(1)解释变量和预报变量的关系式线性函数关系.R=.(2)21说明:如果所有的样本点都在一条直线上,建立的线性回归模型一定是该直线,所以每个=+,没有随机误差项,是严样本点的残差均为0,残差平方和也为0,即此时的模型为y bx aR=.格的一次函数关系. 通过计算可得21习题1.1 (P9)1、(1)由表中数据制作的散点图如下:从散点图中可以看出GDP值与年份近似呈线性关系.y表示GDP值,t表示年份. 根据截距和斜率的最小二乘计算公式,得(2)用tˆ14292537.729a≈-,ˆ7191.969b≈从而得线性回归方程ˆ7191.96914292537.729=-.y t残差计算结果见下表.GDP 值与年份线性拟合残差表(年实际GDP 值为117251.9,所以预报与实际相差4275.540-.(4)上面建立的回归方程的20.974R =,说明年份能够解释约97%的GDP 值变化,因此所建立的模型能够很好地刻画GDP 和年份的关系.说明:关于2003年的GDP 值的来源,不同的渠道可能会有所不同.2、说明:本题的结果与具体的数据有关,所以答案不唯一.3、由表中数据得散点图如下:从散点图中可以看出,震级x 与大于或等于该震级的地震数N 之间不呈线性相关关系,随着x 的减少,所考察的地震数N 近似地以指数形式增长. 做变换lg y N =,得到的数据如下表所示.x 和y 的散点图如下:从这个散点图中可以看出x 和y 之间有很强的线性相关性,因此可以用线性回归模型拟合它们之间的关系. 根据截距和斜率的最小二乘计算公式,得ˆ 6.704a≈,ˆ0.741b ≈-, 故线性回归方程为 ˆ0.741 6.704y x =-+. 20.997R ≈,说明x 可以解释y 的99.7%的变化.因此,可以用回归方程 0.741 6.704ˆ10x N-+= 描述x 和N 之间的关系. 1.2独立性检验的基本思想及其初步应用练习(P15)列联表的条形图如图所示.由图及表直观判断,好像“成绩优秀与班级有关系”. 因为2K 的观测值0.653 6.635k ≈<,由教科书中表1-11克重,在犯错误的概率不超过0.01的前提下,不能认为“成绩与班级有关系”.说明:(1)教师应要求学生画出等高条形图后,从图形上判断两个分类变量之间是否有关系. 这里通过图形的直观感觉的结果可能会出错.(2)本题与例题不同,本题计算得到的2K 的观测值比较小,所以没有理由说明“成绩优秀与班级有关系”. 这与反证法也有类似的地方,在使用反证法证明结论时,假设结论不成立的条件下如果没有推出矛盾,并不能说明结论成立也不能说明结论不成立. 在独立性检验中,没有推出小概率事件发生类似于反证法中没有推出矛盾.习题1.2 (P16)1、假设“服药与患病之间没有关系”,则2K 的值应该比较小;如果2K 的值很大,则说明很可能“服药与患病之间没有关系”. 由列联表中数据可得2K 的观测值 6.110 5.024k ≈>,而由教科书表1-11,得2( 5.024)0.025P K ≥≈,所以在犯错误的概率不超过0.025的前提下可以认为“服药与患病之间有关系”. 又因为服药群体中患病的频率0.182小于没有服药群体中患病的频率0.400,所以“服药与患病之间关系”可以解释为药物对于疾病有预防作用. 因此在犯错误的概率不超过0.025的前提下,可以认为药物有效.说明:仿照例1,学生很容易完成此题,但希望学生能理解独立性检验在这里的具体含义,即“服药与患病之间关系”可以解释为“药物对于疾病有预防作用”.2、如果“性别与读营养说明之间没有关系”,由题目中所给数据计算,得2K 的观测值为8.416k ≈,而由教科书中表1-11知2(7.879)0.005P K ≥≈,所以在犯错误的概率不超过0.005的前提下认为“性别与读营养说明之间有关系”.3、说明:需要收集数据,所有没有统一答案. 第一步,要求学生收集并整理数据后得到列联表;第二步,类似上面的习题做出判断.4、说明:需要从媒体上收集数据,学生关心的问题不同,收集的数据会不同. 第一步,要求学生收集并整理数据后得到列联表;第二步,类似上面的习题做出判断.第一章 复习参考题A 组(P19)根据散点图,可以认为中国人口总数与年份呈现很强的线性相关关系,因此选用线性回归模型建立回归方程.由最小二乘法的计算公式,得 2095141.503a ≈-,1110.903b ≈,则线性回归方程为 ˆ1110.9032095141.503yx =-. 由2R 的计算公式,得 20.994R ≈,明线性回归模型对数据的拟合效果很好.根据回归方程,,预计2003年末中国人口总数约为129997万人,而实际情况为129227万人,预测误差为770万人;预计2004年末中国人口总数约为131108万人,而实际情况为129988万人,预测误差为1120万人.说明:数据来源为《中国统计年鉴》(2003). 由于人数为整数,所以预测的数据经过四舍五入的取整运算.2、(1)将销售总额作为横轴,利润作为纵轴,根据表中数据绘制散点图如下:由于散点图中的样本点基本上在一个带形区域内分布,猜想销售总额与利润之间呈现线性相关关系.(2)由最小二乘法的计算公式,得 ˆ1334.5a≈,ˆ0.026b ≈, 则线性回归方程为 ˆ0.0261334.5yx =+ 其残差值计算结果见下表:(3)对于(2)中所建立的线性回归方程,20.457R ≈,说明在线性回归模型中销售总额只能解释利润变化的46%,所以线性回归模型不能很好地刻画销售总额和利润之间的关系. 说明:此题也可以建立对数模型或二次回归模型等,只要计算和分析合理,就算正确.3、由所给数据计算得2K 的观测值为 3.689k ≈,而由教科书中表1-11知2( 2.706)0.10P K ≥=所以在犯错误的概率不超过0.10的前提下认为“婴儿的性别与出生的时间有关系”.第一章 复习参考题B 组(P19)1、因为 21(,)()ni i i Q a b y a bx ==--∑21(()())n i i i y bx y bx a y bx ==--+--+∑ 2211()()n n i i i i y bx y bx a y bx ===--++-+∑∑12()()ni i i y bx y bx a y bx =---+-+∑ 并且221()()n i a y bx n a y bx =-+=-+∑,12()()n i i i y bx y bx a y bx =--+-+∑ 1()(())ni i i a y bx y bx ny nbx ==-+--+∑ ()()0a y b x n y n b xn y n b x=-+--+= 所以 221(,)()()ni i i Q a b y bx y bx n a y bx ==--++-+∑.考察上面的等式,等号右边的求和号中不包含a ,而另外一项非负,所以ˆa和ˆb 必然使得等号右边的最后一项达到最小值,即 ˆˆ0ay bx -+=, 即ˆˆy a bx =+. 2、总偏差平方和21()n i i y y =-∑表示总的效应,即因变量的变化效应;残差平方和21ˆ()ni i y y =-∑表示随机误差的效应,即随机误差的变化效应;回归平方和21ˆ()ni yy =-∑表示表示变量的效应,即自变量的变化效应. 等式 222111ˆˆ()()()n n n i ii i i y y y y y y ===-=-+-∑∑∑ 表示因变量的变化总效应等于随机误差的变化效应与自变量的变化效应之和.3、说明:该题主要是考察学生应用回归分析模型解决实际问题的能力,解答应该包括如何获取数据,如何根据散点图寻找合适的模型去拟合数据,以及所得结果的解释三方面的内容.。
人教A版选修1-2 第一章 统计案例 全章素养整合 课件(39张)

[典例 2] 从某大学中随机选取 5 名女大学生,其身高和体重数据如下表所示: 编号 1 2 3 4 5
身高 x/cm 165 165 157 170 175 体重 y/kg 48 57 50 54 64 甲、乙两位同学在计算根据女大学生的身高预报体重的回归方程时,分别得到以下回 归模型:甲:^y=0.75x-70;乙:^y=0.76x-71.试依据 R2 判定哪一个模型的拟合效果 较好.
(1)请画出上表数据的散点图; (2)请根据上表提供的数据,求出 y 关于 x 的线性回归方程^y=^bx+^a; (3)据此估计 2020 年该市人口总数.
[解析] (1)散点图如图:
(2)因为 x =0+1+52+3+4=2, y =5+7+85+11+19=10, 0×5+1×7+2×8+3×11+4×19=132, 02+12+22+32+42=30, 所以^b=1323-0-5×5×2×22 10=3.2, ^a= y -^b x =3.6. 所以线性回归方程为^y =3.2x+3.6.
(1)根据茎叶图判断哪种生产方式的效率更高.并说明理由; (2)求 40 名工人完成生产任务所需时间的中位数 m,并将完成生产任务所需时间超过 m 和不超过 m 的工人数填入下面的列联表:
全章素养整合
构网络 提素养 链高考 章末检测(一)
类型一 线性回归方程 在散点图中样本点大致分布在一条直线附近,则利用线性回归模型进行研究,可近似 地利用回归直线方程^y =^b x+^a 来预报,利用公式求出回归系数^a ,^b ,即可写出回归直 线方程,并用回归直线方程进行预测说明.
[典例 1] 某城市理论预测 2010 年到 2014 年人口总数与年份的关系如表所示: 年份 201x(年) 0 1 2 3 4 人口数 y(十万) 5 7 8 11 19
高中数学人教版选修1-2_模块复习课 第一课 统计案例 (共54张PPT)精选ppt课件

【解析】依题意有
P=(-3x+161.5)(x-30)=-3x2+251.5x-4845
=-3(x- )2+ 2 5 1.5
2 5 -1 .45 2845.
所以当x=6 ≈42时1 2 ,P有最大值,约为426.
2 5 1.5 即预测销售单6 价为42元时,能获得最大日销售利润.
【方法技巧】求线性回归方程的基本步骤
每晚都打鼾
30
224
254
不打鼾
24
1 355
1 379
总计
54
1 579
1 633
【解析】由列联表中的信息 知打鼾人群中未患心脏病的 比例为0.88,即患有心脏病 的比例为0.12;同理不打鼾 人群中未患心脏病的比例为0.98,即患有心脏病的比 例为0.02.作出等高条形图(如图).
从该图中可以看出:打鼾样本中患心脏病的比例明显 多于不打鼾样本中患心脏病的比例.因此可以认为“打 鼾与患心脏病有关”.
所以y关于x的b线9 4 性7 3 7 4 回 9 4 归7 3 2 2 方 程5 2,为a 2 7 5 2 1 2 3 ,
y 5 x 3. 2
(3)当x=10时,y =22,|22-23|<2,当x=11时y , =24.5
|24.5-25|<2,当x=13时, =29.5,|29.5-30|<2.
M包含的基本事件有:(AC)、(AD)、(BC)、(BD)、
(CD),所以P(M)=5 . 6
【补偿训练】某研究性学习小组对春季昼夜温差大小 与某花卉种子发芽多少之间的关系进行研究,他们分 别记录了3月1日至3月5日的每天昼夜温差与实验室每 天每100颗种子浸泡后的发芽数,得到如下资料:
高考数学(人教A版选修1-2)第一轮复习教学案第一章统计案例 学案

第一章统计案例[课标研读][课标要求]了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.(1)独立检验:了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.(2)假设检验:了解假设检验的基本思想、方法及其简单应用.(3)聚类分析:了解聚类分析的基本思想、方法及其简单应用.(4)回归分析:了解回归的基本思想、方法及其简单应用.[命题展望]本章所涉及到的知识点均要进行大量的数据计算,而这些计算如果仅仅靠笔算往往是比较困难的,需要借助于计算机或计算器。
其实在新课标中提到“……应鼓励学生使用计算器、计算机等现代技术手段来处理数据……”,而我们目前的高考还不允许使用计算器,所以本章的更看重统计思想。
考虑到本章内容是新增内容,在高考中应该有所体现,但在高考试题中不会出现过于繁琐的计算题,相信会出现一道填空试题或填空题,出现解答题的可能性较小,即使出现,所涉及的计算应该不会很繁琐。
本章的疑点是用这种方法检验可靠吗?实际上这种方法仍然是用样本估计总体,由于抽样的随机性,结果并不唯一,所以用部分推断全体,推断可能正确,也有可能错误。
但我们只要科学合理地去抽样,那么犯错误的可能性就很小了。
如卡方检验中,若2 6.635χ>,则说明我们犯错误的概率仅为1%,这也是统计方法的魅力所在。
第一讲回归分析的基本思想及其初步应用[知识梳理][知识盘点]1.相关关系是一种非确定的关系,是对具有相关关系的两个变量进行统计分析的一种方法。
2.线性回是模型y bx a e=++(e为),因变量y的值是自变量x和随机误差e共同确定的,即自变量x只能解释部分y的变化,在统计中,我们把自变量x称为,因变量y称为。
3.模型中的参数a和b用估计,其计算公式如下:121()()ˆ()ni iiniix x y ybx x==--=-∑∑,ˆˆa y bx=-,其中11niix xn==∑,1niiy y==∑(,)x y称为,回归直线一定经过样本中心点。
人教版数学选修1-2第一章统计案例章末复习提升课

知识网络*体系构建鶴哲簞輕缨展不I ly例说法脏类旁通经典问题一线性回归分析例I (教材P19复习参考题A组T2)假设美国10家最大的工业公司提供了以下数据(单位:百万美元):公司通用汽车福特埃克森IBM通用电气美孚菲利普莫利斯克莱斯勒杜邦德士古销售总额X11269749693386 65663438552645097639069361563520932416利润X24 22438353 510 3 758 3 939 1 809 2 946359 2 480 2 413⑵建立销售总额为解释变量,利润为预报变量的回归模型,并计算残差;⑶计算R2,你认为这个模型能较好地刻画销售总额和利润之间的关系吗?请说明理由. 赏析1规范解答[解](1)将销售总额作为横轴x,利润作为纵轴y,根据表中数据绘制散点图如图.由于散点图中的样本点基本上在一个带状区域内分布,猜想销售总额与利润之间呈线性章末复习提升课回归分折独立性检脸4 500斗0003 5003 0002 50020001 50010005002D 000 40000 60 000 000 L00000 130000140000总额/芮万夬朮⑵由最小二乘法的计算公式,得1 334.5, b- 0.026,相关关系.⑵由最小二乘法的计算公式,得1 334.5, b- 0.026,则线性回归方程为y= 0.026X+ 1 334.5.⑶对于⑵中所建立的线性回归方程,R2~ 0.457,说明在线性回归模型中销售总额只能解释利润变化的46%,所以线性回归模型不能很好地刻画销售总额和利润之间的关系.赏析2|逆向问题经分析预测,美国通用汽车等10家大公司的销售总额X j(i = 1 , 2,…,10,单位:百万美元)与利润y i(i = 1, 2,…,10,单位:百万美元)的近似线性关系为y= 0.026x+ 9,经统计10 10' X i = 623 090, ' y i = 29 300.i =1 i =1,y(1)求a;(2)若通用汽车公司的销售总额X1= 126 974 (百万美元),残差e1=- 387,估计通用汽车的利润;(3)福特公司的销售总额为96 933百万美元,利润为 3 835,比较通用汽车与福特公司利润的解释变量对于预报变量变化的贡献率说明了什么?(以上答案精确到个位)10 10[解](1)二x i= 623 090,—y i= 29 300,i = 1 i = 1得样本中心点为(62 309, 2 930),所以a= 2 930 - 0.026 X 62 309= 1 310.(2)由(1)知y= 0.026X+ 1 310,当冯=126 974 时,;1 = 0.026 X 126 974 + 1 310= 4 611,所以y1=y1+ e1= 4 611 + (—387) = 4 224,估计通用汽车的利润为 4 224百万美元.Q I Q , o ・ ,・, ・ ・ 20 22 2428 30 32 34由散点图知,样本点分布在某条指数函数曲线周围 ,故该回归方程为 y = c i ec z x ,两边取对数得 In y = C 2X + In c i ,、” z = ln yA A A A A 作变换* (C 2= b , In C i = a),得z = bx + a ,X = x 且变化后所得样本数据表为X 21 23 25 27 29 32 35 z 1.946 2.3983.0453.1784.1904.7455.784经计算得z(3)由(1)(2)可得通用汽车利润的解释变量对于预报变量变化的贡献率为R 2,A 2则 R i = 1 —( yi — yi )=(y i ——) 2(—387) 1 294)0.911 = 91.1%.设福特公司利润的解释变量对于预报变量变化的贡献率为 R 2,t A 十 由 y = 0.026x + 1 310 得;2 = 0.026 X 96 933 + 1 310= 3 830,心 2 (3 835 — 3 830) 252则R2=1 —(3 835— 2 930) 2 =1 —丽~ 昵"9= "."%.由R 2< R 2知,用A= 0.026X + 1 310作为解释变量与预报变量的关系 ,预报通用汽车的效 果没有预报福特公司的效果好,或者说预报通用汽车的精确度低于预报福特公司的精确度.经典问题二 非线性回归分析忸丄(教材P6例2)一只红铃虫的产卵数 y 和温度x 有关,现收集了 7组观测数据列 于表中,试建立y 关于x 的回归方程.温度x/C21 23 25 27 29 32 35 产卵数y/个711212466115325赏析1|规范解答[解]根据收集的数据,作散点图:畅3a)2502mL50loo36Z= 0.272X—3.849,所以y关于x的回归方程为z 1 0.272x 即 y = 3.849 • e z 0.272x -3.849y = e 赏析2冋题拓展“指数型”回归方程选择的等价性.拓展i : (1)选择指数函数y = a x (a > 0且a 工i)不科学,因为指数函数 y = a x (a > 0且a ^ i)恒过定点(0 , i),且仅有一个估计值 a ,不能有效体现解释变量x 与预报变量y 之间的关系,即拟合效果很差.(2) “平移型”指数函数与 y = c i ec 2X 的等价性.①回归方程为y = a x *b 作变换f z = In y zz z z z(b = In a , a = bln a),则有 z = bx + a.x = x②回归方程为y = a x + b ,令a x = k e x , t = e x ,+1 xt = a ,-z zk得 y = kt + b(b = k , a = b).可得变换$⑶一般“指数型”函数与 y = c i ec z x 的等价性. 回归方程为 y = k i ek 2x + b因为 y = k i ek 2x + b = k i ek 2x - e b = k i e b • ek 2x , In y = ln( k i e) + k 2x = In k i + b + k^, 作变换z = In y z z(b = k 2, a = ln & + b), x = x …,- A A A 则有 z = bx + a.拓展2:从散点图看回归方程的设置(1)由本例从散点图可以看出,样本点集中在某二次函数(抛物线)的附近,因此可选择二 次函数y = ax 2 + b 作为回归方程.作变换t = x 2,即得 y = at + b(其中 b = a , a = b).y = y⑵若选用y = ax 2 + bx + c 模型,则具有不确定性;于、22因为 y = ax 2 + bx + c = a x + ~ — 4a :_ b ,V 2a 」 4a—\4ac — b 2—可得出线性关系 y = at + ——,但由于a 、b 、c 未确定,从而变换t = x + 2a 的t 值不确定,从而不能列出样本点 (t i ,2y i )数据表,即y = at + 4^尹不能确定.因此,我们根据散点图设置回归方程应特别注et = f (x ),① 变换£ 可列出(t i , z)的数据表.z = g (y )② 注重变换后的线性回归方程中的b 与a 与变换前参数的关系. ③ 利用求出的线性回归方程替换变量后还原成原问题的回归方程. ④ 最后根据需要进行回归分析.经典问题三独立性检验例吕(教材P15练习)甲乙两个班级进行一门课程的考试, 按照学生考试成绩优秀和不优秀统计成绩后,得到如下的列联表:班级与成绩列联表画出列联表的等高条形图, 并通过图形判断成绩与班级是否有关. 根据列联表的独立性检验,能否在犯错误的概率不超过0.01的前提下认为成绩与班级有关系?赏析1|规范解答假设成绩与班级没有关系 ,则有a = 10, b = 35, c = 7, d = 38, a + b = 45, c + d = 45, a + c = 17, b + d = 73, n = 90,代入K 2公式,得K 2的观测值290X (10X 38- 7X 35)k =〜0.653.45 X 45X 17X 73由于k ~ 0.653V 6.635,所以在犯错误的概率不超过 0.01的前提下不能认为成绩与班级有关系.赏析2 逆向问题甲、乙两个班级进行一门课程的考试, 按照学生考试成绩优秀和不优秀统计后, 得到如下的列联表班级与成绩列联表[解⑴求a , b , c, d 的值;(2)根据观测值表,你最少有多大的把握认为成绩与班级无关.[解] ⑴ 由表知,c = 25- a , b = 45- a , d = 45-c = 45- (25 — a) = 20+ a , n = 90. 2n (ad — bc )化简得(2a — 25)2= 25,所以 2a — 25= 5 或 2a — 25= — 5, 所以a = 15或a = 10,当a = 10时,当a = 15时,说明甲班与乙班编号不同而已,故当 a = 10 时,b = 35, c = 15, d = 30, 或当 a = 15 时,b = 30, c = 10, d = 35. 2 18⑵因为 k 2= 13-1.385> 1.323,而 P(K 2> 1.323) = 0.25,所以最少有25%的把握认为成绩与班级无关. 赏析3|问题拓展数学教师STC 对他所任教的高二两个班进行一次数学考试 (满分100分),从两个班学生考试成绩中,都随机抽取了15名学生的数学成绩的茎叶图如下,I 卩班Q 班2 1 5 4 8 6 5 65 6 8 3 110 7 0 4 6 9 9 8 5 48 1 2 4 8 9 3 90 5(1)从茎叶图能否判断乙班的成绩好于甲班的成绩;⑵若记成绩在区间[80 , 100)为优秀,小于80为不优秀,你有多少把握判断乙班的成绩 比甲班的成绩优良.若K 2的观测值为1813.由 K 2= ----------- —— ----------------- 得 由 (a + b )( c + d )( a + c )( b + d ) 得 90[a (20+ a ) — ( 25— a )( 45— a ) ]245 X 45 X 25 X 6513'[解](1)甲班成绩集中在“茎7”,乙班的成绩集中在“茎8”,从茎叶图可判断乙班的成绩好于甲班的成绩.⑵根据茎叶图列出2X2列联表K2的观测值“30(:;8;二108 =訂°.556>.455,且又P(K2> 0.455) = 0.50, P(K2>0.708) = 0.40,故仅有50%至60%的把握认为乙班的成绩比甲班的成绩优良.器0.556 V 0.708 ,。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
栏目 导引
第一章
统计案例
[解] (1) xi=623 090, yi=29 300,
i=1 i=1
10
10
得样本中心点为(62 309,2 930), ^ 所以 a =2 930-0.026×62 309=1 310. ^ (2)由(1)知 y =0.026x+1 310,当 x1=126 974 时, ^ y 1=0.026×126 974+1 310=4 611,
i=1
10
^ (1)求a ;
栏目 导引
第一章
统计案例
(2)若通用汽车公司的销售总额 x1=126 974(百万美元) , ^ 残差 e 1=-387,估计通用汽车的利润; (3) 福特公司的销售总额为 96 933 百万美元, 利润为 3 835, 比较通用汽车与福特公司利润的解释变量对于预报变量变化 的贡献率说明了什么? (以上答案精确到个位)
栏目 导引
第一章
统计案例
赏析2
逆向问题
经分析预测,美国通用汽车等 10 家大公司的销售总额 xi(i= 1,2,…,10,单位:百万美元)与利润 yi(i=1,2,…,10, ^ ^ 单位:百万美元)的近似线性关系为 y =0.026x+ a ,经统计
i=1
10
xi=623 090, yi=29 300.
规范解答
栏目 导引
第一章
统计案例
[解] 根据收集的数据,作散点图:
栏目 导引
第一章
统计案例
由散点图知,样本点分布在某条指数函数曲线周围,故该回 归方程为 y=c1ec2x,两边取对数得 ln y=c2x+ln c1,
z=ln y ^ ^ ^ ^ ^ 作变换 (c2= b ,ln c1= a ),得 z = b x+ a , x=x
且变化后所得样本数据表为 x z 21 1.946 23 2.398 25 3.045 27 3.178 29 4.190 32 4.745 35 5.784
栏目 导引
第一章
统计案例
经计算得 z 关于 x 的线性回归方程为 ^ z =0.272x-3.849,所以 y 关于 x 的回归方程为 1 ^ 0.272x-3.849 ^ y =e 即 y = 3.849·e0.272x. e
斯
销售 总额x1
126 974
96 933
86 656
63 438 55 264 50 976 39 069 36 156 35 209 32 416
利润x2
4 224
3 835
3 510
3 758
3 939
1 809
2 946
359
2 480
2 413
栏目 导引
第一章
统计案例
(1)作销售总额和利润的散点图,根据该图猜想它们之间的关 系应是什么形式; (2)建立销售总额为解释变量,利润为预报变量的回归模型, 并计算残差; (3)计算 R2, 你认为这个模型能较好地刻画销售总额和利润之 间的关系吗?请说明理由. 赏析1 规范解答
第一章
统计案例
章末复习提升课
第一章
统计案例
栏目 导引
第一章
统计案例
经典问题一 线性回归分析 (教材 P19 复习参考题 A 组 T2)假设美国 10 家最大的 工业公司提供了以下数据(单位:百万美元):
公司 通用汽 车 福特 埃克森 IBM 通用电 气 菲利普 美孚 · 莫利 克莱斯 勒 杜邦 德士古
栏目 导引
第一章
统计案例
^ ^ 所以 y1= y 1+ e 1=4 611+(-387)=4 224, 估计通用汽车的利润为 4 224 百万美元. (3)由(1)(2)可得通用汽车利润的解释变量对于预报变量变化的 贡献率为 R2 1, ^ 2 2 ( y - y ) (- 387 ) 1 1 则 R2 =1- ≈0.911=91.1%. 1=1- - 2 (1 294)2 (y1- y )
栏目 导引
第一章
统计案例
其残差值计算结果见下表:
销售 总额
ห้องสมุดไป่ตู้126 974
96 933
86 656
63 438
55 264
利润
4 224
3 835
3 510
-77.556
3 758
774.112
3 939
1 167.636
残差 -411.824 -19.758 销售 总额
50 976
39 069
36 156
栏目 导引
第一章
统计案例
[解] (1)将销售总额作为横轴 x,利润作为纵轴 y,根据表中 数据绘制散点图如图.
栏目 导引
第一章
统计案例
由于散点图中的样本点基本上在一个带状区域内分布,猜想 销售总额与利润之间呈线性相关关系. ^ ^ (2)由最小二乘法的计算公式,得 a ≈1 334.5, b ≈0.026, ^ 则线性回归方程为 y =0.026x+1 334.5.
^ 2 由 R2 < R 知,用 y =0.026x+1 310 作为解释变量与预报变量 1 2 的关系,预报通用汽车的效果没有预报福特公司的效果好, 或者说预报通用汽车的精确度低于预报福特公司的精确度.
栏目 导引
第一章
统计案例
经典问题二
非线性回归分析
(教材 P6 例 2)一只红铃虫的产卵数 y 和温度 x 有关, 现收集了 7 组观测数据列于表中,试建立 y 关于 x 的回归方 程. 温度 x/℃ 产卵数 y/个 赏析1 21 7 23 11 25 21 27 24 29 66 32 115 35 325
35 209
32 416
利润
1 809
2 946
595.706
359
-1 915.556
2 480
230.066
2 413
235.684
栏目 导引
残差 -850.876
第一章
统计案例
(3)对于 (2)中所建立的线性回归方程,R2≈0.457,说明在线 性回归模型中销售总额只能解释利润变化的 46%, 所以线性 回归模型不能很好地刻画销售总额和利润之间的关系.
2 设福特公司利润的解释变量对于预报变量变化的贡献率为 R2 ,
栏目 导引
第一章
统计案例
^ 由 y =0.026x+1 310 得 ^ y 2=0.026×96 933+1 310=3 830,
2 2 ( 3 835 - 3 830 ) 5 则 R2 =1- ≈0.999 9=99.99%. 2=1- 9052 (3 835-2 930)2
栏目 导引
第一章
统计案例
赏析2
问题拓展
拓展 1:“指数型”回归方程选择的等价性. (1)选择指数函数 y=ax(a>0 且 a≠1)不科学,因为指数函数 y=ax(a>0 且 a≠1)恒过定点(0,1),且仅有一个估计值 a, 不能有效体现解释变量 x 与预报变量 y 之间的关系,即拟合 效果很差.