2016_2017学年高中数学第一章统计案例1.1回归分析的基本思想及其初步应用课件新人教A版选修1_2

合集下载

高中数学《1.1回归分析的基本思想及其初步应用》评估训练 新人教A版选修1-2

高中数学《1.1回归分析的基本思想及其初步应用》评估训练 新人教A版选修1-2

第一章统计案例1.1 回归分析的基本思想及其初步应用双基达标限时20分钟1.下列命题中正确的是( ).①任何两个变量都具有相关关系②圆的周长与圆的半径具有相关关系③某商品的需求量与该商品的价格是一种非确定性关系④根据散点图求得的线性回归方程可能是没有意义的⑤两个变量的线性相关关系可以通过线性回归方程,把非确定性问题转化为确定性问题进行研究A.①③④B.②④⑤C.③④⑤D.②③⑤解析显然①是错误的,而②中圆的周长与圆的半径的关系为:C=2πR,是一种确定性的函数关系,故应选C.答案 C2.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有( ).A.b与r的符号相同B.a与r的符号相同C.b与r的符号相反D.a与r的符号相反解析因为b>0时,两变量正相关,此时r>0;b<0时,两变量负相关,此时r<0.答案 A3.在判断两个变量y与x是否相关时,选择了4个不同的模型,它们的相关指数R2分别为:模型1的相关指数R2为0.98,模型2的相关指数R2为0.80,模型3的相关指数R2为0.50,模型4的相关指数R2为0.25.其中拟合效果最好的模型是( ).A.模型1 B.模型2C.模型3 D.模型4解析相关指数R2能够刻画用回归模型拟合数据的效果,相关指数R2的值越接近于1,说明回归模型拟合数据的效果越好.答案 A4.若一组观测值(x 1,y 1),(x 2,y 2),…,(x n ,y n )之间满足y i =bx i +a +e i (i =1,2,…,n ),且e i 恒为0,则R 2为________.解析 由e i 恒为0,知y i =y ^i ,即y i -y ^i =0,故R 2=1-∑i =1ny i -y ^i 2∑i =1ny i -y2=1-0=1.答案 15.已知回归直线的斜率的估计值为 1.23,样本点的中心为(4,5),则回归直线方程是________.解析 由斜率的估计值为 1.23,且回归直线一定经过样本点的中心(4,5),可得y ^-5=1.23(x -4),即y ^=1.23x +0.08.答案 y ^=1.23x +0.086.某个服装店经营某种服装,在某周内纯获利y (元)与该周每天销售这种服装件数x 之间的一组数据如下表:(1)(2)画出散点图.(3)求纯获利y 与每天销售件数x 之间的回归方程. 解 (1)x =6,y ≈79.86,中心点(6,79.86). (2)散点图如下:(3)因为b ^=∑i =17x i -xy i -y ∑i =17x i -x 2≈4.75,a ^=y -b ^x ≈51.36,所以y ^=4.75x +51.36.综合提高 限时25分钟7.为了考察两个变量x 和y 之间的线性相关性,甲、乙两位同学各自独立地做了100次和150次试验,并且利用线性回归方法,求得回归直线分别为l 1和l 2.已知两个人在试验中发现对变量x 的观测数据的平均值都是s ,对变量y 的观测数据的平均值都是t ,那么下列说法正确的是( ). A .l 1和l 2有交点(s ,t )B .l 1与l 2相交,但交点不一定是(s ,t )C .l 1与l 2必定平行D .l 1与l 2必定重合解析 都过样本中心点(s ,t ),但斜率不确定. 答案 A8.某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel 软件计算得y ^=0.577x -0.448(x 为人的年龄,y 为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是( ). A .年龄为37岁的人体内脂肪含量都为20.90% B .年龄为37岁的人体内脂肪含量为21.01%C .年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%D .年龄为37岁的大部分的人体内脂肪含量为31.5%解析 当x =37时,y ^=0.577×37-0.448=20.901≈20.90,由此估计:年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%. 答案 C9.今年一轮又一轮的寒潮席卷全国.某商场为了了解某品牌羽绒服的月销售量y (件)与月平均气温x (℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,数据如下表:由表中数据算出线性回归方程y =b x +a 中的b ≈-2.气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月该品牌羽绒服的销售量的件数约为________. 解析 由表格得(x ,y )为(10,38),又(x ,y )在回归直线y ^=b ^x +a ^上,且b ^≈-2,∴38=-2×10+a ^,a ^=58,所以y ^=-2x +58,当x =6时,y ^=-2×6+58=46. 答案 4610.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量(千箱)与单位成本(元)的资料进行线性回归分析,结果如下:x =72,y =71,∑i =16x 2i =79,∑i =16x i y i =1 481,b ^=1 481-6×72×7179-6×⎝ ⎛⎭⎪⎫722≈-1.818 2, a ^=71-(-1.818 2)×72≈77.36,则销量每增加1千箱,单位成本下降________元.解析 由已知可得,y ^=-1.818 2x +77.36,销量每增加1千箱,则单位成本下降1.818 2元. 答案 1.818 211.在一次抽样调查中测得样本的5个样本点,数值如下表:试建立y 与x 解 由数值表可作散点图如右图.根据散点图可知y 与x 近似地呈反比例函数关系,设y =k x ,令t =1x,则y =kt ,原数据变为:由散点图可以看出y 与t 呈近似的线性相关关系.列表如下:续表所以t =1.55,y =7.2.所以b ^=∑i =15t i y i -5t y∑i =15t 2i -5t 2=4.134 4,a ^=y -b ^t =0.8.所以y ^=4.134 4t +0.8.所以y 与x 的回归方程是y ^=4.134 4x+0.8.12.(创新拓展)某运动员训练次数与成绩之间的数据关系如下:(1)(2)求出回归方程; (3)作出残差图; (4)计算相关指数R 2;(5)试预测该运动员训练47次及55次的成绩.解 (1)作出该运动员训练次数(x )与成绩(y )之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系.(2)x =39.25,y =40.875,∑i =18x 2i =12 656,∑i =18x i y i =13 180,∴b ^=∑i =18x i y i -8x y∑i =18x 2i -8x 2=1.041 5,a ^=y -b ^x =-0.003 88,∴回归方程为y ^=1.0415x -0.003 88. (3)作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适. (4)计算得相关指数R 2=0.985 5,说明了该运动员的成绩的差异有98.55%是由训练次数引起的.(5)由上述分析可知,我们可用回归方程y ^=1.041 5x -0.003 88作为该运动员成绩的预报值.将x =47和x =55分别代入该方程可得y ≈49和y ≈57. 故预测该运动员训练47次和55次的成绩分别为49和57.。

人教版A版高中数学选修1-2课后习题解答

人教版A版高中数学选修1-2课后习题解答

人教版A版高中数学选修1-2课后习题解答高中数学选修1-2课后题答案第一章统计案例1.1 回归分析的基本思想及其初步应用回归分析是一种统计分析方法,用于探究自变量与因变量之间的关系。

它的基本思想是通过建立数学模型,利用已知数据进行拟合,从而预测或解释未知数据。

回归分析的初步应用包括简单线性回归和多元线性回归。

1.2 独立性检验的基本思想及其初步应用独立性检验是一种用于检验两个变量之间是否存在关联的方法。

其基本思想是通过观察两个变量之间的频数或频率分布,来判断它们是否相互独立。

独立性检验的初步应用包括卡方检验和Fisher精确检验。

第二章推理证明2.1 合情推理与演绎推理合情推理是指根据已知事实和常识,推断出可能的结论。

演绎推理是指根据已知的前提和逻辑规则,推导出必然的结论。

两种推理方法都有其适用的场合,需要根据具体情况进行选择。

2.2 直接证明与间接证明直接证明是指通过逻辑推理,直接证明所要证明的命题成立。

间接证明是指采用反证法或归谬法,证明所要证明的命题的否定不成立,从而推出所要证明的命题成立。

第三章数系的扩充与复数的引入3.1 数系的扩充与复数的概念数系的扩充是指在实数系的基础上引入新的数,使得一些原来不可解的方程可以得到解。

复数是指由实部和虚部组成的数,可以表示在平面直角坐标系中的点。

复数的引入扩充了数系,使得一些原本无解的方程可以得到解。

3.2 复数的代数形式的四则运算复数的代数形式是指将复数表示为实部和虚部的和的形式。

复数的四则运算包括加减乘除四种运算,可以通过对实部和虚部分别进行运算来得到结果。

第四章框图4.1 流程图流程图是一种用图形表示算法或过程的方法。

它由各种基本符号和连线构成,用于描述算法或过程的各个步骤及其执行顺序。

流程图可以帮助人们更好地理解算法或过程,从而提高效率。

4.2 结构图结构图是一种用于描述程序结构的图形表示方法。

它包括顺序结构、选择结构和循环结构三种基本结构,可以用来表示程序的控制流程。

回归分析的基本思想及其初步应用分解

回归分析的基本思想及其初步应用分解
真实值a,b,y
是真实值 与估计值 的差!
yˆi 0.849xi 85.712, ei yi yi ,
如e3 y3 y3 50 47.581 2.419
相关关系的测度
(相关系数取值及其意义)
完全负相关
无线性相关
完全正相关
-1.0 -0.5
0
+0.5 +1.0
r
负相关程度增加 正相关程度增加
编号,或身高数据,或体重估计值等,这样作出的图形称为残差图。
残差图的制作及作用。
•几点坐说标明纵:轴为残差变量,横轴可以有不同的选择; 的错第•误一。个若如样果模本数点据型和采选第集6有择个错样的误本,点正就的确予残以差,纠比残正较,大差然,图后需再要中重确新的认利在点用采线应集性过该回程归中分模是布型否拟有在合人以数为 据;如果横数据轴采集为没心有错的误带,则形需区要寻域找;其他的原因。 样的另•带外状,对区残域差于的点宽远比度较离越均窄横匀,地轴说落明的在模水点型平拟,的合带要精状度区特越域别高中,,注回说归意明方选。程用的的预模报型精计度较越合高适。,这
例1 从某大学中随机选取8名女大学生,其身高和 体重数据如下表所示:
编号 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170 体重/kg 48 57 50 54 64 61 43 59
求根据女大学生的身高预报她的体重的回归方程, 并预报一名身高为172cm的女大学生的体重.
(3)对回归模型进行统计检验; (4)利用回归模型,根据自变量去估计、预测、预 报因变量。
最小二乘法求线性回归直线方程:yˆ = bˆ x + aˆ
(x,y)称为样本点的中心。

【创新设计】2015-2016学年高中数学 第一章 统计案例 1.1 回归分析的基本思想及其初步应用

【创新设计】2015-2016学年高中数学 第一章 统计案例 1.1 回归分析的基本思想及其初步应用

2021/5/22
9
(2)残差平方和法
n
残差平方和
(yi-^yi)2,残差平方和 越小
,模型拟合效果
i=1
越好.
2021/5/22
10
(3)利用 R2 刻画回归效果
n
yi-^yi2
i=1
R2=1-
;R2 表示 解释 变量对于 预报 变量变化
n
yi- y 2
i=1
的贡献率.R2 越接近于 1 ,表示回归的效果越好.
2021/5/22
31
跟踪演练2 关于x与y有如下数据:
x2 4 5 6 8 y 30 40 60 50 70
为了对 x,y 两个变量进行统计分析,现有以下两种线性模 型:甲:y^ =6.5x+17.5,乙:y^ =7x+17,试比较哪个模
型拟合的效果更好.
2021/5/22
32
解 由题意得 y =50. 由甲模型可得 yi-y^ i 与 yi- y 的关系如下表:
2021/5/22
26
1.什么是传统机械按键设计?
传统的机械按键设计是需要手动按压按键触动PCBA上的 开关按键来实现功能的一种设计方式。
传统机械按键结构层图:

PCBA

开关 键
传统机械按键设计要点:
1.合理的选择按键的类型, 尽量选择平头类的按键,以 防按键下陷。
2.开关按键和塑胶按键设计 间隙建议留0.05~0.1mm,以 防按键死键。
yi-y^ i -0.5 -3.5 10 -6.5 0.5
yi- y -20 -10 10 0 20
5
^
5
∴∑
i=1
(yi-y
i)2=155,i∑=1

高中数学第一章统计案例1.1回归分析的基本思想及其初步应用课时跟踪训练含解析新人教A版选修1_

高中数学第一章统计案例1.1回归分析的基本思想及其初步应用课时跟踪训练含解析新人教A版选修1_

学习资料回归分析的基本思想及其初步应用[A组学业达标]1.关于回归分析,下列说法错误的是()A.在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定B.线性相关系数可以是正的也可以是负的C.在回归分析中,如果r2=1或r=±1,说明x与y之间完全线性相关D.样本相关系数r∈(-1,1)解析:样本的相关系数应满足-1≤r≤1.答案:D2.对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是()解析:用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.答案:A3.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R2分别如表:甲乙丙丁R20。

980。

780.500。

85A.甲B.乙C.丙D.丁解析:相关指数R2越大,表示回归模型的效果越好.答案:A4.某产品的广告费用x与销售额y的统计数据如表:根据上表可得回归方程y=错误!x+错误!中的错误!为9.4,据此模型预报广告费用为6万元时销售额为()A.63.6万元B.65。

5万元C.67。

7万元D.72。

0万元解析:样本点的中心是(3.5,42),则a,^=错误!-错误!错误!=42-9。

4×3。

5=9.1,所以回归直线方程是错误!=9.4x+9.1,把x=6代入得错误!=65。

5。

答案:B5.如果散点图中的所有的点都在一条斜率不为0的直线上,则残差为________,相关指数R2=________。

解析:由题意知y i=错误!i∴相应的残差错误!i=y i-错误!i=0.相关指数R2=1-错误!=1.答案:0 16.在研究气温和热茶销售杯数的关系时,若求得相关指数R2≈0。

85,则表明气温解释了________的热茶销售杯数变化,而随机误差贡献了剩余的________,所以气温对热茶销售杯数的效应比随机误差的效应大得多.解析:由相关指数R2的意义可知,R2≈0。

高中数学第一章统计案例1.1回归分析的基本思想及其初步应用1教案文新人教A版选修1

高中数学第一章统计案例1.1回归分析的基本思想及其初步应用1教案文新人教A版选修1

1.1回归分析的基本思想及其初步应用(1)精美句子1、善思则能“从无字句处读书”。

读沙漠,读出了它坦荡豪放的胸怀;读太阳,读出了它普照万物的无私;读春雨,读出了它润物无声的柔情。

读大海,读出了它气势磅礴的豪情。

读石灰,读出了它粉身碎骨不变色的清白。

2、幸福幸福是“临行密密缝,意恐迟迟归”的牵挂;幸福是“春种一粒粟,秋收千颗子”的收获. 幸福是“采菊东篱下,悠然见南山”的闲适;幸福是“奇闻共欣赏,疑义相与析”的愉悦。

幸福是“随风潜入夜,润物细无声”的奉献;幸福是“夜来风雨声,花落知多少”的恬淡。

幸福是“零落成泥碾作尘,只有香如故”的圣洁。

幸福是“壮志饥餐胡虏肉,笑谈渴饮匈奴血”的豪壮。

幸福是“先天下之忧而忧,后天下之乐而乐”的胸怀。

幸福是“人生自古谁无死,留取丹心照汗青”的气节。

3、大自然的语言丰富多彩:从秋叶的飘零中,我们读出了季节的变换;从归雁的行列中,我读出了集体的力量;从冰雪的消融中,我们读出了春天的脚步;从穿石的滴水中,我们读出了坚持的可贵;从蜂蜜的浓香中,我们读出了勤劳的甜美。

4、成功与失败种子,如果害怕埋没,那它永远不能发芽。

鲜花,如果害怕凋谢,那它永远不能开放。

矿石,如果害怕焚烧(熔炉),那它永远不能成钢(炼成金子)。

蜡烛,如果害怕熄灭(燃烧),那它永远不能发光。

航船,如果害怕风浪,那它永远不能到达彼岸。

5、墙角的花,当你孤芳自赏时,天地便小了。

井底的蛙,当你自我欢唱时,视野便窄了。

笼中的鸟,当你安于供养时,自由便没了。

山中的石!当你背靠群峰时,意志就坚了。

水中的萍!当你随波逐流后,根基就没了。

空中的鸟!当你展翅蓝天中,宇宙就大了。

空中的雁!当你离开队伍时,危险就大了。

地下的煤!你燃烧自己后,贡献就大了6、朋友是什么?朋友是快乐日子里的一把吉它,尽情地为你弹奏生活的愉悦;朋友是忧伤日子里的一股春风,轻轻地为你拂去心中的愁云。

朋友是成功道路上的一位良师,热情的将你引向阳光的地带;朋友是失败苦闷中的一盏明灯,默默地为你驱赶心灵的阴霾。

高中数学 第一章 统计案例 1.1 回归分析的基本思想及其初步应用教材解读素材 新人教A版选修1-2

高中数学第一章统计案例1.1 回归分析的基本思想及其初步应用教材解读素材新人教A版选修1-2编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第一章统计案例1.1 回归分析的基本思想及其初步应用教材解读素材新人教A版选修1-2)的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。

本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第一章统计案例1.1 回归分析的基本思想及其初步应用教材解读素材新人教A 版选修1-2的全部内容。

回归分析的基本思想及其初步应用教材解读错误!通过实际操作进一步理解建立两相关变量的线性回归模型的思想,求线性回归方程,判断回归模型拟合的好坏.错误!残差变量的解释与分析及指标R2的理解.错误!(四)思维总结(1)求回归直线方程的一般方法.①作出散点图,将问题所给的数据在平面直角坐标系中描点,这样表示出的具有相关关系的两个变量的一组数据的图形就是散点图,从散点图中我们可以看出样本点是否呈条状分布,从而判断两个变量是否线性相关.②求回归系数a,^,错误!,其中称为残差平方和,残差平方和在一定程度上反映了所选回归模型的拟合效果.残差平方和越小,说明模型的拟合效果越好;残差平方和越大,说明拟合效果越差.③通过残差分析判断模型拟合效果:先计算出残差错误!i=y i-错误!i=y i-错误!x i-错误!,i =1,2,…,n,然后横坐标选取为样本编号、解释变量或预报变量,纵坐标为残差,作出残差图.通过图形分析,如果样本点的残差较大,就要分析样本数据的采集是否有错误;另一方面,可以通过残差点分布的水平带状区域的宽窄说明模型拟合效果,反映回归方程的预报精度.带状区域的宽度越窄,说明模型的拟合精度越高,回归方程的预报精度越高.(3)相关指数R2.①相关指数的计算公式是R2=其中为残差平方和.相关指数用来刻画回归模型拟合的效果,R2的值越大,说明模型的拟合效果越好;R2的值越小,说明拟合效果越差.②如果某组样本数据可以采取几种不同的回归模型进行回归分析,则可以通过比较R2的值来作出选择,即选择R2值大的模型作为这组数据的回归模型.③在线性回归模型中R2是刻画回归效果的量,即表示回归模型的拟合效果,也表示解释变量和预报变量的线性相关关系.R2表示解释变量对预报变量变化的贡献率.。

回归分析的基本思想及其初步应用


我们可以用相关指数R2来刻画回归的效果,其计算公式是
显然,R2的值越大,说明残差平方和越小,也就是说模型拟合效果越好。
在线性回归模型中,R2表示解释量对预报变量变化的贡献率。
R2越接近1,表示回归的效果越好(因为R2越接近1,表示解释变量和预报变量的线性相关性越强)。
我们可以用相关指数R2来刻画回归的效果,其计算公式是
如果某组数据可能采取几种不同回归方程进行回归分析,则可以通过比较R2的值来做出选择,即选取R2较大的模型作为这组数据的模型。
总的来说: 相关指数R2是度量模型拟合效果的一种指标。 在线性模型中,它代表自变量刻画预报变量的能力。
我们可以用相关指数R2来刻画回归的效果,其计算公式是
例1的R2≈0.64 ,解释变量对总效应约贡献了64%,可以叙述为“身高解析了64%的体重变化”,而随机误差贡献了剩余的36%。所以,身高对体重的效应比随机误差的效应大得多。
回归方程:
3、回归分析的基本步骤:
画散点图
求回归方程
用回归直线方程预报、决策
这种方法称为回归分析.
回归分析是对具有相关关系的两个变量进行统计 分析的一种常用方法.
函数模型与回归模型之间的差别
函数模型:
回归模型:
线性回归模型y=bx+a+e增加了随机误差项e,因变量y的值由自变量x和随机误差项e共同确定,即自变量x只能解释部分y的变化。
错误数据 模型问题
几点说明: 第1个样本点和第6个样本点的残差比较大,需要确认在采集过程中是否有人为的错误。如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因。另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高。

高中数学1-2 第一章 统计案例1.1回归分析的基本思想及初步应用【学案】

1.1.2 回归分析的基本思想及其初步应用课标转述:①通过对典型案例(如“肺癌与吸烟有关吗”等)的探究,了解独立性检验的基本思想、方法及初步应用。

②通过对现行案例(如“质量控制”“新药是否有效"等)的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用.③通过对典型案例(如“昆虫分类”等)的探究,了解聚类分析的基本思想、方法及初步应用。

④通过对典型案例(如“人的体重与身高的关系”等)的探究,了解回归的基本思想、方法及初步应用学习目标:1、会建立回归模型,进而学习相关指数(相关指数R2、残差分析)2、会求上述的相关指数:3、从实际问题发现已有知识不足,激发好奇心、求知欲,培养勇于求知的良好个性品质.学习重、难点:残差分析,相关指数R2的计算、建立回归模型的步骤.学习过程:一、复习准备:1.由例1知,预报变量(体重)的值受解释变量(身高)或随机误差的影响。

2.为了刻画预报变量(体重)的变化在多大程度上与解释变量(身高)有关?在多大程度上与随机误差有关?我们引入了评价回归效果的两个统计量:残差、相关指数R2.二、自主学习:1。

残差:(1)残差的定义(2)残差的作用2.绘残差图6 7 8从残差图看:⑴那些点为可疑点?发现可疑点该如何办?⑵如何判断模型拟合程度?3。

相关指数R2R2=R 2越大,意味着残差平方和21ˆ()nii y y=-∑ ,即模型的拟合效果 ;R 2越小,意味着残差平方和21ˆ()nii y y=-∑ ,即模型的拟合效果 .。

例如例1,R 2≈表明“ ”或者 “ ”预报时需要注意下列问题:1. 2. 3. 4。

三.、例题解析:例2 关于x 与Y 有如下数据:x Y 种线性模型: 6.517.5y x =+,717y x =+,试比较哪一个模型拟合的效果更好。

四、课堂小结:从这节课你学到了什么?请自己尝试总结如下: 1. 2.五。

课后作业p8 练习。

安徽省高中数学第一章统计案例1.1回归分析的基本思想及其初步应用2教案文

观察 与 的散点图,可以发现变换后样本点分布在一条直线的附近,因此可以用线性回归方程来拟合.
④ 利用计算器算得 , 与 间的线性回归方程为 ,因此红铃虫的产卵数对温度的非线性回归方程为 .
⑤ 利用回归方程探究非线性回归问题,可按“作散点图 建模 确定方程”这三个步骤进行.
其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题.
② 根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y= 的周围(其中 是待定的参数),故可用指数函数模型来拟合这两个变量.
③ 在上式两边取对数,得 ,再令 ,则 ,而 与 间的关系如下:
X
21
23
25
27
29
32
35
z
1.946
2.398
3.045
3. 178
4.190
4.745
5.784
441
529
625
729
841
1024
1225
7
11
21
24
66
115
325
2. 讨论:能用二次函数模型 来拟合上述两个变量间的关系吗?(令 ,则 ,此时 与 间的关系如下:
观察 与 的散点图,可以发现样本点并不分布在一条直线的周围,因此不宜用线性回归方程来拟合它,即不宜用二次曲线 来拟合 与 之间的关系. )小结:也就是说,我们可以通过观察变换后的散点图来判断能否用此种模型来拟合. 事实上,除了观察散点图以外,我们也可先求出函数模型,然后利用残差分析的方法来比较模型的好坏.
教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较.
教学准备
直尺
教学过程
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

4.随机误差产生的原因
1. 回归直线的特征及引起预报值与真实值之间的误差的原 因 (1)回归直线过样本点的中心( x , y ). (2)在线性回归模型中,随机误差 e 的方差 σ2 越小,通过回 归直线y =bx+a预报真实值 y 的精确度越高.
∧ ∧ ∧
(3)引起预报值y 与真实值 y 之间的误差的原因: 一是随机误差 e,它引起预报值y 与真实值 y 之间的误差; 另一方面,由于a和b为截距和斜率的估计值,它们与真实 值 a 和 b 之间也存在着误差,它们引起了预报值y 和真实值 y 之间的差异.
∧ ∧ ∧
1.对于建立的回归模型进行残差分析,一般
从以下几方面进行: (1) 残差图; (2) 残差平方和; (3) 相关指
数. 2.相关指数R2的作用 利用相关指数R2可以刻画拟合效果的好坏.在线性回归模 型中, R2 的取值越接近 1 ,说明残差的平方和越小,即说明模
型的拟合效果越好.
2.在比较两个模型的拟合效果时,甲、乙两个模型的相
试求:(1)y与x之间的回归方程;
(2)当使用年限为10年时,估计维修费用是多少?
解析: (1)根据表中数据作散点图,如图所示:
从散点图可以看出,样本点都集中分布在一条直线附近, 因此 y 与 x 之间具有线性相关关系.利用题中数据得: 1 x =5(2+3+4+5+6)=4, 1 y =5(2.2+3.8+5.5+6.5+7.0)=5,
答案: 6.5

4.关于 x 与 y 有如下数据: x y

2 30
4 40
5 60

6 50
8 70
为了对 x、y 两个变量进行统计分析,现有以下两种线性模 型:甲模型y=6.5x+17.5,乙模型y=7x+17,试比较哪一个模 型拟合的效果更好.
y i- y i 2
i=1
5

解析:

残差图
2 残差平 y - y i i i=1 ,残差平方和 方和 残差平方和为___________________ 越小 ,模型拟合效果越好 _______
n

y i- y i 2
i= 1
n

相关指 数R2
解释 i=1 R2=1_______________________ ,R2表示_______ 预报 变量变化的贡献率,R2越接近于 变量对_________ 1,表示回归的效果越好
∧ ∧ ∧ ∧
④因为由任何一组观测值都可以求得一个回归直线方程, 所以没有必要进行相关性检验. 其中正确说法的个数是( )
A.1
C.3 解析:
B.2
D.4 ①反映的正是最小二乘法思想,故正确.②反映
的是画散点图的作用,也正确.③反映的是回归模型y=bx+a +e,其中e为随机误差,故也正确.1.23×4=0.08, ∴线性回归方程为y =1.23x+0.08. (2)当 x=10 时,y =1.23×10+0.08=12.38(万元),即当使 用 10 年时,估计维修费用是 12.38 万元.
∧ ∧

残差分析
某运动员训练次数与运动成绩之间的数据关系如
下: 次数(x) 成绩(y) 30 30 33 34 35 37 37 39 39 42 44 46 46 48 50 51
关指数 R2 的值分别约为 0.96 和 0.85 ,则拟合效果好的模型是
________. 答案: 甲
非线性回归分析
为了研究某种细菌繁殖个数 y 随时间 x 的变化情况,
收集数据如下: 天数x/天 繁殖个数y/个 1 6 2 12 3 25 4 49 5 95 6 190
(1)用天数作解释变量,繁殖个数作预报变量,作出上述数
a= y -b x =-0.003 875, ∴回归方程为y =1.041 5x-0.003 875.

(3)残差分析 作残差图如下图所示,由图可知,残差点比较均匀地分布 在水平带状区域中,说明选用的模型比较合适.
(4)计算相关指数 R2 计算相关指数 R2≈0.985 5.说明了该运动员的成绩的差异 有 98.55%是由训练次数引起的. (5)做出预报 由上述分析可知,我们可用回归方程 y = 1.041 5x - 0.003 875 作为该运动员成绩的预报值. 将 x=47 和 x=55 分别代入该方程可得 y=49 和 y=57. 故预测该运动员训练 47 次和 55 次的成绩分别为 49 和 57.
解析: 回归直线一定过样本点的中心( x ,y ), 故 C 正确.
答案: C
)
3. 已知某车间加工零件的个数 x 与所花费时间 y(h)之间的 线性回归方程为 y =0.01x+0.5,则加工 600 个零件大约需要 ________小时.

解析: 把 x=600 代入方程得y=0.01×600+0.5=6.5.
点图,如下图所示,由散点图可知,它们之间具有线性相关关
(2)列表计算:
次数 xi 30 33 35 37 39 44 46 50 成绩 yi 30 34 37 39 42 46 48 51 x2 i 900 1 089 1 225 1 369 1 521 1 936 2 116 2 500 x iy i 900 1 122 1 295 1 443 1 638 2 024 2 208 2 550
某班5名学生的数学和物理成绩如下表:
学生
学科 数学成绩(x) 物理成绩(y) (1)画出散点图;
A 88 78
B 76 65
C 73 71
D 66 64
E 63 61
(2)求物理成绩y对数学成绩x的回归直线方程; (3)一名学生的数学成绩是96,试预测他的物理成绩.
[思路点拨]
(1)散点图如图.
( x , y ) ,回归直线过样本 2.变量样本点的中心:_____________ 点的中心.
bx+a+e a 和___ 3.线性回归模型y=______________ ,其中___ b 是模
解释变量 , 型的未知参数,__ e 称为随机误差.自变量x又称为_________ 预报变量 因变量y又称为______________ .
1 (2) x =5×(88+76+73+66+63)=73.2, 1 y =5×(78+65+71+64+61)=67.8.
x iyi = 88×78 + 76×65 + 73×71 + 66×64 + 63×61 = 25
i=1
5
054.
2 2 2 2 2 x2 i =88 +76 +73 +66 +63 =27 174. i=1 5
xiyi-5 x y
所以b=

5
i= 1 5
2 - 5 x x2 i i=1

25 054-5×73.2×67.8 = ≈0.625. 27 174-5×73.22
a= y -b x ≈67.8-0.625×73.2=22.05. 所以 y 对 x 的回归直线方程是 y=0.625x+22.05. (3)x=96,则 y =0.625×96+22.05≈82,即可以预测他的 物理成绩是 82.
线性回归模型
y=bx+a ,其中: 1.回归直线方程:______________
∧ ∧ ∧
xi- x yi- y

n
i=1 n
b=
y -b x , ,a=_________


2 x - x i i=1
1n xi ni x =_____________ =1 ,
y
1n yi n =________________. i=1
方程之前必须进行相关性检验,以确定两变量的关系.
答案: C
2.为了研究变量 x 和 y 的线性相关性,甲、乙两人分别利 用线性回归方法得到回归直线 l1 和 l2,已知两人计算过程中 x , y 分别相同,则下列说法正确的是( A.l1 与 l2 一定平行 B.l1 与 l2 重合 C.l1 与 l2 相交于点( x , y ) D.无法判断 l1 和 l2 是否相交
xiyi=2×2.2+3×3.8+4×5.5+5×6.5+6×7.0=112.3,
i=1 5 2 2 2 2 2 2 x = 2 + 3 + 4 + 5 + 6 =90, i i=1
5
xiyi-5 x y
所以b=

5
i= 1 5
2 - 5 x x2 i i=1

112.3-5×4×5 = =1.23, 90-5×42
第一 章
统计案例
1.1 回归分析的基本思想及其初步应用
自主学习•新知突破
1.了解回归分析的基本思想.
2.会求线性回归直线方程.
3.了解残差平方和、相关指数的概念. 4.了解回归分析的基本步骤.
1.在《必修3》中,我们已经学习了两个变量间的相关关 系.利用了什么方法对两个具有线性相关关系的变量进行了研 究? [提示] 利用了回归分析的方法对两个具有线性相关关系 的变量进行了研究. 2.回归分析的基本步骤是什么? [提示] ①画出两个变量的散点图; ②求回归直线方程; ③用回归直线方程进行预报.
∵R甲=1-
2
2 y - y i i=1 5
5
155 =1-1 000=0.845,
y i- y i 2
i= 1

R乙=1-
2
y i- y 2
i= 1
5
180 =1-1 000=0.82,
∵84.5%>82%,∴甲模型拟合的效果更好.
合作探究•课堂互动
线性回归分析
据的散点图;
(2)试求出预报变量对解释变量的回归方程.
[思路点拨] 作散点图 ⇒ 从散点图确定y与x的近似函数关系 ⇒ 变量替换 ⇒ 对新数据求回归直线方程 ⇒ 变量替回得y与x的回归方程
相关文档
最新文档