线性回归方程高考题讲解

线性回归方程高考题讲解
线性回归方程高考题讲解

线性回归方程高考题

1、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗(吨标准煤)的几组对照数据:

3 4 5 6

2.5 3 4 4.5

(1)请画出上表数据的散点图;

(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;

(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:)

2、假设关于某设备的使用年限x和所支出的维修费用y(万元)统计数据如下:

使用年限x 2 3 4 5 6

维修费用y 2.2 3.8 5.5 6.5 7.0

若有数据知y对x呈线性相关关系.求:

(1)填出下图表并求出线性回归方程=bx+a的回归系数,;

序号x y xy x2

1 2 2.2

2 3 3.8

3 4 5.5

4 5 6.5

5 6 7.0

(2) 估计使用10年时,维修费用是多少.

3、某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四实试验,得到的数据如下:

零件的个数x(个) 2 3 4 5

加工的时间y(小时) 2.5 3 4 4.5

(1)在给定的坐标系中画出表中数据的散点图;

(2)求出y关于x的线性回归方程,并在坐标系中画出回归直线;

(3)试预测加工10个零件需要多少时间?

(注:

4、某服装店经营的某种服装,在某周内获纯利(元)与该周每天销售这种服装件数之间的一组数据关系如下表:

3 4 5 6 7 8 9

66 69 73 81 89 90 91

已知:.

(Ⅰ)画出散点图;(1I)求纯利与每天销售件数之间的回归直线方程.

5、某种产品的广告费用支出与销售额之间有如下的对应数据:

2 4 5 6 8

30 40 60 50 70

(1)画出散点图:

(2)求回归直线方程;

(3)据此估计广告费用为10时,销售收入的值.

6、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:

x 3 4 5 6

y 2.5 3 4 4.5

(I)请画出上表数据的散点图;

(II)请根据上表提供的数据,求出y关于x的线性回归方程;(III)已知该厂技术改造前100吨甲产品能耗为90吨标准煤.试根据(II)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?

(参考公式及数据:,)

7、以下是测得的福建省某县某种产品的广告费支出x与销售额y(单位:百万元)之间,有如下的对应数据:

广告费支出x 2 4 5 6 8

销售额y 30 40 60 50 70

(1)画出数据对应的散点图,你能从散点图中发现福建省某县某种产品的广告费支出x与销售额y(单位:百万元)之间的一般规律吗?

(2)求y关于x的回归直线方程;

(3)预测当广告费支出为2(百万元)时,则这种产品的销售额为多少?(百万元)

8、在某种产品表面进行腐蚀线实验,得到腐蚀深度y与腐蚀时间t之间对应的一组数据:

时间t(s) 5 10 15 20 30

深度y(m) 6 10 10 13 16

(1)画出散点图;

(2)试求腐蚀深度y对时间t的回归直线方程。

线性回归方程的求法(需要给每个人发)

耿老师总结的高考统计部分的两个重要公式的具体如何应用 第一公式:线性回归方程为???y bx a =+的求法: (1) 先求变量x 的平均值,既1231()n x x x x x n = +++???+ (2) 求变量y 的平均值,既1231()n y y y y y n =+++???+ (3) 求变量x 的系数?b ,有两个方法 法112 1()()?()n i i i n i i x x y y b x x ==--=-∑∑(题目给出不用记忆)[]112222212()()()()...()()()()...()n n n x x y y x x y y x x y y x x x x x x --+--++--=??-+-++-?? (需理解并会代入数据) 法21 2 1()()?()n i i i n i i x x y y b x x ==--=-∑∑(题目给出不用记忆) []1122222212...,...n n n x y x y x y nx y x x x nx ++-?=??+++-??(这个公式需要自己记忆,稍微简单些) (4) 求常数?a ,既??a y bx =- 最后写出写出回归方程???y bx a =+。可以改写为:??y bx a =-(?y y 与不做区分) 例.已知,x y 之间的一组数据: 求y 与x 的回归方程: 解:(1)先求变量x 的平均值,既1(0123) 1.54x = +++= (2)求变量y 的平均值,既1(1357)44 y =+++= (3)求变量x 的系数?b ,有两个方法

法1?b = []11223344222212342222()()()()()()()()()()()()(0 1.5)(14)(1 1.5)(34)(2 1.5)(54)(3 1.5)(74)57(0 1.5)(1 1.5)(2 1.5)(3 1.5)x x y y x x y y x x y y x x y y x x x x x x x x --+--+--+--=??-+-+-+-??--+--+--+--==??-+-+-+-?? 法2?b =[][]11222222222212...011325374 1.5457 ...0123n n n x y x y x y nx y x x x nx ++-??+?+?+?-??==????+++-+++???? (4)求常数?a ,既525??4 1.577a y bx =-=-?= 最后写出写出回归方程525???77 y bx a x =+=+ 第二公式:独立性检验 两个分类变量的独立性检验: 注意:数据a 具有两个属性1x ,1y 。数 据b 具有两个属性1x ,2y 。数据c 具有两个属性2x ,2y 数据d 具有两个属性2x ,2y 而且列出表格是最重要。解题步骤如下 第一步:提出假设检验问题 (一般假设两个变量不相关) 第二步:列出上述表格 第三步:计算检验的指标 2 2 ()()()()()n ad bc K a b c d a c b d -=++++ 第四步:查表得出结论 例如你计算出2K =9大于表格中7.879,则查表可得结论:两个变量之间不相关概率为0.005,或者可以肯定的说两个变量相关的概率为0.995.或095.50 例如你计算出2K =6大于表格中5.024,则查表可得结论:两个变量之间不相关概率为0.025,或者可以肯定的说两个变量相关的概率为0.995.或097.50 上述结论都是概率性总结。切记事实结论。只是大概行描述。具体发生情况要和实际联系!! !!

高考试题 回归分析,独立性检验

回归分析与独立性检验 1.高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学生. 从这次考试成绩看, ①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ; ②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 . 2.根据下面给出的2004年至2013年我国二氧化碳年排放量(单位:万吨)柱形图,以下结论中不正确的是( ) A .逐年比较,2008年减少二氧化碳排放量的效果最显着 B .2007年我国治理二氧化碳排放显现成效 C .2006年以来我国二氧化碳年排放量呈减少趋势 D .2006年以来我国二氧化碳年排放量与年份正相关 3.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 根据上表可得回归直线方程???y bx a =+ ,其中???0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元家庭年支出为( )] A .11.4万元 B .11.8万元 C .12.0万元 D .12.2万元 4.在画两个变量的散点图时,下面哪个叙述是正确的 ( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在 y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上 5 2004年 2005年 2006年 2007年 2008年 2009年 2010年 2011年 2012年 2013年

根据以上数据,则 ( ) A .种子经过处理跟是否生病有关 B .种子经过处理跟是否生病无关 C .种子是否经过处理决定是否生病 D .以上都是错误的 6.变量x 与y 具有线性相关关系,当x 取值16,14,12,8时,通过观测得到y 的值分别为11,9,8,5,若在实际问题 中,y 的预报最大取值是10,则x 的最大取值不能超过 ( ) A .16 B .17 C .15 D .12 7.在研究身高和体重的关系时,求得相关指数≈2 R ___________,可以叙述为“身高解释了64%的体重变化,而随机 误差贡献了剩余的36%”所以身高对体重的效应比随机误差的效应大得多。 8.下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图 (I )由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (II )建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量。 参考数据: 7 1 9.32i i y ==∑,7 1 40.17i i i t y ==∑, 7 2 1 () 0.55i i y y =-=∑, 7≈2.646. 参考公式:相关系数1 2 2 1 1 ()() ()(y y)n i i i n n i i i i t t y y r t t ===--= --∑∑∑, 回归方程 y a bt =+ 中斜率和截距的最小二乘估计公式分别为: 9.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图. 根据该折线图,下列结论错误的是 A .月接待游客量逐月增加 B .年接待游客量逐年增加 C .各年的月接待游客量高峰期大致在7,8月 D .各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳 10.为了研究某班学生的脚长x (单位:厘米)和身高 y (单位:厘米)的关系,从该班随机抽取10名学生,根据测 量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为???y bx a =+.已知10 1 225i i x ==∑,10 1 1600i i y ==∑,?4b =.该班某学生的脚长为24,据此估计其身高为 (A )160 (B )163 (C )166 (D )170 11.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg )某频率分布直方图如下: (1) 设两种养殖方法的箱产量相互独立,记A 表示事件:“旧养殖法的箱产量低于50kg, 新养殖法的箱产量不低

最新高考数学复习点拨-非线性回归问题

非线性回归问题 两个变量不呈线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型。分析非线性回归问题的具体做法是: (1)若问题中已给出经验公式,这时可以将变量x 进行置换(换元),将变量的非线性关系转化为线性关系,将问题化为线性回归分析问题来解决. (2)若问题中没有给出经验公式,需要我们画出已知数据的散点图,通过与各种已知函数(如指数函数、对数函数、幂函数等)的图象作比较,选择一种与这些散点拟合得最好的函数,然后采用适当的变量置换,将问题化为线性回归分析问题来解决. 下面举例说明非线性回归分析问题的解法. 例1 在彩色显影中,由经验可知:形成染料光学密度y 与析出银的光学密度x 由公式 e b x y A =(b <0)表示,现测得实验数据如下: 试求对的回归方程. 分析:该例是一个非线性回归分析问题,由于题目中已给定了要求的曲线为e b x y A =(b <0)类型,我们只要通过所给的11对样本数据求出A 和b ,即可确定x 与y 的相关关系的曲线方程. 解:由题意可知,对于给定的公式e b x y A =(b <0)两边取自然对数,得ln ln b y A x =+. 与线性回归方程对照可以看出,只要取1 u x = ,ln v y =,ln a A =,就有v a bu =+,这是v 对u 的线性回归直线方程,对此我们再套用相关性检验,求回归系数b 和a . 题目中所给数据由变量置换1 u = ,ln v y =变为如表所示的数据: 由于|r |=0.998>0.602,可知u 与v 具有很强的线性相关关系. 再求得0.146b =-,0.548a =, ∴v =0.5480.146u -,把u 和v 置换回来可得0.146 ln 0.548y x =- , ∴0.1460.1460.1460.5480.548 e 1.73x x x y e e e - - - ===, ∴回归曲线方程为0.1461.73e x y - =. 点评:解决本题的思路是通过适当的变量置换把非线性回归方程转化为线性回归方程,

线性回归方程分析讲课教案

线性回归方程分析

环球雅思学科教师辅导讲义讲义编号:组长签字:签字日期:

又y 对x 的线性回归方程表示的直线恒过点(x -,y - ), 所以将(176,176)代入A 、B 、C 、D 中检验知选C. 答案 C 3.(2011·陕西)设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个 样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是 ( ). A .x 和y 的相关系数为直线l 的斜率 B .x 和y 的相关系数在0到1之间 C .当n 为偶数时,分布在l 两侧的样本点的个数一定相同 D .直线l 过点(x -,y -) 解析 因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的 绝对值越接近1,两个变量的线性相关程度越强,所以A 、B 错误.C 中n 为偶数时,分布在l 两侧的样本点的个数可以不相同,所以C 错误.根据回 归直线方程一定经过样本中心点可知D 正确,所以选D. 答案 D 4.(2011·广东)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x (单位:小时)与当天投篮命中率y 之间的关系: 时间x 1 2 3 4 5 命中率y 0.4 0.5 0.6 0.6 0.4 小李这5天的平均投篮命中率为________;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为________. 解析 小李这5天的平均投篮命中率 y -=0.4+0.5+0.6+0.6+0.4 5 =0.5, 可求得小李这5天的平均打篮球时间x -=3.根据表中数据可求得b ^=0.01,a ^ = 0.47,故回归直线方程为y ^ =0.47+0.01x ,将x =6代入得6号打6小时篮球的 投篮命中率约为0.53. 答案 0.5 0.53 5.(2011·辽宁)调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与

线性回归方程公式证明

112233^ ^^^2 211(,),(,),(,)(,)1,2,3),()()n n i i i i i i n i i i i i i n x y x y x y x y y bx a x i n y bx a y y y a b Q y y bx a y ===+==+-=-=+-∑L L 设有对观察值,两变量符合线生回归设其回归方程为:,把自变量的某一观测值代(入入回归方程得:,此值与实际观测值存在一个差值,此差值称为剩余或误差。现要决定取何值时,才能够使剩余的平方和有最小值,即求11 2 21122 221 1111 22111:,()[()()()]()()()2()()2()()2()() ()2n n n i i i i n n i i i i i i n n n i i i i i i n n i i i i i n i i x x y y n n Q bx a y a bx y y y b x x n a bx y y y b x x a bx y y y a bx y x x b x x y y b x x =============+-=+---+-=+-+-+--+---+-----=--∑∑∑∑∑∑∑∑∑∑∑的最小值知又22 111 122211()()()()()()()()n n i i i i i n n i i i i i i n n i i i i b x x y y n a bx y y y b x x y y x y nx y b x x x n x a y bx ======--++-+----==--=-∑∑∑∑∑∑此式为关于的一元二次方程,当

2010-2019高考真题分类训练文数专题十 概率与统计第二十九讲 回归分析与独立性检验

专题十 概率与统计 第二十九讲 回归分析与独立性检验 2019年 1.(2019全国1文17)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表: (1)分别估计男、女顾客对该商场服务满意的概率; (2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异? 附:2 2 ()()()()() n ad bc K a b c d a c b d -=++++. 2010-2018年 一、选择题 1.(2015湖北)已知变量x 和y 满足关系0.11y x =-+,变量y 与z 正相关,下列结论中正确的是 A .x 与y 正相关,x 与z 负相关 B .x 与y 正相关,x 与z 正相关 C .x 与y 负相关,x 与z 负相关 D .x 与y 负相关,x 与z 正相关 2.(2014湖北)根据如下样本数据 得到的回归方程为?y bx a =+,则 A .0a >,0b < B .0a >,0b > C .0a <,0b < D .0a <,0b >

3.(2014江西)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关 系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是 4.(2012新课标)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不 全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线1 12 y x =+上,则这组样本数据的样本相关系数为 A .?1 B .0 C .1 2 D .1 5.(2012湖南)设某大学的女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关 系,根据一组样本数据(i x ,i y )(i =1,2,…,n ),用最小二乘法建立的回归方程为 $y =0.85x -85.71,则下列结论中不正确... 的是 A .y 与x 具有正的线性相关关系 B .回归直线过样本点的中心(x ,y ) C .若该大学某女生身高增加1cm ,则其体重约增加0.85kg D .若该大学某女生身高为170cm ,则可断定其体重必为58.79kg 6.(2011山东)某产品的广告费用x 与销售额y 的统计数据如下表 广告费用x (万元) 4 2 3 5 销售额y (万元) 49 26 39 54 根据上表可得回归方程???y bx a =+中的?b 为9.4,据此模型预报广告费用为6万元时销

线性回归方程高考题讲解

线性回归方程高考题讲解

线性回归方程高考题 1、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗(吨标准煤)的几组对照数据: 3 4 5 6 2.5 3 4 4.5 (1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:)

2、假设关于某设备的使用年限x和所支出的维修费用y(万元)统计数据如下: 使用年限x 2 3 4 5 6 维修费用y 2.2 3.8 5.5 6.5 7.0 若有数据知y对x呈线性相关关系.求: (1) 填出下图表并求出线性回归方程=bx+a的回归系数,; 序号x y xy x2 1 2 2.2 2 3 3.8 3 4 5.5 4 5 6.5 5 6 7.0 ∑ (2) 估计使用10年时,维修费用是多少.

3、某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四实试验,得到的数据如下: 零件的个数x(个) 2 3 4 5 加工的时间y(小时) 2.5 3 4 4.5 (1)在给定的坐标系中画出表中数据的散点图; (2)求出y关于x的线性回归方程,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少时间? (注:

4、某服装店经营的某种服装,在某周内获纯利(元)与该周每天销售这种服装件数之间的一组数据关系如下表: 3 4 5 6 7 8 9 66 69 73 81 89 90 91 已知:. (Ⅰ)画出散点图; (1I)求纯利与每天销售件数之间的回归直线方程. 5、某种产品的广告费用支出与销售额之间有如下的对应数据: 2 4 5 6 8 30 40 60 50 70 (1)画出散点图: (2)求回归直线方程;

线性回归方程题型

线性回归方程 1.【2014高考全国2第19题】某地区2007年至2013年农村居民家庭纯收入y(单位:千元)的数据如下表: (Ⅰ)求y关于t的线性回归方程; (Ⅱ)利用(Ⅰ)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘法估计公式分别为: ()() () 1 2 1 n i i i n i i t t y y b t t ∧ = = -- = - ∑ ∑ ,? ?a y bt =- 2.【2016年全国3】下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图. 注:年份代码1–7分别对应年份2008–2014. (Ⅰ)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;

(Ⅱ)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注: 参考数据: 7 1 9.32i i y ==∑,7 1 40.17i i i t y ==∑ 0.55=,≈2.646. 参考公式:()() n i i t t y y r --= ∑ 回归方程y a bt =+ 中斜率和截距的最小二乘估计公式分别为: 1 2 1 ()() ()n i i i n i i t t y y b t t ==--= -∑∑ ,=.a y bt - 3.【2015全国1】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的宣传费i x 和年销售量()1,2,,8i y i = 数据作了初步处理,得到下面的散点图及一些统计量的值.

高考试题回归分析,独立性检验

高考试题回归分析,独立 性检验 标准化工作室编码[XX968T-XX89628-XJ668-XT689N]

回归分析与独立性检验 1.高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学生. 从这次考试成绩看, ①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ; ②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 . 2.根据下面给出的2004年至2013年我国二氧化碳年排放量(单位:万吨)柱形图,以下结论中不正确的是( ) A .逐年比较,2008年减少二氧化碳排放量的效果最显着 B .2007年我国治理二氧化碳排放显现成效 C .2006年以来我国二氧化碳年排放量呈减少趋势 D .2006年以来我国二氧化碳年排放量与年份正相关 3.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 根据上表可得回归直线方程???y bx a =+ ,其中???0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元家 庭年支出为( )] A .万元 B .万元 C .万元 D .万元 4.在画两个变量的散点图时,下面哪个叙述是正确的 ( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在 y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上 5 ( ) A .种子经过处理跟是否生病有关 B .种子经过处理跟是否生病无关 2004年 2005年 2006年 2007年 2008年 2009年 2010年 2011年 2012年 2013年 190020002100220023002400250026002700

多元线性回归模型公式().docx

二、多元线性回归模型 在多要素的地理环境系统中,多个(多于两个)要素之间也存在着相互影响、相互关联的情况。因此,多元地理回归模型更带有普遍性的意义。 (一)多元线性回归模型的建立 假设某一因变量 y 受 k 个自变量 x 1, x 2 ,..., x k 的影响,其 n 组观测值为( y a , x 1 a , x 2 a ,..., x ka ), a 1,2,..., n 。那么,多元线性回归模型的结构形式为: y a 0 1 x 1a 2 x 2 a ... k x ka a () 式中: 0 , 1 ,..., k 为待定参数; a 为随机变量。 如果 b 0 , b 1 ,..., b k 分别为 0 , 1 , 2 ..., k 的拟合值,则回归方程为 ?= b 0 b 1x 1 b 2 x 2 ... b k x k () 式中: b 0 为常数; b 1, b 2 ,..., b k 称为偏回归系数。 偏回归系数 b i ( i 1,2,..., k )的意义是,当其他自变量 x j ( j i )都固定时,自变量 x i 每变 化一个单位而使因变量 y 平均改变的数值。 根据最小二乘法原理, i ( i 0,1,2,..., k )的估计值 b i ( i 0,1,2,..., k )应该使 n 2 n 2 Q y a y a y a b 0 b 1 x 1a b 2 x 2a ... b k x ka min () a 1 a 1 有求极值的必要条件得 Q n 2 y a y a b 0 a 1 () Q n 2 y a y a x ja 0( j 1,2,..., k) b j a 1 将方程组()式展开整理后得:

高考试题回归分析,独立性检验

高考试题回归分析,独 立性检验 TTA standardization office【TTA 5AB- TTAK 08- TTA 2C】

回归分析与独立性检验 1.高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学生. 从这次考试成绩看, ①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ; ②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 . 2.根据下面给出的2004年至2013年我国二氧化碳年排放量(单位:万吨)柱形图,以下结论中不正确的是( ) A .逐年比较,2008年减少二氧化碳排放量的效果最显着 B .2007年我国治理二氧化碳排放显现成效 C .2006年以来我国二氧化碳年排放量呈减少趋势 D .2006年以来我国二氧化碳年排放量与年份正相关 3.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 根据上表可得回归直线方程???y bx a =+ ,其中???0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元 家庭年支出为( )] A .万元 B .万元 C .万元 D .万元 4.在画两个变量的散点图时,下面哪个叙述是正确的 ( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在 y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上 5 2004年 2005年 2006年 2007年 2008年 2009年 2010年 2011年 2012年 2013年

线性回归方程

线性 回归 方程 统计总课时第18课时分课题线性回归方程分课时第1 课时 教学目标了解变量之间的两种关系,了解最小平方法〔最小二乘法〕的思想,会用公式求解回归系数. 重点难点最小平方法的思想,线性回归方程的求解. 线性回归方程 某小卖部为了了解热茶销量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对照表: 气温/C ?26 18 13 10 4 -1 杯数20 24 34 38 50 64假设某天的气温是C? -5,那么你能根据这些数据预测这天小卖部卖出热茶的杯数吗? 新课教学 1.变量之间的两类关系: 〔1〕函数关系: 〔2〕相关关系: 2.线性回归方程: 〔1〕散点图: 〔2〕最小平方法〔最小二乘法〕:〔3〕线性相关关系: 〔4〕线性回归方程、回归直线:3.公式: [来源:https://www.360docs.net/doc/d313721712.html,] 4.求线性回归方程的一般步骤: x y O

例题剖析 例1 下表为某地近几年机动车辆数与交通事故数的统计资料,请判断机动车辆数与交通事故数之间是否具有线性相关关系,如果具有线性相关关系,求出线性回归方程;如果不具有线性相关关系,说明理由.[来源:学&科&网] 机动车辆数x/千辆95 110 112 120 129 135 150 180 交通事故数y/千件 6.2 7.5 7.7 8.5 8.7 9.8 10.2 13 [来源:1ZXXK]

思考:如图是1991年到2000年北京地区年平均气温〔单位:C 〕与年降雨量〔单位:mm 〕的散点图,根据此图能求出它的回归直线方程吗?如果能,此时求得的回归直线方程有意义吗? 巩固练习 1x /百万元 [来 源:Z+xx+https://www.360docs.net/doc/d313721712.html,] 2 4 5 6 8 y /百万元 30 40 60 50 70 〔1〕画出散点图; 〔2〕求线性回归方程. 课堂小结 了解变量之间的两种关系,了解最小平方法的思想,会用公式求解回归系数. x y 100 200 300 400 500 600 12.40 12.60 12.80 13.00

多元线性回归的计算方法

多元线性回归的计算方法 摘要 在实际经济问题中,一个变量往往受到多个变量的影响。例如,家庭 消费支出,除了受家庭可支配收入的影响外,还受诸如家庭所有的财富、物价水平、金融机构存款利息等多种因素的影响,表现在线性回归模型中的解释变量有多个。这样的模型被称为多元线性回归模型。 多元线性回归的基本原理和基本计算过程与一元线性回归相同,但由 于自变量个数多,计算相当麻烦,一般在实际中应用时都要借助统计软件。这里只介绍多元线性回归的一些基本问题。 但由于各个自变量的单位可能不一样,比如说一个消费水平的关系式中,工资水平、受教育程度、职业、地区、家庭负担等等因素都会影响到消费水平,而这些影响因素(自变量)的单位显然是不同的,因此自变量前系数的大小并不能说明该因素的重要程度,更简单地来说,同样工资收入,如果用元为单位就比用百元为单位所得的回归系数要小,但是工资水平对消费的影响程度并没有变,所以得想办法将各个自变量化到统一的单位上来。前面学到的标准分就有这个功能,具体到这里来说,就是将所有变量包括因变量都先转化为标准分,再进行线性回归,此时得到的回归系数就能反映对应自变量的重要程度。这时的回归方程称为标准回归方程,回归系数称为标准回归系数,表示如下: Zy=β1Zx1+β2Zx2+…+βkZxk 注意,由于都化成了标准分,所以就不再有常数项a 了,因为各自变量都取平均水平时,因变量也应该取平均水平,而平均水平正好对应标准分0,当等式两端的变量都取0时,常数项也就为0了。 多元线性回归模型的建立 多元线性回归模型的一般形式为 Yi=β0+β1X1i+β2X2i+…+i i i i h x υβ+ =1,2,…,n 其中 k 为解释变量的数目,j β=(j=1,2,…,k)称为回归系数 (regression coefficient)。上式也被称为总体回归函数的随机表达式。它的非随机表达式为 E(Y∣X1i,X2i,…Xki,)=β0+β1X1i+β2X2i+…+βkXki βj 也被称为偏回归系数(partial regression coefficient) 多元线性回归的计算模型

高考必备——回归分析

高考必备——线性回归分析 【基础自测】 1.如果一组具有相关关系的数据1122(,),(,), ,(,),n n x y x y x y 作出散点图大致分布在一条直线附近, 那么我们称这样的变量之间的关系为 关系(也称一元线性相关),这条直线就是 ,记为 .其中: 1 2 1 ()()() n i i i n i i x x y y b x x ==--= -∑∑12 21 n i i i n i i x y nx y x nx ==-= -∑∑ ; a y bx =- 其中(,)i i x y 为样本数据,11,n n i i i i x x y y n n ==∑∑为样本平均数,(,)x y 称为 ,且所求线性回 归直线经过样本点中心点 当回归直线斜率0b >时,为线性 , 0b < 时为线性 特别注意: (1).以散点图分析线性相关关系,散点图是较粗略地分析和判断两个具有相关关系的变量是否线性相关的问题,如果是线性相关的,我们可以求其线性回归方程,如果不是线性向相关的,即使求得线性回归方程,也是无效的;也就是说不能对一些数据进行分析判断,不能应用它解决和解释一些实际问题. (2).以相关系数分析线性相关关系的强弱 两个变量之间的相关关系的样本相关系数: ()() n i i x x y y r --= ∑可衡量是否线性相关,以及线性相性关系的强弱.由于分子与线性回归 方程中的斜率b 的分子一样(这也给出了公式的内在联系以及公式的记法),因此,当0r >时,两个变量正相关;当0r <时两个变量 .当r 的绝对值接近1,表明两个变量的线性相关性 ;当r 的绝对值接近0,表明两个变量之间几乎不存在线性相关关系.规定当0.75r >时,我们认为两个变量有很强的 相关关系.

线性回归方程

2.4线性回归方程 重难点:散点图的画法,回归直线方程的求解方法,回归直线方程在现实生活与生产中的应. 考纲要求:①会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系. ②了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 经典例题:10.有10名同学高一(x)和高二(y)的数学成绩如下: ⑴画出散点图; ⑵求y对x的回归方程。 当堂练习: 1.下表是某小卖部一周卖出热茶的杯数与当天气温的对比表:若热茶杯数y与气温x近似地满足线性关系,则其关系式最接近的是() . .

. . A . B . C . D . 2.线性回归方程表示的直线必经过的一个定点是( ) A . B . C . D . 3.设有一个直线回归方程为 ,则变量x 增加一个单位时 ( ) A . y 平均增加 1.5 个单位 B. y 平均增加 2 个单位 C . y 平均减少 1.5 个单位 D. y 平均减少 2 个单位 4.对于给定的两个变量的统计数据,下列说确的是( ) A .都可以分析出两个变量的关系 B .都可以用一条直线近似地表示两者的关系 C .都可以作出散点图 D. 都可以用确定的表达式表示两者的关系 5.对于两个变量之间的相关系数,下列说法中正确的是( ) A .|r|越大,相关程度越大 B .|r|,|r|越大,相关程度越小,|r|越小,相关程度越大 杯 数 24 34 39 51 63

C.|r|1且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小D.以上说法都不对 6.“吸烟有害健康”,那么吸烟与健康之间存在什么关系() A.正相关B.负相关C.无相关D.不确定 7.下列两个变量之间的关系不是函数关系的是() A.角度与它的余弦值B.正方形的边长与面积 C.正n边形的边数和顶点角度之和D.人的年龄与身高 8.对于回归分析,下列说法错误的是() A.变量间的关系若是非确定性关系,则因变量不能由自变量唯一确定 B.线性相关系数可正可负 C.如果,则说明x与y之间完全线性相关 D.样本相关系数 9.为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立的做10次和15V次试验,并且利用线性回归方法,求得回归直线分布为和,已知 . .

高考数学真题专题(理数)回归分析与独立性检验

专题十一 概率与统计 第三十三讲 回归分析与独立性检验 一、选择题 1.(2017山东)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关 系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相 关关系,设其回归直线方程为???y bx a =+.已知101 225i i x ==∑,10 1 1600i i y ==∑,?4b =.该 班某学生的脚长为24,据此估计其身高为 A .160 B .163 C .166 D .170 2.(2015福建)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户 家庭,得到如下统计数据表: 根据上表可得回归本线方程???y bx a =+ ,其中???0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元家庭年支出为 A .11.4万元 B .11.8万元 C .12.0万元 D .12.2万元 3.(2014重庆)已知变量x 与y 正相关,且由观测数据算得样本的平均数3x =, 3.5y =, 则由该观测数据算得的线性回归方程可能为 A .0.4 2.3y x =+ B .2 2.4y x =- C .29.5y x =-+ D .0.3 4.4y x =-+ 4.(2014湖北)根据如下样本数据 得到的回归方程为?y bx a =+,则 A .0a >,0b < B .0a >,0b > C .0a <,0b < D .0a <,0b > 5.(2012新课标)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不

多元线性回归模型公式

二、多元线性回归模型 在多要素的地理环境系统中,多个(多于两个)要素之间也存在着相互影响、相互关联的情况。因此,多元地理回归模型更带有普遍性的意义。 (一)多元线性回归模型的建立 假设某一因变量 y 受k 个自变量x 1,x 2,...,x k 的影响,其n 组观测值为(y a ,x 1a ,x 2a ,...,x ka ), a 1,.2..,n 。那么,多元线性回归模型的结构形式为: y a 1x 1a 2x 2a ... k x ka a (3.2.11) 式中: 0,1 ,..., k 为待定参数; a 为随机变量。 如果b 0,b 1,...,b k 分别为 0,1, 2 ... , k 的拟合值,则回归方程为 ?=b 0 b 1x 1 b 2x 2 ... b k x k (3.2.12) 式中: b 0为常数; b 1,b 2,...,b k 称为偏回归系数。 偏回归系数b i (i1,2,...,k )的意义是,当其他自变量 x j (j i )都固定时,自变量 x i 每 变化一个单位而使因变 量 y 平均改变的数值。 根据最小二乘法原理, i (i 0,1,2,...,k )的估计值b i (i 0,1,2,...,k )应该使 n 2 n 2 Q y a y a y a b 0 b1x1a b2x2a ... bkxk a min (3.2.13) a 1 a1 有求极值的必要条件得 Q n 2 y a y a 0 b 0 a 1 (3.2.14) Q n 2 y a yaxja 0(j 1,2,...,k) b j a1 将方程组(3.2.14)式展开整理后得:

高考数学1.3线性回归分析专题1

高考数学1.3线性回归分析专题1 2020.03 1,圆心在x 轴上,经过原点,并且与直线y =4相切的圆的一般方程是 . 2,不等式521<-≤x 的解集是____________________________. 3,某单位用木料制作如图所示的框架, 框架的下部是边长分别为x 、y(单位:m)的矩形.上部是等腰直角三角形. 要求框架围成的总面积8cm 2. 问x 、y 分别为多少时用料最省? 4,在三棱锥P-ABC 中,三侧棱两两垂直,且PB=PC=2PA,PO 垂直于面ABC,O 是垂足,如果设=PA a =PB b =c,请用a 、b 、c 表示P :_______________. 5,命题“" x ∈R ,x 2- x ≥0.”的否定是________________________. 6,已知点P(x,y)满足:?? ? ??≥≥≤+≥-0,020y x y x y x ,则 y x z += 21 可取得的最大值为 ___________. 7,斜率为1的直线与抛物线x y =2 只有一个公共点,这条直线的方程是 ______________. 8,三个数成等比数列,且它们的和为21,积是64.求这三个数. 9,椭圆的两个焦点恰好将长轴三等分,则椭圆的离心率是_____________. 10,椭圆上11692 2=+y x 一动点P 到两焦点距离之和为 A .10 B .8 C .6 D .不确定 11,椭圆 122 22=+b y a x (a >b >)0与直线1=+y x 交于P 、Q 两点,且OQ OP ⊥,其中O 为坐标原点.

(1)求2 211b a +的值; (2)若椭圆的离心率e 满足 3 3≤ ≤ 2 2 ,求椭圆长轴的取值范围. 12,已知点M 在平面ABC 内,并且对空间任一点O ,1123OM xOA OB OC =++u u u u r u u u r u u u r u u u r , 则x 的值是 A .0 B .1/2 C .1/3 D .1/6 13,椭圆x 2+4y 2=16被直线y=x +1截得的弦长为 . 14,已知点A 、B 的坐标分别是A (0,-1),B (0,1),直线AM 、BM 相交于点M ,且它们的斜率之积是2,求点M 的轨迹方程,并说明曲线的类型. 15,解关于x 的不等式).(02 R a a x a x ∈<-- 16,在ΔABC 中,ab c b a -=+2 22,则角C=__________. 17,向量a=(0,1,2),b=(1,0,-1),则数量积a ?b= A .(1,1,1) B .0 C .-2 D .(0,0,-2) 18,不论m 为何实数,直线(m-1)x -y+2m+1=0恒过定点_______________. 19,已知P 是直线λ上一点,将直线 绕 P 点逆时针方向旋转θ(2 0π θ< <) 所得直线为1λ:0223=--y x .若继续绕P 点逆时针方向旋转θ π-2 角,得直 线2λ:01132=-+y x .求直线λ的方程. 20,求与直线 y=x 相切,圆心在直线 y=3x 上且被 y 轴截得的弦长为22的圆的方程. 21,求与椭圆1244922=+y x 有公共焦点,且一条渐近线为x y 34=的双曲线的方 程. 22,有下列命题: (1)若两条直线平行,则其斜率必相等;

线性回归方程和卡方的求法

高考统计部分的两个重要公式的具体如何应用 第一公式:线性回归方程为???y bx a =+的求法: (1) 先求变量x 的平均值,既1231()n x x x x x n = +++???+ (2) 求变量y 的平均值,既1231()n y y y y y n =+++???+ (3) 求变量x 的系数?b ,有两个方法 法112 1()()?()n i i i n i i x x y y b x x ==--=-∑∑(题目给出不用记忆)[]112222212()()()()...()()()()...()n n n x x y y x x y y x x y y x x x x x x --+--++--=??-+-++-?? (需理解并会代入数据) 法21 2 1()()?()n i i i n i i x x y y b x x ==--=-∑∑(题目给出不用记忆) []1122222212...,...n n n x y x y x y nx y x x x nx ++-?=??+++-??(这个公式需要自己记忆,稍微简单些) (4) 求常数?a ,既??a y bx =- 最后写出写出回归方程???y bx a =+。可以改写为:??y bx a =-(?y y 与不做区分) 例.已知,x y 之间的一组数据: 求y 与x 的回归方程: 解:(1)先求变量x 的平均值,既1(0123) 1.54x = +++= (2)求变量y 的平均值,既1(1357)44 y =+++= (3)求变量x 的系数?b ,有两个方法

法1?b = []11223344222212342222()()()()()()()()()()()()(0 1.5)(14)(1 1.5)(34)(2 1.5)(54)(3 1.5)(74)57(0 1.5)(1 1.5)(2 1.5)(3 1.5)x x y y x x y y x x y y x x y y x x x x x x x x --+--+--+--=??-+-+-+-??--+--+--+--==??-+-+-+-?? 法2?b =[][]11222222222212...011325374 1.5457 ...0123n n n x y x y x y nx y x x x nx ++-??+?+?+?-??==????+++-+++???? (4)求常数?a ,既525??4 1.577a y bx =-=-?= 最后写出写出回归方程525???77y bx a x =+=+ 第二公式:独立性检验 两个分类变量的独立性检验: 注意:数据a 具有两个属性1x ,1y 。数 据b 具有两个属性1x ,2y 。数据c 具有两个属性2x ,2y 数据d 具有两个属性2x ,2y 而且列出表格是最重要。解题步骤如下 第一步:提出假设检验问题 (一般假设两个变量不相关) 第二步:列出上述表格 第三步:计算检验的指标 22 ()()()()()n ad bc K a b c d a c b d -=++++ 2K =9大于表格中7.879,则查表可得结论:两个变量之间不相关概率为0.005,或者可以肯定的说两个变量相关的概率为0.995.或095.50 例如你计算出2K =6大于表格中5.024,则查表可得结论:两个变量之间不相关概率为0.025,或者可以肯定的说两个变量相关的概率为0.995.或097.50 上述结论都是概率性总结。切记事实结论。只是大概行描述。具体发生情况要和实际联 系!!!!

相关文档
最新文档