高考试题回归分析,独立性检验

高考试题回归分析,独立性检验
高考试题回归分析,独立性检验

高考试题回归分析,独立

性检验

标准化工作室编码[XX968T-XX89628-XJ668-XT689N]

回归分析与独立性检验

1.高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学生. 从这次考试成绩看,

①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ; ②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 .

2.根据下面给出的2004年至2013年我国二氧化碳年排放量(单位:万吨)柱形图,以下结论中不正确的是( )

A .逐年比较,2008年减少二氧化碳排放量的效果最显着

B .2007年我国治理二氧化碳排放显现成效

C .2006年以来我国二氧化碳年排放量呈减少趋势

D .2006年以来我国二氧化碳年排放量与年份正相关

3.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:

根据上表可得回归直线方程???y

bx a =+ ,其中???0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元家

庭年支出为( )]

A .万元

B .万元

C .万元

D .万元

4.在画两个变量的散点图时,下面哪个叙述是正确的

( )

A .预报变量在x 轴上,解释变量在y 轴上

B .解释变量在x 轴上,预报变量在

y 轴上

C .可以选择两个变量中任意一个变量在x 轴上

D .可以选择两个变量中任意一个变量在y 轴上

5

( )

A .种子经过处理跟是否生病有关

B .种子经过处理跟是否生病无关

2004年 2005年 2006年 2007年 2008年 2009年 2010年 2011年 2012年 2013年

190020002100220023002400250026002700

C .种子是否经过处理决定是否生病

D .以上都是错误的 6.变量x 与y 具有线性相关关系,当x 取值16,14,12,8时,通过观测得到

y 的值分别为11,9,8,5,若在实际问

题中,y 的预报最大取值是10,则x 的最大取值不能超过

( )

A .16

B .17

C .15

D .12

7.在研究身高和体重的关系时,求得相关指数≈2

R ___________,可以叙述为“身高解释了64%的体重变化,而随

机误差贡献了剩余的36%”所以身高对体重的效应比随机误差的效应大得多。 8.下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图

(I )由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (II )建立y 关于t 的回归方程(系数精确到),预测2016年我国生活垃圾无害化处理量。

参考数据:

7

1

9.32i

i y

==∑,7

1

40.17i i i t y ==∑,

7

2

1

()

0.55i

i y y =-=∑,

7≈.

参考公式:相关系数1

2

2

1

1

()()

()(y

y)n

i

i

i n n

i i

i i t t y y r t t ===--=

--∑∑∑,

回归方程

y a bt =+ 中斜率和截距的最小二乘估计公式分别为:

9.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图. 根据该折线图,下列结论错误的是

A .月接待游客量逐月增加

B .年接待游客量逐年增加

C .各年的月接待游客量高峰期大致在7,8月

D .各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳

10.为了研究某班学生的脚长x (单位:厘米)和身高

y (单位:厘米)的关系,从该班随机抽取10名学生,根据

测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为???y

bx a =+.已知10

1

225i i x ==∑,10

1

1600i

i y

==∑,?4b

=.该班某学生的脚长为24,据此估计其身高为 (A )160 (B )163 (C )166 (D )170

11.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg )某频率分布直方图如下:

(1) 设两种养殖方法的箱产量相互独立,记A 表示事件:“旧养殖法的箱产量低于50kg, 新养殖法的箱产量不

低于50kg”,估计A 的概率;

(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:

(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到)附:

高中数学 第2讲变量的相关性、回归分析及独立性检验

第2讲 变量的相关性、回归分析及独立性检验 一、知识回顾 1.如何判断两个变量的线性相关: 如果在散点图中,2个变量数据点分布在一条直线附近,则这2个变量之间具有线性相关关系。 2.所求直线方程 ?y =bx +a 叫做回归直线方程;其中 ?∑∑∑∑n n i i i i i=1 i=1 n n 2 2 2 i i i=1 i=1 (x -x)(y -y) x -nx y b = = ,a =y -bx (x -x)x -nx y 回归直线方程必过中心点(,)x y 3 .相关系数的∑n i i (x -x)(y -y) r = 性质 ? (1)|r|≤1.(2)|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小. 4. ??=-i i y y i 残差e =实际值-预测值2 ^^ 2 1 1 () ===-∑∑n n i i i i i e y y 总残差平方和: 残差平方和越小,即模型拟合效果越好 5. 两个分类变量的独立性检验: (1)假设结论不成立,即“两个分类变量没有关系”. (2)在此假设下计算随机变量 2 2 n(ad -bc) K =(a +b)(c +d)(a +c)(b +d) (3) 根据随机变量K 2 查表得“两个分类变量没有关系”的概率,用1减去此概率即得有联系的概率 典型例题: 例1.(宁夏海南卷)对变量x, y 有观测数据理力争(,)(i=1,2,…,10),得散点图1;对变量u ,v 有观测数据(,)(i=1,2,…,10),得散点图2. 由这两个散点图可以判断( )。 (A )变量x 与y 正相关,u 与v 正相关 (B )变量x 与y 正相关,u 与v 负相关 (C )变量x 与y 负相关,u 与v 正相关 (D )变量x 与y 负相关,u 与v 负相关 1x 1y 1u 1 v

高考试题回归分析,独立性检验

回归分析与独立性检验 1.高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学生. 从这次考试成绩看, ①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ; ②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 . 2.根据下面给出的2004年至2013年我国二氧化碳年排放量(单位:万吨)柱形图,以下结论中不正确的是( ) A .逐年比较,2008年减少二氧化碳排放量的效果最显着 B .2007年我国治理二氧化碳排放显现成效 C .2006年以来我国二氧化碳年排放量呈减少趋势 D .2006年以来我国二氧化碳年排放量与年份正相关 3.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 根据上表可得回归直线方程???y bx a =+ ,其中???0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元家庭年支出为( )] A .万元 B .万元 C .万元 D .万元 4.在画两个变量的散点图时,下面哪个叙述是正确的 ( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在 y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上 5 2004年 2005年 2006年 2007年 2008年 2009年 2010年 2011年 2012年 2013年

不得病 61 213 274 合计 93 314 407 ( ) A .种子经过处理跟是否生病有关 B .种子经过处理跟是否生病无关 C .种子是否经过处理决定是否生病 D .以上都是错误的 6.变量x 与y 具有线性相关关系,当x 取值16,14,12,8时,通过观测得到y 的值分别为11,9,8,5,若在实际问 题中,y 的预报最大取值是10,则x 的最大取值不能超过 ( ) A .16 B .17 C .15 D .12 7.在研究身高和体重的关系时,求得相关指数≈2 R ___________,可以叙述为“身高解释了64%的体重变化,而随 机误差贡献了剩余的36%”所以身高对体重的效应比随机误差的效应大得多。 8.下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图 (I )由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (II )建立y 关于t 的回归方程(系数精确到),预测2016年我国生活垃圾无害化处理量。 参考数据: 7 1 9.32i i y ==∑,7 1 40.17i i i t y ==∑, 7 2 1 ()0.55i i y y =-=∑,7≈. 参考公式:相关系数1 2 2 1 1 ()() ()(y y)n i i i n n i i i i t t y y r t t ===--= --∑∑∑, 回归方程 y a bt =+) )) 中斜率和截距的最小二乘估计公式分别为: 9.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图. 根据该折线图,下列结论错误的是 A .月接待游客量逐月增加 B .年接待游客量逐年增加 C .各年的月接待游客量高峰期大致在7,8月 D .各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳 10.为了研究某班学生的脚长x (单位:厘米)和身高 y (单位:厘米)的关系,从该班随机抽取10名学生,根据 测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为???y bx a =+.已知10 1 225i i x ==∑,10 1 1600i i y ==∑,?4b =.该班某学生的脚长为24,据此估计其身高为 (A )160 (B )163 (C )166 (D )170 11.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg )某频率分布直方图如下:

回归分析及独立性检验的基本知识点及习题集锦

回归分析的基本知识点及习题 本周题目:回归分析的基本思想及其初步应用 本周重点: (1)通过对实际问题的分析,了解回归分析的必要性与回归分析的一般步骤;了解线性回归模型与函数模型的区别; (2)尝试做散点图,求回归直线方程; (3)能用所学的知识对实际问题进行回归分析,体会回归分析的实际价值与基本思想;了解判断刻画回归模型拟合好坏的方法――相关指数和残差分析。 本周难点: (1)求回归直线方程,会用所学的知识对实际问题进行回归分析. (2)掌握回归分析的实际价值与基本思想. (3)能运用自己所学的知识对具体案例进行检验与说明. (4)残差变量的解释; (5)偏差平方和分解的思想; 本周内容: 一、基础知识梳理 1.回归直线: 如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线。 求回归直线方程的一般步骤: ①作出散点图(由样本点是否呈条状分布来判断两个量是否具有线性相关关系),若存在线性相关关系→②求回归系数→ ③写出回归直线方程,并利用回归直线方程进行预测说明. 2.回归分析: 对具有相关关系的两个变量进行统计分析的一种常用方法。 建立回归模型的基本步骤是: ①确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量; ②画好确定好的解释变量和预报变量的散点图,观察它们之间的关系(线性关系). ③由经验确定回归方程的类型. ④按一定规则估计回归方程中的参数(最小二乘法); ⑤得出结论后在分析残差图是否异常,若存在异常,则检验数据是否有误,后模型是否合适等. 3.利用统计方法解决实际问题的基本步骤: (1)提出问题; (2)收集数据; (3)分析整理数据; (4)进行预测或决策。 4.残差变量的主要来源: (1)用线性回归模型近似真实模型(真实模型是客观存在的,通常我们并不知道真实模型到底是什么)所引起的误差。 可能存在非线性的函数能够更好地描述与之间的关系,但是现在却用线性函数来表述这种关系,结果就会产生误差。这 种由于模型近似所引起的误差包含在中。 (2)忽略了某些因素的影响。影响变量的因素不只变量一个,可能还包含其他许多因素(例如在描述身高和体重 关系的模型中,体重不仅受身高的影响,还会受遗传基因、饮食习惯、生长环境等其他因素的影响),但通常它们每一个因素的影响可能都是比较小的,它们的影响都体现在中。 (3)观测误差。由于测量工具等原因,得到的的观测值一般是有误差的(比如一个人的体重是确定的数,不同的秤可 能会得到不同的观测值,它们与真实值之间存在误差),这样的误差也包含在中。 上面三项误差越小,说明我们的回归模型的拟合效果越好。

回归方程和独立性检验知识点

回归方程和独立性检验 知识点 Document number:NOCG-YUNOO-BUYTT-UU986-1986UT

回归分析和独立性检验 一、回归分析 1、回归直线方程 a x b y ???+= (x 叫做解释变量,y 叫做预报变量) 其中∑∑==---=n i i n i i i x x y y x x b 1 2 1 )() )((?= ∑∑==--n i i n i i i x n x y x n y x 1 2 21 (由最小二乘法得出,考试时给出此公式中的一 个) x b y a ??-= ( 此式说明:回归直线过样本的中心点)(y x , ,也就是平均值点。 ) 2、几条结论: (1)回归直线过样本的中心点)(y x ,。 (2)b>0时,y 与x 正相关,散点图呈上升趋势;b<0时,y 与x 负相关,散点图呈下降趋势。 (3)斜率b 的含义(举例): 如果回归方程为y=+2, 说明x 增加1个单位时,y 平均增加个单位; 如果回归方程为y=-+2,说明x 增加1个单位时,y 平均减少个单位。 (4)相关系数r 表示变量的相关程度。 范围:1≤r ,即 11≤≤-r r 越大.,相关性越强. 。0>r 时,y 与x 正相关;0

高中选修1-2回归分析和独立性检验知识总结与联系

11 22211()()()n n i i i i i i n n i i i i x x y y x y nx y b x x x nx a y bx ====? ---??==??--??=-??∑∑∑∑选修1-2第一部分 变量间的相关关系与统计案例 【基础知识】 一、回归分析 1.两个变量的线性相关:判断是否线性相关 ①用散点图 (1)正相关:在散点图中,点散布在从左下角到右上角的区域.对于两个变量的这种相关关系,我们将它称为正相关. (2)负相关:在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (3)线性相关关系、回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. ②用相关系数r (3)除用散点图外,还可用样本相关系数r 来衡量两个变量x ,y 相关关系的强弱, n i i x y nx y r -?= ∑当r >0,表明两个变量正相关,当r <0,表明两个变量负相关,r 的绝对值越接近于1,表明两个变量的线性相关性越强;r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r |0.75>时,认为这两个变量具有很强的线性相关关系. 2.回归方程: 两个变量具有线性相关关系,数据收集如下: 可用最小二乘法得到回归方程?y bx a =+,其中 3.回归分析的基本思想及其初步应用 (1)回归分析是对具有相关关系的两个变量进行统计分析的方法,其常用的 研究方法步骤是画出散点图,求出回归直线方程,并利用回归直线方程进行预报. (2)对n 个样本数据(x 1,y 1)、(x 2,y 2)、…、(xn ,yn ),(,)x y 称为样本点的中心.样本点中心一定落在回归直线上。 4、回归效果的刻画: 用相关指数2R 来刻画回归的效果,公式是μ 2 21 2 1 ()1() n i i i n i i y y R y y ==-=- -∑∑ 2R 的值越大,说明残差平方和越小,也就是说模型拟合效果好

回归分析与独立性检验

回归分析与独立性检验 知识要点及解析 1.函数关系与相关关系的区别? 函数关系是一种确定性关系,而相关关系是一种非确定性关系. 2.回归公式∑∑∑∑====--= ---=n i i n i i i n i i n i i i x n x y x n y x x x y y x x b 1 2 2 1 1 2 1 ) () )((? x b y a ??-= a x b y ???+= 3.回归分析的步骤? 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法, 其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预报. 4.回归直线的性质 a x b y ??+= ⑴回归直线 过样本点的中心()y x , 其中解释变量x 的平均数为: ∑==n i i x n x 11 预报变量y 的平均数为: ∑==n i i y n y 1 1 ⑵回归直线的斜率的估计值b ?的意义: 解释变量x 每增加一个单位,预报变量y 就增加b ?个单位. 5.求线性回归方程的五个步骤: ⑴计算y x x y x 、、、2 ⑵计算 ∑=n i i i y x 1 ⑶计算 ∑=n i i x 12 ⑷代入系数公式求b ?⑸代入公式计算a ? 例题1:下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的 能耗y (吨标准煤)的几组数据: ⑴画出散点图; ⑵求出线性回归方程a x b y ???+= ⑶已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)问求出的线性回 归方程预测(估计)生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? a x b y ???+=

回归分析与独立性检验

湛江一中2016届高二级第二学期数学科临界生辅导资料(初诊卷) 选修1-2 专题二 回归分析与独立性检验 学科老师:_____________ 辅导老师:___________ 高二( )班 学号 ____________ 学生姓名:____________ 一、基础知识 1.两个变量的线性相关 如果散点图中点的分布从整体上看大致在 ,就称这两个变量之间具有线性相关关系,这条直线叫做 . 2.回归方程 (1)最小二乘法求回归直线使得样本数据的点到回归直线的________________的方法叫做最小二乘法. (2)回归方程方程 是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程. 其中b ?= _______________________,a ? =______________, ____________称为样本点的中心. 3、相关系数 当r >0时,表明两个变量_______;当r <0时,表明两个变量_________. r 的绝对值越接近于1,表明两个变量的线性相关性_______;r 的绝对值越接近于0,表明两个变量之间________________________. 4、相关指数 ∑∑==--- =n i i n i i i y y y y R 1 2 122 )()?(1 其 中 ∑=-n i i i y y 1 2 )?(为_________________, ∑=-n i i y y 1 2 ) (为 _________________ 。当2 R 越大,则模型拟合效果__________ 5.独立性检验 (1)2×2列联表:假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其_________列联表(称为2×2列联表)为: y 1 y 2 总计 x 1 a b a+b x 2 c d c+d 总计 a+c b+d a+b+c+d (2)利用随机变量 来确定在多大程度上可认为____________________的方法称为两个分类变量的独立性检验. 下面的临界值表供参考: 20 ()P K k ≥ 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0k 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 22 n ad bc K a b c d a c b d -=++++()()()()()n a b c d =+++(其中)

回归分析、独立性检验

突破点8 回归分析、独立性检验 (1)正相关:在散点图中,点散布在从左下角到右上角的区域. (2)负相关:在散点图中,点散布在从左上角到右下角的区域. (3)相关系数r :当r >0时,两变量正相关;当r <0时,两变量负相关;当|r |≤1且|r |越接近于1,相关程度越高,当|r |≤1且|r |越接近于0,相关程度越低 . 方程y ^=b ^x +a ^称为线性回归方程,其中b ^=∑i =1 n x i y i -n x - y -∑i =1 n x 2i -n x 2 ,a ^=y --b ^x - .(x -, y - )称为样本中心点 . (1) (2)求观测值:k =n (ad -bc )2 (a +b )(c +d )(a +c )(b +d ) . (3) 根据临界值表,作出正确判断.如果k ≥k α,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”. 回访1 变量的相关性 1.(2015·全国卷Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )

图8-1 A .逐年比较,2008年减少二氧化硫排放量的效果最显著 B .2007年我国治理二氧化硫排放显现成效 C .2006年以来我国二氧化硫年排放量呈减少趋势 D .2006年以来我国二氧化硫年排放量与年份正相关 D [对于A 选项,由图知从2007年到2008年二氧化硫排放量下降得最多,故A 正确.对于B 选项,由图知,由2006年到2007年矩形高度明显下降,因此B 正确.对于C 选项,由图知从2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以C 正确.由图知2006年以来我国二氧化硫年排放量与年份负相关,故选D.] 2.(2012·全国卷)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =1 2x +1上,则这组样本数据的样本相关系数为( ) A .-1 B .0 C.1 2 D .1 D [样本点都在直线上时,其数据的估计值与真实值是相等的,即y i =y ^i , 代入相关系数公式r =1-∑i =1 n (y i -y ^ i )2∑i =1 n (y i -y )2 =1.] 3.(2015·全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.

新人教A版高中数学选修1-2:第一章、回归分析和独立性检验

第一章 统计案例 1.1 回归分析的基本思想及其初步应 用 A 级 基础巩固 一、选择题 1.已知x 和y 之间的一组数据 x 0 1 2 3 y 1 3 5 7 则y 与x 的线性回归方程y =b x +a 必过点( ) A .(2,2) B.? ?? ??32,0 C .(1,2) D.? ?? ??32,4 解析:∵x -=14(0+1+2+3)=32,y -=1 4(1+3+5+7)=4, ∴回归方程y ^=b ^x +a ^必过点? ?? ?? 32,4. 答案:D 2.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论: ①y 与x 负相关且y ^ =2.347x -6.423; ②y 与x 负相关且y ^ =-3.476x -5.648;

③y 与x 正相关且y ^ =5.437x +8.493; ④y 与x 正相关且y ^ =-4.326x -4.578. 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④ D .①④ 解析:①中y 与x 负相关而斜率为正,不正确;④中y 与x 正相关而斜率为负,不正确. 答案:D 3.甲、乙、丙、丁四位同学在建立变量x ,y 的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R 2分别如表: 甲 乙 丙 丁 R 2 0.98 0.78 0.50 0.85 A .甲 B .乙 C .丙 D .丁 解析:相关指数R 2越大,表示回归模型的效果越好. 答案:A 4.如图所示的是四个残差图,其中回归模型的拟合效果最好的是( )

高考数学真题之回归分析与独立性检验

回归分析与独立性检验 2019年 1.(2019全国1文17)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表: (1)分别估计男、女顾客对该商场服务满意的概率; (2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异? 附:2 2 ()()()()() n ad bc K a b c d a c b d -=++++. 2010-2018年 一、选择题 1.(2015湖北)已知变量x 和y 满足关系0.11y x =-+,变量y 与z 正相关,下列结论中正确的是 A .x 与y 正相关,x 与z 负相关 B .x 与y 正相关,x 与z 正相关 C .x 与y 负相关,x 与z 负相关 D .x 与y 负相关,x 与z 正相关 2.(2014湖北)根据如下样本数据 得到的回归方程为?y bx a =+,则 A .0a >,0b < B .0a >,0b > C .0a <,0b < D .0a <,0b > 3.(2014江西)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关

系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是 4.(2012新课标)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不 全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线1 12 y x =+上,则这组样本数据的样本相关系数为 A .?1 B .0 C .1 2 D .1 5.(2012湖南)设某大学的女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关 系,根据一组样本数据(i x ,i y )(i =1,2,…,n ),用最小二乘法建立的回归方程为 $y =0.85x -85.71,则下列结论中不正确... 的是 A .y 与x 具有正的线性相关关系 B .回归直线过样本点的中心(x ,y ) C .若该大学某女生身高增加1cm ,则其体重约增加0.85kg D .若该大学某女生身高为170cm ,则可断定其体重必为58.79kg 6.(2011山东)某产品的广告费用x 与销售额y 的统计数据如下表 广告费用x (万元) 4 2 3 5 销售额y (万元) 49 26 39 54 根据上表可得回归方程???y bx a =+中的?b 为9.4,据此模型预报广告费用为6万元时销售额为

独立性检验与回归分析

独立性检验与回归分析 [核心知识提炼] 提炼1 变量的相关性 (1)正相关:在散点图中,点散布在从左下角到右上角的区域. (2)负相关:在散点图中,点散布在从左上角到右下角的区域. (3)相关系数r :当r >0时,两变量正相关;当r <0时,两变量负相关;当|r |≤1且|r |越接近于1,相关程度越高,当|r |≤1且|r |越接近于0,相关程度越低. 提炼2 线性回归方程 方程y ^=b ^x +a ^称为线性回归方程,其中b ^= ∑i =1 n x i y i -n x -y - ∑i =1 n x 2i -n x 2 ,a ^=y --b ^x - .回归 直线恒过样本中心(x ,y ). 提炼3 独立性检验 (1)确定分类变量,获取样本频数,得到2×2列联表. (2)求观测值:k =n (ad -bc )2 (a +b )(c +d )(a +c )(b +d ) . (3)根据临界值表,作出正确判断.如果k ≥k α,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”. [高考真题回访] 回访1 变量的相关性 1.(2015·全国卷Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )

图8-1 A .逐年比较,2008年减少二氧化硫排放量的效果最显著 B .2007年我国治理二氧化硫排放显现成效 C .2006年以来我国二氧化硫年排放量呈减少趋势 D .2006年以来我国二氧化硫年排放量与年份正相关 D [对于A 选项,由图知从2007年到2008年二氧化硫排放量下降得最多,故A 正确.对于B 选项,由图知,由2006年到2007年矩形高度明显下降,因此B 正确.对于C 选项,由图知从2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以C 正确.由图知2006年以来我国二氧化硫年排放量与年份负相关,故选D.] 2.(2012·全国卷)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( ) A .-1 B .0 C.1 2 D .1 D [样本点都在直线上时,其数据的估计值与真实值是相等的,即y i =y ^ i , 代入相关系数公式r =1- ∑i =1 n (y i -y ^ i )2 ∑i =1 n (y i -y )2 =1.] 3.(2017·全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:

(完整版)回归方程和独立性检验知识点讲解

回归分析和独立性检验 一、回归分析 1、回归直线方程 a x b y ???+= (x 叫做解释变量,y 叫做预报变量) 其中∑∑==---=n i i n i i i x x y y x x b 1 2 1 )() )((?= ∑∑==--n i i n i i i x n x y x n y x 1 2 21 (由最小二乘法得出,考试时给出此公式中的一个) x b y a ??-= ( 此式说明:回归直线过样本的中心点)(y x , ,也就是平均值点。 ) 2、几条结论: (1)回归直线过样本的中心点)(y x ,。 (2)b>0时,y 与x 正相关,散点图呈上升趋势;b<0时,y 与x 负相关,散点图呈下降趋势。 (3)斜率b 的含义(举例): 如果回归方程为y=2.5x+2, 说明x 增加1个单位时,y 平均增加2.5个单位; 如果回归方程为y=-2.5x+2,说明x 增加1个单位时,y 平均减少2.5个单位。 (4)相关系数r 表示变量的相关程度。 范围:1≤r ,即 11≤≤-r r 越大.,相关性越强. 。0>r 时,y 与x 正相关;0

正态分布、回归分析、独立性检验(教师)

正态分布、回归分析、独立性检验(教师) https://www.360docs.net/doc/1f18737127.html,work Information Technology Company.2020YEAR

正态分布、回归分析、独立性检验 一、正态分布 1.已知随机变量X服从正态分布N(a,4),且P(X>1)=0.5,则实数a的值为() A.1 B.2 C.3 D.4 【解题指南】画正态曲线图,由对称性得图象关于x=a对称且P(X>a)=0.5,结合题意得到a的值.【解析】选A. 随机变量X服从正态分布N(a,4),所以曲线关于x=a对称,且P(X>a)=0.5,由P(X>1)=0.5,可知μ =a=1.故选A. 2.(2014·广州高二检测)已知ξ~N(3,σ2),若P(ξ≤2)=0.2,则P(ξ≤4)等于() A.0.2 B.0.3 C.0.7 D.0.8 【解析】选D.根据正态曲线的特征:知对称轴为x=3,[来源:学+科+网Z+X+X+K] 所以P(ξ≤3)=0.5,则P(ξ≤2)=P(ξ>4)=0.2, 所以P(ξ≤4)=1-P(ξ>4)=1-0.2=0.8. 3.随机变量ξ服从正态分布N(1,4),若P(2<ξ<3)=a,则P(ξ<-1)+P(1<ξ<2)=() A. B.-a C.a+0.003a D.+a 【解析】选B.因为随机变量ξ服从正态分布N(1,4),所以正态曲线关于x=1对称,因为P(2<ξ <3)=a,所以P(-1<ξ<0)=a,P(1<ξ<2)=P(0<ξ<1),P(ξ<-1)+P(1<ξ<2)=-a,故选B. 4.已知随机变量X服从正态分布N(3,1),且P(2≤X≤4)=0.6826,则P(X>4)=() A.0.158 8 B.0.158 7 C.0.158 6 D.0.158 5 【解析】选B.P(3≤X≤4)=P(2≤X≤4)=0.3413,P(X>4)=0.5-P(3≤X≤4)=0.5-0.3413=0.1587. 5.设随机变量ξ服从正态分布N(μ,σ2),且二次方程x2+4x+ξ=0无实数根的概率为,则μ等于 ()

回归分析及独立性检验)

回归分析及独立性检验)

回归分析与独立性检验 1.回归分析的含义是什么?有哪些基本步骤?线性回归模型怎样用表达式表示?产生随机误差的原因是什么? a$$b 2.回归方程中与怎样求解? 3.刻画回归效果的方式有哪些? (1)残差(2)残差图 (3)残差图法 (4)残差平方和(5)相关指数R2 2

1.判一判(正确的打“√”,错误的打“×”) (1)在线性回归模型中,e是bx+a预报真实值y的随机误差,它是一个可观测的量. ( ) (2)求线性回归方程前可以不进行相关性检验. ( ) (3)在残差图中,纵坐标为残差,横坐标可以选为样本编号.( ) 2、一位母亲记录了儿子3~9岁的身高数据,并由此建立的身高 与年龄的回归模型为 =7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则下列说法正确的A.身高一定是145.83cm B.身高在145.83cm以上 3

C.身高在145.83cm左右 D.身高在 145.83cm以下 有下列说法:①在残差图中,残差点比较均匀地落在 水平的带状区域内,说明选用的模型比较合适;②用相关指数R2来刻画回归的效果,R2值越大,说明模型的拟合效果越好;③比较两个模型的拟合效果,可以 比较残差平方和的大小,残差平方和越小的模型,拟 合效果越好.其中正确命题的个数是 A.0 B.1 C.2 D.3 $y y 【典例1】(1)(2014·合肥高二检测)已知一个回归方 程为 =1.5x+45,x∈{1,7,5,13,19},则 = A.9 B.45 C.58.5 D.1.5 4

(2)如图所示的是四个残差图,其中回归模型的拟合 ) 效果最好的是( (3)为研究质量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同质量的6个物体进行测量,数据如下表所示: x51015202530 5

回归分析及独立性检验

回归分析与独立性检验 1.回归分析的含义是什么?有哪些基本步骤?线性回归模型怎样用表达式表示?产生随机误差的原 因是什么? a b 2.回归方程中与怎样求解? 3.刻画回归效果的方式有哪些? (1)残差(2)残差图 (3)残差图法 2 (4)残差平方和(5)相关指数R 1.判一判(正确的打“√”,错误的打“×”) (1)在线性回归模型中,e是bx+a预报真实值y的随机误差,它是一个可观测的量. ( ) (2)求线性回归方程前可以不进行相关性检验. ( ) (3)在残差图中,纵坐标为残差,横坐标可以选为样本编号.( ) 2、一位母亲记录了儿子3~9岁的身高数据,并由此建立的身高 与年龄的回归模型为 =7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则下列说法正确的

A.身高一定是145.83cm B.身高在145.83cm 以上 C.身高在145.83cm 左右 D.身高在145.83cm 以下 有下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适; ②用相关指数R 2 来刻画回归的效果,R 2 值越大,说明模型的拟合效果越好;③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.其中正确命题的个数是 A.0 B.1 C.2 D.3 【典例1】(1)(2014·合肥高二检测)已知一个回归方程为 =1.5x+45,x ∈{1,7,5,13,19},则 = A.9 B.45 C.58.5 D.1.5 (2)如图所示的是四个残差图,其中回归模型的拟合效果最好的是( ) y y

(3)为研究质量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同质量的6个物体进行测量,数据如下表所示: x51015202530 y7.258.128.959.9010.911.8 出散点图,并求线性回归方程; ②求出R 2 ; ③进行残差分析. 类型二非线性回归分析 【典例2】(1)两个变量的散点图如图,可考虑用如下函数进行拟合比较合理的 A.y=a·x b B.y=a+blnx C.y=a·e bx D.y=a· 2)在一次抽样调查中,测得样本的5个样本点的数值如下表: h x e

回归分析及独立性检验规律小结

一、本章知识结构 二、知识要点与联系 1.已知回归直线的斜率估计值为k ,样本点的中心为(m, n),则回归直线方程为 。 2.相关指数R 2= ,R 2越 表示回归效果越好。 3.建立回归模型基本步骤: 第一步: 第二步: 第三步: 第四步: 第五步: 4.三维柱形图中,估计“X 与Y 有关系”成立的可能性越大的依据是 。 5.二维条形图中,估计“X 与Y 有关系”成立的可能性越大的依据是 。 6.精确判断两个分类变量是否有关系的具体做法是 。 7.考查某种针剂的预防效果进行试验数据如下: 注射针剂的串病12例,未患病48例,未注射针剂的患病22例,未患病35例,则认为针剂无效的可能性约为 。 三、综合型问题剖析 使用年限x 2 3 4 5 6 维修费用y 2.2 3.8 5.5 6.5 7.0 若由资料知,y 对x 呈线性相关关系。试求:线性回归方程$ $y bx a =+$的回归系数$,a b $; 统计案例 回归分析 独立性检验

解:由已知数据制成表格。 4;5;x y ==5 5 21 1 90;112.3.i i i i i x x y ====∑∑ 所以有??1.23,0.08.b a ==? 1.230.08.y x ∴=+ 评注: 例2.为了研究某种细菌随时间x 变化,繁殖的个数,收集数据如下: (1)用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图; (2)描述解释变量与预报变量之间的关系; (3)计算残差、相关指数R 2. 解:(1)散点图如右所示

(2)由散点图看出样本点分布在一条指数函数2 1C x y C e =的周围,于是令Z=lny,则 x 1 2 3 4 5 6 Z 1.79 2.48 3.22 3.89 4.55 5.25 由计数器算得μ0.69 1.112Z X =+,则有0.69x 1.112 ?y =e + $y 6.06 12.09 24.09 48.04 95.77 190.9 $y 6 12 25 49 95 190 n 22 i i=1 1 ??e () 3.1643,n i i i y y ==-=∑∑n 2 22i 1 i=1 ()y ny 25553.3.n i i y y =-=-=∑∑ 2 3.1643 10.9999.25553.3 R ∴=- = 即解释变量天数对预报变量繁殖细菌得个数解释了99.99%. 评注: 例3.在某医院,因为患心脏病而住院的 665 名男性病人中,有 214 人秃顶,而另外 772 名不是因为患心脏病而住院的男性病人中有 175 人秃顶. (1)利用图形判断秃顶与患心脏病是否有关系. (2)能够以 99 %的把握认为秃顶与患心脏病有关系吗?为什么? 解:根据题目所给数据得到如下列联表: (1)相应的三维柱形图如图3.2一4所示.比较来说,底面副对角线上两个柱体高度的乘积要大一些,可以在某种程度上认为“秃顶与患心脏病有关”.

线性回归分析与独立性检验.

线性回归分析与独立性检验在实际中的应用 (多维探究题 命题角度一线性回归直线方程的应用 【典例】 (2015·福建高考为了解某社区居民的家庭年收入与年支出的关 根据上表可得回归直线方程 y =b x +a ,其中 b =0.76, a =y -b ^ x . 据此估计,该社区一户年收入为 15万元家庭的年支出为 ( A . 11.4万元 B. 11.8万元 C . 12.0万元 D. 12.2万元 【典例】 (2015·重庆高考随着我国经济的发展,居民的储蓄存款逐年增 (1求 y 关于 t 的回归方程 y =b t +a ; (2用所求回归方程预测该地区 2015年 (t =6 的人民币储蓄存款. 【强化训练】 1 如果 y 与 x 线性相关,且线性回归方程为 y ^=b ^x + 13 2 ,则

b ^ 的值为 ( A .- 1 2 B. 1 2 C.- 1 10

D. 1 10 2.(2015·新课标Ⅰ高考某公司为确定下一年度投入某种产品的宣传费, 需了解年宣传费 x (单位:千元对年销售量 y (单位:t 和年利润 z (单位:千元的影响,对近 8年的年宣传费 x i 和年销售量y i (i =1,2,…, 8 数据作了初步处理,得到下面的散点图及一些统计量的值. 表中 w i x i , w = 1 8 ∑ i =1 8 w i . (1根据散点图判断, y =a +bx 与 y =c +d x 哪一个适宜作为年销售量 y 关于年宣传费 x 的回归方程类型? (给出判断即可,不必说明理由 (2根据 (1的判断结果及表中数据,建立 y 关于 x 的回归方程;

回归分析和独立性检验(教师版)

回归分析即独立性检验 一、回归分析 1、两个变量之间的关系; 常见的有两类:一类是确定性的函数关系;另一类是变量间存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有一定随机性的.当一个变量取值一定时,另一个变量的取值带有一定随机性的两个变量之间的关系叫做相关关系. 2、散点图:将样本中的n 个数据点()(12)i i x y i n =L ,,,,描在平面直角坐标系中,就得到了散点图.散点图形象地反映了各个数据的密切程度,根据散点图的分布趋势可以直观地判断分析两个变量的关系. 3、如果当一个变量的值变大时,另一个变量的值也在变大,则这种相关称为正相关;此时,散点图中的点在从左下角到右上角的区域. 反之,一个变量的值变大时,另一个变量的值由大变小,这种相关称为负相关.此时,散点图中的点在从左上角到右下角的区域. 散点图可以判断两个变量之间有没有相关关系. 4、回归分析:对于具有相关关系的两个变量进行统计分析的方法叫做回归分析,即回归分析就是寻找相关关系中这种非确定关系的某种确定性. 回归直线:如果散点图中的各点都大致分布在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 5、最小二乘法: 记回归直线方程为:???y bx a =+,称为变量y 对变量x 的回归直线方程,其中a b ,叫做回归 系数.用最小二乘法求回归系数??a b ,有如下的公式: 11 22211 ()()?()??n n i i i i i i n n i i i i x x y y x y nxy b x x x nx a y bx ====? ---? ?==??--?? =-??∑∑∑∑,其中a b , 上方加“^”,表示是由观察值按最小二乘法求得的(样本中心点(,)x y 必定落在回归直线上) 例1、已知回归直线方程中斜率的估计值为1.23,样本点的中心(4,5),则回归直线方程为 A . ?y =1.23x +0.08 B . ?y =0.08x +1.23 C . ?y =1.23x +4 D . ?y =1.23x +5 解析 回归直线方程过样本点的中心,把点(4,5)代入A 项成立. 答案 A 例2、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的 (2) 请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程$y bx a =+$; (3) 已知该厂技术改造前100吨甲产品能耗为90吨标准煤.试根据(2)求出的线 性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?

相关文档
最新文档