高考数学1.3线性回归分析专题1
高考数学基础训练:回归分析含详解

高考数学基础训练:回归分析一、单选题1.某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是.A .90B .75C .60D .452.对两个变量y 与x 进行回归分析,分别选择不同的模型,它们的相关系数r 如下,其中拟合效果最好的模型是()A .0.2B .0.8C .-0.98D .-0.73.为研究变量x ,y 的相关关系,收集得到下面五个样本点(x ,y ):x 99.51010.511y1110865若由最小二乘法求得y 关于x 的回归直线方程为 3.2y x a=-+,则据此计算残差为0的样本点是()A .(9,11)B .(10,8)C .(10.5,6)D .(11.5)4.据一组样本数据()11,x y ,()22,x y ,…,(),n n x y ,求得经验回归方程为ˆ 1.50.5yx =+,且3x =.现发现这组样本数据中有两个样本点()1.2,2.2和()4.8,7.8误差较大,去除后重新求得的经验回归直线l 的斜率为1.2,则()A .变量x 与y 具有正相关关系B .去除两个误差较大的样本点后,重新求得的回归方程仍为ˆ 1.50.5yx =+C .去除两个误差较大的样本点后,y 的估计值增加速度变快D .去除两个误差较大的样本点后,相应于样本点()2,3.75的残差为0.055.对于样本相关系数,下列说法错误的是()A .可以用来判断成对样本数据相关的正负性B .可以是正的,也可以是负的C .样本相关系数越大,成对样本数据的线性相关程度也越高D .取值范围是[]1,1-6.下列说法中正确的是A .先把高二年级的2000名学生编号:1到2000,再从编号为1到50的学生中随机抽取1名学生,其编号为m ,然后抽取编号为50,100,150,m m m +++ 的学生,这种抽样方法是分层抽样法B .线性回归直线ˆˆy bxa =+不一定过样本中心()x y C .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1D .若一组数据2,4,a ,8的平均数是5,则该组数据的方差也是57.某同学用收集到的6组数据对(),(1,2,3,4,5,6)i i x y i =制作成如图所示的散点图(点旁的数据为该点坐标),并由最小二乘法计算得到回归直线1l 的方程:µµ11y b x a =+$,相关系数为1r ,相关指数为21R :经过残差分析确定点E 为“离群点”(对应残差过大的点),把它去掉后,再用剩下的5组数据计算得到回归直线2l 的方程:µµ22y b x a =+$,相关系数为2r ,相关指数为22R .则以下结论中,正确的是()①10r >,20r >;②µ10b >,µ20b >;③µµ12b b >;④2212R R >A .①②B .①②③C .②④D .②③④8.已知变量y 关于x 的非线性经验回归方程为0.5ˆe bx y-=,其一组数据如下表所示:x 1234ye3e 4e 5e 若5x =,则预测y 的值可能为()A .152e B .112e C .7e D .5e 第II 卷(非选择题)请点击修改第II 卷的文字说明二、填空题9.高中女学生的身高预报体重的回归方程是 0.7575.5y x =-(其中x , y 的单位分别是cm ,kg ),则此方程在样本()160,46处残差的绝对值是______.10.甲、乙、丙、丁四位同学在建立变量x ,y 的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R 2分别如下表:甲乙丙丁R 20.980.780.500.85建立的回归模型拟合效果最好的同学是__________.11.在一组样本数据()11,x y ,()22,x y ,…,(),n n x y (122,,,,n n x x x ≥⋅⋅⋅不全相等)的散点图中,若所有样本点()(),1,2,3,,i i x y i n =⋅⋅⋅都在直线210x y +-=上,则这组样本数据的相关系数r 为______.12.在一组样本数据()11,x y ,()22,x y ,…,()66,x y 的散点图中,若所有样本点(),i i x y ()1,2,,6i = 都在曲线212y bx =-附近波动.经计算6112i i x ==∑,6114i i y ==∑,62123ii x==∑,则实数b 的值为________.三、解答题13.某科技公司研发了一项新产品A ,经过市场调研,对公司1月份至6月份销售量及销售单价进行统计,销售单价x (千元)和销售量y (千件)之间的一组数据如下表所示:月份i 123456销售单价i x 99.51010.5118销售量iy 111086515(1)试根据1至5月份的数据,建立y 关于x 的回归直线方程;(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过065.千件,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想?参考公式:回归直线方程ˆˆˆybx a =+,其中i ii 122ii 1ˆnnx y n x yb xnx==-⋅⋅=-∑∑.参考数据:5i i i 1392x y ==∑,52i i 1502.5x ==∑.14.为了巩固拓展脱贫攻坚的成果,振兴乡村经济,某知名电商平台决定为脱贫乡村的特色水果开设直播带货专场.该特色水果的热卖黄金时段为2021年7月10日至9月10日,为了解直播的效果和关注度,该电商平台统计了已直播的2021年7月10日至7月14日时段中的相关数据,这5天的第x 天到该电商平台专营店购物的人数y (单位:万人)的数据如下表:日期7月10日7月11日7月12日7月13日7月14日第x 天12345人数y (单位:万人)75849398100(1)依据表中的统计数据,请判断该电商平台的第x 天与到该电商平台专营店购物的人数y (单位:万人)是否具有较高的线性相关程度?(参考:若0.30.75r <<,则线性相关程度一般,若0.75r >,则线性相关程度较高,计算r 时精确度为0.01)(2)求购买人数y 与直播的第x 天的线性回归方程;用样本估计总体,请预测从2021年7月10日起的第38天到该专营店购物的人数(单位:万人).参考数据:521(434i iy y =-=∑,51(64i i i x x y y =--=∑65.979≈.附:相关系数()()ni i x x y y r --=∑,回归直线方程的斜率121()()()niii nii x x y y bx x ==--=-∑∑ ,截距a y bx =-$$.15.近年来,明代著名医药学家李时珍故乡黄冈市蕲春县大力发展大健康产业,蕲艾产业化种植已经成为该县脱贫攻坚的主要产业之一,已知蕲艾的株高y (单位:cm)与一定范围内的温度x (单位:℃)有关,现收集了蕲艾的13组观测数据,得到如下的散点图:现根据散点图利用y a =+或dy c x=+建立y 关于x 的回归方程,令s =1t x=得到如下数据:xyst10.15109.943.040.16113niii s ys y=-⋅∑13113iii t yt y=-⋅∑1322113ik ss=-∑1322113ii t t =-∑ 1322113ii yy =-∑13.94-2.111.670.2121.22且(i s ,i y )与(i t ,i y )(i =1,2,3,…,13)的相关系数分别为1r ,2r ,且2r =﹣0.9953.(1)用相关系数说明哪种模型建立y 与x 的回归方程更合适;(2)根据(1)的结果及表中数据,建立 y 关于x 的回归方程;(3)已知蕲艾的利润z 与x 、y 的关系为1202z y x =-,当x 为何值时,z 的预报值最大.参考数据和公式:0.21×21.22=4.4562,11.67×21.22=247.637415.7365,对于一组数据(i u ,i v )(i =1,2,3,…,n ),其回归直线方程v u αβ=+的斜率和截距的最小二乘法估计分别为 1221ni i i nii u vnu v unuβ==-⋅=-∑∑, v u αβ=-,相关系数ni i u vnu vr -⋅∑.参考答案:1.A 【解析】【详解】样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36,∴样本总数为.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.考点:频率分布直方图.2.C 【解析】【分析】由相关系数的绝对值越大,越具有强大相关性,即可求解【详解】∵相关系数的绝对值越大,越具有强大相关性,C 相关系数的绝对值最大约接近1,∴C 拟合程度越好.故选:C 3.B 【解析】【分析】先求出线性方程的样本中心点,从而可求得 3.240y x =-+,再根据残差的定义可判断.【详解】由题意可知,99.51010.511105x ++++==,111086585y ++++==所以线性方程的样本中心点为(10,8),因此有 8 3.21040aa =-⨯+⇒=,所以 3.240y x =-+,在收集的5个样本点中,(10,8)一点在 3.240y x =-+上,故计算残差为0的样本点是(10,8).故选:B 4.A 【解析】【分析】由条件可知样本中心不变,可求出新的回归直线方程,即可判断.【详解】因为重新求得的经验回归直线l 的斜率为1.2,所以变量x 与y 具有正相关关系,故A 正确;当3x =时,315055y ..=⨯+=,设去掉两个误差较大的样本点后,横坐标的平均值为x ',纵坐标的平均值为y ',则12636322n x x x x n n n ++⋅⋅⋅+--=--'==,1210510522n y y y n n n y ++⋅⋅⋅+--'==--=,因为去除两个误差较大的样本点后,重新求得回归直线l 的斜率为1.2,所以ˆ53 1.2a =⨯+,解得 1.4ˆa =,所以去除两个误差较大的样本点后的经验回归方程为ˆ 1.2 1.4yx =+,故B 错误;因为1.5 1.2>,所以去除两个误差较大的样本点后y 的估计值增加速度变慢,故C 错误;因为ˆ 1.22 1.4 3.8y=⨯+=,所以ˆ 3.75 3.80.05y y -=-=-,故D 错误.故选:A.5.C 【解析】【分析】根据相关系数的概念,依次分析各选项即可得答案.【详解】解:对于A 选项,当相关系数为正时,表明变量之间是正相关,相关系数为负数时,表明相关系数为负数,故A 选项正确;对于B ,D 选项,相关系数范围是[]1,1-,故可以为正,也可以为负,故B ,D 选项正确;对于C 选项,当相关系数为负数时,样本相关系数越大,线性相关性就越弱,故C 选项错误;故选:C6.D 【解析】A 是系统抽样,B 选项线性回归直线ˆˆy bxa =+一定过样本中心(),x y ,C 选项若两个随机变量的线性相关性越强,则相关系数r 的绝对值越接近于1,D 选项若一组数据2,4,a ,8的平均数是5,求出a ,则该组数据的方差即可求解.【详解】A 选项:先把高二年级的2000名学生编号:1到2000,再从编号为1到50的学生中随机抽取1名学生,其编号为m ,然后抽取编号为50,100,150,m m m +++ 的学生,这种抽样方法是系统抽样法,所以该选项不正确;B 选项:线性回归直线ˆˆy bxa =+一定过样本中心(),x y ,所以该选项不正确;C 选项:若两个随机变量的线性相关性越强,则相关系数r 的绝对值越接近于1,所以该选项不正确;D 选项:若一组数据2,4,a ,8的平均数是5,24854a +++=,解得6a =,则该组数据的方差是()()()()22222545658554-+-+-+-=,所以该选项正确.故选:D 【点睛】此题考查抽样方法,回归直线,相关关系的辨析,求平均数和方差,关键在于熟练掌握相关概念和公式,准确计算.7.B 【解析】【分析】根据散点图逐项进行判断即可.【详解】①:由散点图可知,,x y 之间是正相关关系,所以10r >,20r >,故①正确;②③:由散点图可知,回归直线的斜率是正数,且1l 的斜率大于2l 的斜率,所以µ10b >,µ20b >,µµ12b b >,故②③正确;④:由散点图可知,去掉“离群点”E 后,相关性更强,拟合的效果更好,所以2212R R <,故④错误;故选:B.8.C 【解析】【分析】将0.5ˆe bx y-=两边同时取对数,得ln 0.5y bx =-,设0.5z bx =-,由样本中心()x z 必在回归直线0.5z bx =-上,可求出b ,从而即可求解.【详解】解:由题意,将0.5ˆe bx y-=两边同时取对数,得ln 0.5y bx =-,设0.5z bx =-,则x1234z13451234 2.54x +++==,13453.254z +++==,由0.5z bx =-,得3.25 2.50.5b =-,解得 1.5b =,所以 1.50.5e x y -=,所以当5x =时, 1.550.57e e y ⨯-==,故选:C.9.1.5##32【解析】【分析】利用回归直线方程,求出160x =的估计值,然后求解残差的绝对值.【详解】由样本数据得到,女大学生的身高预报体重的回归方程是 0.7575.5y x =-,当160x =时, 0.7516075.544.5y =⨯-=,此方程在样本()160,46处残差的绝对值:44.546 1.5-=.故答案为:1.5.10.选甲相关指数R 2越大,表示回归模型拟合效果越好.【解析】【分析】相关指数越大,相关性越强,拟合效果越好.根据相关指数的大小即可判断.【详解】相关指数2R 越大,相关性越强,回归模型拟合效果越好,所以效果最好的是甲.【点睛】如果两个变量间的关系是相关关系,相关指数2R 越大,相关系数r 越接近1,残差平方和越接近0,都代表拟合效果越好.11.1-【解析】【分析】根据直线斜率可知两个变量负相关,结合数据点都在直线上可确定1r =-.【详解】直线210x y +-=的斜率20k =-<,∴这两个变量成负相关,0r ∴<,又所有样本点都在直线210x y +-=上,1r ∴=-.故答案为:1-.12.1723【解析】【分析】设2t x =,可得回归直线方程为12y bt =-,求出样本中心点(),t y 代入可得b 的值.【详解】令2t x =则212y bx =-即12y bt =-,6212366i i x t ===∑,61147663ii y y ====∑,因为样本中心点237,63⎛⎫ ⎪⎝⎭在回归直线12y bt =-上,所以7231362b =-,可得:1723b =,故答案为:1723.13.(1)ˆ3240y x =-+.;(2)是.【解析】【分析】(1)先由表中的数据求出,x y ,再利用已知的数据和公式求出 ,ba ,从而可求出y 关于x 的回归直线方程;(2)当8x =时,求出 y 的值,再与15比较即可得结论【详解】(1)因为()199.51010.511105x =++++=,()1111086585y =++++=,所以23925108ˆ 3.2502.5510b -⨯⨯==--⨯,得()ˆ8 3.21040a=--⨯=,于是y 关于x 的回归直线方程为 3.240ˆyx =-+;(2)当8x =时,ˆ 3.284014.4y=-⨯+=,则ˆ14.4150.60.65yy -=-=<,故可以认为所得到的回归直线方程是理想的.14.(1)具有较高的线性相关程度(2) 6.470.8y x =+,314万人【解析】【分析】(1)由已知计算相关系数r 即可.(2)由列表计算 a、b ,可得线性回归方程进一步可得解.(1)由表中数据可得3,90x y ==,所以521()10i i x x =-=∑,又55211()434,()()64i i i i i y y x x y y ==-=--=∑∑,所以()()50.970.75i i x x y y r --=>∑,所以该电商平台直播黄金时段的天数x 与购买人数y 具有较高的线性相关程度.所以可用线性回归模型拟合人数y 与天数x 之间的关系.(2)由表中数据可得()()()5152164ˆ 6.410i i i i i x x y y b x x ==--===-∑∑,则ˆˆ90 6.4370.8a y bx =-=-⨯=,所以 6.470.8y x =+,令38x =,可得 6.4387031ˆ.84y =⨯+=(万人)15.(1)用d y c x =+模型建立y 与x 的回归方程更合适;(2)10ˆ111.54y x =-;(3)当温度为20时这种草药的利润最大.【解析】【分析】(1)利用相关系数1r ,2r ,比较1||r 与2||r 的大小,得出用模型d y c x=+建立回归方程更合适;(2)根据(1)的结论求出y 关于x 的回归方程即可;(3)由题意写出利润函数ˆz ,利用基本不等式求得利润z 的最大值以及对应的x 值.【详解】(1)由题意知20.9953r =-,10.8858r =,因为121r r <<,所有用d y c x =+模型建立y 与x 的回归方程更合适.(2)因为1311322113 2.1ˆ100.2113i i i i i t y t yd tt ==-⋅-===--∑∑,ˆˆ109.94100.16111.54cy dt =-=+⨯=,所以ˆy 关于x 的回归方程为10ˆ111.54y x=-(3)由题意知11012020(111.54ˆˆ)22z y x x x =-=--20012230.8()2x x =-+2230.8202210.8≤-=,所以22.8ˆ10z≤,当且仅当20x =时等号成立,所以当温度为20时这种草药的利润最大.。
高三回归方程知识点汇总

高三回归方程知识点汇总回归方程是数学中重要的数学模型,用于描述变量之间的关系和进行预测。
在高三阶段,学生需要掌握回归分析的基本知识和技巧。
本文将对高三数学中回归方程的知识点进行全面汇总,并提供一些实例和应用场景供参考。
一、线性回归方程1.1 线性关系与线性回归方程线性关系指的是两个变量之间存在直线关系,可用一条直线来近似表示。
线性回归方程是线性关系的数学表达式,常用形式为 y = kx + b,其中 k 表示直线的斜率,b 表示直线在 y 轴上的截距。
1.2 最小二乘法最小二乘法是确定线性回归方程中斜率 k 和截距 b 的常用方法。
它通过最小化观测值与回归直线的拟合误差平方和,找到最佳的拟合直线。
1.3 直线拟合与误差分析直线拟合是利用线性回归方程将观测数据点拟合到一条直线上。
误差分析可以评估回归方程的拟合优度,常用指标有决定系数R²、平均绝对误差 MAE 等。
二、非线性回归方程2.1 非线性关系与非线性回归方程非线性关系指的是两个变量之间的关系不能用一条直线来近似表示,而是需要使用曲线或其他非线性形式进行描述。
非线性回归方程可以是多项式方程、指数方程、对数方程等形式。
2.2 最小二乘法拟合非线性回归方程与线性回归相似,最小二乘法也可以用于拟合非线性回归方程。
但由于非线性方程的复杂性,通常需要借助计算工具进行求解,例如利用数学软件进行非线性拟合。
2.3 模型选择和拟合优度检验在选择非线性回归模型时,需要综合考虑模型的拟合优度和实际应用的需求。
常见的方法包括比较不同模型的决定系数 R²、检验残差分布等。
三、应用实例3.1 人口增长模型以某地区的人口数据为例,通过拟合合适的回归方程,可以预测未来的人口增长趋势,为城市规划和社会发展提供决策依据。
3.2 经济增长模型回归方程可以用于分析经济数据,例如拟合国民生产总值与时间的关系,预测未来的经济增长态势,为政府制定经济政策提供参考。
3.3 科学实验数据分析在科学研究中,常常需要利用回归方程对实验数据进行拟合和分析。
高三数学一轮复习课件:线性回归方程

课堂互动讲练
(3)若由线性回归方程得到的估计数据与 所选出的检验数据的误差均不超过2人, 则认为得到的线性回归方程是理想的, 试问该小组在(2)中所得线性回归方程是 否理想?
课堂互动讲练
解:(1)设“抽到相邻2个月的数据”为事件 A.因为从6组数据中选取2组数据共有15 种情况,每种情况都是等可能出现的, 其中抽到相邻两个月的数据的情况有5种, 所以P(A)= = .4分 1 5 15 3
,a= y -b x .其中
a,b是由观察值按最小二乘法求得 的估计值 ,也叫 回归系数 .
三基能力强化
1.下列关系中,是相关关系的为 ________. ①学生的学习态度与学习成绩之间的关 系; ②教师的执教水平与学生的学习成绩之 间的关系;
三基能力强化
③学生的身高与学生的学习成绩之间的 关系; ④家庭的经济条件与学生的学习成绩之 间的关系. 答案:①②
(1)判断家庭平均收入与月平均生活支出是否相关? (2)若二者线性相关,求回归直线方程.
课堂互动讲练
【思路点拨】 利用散点图观察 收入x和支出y是否线性相关,若呈线性相 关关系,可利用公式来求回归系数,然 后获得回归直线方程.
课堂互动讲练
【解】 (1)作出散点图:
课堂互动讲练
观察发现各个数据对应的点都在一条 直线附近,所以二者呈线性相关关系. (2) = (0.8+1.1+1.3+1.5+1.5+ 1 1.8+2.0+ 2.2 +2.4+2.8)=1.74, x 10 = (0.7+1.0+1.2+1.0+1.3+1.5 1 +1.3+ 1.7 +2.0+2.5)=1.42, y 10
课堂互动讲练
i= 1 i i
∑ x y =0.8×0.7+1.1×1.0+1.3×1.2+
线性回归方程-高中数学知识点讲解

线性回归方程
1.线性回归方程
【概念】
线性回归是利用数理统计中的回归分析,来确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法之一,运用十分广泛.分析按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析.如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析.如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析.变量的相关关系中最为简单的是线性相关关系,设随机变量与变量之间存在线性相关关系,则由试验数据得到的点将散布在某一直线周围.因此,可以认为关于的回归函数的类型为线性函数.
【实例解析】
例:对于线性回归方程푦=1.5푥+45,푥1∈{1,7,5,13,19},则푦=
解:푥=1+7+5+13+19
5
=
9,因为回归直线必过样本中心(푥,푦),
所以푦=1.5×9+45=13.5+45=58.5.
故答案为:58.5.
方法就是根据线性回归直线必过样本中心(푥,푦),求出푥,代入即可求푦.这里面可以看出线性规划这类题解题方法比较套路化,需要熟记公式.
【考点点评】
这类题记住公式就可以了,也是高考中一个比较重要的点.
1/ 1。
(完整版)数学必修三回归分析经典题型(带答案)

数学必修三回归分析经典题型1.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为93.7319.7ˆ+=x y用这个模型预测这个孩子10岁时的身高,则正确的叙述是( ) A.身高一定是145.83cm B.身高在145.83cm 以上 C.身高在145.83cm 以下 D.身高在145.83cm 左右 【答案】D【解析】解:把x=10代入可以得到预测值为145.83,由于回归模型是针对3-9岁的孩子的,因此这个仅仅是估计值,只能说左右,不能说在上或者下,没有标准。
选D2.对有线性相关关系的两个变量建立的线性回归方程$y =$a+b $x ,关于回归系数b $,下面叙述正确的是________.①可以小于0;②大于0;③能等于0;④只能小于0. 【答案】①【解析】由b$和r 的公式可知,当r =0时,这两变量不具有线性相关关系,但b 能大于0也能小于0.3.对具有线性相关关系的变量x 、y 有观测数据(x i ,y i )(i =1,2,…,10),它们之间的线性回归方程是$y =3x +20,若101i i x =∑=18,则101i i y =∑=________.【答案】254【解析】由101i i x =∑=18 1.8.因为点在直线$y =3x +2025.4. 所以101i i y =∑=25.4×10=254.4.下表是某厂1~4由散点图可知,用水量其线性回归直线方程是y =-0.7x +a ,则a 等于________. 【答案】5.252.53.5,∵回归直线方程过定点, ∴3.5=-0.7×2.5+a. ∴a =5.25.5.由一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到线性回归方程$y =b$x +$a ,那么下列说法正确的是________.①直线$y =b$x +$a 必经过点(x ,y ); ②直线$y =b$x +$a 至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点; ③直线$y =b$x +$a 的斜率为1221ni ii nii x ynx y xnx==--∑∑;④直线$y =b $x +$a 和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差$21()ni i i b a y x =⎡⎤⎣⎦∑$-+是该坐标平面上的直线与这些点的最小偏差.【答案】①③④【解析】回归直线的斜率为b ,故③正确,回归直线不一定经过样本点,但一定经过样本中心,故①正确,②不正确.6.某数学老师身高176 cm ,他爷爷、父亲和儿子的身高分别是173 cm 、170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________cm. 【答案】185【解析】设父亲身高为173176,b$= $a=-b $ 176-1×173=3, ∴$y =x +3,当x =182时,$y =185.7.下表是关于宿州市服装机械厂某设备的使用年限(年)和所需要的维修费用y (万元)的几组统计数据:)请根据上表提供的数据,用最小二乘法求出y 关于的线性回归方程;(2)估计使用年限为10年时,维修费用为多少?【答案】解:(1)0.08 1.23yx =+线性回归方程为 (2)估计使用年限为10年时,维修费用为12.38万元. 【解析】(1)先求然后利用公可求出回归直线y ax b =+方程.(2)把x=10代入回归直线方程可得y 的值,就可得所求的值.解:(1906543222222512=++++=∑=i ixΘ又x y 23.108.0+=∴线性回归方程为 (2)把10=x 代入回归方程得到:38.121023.108.0=⨯+=y∴估计使用年限为10年时,维修费用为12.38万元.。
2018 高考 回归分析和独立性检验专题复习(学生版)

回归分析与独立性检验(一)变量间的相关关系、回归分析的基本思想及初步运用一、相关关系:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系. 二、散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图. 三、回归分析:对具有相关关系的两个变量进行统计分析的方法叫回归分析. 1、回归直线方程设所求的直线方程为y b x a ∧=+,其中121()(),()ni i i ni i x x y y b a y b x x x ==--==--∑∑,1111,,nni i i i x x y y nn====∑∑(,)x y 称为样本点的中心,回归直线过样本点的中心.回归方程的截距a 和斜率b 是用最小二乘法计算出来的. 2、相关系数:两个变量之间线性相关关系的强弱用相关系数r 来衡量.相关系数:()()ni i x x y y r --=∑0r >,表示两个变量正相关;0r <,表示两个变量负相关;r的绝对值越接近1,表明两个变量的线性相关性越强.r 的绝对值越接近0,表明两个变量之间几乎不存在线性相关关系.通常,r 的绝对值大于0.75时,表明两个变量的线性相关性很强. (二)独立性检验的基本思想及其初步运用一、用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量.例:是否吸烟,是否患肺癌等 二、独立性检验的方法:列出两个分类变量的频数表(列联表),直观判断.一般步骤: (1)2*2列联表(2)提出假设:设p 与q 没有关系 (3)根据列联表中的数据2K 计算的值22()()()()()()n a d b c Kn a b c d a b c d a c b d -==+++++++其中为样本容量(4)根据计算得到的随机变量2K 的观测值作出判断如:24.232K =因为4.232介于临界值3.841和5.024之间,2( 3.841)p K ≥=0.05,所以两个分类变量没有关系的概率是5%,即两个分类变量有关系的概率为95%.【例1】【2017课标1,文19】为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm ).下面是检验员在一天内依次抽取的16个零件的尺寸:经计算得16119.9716i i x x ===∑,0.212s ==≈,18.439≈,161()(8.5) 2.78i i x x i =--=-∑,其中i x 为抽取的第i 个零件的尺寸,1,2,,16i =⋅⋅⋅. (1)求(,)i x i (1,2,,16)i =⋅⋅⋅的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若||0.25r <,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小). (2)一天内抽检零件中,如果出现了尺寸在(3,3)x s x s -+之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查. (ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ⅱ)在(3,3)x s x s -+之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(,)i i x y (1,2,,)i n =⋅⋅⋅的相关系数()()ni i x x y y r --=∑0.09≈.【反馈检测1】下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图(Ⅰ)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (Ⅱ)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:719.32i i y ==∑,7140.17i i i t y ==∑0.55=2.646≈.参考公式:相关系数()()ni i t t y y r --=∑回归方程y a b t =+ 中斜率和截距的最小二乘估计公式分别为:121()()()ni i i ni i t t y y b t t ==--=-∑∑,=.a yb t -【例2】全国人大常委会会议于 2015年12月27日通过了关于修改人口与计划生育法的决定, “全面二孩”从2016年元旦起开始实施,A市妇联为了解该市市民对“全面二孩”政策的态度,随机抽取了男性市民30人、女性市民70人进行调查, 得到以下的22⨯列联表:(1)根椐以上数据,能否有090的把握认为A市市民“支持全面二孩”与“性别”有关?(2)现从持“支持”态度的市民中再按分层抽样的方法选出15名发放礼品,分别求所抽取的15人中男性市民和女性市民的人数;(3)将上述调查所得到的频率视为概率,.现在从A市所有市民中,采用随机抽样的方法抽取3位市民进行长期跟踪调查, 记被抽取的3位市民中持“支持”态度人数为X.①求X的分布列;②求X的数学期望()E X和方差()D X.参考公式:()()()()()22n a d b cKa b a d a c b d-=++++,其中n a b c d=+++【反馈检测3】【2017课标II ,理18】海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg )某频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记A 表示事件:“旧养殖法的箱产量低于50kg, 新养殖法的箱产量不低于50kg”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01)附:22()()()()()n a d b c K a b c d a c b d -=++++。
高三线性回归方程知识点

高三线性回归方程知识点线性回归是数学中的一种方法,用于建立一个自变量与因变量之间的关系。
在高三数学中,线性回归方程是一个重要的知识点。
本文将介绍高三线性回归方程的基本概念、推导过程以及应用范围。
一、基本概念1. 线性回归方程线性回归方程,也叫作线性回归模型,表示自变量x和因变量y之间的关系。
它可以用如下的一般形式表示:y = β0 + β1x + ε其中,y表示因变量,x表示自变量,β0和β1表示模型中的参数,ε表示误差项。
2. 参数估计线性回归方程中的参数β0和β1需要通过观测数据进行估计。
常用的方法是最小二乘法,即通过最小化实际观测值和预测值之间的差异,来得到最优的参数估计值。
二、推导过程1. 求解参数通过最小二乘法,可以得到线性回归方程中的参数估计值。
具体推导过程包括以下几个步骤:(1)确定目标函数:将观测值和预测值之间的差异平方和作为目标函数。
(2)对目标函数求偏导:对目标函数分别对β0和β1求偏导,并令偏导数为0。
(3)计算参数估计值:根据求得的偏导数为0的方程组,解出β0和β1的值。
2. 模型拟合度评估在得到参数估计值之后,需要评估线性回归模型的拟合度。
常用的指标包括相关系数R和残差平方和SSE等。
相关系数R可以表示自变量和因变量之间的线性相关程度,取值范围在-1到1之间,越接近1表示拟合度越好。
三、应用范围线性回归方程在实际问题中有广泛的应用,例如经济学、统计学、社会科学等领域。
它可以用来分析自变量和因变量之间的关系,并预测未来的结果。
1. 经济学应用在线性回归模型中,可以将自变量设置为经济指标,例如GDP、通货膨胀率等,将因变量设置为某一经济现象的数值。
通过构建线性回归方程,可以分析不同经济指标对经济现象的影响,为经济决策提供参考依据。
2. 统计学应用线性回归方程是统计学中的一项重要工具。
通过对观测数据的拟合,可以得到参数估计值,并进一步分析自变量和因变量之间的关系。
统计学家可以利用线性回归分析建立统计模型,为实验数据的解释提供更为准确的结论。
高考回归分析知识点

高考回归分析知识点回归分析是统计学中一种重要的分析方法,用于研究变量之间的关系和预测。
在高考数学中,回归分析也是一个重要的知识点。
本文将介绍高考中常见的回归分析知识点,并结合具体例子进行解析。
一、简单线性回归1. 定义:简单线性回归是指在研究两个变量之间关系时,其中一个变量为自变量,另一个变量为因变量,且二者之间存在线性关系的情况。
2. 公式:简单线性回归模型的数学表示为:Y = α + βX + ε,其中Y为因变量,X为自变量,α和β为常数,ε为误差项。
3. 参数估计:通过最小二乘法可以估计出回归系数α和β的值,从而建立回归方程。
示例:假设我们想研究学生的学习时间与考试分数之间的关系。
我们收集了一组数据,学习时间(自变量X)和考试分数(因变量Y)的数值如下:学习时间(小时):[5, 10, 15, 20, 25, 30]考试分数(分数):[60, 70, 75, 80, 85, 90]通过简单线性回归分析,我们可以建立回归方程为:Y = 55 + 0.75X,说明学习时间对考试分数有正向影响。
二、多元线性回归1. 定义:多元线性回归是指在研究多个自变量与一个因变量之间关系时的回归分析方法。
它可以用来探究多个因素对因变量的影响程度,并进行预测和解释。
2. 公式:多元线性回归模型的数学表示为:Y = α + β₁X₁ + β₂X₂+ ... + βₚXₚ + ε,其中Y为因变量,X₁、X₂、...、Xₚ为自变量,α和β₁、β₂、...、βₚ为常数,ε为误差项。
3. 参数估计:同样通过最小二乘法可以估计出回归系数α和β₁、β₂、...、βₚ的值,从而建立回归方程。
示例:我们想研究学生的考试分数与学习时间、家庭收入、家庭教育水平等因素之间的关系。
我们收集了一组数据,学习时间(自变量X₁)、家庭收入(自变量X₂)、家庭教育水平(自变量X₃)和考试分数(因变量Y)的数值如下:学习时间(小时):[5, 10, 15, 20, 25, 30]家庭收入(万元):[8, 10, 12, 15, 18, 20]家庭教育水平(年):[10, 12, 14, 16, 18, 20]考试分数(分数):[60, 70, 75, 80, 85, 90]通过多元线性回归分析,我们可以建立回归方程为:Y = 50 +0.7X₁ + 1.2X₂ + 1.5X₃,说明学习时间、家庭收入和家庭教育水平都对考试分数有正向影响。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高考数学1.3线性回归分析专题1
2020.03
1,圆心在x 轴上,经过原点,并且与直线y =4相切的圆的一般方程是
.
2,不等式521<-≤x 的解集是____________________________.
3,某单位用木料制作如图所示的框架, 框架的下部是边长分别为x 、y(单位:m)的矩形.上部是等腰直角三角形. 要求框架围成的总面积8cm 2. 问x 、y 分别为多少时用料最省?
4,在三棱锥P-ABC 中,三侧棱两两垂直,且PB=PC=2PA,PO 垂直于面ABC,O 是垂足,如果设=PA a =PB b =c,请用a 、b 、c 表示P :_______________. 5,命题“" x ∈R ,x 2- x ≥0.”的否定是________________________.
6,已知点P(x,y)满足:⎪⎩
⎪
⎨⎧≥≥≤+≥-0,020y x y x y x ,则
y x z +=
21
可取得的最大值为
___________.
7,斜率为1的直线与抛物线x y =2
只有一个公共点,这条直线的方程是
______________.
8,三个数成等比数列,且它们的和为21,积是64.求这三个数. 9,椭圆的两个焦点恰好将长轴三等分,则椭圆的离心率是_____________.
10,椭圆上11692
2=+y x 一动点P 到两焦点距离之和为
A .10
B .8
C .6
D .不确定
11,椭圆
122
22=+b y a x (a >b >)0与直线1=+y x 交于P 、Q 两点,且OQ OP ⊥,其中O 为坐标原点.
(1)求2
211b a +的值;
(2)若椭圆的离心率e 满足
3
3≤ ≤
2
2
,求椭圆长轴的取值范围.
12,已知点M 在平面ABC 内,并且对空间任一点O ,1123OM xOA OB OC
=++u u u u r u u u r u u u r u u u r ,
则x 的值是
A .0
B .1/2
C .1/3
D .1/6 13,椭圆x 2+4y 2=16被直线y=x +1截得的弦长为 .
14,已知点A 、B 的坐标分别是A (0,-1),B (0,1),直线AM 、BM 相交于点M ,且它们的斜率之积是2,求点M 的轨迹方程,并说明曲线的类型.
15,解关于x 的不等式).(02
R a a x a
x ∈<--
16,在ΔABC 中,ab c b a -=+2
22,则角C=__________.
17,向量a=(0,1,2),b=(1,0,-1),则数量积a •b=
A .(1,1,1)
B .0
C .-2
D .(0,0,-2)
18,不论m 为何实数,直线(m-1)x -y+2m+1=0恒过定点_______________.
19,已知P 是直线λ上一点,将直线 绕
P 点逆时针方向旋转θ(2
0π
θ<
<)
所得直线为1λ:0223=--y x .若继续绕P 点逆时针方向旋转θ
π-2
角,得直
线2λ:01132=-+y x .求直线λ的方程.
20,求与直线 y=x 相切,圆心在直线 y=3x 上且被 y 轴截得的弦长为22的圆的方程.
21,求与椭圆1244922=+y x 有公共焦点,且一条渐近线为x
y 34=的双曲线的方
程.
22,有下列命题:
(1)若两条直线平行,则其斜率必相等;
(2)若两条直线的斜率乘积为-1, 则其必互相垂直;
(3)过点(-1,1),且斜率为2的直线方程是211
=+-x y ;
(4)同垂直于x 轴的两条直线一定都和y 轴平行; (5)若直线的倾斜角为α,则πα≤≤0.
其中为真命题的有_____________(填写序号)
23,已知空间两点A (4,a ,-b ),B (a ,a ,2),则向量AB u u u r
= A .(a-4,0,2+b ) B .(4-a ,0,-b-2) C .(0,a-4,2+b ) D .(a-4,0,-b-2)
答案
1, x 2+y 2±8x =0 2, ]1,3()7,3[-⋃
3, [解析]:由题意得 xy+41x 2
=8,∴y=x
x 4
82-=
48x x -(0<x<42). 于定, 框架用料长度为 L=2x+2y+2(x
22)=(23+2)x+x 16
≥
4246+. 当(
+
)x=
,即x=8-42时等号成立.
此时, 用料最省.
4,
c b a ρ
ρρ616132++ 5,
0,2<-∈∃x x R x 6, 3/2 7,
41
+
=x y
8, 解:设这三个数依次为a/q,a,aq 根据题意,有
a/q+a+aq=21(4分)和64
=⋅⋅aq a q a
,
解得:a=4,(8分)q=4或1/4
这三个数依次为1,4,16或16,4,1 9, 1/3 10, C
11, [解析]:设),(),,(2211y x P y x P ,由OP ⊥ OQ ⇔ x 1 x 2 + y 1 y 2 = 0 ①
01)(2,1,1212122
11=++--=-=x x x x x y x y 代入上式得:Θ又将
代入
x y -=1
122
22=+b y a x 0)1(2)(222222=-+-+⇒b a x a x b a ,
,2,022221b a a x x +=+∴>∆Θ 2
22221)1(b a b a x x +-=
代入①化简得 21
122=+b a .
(2)
,3221211311222222222
≤≤⇒≤-≤∴-==a b a b a b a c e Θ又由(1)知122
22
-=a a b 2
6
252345321212122≤≤⇒≤≤⇒≤-≤∴a a a ,∴长轴 2a ∈ [6,5].
12, D
13, 5384
14, 解:设M(x,y),则
),0(0)
1(),0(01≠---=≠--=
x x y k x x y k AM BM ,t k k AM BM -=⋅
)
0(0)
1(01≠-=---⋅--x t x y x y , 整理得)
0(112
2
≠=+x t x y
(1) 当t ∈(0,1)时,M 的轨迹为椭圆(除去A 和B 两点); (2)当t=1时,M 的轨迹为圆(除去A 和B 两点).
15, [解析]:原不等式⇔0))((2<--a x a x . 分情况讨论
(i )当a <0或a >1时,有a <a 2,此时不等式的解集为}|{2
a x a x <<;
(ii )当10<<a 时,有a 2<a ,此时不等式组的解集为
};|{2a x a x << (iii )当a=0或a=1时,原不等式无解. 综上,当a <0或a >1时时,原不等式的解集为; 当
时,原不等式的解集为
当a=0或a=1时,原不等式的解集为φ.
16, 120°(或3
2π
)
17, C 18, )3,2(-
19, [解析]:由题意知点P 是1λ与2λ的交点,且2λλ⊥,则由 322023110x y x y --=⎧⎨
+-=⎩ ⇒ 71x y =⎧⎨
=-⎩,即P (7,-1),又2
3
12
=-=λλk k ,所以直线λ的方程为:
)7(23
1-=
+x y
即02323=--y x .
20, [解析]:设圆心坐标为0)r(r ),3,(001>半径为x x O ,则
r
x x =-2
30
00
2x r =⇒,
又
2
202)2(,22r x AB =+∴=
2
2202020±=⇒=+⇒x x x ,2=∴r
即圆的方程为:
4
)23()2(4)23()2(2222=-+-=+++y x y x 或.
21, 解:由椭圆标准方程1
24492
2=+y x 可得的两者公共焦点为(-5,0)和
(5,0),
设双曲线的方程为)0,0(12
222>>=-b a b y a x , 其渐近线为
x a b y ±=, 现已知双曲线的一条渐近线为
x y 34=
,得34
=a b ,又双曲线中2
225=+b a ,
解得4,3==b a ,∴双曲线的方程为14322
2
2=-y x
22, (2) 23, A。