高中数学线性回归分析集锦

合集下载

高三回归方程知识点汇总

高三回归方程知识点汇总

高三回归方程知识点汇总回归方程是数学中重要的数学模型,用于描述变量之间的关系和进行预测。

在高三阶段,学生需要掌握回归分析的基本知识和技巧。

本文将对高三数学中回归方程的知识点进行全面汇总,并提供一些实例和应用场景供参考。

一、线性回归方程1.1 线性关系与线性回归方程线性关系指的是两个变量之间存在直线关系,可用一条直线来近似表示。

线性回归方程是线性关系的数学表达式,常用形式为 y = kx + b,其中 k 表示直线的斜率,b 表示直线在 y 轴上的截距。

1.2 最小二乘法最小二乘法是确定线性回归方程中斜率 k 和截距 b 的常用方法。

它通过最小化观测值与回归直线的拟合误差平方和,找到最佳的拟合直线。

1.3 直线拟合与误差分析直线拟合是利用线性回归方程将观测数据点拟合到一条直线上。

误差分析可以评估回归方程的拟合优度,常用指标有决定系数R²、平均绝对误差 MAE 等。

二、非线性回归方程2.1 非线性关系与非线性回归方程非线性关系指的是两个变量之间的关系不能用一条直线来近似表示,而是需要使用曲线或其他非线性形式进行描述。

非线性回归方程可以是多项式方程、指数方程、对数方程等形式。

2.2 最小二乘法拟合非线性回归方程与线性回归相似,最小二乘法也可以用于拟合非线性回归方程。

但由于非线性方程的复杂性,通常需要借助计算工具进行求解,例如利用数学软件进行非线性拟合。

2.3 模型选择和拟合优度检验在选择非线性回归模型时,需要综合考虑模型的拟合优度和实际应用的需求。

常见的方法包括比较不同模型的决定系数 R²、检验残差分布等。

三、应用实例3.1 人口增长模型以某地区的人口数据为例,通过拟合合适的回归方程,可以预测未来的人口增长趋势,为城市规划和社会发展提供决策依据。

3.2 经济增长模型回归方程可以用于分析经济数据,例如拟合国民生产总值与时间的关系,预测未来的经济增长态势,为政府制定经济政策提供参考。

3.3 科学实验数据分析在科学研究中,常常需要利用回归方程对实验数据进行拟合和分析。

高中数学知识点精讲精析 线性回归方程

高中数学知识点精讲精析 线性回归方程

6.4 线性回归方程1、确定性函数关系:变量之间可以用函数表示2、相关关系:变量之间具有一定的联系,但不能完全用函数表达引入:某小卖部为了了解热茶销售量与气温的大致的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温对照表如果某天的气温是-5℃,你能根据这些数据预测这天小卖部卖出热茶的杯数么?考虑离差的平方和:一般地,设有n对观察数据如下:仿照前面的方法,可得线性回归方程中系数a,b满足由此二元一次方程组便可依次求出b 、a 的值.相关关系1. 散点图、正相关、负相关2. 数据回归直线方程:样本相关系数:1112211nn n i i i i i i i n ni i i i n x y x y b n x x a y bx =====⎧⎛⎫⎛⎫-⎪⎪⎪⎝⎭⎝⎭⎪=⎪⎛⎫⎨- ⎪⎪⎝⎭⎪⎪=-⎩∑∑∑∑∑)(121n x x x n x +++=)(121n y y y n y +++= ∑=+++=ni nix x x x1222212 ∑=+++=ni niy y y y1222212 ∑=+++=ni nn ii y x y x y x yx 12211 ∑∑==--=n i i ni ii xn x yx n yx b 1221x b y a -=a bx y +=⋂∑∑∑===-⋅--=ni ni i ini ii y y x xyx n yx r 11221)()(时回归直线有意义时回归直线无意义.该市统计调查队随机调查10个家庭,【解析】∴ 回归直线有意义∴ 回归直线:∑∑∑===---=ni ni i i ni ii y n y x n x yx n yx 11221))((1||≤r 05.0||r r >05.0||r r ≤88.321012=∑=i ix∑==10127.22i iy∑==10117.27i ii yx 632.0950.005.0=>=r r 013.0-=a 833.0=b 013.0833.0-=x y(1)检验是否线性相关. (2)求回归方程.(3)若市政府下一步再扩大5千煤气用户.试预测该市煤气消耗量将达到多少. 【解析】解:(1)线性相关(2)(3)代入 所以煤气量达3037万立方米3. 为了了解参加某种知识竞赛的1003名学生的成绩,请用系统抽样抽取一个容量为50的样本. 【解析】解:(1)随机地将这1003个个体编号为1,2,3, (1003)(2)利用简单随机抽样,先从总体中剔除3个个体(可利用随机数表),剩下的个体数1000能被样本容量50整除,然后再按系统抽样的方法进行.总体中的每个个体被剔除的概率相等(3/1003),也就是每个个体不被剔除的概率相等(1000/1003),采用系统抽样时每个个体被抽取的概率都是(50/1000),所以在整个抽样过程中每个个体被抽取的概率仍然相等,都是4. 某农场种植的甲乙两种水稻,在连续6年中各年的平均产量如下:哪种水稻的产量比较稳定? 【解析】解:因为,所以甲水稻的产量比较稳定5. 已知10只狗的血球体积及红血球的测量值如下:x (血球体积,mm ),y (血红球数,百万)(1)画出上表的散点图;(2)求出回归直线并且画出图形; (3)回归直线必经过的一点是哪一点? 【解析】05.0632.0998.0r r =>=06.6=b 07.0=a x y 06.607.0+=⋂55.05.40=+=x 37.30=⋂y 10035010005010031000=⨯6/)9.683.638.675.69.675.6(+++++=甲x 75.6=177.0=甲S 6/)68.645.638.613.72.768.6(+++++=乙x 75.6=312.0=乙S 乙甲S S <解:(1)见下图(2)设回归直线为则所以所求回归直线的方程为,图形如下:故可得到从而得回归直线方程是点评:借助散点图,可以直观探究两个变量是否具有线形相关关系;运用由最小二乘法思想得到回归直线方程的回归系数和,会由数据求回归直线方程,并利用回归直线方程进行回归分析与预测.50.45)50394058354248464245(101=+++++++++=x 37.7)72.855.620.649.990.599.650.752.930.653.6(101=+++++++++=y a bx y +=⋂176.01221=--=∑∑==ni ini ii xn xxyn yx a 64.0-=-=x a y b 64.0176.0-=⋂x y 75.430770003.399307871752≈⨯-⨯⨯-=b 2573075.43.399≈⨯-=a 25775.4+=⋂x y a b。

(完整版)数学必修三回归分析经典题型(带答案)

(完整版)数学必修三回归分析经典题型(带答案)

数学必修三回归分析经典题型1.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为93.7319.7ˆ+=x y用这个模型预测这个孩子10岁时的身高,则正确的叙述是( ) A.身高一定是145.83cm B.身高在145.83cm 以上 C.身高在145.83cm 以下 D.身高在145.83cm 左右 【答案】D【解析】解:把x=10代入可以得到预测值为145.83,由于回归模型是针对3-9岁的孩子的,因此这个仅仅是估计值,只能说左右,不能说在上或者下,没有标准。

选D2.对有线性相关关系的两个变量建立的线性回归方程$y =$a+b $x ,关于回归系数b $,下面叙述正确的是________.①可以小于0;②大于0;③能等于0;④只能小于0. 【答案】①【解析】由b$和r 的公式可知,当r =0时,这两变量不具有线性相关关系,但b 能大于0也能小于0.3.对具有线性相关关系的变量x 、y 有观测数据(x i ,y i )(i =1,2,…,10),它们之间的线性回归方程是$y =3x +20,若101i i x =∑=18,则101i i y =∑=________.【答案】254【解析】由101i i x =∑=18 1.8.因为点在直线$y =3x +2025.4. 所以101i i y =∑=25.4×10=254.4.下表是某厂1~4由散点图可知,用水量其线性回归直线方程是y =-0.7x +a ,则a 等于________. 【答案】5.252.53.5,∵回归直线方程过定点, ∴3.5=-0.7×2.5+a. ∴a =5.25.5.由一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到线性回归方程$y =b$x +$a ,那么下列说法正确的是________.①直线$y =b$x +$a 必经过点(x ,y ); ②直线$y =b$x +$a 至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点; ③直线$y =b$x +$a 的斜率为1221ni ii nii x ynx y xnx==--∑∑;④直线$y =b $x +$a 和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差$21()ni i i b a y x =⎡⎤⎣⎦∑$-+是该坐标平面上的直线与这些点的最小偏差.【答案】①③④【解析】回归直线的斜率为b ,故③正确,回归直线不一定经过样本点,但一定经过样本中心,故①正确,②不正确.6.某数学老师身高176 cm ,他爷爷、父亲和儿子的身高分别是173 cm 、170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________cm. 【答案】185【解析】设父亲身高为173176,b$= $a=-b $ 176-1×173=3, ∴$y =x +3,当x =182时,$y =185.7.下表是关于宿州市服装机械厂某设备的使用年限(年)和所需要的维修费用y (万元)的几组统计数据:)请根据上表提供的数据,用最小二乘法求出y 关于的线性回归方程;(2)估计使用年限为10年时,维修费用为多少?【答案】解:(1)0.08 1.23yx =+线性回归方程为 (2)估计使用年限为10年时,维修费用为12.38万元. 【解析】(1)先求然后利用公可求出回归直线y ax b =+方程.(2)把x=10代入回归直线方程可得y 的值,就可得所求的值.解:(1906543222222512=++++=∑=i ixΘ又x y 23.108.0+=∴线性回归方程为 (2)把10=x 代入回归方程得到:38.121023.108.0=⨯+=y∴估计使用年限为10年时,维修费用为12.38万元.。

高一数学必修线性回归分析知识点

高一数学必修线性回归分析知识点

⾼⼀数学必修线性回归分析知识点 分析按照⾃变量和因变量之间的关系类型,可分为线性回归分析和⾮线性回归分析。

下⾯是店铺给⼤家带来的⾼⼀数学必修线性回归分析知识点,希望对你有帮助。

⾼⼀数学线性回归分析知识点总结(⼀) 重点难点讲解: 1.回归分析: 就是对具有相关关系的两个变量之间的关系形式进⾏测定,确定⼀个相关的数学表达式,以便进⾏估计预测的统计分析⽅法。

根据回归分析⽅法得出的数学表达式称为回归⽅程,它可能是直线,也可能是曲线。

2.线性回归⽅程 设x与y是具有相关关系的两个变量,且相应于n组观测值的n个点(xi, yi)(i=1,......,n)⼤致分布在⼀条直线的附近,则回归直线的⽅程为。

其中 。

3.线性相关性检验 线性相关性检验是⼀种假设检验,它给出了⼀个具体检验y与x之间线性相关与否的办法。

①在课本附表3中查出与显著性⽔平0.05与⾃由度n-2(n为观测值组数)相应的相关系数临界值r0.05。

②由公式,计算r的值。

③检验所得结果 如果|r|≤r0.05,可以认为y与x之间的线性相关关系不显著,接受统计假设。

如果|r|>r0.05,可以认为y与x之间不具有线性相关关系的假设是不成⽴的,即y与x之间具有线性相关关系。

典型例题讲解: 例1.从某班50名学⽣中随机抽取10名,测得其数学考试成绩与物理考试成绩资料如表:序号12345678910数学成绩54666876788285879094,物理成绩61806286847685828896试建⽴该10名学⽣的物理成绩对数学成绩的线性回归模型。

解:设数学成绩为x,物理成绩为,则可设所求线性回归模型为, 计算,代⼊公式得 ∴所求线性回归模型为=0.74x+22.28。

说明:将⾃变量x的值分别代⼊上述回归模型中,即可得到相应的因变量的估计值,由回归模型知:数学成绩每增加1分,物理成绩平均增加0.74分。

⼤家可以在⽼师的帮助下对⾃⼰班的数学、化学成绩进⾏分析。

高中数学知识点精讲精析 线性回归分析 (2)

高中数学知识点精讲精析 线性回归分析 (2)

1.3 线性回归分析1.客观事物是相互联系的但实际上更多存在的是一种非因果关系 某某同学的数学成绩与物理成绩,彼此是互相联系的,但不能认为数学是“因”,物理是“果”,或者反过来说 “果”,而真正的“因”是学生的理科学习能力和努力程度 函数关系存在着一种确定性关系 2.线性相关关系:像能用直线方程ˆybx a =+近似表示的相关关系叫做线性相关关系. 3.线性回归方程:一般地,设有n 个观察数据如下:当,a b 使2221122()()...()n n Q y bx a y bx a y bx a =--+--++--取得最小值时,就称ˆybx a =+为拟合这n 对数据的线性回归方程,该方程所表示的直线称为回归直线. 上述式子展开后,是一个关于,a b 的二次多项式,应用配方法,可求出使Q 为最小值时的,a b 的值.即1112211()()()n n n i i i i i i i i i i i n x y x y b n x x a y bx=====⎧-⎪⎪=⎨-⎪⎪=-⎪⎩∑∑∑∑∑,(*) ∑==ni i x n x 11, ∑==n i i y n y 111. 下表为某地近几年机动车辆数与交通事故数的统计资料,请判断机动车辆数与交通事故数之间是否有线性相关关系,如果具有线性相关关系,求出线性回归方程;如果不具有线性相关关系,说明理由.【解析】在直角坐标系中画出数据的散点图,直观判断散点在一条直线附近,故具有线性相关关系.计算相应的数据之和:8888211111031,71.6,137835,9611.7ii i i i i i i i xy x x y ========∑∑∑∑,将它们代入(*)式计算得0.0774, 1.0241b a ≈=-,所以,所求线性回归方程为0.0774 1.0241y x =-.2.有10名同学高一(x )和高二(y )的数学成绩如下:⑴画出散点图;⑵求y 对x 的回归方程 【解析】 ⑴如图:⑵ 由已知表格的数据可得,,所以,又可查表中相应与显著性水平0.05和n -2的相关系数的临界值 因为可知,y 与x 具有相关关系. 因为y 与x 具有相关关系,设y=bx+a ,∴71,72.3x y ==101011710,723ii i i xy ====∑∑1010102211151467,50520,52541i ii i i i i x yx y ======∑∑∑10100.7802972i ix y x yr -⋅===∑0.050.632,r =0.05r r >1012110 1.22,14.3210i ii nii x y x yb a y bx xx==-⋅=≈=-≈--∑∑∴所求的回归方程为y=1.22x -14.32.3.下列两个变量之间的关系哪个不是函数关系( D ) A .角度和它的余弦值B.正方形边长和面积C .正n边形的边数和它的内角和 D.4.给出施化肥量对水稻产量影响的试验数据:(1)画出上表的散点图;(2)求出回归直线并且画出图形 【解析】(1)散点图(略).(2)表中的数据进行具体计算,列成以下表格 故可得到 2573075.43.399,75.430770002≈⨯-=≈⨯-=a b从而得回归直线方程是^4.75257y x =+.(图形略)5.一个工厂在某年里每月产品的总成本y (万元)与该月产量x (万件)之间由如下一组数据: 1)画出散点图;2)检验相关系数r 的显著性水平;3)求月总成本y 与月产量x 之间的回归直线方程.解析:=,==2.8475,=29.808,=99.2081,=54.243 1)画出散点图:2)r==在“相关系数检验的临界值表”查出与显著性水平0.05及自由度12-2=10相应的相关数临界值r0.05=0.576<0.997891, 这说明每月产品的总成本y(万元)与该月产量x(万件)之间存在线性相关关系。

高考回归分析知识点

高考回归分析知识点

高考回归分析知识点回归分析是统计学中一种重要的分析方法,用于研究变量之间的关系和预测。

在高考数学中,回归分析也是一个重要的知识点。

本文将介绍高考中常见的回归分析知识点,并结合具体例子进行解析。

一、简单线性回归1. 定义:简单线性回归是指在研究两个变量之间关系时,其中一个变量为自变量,另一个变量为因变量,且二者之间存在线性关系的情况。

2. 公式:简单线性回归模型的数学表示为:Y = α + βX + ε,其中Y为因变量,X为自变量,α和β为常数,ε为误差项。

3. 参数估计:通过最小二乘法可以估计出回归系数α和β的值,从而建立回归方程。

示例:假设我们想研究学生的学习时间与考试分数之间的关系。

我们收集了一组数据,学习时间(自变量X)和考试分数(因变量Y)的数值如下:学习时间(小时):[5, 10, 15, 20, 25, 30]考试分数(分数):[60, 70, 75, 80, 85, 90]通过简单线性回归分析,我们可以建立回归方程为:Y = 55 + 0.75X,说明学习时间对考试分数有正向影响。

二、多元线性回归1. 定义:多元线性回归是指在研究多个自变量与一个因变量之间关系时的回归分析方法。

它可以用来探究多个因素对因变量的影响程度,并进行预测和解释。

2. 公式:多元线性回归模型的数学表示为:Y = α + β₁X₁ + β₂X₂+ ... + βₚXₚ + ε,其中Y为因变量,X₁、X₂、...、Xₚ为自变量,α和β₁、β₂、...、βₚ为常数,ε为误差项。

3. 参数估计:同样通过最小二乘法可以估计出回归系数α和β₁、β₂、...、βₚ的值,从而建立回归方程。

示例:我们想研究学生的考试分数与学习时间、家庭收入、家庭教育水平等因素之间的关系。

我们收集了一组数据,学习时间(自变量X₁)、家庭收入(自变量X₂)、家庭教育水平(自变量X₃)和考试分数(因变量Y)的数值如下:学习时间(小时):[5, 10, 15, 20, 25, 30]家庭收入(万元):[8, 10, 12, 15, 18, 20]家庭教育水平(年):[10, 12, 14, 16, 18, 20]考试分数(分数):[60, 70, 75, 80, 85, 90]通过多元线性回归分析,我们可以建立回归方程为:Y = 50 +0.7X₁ + 1.2X₂ + 1.5X₃,说明学习时间、家庭收入和家庭教育水平都对考试分数有正向影响。

数学必修3知识导引 2.4线性回归方程 含解析 精品

数学必修3知识导引 2.4线性回归方程 含解析 精品

6.4线性回归方程案例探究在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢?分析:凭我们的学习经验可知,物理成绩确实与数学成绩有一定的关系,但除此以外,还存在其他影响物理成绩的因素.例如,是否喜欢物理,用在物理学习上的时间等等.在实际问题中,变量之间的常见关系有如下两类:一类是确定性函数关系,变量之间的关系可以用函数表示.例如,圆的面积S与半径r 之间就是确定性函数关系,可以用函数S=πr2表示.一类是相关关系,变量之间有一定的联系,但不能完全用函数来表达.例如,人的体重与身高有关.一般来说,身高越高,体重越重,但不能用一个函数来严格地表示身高与体重之间的关系.自学导引1.在实际问题中,变量之间的常见关系有两类:一类是确定性关系,另一类是相关关系.2.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.3.请你说出确定性关系与相关关系的相同点和不同点.答案:相同点:均是指两个变量的关系.不同点:相关关系是一种非确定的关系.确定性关系是自变量与函数值之间的关系,可以用一个函数表示.这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.这种关系不能用一个确定的函数来表示.4.你是否还能举出一些现实生活中存在的相关关系的问题?答案:例如,商品销售收入与广告支出经费之间的关系;粮食产量与施肥量之间的关系;人体的脂肪含量与年龄之间的关系,等等.5.将n个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中,以表示具有相关关系的两个变量的一组数据的图形叫做散点图.6.(1)当两个变量成正相关时,散点图有什么特点?(2)当两个变量成负相关时,散点图又有什么特点?答案:(1)散点图中的点散布在从左下角到右上角的区域.(2)散点图中的点散布在从左上角到右下角的区域.7.对于散点图可以作出如下判断:(1)当所有的样本点都落在某一函数曲线上,变量之间具有函数关系;(2)当所有的样本点都落在某一函数曲线附近,变量之间具有相关关系;(3)当所有的样本点都落在某一直线附近,变量之间具有线性相关关系.8.回归直线是怎样定义的?答案:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.疑难剖析【例1】 下表是某地年降雨量与年平均气温的统计数据,判断两变量有相关关系吗?求回归直线方程有意义吗?思路分析:用回归直线进行拟合两变量关系的一般步骤为: (1)作出散点图,判断散点是否在一条直线附近;(2)如果散点在一条直线附近,以公式求出a, b ,并写出线性回归方程.解:以x 轴为年平均气温,y 轴为年降雨量可得相应的散点图:因为图中各点并不在一条直线的附近,所以两者不具有线性相关关系,没有必要用回归直线进行拟合,用公式求得的回归方程也是没有意义的.思维启示:要判断两个变量是否具有线性相关关系,可先作出散点图,再观察散点是否在一条直线附近,如果是,则二者具有线性相关关系;否则,二者不具有线性相关关系. 思维陷阱:解此题的第(2)小问时不要盲目地去求回归方程.观察两相关变量得如下数据:求两变量间的回归方程.错解:求线性回归直线方程的步骤: 第一步:列表x i ,y i ,x i y i ; 第二步:计算x ,y,∑=ni ix12,∑=ni iy12,∑=ni ii yx 1;第三步:代入公式计算b, a 的值; 第四步:写出回归直线方程.列表:计算得:x =0, y =0∑=1012i ix=110,∑=1012i iy=310,∑=101i ii yx =110∴b=1010110010110)(101021012101=*-*-=--∑∑==x x yx yx i i i iia=y -b x =0-1*0=0故所求回归直线方程为yˆ=x. 正解:作两个变量的散点图(图略),从散点图中看出,点不在某条直线附近,分散得很开.因此,变量x 和y 不具有线性相关关系,也就不存在线性回归方程.【例2】 某班学生每周用于数学学习的时间x (单位:h )与数学成绩y (单位:分)之间有如下数据:某同学每周用于数学学习的时间为18小时,试预测该生数学成绩. 思路分析:首先应该利用表中数据通过计算去判断数学学习的时间x 与数学成绩y 是否具有线性相关关系.若有,则可求出回归方程;然后在方程中令x=18,可求出该生数学成绩.解:因为学习时间与学习成绩之间具有线性相关关系.利用科学计算器计算到如下表所示的数据:于是可得b=53.34.1544.545)(101021012101≈=--∑∑==x xyx yx i ii iia=y -b x =74.9-3.53×17.4≈13.5 故所求回归直线方程为y=3.53x+13.5当x=18时,yˆ=3.53×18+13.5=77.04≈77 故该同学预计可得77分左右.思维启示:两个有线性相关关系的变量间的关系可以用线性回归方程来表示,而对总体的预测可依据回归直线方程进行.【例3】 一般说,一个人的身高越高,他的手就越大.为了调查这一问题,对10名高三男生的身高与右手一揸长测量得如下数据:(单位:cm )(1)依据上述数据制作散点图,发现两者有何相关关系吗? (2)如果近似成线性关系,求线性回归方程.(3)如果一个学生身高185 cm ,估计他的右手一揸长.思路分析:首先作出散点图;利用散点图去判断两变量是否具有线性关系;若具有线性关系,再利用公式求出方程;最后利用方程去解答第三小问.解:(1)散点图如下:可见,身高与右手一揸长之间的总体趋势成一条直线,即他们线性相关.(2)设线性回归方程为yˆ=bx+a 由上述数据计算可得x =174.8, y =21.7∑=1012i ix=305 730,∑=101i ii yx =37 986∴b=21012101)(1010x xyx yx i ii ii--∑∑===303.08.174107303057.218.17410986372≈⨯-⨯⨯- a=y -b x =-31.264∴方程为yˆ=0.303x-31.264. (3)当x=185时, yˆ=24.79. 思维启示:先作出散点图,若两变量具有线性关系,再利用公式求出方程.拓展迁移【拓展点1】 如果你想作一个反对抽烟的电视公益广告的播放次数与看电视的中学生戒烟率的数据散点图,作为x 轴的变量为__________. 答案:播放次数【拓展点2】 有时候,一些东西吃起来口味越好,对我们的身体越有害,下表给出了不同类型的某种食品的数据.第一列表示此种食品所含热量的百分比,第二列数据表示由一些美食家以百分制给出的对此种食品口味的评价.(1)求出回归直线方程;(2)关于两个变量之间的关系,得出的结论是什么?答案:(1) yˆ=1.565x+37.827 (2)由回归方程知道,食品所含热量越大,口味记录越好,反之亦然.【拓展点3】 某医院用光电比色计检验尿汞时,得尿汞含量(毫克/升)与消光系数如下表:(1)作出散点图;(2)如果y与x之间具有线性相关关系,求回归方程;(3)估计尿汞含量为9毫克/升时消光系数.答案:(1)散点图略.(2)由散点图可知y与x线性相关.设回归方程为yˆ=bx+A.计算可得回归方程为yˆ=36.95x-11.3.(3)当x=9时,yˆ=36.95×9-11.3=321.25≈321。

高中数学回归分析精选题

高中数学回归分析精选题

回归分析精选题20道一.选择题(共12小题)1.设某大学的女生体重y (单位:)k g 与身高x (单位:)cm 具有线性相关关系,根据一组样本数据(i x ,)(1i y i=,2,⋯,)n ,用最小二乘法建立的回归方程为ˆ0.8585.71y x =-,则下列结论中不正确的是()A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,)yC .若该大学某女生身高增加1c m ,则其体重约增加0.85k gD .若该大学某女生身高为170c m ,则可断定其体重必为58.79k g2.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是()A .ˆ10200yx =-+ B .ˆ10200yx =+ C .ˆ10200yx =-- D .ˆ10200yx =-3.有一散点图如图所示,在5个(,)x y 数据中去掉(3,10)D 后,下列说法正确的是( )A .残差平方和变小B .相关系数r 变小C .相关指数2R 变小D .解释变量x 与预报变量y 的相关性变弱4.在线性回归模型中,分别选择了4个不同的模型,它们的相关指数2R 依次为0.36、0.95、0.74、0.81,其中回归效果最好的模型的相关指数2R 为( )A .0.95B .0.81C .0.74D .0.365.已知四个命题:①在回归分析中,2R 可以用来刻画回归效果,2R 的值越大,模型的拟合效果越好; ②在独立性检验中,随机变量2K 的值越大,说明两个分类变量有关系的可能性越大;③在回归方程ˆ0.212yx =+中,当解释变量x 每增加1个单位时,预报变量ˆy平均增加1个单位;④两个随机变量相关性越弱,则相关系数的绝对值越接近于1; 其中真命题是( )A .①④B .②④C .①②D .②③6.某地区植被被破坏,土地沙化越来越严重,最近三年测得沙漠面积增加值分别为0.2万公顷、0.39万公顷和0.78万公顷,则沙漠面积增加数y (万公顷)关于年数x (年)的函数关系较为接近的是( )A .0.2yx= B .20.10.1y x x=+ C .40.2lo g yx=+ D .210xy=7.对于给定的样本点所建立的模型A 和模型B ,它们的残差平方和分别是212,,a a R 的值分别为1b ,2b ,下列说法正确的是( )A .若12a a <,则12b b <,A 的拟合效果更好 B .若12a a <,则12b b <,B 的拟合效果更好 C .若12a a <,则12b b >,A 的拟合效果更好 D .若12a a <,则12b b >,B 的拟合效果更好8.下列结论正确的是( )①函数关系是一种确定性关系; ②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法; ④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. A .①②B .①②③C .①②④D .①②③④9.某车间加工零件的数量x 与加工时间y 的统计数据如表:现已求得上表数据的回归方程ˆˆˆy bx a =+中的ˆb 值为0.9,则据此回归模型可以预测,加工100个零件所需要的加工时间约为( )A .84分钟B .94分钟C .102分钟D .112分钟10.两个变量y与x的回归模型中,分别选择了4个不同模型,它们对应的22121()1()ni i i ni i y y Ry y ==-=--∑∑的值如下,其中拟合效果最好的模型是()A .模型1对应的20.48R =B .模型3对应的20.15R =C .模型2对应的20.96R =D .模型4对应的20.30R =11.对于回归分析,下列说法错误的是( )A .在残差图中,纵坐标表示残差B .若散点图中的一组点全部位于直线ˆ32yx =-+的图象上,则相关系数1r =C .若残差平方和越小,则相关指数2R 越大D .在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定 12.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( )A .总偏差平方和B .残差平方和C .回归平方和D .相关指数二.多选题(共1小题)13.下列有关回归分析的结论中,正确的有()A .运用最小二乘法求得的回归直线一定经过样本点的中心(x ,)yB .若相关系数r 的绝对值越接近于1,则相关性越强C .若相关指数2R 的值越接近于0,表示回归模型的拟合效果越好D .在残差图中,残差点分布的带状区域的宽度越窄,说明模型拟合的精度越高 三.填空题(共4小题)14.某商店统计了最近6个月某商品的进价x 与售价y (单位:元)的对应数据如表:假设得到的关于x 和y 之间的回归直线方程是ˆˆˆy bx a =+,那么该直线必过的定点是 .15.对具有线性相关关系的变量x ,y ,测得一组数据如表:根据上表,利用最小二乘法得它们的回归直线方程为ˆˆ10.5y x a=+,据此模型预测,当10x=时,y 的估计值是16.已知x 与y 之间的一组数据:已求得关于y 与x 的线性回归方程ˆ 2.10.85y x =+,则m 的值为 .17.对某城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查后知,y 与x 具有线性相关关系,满足回归方程0.6 1.5yx =+,若该城市居民人均消费水平为7.5(千元),则可以估计该城市人均消费额占人均工资收入的百分比约为 . 四.解答题(共3小题)18.某同学在生物研究性学习中想对春季昼夜温差大小与黄豆种子发芽多少之间的关系进行研究,于是他在4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天每100颗种子浸泡后的发芽数,得到如下资料:(1)从这5天中任选2天,记发芽的种子数分别为m ,n ,求事件“m ,n 均不小于25的概率.(2)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另三天的数据,求出y 关于x 的线性回归方程ˆˆˆybx a =+;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?(参考公式:1221ˆni i i ni i x y n x yb x n x==-=-∑∑,ˆˆ)ay bx =-19.随着人们经济收入的不断增长,个人购买家庭轿车已不再是一种时尚.车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题.某汽车销售公司作了一次抽样调查,并统计得出某款车的使用年限x 与所支出的总费用y(万元)有如下的数据资料:(1)在给出的坐标系中做出散点图;(2)求线性回归方程ˆˆˆybx a =+中的ˆa、ˆb ; (3)估计使用年限为10年时,车的使用总费用是多少?(最小二乘法求线性回归方程系数公式1221ˆni i i ni i x y n x yb x n x==-=-∑∑,ˆˆ)ay bx =-.20.一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果:(1)画散点图;(2)如果y对x有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为89个,那么机器的运转速度应控制在什么范围内?(参考数值:511380 i iix y==∑,521145)iix==∑回归分析精选题20道参考答案与试题解析一.选择题(共12小题)1.设某大学的女生体重y (单位:)k g 与身高x (单位:)cm 具有线性相关关系,根据一组样本数据(i x ,)(1i y i=,2,⋯,)n ,用最小二乘法建立的回归方程为ˆ0.8585.71y x =-,则下列结论中不正确的是()A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,)yC .若该大学某女生身高增加1c m ,则其体重约增加0.85k gD .若该大学某女生身高为170c m ,则可断定其体重必为58.79k g【分析】根据回归方程为ˆ0.8585.71yx =-,0.85>,可知A ,B ,C 均正确,对于D 回归方程只能进行预测,但不可断定. 【解答】解:对于A ,0.85>,所以y 与x 具有正的线性相关关系,故正确;对于B ,回归直线过样本点的中心(x ,)y ,故正确;对于C ,回归方程为ˆ0.8585.71yx =-,∴该大学某女生身高增加1c m ,则其体重约增加0.85k g,故正确;对于D ,170xc m=时,ˆ0.8517085.7158.79y =⨯-=,但这是预测值,不可断定其体重为58.79k g,故不正确故选:D .【点评】本题考查线性回归方程,考查学生对线性回归方程的理解,属于中档题. 2.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是()A .ˆ10200yx =-+ B .ˆ10200yx =+ C .ˆ10200yx =-- D .ˆ10200yx =-【分析】本题考查的知识点是回归分析的基本概念,根据某商品销售量y (件)与销售价格x(元/件)负相关,故回归系数应为负,再结合实际进行分析,即可得到答案.【解答】解:由x 与y 负相关, 可排除B 、D 两项,而C 项中的ˆ102000yx =--<不符合题意.故选:A .【点评】两个相关变量之间的关系为正相关关系,则他们的回归直线方程中回归系数为正;两个相关变量之间的关系为负相关关系,则他们的回归直线方程中回归系数为负.3.有一散点图如图所示,在5个(,)D后,下列说法正确的是()x y数据中去掉(3,10)A.残差平方和变小B.相关系数r变小C.相关指数2R变小D.解释变量x与预报变量y的相关性变弱【分析】利用散点图分析数据,判断相关系数,相关指数,残差的平方和,的变化情况.【解答】解:从散点图可分析得出:只有D点偏离直线远,去掉D点,变量x与变量y的线性相关性变强,相关系数变大,相关指数变大,残差的平方和变小,故选:A.【点评】本题考查了利用散点图分析数据,判断变量的相关性问题,属于运用图形解决问题的能力,属于容易出错的题目.4.在线性回归模型中,分别选择了4个不同的模型,它们的相关指数2R依次为0.36、0.95、0.74、0.81,其中回归效果最好的模型的相关指数2R为()A.0.95B.0.81C.0.74D.0.36【分析】根据两个变量y与x的回归模型中,它们的相关指数2R越接近于1,这个模型的拟合效果就越好,由此选出选项中的答案.【解答】解:两个变量y与x的回归模型中,它们的相关指数2R越接近于1,这个模型的拟合效果就越好,在所给的四个选项中0.95是相关指数最大的值,∴其拟合效果也最好.故选:A.【点评】本题考查了相关指数,这里不用求相关指数,而是根据所给的相关指数判断模型的拟合效果,解题的关键是理解相关指数越大拟合效果越好.5.已知四个命题:①在回归分析中,2R可以用来刻画回归效果,2R的值越大,模型的拟合效果越好;②在独立性检验中,随机变量2K的值越大,说明两个分类变量有关系的可能性越大;③在回归方程ˆ0.212y x=+中,当解释变量x每增加1个单位时,预报变量ˆy平均增加1个单位;④两个随机变量相关性越弱,则相关系数的绝对值越接近于1;其中真命题是()A.①④B.②④C.①②D.②③【分析】对4个选项分别进行判断,即可得出结论.【解答】解:①相关指数2R是用来刻画回归效果的,2R表示解释变量对预报变量的贡献率,2R越接近于1,表示解释变量和预报变量的线性相关关系越强,越趋近0,关系越弱,故2R的值越大,说明回归模型的拟合效果越好,故①正确.②由2K的计算公式可知,对分类变量X与Y的随机变量2K的观测值k来说,k越小,判断“X与Y有关系”的把握越小,随机变量2K的值越大,说明两个分类变量有关系的可能性越大,故②正确;③在回归直线方程ˆ0.212=+中,当解释变量x每增加一个单位时,预报变量ˆy平均增加y x0.2个单位,故③错误.④两个随机变量相关性越强,则相关系数的绝对值越接近于1;两个随机变量相关性越弱,则相关系数的绝对值越接近于0,故④不正确.故选:C.【点评】本题以命题的真假判断为载体,考查了抽样方法,相关系数,回归分析,独立性检验等知识点,难度不大,属于基础题.6.某地区植被被破坏,土地沙化越来越严重,最近三年测得沙漠面积增加值分别为0.2万公顷、0.39万公顷和0.78万公顷,则沙漠面积增加数y (万公顷)关于年数x (年)的函数关系较为接近的是( )A .0.2yx= B .20.10.1y x x=+ C .40.2lo g yx=+D .210xy=【分析】将(1,0.2),(2,0.39),(3,0.78)分别代入0.2y x=,20.10.1yx x=+,40.2lo g yx=+和210xy=中,验证即可.【解答】解:将(1,0.2),(2,0.39),(3,0.78)代入0.2y x=,当3x=时,0.6y=,和0.78相差较大;将(1,0.2),(2,0.39),(3,0.78)代入20.10.1y x x=+,当2x=时,0.6y=,和0.39相差较大;将(1,0.2),(2,0.39),(3,0.78)代入40.2lo g y x=+,当2x=时,0.7y=,和0.39相差较大;将(1,0.2),(2,0.39),(3,0.78)代入210xy =,当1x =时,0.2y =,当2x =时,0.4y =,与0.39相差0.01, 当3x=时,0.8y=,和0.78相差0.02;综合以上分析,选用函数关系210xy =较为近似.故选:D .【点评】本题考查了函数模型的应用问题,也考查了运算求解能力,是基础题.7.对于给定的样本点所建立的模型A 和模型B ,它们的残差平方和分别是212,,a a R 的值分别为1b ,2b ,下列说法正确的是( )A .若12a a <,则12b b <,A 的拟合效果更好 B .若12a a <,则12b b <,B 的拟合效果更好 C .若12a a <,则12b b >,A 的拟合效果更好D .若12a a <,则12b b >,B 的拟合效果更好【分析】比较两个模型的拟合效果时,如果模型残差平方和越小,则相应的相关指数2R 越大,该模型拟合的效果越好,即可得出结论.【解答】解:比较两个模型的拟合效果时,如果模型残差平方和越小, 则相应的相关指数2R 越大,该模型拟合的效果越好. 故选:C .【点评】本题是基础题.考查残差平方和、相关指数. 8.下列结论正确的是()①函数关系是一种确定性关系; ②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法; ④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. A .①②B .①②③C .①②④D .①②③④【分析】本题是一个对概念进行考查的内容,根据相关关系的定义与回归分析的统计意义进行判断.【解答】解:①函数关系是一种确定性关系,这是一个正确的结论. ②相关关系是一种非确定性关系,是一个正确的结论.③回归分析是对具有相关关系的两个变量进行统计分析的一种方法,所以③不对. 与③对比,依据定义知④是正确的, 故选:C .【点评】本题的考点是相关关系,对本题的正确判断需要对相关概念的熟练掌握. 9.某车间加工零件的数量x 与加工时间y 的统计数据如表:现已求得上表数据的回归方程ˆˆˆy bx a =+中的ˆb 值为0.9,则据此回归模型可以预测,加工100个零件所需要的加工时间约为( )A .84分钟B .94分钟C .102分钟D .112分钟【分析】根据表中所给的数据,做出横标和纵标的平均数,得到样本中心点,代入样本中心点求出a 的值,写出线性回归方程.将100x=代入回归直线方程,得y ,可以预测加工100个零件需要102分钟,这是一个预报值,不是生产100个零件的准确的时间数. 【解答】解:由表中数据得:20x =,30y=,又ˆb 值为0.9,故300.92012a=-⨯=,0.912y x ∴=+.将100x=代入回归直线方程,得0.910012102y =⨯+=(分钟).∴预测加工100个零件需要102分钟.故选:C .【点评】本题考查线性回归方程的求法和应用,解题的关键是正确应用最小二乘法求出线性回归方程的系数的运算,再一点就是代入样本中心点可以求出字母a 的值,是一个中档题目. 10.两个变量y与x的回归模型中,分别选择了4个不同模型,它们对应的22121()1()ni i i ni i y y Ry y ==-=--∑∑的值如下,其中拟合效果最好的模型是()A .模型1对应的20.48R =B .模型3对应的20.15R =C .模型2对应的20.96R =D .模型4对应的20.30R =【分析】根据回归分析中相关指数2R 越接近于1,拟合效果越好,即可得出答案. 【解答】解:回归分析中,相关指数2R 越接近于1,拟合效果越好; 越接近0,拟合效果越差,由模型2对应的2R 最大,其拟合效果最好. 故选:C .【点评】本题考查了利用相关指数判断模型拟合效果的应用问题,是基础题. 11.对于回归分析,下列说法错误的是( )A .在残差图中,纵坐标表示残差B .若散点图中的一组点全部位于直线ˆ32y x =-+的图象上,则相关系数1r =C .若残差平方和越小,则相关指数2R 越大D .在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定 【分析】根据题意,对选项种的命题分析判断正误即可.【解答】解:对于A ,在残差图中,纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,所以A 正确;对于B,散点图中的一组点全部位于直线ˆ32=-+的图象上,则x,y成负相关,且相关y x关系最强,此时相关系数1r=-,所以B错误;对于C,若残差平方和越小,则残差点分布的带状区域的宽度越窄,其相关性越强,相关指数2R越大,所以C正确;对于D,回归分析中,变量间的关系若是非确定关系,即变量间的关系不是函数关系,因变量不能由自变量唯一确定,所以D正确.故选:B.【点评】本题考查了统计知识的概念与应用问题,掌握相关概念的含义是解题的关键,是基础题.12.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是() A.总偏差平方和B.残差平方和C.回归平方和D.相关指数【分析】本题考查的回归分析的基本概念,根据拟合效果好坏的判断方法我们可得,数据点和它在回归直线上相应位置的差异是通过残差的平方和来体现的.【解答】解:拟合效果好坏的是由残差的平方和来体现的,而拟合效果即数据点和它在回归直线上相应位置的差异故据点和它在回归直线上相应位置的差异是通过残差的平方和来体现的.故选:B.【点评】拟合效果好坏的是由残差的平方和来体现的,也可以理解为拟合效果即数据点和它在回归直线上相应位置的差异,故据点和它在回归直线上相应位置的差异是通过残差的平方和来体现的.二.多选题(共1小题)13.下列有关回归分析的结论中,正确的有()A.运用最小二乘法求得的回归直线一定经过样本点的中心(x,)yB.若相关系数r的绝对值越接近于1,则相关性越强C.若相关指数2R的值越接近于0,表示回归模型的拟合效果越好D.在残差图中,残差点分布的带状区域的宽度越窄,说明模型拟合的精度越高【分析】利用回归分析中的相关知识对四个选项逐一分析判断即可.【解答】解:对于A,回归方程必定经过样本中心(x,)y,故选项A正确;对于B,由相关系数的意义可知,相关系数r的绝对值越接近于1,则相关性越强,故选项B正确;对于C ,若相关指数2R 的值越接近于1,表示回归模型的拟合效果越好,故选项C 错误; 对于D ,在残差图中,残差点分布的带状区域的宽度越窄,说明模型拟合的精度越高,故选项D 正确. 故选:A B D .【点评】本题考查了回归分析的理解,主要考查了回归方程的性质,相关系数的意义等,属于基础题.三.填空题(共4小题)14.某商店统计了最近6个月某商品的进价x 与售价y (单位:元)的对应数据如表:假设得到的关于x 和y 之间的回归直线方程是ˆˆˆy bx a =+,那么该直线必过的定点是13(2,8).【分析】根据回归方程必过点(,)x y ,计算出,x y 即可求得答案. 【解答】解:35289121362x+++++==,4639121486y+++++==,回归方程必过点(,)x y ,∴该直线必过的定点是13(2,8).故答案为:13(2,8).【点评】本题考查了回归方程,线性回归方程必过样本中心点(,)x y ,这是线性回归中最常考的知识点,希望大家熟练掌握.属于基础题.15.对具有线性相关关系的变量x ,y ,测得一组数据如表:根据上表,利用最小二乘法得它们的回归直线方程为ˆˆ10.5y x a=+,据此模型预测,当10x=时,y 的估计值是 106.5【分析】根据表中数据计算x 、y ,代入回归直线方程求得ˆa的值, 写出回归直线方程,利用方程求出10x =时ˆy的值即可. 【解答】解:根据表中数据,计算1(24568)55x=⨯++++=,1(2040607080)545y =⨯++++=,代入回归直线方程ˆˆ10.5y x a=+中,求得ˆ5410.55 1.5a =-⨯=,∴回归直线方程为ˆ10.5 1.5yx =+,据此模型预测,10x=时,ˆ10.510 1.5106.5y=⨯+=,即y 的估计值是106.5. 故答案为:106.5.【点评】本题考查了线性回归方程的应用问题,是基础题. 16.已知x 与y 之间的一组数据:已求得关于y 与x 的线性回归方程ˆ 2.10.85y x =+,则m 的值为 0.5 .【分析】首先求出这组数据的横标和纵标的平均数,写出这组数据的样本中心点,把样本中心点代入线性回归方程求出m 的值. 【解答】解:0123342x +++==,3 5.5715.544m m y++++==,∴这组数据的样本中心点是3(2,15.5)4m +, 关于y 与x 的线性回归方程ˆ 2.10.85y x =+,∴15.532.10.8542m +=⨯+,解得0.5m =,m∴的值为0.5.故答案为:0.5.【点评】本题考查回归分析,考查样本中心点满足回归直线的方程,考查求一组数据的平均数,是一个运算量比较小的题目,并且题目所用的原理不复杂,是一个好题.17.对某城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查后知,y 与x 具有线性相关关系,满足回归方程0.6 1.5yx =+,若该城市居民人均消费水平为7.5(千元),则可以估计该城市人均消费额占人均工资收入的百分比约为 75%.【分析】根据y 与x 具有线性相关关系,且满足回归方程,和该城市居民人均消费水平为,把消费水平的值代入线性回归方程,可以估计该市的职工均工资水平,做出人均消费额占人均工资收入的百分比. 【解答】解:y与x 具有线性相关关系,满足回归方程0.6 1.5yx =+,该城市居民人均消费水平为7.5y=,∴可以估计该市的职工均工资水平7.50.6 1.5x =+,10x ∴=,∴可以估计该城市人均消费额占人均工资收入的百分比约为7.5100%75%10⨯=,故答案为:75%【点评】本题考查线性回归方程的应用,考查用线性回归方程估计方程中的一个变量,利用线性回归的知识点解决实际问题. 四.解答题(共3小题)18.某同学在生物研究性学习中想对春季昼夜温差大小与黄豆种子发芽多少之间的关系进行研究,于是他在4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天每100颗种子浸泡后的发芽数,得到如下资料:(1)从这5天中任选2天,记发芽的种子数分别为m ,n ,求事件“m ,n 均不小于25的概率.(2)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另三天的数据,求出y 关于x 的线性回归方程ˆˆˆybx a =+;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?(参考公式:1221ˆni i i ni i x y n x yb x n x==-=-∑∑,ˆˆ)ay bx =-【分析】(1)用数组(,)m n 表示选出2天的发芽情况,用列举法可得m ,n 的所有取值情况,分析可得m ,n 均不小于25的情况数目,由古典概型公式,计算可得答案;(2)根据所给的数据,先做出x ,y 的平均数,即做出本组数据的样本中心点,根据最小二乘法求出线性回归方程的系数,写出线性回归方程.(3)根据估计数据与所选出的检验数据的误差均不超过2颗,就认为得到的线性回归方程是可靠的,根据求得的结果和所给的数据进行比较,得到所求的方程是可靠的.【解答】解:(1)用数组(,)m n 表示选出2天的发芽情况,m,n 的所有取值情况有(23,25),(23,30),(23,26),(23,16),(25,30),(25,26),(25,16),(30,26),(30,16),(30,26),共有10个设“m ,n 均不小于25”为事件A ,则包含的基本事件有(25,30),(25,26),(30,26) 所以3()10P A =,故事件A 的概率为310(2)由数据得12,27xy ==,3972x y=,31977i i i x y ==∑,321434i i x ==∑,23432x =由公式,得9779725ˆ4344322b -==-,5ˆ271232a=-⨯=-所以y 关于x 的线性回归方程为5ˆ32yx =-(3)当10x =时,ˆ22y=,|2223|2-<,当8x=时,ˆ17y=,|1716|2-<所以得到的线性回归方程是可靠的.【点评】本题考查回归直线方程的计算与应用,涉及古典概型的计算,是基础题,在计算线性回归方程时计算量较大,注意正确计算.19.随着人们经济收入的不断增长,个人购买家庭轿车已不再是一种时尚.车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题.某汽车销售公司作了一次抽样调查,并统计得出某款车的使用年限x 与所支出的总费用y(万元)有如下的数据资料:(1)在给出的坐标系中做出散点图;(2)求线性回归方程ˆˆˆybx a =+中的ˆa、ˆb ; (3)估计使用年限为10年时,车的使用总费用是多少?(最小二乘法求线性回归方程系数公式1221ˆni i i ni i x y n x yb x n x==-=-∑∑,ˆˆ)ay bx =-.【分析】(1)利用描点法作出散点图;(2)把数据代入公式,利用最小二乘法求回归方程的系数,可得回归直线方程; (3)把10x=代入回归方程得y 值,即为预报变量.【解答】解:(1)散点图如图,由图知y 与x 间有线性相关关系.(2)4x=,5y=,52190i i x ==∑,51112.3i i i x y ==∑,∴112.354512.3ˆ 1.239054210a-⨯⨯===-⨯;ˆˆ5 1.2340.08a y b x =-=-⨯=.(3)线性回归直线方程是ˆ 1.230.08y x =+,当10x=(年)时,ˆ 1.23100.0812.38y=⨯+=(万元),即估计使用10年时,支出总费用是12.38万元.【点评】本题考查了线性回归直线方程的求法及利用回归方程估计预报变量,解答此类问题的关键是利用公式求回归方程的系数,计算要细心.20.一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果:(1)画散点图;(2)如果y 对x 有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为89个,那么机器的运转速度应控制在什么范围内?(参考数值:511380i i i x y ==∑,521145)i i x ==∑【分析】(1)根据表格数据,可得散点图;(2)先求出横标和纵标的平均数,代入求系数b 的公式,利用最小二乘法得到系数,再根据公式求出a 的值,写出线性回归方程,得到结果.(3)允许每小时的产品中有缺点的零件最多为89个,即线性回归方程的预报值不大于89,写出不等式,解关于x 的一次不等式,得到要求的机器允许的转数. 【解答】解:(1)散点图如图;(2)5x =,50y=,511380i i i x y ==∑,521145i i x ==∑∴13805550ˆ 6.5145555b-⨯⨯==-⨯⨯,ˆˆ17.5ay b x =-=∴回归直线方程为:ˆ 6.517.5yx =+;(3)由89y …得6.517.589x+…,解得11x …∴机器的运转速度应控制11转/秒内【点评】本题考查线性回归分析,考查线性回归方程,考查线性回归方程的应用,考查不等式的解法,是一个综合题目.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

高中数学线性回归分析集锦高中数学线性回来分析集锦间或会埋怨为什么自己没天赋,又或者因为别人能轻易做到自己做不到的事而不平衡。

课件网高一频道为你整理了《高中数学线性回来分析集锦》盼望对你有关心!【高一数学必修四线性回来分析学问点一】问题提出1.函数是讨论两个变量之间的依存关系的一种数量形式.对于两个变量,假如当一个变量的取值肯定时,另一个变量的取值被惟一确定,则这两个变量之间的关系就是一个函数关系.2.在中学校内里,有这样一种说法:"假如你的数学成果好,那么你的物理学习就不会有什么大问题.'根据这种说法,好像学生的物理成果与数学成果之间存在着某种关系,我们把数学成果和物理成果看成是两个变量,那么这两个变量之间的关系是函数关系吗?3.我们不能通过一个人的数学成果是多少就精确地断定其物理成果能到达多少,学习兴趣、学习时间、教学水平等,也是影响物理成果的一些因素,但这两个变量是有肯定关系的,它们之间是一种不确定性的关系.类似于这样的两个变量之间的关系,有必要从理论上作些探讨,假如能通过数学成果对物理成果进行合理估量,将有着特别重要的现实意义.学问探究〔一〕:变量之间的相关关系思索1:考察以下问题中两个变量之间的关系:〔1〕商品销售收入与广告支出经费;〔2〕粮食产量与施肥量;〔3〕人体内的脂肪含量与年龄.这些问题中两个变量之间的关系是函数关系吗?思索2:"名师出高徒'可以解释为教师的水平越高,学生的水平就越高,那么学生的学业成果与教师的教学水平之间的关系是函数关系吗?你能举出类似的描述生活中两个变量之间的这种关系的成语吗?思索3:上述两个变量之间的关系是一种非确定性关系,称之为相关关系,那么相关关系的含义如何?自变量取值肯定时,因变量的取值带有肯定随机性的两个变量之间的关系,叫做相关关系.1、球的体积和球的半径具有〔〕A函数关系B相关关系C不确定关系D无任何关系2、以下两个变量之间的关系不是函数关系的是〔〕A角的度数和正弦值B速度肯定时,距离和时间的关系C正方体的棱长和体积D日照时间和水稻的亩产量AD练:学问探究〔二〕:散点图【问题】在一次对人体脂肪含量和年龄关系的讨论中,讨论人员获得了一组样本数据:其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数.思索1:对某一个人来说,他的体内脂肪含量不肯定随年龄增长而增加或削减,但是假如把许多个体放在一起,就可能表现出肯定的规律性.观看上表中的数据,大体上看,随着年龄的增加,人体脂肪含量怎样改变?思索2:为了确定年龄和人体脂肪含量之间的更明确的关系,我们需要对数据进行分析,通过作图可以对两个变量之间的关系有一个直观的印象.以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?思索3:上图叫做散点图,你能描述一下散点图的含义吗?在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图.思索4:观看散点图的大致趋势,人的年龄的与人体脂肪含量具有什么相关关系?思索5:在上面的散点图中,这些点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.一般地,假如两个变量成正相关,那么这两个变量的改变趋势如何?思索6:假如两个变量成负相关,从整体上看这两个变量的改变趋势如何?其散点图有什么特点?一个变量随另一个变量的变大而变小,散点图中的点散布在从左上角到右下角的区域.一般状况下两个变量之间的相关关系成正相关或负相关,类似于函数的单调性.学问探究〔一〕:回来直线思索1:一组样本数据的平均数是样本数据的中心,那么散点图中样本点的中心如何确定?它肯定是散点图中的点吗?思索2:在各种各样的散点图中,有些散点图中的点是杂乱分布的,有些散点图中的点的分布有肯定的规律性,年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点?这些点大致分布在一条直线附近.思索3:假如散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回来直线.对具有线性相关关系的两个变量,其回来直线肯定通过样本点的中心吗?思索4:对一组具有线性相关关系的样本数据,你认为其回来直线是一条还是几条?思索5:在样本数据的散点图中,能否用直尺精确画出回来直线?借助计算机怎样画出回来直线?学问探究〔二〕:回来方程在直角坐标系中,任何一条直线都有相应的方程,回来直线的方程称为回来方程.对一组具有线性相关关系的样本数据,假如能够求出它的回来方程,那么我们就可以比较具体、清晰地了解两个相关变量的内在联系,并依据回来方程对总体进行估量.思索1:回来直线与散点图中各点的位置应具有怎样的关系?整体上最接近思索2:对于求回来直线方程,你有哪些想法?思索4:为了从整体上反映n个样本数据与回来直线的接近程度,你认为选用哪个数量关系来刻画比较合适?20.9%某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对比表:假如某天的气温是-50C,你能依据这些数据预报这天小卖部卖出热茶的杯数吗?实例探究为了了解热茶销量与气温的大致关系,我们以横坐标x表示气温,纵坐标y表示热茶销量,建立直角坐标系.将表中数据构成的6个数对表示的点在坐标系内标出,得到下列图。

你发觉这些点有什么规律?今后我们称这样的图为散点图〔scatterplot〕.建构数学所以,我们用类似于估量平均数时的思想,考虑离差的平方和当x=-5时,热茶销量约为66杯线性回来方程:一般地,设有n个观看数据如下:当a,b使2.三点〔3,10〕,〔7,20〕,〔11,24〕的线性回来方程是〔〕D11.69二、求线性回来方程例2:观看两相关变量得如下表:求两变量间的回来方程解1:列表:阅读课本P73例1EXCEL作散点图利用线性回来方程解题步骤:1、先画出所给数据对应的散点图;2、观看散点,假如在一条直线附近,则说明所给量具有线性相关关系3、依据公式求出线性回来方程,并解决其他问题。

〔1〕假如x=3,e=1,分别求两个模型中y的值;〔2〕分别说明以上两个模型是确定性模型还是随机模型.模型1:y=6+4x;模型2:y=6+4x+e.解〔1〕模型1:y=6+4x=6+43=18;模型2:y=6+4x+e=6+43+1=19.C线性相关与线性回来方程小结1、变量间相关关系的散点图2、如何利用"最小二乘法'思想求直线的回来方程3、学会用回来思想考察现实生活中变量之间的相关关系【高一数学必修四线性回来分析学问点二】重点难点讲解:1.回来分析:就是对具有相关关系的两个变量之间的关系形式进行测定,确定一个相关的数学表达式,以便进行估量预报的统计分析方法。

依据回来分析方法得出的数学表达式称为回来方程,它可能是直线,也可能是曲线。

2.线性回来方程设x与y是具有相关关系的两个变量,且相应于n组观测值的n个点〔xi,yi〕〔i=1,......,n〕大致分布在一条直线的附近,则回来直线的方程为。

其中。

3.线性相关性检验线性相关性检验是一种假设检验,它给出了一个具体检验y与x之间线性相关与否的方法。

①在课本附表3中查出与显著性水平0.05与自由度n-2〔n 为观测值组数〕相应的相关系数临界值r0.05。

②由公式,计算r的值。

③检验所得结果假如|r|r0.05,可以认为y与x之间的线性相关关系不显著,接受统计假设。

假如|r|r0.05,可以认为y与x之间不具有线性相关关系的假设是不成立的,即y与x之间具有线性相关关系。

典型例题讲解:例1.从某班50名学生中随机抽取10名,测得其数学考试成果与物理考试成果资料如表:序号12345678910数学成果54666876788285879094,物理成果61806286847685828896试建立该10名学生的物理成果对数学成果的线性回来模型。

解:设数学成果为x,物理成果为,则可设所求线性回来模型为,计算,代入公式得所求线性回来模型为=0.74x+22.28。

说明:将自变量x的值分别代入上述回来模型中,即可得到相应的因变量的估量值,由回来模型知:数学成果每增加1分,物理成果平均增加0.74分。

大家可以在老师的关心下对自己班的数学、化学成果进行分析。

例2.假设关于某设备的使用年限x和所支出的修理费用y 〔万元〕,有如下的统计资料:x23456y2.23.85.56.57.0 若由资料可知y对x成线性相关关系。

试求:〔1〕线性回来方程;〔2〕估量使用年限为10年时,修理费用是多少?分析:此题为了降低难度,告知了y与x间成线性相关关系,目的是训练公式的使用。

解:〔1〕列表如下:i12345xi23456yi2.23.85.56.57.0xiyi4.411.422.032.542.0491 62536于是b=,。

线性回来方程为:=bx+a=1.23x+0.08。

〔2〕当x=10时,=1.2310+0.08=12.38〔万元〕即估量使用10年时修理费用是12.38万元。

说明:此题若没有告知我们y与x间是线性相关的,应首先进行相关性检验。

假如本身两个变量不具备线性相关关系,或者说它们之间相关关系不显著时,即使求出回来方程也是没有意义的,而且其估量与预报也是不行信的。

例3.某省七年的国民生产总值及社会商品零售总额如下表所示:已知国民生产总值与社会商品的零售总额之间存在线性关系,请建立回来模型。

年份国民生产总值〔亿元〕社会商品零售总额〔亿元〕1985396.26205.821986442.04227.951987517.77268.6619 88625.10337.521989700.83366.001990792.54375.111991858.47413.18合计4333.012194.24解:设国民生产总值为x,社会商品零售总额为y,设线性回来模型为。

依上表计算有关数据后代入的表达式得:所求线性回来模型为y=0.445957x+37.4148,说明国民生产总值每增加1亿元,社会商品零售总额将平均增加4459.57万元。

例4.已知某地每单位面积菜地年平均使用氮肥量xkg与每单位面积蔬菜每年平均产量yt之间的关系有如下数据:年份19851986198719881989199019911992x〔kg〕7074807885929095y〔t〕5.16.06.87.89.010.210.012.0年份19931994199519961997199871999x〔kg〕92108115123130138145y〔t〕11.511.011.812.212.512.813.0〔1〕求x与y之间的相关系数,并检验是否线性相关;〔2〕若线性相关,求蔬菜产量y与使用氮肥量之间的回来直线方程,并估量每单位面积施肥150kg时,每单位面积蔬菜的年平均产量。

相关文档
最新文档