可线性化的回归分析

合集下载

线性回归分析的基本原理

线性回归分析的基本原理

线性回归分析的基本原理线性回归分析是一种常用的统计分析方法,用于研究两个变量之间的线性关系。

它通过拟合一条直线来描述两个变量之间的关系,并利用这条直线进行预测和推断。

本文将介绍线性回归分析的基本原理,包括模型假设、参数估计、模型评估等内容。

一、模型假设线性回归分析的基本假设是:自变量和因变量之间存在线性关系,并且误差项服从正态分布。

具体来说,线性回归模型可以表示为:Y = β0 + β1X + ε其中,Y表示因变量,X表示自变量,β0和β1表示模型的参数,ε表示误差项。

线性回归模型假设误差项ε服从均值为0、方差为σ^2的正态分布。

二、参数估计线性回归模型的参数估计通常使用最小二乘法。

最小二乘法的基本思想是通过最小化观测值与模型预测值之间的差异来估计模型的参数。

具体来说,最小二乘法的目标是最小化残差平方和:min Σ(Yi - (β0 + β1Xi))^2通过对残差平方和进行求导,可以得到参数的估计值:β1 = Σ(Xi - X̄)(Yi - Ȳ) / Σ(Xi - X̄)^2β0 = Ȳ - β1X̄其中,Xi和Yi分别表示观测值的自变量和因变量,X̄和Ȳ分别表示自变量和因变量的均值。

三、模型评估线性回归模型的拟合程度可以通过多个指标进行评估,包括决定系数(R^2)、标准误差(SE)和F统计量等。

决定系数是用来衡量模型解释变量变异性的比例,其取值范围为0到1。

决定系数越接近1,说明模型对观测值的解释能力越强。

标准误差是用来衡量模型预测值与观测值之间的平均误差。

标准误差越小,说明模型的预测精度越高。

F统计量是用来检验模型的显著性。

F统计量的计算公式为:F = (SSR / k) / (SSE / (n - k - 1))其中,SSR表示回归平方和,SSE表示残差平方和,k表示模型的自由度,n表示观测值的个数。

F统计量的值越大,说明模型的显著性越高。

四、模型应用线性回归分析可以用于预测和推断。

通过拟合一条直线,可以根据自变量的取值来预测因变量的值。

回归分析概述

回归分析概述
y f (x)
例 1:某保险公司承保汽车 x 万辆,每辆保费
为 1000 元,如果记保险公司的承保总收入为
y ,则 y 与 x 之间表现为一种确定性的关系:
y 1000x
变量之间具有密切关联而又不能由一个 或若干个变量唯一确定另外一个变量, 这样 的一种联系称为变量之间的相关关系.
例如,父亲身材较高时儿子的身材也较高,但是 父子身高之间的关系不能用一个确定的函数关系 来表达.又如,人的血压与年龄之间有密切的关 系,但是两者之间的关系不能用一个确定的函数 关系来表达.
回归分析是考察两个变量之间统计联系的一种重要 方法,它在许多领域中都有极其广泛的应用。本章 主要介绍回归分析中最基本的部分 — —(线性)回 归分析,内容包括一元(线性)回归分析与多元 (线性)回归分析,以及某些可以线性化的非线性 回归分析问题,回归分析的基本形式仍然是估计与 检验。因此,不妨把本章的内容视作估计与检验方 法在特殊的一类统计问题中的应用。
概率论中简化处理随机变量的常用方法是求其
数学期望.因此,我们来研究自变量 x 与因变量
Y 的均值E Y 之间的关系.当自变量x 的值给定 时,相应的均值E Y 跟着确定,即x 与给定 x 时
Y 的均值 E Y x ˆ y 之间存在一种函数关系, 记
这个函数关系为 y f x,并称它为回归函数.
回归函数反映了自变量 x 与因变量 Y 的均值E Y
之间的函数关系, 因此它近似地描述了自变量 x 与 因变量Y 之间的数量关系.
回归函数f x是未知的,为了数学上处理的方便,
首先假定回归函数是线性的,即 y 0 1x, 其中 0 , 1 待定, 称1 为这个一元线性回归函数的回归
系数.也即E Y 0 1x, 引进随机误差项 ,那么

数据分析中的回归分析方法

数据分析中的回归分析方法

数据分析中的回归分析方法数据分析是当今社会中非常热门的研究领域之一,而回归分析是数据分析中最为常见的方法,是分析变量之间关系的一种模型。

本文将介绍回归分析的定义、类型、作用以及具体实现流程。

一、回归分析的定义回归分析是一个广泛使用的方法,它用于检测两个或多个变量之间的关系。

回归分析的一般形式为y = f(x) + ε,其中 y 是因变量,x 是自变量,f(x) 是函数关系,ε 是误差。

回归分析可以帮助人们了解和预测这些变量之间的关系。

二、回归分析的类型回归分析通常分为线性回归和非线性回归。

线性回归是一种简单的方法,它假设自变量和因变量之间具有线性关系。

非线性回归则包括各种模型,它们假设自变量和因变量之间具有不同的关系。

1. 线性回归线性回归是一种最常用的回归分析方法,它假设自变量和因变量之间有一个线性关系。

这种关系可以用一个数学方程来表示,即 y = mx + b,其中 m 是斜率,b 是截距。

m 和 b 可以通过最小二乘法来估计,最小二乘法是一种优化方法,它寻找最小化残差平方和的参数估计值。

残差是观察值和估计值之间的差异。

2. 非线性回归非线性回归是一种更复杂的回归分析方法,它假设自变量和因变量之间具有非线性关系。

非线性回归包括各种模型,例如指数模型、对数模型和多项式模型等。

这些模型通常需要通过试验和逼近来获得参数估计值。

三、回归分析的作用回归分析可以用于很多领域,例如经济学、医学、物理学和社会科学等,它可以帮助人们了解和预测变量之间的关系。

回归分析也可以用于探索变量之间的因果关系,即自变量是否会导致因变量的变化。

此外,回归分析还可以用于建立预测模型,以便预测未来数据的变化趋势。

四、回归分析的实现流程回归分析的实现流程通常包括以下步骤:1. 收集数据首先,需要收集自变量和因变量的数据。

数据可以从各种来源获得,如实验、调查和观察等。

2. 确定回归模型接下来,需要选择合适的回归模型。

如果自变量和因变量之间具有线性关系,则可以使用线性回归模型;如果具有非线性关系,则需要选择适当的非线性回归模型。

回归分析的基本方法

回归分析的基本方法

回归分析的基本方法回归分析是一种用于分析变量之间关系的统计方法,可以帮助我们预测一个变量如何随其他变量的变化而变化。

它可以用于描述变量之间的相互依赖关系,并据此进行预测和解释。

回归分析的基本方法有简单线性回归、多元线性回归和逻辑回归等。

简单线性回归是回归分析的最简单形式,用于探索两个变量之间的线性关系。

它假设两个变量之间存在一个直线关系,通过最小二乘法拟合一条直线来拟合这种关系。

简单线性回归模型的基本形式为:Y=β0+β1X+ε。

其中,Y是被解释变量,X是解释变量,β0和β1是回归系数,ε是误差项。

回归系数β0和β1可以通过最小二乘法估计得到,从而得到最佳拟合直线。

多元线性回归是在简单线性回归的基础上进行扩展,用于分析多个解释变量对一个被解释变量的影响。

它假设被解释变量与解释变量之间存在一个线性关系,通过最小二乘法拟合一个多元线性模型。

多元线性回归模型的基本形式为:Y=β0+β1X1+β2X2+...+βnXn+ε。

其中,Y是被解释变量,X1、X2、..、Xn是解释变量,β0、β1、β2、..、βn是回归系数,ε是误差项。

通过最小二乘法,我们可以估计出回归系数β0、β1、β2、..、βn,从而得到最佳拟合模型。

逻辑回归是一种常用于处理二分类问题的回归方法,它用于预测二分类变量的概率。

逻辑回归将线性回归模型的输出值转换为0和1之间的概率值,并根据概率值进行分类。

逻辑回归模型的基本形式为:P(Y=1,X)= 1 / (1+exp(-β0-β1X1-β2X2-...-βnXn))。

其中,P(Y=1,X)是当给定解释变量X时,被解释变量Y等于1的概率,β0、β1、β2、..、βn是回归系数。

在回归分析中,我们需要进行变量选择来判断哪些解释变量对被解释变量的影响最为显著。

常用的变量选择方法有前向选择、后向删除和逐步回归等。

此外,还可以通过检验回归系数的显著性和分析残差来评估回归模型的拟合程度和预测能力。

常用的检验方法包括t检验、F检验和R方等。

回归分析法原理及应用

回归分析法原理及应用

回归分析法原理及应用回归分析法是一种常用的统计方法,旨在探究自变量和因变量之间的关系。

在回归分析中,自变量是可以用于预测或解释因变量的变量,而因变量是被预测或被解释的变量。

利用回归分析,我们可以确定这些变量之间的关系,从而预测未来的趋势和结果。

回归分析法的原理非常简单,通过一系列统计方法来评估自变量和因变量之间的关系。

最常用的回归分析是线性回归分析,它建立在一条直线上,通过最小二乘法来寻找自变量和因变量之间的线性关系。

其它类型的回归分析包括多元回归分析、二元分类回归分析等。

回归分析法的应用非常广泛,它可以应用于医学、社会科学、金融、自然科学等领域。

举个例子,在医学领域,回归分析可用于预测疾病的发病率或死亡率。

在金融领域,回归分析可用于预测股票价格趋势或汇率变化。

在社会科学领域,回归分析可用于解释人类行为、心理和社会变化。

要使用回归分析法,需要完成以下步骤:1. 收集数据。

这包括自变量和因变量的数据,例如市场规模和销售额。

2. 进行数据预处理。

这包括检查数据是否有缺失、异常值或离群值。

必要时,可对数据进行清理并进行适当的转换或标准化。

3. 选择合适的回归模型。

这需要考虑自变量和因变量之间的关系类型,例如线性、非线性和分类。

根据实际情况和目标,选择最适合的回归模型。

4. 训练模型。

这需要将数据分为训练数据集和测试数据集,并利用训练数据集来建立回归模型。

模型的性能可以通过测试数据集的预测能力来评估。

5. 评估模型性能。

测试数据集可以用来评估模型的性能如何,例如模型的准确度、召回率或F1分数。

这些指标可以用来比较不同的回归模型。

回归分析法的优点包括:1. 提供对自变量与因变量之间的关系的量化估计。

2. 可以帮助我们理解变量之间的相互作用。

3. 可以预测未来的行为或趋势。

4. 可以作为一种基本的统计工具,应用于各种具体应用领域。

回归分析法的缺点包括:1. 回归模型只能处理自变量和因变量之间的线性关系,而不能处理非线性关系。

统计学中的回归分析方法

统计学中的回归分析方法

统计学中的回归分析方法回归分析是统计学中经常被使用的一种方法,它用于研究两个或多个变量之间的关系。

通过回归分析,我们可以预测一个变量如何随着其他变量的变化而变化,或者确定变量之间的因果关系。

在本文中,我将介绍几种常见的回归分析方法,帮助读者更好地理解和应用这一统计学方法。

一、简单线性回归分析简单线性回归分析是回归分析的最基本形式。

它适用于只涉及两个变量的场景,并且假设变量之间的关系可以用一条直线来描述。

在进行简单线性回归分析时,我们需要收集一组观测数据,并使用最小二乘法来拟合直线模型,从而得到最优的回归方程。

通过该方程,我们可以根据自变量的取值预测因变量的值,或者评估自变量对因变量的影响程度。

二、多元线性回归分析多元线性回归分析扩展了简单线性回归模型,允许多个自变量同时对因变量进行解释和预测。

当我们要考察一个因变量与多个自变量之间的复杂关系时,多元线性回归分析是一种有力的工具。

在进行多元线性回归分析时,我们需收集多组观测数据,并建立一个包含多个自变量的回归模型。

通过拟合最优的回归方程,我们可以分析每个自变量对因变量的影响,进一步理解变量之间的关系。

三、逻辑回归分析逻辑回归分析是回归分析的一种特殊形式,用于处理因变量为二元变量(如真与假)时的回归问题。

逻辑回归分析的目标是根据自变量的取值,对因变量的分类进行概率预测。

逻辑回归模型是通过将线性回归模型的输出映射到一个概率区间(通常为0到1)来实现的。

逻辑回归在实际应用中非常广泛,如市场预测、医学诊断等领域。

四、岭回归分析岭回归是一种用于解决多重共线性问题的回归分析方法。

多重共线性指多个自变量之间存在高度相关性的情况,这会导致回归分析结果不稳定。

岭回归通过在最小二乘法的基础上加入一个惩罚项,使得回归系数的估计更加稳定。

岭回归分析的目标是获得一个优化的回归方程,从而在存在多重共线性的情况下提高预测准确度。

五、非线性回归分析在某些情况下,变量之间的关系不是线性的,而是呈现出曲线或其他非线性形态。

第1章 1.2-1.3 可线性化的回归分析

第1章 1.2-1.3 可线性化的回归分析

1.2相关系数1.3可线性化的回归分析学习目标 1.了解线性相关系数r的求解公式,并会初步应用.2.理解回归分析的基本思想.3.通过可线性化的回归分析,判断几种不同模型的拟合程度.知识点一相关系数1.相关系数r的计算假设两个随机变量的数据分别为(x1,y1),(x2,y2),…,(x n,y n),则变量间线性相关系数r=l xyl xx l yy=∑i=1n(x i-x)(y i-y)∑i=1n(x i-x)2∑i=1n(y i-y)2=∑i=1nx i y i-n x y∑i=1nx2i-n x2∑i=1ny2i-n y2.2.相关系数r的性质(1)r的取值范围为[-1,1].(2)|r|值越大,误差Q越小,变量之间的线性相关程度越高.(3)|r|值越接近0,误差Q越大,变量之间的线性相关程度越低.3.相关性的分类(1)当r>0时,两个变量正相关.(2)当r<0时,两个变量负相关.(3)当r=0时,两个变量线性不相关.知识点二 可线性化的回归分析1.回归分析中,若r =±1说明x ,y 之间具有完全的线性关系.( √ ) 2.若r =0,则说明两变量是函数关系.( × ) 3.样本相关系数的范围是r ∈(-∞,+∞).( × )类型一 线性相关系数及其应用例1 下图是我国2012年至2018年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1-7分别对应年份2012-2018.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2020年我国生活垃圾无害化处理量. 附注:参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,∑i =17(y i -y )2=0.55,7≈2.646.参考公式:相关系数r =∑i =1n(t i -t )(y i -y )∑i =1n(t i -t )2∑i =1n(y i -y )2,回归方程y =a +bt 中斜率和截距的最小二乘估计公式分别为:b =∑i =1n(t i -t )(y i -y )∑i =1n(t i -t )2,a =y-b t .解 (1)由折线图中数据和附注中参考数据得 t =4,∑i =17(t i -t )2=28,∑i =17(y i -y )2=0.55.∑i =17(t i -t )(y i -y )=∑i =17t i y i -t ∑i =17y i =40.17-4×9.32=2.89,r ≈ 2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1)得b =∑i =17(t i -t )(y i -y )∑i =17(t i -t )2=2.8928≈0.103, a =y -b t ≈1.331-0.103×4≈0.92. 所以y 关于t 的回归方程为y =0.92+0.10t .将2020年对应的t=9代入回归方程得y=0.92+0.10×9=1.82. 所以预测2020年我国生活垃圾无害化处理量将约为1.82亿吨.反思与感悟(1)散点图只能直观判断两变量是否具有相关关系.(2)相关系数能精确刻画两变量线性相关关系的强弱.跟踪训练1变量x,y的散点图如图所示,那么x,y之间的相关系数r的最接近的值为()A.1 B.-0.5 C.0 D.0.5考点题点答案 C解析从散点图中,我们可以看出,x与y没有线性相关关系,因而r的值接近于0.类型二可线性化的回归分析例2某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费x i和年销售量y i(i=1,2,…,8)的数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i =x i ,w =18∑i =18w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程; (3)当年宣传费x =49时,年销售量的预报值是多少?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β=∑i =1n(u i -u )(v i -v )∑i =1n(u i -u )2,α=v -βu .考点 非线性回归分析 题点 非线性回归分析解 (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型. (2)令w =x ,先建立y 关于w 的线性回归方程.由于d =∑i =18(w i -w )(y i -y )∑i =18(w i -w )2=108.81.6=68, c =y -d w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y =100.6+68w , 因此y 关于x 的回归方程为y =100.6+68x . (3)由(2)知,当x =49时,年销售量y 的预报值y =100.6+6849=576.6.反思与感悟 由样本数据先作散点图,根据散点图的分布规律选择合适的函数模型.如果发现具有线性相关头系,可由公式或计算器的统计功能,求得线性回归方程的两个参数.如果发现是指数型函数或二次函数,可以通过一些代数变换,转化为线性回归模型. 跟踪训练2 在一次抽样调查中测得样本的5个样本点,数值如下表:求y 关于x 的回归方程. 考点 非线性回归分析 题点 非线性回归分析 解 由数值表可作散点图如图,根据散点图可知y 与x 近似地呈反比例函数关系, 设y =k x ,令t =1x,则y =kt ,原数据变为:由置换后的数值表作散点图如下:由散点图可以看出y 与t 呈近似的线性相关关系,列表如下:所以t =1.55,y =7.2.所以b =∑i =15t i y i -5t y∑i =15t 2i -5t2≈4.134 4,a =y -b t ≈0.8. 所以y =4.134 4t +0.8.所以y 与x 之间的回归方程是y =4.134 4x+0.8.1.给定y 与x 是一组样本数据,求得相关系数r =-0.690,则( ) A .y 与x 的线性相关性很强 B .y 与x 线性不相关 C .y 与x 正线性相关 D .y 与x 负线性相关 考点 线性相关系数 题点 线性相关系数的应用 答案 D解析 因为|r |=|-0.690|<0.75, 所以y 与x 的线性相关性一般,又因为r =-0.690<0, 所以y 与x 负线性相关.2.某种细胞在培养正常的情况下,时刻t (单位:分)与细胞数n (单位:个)的部分数据如下:根据表中的数据,推测繁殖到1 000个细胞时的时刻t 最接近于( ) A .200 B .220 C .240 D .260 考点 非线性回归分析 题点 非线性回归分析 答案 A解析 由表可得时刻t (单位:分)与细胞数n 满足回归方程n =202t,由此可知n =1 000时,t 接近200.3.对于回归分析,下列说法错误的是( )A .在回归分析中,变量间的关系是非确定性关系,因此因变量不能由自变量唯一确定B .线性相关系数可以是正的或负的C .回归分析中,如果r =±1,说明x 与y 之间完全线性相关D .样本相关系数r ∈(-1,1) 考点 线性相关系数 题点 线性相关系数的应用 答案 D解析 ∵相关系数|r |≤1,∴D 错误.4.由两个变量x 与y 的散点图可看出样本点分布在一条曲线y =x 2的附近,若要将其线性化,则只需要设________即可. 考点 非线性回归分析 题点 非线性回归分析 答案 t =x 2解析 设t =x 2,则y =t 为线性回归方程.5.一唱片公司研究预支出费用x (十万元)与唱片销售量y (千张)之间的关系,从其所发行的唱片中随机抽选了10张,得到如下的资料:∑i =110x i =28,∑i =110x 2i =303.4,∑i =110y i =75,∑i =110y 2i =598.5,∑i =110x i y i =237,则y 与x 的相关系数r 的绝对值为________.考点 线性相关系数 题点 线性相关系数的应用 答案 0.3解析 根据公式得相关系数r =∑i =110x i y i -10x y(∑i =110x 2i -10x 2)(∑i =110y 2i -10y 2)=237-10×2.8×7.5(303.4-10×2.82)(598.5-10×7.52)=0.3,所以|r |=0.3.1.散点图的优点是直观.但是有时不能准确判断,尤其数据较多时,不易作出散点图.这时可根据线性相关系数r 来判断.2.对于具有非线性相关关系的两个变量,可以通过对变量进行变换,转化为线性回归问题去解决.一、选择题1.若两个变量x 和y 之间具有线性相关关系,它们的相关系数是r ,y 关于x 的回归方程为y =bx +a ,那么( ) A .b ·r >0 B .b ·r <0 C .a ·r >0D .a ·r <0考点 线性相关系数题点线性相关系数的应用答案 A解析对于回归方程y=bx+a,当b>0时,x和y正相关,则r>0;当b<0时,x和y负相关,则r<0.综上所述,b·r>0.2.关于两个变量x,y与其线性相关系数r,有下列说法:①若r>0,则x增大时,y也相应增大;②若|r|越趋近于1,则x与y的线性相关程度越强;③若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上.其中正确的有()A.①②B.②③C.①③D.①②③考点线性相关系数题点线性相关系数的应用答案 D解析根据相关系数的定义,变量之间的相关关系可利用相关系数r进行判断:当r为正数时,表示变量x,y正相关;当r为负数时,表示两个变量x,y负相关;|r|越接近于1,相关程度越强;|r|越接近于0,相关程度越弱.故可知①②③正确.3.甲、乙、丙、丁四位同学各自对A,B两变量进行线性相关试验,并用回归分析方法分别求得相关系数r如表:则这四位同学的试验结果能体现出A,B两变量有更强的线性相关性的是()A .甲B .乙C .丙D .丁 考点 线性相关系数 题点 线性相关系数的应用 答案 D解析 由相关系数的意义可知,相关系数的绝对值越接近于1,相关性越强,结合题意可知,丁的线性相关性更强,故选D.4.若一函数模型为y =ax 2+bx +c (a ≠0),为将y 转化为关于t 的线性回归方程,则需作变换t 等于( ) A .x 2 B .(x +a )2 C.⎝⎛⎭⎫x +b2a 2 D .以上都不对考点 非线性回归分析 题点 非线性回归分析 答案 C解析 y 关于t 的线性回归方程,实际上就是y 关于t 的一次函数, 因为y =a ⎝⎛⎭⎫x +b 2a 2+4ac -b 24a (a ≠0),故选C.5.对于指数曲线y =a e bx ,令u =ln y ,c =ln a ,经过非线性化回归分析之后,可以转化成的形式为( ) A .u =c +bx B .u =b +cx C .y =b +cx D .y =c +bx考点 非线性回归分析 题点 非线性回归分析 答案 A解析 对方程y =a e bx 两边同时取对数,然后将u =ln y ,c =ln a 代入,不难得出u =c +bx . 6.某奶茶店为了了解奶茶销售量与气温之间的关系,随机统计并制作了6天卖出的奶茶的杯数与气温的对照表:经检验,这组样本数据具有线性相关关系,那么,对于气温x (℃)与奶茶销售量y (杯)这两个变量,下列判断正确的是( )A .呈正相关,其回归直线经过点(12,385)B .呈负相关,其回归直线经过点(12,385)C .呈正相关,其回归直线经过点(12,386)D .呈负相关,其回归直线经过点(12,386) 考点 线性回归直线方程 题点 样本点中心的应用 答案 B解析 画出散点图(图略)可知成负相关,又根据表中数据可得x =26+19+14+10+4+(-1)6=12,y =201+242+339+383+505+6406=385,故选B.7.有一组数据如下表:现准备从以下函数中选择一个能够近似地表示这组数据满足的规律,其中拟合最好的是( )A .y =-2x -2B .y =32log 2xC .y =2x -1+1D .y =12x 2-12考点 非线性回归分析 题点 非线性回归分析 答案 D解析把X看作自变量,Y看作其函数值,从表中数据的变化趋势看,函数递增的速度不断加快.A选项中一次函数是以一个恒定的幅度变化,其图像是直线,不符合本题的变化规律.B选项为对数型函数,随着X的增大Y的递增速度不断变慢,不符合本题的变化规律.C选项为指数型函数,随着X的增大Y的递增速度不断变快,但增长速度超出题目中Y的增长速度,不符合本题的变化规律.D选项是二次函数,对比数据知,其最接近这组数据的变化趋势.故选D.8.设(x1,y1),(x2,y2),…,(x n,y n)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线如图,以下说法正确的是()A.x和y的相关系数为直线l的斜率B.x和y的相关系数在0到1之间C.当n为偶数时,分布在l两侧的样本点的个数一定相同D.由直线l可知,r一定小于0考点线性相关系数题点线性相关系数的应用答案 D解析因为r的符号与线性回归方程y=a+bx斜率符号相同,故r一定小于0.二、填空题9.在一组样本数据(x1,y1),(x2,y2),…,(x n,y n)(n≥2,x1,x2,…,x n不全相等)的散点图中,若所有样本点(x i,y i)(i=1,2,…,n)都在直线y=12x+1上,则这组样本数据的样本相关系数为________.考点线性相关系数题点线性相关系数的应用答案 1解析 根据样本相关系数的定义可知,当所有样本点都在直线y =12x +1上时,相关系数为1.10.若已知∑i =1n(y i -y )2是∑i =1n(x i -x )2的4倍,∑i =1n(x i -x )(y i -y )是∑i =1n(x i -x )2的1.5倍,则相关系数r 的值为________. 考点 线性相关系数 题点 线性相关系数的应用 答案 34解析 由r =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2∑i =1n(y i -y )2,得r =34.11.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y =e bx+a的周围.令z =ln y ,求得线性回归方程为z =0.25x -2.58,则该模型的回归方程为______. 考点 非线性回归分析 题点 非线性回归分析 答案 y =e 0.25x-2.58解析 因为z =0.25x -2.58,z =ln y , 所以y =e 0.25x -2.58.三、解答题12.噪声污染已经成为影响人们身体健康和生活质量的严重问题,为了了解声音强度D (单位:分贝)与声音能量I (单位:W/cm 2)之间的关系,将测量得到的声音强度D i 和声音能量I i (i =1,2,…,10)数据做了初步处理,得到下面的散点图及一些统计量的值.(数据:I =3.16×10-12,D =45.7,W =-11.5,∑i =110(I i -I )2=1.56×10-11,∑i =110(W i -W )2=0.51,∑i =110(I i -I )(D i -D )=6.88×10-11,∑i =110(W i -W )(D i -D )=5.1,其中W i =lg I i ,W =110∑i =110W i )根据给出的数据,求声音强度D 关于声音能量I 的回归方程D =a +b lg I ;附:对于一组数据(μ1,υ1),(μ2,υ2),…,(μn ,υn ),其回归直线υ=α+βμ的斜率和截距的最小二乘估计分别为β=∑i =1n(u i -u )(υi -υ)∑i =1n(u i -u )2,α=v -βu .考点 非线性回归分析 题点 非线性回归分析解 令W i =lg I i ,先建立D 关于W 的线性回归方程,由于b =∑i =110(W i -W )(D i -D )∑i =110(W i -W )2=5.10.51=10, ∴a =D -b W =160.7,∴D 关于W 的线性回归方程为D =10W +160.7, ∴D 关于I 的回归方程为D =10lg I +160.7. 四、探究与拓展13.已知某个样本点中的变量x ,y 线性相关,相关系数r >0,平移坐标系,则在以(x ,y )为坐标原点的坐标系下的散点图中,大多数的点都落在第________象限. 考点 线性相关系数 题点 线性相关系数的应用 答案 一、三解析 因为r >0时,b >0,所以大多数的点都落在第一、三象限.14.某种书每册的成本费y (元)与印刷册数x (万册)有关,经统计得到数据如下:令μ=1x ,检验每册书的成本费y 与μ之间是否具有线性相关关系,若有,求出y 对μ的回归方程.(参考数据:∑i =110μ2i =1.413 014,∑i =110y 2i =171.803,∑i =110μi y i =15.208 78)考点 非线性回归分析 题点 非线性回归分析解 设μ=1x ,则y 与μ的数据关系如下表所示:由上表可以得到μ=110×(1+0.5+…+0.005)=0.224 8,y =110×(10.15+5.52+…+1.15)=3.14, 则r =15.208 78-10×0.224 8×3.14(1.413 014-10×0.224 82)(171.803-10×3.142)≈0.999 8.由于r 的值非常接近于1,这表明两个变量的线性相关关系很强,从而求y 与μ的回归方程有意义.又b =15.208 78-10×0.224 8×3.141.413 014-10×0.224 82≈8.98, 则a =y -b μ=3.14-8.98×0.224 8≈1.12, 所以y 关于μ的回归方程为y =1.12+8.98μ.。

3.1.3 可线性化的回归分析

3.1.3 可线性化的回归分析

3.1.3 可线性化的回归分析1.函数y =ax b 两边取自然对数,结果如何? 【提示】 ln y =ln a +b ln x .2.对上述问题作适当变换,得出一个线性函数. 【提示】 令u =ln y ,v =ln x ,c =ln a ,则u =c +b v . 3.作变换,将函数y =a e bx 线性化. 【提示】 ∵y =a e bx , ∴ln y =ln a +bx ,∴作变换:u =ln y ,c =ln a ,则u =c +bx . 4.作变换,将函数y =a e bx 线性化.【提示】 ∵y =a e b x ,∴ln y =ln a +bx ,∴作变换u =ln y ,c =ln a ,v =1x ,则u =c +b v .5.作变换,将函数y =a +b ln x 线性化. 【提示】 ∵y =a +b ln x , ∴作变换v =ln x ,则y =a +b v .对于非线性回归模型一般可转化为线性回归模型,从而得到相应的回归方程.常见的有: (1)幂函数曲线y =ax b ,则作变换u =ln_y ,v =ln_x ,c =ln_a ,得线性函数u =c +b v . (2)指数曲线y =a ·e bx ,则作变换u =ln y ,c =ln a ,得线性函数u =c +b v . (3)倒指数曲线y =a e b x ,则作变换u =ln y ,c =ln a ,v =1x ,得线性函数u =c +b v .(4)对数曲线y =a +b ln x ,则作变换v =ln x ,得线性函数y =a +b v .某地今年上半年患某种传染病人数y 与月份x 之间满足的函数关系模型为y =a e bx ,确定这个函数解析式.月份x 1 2 3 4 5 6 【自主解答】 设u =ln y ,c =ln a ,则u =c +bx . 由已知得下表:∑i =1x i =21,∑i =1u i ≈25.361 1,∑i =1x 2i =91,∑i =1u 2i ≈107.346 7,∑i =1x i u i ≈90.343 8,x =3.5,u ≈4.226 9,b =∑6i =1x i u i -6x u ∑6i =1x 2i -6x2=90.343 8-6×3.5×4.226 991-6×3.52≈0.090 2,c =u -b x =4.226 9-0.090 2×3.5=3.911 2, ∴u =3.911 2+0.090 2x , ∴y =e 3.911 2·e 0.090 2x .基础函数模型为指数函数型,可两边取对数转化为线性函数关系式,求出回归方程.在彩显影中,由经验可知:形成染料光学密度y 与析出银的光学密度x 由公式y =A e b x (b <0)表示.现测得试验数据如下:试求y 对x 的回归方程.【解】 由题意知,对于给定的公式y =A e b x (b <0)两边取自然对数,得ln y =ln A +bx .与线性回归方程相对照可以看出,只要取u =1x ,v =ln y ,a =ln A ,就有v =a +bu .这是v 关于u 的线性回归直线方程,对此我们再套用相关性检验,求出回归系数b 和a .题目中所给出的数据由变量置换u =1x,v =ln y ,得到如下数据:由于|r |≈0.998接近于1,可知u 和v 具有很强的线性相关性.再求出b ≈-0.146,a ≈0.548.所以A =e a =e 0.548,y =e 0.548e -0.146x =e0.548-0.146x .、某地区不同身高的未成年男性的体重平均值如下表:身高x /cm 60 70 80 90 100 110 (2)能否建立适当的函数模型使它能比较近似地反映这个地区未成年男性体重y kg 与身高x cm 的函数关系?试写出这个函数模型的解析式;(3)若体重超过相同身高男性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么这个地区一名身高为175 cm ,体重为78 kg 的在校男生的体重是否正常?【思路探究】 可先依据表中数据画出散点图,从图中观察探究其适合那种函数模型,确定函数模拟,作变换转化为有线性相关关系的量,再由公式计算所求量.【自主解答】 (1)作出散点图如下(2)从散点图可看出函数曲线符合指数曲线y=a e bx. 设u=ln y,c=ln a,则u=c+bx.∑i=1x i=1 380,∑i=1u i=35.542 8,∑i=1x2i=173 000,∑i=1x i u i=4 369.283,x=115,u=2.961 9,b=∑12i=1x i u i-12x u ∑12i=1x2i-12x2=4 369.283-12×115×2.961 9173 000-12×1152≈0.019 6,c=u-b x=2.961 9-0.019 6×115=0.7079,∴u=0.707 9+0.019 6x,y=e0.707 9·e0.019 6x.(3)∵x=175时,u=4.137 9,∴y=e u=e4.137 9≈62.671 1.7862.671 1≈1.245>1.2,此男子偏胖.1.在实际问题中,当变量之间的相关关系不是线性相关关系时,不能用线性回归方程描述它们之间的相关关系,需要进行非线性回归分析.2.可线性化的回归分析:非线性回归问题的非线性回归方程一般很难求,因此把非线性回归化线性回归是解决问题的好方法;把非线性回归化为线性回归,再利用线性回归的方法确定参数a及b的估计值.寒假中,某同学为组织一次爱心捐款,于2013年2月1日在网上给网友发了张帖子,(2)建立x与y的关系,预报回归模型;(3)如果此人打算在2013年2月12日(即帖子传播时间共10天)进行募捐活动,根据上述回归模型,估计可去多少人.【解】(1)散点图略.从散点图可以看出x与y不具有线性相关关系,同时可发现样本点分布在某一个指数函数曲线y=k e mx的周围,其中k、m是参数.(2)对y=k e mx两边取对数,把指数关系变成线性关系.令z=ln y,则变换后的样本点分布在直线z=bx+a(a=ln k,b=m)的周围,这样就可以利用线性回归模型来建立x与y之间的非线性回归方程了,数据可以转化为∴y=e0.620x+1.133.(3)截止到2013年2月12日,x=10,此时y=e0.620×10+1.133≈1 530(人).∴估计可去1 530人.转化与化归思想在可线性化的回归分析中的应用下表为收集到的一组数据:(2)建立x与y的关系,预报回归模型;(3)利用所得模型,预报x=40时y的值.【思路点拨】(1)可直接依据表中数据画出散点图;(2)可利用换元法,将两个变量转化为两个新的变量且成线性关系;得出关系式,再转化为x,y的关系式;(3)利用(2)中的式子,即可求出.【规范解答】(1)作出散点图如图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线y=c1e c2x的周围,其中c1、c2为待定的参数.(2)对两边取对数把指数关系变为线性关系,令z=ln y,则有变换后的样本点应分布在直线z=bx+a,a=ln c1,b=c2的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了,数据可以转化为:∴y=e0.272x-3.849.(3)当x=40时,y=e0.272x-3.849≈1 131.在寻找两变量之间的关系时,通过散点图先确定其关系满足的函数模型,如果不满足线性关系,则通过换元转化为线性关系,求出新元的关系式,再转化为原来的两个变量的关系.可化为线性回归的几种常用曲线 (1)幂函数曲线y =ax b ; (2)指数函数曲线y =ak bx ; (3)倒指数曲线y =a ·e bx ;(4)对数曲线y =a +b ln x .1.对于指数曲线y =a e bx 方程,令u =ln y ,c =ln a 经过非线性化回归分析之后,可以转化成的形式为( )A .u =c +bxB .u =b +cxC .y =b +cxD .y =c +bx【解析】 对指数曲线y =a e bx 方程两边同时取对数,然后将u =ln y ,c =ln a 代入,不难得出u =c +bx .【答案】 A2.指数曲线y =a e bx 的图像可以是( )【解析】 ∵y =a e bx 为指数曲线, ∴y >0恒成立,∴排除选项C.又∵x ∈R ,∴A 、D 错误. 【答案】 B3.x ,y 的取值如下表:【解析】 作出散点图从图中可以看出,可选用y =x 2来进行拟合. 【答案】 y =x 24.在试验中得到变量y 与x 数据如下表:由试验知,y 与1x 之间具有线性相关关系,试求y 与x 之间的回归曲线方程,并预测当x 0=0.038时y 0的值.【解】 令u =1x,由题目所给数据可得下表所示的数据:所以y =34.32+0.29u .所求曲线方程为y =34.32+0.29x. 当x 0=0.038时,y 0=34.32+0.290.038≈41.95.一、选择题1.倒指数曲线y =a e bx的图像为( )【解析】 y =a e bx ,当a >0,b >0时,图像为A.【答案】 A 2.有下列说法:①线性回归分析就是由样本点去寻找一条直线贴近这些样本点的数学方法; ②利用样本点的散点图可以直观地判断两个变量之间的关系是否是线性相关关系; ③通过回归方程y =bx +a 及其回归系数b ,可以估计和观测变量的取值和变化趋势; ④因为由任何一组观测值都可以求得一个回归直线方程,所以没有必要进行相关性检验. 其中正确命题的个数是( ) A .1个 B .2个 C .3个D .4个【解析】 由线性回归分析的意义知①、②、③正确,④错误. 【答案】 C3.幂函数曲线y =x b ,当b >1时的图像为( )【解析】 当b >1时,图像为选项A ,当0<b <1时为选项B ,当b <0时为选项C ,当b =1时为选项D.【答案】 A4.对于回归分析,下列说法错误的是( )A .在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定B .线性相关系数可以是正的或负的C .回归分析中,如果r 2=1或r =±1,说明x 与y 之间完全线性相关D .样本相关系数r ∈(-∞,+∞)【解析】 由相关系数性质知,B 、C 正确.A 正确,因为拟合函数不是唯一的.D 错,因为相关系数|r |≤1.【答案】 D5.可以对下列数据x 、y 之间的关系进行拟合的函数( )A.y =2+13xB .y =2e xC .y =2e 1xD .y =2+ln x【解析】 ∵y =2e 1x为减函数,∴选项C 错.又∵y =2e x 的增长速度极快,∴选项B 错误.由增长速度可知A 错,D 正确. 【答案】 D 二、填空题6.x ,y 的取值如下表:则x ,y 【解析】 由x 与y 值的对应关系可知:该函数应为指数函数,由其近似值可知y =2x较合适.【答案】 y =2x7.在研究硝酸钠的可溶性程度时,观察它在不同温度的水中的溶解度,得观测结果如下:【解析】 将表中数据代入公式,可得b =∑5i =1x i y i -5x y ∑5i =1x 2i -5x2≈0.880 9.【答案】 0.880 9 8.下列说法①当变量之间的相关关系不是线性相关关系时,也能直接用线性回归方程描述它们之间的相关关系;②把非线性回归化为线性回归为我们解决问题提供一种方法;③当变量之间的相关关系不是线性相关关系时,也能描述变量之间的相关关系; ④当变量之间的相关关系不是线性相关关系时,可以通过适当的变换使其转换为线性关系,将问题化为线性回归分析问题来解决.其中正确的序号为________.【解析】 此题考查解决线性相关问题的基本思路,当变量之间的相关关系不是线性相关关系时,也能描述变量之间的相关关系,只是要通过适当的变换使其转化为线性相关问题,用线性回归分析问题来解决.因此②③④正确,①错误.【答案】 ②③④ 三、解答题9.某种书每册的成本费y 元与印刷册数x (千册)有关,经统计得到数据如下:检验每册书的成本费y 与印刷册数的倒数1x 之间是否具有线性相关关系?如有,求出y对x 的回归方程.【解】 把1x 置换成z ,则有z =1x ,从而z 与y 的数据为:∴有z =110(1+0.5+0.333+0.2+0.1+0.05+0.033+0.02+0.01+0.005)=0.225 1y =110(10.15+5.52+4.08+2.85+2.11+1.62+1.41+1.30+1.21+1.15)=3.14, ∑10i =1z 2i =12+0.52+0.3332+0.22+0.12+0.052+0.0332+0.022+0.012+0.0052≈1.415, ∑10i =1y 2i =10.152+5.522+4.082+2.852+2.112+1.622+1.412+1.302+1.212+1.152=171.803, ∑10i =1z i y i =1×10.15+0.5×5.52+0.333×4.08+0.2×2.85+0.1×2.11+0.05×1.62+0.033×1.41+0.02×1.30+0.01×1.21+0.005×1.15≈15.221,∴r ≈0.999 8.∵|r |≈0.999 8接近于1,∴z 对y 具有很强的线性相关关系. ∴b ≈8.976,a ≈1.12.∴所求的z 与y 的回归方程为y =8.976z +1.12. 又∵z =1x ,∴y =8.976x+1.12.10.在一次抽样调查中测得样本的5个样本点,数值如下表:试建立y 与x 【解】 画出散点图如下图1所示,观察可知y 与x 近似是反比例函数关系. 设y =k x (k ≠0),令t =1x,则y =kt .图1 图2可得到y 关于t 的数据如下表:画出散点图如图2型进行拟合,易得:b=∑5i=1t i y i-5t y∑5 i=1t2i-5t2≈4.134 4,a=y-b t≈0.791 7,所以y=4.134 4t+0.791 7,所以y与x的回归方程是y=4.134 4x t+0.791 711.为了研究某种细菌随时间x变化繁殖的个数y,收集数据如下:(1)(2)试求回归方程.【解】(1)根据数据得散点图,如图所示.(2)根据数的散点图可以发现样本点不是分布在某一条直线附近,而是分布在一条曲线附近.根据已学的函数知识,可以发现样本点分布在某一指数型函数y=c1e c2x(c1>0,c2>0)附近,则将函数两边取对数得ln y=c2x+ln c1,则令u=ln y,得u=c2x+ln c1,根据数据可得x和u的数据表:由上面x和从图中可以发现x和u之间有很强的线性相关关系,因此可以用线性回归模型来拟合它们之间的关系.根据公式得到线性回归方程为:u=1.112+0.690 9x,即ln y=1.112+0.690 9x,则得y=e0.690 9x+1.112.故我们可以利用y=e0.690 9x+1.112来描述天数x与繁殖个数y之间的关系.(教师用书独具)(12分)在一化学反应过程中某化学物质的反应速度y(单位:g/分)与一种催化剂的量x(单位:g)有关,现收集了8组数据列于表中,试建立y与x之间回归方程.(2)两个变量间的关系是非线性的,要结合函数模型的应用来选择函数,然后利用变量代换化为直线型,从而解决问题.【自主解答】根据收集的数据作散点图:2分根据x与y的散点图也可以认为样本点集中在某一条指数型函数曲线y=c1e c2x的周围. 4分令z=ln y,则z=c2x+ln c1,即变换后样本点应该分布在直线z=bx+a(a=ln c1,b=c2)的周围,由y与x数据表可得z与x的数据表:8分由散点图可观察到样本数据点大致在一条直线上,所以可用线性回归方程来拟合它.由z与x数据表,得到线性回归方程,z=0.181 2x-0.848 5,10分所以非线性回归方程为y=e0.181 2x-0.848 5. 11分因此,该化学物质反应速度对催化剂的量的非线性回归方程为y=e0.181 2x-0.848 5. 12分1.解决非线性回归分析的关键是根据散点图选择正确的函数模型.2.解决非线性回归分析问题的方法步骤(1)确定变量:确定变量x,y;(2)画散点图:通过观察散点图并与学过的函数(幂函数、指数函数、对数函数、二次函数)作比较,选取拟合效果好的函数模型;(3)变量置换:通过变量置换把非线性问题转化为线性回归问题;(4)写出非线性回归方程.为了研究某种细菌繁殖的个数y(个)与时间x(天)的关系,收集数据如下:(2)建立时间与细菌繁殖个数之间的回归方程.【解】(1)以时间为横轴,细菌繁殖个数为纵轴绘制散点图如下.由图猜想样本点分布在一条指数函数曲线y=c e bx的周围.(2)令z=ln y,a=ln c,则z=bx+a且变换后的样本数据表如下:y=e0.69x+1.112.拓展阅读脚印与统计在这个逐步实现现代化的社会里,统计信息越来越多,这促使人们去探索对一些统计信息进行分析、推断的方法.在《福尔摩斯探案集》中著名的一个探案故事《血字的研究》有这样的情节:福尔摩斯应英格兰探长的求助,帮忙侦破一起杀人案.一到案发现场,福尔摩斯就开始仔细地搜寻罪犯的脚印,其理由是他可以根据一个人的脚印长度来估计他的身高.这里就用到了统计的有关知识.因为,统计学家经过对大量数据的统计分析得出这样的结论:一个人的身高大约是其脚印长度的7倍.另外步幅长度与身高也有一定关系.人的脚印与人的体形、性别也有一定的关系.人脚的大小和手臂前臂的长度差不多,如果知道一个人的身高,就可以算出他脚印的长度;如果不知道一个人的身高,可以通过他脚印的长度推算出他的身高.《血字的研究》是柯南道尔于1886年写成,可见有关根据人的脚印长度估计其身高的方法在那时已经初步成型.由于这一方法对于破案起着至关重要的作用,所以在犯罪率不断升高的今天,刑警到达案发现场的第一件事情也是仔细地搜寻罪犯的脚印.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.2可线性化的回归分析学案备注【学习目标】
1.能直观的判断两个变量是否满足线性相关
2.用非线性的函数关系来描述不好用线性关系刻画的两个
变量之间的关系
【重点、难点】用非线性的函数关系来描述不好用线性关系
刻画的两个变量之间的关系
【自主学习】
1.若两个变量不呈现线性关系,不能直接利用线性回归方程
建立两个变量的相关关系,那我们应如何建立两个变量的
关系?例如bx
y=怎么化成线性相关问题解决?(阅读教
ae
材第9页到13页)
2. 在具体问题中,我们首先应该作出原始数据)
x
,
(y 的,从中看出数据的大致规律,再
根据这个规律选择适当的函数进行拟合。

3. 对于非线性回归模型一般可转化为模
型从而得到相应的回归方程。

4.几种能转化为线性回归模型的非线性回归模型
(1)幂函数曲线x
ab
y=,作变换____________,得线性函数__________________
(2)指数曲线bx
ae
y=,作变换______________,得线性函数_______________
(3)倒指数曲线x
b
ae y =,作变换______________得线性函数
________________
(4)对数曲线x b a y ln +=,作变换_______________得线性函数_____________ 【例题分析】
例1.(1)有5组(x,y )数据(1,3),(2,4),(4,5),(3,10),(10,12),去掉一组______数据后,剩下的四组数据的线性相关系数最大。

(2)已知幂函数曲线b ax y =做线性变换后得到的回归方程为v u 4.02+=,则a=_______,b=__________
例2.为了研究某种细菌随时间x 变化,繁殖的个数,收集数据如下:
天数 x /天 1 2 3 4 5 繁殖个数y /个
6 12 25 49 95
(1)用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图;
(2)试求出预报变量对解释变量的回归方程.(答案:所求
非线性回归方程为0.69 1.112ˆy =e x +.)
小结:利用回归方程探究非线性回归问题,可按“作散点图→建模→确定方程”这三个步骤进行.
其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题.
【课后巩固】 1.
根据下面所给的散点图,变量y 关于x 的回归函数模
型应选择( )
A. b ax y =
B. bx ae y = y
C. x
b ae y = D. x b a y ln += O x 2.为考虑广告费用x 与销售额y 之间的关系,随机地抽取5家超市,得到如下表所示的数据;
广告费用x(千克)
1.0 4.0 6.0 10.0 14.0 销售额y (千元) 19.0
42.0
46.0
52.0
53.0
现要使销售额达到10万元,则广告费用约为______________千克.
3. 已知两个变量x ,y 的关系可以近似的用函数bx ae y =来表示,通过变换后得到一个线性函数,利用最小二乘法得到的线性回归方程为x u 5.02+=,则x ,y 的近似函数关系为______________
4. 在彩色显影中,由经验可知,形成染料光学密度y 与析出银的光学密度x 由公式)0(<=b Ae y x
b
表示, 现测得试验数据如下:
i x
0.05 0.06 0.25 0.31 0.07 0.10
i y 0.10 0.14 1.00 1.12 0.23 0.37 i x 0.38 0.43 0.14 0.20 0.47 i y
1.19
1.25
0.59
0.79
1.29
试求y 对x 的回归方程.
5.在一次抽样调查中测得样本的5个样本点,数值如下表:
试建立y 与x 之间的回归方程.
x 0.25 0.5 1 2 4 y
16
12
5
2
1
课后反思:。

相关文档
最新文档