高考数学-统计案例-1-回归分析的基本思想及其初步应用

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

专项-统计案例

3.1回归分析的基本思想及其初步应用

知识点

1.回归分析:对于具有相关关系的两个变量进行统计分析的方法叫做回归分析,即回归分析就是寻找相关关系中这种非确定关系的某种确定性.

2.线性回归方程:如果散点图中的各点都大致分布在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线,其方程称为线性回归方程.

记回归直线方程为:a bx y +=,称为变量Y 对变量x 的回归直线方程,其中a b ,叫做回归系数.未知参数

b 和a 的最小二乘法估计分别为b

ˆ和a ˆ,给定一组数据()()()n n y x y x y x ,,........,,,2211,则a ˆ与b ˆ的计算公式为:()()()

∑∑∑∑====--=

---=n

i i n

i i

i n

i i

n

i i

i

x

n x y

x n y x x x y

y

x x b

1

2

2

1

1

2

1

ˆ,x b y a

ˆˆ-=,其中∑∑====n

i i n i i y n

y x n

x 1

1

1,1,从而a bx +的估计表示为a x b y

ˆˆˆ+=. 3.相关关系的强弱:

(1)相关系数:给定一组数据()()()n n y x y x y x ,,........,,,2211,则变量间线性相关系数r 的计算公式为:

()()

()()

∑∑∑∑∑∑======---=

----=

n

i n

i i i n

i i

i n

i i

n

i i

n

i i

i

y n y x n x y

x n y

x y

y

x x y

y

x x r 1

1

2

22

21

1

2

1

2

1)

)((

(2)相关系数和相关程度:

r

两个变量的变化趋势 线性相关关系

10≤

0ˆ>b 01<≤-r

一个变量增,另一个变量减

负相关(

)

0=r

无规律

不相关

当75.0≥r 时,通常认为两个变量有较强的线性关系. 4. 随机误差

线性回归模型⎩

⎪⎨

⎪⎧

y =bx +a +e ,

E e =0,D e =σ2

,其中a ,b 为模型的未知参数,通常e 为随机变量,称为随机误

差.x 称为解释变量,y 称为预报变量.

3.残差分析

(1)残差:对于样本点(x 1,y 1),(x 2,y 2),…,(x n ,y n ),它们的随机误差为e i =y i -bx i -a ,i =1,2,…,n ,其估计值为e ^i =y i -y ^i =y i -b ^x i -a ^,i =1,2,…,n ,e ^

i 称为相应于点(x i ,y i )的残差.残差平方和()∑=-n

i i

y

y

1

2

ˆ越小,模型拟合效果越好

(2)残差图:作图时纵坐标为残差,横坐标为样本编号,或i x 的数据,或i y 的数据,这样做出的图形称为残差图

4.相关指数:R 2=1-∑n

i =1 (y i -y ^

i )2

∑n i =1 (y i -y )2

.,相关指数的值越大,模型的拟合效果越好.

注 建立回归模型的基本步骤

1.确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.

2.画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等). 3.由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性回归方程). 4.按一定规则(如最小二乘法)估计回归方程中的参数.

5.得出结果后分析残差图是否有异常(如个别数据对应残差过大,残差呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否合适等.

题型一 求线性回归方程

【例1】某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据:

(1)请画出上表数据的散点图;

(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^

=b ^

x +a ^

; (3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.

⎝ ⎛⎭

⎪⎪⎫

相关公式:b ^

=∑i =1

n

x i y i

-n x ·y ∑i =1

n

x 2

i

-n x 2

,a ^

=y -b ^

x

【过关练习】

1.假设关于某设备的使用年限x (年)和所支出的维修费用y (万元)有如下的统计数据:

由此资料可知y 对x 呈线性相关关系. (1)求线性回归方程;

(2)求使用年限为10年时,该设备的维修费用为多少?

题型二 线性回归分析

【例1】在一段时间内,某种商品的价格x 元和需求量y 件之间的一组数据为:

求出y 对x 的线性回归方程,并说明拟合效果的程度.

【过关练习】

1.关于x 与y 有如下数据:

有如下的两个线性模型:(1)y ^

=6.5x +17.5;(2)y ^

=7x +17.试比较哪一个拟合效果更好.

题型二 非线性回归分析

【例1】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.

相关文档
最新文档