人教版高中数学必修三 第四章 线性回归方程 Word版含解析

重点列表:

重点详解:

1.变量间的相关关系

常见的两变量之间的关系有两类:一类是确定性的函数关系,另一类是________;与函数关系不同,相关关系是一种________关系,带有随机性. 2.两个变量的线性相关

(1)如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有____________,这条直线叫________.

(2)从散点图上看,如果点分布在从左下角到右上角的区域内,那么两个变量的这种相关关系称为________;如果点分布在从左上角到右下角的区域内,那么两个变量的这种相关关系称为________.

※ (3)相关系数

r =

∑∑∑===----n

j j

n i i

n

i i

i

y y

x x y y x x 1

2

1

2

1

)()()

)((,当r >0时,表示两个变量正相关;当r <0时,表示两个

变量负相关.r 的绝对值越接近________,表示两个变量的线性相关性越强;r 的绝对值越接近________,表示两个变量的线性相关性越弱.通常当r 的绝对值大于0.75时,认为两个变量具有很强的线性相关关系. 3.回归直线方程 (1)通过求Q =

∑=--n

i i i

x y

1

2)(βα的最小值而得出回归直线的方法,即使得样本数据的点到回

归直线的距离的平方和最小的方法叫做____________.该式取最小值时的α,β的值即分别为,.

(2)两个具有线性相关关系的变量的一组数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程

为a x b y

ˆˆˆ+=,则 ⎪⎪

⎪⎩⎪⎪⎪

⎨⎧

-=--=---=∑∑∑∑====.ˆˆ,

)())((ˆ1

2

21

121x b y a

x

n x

y x n y

x x x y y x x b n

i i

n

i i

i n i i n

i i i

【答案】

1.相关关系 非确定性

2.(1)线性相关关系 回归直线 (2)正相关 负相关 (3)1 0 3.最小二乘法

重点1:相关关系的判断 【要点解读】

在研究两个变量之间是否存在某种关系时,必须从散点图入手.对于散点图,可以做出如下判断:

(1)如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.

(2)如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系. (3)如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系. 【考向1】确定性关系与随机关系

【例题】下列变量之间的关系不是..

相关关系的是( ) A .已知二次函数y =ax 2+bx +c ,其中a ,c 是已知常数,取b 为自变量,因变量是这个函数的判别式Δ=b 2-4ac B .光照时间和果树亩产量 C .降雪量和交通事故发生率 D .每亩施用肥料量和粮食亩产量

解:由函数关系和相关关系的定义可知,A 中Δ=b 2-4ac ,因为a ,c 是已知常数,b 为自变量,所以给定一个b 的值,就有唯一确定的Δ与之对应,所以Δ与b 之间是一种确定的关系,是函数关系.B ,C ,D 中两个变量之间的关系都是相关关系.故选A .

【评析】要注意函数关系与相关关系的区别:函数关系是确定性关系,而相关关系是随机的、不确定的.

重点2:线性回归方程有关概念 【要点解读】

样本中心点一定在回归直线上 【考向1】样本中心点

【例题】为了考查两个变量x 和y 之间的线性关系,甲、乙两位同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1,l 2,已知两人得到的试验数据中,变量x 的平均值都等于s ,变量y 的平均值都等于t ,那么下列说法正确的是( ) A .直线l 1和l 2一定有公共点(s ,t ) B .直线l 1和l 2相交,但交点不一定是(s ,t ) C .必有直线l 1∥l 2 D .直线l 1和l 2必定重合

【评析】回归方程一定通过样本点的中心(,y );中心相同的样本点的回归方程不一定相同. 【考向2】线性回归直线的理解

【例题】由一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到回归直线方程a x b y

ˆˆˆ+=,那么下面说法错误..

的是( ) A .直线a x b y

ˆˆˆ+=必经过点(,y ) B .直线a x b y

ˆˆˆ+=至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点 C .直线a x b y

ˆˆˆ+=的斜率=∑∑==--n

i i

n

i i

i x

n x

y x n y

x 1

2

21

D .直线a x b y ˆˆˆ+=和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差∑=+-n

i i

i a x b y 1

2)]ˆˆ([是该坐标平面上所有直线与这些点的偏差中最小的

重点3:散点图 【要点解读】

根据散点图可以直观判断正负相关以及数据所对应的函数模型 【考向1】正相关与负相关

【例题】(1)对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图2.由这两个散点图可以判断( )

图1

图2

A .变量x 与y 正相关,u 与v 正相关

B .变量x 与y 正相关,u 与v 负相关

C .变量x 与y 负相关,u 与v 正相关

D .变量x 与y 负相关,u 与v 负相关

解:由这两个散点图可以判断,变量x 与y 负相关,u 与v 正相关,故选C.

【评析】点分布在从左下角到右上角的区域时,两个变量的相关关系为正相关;点分布在从左上角到右下角的区域时,两个变量的相关关系为负相关. (2)下面是一块田的水稻产量与施化肥量的一组观测数据(单位:kg): 施化肥量15 20 25 30 35 40 45 水稻产量 320 330 360 410 460 470 480 (Ⅰ)将上述数据制成散点图;

(Ⅱ)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗? 解:(Ⅰ)散点图如下:

(Ⅱ)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大.图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长,不会一直随化肥施用量的增加而增长.

【评析】任何一组数据(二元数据)都可以作出散点图,散点图可以直观地观察两个变量间的关系.

【考向2】散点图的画法及相关关系识别

【例题】(1)从左至右,观察下列三个散点图,变量x与y的关系依次为________(正相关记作①;负相关记作②;不相关记作③).

(2)科研人员为了全面掌握棉花新品种的生产情况,查看了气象局对该地区年降雨量与年平均气温的统计数据(单位分别是mm,℃),并作了统计:

(Ⅰ)试画出散点图;

(Ⅱ)判断两个变量是否具有线性相关关系.

解:(Ⅰ)作出散点图如图所示.

(Ⅱ)由散点图可知,各点并不在一条直线附近,所以两个变量不具有线性相关关系.

难点列表:

求线性回归直线方程的步骤

(1)用散点图或进行相关性检验判断两个变量是否具有线性相关关系;

(2)求系数b ^

:公式有两种形式,b ^

∑n

i =1

(x i -x -

)(y i -y -

∑n i =1

(x i -x -

2

∑n

i =1

x i y i -nx - y

∑n

i =1x 2i -nx -

2,根据题目具体情

况灵活选用;

(3)求a ^

:a ^

=y -

-b ^x -

; (4)写出回归直线方程.

说明:当数据较复杂时,题目一般会给出部分中间结果,观察这些中间结果可确定选用公式

的哪种形式求b ^

.

难点1:求回归方程及用回归方程进行估计 【要点解读】

(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则无意义.

(2)根据回归方程进行的估计仅是一个预测值,而不是真实发生的值.

(3)用最小二乘法求回归方程,关键在于正确求出系数,,由于,的计算量大,计算时应仔细小心,分层进行(最好列出表格),避免因计算而产生错误. 【考向1】求线性回归方程

【例题】下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:

(1)请画出上表数据的散点图;

(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程;

(3)已知该厂技术改造前100吨甲产品能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?

(参考值3×2.5+4×3+5×4+6×4.5=66.5) 解:(1)散点图如下:

(2)由系数公式可知,=4.5,y =3.5, =

66.5-4×4.5×3.5

86-4×4.5

2

=0.7, =3.5-0.7×4.5=0.35,

所以线性回归方程为y

ˆ=0.7x +0.35. (3)x =100时,y

ˆ=0.7x +0.35=70.35,所以预测生产100吨甲产品的生产能耗比技术改造前降低19.65吨标准煤.

【评析】牢记求线性回归方程的步骤:(1)列表;(2)计算,y ,

∑=n

i i i y x 1

,∑=n

i i x 1

2

;(3)代入公式求,再利用x b y a

ˆˆ-=求,(4)写出回归方程. 【考向2】利用线性回归方程进行预测

【例题】从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得

∑=10

1

i i

x

=80,

∑=10

1

i i

y

=20,

∑=101

i i

i y x =184,∑=10

1

2

i i

x

=720.

(1)求家庭的月储蓄y 对月收入x 的线性回归方程y =bx +a ; (2)判断变量x 与y 之间是正相关还是负相关;

(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄. 附:线性回归方程y =bx +a 中,

b =

∑∑==--n

i i

n

i i

i

x

n x

y x n y

x 1

2

21,x b y a -=,

其中,y 为样本平均值,线性回归方程也可写为y ^=b ^x +a ^

.

解:(1)由题意知n =10,=

1

n ∑=n

i i

x

1=80

10

=8, y =1n

=n

i i y 1=20

10=2,又

∑=n

i i

x

1

2- n 2 =720 -10×82=80,

∑=n

i i

i y x 1

-n y x =184-10×8×2=24,

由此得b =24

80

=0.3,

a =y -

b =2-0.3×8=-0.4, 故所求回归方程为y =0.3x -0.4.

(2)由于变量y 的值随x 的值增加而增加(b =0.3>0),故x 与y 之间是正相关. (3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7(千元). 难点2:非线性相关转化为线性相关 【要点解读】

通过观察散点图,分析其函数模型,然后转化成线性相关 【考向1】非线性相关转化为线性相关

【例题】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.

(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回

归方程类型?(给出判断即可,不必说明理由)

(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程.

(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?

附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+β u 的斜率和截距的最小二乘估计分别为β^

解题指导] 切入点:回归分析中对散点图的理解,回归方程的求法和应用;关键点:通过换元把非线性回归方程转化为线性回归方程求解.

解] (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型. (2)令w =x ,先建立y 关于w 的线性回归方程.

c ^=y -d

^ w =563-68×6.8=100.6, 所以y 关于w 的线性回归方程为y ^=100.6+68w , 因此y 关于x 的回归方程为y ^=100.6+68x . (3)①由(2)知,当x =49时,

年销售量y 的预报值y ^=100.6+6849=576.6, 年利润z 的预报值z ^=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z 的预报值 z ^=0.2(100.6+68x )-x =-x +13.6x +20.12. 所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.

故年宣传费为46.24千元时,年利润的预报值最大.

【趁热打铁】

1.两个变量成负相关关系时,散点图的特征是( ) A .点分布在从左下角到右上角的区域 B .散点图在某方形区域内 C .散点图在某圆形区域内

D .点分布在从左上角到右下角的区域

2.对于给定的两个变量的统计数据,下列说法正确的是( ) A .都可以分析出两个变量的关系

B .都可以用一条直线通过近似表示两者关系来估计总体的均值

C .都可以作出散点图

D .都可以用确定的表达式表示两者的关系 3.下列命题:

①任何两个变量都具有相关关系; ②圆的周长与该圆的半径具有相关关系;

③某商品的需求与该商品的价格是一种非确定性关系; ④根据散点图求得的回归直线方程可能是没有意义的;

⑤两个变量间的相关关系可以通过回归直线把非确定性问题转化为确定性问题进行研究. 其中正确的命题为( )

A .①③④

B .②④⑤

C .③④⑤

D .②③⑤

4.对四组数据进行统计,获得以下散点图,关于其相关系数比较,正确的是( )

A .r 2

B .r 4

C .r 4

D .r 2

5.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归方程y ^

=0.67x +54.9.

A .67

B .68

C .69

D .70

6.变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r 1表示变量Y 与X 之间的线性相关系数,r 2表示变量V 与U 之间的线性相关系数,则( ) A .r 2<r 1<0 B .0<r 2<r 1 C .r 2<0<r 1

D .r 2=r 1

7.某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,得到售价x (元)和销售量y (件)之间的一组数据如下表:

y

ˆ=-3.2x +a ,则a =______.

8.某数学老师身高176 cm ,他爷爷、父亲和儿子的身高分别是173 cm 、170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________cm.

9.假设关于某种设备的使用年限x (年)与所支出的维修费用y (万元

)有如下统计资料:

已知

∑=5

1

2

i i

x

=90,

∑=5

1

i i

i y x =112.3.

(1)求,y ;

(2)如果x 与y 具有线性相关关系,求出线性回归方程; (3)估计使用年限为10年时,维修费用约是多少?

10.某班主任为了对本班学生的月考成绩进行分析,决定从全班25名女同学,15名男同学中随机抽取一个容量为8的样本进行分析.

(1)如果按性别比例分层抽样,应选男女生各多少人; (2)随机抽取8位同学的数学、物理分数对应如表:

相关性,求出线性回归方程(系数精确到0.01);如果不具有线性相关性,请说明理由.

第四章

1解:正确的只有D 选项.故选D.

2解:任两个变量均可作出散点图,从散点图上看有相关关系的才具有分析的价值,无相关关系的则作不出什么结论.故选C.

4解:由相关系数定义及散点图所表达含义可知r 2

5解:=15×(10+20+30+40+50)=30,由于y ^

=0.67x +54.9必过点(,y ),∴y =0.67×30+

54.9=75,因此图表中的模糊数据为75×5-(62+75+81+89)=68.故选B.

6解:对于变量Y 与X 而言,Y 随X 的增大而增大,故Y 与X 正相关;对于变量V 与U 而言,V 随U 的增大而减小,故V 与U 负相关,故r 2<0<r 1.故选C. 7解:价格的平均数=

9+9.5+10+10.5+115=10,销售量的平均数y =11+10+8+6+5

5

8,由y

ˆ=-3.2x +a 知b =-3.2,所以a =y -b =8+3.2×10=40.故填40. 8解:根据题中所提供的信息,可知父亲与儿子的身高的对应数据可列表如下:

=173,y =176,∴=

∑∑==---3

1

2

1

)()

)((i i

i i i

x x

y y x x

=3×6

(-3)2+32

=1,=y -=176-173=3. ∴回归直线方程为y

ˆ=x +3,从而可预测他孙子的身高为182+3=185(cm).故填185.

10解:(1)按性别比例分层抽样,应选男生15×8

40=3(人),选女生25×8

40=5(人).

(2)以数学成绩x为横坐标,物理成绩y为纵坐标作散点图如图所示.

从散点图可以看出这些点大致分布在一条直线附近,并且在逐步上升,故物理与数学成绩线性正相关.

设y与x的线性回归方程是yˆ=bx+a,根据所给的数据,可以计算出≈0.65,≈34.5,

所以y与x的回归方程是yˆ=0.65x+34.5.

人教版高中数学必修三 第四章 线性回归方程 Word版含解析

重点列表: 重点详解: 1.变量间的相关关系 常见的两变量之间的关系有两类:一类是确定性的函数关系,另一类是________;与函数关系不同,相关关系是一种________关系,带有随机性. 2.两个变量的线性相关 (1)如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有____________,这条直线叫________. (2)从散点图上看,如果点分布在从左下角到右上角的区域内,那么两个变量的这种相关关系称为________;如果点分布在从左上角到右下角的区域内,那么两个变量的这种相关关系称为________. ※ (3)相关系数 r = ∑∑∑===----n j j n i i n i i i y y x x y y x x 1 2 1 2 1 )()() )((,当r >0时,表示两个变量正相关;当r <0时,表示两个 变量负相关.r 的绝对值越接近________,表示两个变量的线性相关性越强;r 的绝对值越接近________,表示两个变量的线性相关性越弱.通常当r 的绝对值大于0.75时,认为两个变量具有很强的线性相关关系. 3.回归直线方程 (1)通过求Q = ∑=--n i i i x y 1 2)(βα的最小值而得出回归直线的方法,即使得样本数据的点到回

归直线的距离的平方和最小的方法叫做____________.该式取最小值时的α,β的值即分别为,. (2)两个具有线性相关关系的变量的一组数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程 为a x b y ???+=,则 ?? ????? ?? -=--=---=∑∑∑∑====.??, )())((?1 2 21 121x b y a x n x y x n y x x x y y x x b n i i n i i i n i i n i i i 【答案】 1.相关关系 非确定性 2.(1)线性相关关系 回归直线 (2)正相关 负相关 (3)1 0 3.最小二乘法 重点1:相关关系的判断 【要点解读】 在研究两个变量之间是否存在某种关系时,必须从散点图入手.对于散点图,可以做出如下判断: (1)如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系. (2)如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系. (3)如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系. 【考向1】确定性关系与随机关系 【例题】下列变量之间的关系不是.. 相关关系的是( ) A .已知二次函数y =ax 2+bx +c ,其中a ,c 是已知常数,取b 为自变量,因变量是这个函数的判别式Δ=b 2-4ac B .光照时间和果树亩产量 C .降雪量和交通事故发生率 D .每亩施用肥料量和粮食亩产量

高中数学《线性回归方程》教案

线性回归方程 教学目标: (1)了解非确定性关系中两个变量的统计方法; (2)掌握散点图的画法及在统计中的作用; (3)掌握回归直线方程的实际应用。 教学重点: 线性回归方程的求解。 教学难点: 回归直线方程在现实生活与生产中的应用。 教学过程: 一、复习练习 1.下例说法不正确的是( B ) A.在线性回归分析中,x 和y 都是变量; B.变量之间的关系若是非确定关系,那么x 不能由y 唯一确定; C.由两个变量所对应的散点图,可判断变量之间有无相关关系; D.相关关系是一种非确定性关系. 2.已知回归方程81.05.0ˆ-=x y ,则x =25时, y 的估计值为__11.69____. 3.三点)24,11(),20,7(),10,3(的线性回归方程是 ( D ) A x y 75.175.1ˆ-= B x y 75.575.1ˆ += C x y 75.575.1ˆ-= D x y 75.175.1ˆ+= 4.我们考虑两个表示变量x 与y 之间的关系的模型,δ为误差项,模型如下: 模型1:x y 46+=:;模型2:e x y ++=46. (1)如果1,3==e x ,分别求两个模型中y 的值; (2)分别说明以上两个模型是确定性模型还是随机模型. 解 (1)模型1:y=6+4x=6+4×3=18; 模型2:y=6+4x+e=6+4×3+1=19. (2)模型1中相同的x 值一定得到相同的y 值.所以是确定性模型;模型2中相同的x 值,因 δ不同,且δ为误差项是随机的,所以模型2是随机性模型。 二、典例分析 例1、一个车间为了规定工时定额,需要确定加工零件所花费的时间.为此进行了10次试验,测得数据如下:

高中数学知识点精讲精析 线性回归分析

3.3 线性回归分析 1.在实际问题中我们常会遇到多个变量同处于一个过程之中,它们互相联系,互相制约。一些变量它们不能用用一个确定的函数关系式表达出来。这些变量其实就是是随机变量,之间的关系我们常称为相关关系。为深入本质,我们也需要去寻找这些变量间的数量关系式。回归分析就是进行统计的一种方法。在这种关系中简单的线性回归。 2.线性回归方程: 一般地,设有n 个观察数据如下: 当,a b 使2221122()()...()n n Q y bx a y bx a y bx a =--+--++--取得最小值时,就 称?y bx a =+为拟合这n 对数据的线性回归方程,该方程所表示的直线称为回归直线. 上述式子展开后,是一个关于,a b 的二次多项式,应用配方法,可求出使Q 为最小值时的,a b 的值.即 111 22 11()()()n n n i i i i i i i i i i i n x y x y b n x x a y bx =====? -? ?=?-??=-??∑∑∑∑∑,(*) ∑==n i i x n x 1 1, ∑==n i i y n y 11 1.有10个同类企业的生产性固定资产年平均价值和工业总产值资料如下: 企业编号 生产性固定资产价值(万元) 工业总产值(万元)

1 2 3 4 5 6 7 8 9 10 318 910 200 409 415 502 314 1210 1022 1225 524 1019 638 815 913 928 605 1516 1219 1624 合计6525 9801 (1)说明两变量之间的相关方向; (2)建立直线回归方程; (3)计算估计标准误差; (4)估计生产性固定资产(自变量)为1100万元时总产值(因变量)的可能值。 【解析】 (1)r=0.9478 (2)y=395.567+0.8958x (3)S yx=126.764 (4)1380.947 2.检查5位同学统计学的学习时间与成绩分数如下表: 每周学习时数学习成绩 4 6 7 10 13 40 60 50 70 90 要求:(1)由此计算出学习时数与学习成绩之间的相关系数; (2)建立直线回归方程; (3)计算估计标准误差。 【解析】 (1)0.9558 (2)y=20.4+5.2x (3)S yx=6.532

高中数学专题讲义-回归分析

一.随机抽样 1.随机抽样:满足每个个体被抽到的机会是均等的抽样,共有三种经常采用的随机抽样方法: ⑴简单随机抽样:从元素个数为N 的总体中不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样. 抽出办法:①抽签法:用纸片或小球分别标号后抽签的方法. ②随机数表法:随机数表是使用计算器或计算机的应用程序生成随机数的功能生成的一张数表.表中每一位置出现各个数字的可能性相同. 随机数表法是对样本进行编号后,按照一定的规律从随机数表中读数,并取出相应的样本的方法. 简单随机抽样是最简单、最基本的抽样方法. ⑵系统抽样:将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法. 抽出办法:从元素个数为N 的总体中抽取容量为n 的样本,如果总体容量能被样本容量整 除,设N k n =,先对总体进行编号,号码从1到N ,再从数字1到k 中随机抽取一个数s 作 为起始数,然后顺次抽取第2(1)s k s k s n k +++-L ,,,个数,这样就得到容量为n 的样本.如果总体容量不能被样本容量整除,可随机地从总体中剔除余数,然后再按系统抽样方法进行抽样. 系统抽样适用于大规模的抽样调查,由于抽样间隔相等,又被称为等距抽样. ⑶分层抽样:当总体有明显差别的几部分组成时,要反映总体情况,常采用分层抽样,使总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样,这种抽样方法叫做分层抽样. 分层抽样的样本具有较强的代表性,而且各层抽样时,可灵活选用不同的抽样方法,应用广泛. 2.简单随机抽样必须具备下列特点: ⑴简单随机抽样要求被抽取的样本的总体个数N 是有限的. ⑵简单随机样本数n 小于等于样本总体的个数N . ⑶简单随机样本是从总体中逐个抽取的. ⑷简单随机抽样是一种不放回的抽样. ⑸简单随机抽样的每个个体入样的可能性均为n N . 3.系统抽样时,当总体个数N 恰好是样本容量n 的整数倍时,取N k n =; 若N n 不是整数时,先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量n 整除.因为每个个体被剔除的机会相等,因而整个抽样过程中每个个体被抽取的机会仍 知识内容 板块六.回归分析

高中数学 第2章 统计 2.4 线性回归方程教材梳理导学案 苏教版必修3

2.4 线性回归方程 庖丁巧解牛 知识·巧学 一、相关关系 变量之间的常见关系: 一类是确定性函数关系,变量之间的关系可以用函数表示.如正方形的边长l与面积S 之间就是确定性函数关系,可以用函数S=l2表示; 一类是相关关系,变量之间有一定的联系,但不能完全用函数来表达.如人的体重y与身高x有关.一般来说,身高越高,体重越重,但不能用一个函数来严格地表示身高与体重之间的关系. 在现实生活中存在着大量的相关关系,如何判断和描述相关关系,统计学发挥着非常重要的作用.变量之间的相关关系带有不确定性,这需要通过收集大量的数据,对数据进行统计分析,发现规律,才能作出科学的判断. 辨析比较函数关系与相关关系的区别与联系 相同点:两者均是指两个变量间的关系; 不同点: ①函数关系是一种确定性关系,自变量的任一取值,因变量都有唯一确定的值与之对应;相关关系是非确定性关系,因变量的取值具有一定的随机性; ②函数关系是因果关系,而相关关系不一定是因果关系,也可能是伴随关系; ③相关关系的分析方向及方法,由于相关关系的不确定性,在寻找变量间相关性的过程中,统计发挥着重要的作用,而函数关系则可以通过函数的性质来进行研究. 二、线性回归分析 对具有相关关系的两个变量进行统计分析的方法叫回归分析. 通俗地讲,回归分析就是寻找相关关系中非确定性关系的某种确定性. 1.散点图 我们把表示具有相关关系的两个变量x、y的一组数据(x n,y n)(n=1,2,3,…)对应的一些点(即样本点)画在坐标系内,得到的图形叫做散点图. 如:某地农业技术指导站的技术员,经过在7块并排大小相同的试验田上进行施化肥量对水 观察表中数据,大体上随着施化肥量的增加,水稻的产量也在增加.只是表中两者之间的关系表现得不是很确切,需要对数据进行分析.为此我们可以作统计图表,以便对两者有一个直观的印象和判断.除上述的统计图表外,我们还可以用另一种统计图——散点图来分析. 以x轴表示施肥量,y轴表示水稻产量,可得散点图如图2-4-1: 图2-4-1

高中数学第2章统计2.4线性回归方程(2)教案苏教版必修3(new)

2。4 线性回归方程 第2课时 导入新课 在上一节课中问题1:将汽油以均匀的速度注入桶里,注入的时间t与注入的油量y如下表: 从表里数据得出油量y与时间t之间的函数关系式为y=2x(x≥0).并且在直角坐标系里很容易作出它们的图象,我们知道各点在同一条直线上。 再看下面的问题(即上一节课的练习2):某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对比表: 请大家动手作出热茶销售量与气温的坐标图,说说它的特点,能得到什么规律? 分析:该图中所有点不像第一个问题中函数关系的图象对应的点在同一条直线上,但是分布也是很有规律,它们散布在从左上角到右下角的区域,因此,可以得到规律是随着气温的增加,热茶卖出的杯数在减少。但究竟以什么样的方式在减少呢?这就是今天要继续学习的内容——线性回归方程. 推进新课 新知探究

以横坐标x表示气温,纵坐标y表示热茶销量,建立平面直角坐标系,将表中数据构成的6个数对所表示的点在坐标系内标出,得到上图,今后我们称这样的图为散点图。 1。散点图(scatterplot):表示具有相关关系的两个变量的一组数据的图形叫做散点图。散点图形象地反映了各对数据的密切程度。粗略地看,散点分布具有一定的规律。在本图中这些点散布的位置也是值得注意的,它们散布在从左上角到右下角的区域,对于这种相关关系,我们称它为负相关.如果点散布在从左下角到右上角的区域.对于这种相关关系,我们称它为正相关. 请学生举例:两个变量之间是正相关的关系.例如:某小卖部卖的冷饮销售量与气温之间的关系. 再看上节课的练习 1.在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据: 如果作出散点图如右图,它是散布在从左下角到右上角的区域,也是正相关的关系. 回到解热茶销售量与气温之间的关系的散点图来,从图中可以得到规律是随着气温的增加,热饮的销售量在减少,究竟以什么样的方式减少呢? 分析:分布情况是在从左上角到右下角的区域的某条直线附近摆动。能画出这条直线吗?

高中数学选修2-3统计案例之线性回归方程习题课

1.相关关系的分类 从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关. 2.线性相关 从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线.3.回归方程 (1)最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法叫最小二乘法.(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(x n,y n),其回归方程为y^=b^x+a^,则b^,a^

其中,b是回归方程的斜率,a是在y轴上的截距. 4.样本相关系数 r= ∑ i=1 n (x i-x)(y i-y) ∑ i=1 n (x i-x)2∑ i=1 n (y i-y)2 ,用它来衡 量两个变量间的线性相关关系. (1)当r>0时,表明两个变量正相关; (2)当r<0时,表明两个变量负相关; (3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系. 5.线性回归模型

(1)y=bx+a+e中,a、b称为模型的未知参数;e称为随机误差. (2)相关指数 用相关指数R2来刻画回归的效果,其计算公式是:R2=,R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归效果越好. 规律 (1)函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系. 注意 (1)回归分析是对具有相关关系的两个变量

高中线性回归习题含答案

资料范本 本资料为word版本,可以直接编辑和打印,感谢您的下载 高中线性回归习题含答案 地点:__________________ 时间:__________________ 说明:本资料适用于约定双方经过谈判,协商而共同承认,共同遵守的责任与义务,仅供参考,文档可直接下载或修改,不需要的部分可直接删除,使用时请详细阅读内容

高二选修1—2线性回归习题 1. 独立性检验,适用于检查变量之间的关系 () A.线性 B.非线性 C.解释与预报 D.分类 2. 样本点的样本中心与回归直线的关系() A.在直线上 B.在直线左上方 C. 在直线右下方 D.在直线外 3 已知数列,则是这个数列的() A.第项 B.第项 C.第项 D.第项 4 用数学归纳法证明成立时,第二步归纳假设正确写法是() A.假设时命题成立 B.假设时命题成立 C.假设时命题成立 D.假设时命题成立 5 .确定结论“与有关系”的可信度为℅时,则随即变量的观测值必须() A.大于 B.小于 C.小于 D.大于 6.有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其横断面直径与高度之间的关系,其中有相关关系的是 ( ) A.①②③B.①②C.②③D.①③④ 7.在线性回归模型中,下列说法正确的是 A.是一次函数 B.因变量y是由自变量x唯一确定的

C.因变量y除了受自变量x的影响外,可能还受到其它因素的影响,这些因素会导致随机误差e的产生 D.随机误差e是由于计算不准确造成的,可以通过精确计算避免随机误差e的产生 8.对相关系数r,下列说法正确的是 ( ) A.越大,线性相关程度越大 B.越小,线性相关程度越大 C.越大,线性相关程度越小,越接近0,线性相关程度越大 D.且越接近1,线性相关程度越大,越接近0,线性相关程度越小 9.在独立性检验中,统计量有两个临界值:3.841和6.635;当>3.841时,有95%的把握说明两个事件有关,当>6.635时,有99%的把握说明两个事件有关,当3.841时,认为两个事件无关.在一项打鼾与患心脏病的调查中,共调查了2000人,经计算的=20.87,根据这一数据分析,认为打鼾与患心脏病之间 ( ) A.有95%的把握认为两者有关B.约有95%的打鼾者患心脏病 C.有99%的把握认为两者有关D.约有99%的打鼾者患心脏病 10.已知x与y之间的一组数据: 则y与x的线性回归方程为y=bx+a必过点 . 11.已知,且, 求证:与中至少有一个小于2 12. 如图是所在平面外一点,平面,是的中点,是上的点,。求证:. 13. 若,,求证: 14.在调查男女乘客是否晕机的情况中,已知男乘客晕机为28人,不会晕机的也是28人,而女乘客晕机为28人,不会晕机的为56人.

2021_2022学年高中数学课时分层作业8线性回归方程(含解析)苏教版必修3 (2)

课时分层作业(八) 线性回归方程 (建议用时:60分钟) [根底达标练] 一、选择题 1.以下两个变量之间的关系是相关关系的有( ) ①长方体的体积和长方体的棱长;②正n边形的边数和其内角和;③父亲的身高与儿子的身高;④光照时间和果树亩产量. A.①②B.①③ C.②③D.③④ D[①②是函数关系;关于③,一般来说父亲的身高高,儿子也不矮,两者之间具有相关关系;对于④,一般来说,光照时间越长,果树亩产量也越高,两者之间具有相关关系.] 2.图中各图反映了两个变量的某种关系,其中可以看作具有线性相关关系的有( ) A.①②B.①④ C.②③D.②④ B[图①④中的点的分布根本上集中在一个带状区域内,反映了两个变量之间存在相关关系,即当一个变量变化时,另一个变量的值虽然不能完全确定,但大体上总是落在带状区域内,我们可以寻找一条适宜的直线来近似表示两个变量之间的关系,因此这两个变量具有线性相关关系.图②中的点的分布根本上集中在由某条曲线两侧的带状区域内,表示两个变量有相关关系,但不是线性相关关系.图③表示两个变量之间有确定的关系,即函数关系.] 3.如图,有4组(x,y)数据,去掉一点后,剩下的3组数据的线性相关程度最大.那么去掉的点是( )

A .P 1 B .P 2 C .P 3 D .P 4 C [去掉P 3点后, 其余点大致在一条直线附近.] 4.x ,y 的取值如下表所示: 从散点图分析,y 与x 线性相关,且y x +a ,那么a =( ) B [回归直线必过样本中心点(x ,y ),且x =2,y =4.5,那么4.5=0.95×2+a , a =2.6.] 5.某地区调查了2岁~9岁的儿童的身高,由此建立的身高y (单位:cm)与年龄x (单位:岁)的线性回归方程为y ^ x +60.13,那么以下表达中正确的选项是 ( ) A .该地区一个10岁儿童的身高为142.63 cm B .该地区2岁~9岁的儿童每年身高约增加8.25 cm C .该地区9岁儿童的平均身高是134.38 cm D .利用这个模型可以准确地预算该地区每个儿童(2岁~9岁)的身高 B [根据回归分析的意义知该地区一个10岁儿童的身高只能估计为142.63 cm ;该地区9岁儿童的平均身高不一定是134.38 cm ,且利用这个模型只能近似地预算该地区每个2岁~9岁儿童的身高.所以只有B 正确.] 二、填空题 6.三点(3,10),(7,20),(11,24)的横坐标x 与纵坐标y 具有线性关系,那么其线性回归方程是________. y ^ =7 4x +234 [根据线性回归方程系数公式计算.] 7.一个回归直线方程为y ^ =2.5-3x ,那么当变量x 平均增加1个单位时,变量y 的变化情况是________. 平均减少3个单位 [由回归直线方程知斜率k =-3,所以当x 平均增加1个单位时,y 平均减少3个单位.] 8.回归直线斜率的估计值为3,样本点的中心为(4,5),那么回归直线方程为________. y ^ =3x -7 [由题意知回归直线方程为y ^ =3x +a ,将(4,5)代入方程得5=3×4+a ,解得

2019-2020学年高一数学苏教版必修3同步练习:2.4 线性回归方程 Word版含答案

2.4 线性回归方程 1、某产品的广告费用x 与销售额y 的统计数据如下表: 根据上表可得回归方程ˆˆˆy bx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为( ) A. 63.6万元 B. 65.5万元 C. 67.7万元 D. 72.0万元 2、某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查,y 与x 具有相关关系,回归方程为0.66.52ˆ16y x =+,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为( ) A.83% B.72% C.67% D.66% 3、变量X 与Y 相对应的一组数据为()()()()()10,1,11.3,2,11.8,3,12.5,4,13,5,变量U 与V 相对应的一组数据为()()()()()10,5,11.3,4,11.8,3,12.5,2,13,1.1r 表示变量X 与Y 之间的线性相关系数,2r 表示变量V 与U 之间的线性相关系数,则( ) A.210r r << B.210r r << C.210r r << D.21r r = 4、四名同学根据各自的样本数据研究变量,x y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论: ①y 与x 负相关且 2.34.4ˆ7623y x =-; ②y 与x 负相关且 3.476 5.6ˆ48y x =-+; ③y 与x 正相关且 5.43.4ˆ7893y x =+; ④y 与x 正相关且 4.326 4.5ˆ78y x =--. 其中一定不正确的结论的序号是( ) A.①② B.②③ C.③④ D.①④ 5、已知变量x 与y 正相关,且由观测数据算得样本平均数3x =, 3.5y =,则由该观测数据算得的线性回归方程可能为( )

人教版高中数学(理科)选修线性回归(二)

线性回归〔二〕 教学目的: 1 进一步熟悉回归直线方程的求法 2.加深对回归直线方程意义的理解 3. 增强学生应用回归直线方程解决相关实际问题的意识 掌握样本相关系数显著性检验的方法 教学重点:准确求出回归直线方程 教学难点:样本相关系数显著性检验的方法 授课类型:新授课 课时安排:1课时 教 具:多媒体、实物投影仪 教学过程: 一、复习引入: 1.相关关系的概念 当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系 相关关系是非随机变量与随机变量之间的关系,函数关系是两个非随机变量之间的关系,是一种因果关系,而相关关系不一定是因果关系,所以相关关系与函数关系不同,其变量具有随机性,因此相关关系是一种非确定性关系 〔有因果关系,也有伴随关系〕.因此,相关关系与函数关系的异同点如下: 相同点:均是指两个变量的关系 不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系. 2.回归分析: 对具有相关关系的两个变量进行统计分析的方法叫做回归分析 通俗地讲,回归分析 是寻找相关关系中非确定性关系的某种确定性 3.散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图.散点图形象地反映了各对数据的密切程度 粗略地看,散点分布具有一定的规律 4. 回归直线 设所求的直线方程为,^ a bx y +=,其中a 、 b 是待定系数. 11 22211()()()n n i i i i i i n n i i i i x x y y x y nxy b x x x nx a y bx ====⎧ ---⎪ ⎪==⎨--⎪⎪ =-⎩∑∑∑∑, ∑==n i i x n x 11,∑==n i i y n y 11 相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析 二、讲解新课: 1.相关系数:相关系数是因果统计学家皮尔逊提出的,对于变量y 与x 的一组观测值,把 ∑∑∑===----= n i n i i i n i i i y y x x y y x x r 1 1 221 )()() )((= ∑∑∑===---n i n i i i n i i i y n y x n x y x n y x 1 1 22221 ) )(( 叫做变量y 与x 之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度. 2.相关系数的性质: r ≤1,且r 越接近1,相关程度越大;且r 越接近0,相关程度越小.

高考数学一轮复习专题05 回归直线方程(解析版)

概率与统计 专题五:回归直线方程 一、知识储备 1.两个变量线性相关 (1)散点图:将样本中n 个数据点(,)i i x y (i =1,2,…,n )描在平面直角坐标系中得到的图形. (2)正相关与负相关 ①正相关:散点图中的点散布在从左下角到右上角的区域. ②负相关:散点图中的点散布在从左上角到右下角的区域. 2.回归直线的方程 (1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. (2)回归方程:回归直线对应的方程叫回归直线的方程,简称回归方程. (3)回归方程的推导过程: ①假设已经得到两个具有线性相关关系的变量的一组数据11(,)x y ,22(,)x y ,33(,)x y (,)n n x y . ②设所求回归方程为y bx a =+,其中,a b 是待定参数. ③由最小二乘法得 1 12 2 2 1 1 ()() ,()n n i i i i i i n n i i i i x x y y x y nx y b a y bx x x x nx ====---= = =---∑∑∑∑ 其中,b 是回归方程的斜率,a 是截距. 二、例题讲解 1.(2022·哈尔滨市呼兰区第一中学校高三模拟预测(文))十三届全国人大三次会议表决通过了《中华人民共和国民法典》这部法律自2021年1月1日起施行,某市相关部门进行法律宣传,某宣传小分队记录了前5周每周普及宣传的人数与时间的数据,得到下表: (1)若可用线性回归模型拟合y 与x 的关系,求y 关于x 的线性回归方程; (2)利用(1)的回归方程,预测该宣传小分队第7周普及宣传(民法典)的人数.

高中数学必修三线性回归方程

统计第三讲:变量间的相关关系 —————————————————————————————————————————————— 一、两个变量的线性相关 1、线性回归方程:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线,回归直线对应的方程叫做回归直线方程(简称回归方程)。 2、回归方程求法:设已经得到两个具有线性相关关系的变量的一组数据1122(,),(,),,(,)n n x y x y x y ⋅⋅⋅,直线方程y bx a =+,其中,a b 是待定参数. 经数学上的推导,,a b 的值由下列公式给出:1 1222 11 ()()()n n i i i i i i n n i i i i x x y y x y nx y b x x x nx a y bx ====⎧ ---⎪ ⎪==⎪⎨--⎪⎪ =-⎪⎩∑∑∑∑. 其中,回归直线的斜率为b ,截距为a ,即回归方程为y bx a =+. 上述求回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. 3、回归方程应用:利用回归方程,我们可以进行预测并对总体进行估计. —————————————————————————————————————————————— 二、相关关系的强弱 1、相关系数:若相应于变量x 的取值i x ,变量y 的观测值为(1)i y i n ≤ ≤,则变量x 与y 的相关系数 ()() n i i x x y y r --= ∑,即n i i x y nx y r -= ∑, 2、通常用r 来衡量x 与y 之间的线性关系的强弱 (1)r 的范围为11r -≤≤,r 为正时,x 与y 正相关;r 为负时,x 与y 负相关 (2)||r 越接近于1,x 与y 的相关程度越大;当||1r =时,所以数据点都在一条直线上. (3)||r 越接近于0,二者的相关程度越小 ——————————————————————————————————————————————

高中数学 2.4 线性回归方程(第1课时)教案 新人教版必修3

江苏省常州市西夏墅中学高中数学 2.4 线性回归方程(第1课时)教 案新人教版必修3 教学目标: 1. 通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系; 2. 在两个变量具有线性相关关系时,会在散点图中作出线性直线,会用线性回归方程进行预测; 3. 知道最小二乘法的含义,知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程,了解(线性)相关系数的定义. 教学重点: 散点图的画法,回归直线方程的求解方法. 教学难点: 回归直线方程的求解方法. 教学方法: 引导发现、合作探究. 教学过程: 一、创设情景,揭示课题 客观事物是相互联系的.过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系.比如说:某某同学的数学成绩与物理成绩,彼此是互相联系的,但不能认为数学是“因”,物理是“果”,或者反过来说事实上数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度.所以说,函数关系存在着一种确定性关系,但还存在着另一种非确定性关系——相关关系. 二、学生活动 提出问题:两个变量之间的常见关系有几种? (1)确定性的函数关系,变量之间的关系可以用函数表示; (2)相关关系,变量之间有一定的联系,但不能完全用函数来表示. 说明:不要认为两个变量间除了函数关系,就是相关关系,事实是,两个变量间可能毫

无关系.比如地球运行的速度与某个人的行走速度就可认为没有关系. 某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对照表: 如果某天的气温是5-0 C ,你能根据这些数据预测这天小卖部卖出热茶的杯数吗? 从下图可以看出,这些点散布在一条直线的附近,故可用一个线性函数近似地表示热茶销量与气温之间的关系. 选择怎样的直线近似地表示热茶销量与气温之间的关系? 我们有多种思考方案: (1)选择能反映直线变化的两个点,例如取(4,50),(18,24)这两点的直线; (2)取一条直线,使得位于该直线一侧和另一侧的点的个数基本相同; (3)多取几组点,确定几条直线方程,再分别算出各条直线斜率、截距的平均值,作为所求直线的斜率、截距; …… 怎样的直线最好呢? 三、建构数学 1.最小平方法: 用方程为ˆy bx a =+的直线拟合散点图中的点,应使得该直线 与散点图中的点最接近.那么,怎样衡量直线ˆy bx a =+与图中六 个点的接近程度呢? 我们将表中给出的自变量x 的六个值带入直线方程,得到相应的六个ˆy 的值: 26,18,13,10,4,b a b a b a b a b a b a +++++-+.这六个值与表中相应的实际值应该越 接近越好.所以,我们用类似于估计平均数时的思想,考虑离差的平方和 22222 2 (,)(2620)(1824)(1334)(1038)(450)(64) Q a b b a b a b a b a b a b a =+-++-++-++-++-+-+- 21286b =26140382046010172a ab b a ++--+

高中数学专题训练(教师版)—线性回归

高中数学专题训练(教师版)—线性回归 一、选择题 1.实验测得四组(x ,y )的值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的回归直线方程为( ) A.y ^ =x +1 B.y ^ =x +2 C.y ^ =2x +1 D.y ^ =x -1 答案 A 解析 画出散点图,四点都在直线y ^ =x +1. 2.下列有关样本相关系数的说法不正确的是( ) A .相关系数用来衡量变量x 与y 之间的线性相关程度 B .|r |≤1,且|r |越接近于1,相关程度越大 C .|r |≤1,且|r |越接近0,相关程度越小 D .|r |≥1,且|r |越接近1,相关程度越小 答案 D 3.由一组样本(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到的回归直线方程y ^ =a +bx ,下面有四种关于回归直线方程的论述: (1)直线y ^ =a +bx 至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点; (2)直线y ^=a +bx 的斜率是 ∑n i =1x i y i -n x y ∑n i =1x 2i -n x 2 ; (3)直线y ^ =a +bx 必过(x ,y )点; (4)直线y ^=a +bx 和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差∑n i =1 (y i -a -bx i )2是该坐标平面上所有的直线与这些点的偏差中最小的直线. 其中正确的论述有( ) A .0个 B .1个 C .2个 D .3个 答案 D 解析 线性回归直线不一定过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的任何一点;b = ∑n i =1x i y i -n x y ∑n i =1x 2i -n x 2 就是线性回归直线的斜率,也就是回归系数;线性回 归直线过点(x ,y );线性回归直线是平面上所有直线中偏差∑n i =1 (y i -a -bx i )2取得最小的那一条.故有三种论述是正确的,选D. 4.设两个变量x 和y 之间具有线性相关关系,它们的相关系数是r ,y 关于x 的回归直线的斜率是b ,纵截距是a ,那么必有( ) A .b 与r 的符号相同 B .a 与r 的符号相同 C .b 与r 的符号相反 D .a 与r 的符号相反

新教材高中数学第4章第1课时相关关系与回归直线方程学案含解析新人教B版选择性必修第二册

新教材高中数学新人教B版选择性必修第二册: 4.3 统计模型 4.3.1一元线性回归模型 第1课时相关关系与回归直线方程 学习任务核心素养 1.了解变量间的相关关系.(易混点) 2.会根据散点图判断数据是否具有相关关系.(重点) 3.了解最小二乘法的思想,会求回归直线方程,掌握回归方程的性质.(重点、难点)1.通过回归直线方程及相关关系的学习,体会数学建模与直观想象的素养. 2.借助回归直线方程的求法,培养数学运算的素养. 你知道“名师出高徒”的意思吗?——高明的师傅很可能教出技艺高的徒弟,比喻学识丰富的人对于培养人才的重要.也就是说,高水平的老师往往能教出高水平的学生.问题:那么老师的水平与学生的水平之间具有怎样的关系呢?这种关系是确定的吗?该关系与函数关系相同吗? [提示]老师的水平与学生的水平之间具有相关性,一般而言,高水平的老师教出高水平的学生的可能性更大;但两者之间虽然具有相关性,却不具备确定性,这种关系是不确定的.不相同. 知识点1相关关系 如果两个变量之间确实有一定的关系,但没有达到可以互相决定的程度,它们之间的关系带有一定的随机性,像这样两个变量之间的关系,统计学上称为相关关系. 1.函数关系是相关关系吗? [提示]不是.函数关系中两个变量之间是一种确定关系. 1.下列两个变量中,具有相关关系的是() A.正方体的体积与棱长 B.匀速行驶的汽车的行驶路程与时间

C .人的身高与体重 D .人的身高与视力 C [A 选项中,正方体的体积与棱长是函数关系,不是相关关系; B 选项中,匀速行驶的汽车的行驶路程与时间是函数关系,不是相关关系; C 选项中,人的身高会影响体重,但不是唯一因素,所以人的身高与体重是相关关系; D 选项中,人的身高与视力无任何关系.] 知识点2 线性相关 (1)散点图 一般地,如果收集到了变量x 和变量y 的n 对数据(简称为成对数据),如下表所示. 序号i 1 2 3 … n 变量x x 1 x 2 x 3 … x n 变量y y 1 y 2 y 3 … y n 则在平面直角坐标系xOy 中描出点(x i ,y i ),i =1,2,3,…,n ,就可以得到这n 对数据的散点图. (2)线性相关:如果由变量的成对数据、散点图或直观经验可知,变量x 与变量y 之间的关系可以近似地用一次函数来刻画,则称x 与y 线性相关. (3)正相关和负相关 若x 与y 线性相关,如果一个变量增大,另一个变量大体上也增大,则称这两个变量正相关;如果一个变量增大,另一个变量大体上减少,则称这两个变量负相关. 2.下列两个变量具有正相关关系的是( ) A .正方形的面积与边长 B .吸烟与健康 C .数学成绩与物理成绩 D .汽车的重量与汽车每消耗1 L 汽油所行驶的平均路程 C [正方形的面积与边长是函数关系,A 错误;吸烟与健康具有负相关关系,B 错误;汽车越重,每消耗1 L 汽油所行驶的平均路程越短,所以汽车的重量与汽车每消耗1 L 汽油所行驶的平均路程具有负相关关系, D 错误;数学成绩越好,物理成绩也会越好,所以数学成绩与物理成绩具有正相关关系,C 正确.] 知识点3 回归直线方程 一般地,已知变量x 与y 的n 对成对数据(x i ,y i ),i =1,2,3,…,n .任意给定一个一次函数y =bx +a ,对每一个已知的x i ,由直线方程可以得到一个估计值y ^ i =bx i +a ,如果一次函数y ^=b ^x +a ^能使(y 1-y ^1)2+(y 2-y ^2)2+…+(y n -y ^n )2=∑n i =1 (y i -y ^i )2取得最小值,则y ^=b ^x +a ^ 称为y 关于x 的回归直线方程(对应的直线称为回归直线).因为是使得平方和最小,所以其中涉及的

(word完整版)高中数学必修三课后答案

1.3算法案例 练习(P45) 1、(1)45; (2)98; (3)24; (4)17. 2、2881.75. 3、2200811111011000=() ,820083730=() 习题1.3 A 组(P48) 1、(1)57; (2)55. 2、21324. 3、(1)104; (2)7212() (3)1278; (4)6315(). 4、 习题1.3 B 组(P48) 1、算法步骤:第一步,令45n =,1i =,0a =,0b =,0c =.

第二步,输入()a i . 第三步,判断是否0()60a i ≤<. 若是,则1a a =+,并执行第六步. 第四步,判断是否60()80a i ≤<. 若是,则1b b =+,并执行第六步. 第五步,判断是否80()100a i ≤≤. 若是,则1c c =+,并执行第六步. 第六步,1i i =+. 判断是否45i ≤. 若是,则返回第二步. 第七步,输出成绩分别在区间[0,60),[60,80),[80,100]的人数,,a b c . 2、如“出入相补”——计算面积的方法,“垛积术”——高阶等差数列的求和方法,等等. 第二章 复习参考题A 组(P50) 1、 (1)程序框图: 程序: 1、 (2)程序框图: 程序: INPUT “x=”;x IF x<0 THEN y=0 ELSE IF x<1 THEN y=1 ELSE y=x END IF END IF PRINT “y=”;y END INPUT “x=”;x IF x<0 THEN y=(x +2)^2 ELSE IF x=0 THEN y=4 ELSE y=(x -2)^2 END IF END IF PRINT “y=”;y END

相关文档
最新文档