高中数学复习概率统计题型归纳与讲解01 线性回归方程

高中数学复习概率统计题型归纳与讲解

专题1线性回归方程

例1.蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率x (每分钟鸣叫的次数)与气温y (单位:C)︒存在着较强的线性相关关系.某地观测人员根据如表的观测数据,建立了y 关于x 的线性回归方程ˆˆ0.25y

x =+,则当蟋蟀每分钟鸣叫56次时,该地当时的气温预报值为()

A .33C ︒

B .34

C ︒C .35C ︒

D .35.5C ︒ 【解析】解:由题意,得2030405060

405

x ++++==,

2527.52932.536

305

y ++++=

=,

则0.25300.254020y x =-=-⨯=; 当56x =时,ˆ34y

=. 故选:B .

例2.已知下列说法:

①对于线性回归方程ˆ35y

x =-,变量x 增加一个单位时,ˆy 平均增加5个单位; ②在线性回归模型中,相关指数2R 越接近于1,则模型回归效果越好; ③两个随机变量的线性相关性越强,则相关系数就越接近1; ④互斥事件不一定是对立事件,对立事件一定是互斥事件; ⑤演绎推理是从特殊到一般的推理,它的一般模式是“三段论”.

其中说法错误的个数为() A .1B .2C .3D .4

【解析】解:①对于线性回归方程ˆ35y

x =-,变量x 增加一个单位时,ˆy 平均减少5个单位,故①不正确;

②在线性回归模型中,相关指数2R 越接近于1,则模型回归效果越好,故②正确; ③两个随机变量的线性相关性越强,则相关系数的绝对值就越接近1,故③不正确; ④互斥事件不一定是对立事件,对立事件一定是互斥事件,所以④正确; ⑤演绎推理是从一般到特殊的推理,它的一般模式是“三段论”.所以⑤不正确; 故选:C .

例3.变量x ,y 之间的一组相关数据如表所示:若x ,y 之间的线性回归方程为ˆˆ12.28y bx =+,则ˆb

的值为()

A .0.92-

B .0.94-

C .0.96-

D .0.98-

【解析】解:4567

5.54

x +++==,8.27.8 6.6 5.4

74

y +++=

=,

则样本点的中心的坐标为(5.5,7), 代入ˆˆ12.28y bx =+,得ˆ7 5.512.28b =+, 则ˆ0.96b

=-. 故选:C .

例4.我国5G 技术研发试验在20162018-年进行,分为5G 关键技术试验、5G 技术方案验证和5G 系统验证三个阶段实施.2020年初以来,5G 技术在我国已经进入高速发展的阶段,5G 手机的销量也逐

渐上升,某手机商城统计了近5个月来5G手机的实际销量,如表所示:

若y与x线性相关,且求得线性回归方程为ˆ455

y x

=+,则下列说法正确的是() A.142

a=

B.y与x正相关

C.y与x的相关系数为负数

D.12月份该手机商城的5G手机销量约为365部

【解析】解:根据表中数据,可得

12345

3

5

x

++++

==,

∴4535140

y=⨯+=,

于是,50961852271405700

a

++++=⨯=,即142

a=,故A正确;

由回归方程中x的系数大于0,可知y与x正相关,且相关系数0

r>,故B正确,C错误;12月份时,7

x=,ˆ4575320

y=⨯+=部,故D错误.

故选:AB.

例5.已知x与y之间的一组数据:

已求得关于y与x的线性回归方程ˆ 2.30.85

y x

=+,则m的值为0.5.

【解析】解:

01233

42

x

+++

==,

3 5.5715.5

44

m m

y

++++

==,

∴这组数据的样本中心点是

315.5 (,) 24

m+

关于y 与x 的线性回归方程ˆ 2.10.85y

x =+, ∴

15.53

2.10.8542

m +=⨯+,解得0.5m =, m ∴的值为0.5.

故答案为:0.5.

例6.邢台市物价部门对市区的天一城、北国商城、恒大城、家乐园、中北世纪城5家商场的某件商品在7月15号一天销售量及其价格进行调查,5家商场的售价x 元和销售量y 件之间的一组数据如表所示:

已知销售量y 与价格x 之间有较强的线性相关关系,其线性回归方程是ˆ 3.240y x =-+,且20m n +=,

则其中的m =10. 【解析】解:依题意4030,55m n x y ++=

=,代入回归直线方程得30403.24055

n m

++=-⨯+①,根据

题意20m n +=②,解①②组成的方程组得10m n ==, 故答案为:10. 例7.已知一组数据点:

用最小二乘法得到其线性回归方程为ˆ24y x =-+,若数据1x ,2x ,⋯,8x 的平均数为1,

则8

1

i i y ==∑16. 【解析】解:由题意,1x =,设样本点的中心为(1,)y , 又线性回归方程为ˆ24y

x =-+,则2142y =-⨯+=, ∴8

18216i i y ==⨯=∑.

故答案为:16.

例8.垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成分复杂多样,且具有污染性,所以需要无害化、减量化处理.某市为调査产生的垃圾数量,采用简单随机抽样的方法抽取20个县城进行了分析,得到样本数据(i x ,)(1i y i =,2,⋯⋯,20),其中i x 和i y 分别表示第i 个县城的人口(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得20

180i i x ==∑,2014000i i y ==∑,20

21

()80i i x x =-=∑,

20

2

1

()8000i

i y

y =-=∑,20

1

()()7000i i i x x y y =--=∑.

(1)请用相关系数说明该组数据中y 与x 之间的关系可用线性回归模型进行拟合; (2)求y 关于x 的线性回归方程;

(3)某科研机构研发了两款垃圾处理机器,如表是以往两款垃圾处理机器的使用年限(整年)统计表:

某环保机构若考虑购买其中一款垃圾处理器,以使用年限的频率估计概率.根据以往经验估计,该机构选择购买哪一款垃圾处理机器,才能使用更长久?

参考公式:相关系数()()

n

i

i x

x y y r --=

对于一组具有线性相关关系的数据(i x ,)(1i y i =,2,⋯⋯,)n ,其回归直线ˆˆˆy

bx a =+的斜率和截距

的最小二乘估计分别为:1

2

1

()()

ˆ()

n

i

i

i n

i

i x x y

y b

x x ==--=-∑∑,ˆˆa

y bx =-. 【解析】解:(1

)由题意知相关系数20

()()

7

0.8758

i

i x

x y y r --=

=

=

=∑, 因为y 与x 的相关系数接近1,

所以y 与x 之间具有较强的线性相关关系,可用线性回归模型进行拟合.

(2)由题意可得,

20

1

20

2

1

()()

700

ˆ8.7580

()i

i i i

i x

x y y b

x

x ==--==

=-∑∑,

400080ˆˆ8.752008.7541652020

a

y bx =-=-⨯=-⨯=, 所以ˆ8.75165y

x =+. (3)以频率估计概率,购买一台甲款垃圾处理机器节约政府支持的垃圾处理费用X (单位:万元)的分布列为

()500.100.4500.31000.230E X =-⨯+⨯+⨯+⨯=(万元)

购买一台乙款垃圾处理机器节约政府支持的垃圾处理费用Y (单位:万元)的分布列为:

()300.3200.4700.21200.125E Y =-⨯+⨯+⨯+⨯=(万元)

因为()()E X E Y >,所以该县城选择购买一台甲款垃圾处理机器更划算.

例9.近年来,高铁的发展逐渐改变了人们的出行方式,我国20152019-年高铁运营里程的数据如表

所示.

(Ⅰ)求y 关于x 的线性回归方程;

(Ⅱ)每一年与前一年的高铁运营里程之差即为该年新增的里程,若用2016~2019年每年新增里程的频率代替之后每年新增相应里程的概率,求2023年中国高铁运营里程大于或等于5万千米的概率.

附:线性回归方程ˆˆˆy a bx =+中斜率和截距的最小二乘估计公式分别为:1

2

2

1

ˆn

i i

i n

i

i x y

nxy b

x

nx ==-=-∑∑,

ˆˆa y bx =-. 【解析】解:(Ⅰ)1(12345)35x =⨯++++=,1

(1.9 2.2 2.5 2.9 3.5) 2.65

y =⨯++++=,

5

11 1.92 2.23 2.54 2.95 3.542.9i i

i x y

==⨯+⨯+⨯+⨯+⨯=∑,

5

2

1

149162555i

i x

==++++=∑,

∴2

42.953 2.6

ˆ0.395553

b

-⨯⨯==-⨯, ˆ 2.60.393 1.43a

=-⨯=. y ∴关于x 的线性回归方程为:ˆ0.39 1.43y

x =+. (Ⅱ)设每年新增高铁运营里程为x 万千米,由条件知X 的分布列为:

若2023年中国高铁运营里程小于5万平方千米,

则2020~2023年每年新增的高铁运营里程有三种情况:0.34⨯,0.330.4⨯+,0.320.42⨯+⨯,

相应的概率为4132

2244111119()()()()2242432P C C =+⨯⨯+⨯⨯=

. 2023∴年中国高铁运营里程大于或等于5万千米的概率为

9

32

. 例10.某地区2013年至2019年居民纯收入y (单位:千元)的部分数据如表所示:

2018和2019年的居民纯收入y (单位:千元)数据采用随机抽样的方式获得,用样本的均值来代替当年的居民人均纯收入,其数据如下:

2018年抽取的居民纯收入(单位:千元)数据:5.2 4.8 6.5 5.6 6.0 7.1 6.1 7.3 5.9 7.5 2019年抽取的居民纯收入(单位:千元)数据:6.2 7.8 6.6 5.8 7.1 6.8 7.2 7.9 5.9 7.7 (Ⅰ)求y 关于t 的线性回归方程;

(Ⅱ)当地政府为了提高居民收入水平,现从2018和2019年居民纯收入(单位:千元)高于7.0千元的样本中随机选择3人进行座谈,了解其工作行业及主要收入来源.设X 为选出的3人中2018年纯收入高于7.0千元的人数,求随机变量X 的分布列和数学期望.

附:回归直线的斜率和截距的最小二乘法估计公式分别为:21

2

1

()()

ˆ()n

i i i n

i

i t

t y y b

t

t ==--=-∑∑,ˆˆa

y bt =-. 【解析】解:(Ⅰ)根据2018年的抽样数据可得2018年的人均纯收入为1

(5.2 4.8 6.5 5.6 6.07.1 6.17.3 5.97.5) 6.210

+++++++++=千元, 根据2019年的抽样数据可得2019年的人均纯收入为

1

(6.27.8 6.6 5.87.1 6.87.27.9 5.97.75) 6.910

+++++++++=千元,

由所给的数据得1

(1234567)47t =++++++=,

1

(3.9 4.3 4.6 5.4 5.8 6.2 6.9) 5.37

y =++++++=,

∴7

21()941014928i i t t =-=++++++=∑,

7

1

()()(3)( 1.4)(2)(1)(1)(0.7)00.110.520.93 1.614i

i i t

t y y =--=-⨯-+-⨯-+-⨯-+⨯+⨯+⨯+⨯=∑,

∴7

1

7

2

1

()()

14

ˆ0.528

()i

i i i

i t

t y y b

t

t ==--==

=-∑∑, 则ˆˆ 5.30.54 3.3a

y bt =-=-⨯=, 则所求y 关于t 的线性回归方程为ˆ0.5 3.3y

t =+; (Ⅱ)由2018年和2019年的抽样数据可知,2018年居民纯收入高于7.0千元的有3人,2019年居民纯收入高于7.0千元的有5人,

由题意可得,随机变量X 的可能取值为0,1,2,3,

则35385

(0)28C P X C ===,12

353815(1)28

C C P X C ===,

21353815(2)56C C P X C ===,33381

(1)56

C P X C ===,

∴随机变量X 的分布列为则X 的分布列为:

则5151519()0123282856568

E X =⨯

+⨯+⨯+⨯= 例11.为了缓解日益拥堵的交通状况,不少城市实施车牌竞价策略,以控制车辆数量.某地车牌竞价的基本规则是:

①“盲拍”,即所有参与竞拍的人都是网络报价,每个人不知晓其他人的报价,也不知道参与当期竞拍的总人数;②竞价时间截止后,系统根据当期车牌配额,按照竞拍人的出价从高到低分配名额.某人拟参加2020年12月份的车牌竞拍,他为了预测最低成交价,根据竞拍网站的公告.统计了最近5个月参与竞拍的人数(见表):

(1)由收集数据的散点图发现1可用线性回归模型拟合竞拍人数y (万人)与月份编号t 之间的相关

关系.请用最小二乘法求y 关于t 的线性回归方程:ˆˆˆy

bt a =+,并预测2020年12月份参与竞拍的人数.

(2)某市场调研机构对200位拟参加2020年12月份车牌竞拍人员的报价价格进行了一个抽样调查,得到如下的一份频数表:

(ⅰ)求这200为竞拍人员报价X 的平均数值x 和样本方差2s (同一区间的报价可用该价格区间的中点值代替);

(ⅱ)假设所有参与竞价人员的报价X

可视为服从正态分布2(,)N μσ,且μ与2σ可分别由(ⅰ)中所求的样本平均数x 及2s 估值.若2020年12月份实际发放车牌数量是3174,请你合理预测(需说明理由)竞拍的最低成交价.

参考公式及数据:①回归方程ˆˆˆy

bx a =+,其中1

2

2

1

ˆn

i

i

i n

i

i x y

xy

b x

nx ==-=-∑∑,ˆˆa

y bx =-; ②55

2

1

1

55, 1.3i i i i i t t y ====∑∑;

③若随机变量Z 服从正态分布2(,)N μσ,则()0.6826P Z μσμσ-<<+=,(22)0.9544P Z μσμσ-<<+=,(33)0.9974P Z μσμσ-<<+=.

④方差2

2

211

1()()n n

i i i i i S x x x x P n ===-=-∑∑.

【解析】解:(1)由题意得1234535t ++++=

=,0.50.611 1.7

1.045

y ++++==,

5

5

2

1

1

55,18.8i

i i i i t

t y ====∑∑,

∴1

2

2

2

1

18.853 1.04

ˆ0.325553n

i

i

i n

i

i x y

xy

b

x

nx ==--⨯⨯==

=-⨯-∑∑,

ˆˆ 1.040.3230.08a

y bx =-=-⨯=, y ∴关于t 的线性回归方程为ˆ0.320.08y

t =+.

当6t =时,ˆ0.3260.082y

=⨯+=. ∴预测2020年12月份参与竞拍的人数为2万人.

(2)()i 依题意可得这200人报价的平均值为:

1.50.1

2.50.3

3.50.3

4.50.15

5.50.1

6.50.05 3.5x =⨯+⨯+⨯+⨯+⨯+⨯=.

这200人报价的方差为:

2222222(1.5 3.5)0.1(2.5 3.5)0.3(3.5 3.5)0.3(4.5 3.5)0.15(5.5 3.5)0.1(6.5 3.5)0.05 1.7S =-⨯+-⨯+-⨯+-⨯+-⨯+-⨯=.

()2020ii 年12月份实际发放车牌数量是3174,

根据竞价规则,报价在最低成交价以上人数占总人数比例为3174

100%15.87%20000

⨯=, 根据假设报价X 可视为服从正态分布2(,)N μσ,

3.5μ=,2 1.7σ=

, 1.3σ=≈,

1()

()0.15872

P x P x μσμσμσ--<<++=

=,

( 4.8)0.1587P X ∴=,

∴预测竞拍的最低成交价为4.8万元.

例12.某医疗专家组为了研究新冠肺炎病毒在特定环境下一周内随时间变化的繁殖情况,得到如下的实验数据:

(1)由如表数据可知,可用线性回归模型拟合y 与t 的关系,求y 关于t 的线性回归方程; (Ⅱ)若由线性回归方程得到的估计数据与实验数据的误差不超过0.5,则该实验数据是“理想数据”,现从实验数据中随机抽取3个,求“理想数据”的个数X 的分布列和数学期望.

参考公式:回归方程ˆˆˆy

bt a =+中斜率和截距的最小二乘估计公式分别为1

2

1

()()

ˆ()n

i

i i n

i

i t

t y y b t

t ==--=-∑∑,

ˆˆa

y bt =-. 【解析】解:(Ⅰ)由题意,4t =,3y =,

7

1

107i i

i t y

==∑,7

21

140i i t ==∑,

∴7

1

7

2

2

1

71078423

ˆ14011228

7i

i

i i

i t y

ty

b

t

t ==--===--∑∑,

232ˆˆ34287a

y bt =-=-⨯=-. y ∴关于t 的线性回归方程为232

ˆ287

y

t =-; (Ⅱ)由题意将估计数据与实验数据列表:

由列表和题意可知该实验数据为“理想数据”的有5个, 故X 的所有可能取值为1,2,3.

12523

71

(1)7

C C P X C ===, 21523

74

(2)7

C C P X C ===,

35372

(3)7

C P X C ===.

∴“理想数据”个数X 的分布列为:

则14215

()1237777

E X =⨯+⨯+⨯=.

例13.在线教育的发展,有利于弥补乡村教育短板,为我国各地区教育均衡发展提供了条件.2019年《政府工作报告》明确提出发展“互联网+教育”促进优质资源共享.下面是20152019-年我国在线教育网络使用率的统计表:

其散点图如图:

设日期代码2017x t =-.

(Ⅰ)求y 关于x 的线性回归方程;

(Ⅱ)根据线性回归方程,预测2025年我国在线教育网络使用率约达到多少?

附:回归直线ˆˆˆy

bx a =+中斜率和截距的最小二乘估计公式:1

1

2

2

2

1

1

()()

ˆ()n

n

i

i i i

i i n

n

i

i

i i x

x y y x y

nx y

b x

x x

nx ====---==

--∑∑∑∑,ˆˆa

x bx =-. 【解析】解:(Ⅰ)由2017x t =-,得5组对应数据为(2,16)-,(1,18.8)-,(0,20.1),(1,24.3),(2,27.2), 则1

[2(1)012]05

x =-+-+++=,

1

(1616.820.124.327.2)21.285

y =++++=,

求出521

10i i x ==∑,5

1

27.9i i i x y ==∑,

所以:1

1

2

2

2

2

1

1

()()

27.95021.28

ˆ 2.791050()n

n

i

i i i

i i n

n

i

i

i i x

x y y x y

nx y

b

x

x x

nx ====----⨯⨯==

==-⨯--∑∑∑∑,

ˆˆ21.28 2.79021.28a

x bx =-=-⨯=, 所以y 关于x 的线性回归方程为ˆˆˆ 2.7921.28y

bx a x =+=+. (Ⅱ)当2025t =时,202520178x =-=, 此时ˆ 2.79821.2843.6y

=⨯+=, 所以预测2025年我国在线教育网络使用率约达到43.6%.

例14.学校食堂统计了最近5天到餐厅就餐的人数x (百人)与食堂向食材公司购买所需食材(原材

料)的数量y (袋),得到如下统计表:

(1)根据所给的5组数据,求出y 关于x 的线性回归方程ˆˆˆy y

bx a ==+; (2)已知购买食材的费用C (元)与数量y (袋)的关系为40020,036()

380,36()

y y x N C y y y N -<<∈⎧=⎨∈⎩,投入使

用的每袋食材相应的销售单价为700元,多余的食材必须无偿退还食材公司,据悉下周一大约有1500人到食堂餐厅就餐.根据(1)中求出的线性回归方程,预测食堂应购买多少袋食材,才能获得最大利润,最大利润是多少?(注:利润L =销售收入-原材料费用)

参考公式:1

1

2

22

1

1

()()

ˆ()n

n

i

i i i

i i n

n

i

i

i i x

x y y x y

nxy b

x

x x

nx ====---==

--∑∑∑∑,ˆˆa

y bx =-. 参考数据:51

1343i i i x y ==∑,5

2

1

558i

i x ==∑,5

21

3237i i y ==∑.

【解析】解:(1)由所给数据可得:13981012

10.45

x ++++==,

3223182428

255

y ++++=

=,

5

1

5

2

2

2

1

51343510.425

ˆ 2.555851045i i

i i

i x y

xy

b

x

x ==--⨯⨯===-⨯-∑∑,

ˆˆ25 2.510.41a

y bx =-=-⨯=-,

y ∴关于x 的线性回归方程为ˆ 2.51y

x =-; (2)由(1)中求出的线性回归方程知, 当15x =时, 2.515136.5y =⨯-=, 即预计需要购买食材36.5袋. 40020,036()380,36()y y x N C y y y N -<<∈⎧=⎨∈⎩

∴当36y <时,利润700(40020)30020L y y y =--=+,

当35y =时,300352010520max L =⨯+=; 当36y =时,700363803611870max L =⨯-⨯=. 当37y =时,70036.53803711490max L =⨯-⨯=.

综上所述,食堂应该购买36袋食材,才能使利润获得最大,最大利润为11870元.

苏教版 高考数学 一轮复习 讲义---第10章 学案56 线性回归方程

学案56 线性回归方程 导学目标: 1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 自主梳理 1.相关关系:两个变量之间的关系可能是________关系(如:函数关系),或__________关系.当自变量取值一定时,因变量也确定,则为确定性关系;当自变量取值一定时,因变量带有随机性,这种变量之间的关系称为相关关系.相关关系是一种非确定性关系. 2.散点图:将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图. 3.回归直线 (1)定义:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有________________,这条直线叫做回归直线. (2)最小二乘法:通过求Q =∑n i = 1 (y i -bx i -a )2的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和______,这一方法叫做最小二乘法. (3)线性回归方程 方程y ^ =bx +a 是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的线性回归方程,其中a ,b 是待定参数. 错误!. 自我检测 1.下列有关线性回归的说法,正确的序号是________. ①相关关系的两个变量不一定是因果关系; ②散点图能直观地反映数据的相关程度; ③回归直线最能代表线性相关的两个变量之间的关系; ④任一组数据都有线性回归方程. 2.下列关系: ①人的年龄与其拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一树木,其截面直径与高度之间的关系;⑤学生的身高与其学号之间的关系,其中有相关关系的是________(填序号). 3.(2010·银川模拟)下表是某厂1~4月份用水量(单位:百吨)的一组数据: 由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归方程是y ^ = -0.7x +a ,则a =________. 4.如图所示,有5组(x ,y )数据,去掉________组数据后,剩下的4组数据的线性相关性最大. 5.(2010·金陵中学三模)已知三点(3,10),(7,20),(11,24)的横坐标x 与纵坐标y 具有线性关系,则其线性回归方程是________________.

高中数学概率与统计(理科)常考题型归纳

高中数学概率与统计 ( 理科 ) 常考题型归纳 题型一 :常见概率模型的概率 几何概型、古典概型、相互独立事件与互斥事件的概率、条件概率是高考的热点,几何概型主要 以客观题考查,求解的关键在于找准测度 (面积,体积或长度 );相互独立事件,互斥事件常作为解答题的一问考查,也是进一步求分布列,期望与方差的基础,求解该类问题要正确理解题意,准确判定概率模型,恰当选择概率公式 . 【例 1】现有 4 个人去参加某娱乐活动,该活动有甲、乙两个游戏可供参加者选择 .为增加趣味性,约 定:每个人通过掷一枚质地均匀的骰子决定自己去参加哪个游戏, 掷出点数为 1 或 2 的人去参加甲游 戏,掷出点数大于 2 的人去参加乙游戏 . (1)求这 4 个人中恰有 2 人去参加甲游戏的概率; (2)求这 4 个人中去参加甲游戏的人数大于去参加乙游戏的人数的概率; (3)用 X , Y 分别表示这 4 个人中去参加甲、乙游戏的人数,记 ξ= |X -Y|,求随机变量 ξ的分布列 . 解 依题意,这 4 个人中,每个人去参加甲游戏的概率为 1 2 3,去参加乙游戏的概率为 3. 设“这 4 个人中恰有 i 人去参加甲游戏”为事件 Ai = ,,,, 4). ( i 0 1 2 3 i 1 i 2 4-i 则 P(Ai)=C4 3 3 . (1)这 4 个人中恰有 2 人去参加甲游戏的概率 212 2 2 8 P(A2)=C4 3 3 =27. (2)设“这 4 个人中去参加甲游戏的人数大于去参加乙游戏的人数”为事件 3+A4,且 A3 B ,则 B = A 与 A4 互斥, ∴P(B)=P(A3+A4 = 3 1 3 2 4 1 4 1 3 + 4 = = 4 3 × +C4 3 9. ) P(A ) P(A ) C 3 (3)依题设, ξ的所有可能取值为 0,2,4. 且 A 1与 A 3 互斥,A 0 与 A 4互斥. 8 则 P(ξ=0)= P(A2)= 27, P(ξ=2)=P(A1+ A3)= P(A1)+P(A3) 1 1 1 2 3 3 1 3 2 40 =C4 3 · 3 +C4 3 ×3=81, P(ξ=4)=P(A0+ A4)= P(A0)+P(A4) 0 2 4 4 1 4 17 = .

线性回归方程[高考数学总复习][高中数学课时训]

线性回归方程 1.下列关系中,是相关关系的为 (填序号). ①学生的学习态度与学习成绩之间的关系; ②教师的执教水平与学生的学习成绩之间的关系; ③学生的身高与学生的学习成绩之间的关系; ④家庭的经济条件与学生的学习成绩之间的关系. 答案 ①② 2.为了考察两个变量x 、y 之间的线性相关关系,甲、乙两同学各自独立地做10次和15次试验,并利用最小二乘法求得回归直线分别为l 1和l 2.已知在两人的试验中发现变量x 的观测数据的平均值恰好相等,都为s ,变量y 的观测数据的平均值也恰好相等,都为t ,那么下列说法中正确的是 (填序号). ①直线l 1,l 2有交点(s ,t ) ②直线l 1,l 2相交,但是交点未必是(s ,t ) ③直线l 1,l 2由于斜率相等,所以必定平行 ④直线l 1,l 2必定重合 答案 ① 3.下列有关线性回归的说法,正确的是 (填序号). ①相关关系的两个变量不一定是因果关系 ②散点图能直观地反映数据的相关程度 ③回归直线最能代表线性相关的两个变量之间的关系 ④任一组数据都有回归直线方程 答案 ①②③ 4.下列命题: ①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法; ②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示; ③通过回归直线y ?=b ?x +a ?及回归系数b ?,可以估计和预测变量的取值和变化趋势. 其中正确命题的序号是 . 答案 ①②③ 5.已知回归方程为y ?=0.50x -0.81,则x =25时,y ?的估计值为 . 答案 11.69 例1 下面是水稻产量与施化肥量的一组观测数据: 施化肥量 15 20 25 30 35 40 45 水稻产量 320 330 360 410 460 470 480 (1)将上述数据制成散点图; (2) 你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而 基础自测

高中数学选修2-3统计案例之线性回归方程习题课解析

1.相关关系的分类 从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关. 2.线性相关 从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线.3.回归方程 (1)最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法叫最小二乘法.(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(x n,y n),其回归方程为y^=b^x+a^,则b^,a^

其中,b是回归方程的斜率,a是在y轴上的截距. 4.样本相关系数 r= ∑ i=1 n (x i-x)(y i-y) ∑ i=1 n (x i-x)2∑ i=1 n (y i-y)2 ,用它来衡 量两个变量间的线性相关关系. (1)当r>0时,表明两个变量正相关; (2)当r<0时,表明两个变量负相关; (3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系. 5.线性回归模型

(1)y=bx+a+e中,a、b称为模型的未知参数;e称为随机误差. (2)相关指数 用相关指数R2来刻画回归的效果,其计算公式是:R2=,R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归效果越好. 规律 (1)函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系. 注意

高中数学复习概率统计题型归纳与讲解01 线性回归方程

高中数学复习概率统计题型归纳与讲解 专题1线性回归方程 例1.蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率x (每分钟鸣叫的次数)与气温y (单位:C)︒存在着较强的线性相关关系.某地观测人员根据如表的观测数据,建立了y 关于x 的线性回归方程ˆˆ0.25y x =+,则当蟋蟀每分钟鸣叫56次时,该地当时的气温预报值为() A .33C ︒ B .34 C ︒C .35C ︒ D .35.5C ︒ 【解析】解:由题意,得2030405060 405 x ++++==, 2527.52932.536 305 y ++++= =, 则0.25300.254020y x =-=-⨯=; 当56x =时,ˆ34y =. 故选:B . 例2.已知下列说法: ①对于线性回归方程ˆ35y x =-,变量x 增加一个单位时,ˆy 平均增加5个单位; ②在线性回归模型中,相关指数2R 越接近于1,则模型回归效果越好; ③两个随机变量的线性相关性越强,则相关系数就越接近1; ④互斥事件不一定是对立事件,对立事件一定是互斥事件; ⑤演绎推理是从特殊到一般的推理,它的一般模式是“三段论”.

其中说法错误的个数为() A .1B .2C .3D .4 【解析】解:①对于线性回归方程ˆ35y x =-,变量x 增加一个单位时,ˆy 平均减少5个单位,故①不正确; ②在线性回归模型中,相关指数2R 越接近于1,则模型回归效果越好,故②正确; ③两个随机变量的线性相关性越强,则相关系数的绝对值就越接近1,故③不正确; ④互斥事件不一定是对立事件,对立事件一定是互斥事件,所以④正确; ⑤演绎推理是从一般到特殊的推理,它的一般模式是“三段论”.所以⑤不正确; 故选:C . 例3.变量x ,y 之间的一组相关数据如表所示:若x ,y 之间的线性回归方程为ˆˆ12.28y bx =+,则ˆb 的值为() A .0.92- B .0.94- C .0.96- D .0.98- 【解析】解:4567 5.54 x +++==,8.27.8 6.6 5.4 74 y +++= =, 则样本点的中心的坐标为(5.5,7), 代入ˆˆ12.28y bx =+,得ˆ7 5.512.28b =+, 则ˆ0.96b =-. 故选:C . 例4.我国5G 技术研发试验在20162018-年进行,分为5G 关键技术试验、5G 技术方案验证和5G 系统验证三个阶段实施.2020年初以来,5G 技术在我国已经进入高速发展的阶段,5G 手机的销量也逐

高中数学概率与统计(理科)常考题型归纳

高中数学概率与统计(理科)常考题型归纳 题型一:常见概率模型的概率 几何概型、古典概型、相互独立事件与互斥事件的概率、条件概率是高考的热点,几何概型主要以客观题考查,求解的关键在于找准测度(面积,体积或长度);相互独立事件,互斥事件常作为解答题的一问考查,也是进一步求分布列,期望与方差的基础,求解该类问题要正确理解题意,准确判定概率模型,恰当选择概率公式. 【例1】现有4个人去参加某娱乐活动,该活动有甲、乙两个游戏可供参加者选择.为增加趣味性,约定:每个人通过掷一枚质地均匀的骰子决定自己去参加哪个游戏,掷出点数为1或2的人去参加甲游戏,掷出点数大于2的人去参加乙游戏. (1)求这4个人中恰有2人去参加甲游戏的概率; (2)求这4个人中去参加甲游戏的人数大于去参加乙游戏的人数的概率; (3)用X ,Y 分别表示这4个人中去参加甲、乙游戏的人数,记ξ=|X -Y |,求随机变量ξ的分布列. 解 依题意,这4个人中,每个人去参加甲游戏的概率为13,去参加乙游戏的概率为2 3. 设“这4个人中恰有i 人去参加甲游戏”为事件A i (i =0,1,2,3,4). 则 P (A i )=C i 4⎝ ⎛⎭⎪ ⎫ 13i ⎝ ⎛⎭ ⎪⎫234-i . (1)这4个人中恰有2人去参加甲游戏的概率 P (A 2)=C 24⎝ ⎛⎭⎪ ⎫ 132⎝ ⎛⎭ ⎪⎫232=8 27. (2)设“这4个人中去参加甲游戏的人数大于去参加乙游戏的人数”为事件B ,则B =A 3+A 4,且A 3与A 4互斥, ∴P (B )=P (A 3+A 4)=P (A 3)+P (A 4)=C 34⎝ ⎛⎭⎪ ⎫133×23+C 44⎝ ⎛⎭ ⎪⎫134=1 9. (3)依题设,ξ的所有可能取值为0,2,4. 且A 1与A 3互斥,A 0与A 4互斥. 则P (ξ=0)=P (A 2)=8 27, P (ξ=2)=P (A 1+A 3)=P (A 1)+P (A 3) =C 14⎝ ⎛⎭⎪ ⎫131 ·⎝ ⎛⎭⎪⎫233+C 34⎝ ⎛⎭ ⎪⎫133×23=4081, P (ξ=4)=P (A 0+A 4)=P (A 0)+P (A 4) =C 04⎝ ⎛⎭ ⎪ ⎫234 +C 44⎝ ⎛⎭ ⎪ ⎫134 =17 81. 所以ξ的分布列是

(最全)高中数学概率统计知识点总结

概率与统计 一、普通的众数、平均数、中位数及方差 1、 众数:一组数据中,出现次数最多的数。 2、平均数:①、常规平均数:12n x x x x n ++⋅⋅⋅+= ②、加权平均数:112212n n n x x x x ωωωωωω++⋅⋅⋅+=++⋅⋅⋅+ 3、中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数。 4、方差:2222121 [()()()]n s x x x x x x n = -+-+⋅⋅⋅+- 二、频率直方分布图下的频率 1、频率 =小长方形面积:f S y d ==⨯距;频率=频数/总数 2、频率之和:121n f f f ++⋅⋅⋅+=;同时 121n S S S ++⋅⋅⋅+=; 三、频率直方分布图下的众数、平均数、中位数及方差 1、众数:最高小矩形底边的中点。 2、平均数: 112233n n x x f x f x f x f =+++⋅⋅⋅+ 112233n n x x S x S x S x S =+++⋅⋅⋅+ 3、中位数:从左到右或者从右到左累加,面积等于0.5时x 的值。 4、方差:22221122()()()n n s x x f x x f x x f =-+-+⋅⋅⋅+- 四、线性回归直线方程:ˆˆˆy bx a =+ 其中:1 1 2 22 1 1 ()() ˆ() n n i i i i i i n n i i i i x x y y x y nxy b x x x nx ====---∑∑== --∑∑ , ˆˆa y bx =- 1、线性回归直线方程必过样本中心(,)x y ; 2、ˆ0:b >正相关;ˆ0:b <负相关。 3、线性回归直线方程:ˆˆˆy bx a =+的斜率ˆb 中,两个公式中分子、分母对应也相等;中间可以推导得到。 五、回归分析 1、残差:ˆˆi i i e y y =-(残差=真实值—预报值)。分析:ˆi e 越小越好; 2、残差平方和:21ˆ()n i i i y y =-∑, 分析:①意义:越小越好; ②计算:222211221 ˆˆˆˆ()()()()n i i n n i y y y y y y y y =-=-+-+⋅⋅⋅+-∑ 3、拟合度(相关指数):221 2 1 ˆ()1() n i i i n i i y y R y y ==-∑=- -∑,分析:①.(]20,1R ∈的常数; ②.越大拟合度越高; 4、相关系数 :()() n n i i i i x x y y x y nx y r ---⋅∑∑= = 分析:①.[r ∈-的常数; ②.0:r >正相关;0:r <负相关 ③.[0,0.25]r ∈;相关性很弱; (0.25,0.75)r ∈;相关性一般; [0.75,1]r ∈;相关性很强; 六、独立性检验 1、2×2列联表: 2、独立性检验公式 ①.2 2() ()()()() n ad bc k a b c d a c b d -= ++++ ②.犯错误上界P 对照表 3、独立性检验步骤

高中数学统计与概率知识点归纳(全)

高中数学统计与概率知识点(文) 一、众数: 一组数据中出现次数最多的那个数据。 众数与平均数的区别: 众数表示一组数据中出现次数最多的那个数据;平均数是一组数据中表示平均每份的数量。 二、.中位数: 一组数据按大小顺序排列,位于最中间的一个数据(当有偶数个数据时,为最中间两个数据的平均数) 三 .众数、中位数及平均数的求法。 ①众数由所给数据可直接求出;②求中位数时,首先要先排序(从小到大或从大到小),然后根据数据的个数,当数据为奇数个时,最中间的一个数就是中位数;当数据为偶数个时,最中间两个数的平均数就是中位数。③求平均数时,就用各数据的总和除以数据的个数,得数就是这组数据的平均数。 四、中位数与众数的特点。 ⑴中位数是一组数据中唯一的,可能是这组数据中的数据,也可能不是这组数据中的数据; ⑵求中位数时,先将数据有小到大顺序排列,若这组数据是奇数个,则中间的数据是中位数;若这组数据是偶数个时,则中间的两个数据的平均数是中位数; ⑶中位数的单位与数据的单位相同; ⑷众数考察的是一组数据中出现的频数; ⑸众数的大小只与这组数的个别数据有关,它一定是一组数据中的某个数据,其单位与数据的单位相同; (6)众数可能是一个或多个甚至没有; (7)平均数、众数和中位数都是描述一组数据集中趋势的量。 五.平均数、中位数与众数的异同: ⑴平均数、众数和中位数都是描述一组数据集中趋势的量; ⑵平均数、众数和中位数都有单位; ⑶平均数反映一组数据的平均水平,与这组数据中的每个数都有关系,所以最为重要,应用最广; ⑷中位数不受个别偏大或偏小数据的影响; ⑸众数与各组数据出现的频数有关,不受个别数据的影响,有时是我们最为关心的数据。 六、对于样本数据x 1,x 2,…,x n ,设想通过各数据到其平均数的平均距离来反映样本数据的分散程度,那么这个平均距离如何计算? 思考4:反映样本数据的分散程度的大小,最常用的统计量是标准差,一般用s 表示.假设样本数据 x 1,x 2,…,x n 的平均数为x ,则标准差的计算公式是: 七、简单随即抽样的含义 一般地,设一个总体有N 个个体, 从中逐个不放回地抽取n 个个体作为样本(n≤N), 如果每次 12|||||| n x x x x x x n 22212()()()n x x x x x x s n

第一章概率与统计(第11课)线性回归(1)

课题:1.6线性回归(一) 教学目的: 1了解相关关系、回归分析、散点图的概念 2.明确事物间是相互联系的,了解非确定性关系中两个变量的统计方法;掌握散点图的画法及在统计中的作用,掌握回归直线方程的求解方法3.会求回归直线方程 教学重点:散点图的画法,回归直线方程的求解方法 教学难点:回归直线方程的求解方法 授课类型:新授课 课时安排:1课时 教具:多媒体、实物投影仪 教学过程: 一、复习引入: 客观事物是相互联系的过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系比如说:某某同学的数学成绩与物理成绩,彼此是互相联系的,但不能认为数学是“因”,物理是“果”,或者反过来说事实上数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度所以说,函数关系存在着一种确定性关系但还存在着另一种非确定性关系——相关关系 二、讲解新课: 1.相关关系的概念 当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系 相关关系是非随机变量与随机变量之间的关系,函数关系是两个非随机变量之间的关系,是一种因果关系,而相关关系不一定是因果关系,所以相关关系与函数关系不同,其变量具有随机性,因此相关关系是一种非确定性关系(有因果关系,也有伴随关系).因此,相关关系与函数关系的异同点如下:相同点:均是指两个变量的关系 不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系. 2.回归分析:对具有相关关系的两个变量进行统计分析的方法叫做回归分析通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性3.散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图.散点图形象地反映了各对数据的密切程度 律 4. 回归直线

2023年新高考数学大一轮复习专题五概率与统计第1讲统计与统计案例(含答案)

新高考数学大一轮复习专题: 第1讲 统计与统计案例 [考情分析] 高考对本讲内容的考查往往以实际问题为背景,考查随机抽样与用样本估计总体,线性回归方程的求解与运用,独立性检验问题.常与概率综合考查,中等难度. 考点一 统计图表 核心提炼 1.频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率 组距. 2.频率分布直方图中各小长方形的面积之和为1. 3.利用频率分布直方图求众数、中位数与平均数. 频率分布直方图中: (1)最高的小长方形底边中点的横坐标即众数. (2)中位数左边和右边的小长方形的面积和相等. (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 例1 (1)(多选)(2020·新高考全国Ⅱ)我国新冠肺炎疫情防控进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是( ) A .这11天复工指数和复产指数均逐日增加 B .这11天期间,复产指数增量大于复工指数的增量 C .第3天至第11天复工复产指数均增大都超过80% D .第9天至第11天复产指数增量大于复工指数的增量 答案 CD (2)学校为了了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示:

将阅读时间不低于30分钟的学生称为“阅读霸”,则下列结论正确的是( ) A.抽样表明,该校约有一半学生为阅读霸 B.该校只有50名学生不喜欢阅读 C.该校只有50名学生喜欢阅读 D.抽样表明,该校有50名学生为阅读霸 答案 A 解析根据频率分布直方图可列下表: 阅读时间(分 钟)[0,10 ) [10,20)[20,30)[30,40)[40,50)[50,60] 抽样人数(名)1018222520 5 抽样100名学生中有50名为阅读霸,占一半,据此可判断该校约有一半学生为阅读霸. 易错提醒(1)对于给出的统计图表,一定要结合问题背景理解图表意义,不能似懂非懂.(2)频率分布直方图中纵坐标不要误以为频率. 跟踪演练1 (1)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃.下面叙述不正确的是( ) A.各月的平均最低气温都在0℃以上 B.七月的平均温差比一月的平均温差大 C.三月和十一月的平均最高气温基本相同 D.平均最高气温不低于20℃的月份有5个

高三数学 正态分布和线性回归(知识点和例题)

正态分布和线性回归 高考要求 1.了解正态分布的意义及主要性质 2.了解线性回归的方法和简单应用 知识点归纳 1.正态分布密度函数: 2 2 () 2 () x f x μ σ - - =,(σ>0,-∞<x<∞) 其中π是圆周率;e是自然对数的底;x是随机变量的取值;μ为正态分布的均值;σ是正态分布的标准差.正态分布一般记为) , (2 σ μ N 2.正态分布) , (2 σ μ N)是由均值μ和标准差σ唯一决定的分布 例1、下面给出三个正态总体的函数表示式,请找出其均值μ和标准差σ.(1)2 2 2 1 ) ( x e x f- = π ,(-∞<x<+∞) (2 ) 2 (1) 8 () x f x - - =,(-∞<x<+∞) 解:(1)0,1 (2)1,2 3.正态曲线的性质:正态分布由参数μ、σ唯一确定,如果随机变量ξ~N(μ,σ2),根据定义有:μ=Eξ,σ=Dξ。 正态曲线具有以下性质: (1)曲线在x轴的上方,与x轴不相交。 (2)曲线关于直线x =μ对称。 (3)曲线在x =μ时位于最高点。 (4)当x <μ时,曲线上升;当x >μ 时,曲线下降。并且当曲线向左、

右两边无限延伸时,以x 轴为渐近线,向它无限靠近。 (5)当μ一定时,曲线的形状由σ确定。σ越大,曲线越“矮胖”,表示总体越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中。 五条性质中前三条较易掌握,后两条较难理解,因此应运用数形结合的原则,采用对比教学 4.标准正态曲线:当μ=0、σ=l 时,正态总体称为标准正态总体,其 相应的函数表示式是2 221)(x e x f - = π ,(-∞<x <+∞) 其相应的曲线称为标准正态曲线 标准正态总体N (0,1)在正态总体的研究中占有重要的地位 任何正态分布的概率问题均可转化成标准正态分布的概率问题 5.标准正态总体的概率问题: 对于标准正态总体N (0,1),)(0x Φ是总体取值小于0x 的概率, 即 )()(00x x P x <=Φ, 其中00>x ,图中阴影部分的面积表示为概率0()P x x < 只要有标准正态 分布表即可查表解决.从图中不难发现:当00

高三数学(文科)复习主干知识与测试:概率-统计-线性回归方程

2011高三数学(文科)一轮复习主干知识单元测试:概率与统计 一、选择题:本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题意要求的. 1.某校有男生1500人,女生1200人,为了解该年级学生的健康情况,从男生中任意抽取30人,从女生中任意抽取24人进行调查.这种抽样方法是( ) A .简单随机抽样法 B .抽签法 C .系统抽样法 D .分层抽样法 2.调查某厂工人生产某种产品的能力,随机抽查了2000位工人某 天生产该产品的数量.产品数量的分组区间为[45,50),[50,55), [55,60),[60,65),[65,70),由此得到频率分布直方图如图示, 这20名工人中一天生产该产品数量在[55,70)的人数是( ) A .1050 B .950 C . 210 D .1790 3.从1008名学生中抽取20人参加义务劳动。规定采用下列方法选取:先用简单随机抽样的抽取方法从1008人剔除8人,剩下1000人再按系统抽样的方法抽取,那么在1008人中每个人入选的概率是( ) A .都相等且等于 50 1 B .都相等且等于 252 5 C .不全相等 D .均不相等 4.某校高中研究性学习小组对本地区2006年至2008年快餐公司发展情况进行了调查,制成了该地区快餐公司个数情况的条形图和快餐公司盒饭年销售量的平均数情况条形图(如图),根据图中提供的信息可以得出这三年中该地区每年平均销售盒饭( ) A .82万盒 B .83万盒 C .84万盒 D .85万盒 5.在抽查产品的尺寸过程中,将尺寸分成若干组,[)b a ,是其中的一组,抽查出的个体在该组上的频率为m ,该组上的直方图的高为h ,则=-b a ( ) A .hm B . m h C . h m D .m h + 6.为调查某中学学生平均每人每天参加体育锻炼时间X (单位:分钟), 按锻炼时间分下列四种情况统计:①0~10分钟;②11~20分钟;③21~30分钟;④30分钟以上.有1000名中学生参加了此项活动,下图是此次调查中某一项的流程图,其输出的结果是620,则平均每天参加体育锻炼时间在0~20分钟内的学生的频率是 ( ) A .380 B .620

高中数学专题训练(教师版)—线性回归

高中数学专题训练(教师版)—线性回归 一、选择题 1.实验测得四组(x ,y )的值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的回归直线方程为( ) A.y ^ =x +1 B.y ^ =x +2 C.y ^ =2x +1 D.y ^ =x -1 答案 A 解析 画出散点图,四点都在直线y ^ =x +1. 2.下列有关样本相关系数的说法不正确的是( ) A .相关系数用来衡量变量x 与y 之间的线性相关程度 B .|r |≤1,且|r |越接近于1,相关程度越大 C .|r |≤1,且|r |越接近0,相关程度越小 D .|r |≥1,且|r |越接近1,相关程度越小 答案 D 3.由一组样本(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到的回归直线方程y ^ =a +bx ,下面有四种关于回归直线方程的论述: (1)直线y ^ =a +bx 至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点; (2)直线y ^=a +bx 的斜率是 ∑n i =1x i y i -n x y ∑n i =1x 2i -n x 2 ; (3)直线y ^ =a +bx 必过(x ,y )点; (4)直线y ^=a +bx 和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差∑n i =1 (y i -a -bx i )2是该坐标平面上所有的直线与这些点的偏差中最小的直线. 其中正确的论述有( ) A .0个 B .1个 C .2个 D .3个 答案 D 解析 线性回归直线不一定过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的任何一点;b = ∑n i =1x i y i -n x y ∑n i =1x 2i -n x 2 就是线性回归直线的斜率,也就是回归系数;线性回 归直线过点(x ,y );线性回归直线是平面上所有直线中偏差∑n i =1 (y i -a -bx i )2取得最小的那一条.故有三种论述是正确的,选D. 4.设两个变量x 和y 之间具有线性相关关系,它们的相关系数是r ,y 关于x 的回归直线的斜率是b ,纵截距是a ,那么必有( ) A .b 与r 的符号相同 B .a 与r 的符号相同 C .b 与r 的符号相反 D .a 与r 的符号相反

高考数学专题复习:一元线性回归模型及其应用

高考数学专题复习:一元线性回归模型及其应用 一、单选题 1.下表是某产品1~4月份销量(单位:百件)的一组数据,分析后可知,销量y 与月份)(17x x <<之间有较好的线性相关关系,其线性回归方程是0.6ˆˆ=-+y x a ,则预测5月份的销量是( ) A .2 B .1.5 C .2.5 D .1.6 2.某工厂为节能降耗,经过技术改造后,生产某种产品的产量x (单位:吨)与相应的生产能耗y (单位:吨)的对应数据如下表: 根据上表提供的数据,求得y 关于x 的线性回归方程为0.35y bx =+,则b 的值为( ) A .0.3 B .0.7 C .3 D .7 3.某种产品的投入x (单位:万元)与收入y (单位:万元)之间的关系如表: 若已知y 与x 的线性回归方程为 6.517.5y x =+,那么当投入为4万元时,收入的随机误差为( )万元.(随机误差=真实值-预测值) A .-4.5 B .4.5 C .3.5 D .-3.5 4.已知两个变量x 和y 之间的一组数据: 则y 关于x 的线性回归方程一定经过点( ) A .(3,6) B .(4,6.6) C .(4,7) D .(6,8.5)

5.如果发现散点图中所有的样本点都落在一条斜率为非0实数的直线上,则下列说法错误的是( ) A .解释变量和预报变量是一次函数关系 B .相关指数21R = C .残差平方和为0 D .相关系数1r = 6.下表是某厂1-4月份用水量(单位:百吨)的一组数据: 经分析可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归方程是ˆˆ0.7y x a =-+,则ˆa 等于( ) A .5.1 B .5.25 C .5.3 D .5.4 7.两个变量有线性相关关系且正相关,则回归直线方程中,ˆˆˆy bx a =+的系数ˆb ( ) A .ˆ0b > B .ˆ0b < C .ˆ0b = D .ˆ1b =- 8.某单位做了一项统计,了解办公楼用电量y (度)与气温x (C )之间的关系,随机统计了四个工作日用电量与当天平均气温,并制作了对照表: C ) 用电量(度)由表中数据得到回归方程2y x a ∧∧ =-+,则当平均气温气温为3-(C )时,预测用电量为( ) A .64度 B .66度 C .68度 D .70度 9.某校课题小组为了研究高一学生数学成绩和物理成绩的线性相关关系,在高一第二学期期中考试后随机抽取了5名同学(记为1,2,3,4,5)数学成绩和物理成绩(满分均为100分)如表所示: 则y 关于x 的线性回归方程为( )

2020年高考理科数学《概率与统计》题型归纳与训练及答案解析

2020年高考理科数学《概率与统计》题型归纳与训练 【题型归纳】 题型一 古典概型与几何概型 例1、某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒.若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为 . 【答案】 【解析】因为红灯持续时间为40秒.所以这名行人至少需要等待15秒才出现绿灯的概率为 . 例2、市政府为调查市民对本市某项调控措施的态度,随机抽取了100名市民,统计了他们的月收入频率分布和对该项措施的赞成人数,统计结果如下表所示: (1)用样本估计总体的思想比较该市月收入低于20(百元)和不低于30(百元)的两类人群在该项措施的态度上有何不同; (2)现从样本中月收入在)20,10[和)70,60[的市民中各随机抽取一个人进行跟踪调查,求抽取的两个人恰好对该措施一个赞成一个不赞成的概率. 【答案】(1)详见解析;(2) 20 11 . 【解析】(1)由表知,样本中月收入低于20(百元)的共有5人,其中持赞成态度的共有2人,故赞成人数的频率为 52,月收入不低于30(百元)的共有75人,其中持赞成态度的共有64人,故赞成人数的频率为75 64, ∵ 5 2 7564>,∴根据样本估计总体的思想可知月收入不低于30(百元)的人群对该措施持赞成态度的比月收入低于20(百元)的人群持赞成态度的比例要高. (2) 将月收入在)20,10[内,不赞成的3人记为321,,a a a ,赞成的2人记为54,a a ,将月收入在)70,60[内,不赞成的1人记为1b ,赞成的3人记为,,,432b b b 从月收入在)20,10[和)70,60[内的人中各随机抽取1人,基本事件总数20=n ,其中事件“抽取的两个人恰好对该措施一个赞成一个不赞成”包含的基本事件有 5840155 408 -=

概率与统计高考常见题型解题思路及知识点总结

概率与统计高考常见题型 解题思路及知识点总结 一、解题思路 (一)解题思路思维导图 (二)常见题型及解题思路 1.正确读取统计图表的信息 典例1:(2017全国3卷理科3)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图,根据该折线图,下列结论错误的是().

A .月接待游客量逐月增加 B .年接待游客量逐年增加 C .各年的月接待游客量高峰期大致在7,8月份 D .各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳 【解析】由题图可知,2014年8月到9月的月接待游客量在减少,则A 选项错误,选A. 2.古典概型概率问题 典例 :(全国卷理科)我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德 巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,如.在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是 A. B. C. D. 解:不超过30的素数有2,3,5,7, 11,13,17,19,23,29,共10个,随机选取两个不同的数,共有 种方法,因为 ,所以随机选取两个不同的数,其和等于30的有3种方 法,故概率为 ,选C. 典例3: (2014全国2卷理科5)某地区空气质量监测资料表明,一天的空气质量为优良的概率是0.75,连续两天为优良的概率是0.6,已知某天的空气质量为优良,则随后一天的空气质量为优良的概率是 ( ) A. 0.8 B. 0.75 C. 0.6 D. 0.45 解:设某天空气质量优良,则随后一天空气质量也优良的概率为p,则据条件概率公式得p =0.6 0.75=0.8,故选A. 3.几何概型问题 典例4:(2016全国1卷理科4)某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是 ( ) A.13 B.12 C. 23 D.3 4

相关文档
最新文档