2018-2019学年人教A版数学选修2-3同步导学精品课件:第三章 统计案例3.1
合集下载
2018-2019版高中数学第三章统计案例章末复习课件新人教A版选修2-3

50岁以上
16
2
18
解答
(3)在犯错误的概率不超过 0.01的前提下,是否能认为 “ 其亲属的饮食习 惯与年龄有关”?
解
2 30 × 8 - 128 K2= =10>6.635, 12×18×20×10
故在犯错误的概率不超过 0.01 的前提下认为 “ 其亲属的饮食习惯与年龄 有关”.
解答
跟踪训练 1
经分析预测,美国通用汽车等 10 家大公司的销售总额 xi(i=
1,2,…,10,单位:百万美元)与利润 yi(i=1,2,…,10,单位:百万美 元)的近似线性关系为y=0.026x+a,经统计 xi=623 090, yi=29 300.
i=1 i=1 ^ ^ 10 10
(1)求a;
,
参考公式:相关系数 r=
n n i=1 i =1
ti- t 2 yi- y 2
回归方程 y = a + b t 中斜率和截距的最小二乘估计公式分别为: b =
^
^
^
^
i =1
ti- t yi- y ti - t 2
n
n
,a= y -b t .
^
^
i=1
解答
(1) 根据茎叶图,帮助这位同学说明其亲属
30人的饮食习惯; 解 30位亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉 类为主.
解答
(2)根据以上数据完成下列2×2列联表;
主食蔬菜 主食肉类 合计 50岁以下
50岁以上
解 2×2列联表如表所示: 总计
主食蔬菜 主食肉类 合计 50岁以下 4 8 12
由(1)知y=0.026x+1 310,
2018-2019学年人教A版高中数学选修2-3三 统计案例

栏目 导引
模块复习提升课
所以^ a =7.4+1.15×18=28.1, 所以 y 对 x 的回归直线方程为^ y =-1.15x+28.1. 列出残差表为
yi-^ yi 0 0.3 -0.4 -0.1 0.2
yi-― y 4.6 2.6 -0.4 -2.4 -4.4
栏目 导引
模块复习提升课
栏目 导引
栏目 导引
模块复习提升课
独立性检验问题的求解策略 (1)等高条形图法:依据题目信息画出等高条形图,依据频率差 异来粗略地判断两个变量的相关性. (2)K2 统计量法:通过公式
2 n ( ad - bc ) K2= 先计算观测值 k,再 (a+b)(c+d)(a+c)(b+d)
栏目 导引
模块复习提升课
(3)①由(2)知,当 x=49 时, 年销售量 y 的预报值^ y =100.6+68 49=576.6, 年利润 z 的预报值^ z =576.6×0.2-49=66.32. ②根据(2)的结果知,年利润 z 的预报值 ^ z =0.2(100.6+68 x)-x=-x+13.6 x+20.12. 13.6 所以当 x= =6.8,即 x=46.24 时,^ z 取得最大值. 2 故年宣传费为 46.24 千元时,年利润的预报值最大.
栏目 导引
模块复习提升课
解决回归分析问题的一般步骤 (1)画散点图.根据已知数据画出散点图. (2)判断变量的相关性并求回归方程.通过观察散点图,直观感 知两个变量是否具有相关关系;在此基础上,利用最小二乘法 求回归系数,然后写出回归方程. (3)回归分析.画残差图或计算 R2,进行残差分析. (4)实际应用.依据求得的回归方程解决问题.
栏目 导引
模块复习提升课
高中数学人教A版选修2-3课件第三章统计案例

(1)求 y 与 x 的线性回归方程.
^
(2)现有第二个线性模型:y=7x+17,且 R 2=0.82.
若与(1)的线性模型比较,哪一个线性模型拟合效果比较好,请说
明理由.
专题归纳
高考体验
^
^
解:(1)依题意设 y 与 x 的线性回归方程为=6.5x+.
2+4+5+6+8
=
=5,
=
^
5
30+40+60+50+70
来粗略地判断两个变量的相关性.
2
(-)
(2)通过公式 K2=
(+)(+)(+)(+)
表作比较,最后得出结论.
先计算观测值k,再与临界值
专题归纳
高考体验
跟踪训练 2某学生对其亲属30人的饮食习惯进行了一次调查,并
用茎叶图表示30人的饮食指数,如图所示.(说明:图中饮食指数低于
愿意
不愿意
男生
20
10
女生
10
20
性别
(1)用分层抽样的方法在愿意提供志愿者服务的学生中抽取6人,
其中男生抽取多少人?
专题归纳
高考体验
(2)你能否在犯错误的概率不超过0.01的前提下认为该校高中生
是否愿意提供志愿者服务与性别有关?
下面的临界值表供参考:
P(K2≥k0) 0.15
k0
0.10
0.05
5
=50,
^
∵=6.5x+经过(, ),
^
^
∴50=6.5×5+,∴=17.5,
^
∴y 与 x 的线性回归方程为=6.5x+17.5.
^
(2)现有第二个线性模型:y=7x+17,且 R 2=0.82.
若与(1)的线性模型比较,哪一个线性模型拟合效果比较好,请说
明理由.
专题归纳
高考体验
^
^
解:(1)依题意设 y 与 x 的线性回归方程为=6.5x+.
2+4+5+6+8
=
=5,
=
^
5
30+40+60+50+70
来粗略地判断两个变量的相关性.
2
(-)
(2)通过公式 K2=
(+)(+)(+)(+)
表作比较,最后得出结论.
先计算观测值k,再与临界值
专题归纳
高考体验
跟踪训练 2某学生对其亲属30人的饮食习惯进行了一次调查,并
用茎叶图表示30人的饮食指数,如图所示.(说明:图中饮食指数低于
愿意
不愿意
男生
20
10
女生
10
20
性别
(1)用分层抽样的方法在愿意提供志愿者服务的学生中抽取6人,
其中男生抽取多少人?
专题归纳
高考体验
(2)你能否在犯错误的概率不超过0.01的前提下认为该校高中生
是否愿意提供志愿者服务与性别有关?
下面的临界值表供参考:
P(K2≥k0) 0.15
k0
0.10
0.05
5
=50,
^
∵=6.5x+经过(, ),
^
^
∴50=6.5×5+,∴=17.5,
^
∴y 与 x 的线性回归方程为=6.5x+17.5.
2018学年高中数学人教A版课件选修2-3 第三章 统计案例

【精彩点拨】
首先求出在考前心情紧张与考前心情不紧张群体中,性格
内向的频率,再绘制等高条形图进行判定.
【自主解答】
作列联表如下: 性格内向 性格外向 总计
考前心情紧张 考前心情不紧张 总计
332 94 426
213 381 594
545 475 1 020
在考前心情紧张的群体中,性格内向的约占 61%,在考前心情不紧张的群 体中,性格内向的约占 20%.绘制相应的等高条形图如图所示:
【答案】 ④
3.下列说法正确的有________(填序号). ①分类变量的取值仅表示个体所属的类别,它们的取值一定是离散的; ②分类变量的取值也可以用数字来表示,但这时的数字除了分类以外没有 其他的含义; ③2×2 列联表是两个分类变量的频数汇总统计表; ④2×2 列联表和等高条形图都能反映出两个分类变量间是否相互影响.
图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例, 从图 中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中 性格内向占的比例大,可以认为考前紧张与性格类别有关.
相互影响 ,常用等高条形图展示列联表数据的______________. 频率特征 __________
a c (2) 观察等高条形图发现 和 相差很大,就判断两个分类变量之间 a+b c+d
有关系 ______________.
1.下面是 2×2 列联表: y1 x1 x2 总计 a 2 b y2 21 25 46 总计 73 27
【解析】
由分类变量的定义可知①②正确;由 2×2 列联表的定义可知③
正确;2×2 列联表和等高条形图都能展示样本的频率特征,若在一个分类变量 所取值的群体中, 另一个分类变量所取值的频率相差较小, 则说明这两个变量不 相互影响,否则就相互影响.故④正确.
2018-2019学年人教A版数学选修2-3全册课件:第三章 3.

y1 x1 x2 总计 a c a+c
y2 b d b+d
总计 a+ b c+ d a+b+c+d
3.K2 统计量 为了使不同样本容量的数据有统一的评判标准,我们构造 nad-bc2 一个随机变量 K2= a+bc+da+cb+d ,其中 n=
a+b+c+d 为样本容量.
4.独立性检验 利用随机变量 K2 来确定是否能以给定把握认为“两个分
提示:有. 问题2:通过怎样比较看出有? 提示:通过考前紧张的人数占性格类型的比例.
[导入新知]
1.分类变量 变量的不同“值”表示 个体所属 变量称为分类变量. 2.2×2 列联表 假设有两个分类变量 X 和 Y,它们的取值分别为 {x1,x2} 和 {y1,y2} ,其样本频数列联表(也称为 2×2 列联表)为: 的不同类别,像这样的
[活学活用] 为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少 年及其家长,数据如下: 父母吸烟 子女吸烟 子女不吸烟 总计 237 678 915 父母不吸烟 83 522 605 总计 320 1 200 1 520
利用等高条形图判断父母吸烟对子女吸烟是否有影响?
解:等高条形图如下:
由图形观察可以看出父母吸烟者中子女吸烟的比例要比父 母不吸烟者中子女吸烟的比例高,因此可以在某种程度上认 为“子女吸烟与父母吸烟有关系”.
[解]
根据题目所给数据建立如下 2×2 列联表: 肯定 男生 女生 总计 22 22 44 否定 88 38 126 总计 110 60 170
根据 2×2 列联表中的数据得到: 170×22×38-22×882 k= ≈5.622>3.841. 110×60×44×126 所以在犯错误的概率不超过 0.05 的前提下,认为“性别与态 度有关系”.
2018学年高中数学人教A版选修2-3课件 第3章 统计案例3.2 精品

没有发现足够证据拒绝“两个分类变量没有关系”.
2.独立性检验的几个常用临界值 在独立性检验中,设 K2 的观测值为 k ,当 k>3.841 时,有 95%的把握说事件A与B有关;当k>6.635时,有99%的把握说事 件A与B有关;当k≥10.828时,有99.9%的把握认为A与B有关; 当k≤3.841时,认为事件A与B是无关的.
3.独立性检验的基本思想
2 K (1) 定义:利用随机变量 ________ 来判断“两个分类变量 有关系 ________”的方法称为独立性检验.
nad-bc2 a+bc+da+cb+d , 其 中 n = (2) 公 式 : K2 = _________________________
②一般地,假设有两个分类变量X和Y,它们的取值分别为 {x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为: Y X x1 y1 a y2 b 总计 a+b ________
x2
总计
c a+c ________
d b+d ________
________ c+d a+b+c+d
2.等高条形图 等高条形图与表格相比,图形更能直观地反映出两个分类 相互影响 , 常 用 等 高 条 形 图 展 示 列 表 数 据 的 变 量 间 是 否 __________ 频率特征 __________.
a=52, 得 b=54.
2.对于研究两个分类变量 A 与 B 关系的统计量 K2,下列 说法正确的是 导学号 03960642 ( )
A.K2 越大,说明“A 与 B 有关系”的可信度越小 B.K2 越小,说明“A 与 B 有关系”的可信度越小 C.K2 越大,说明“A 与 B 无关”的程度越大 D.K2 接近于 0,说明“A 与 B 无关”的程度越小
人教a版数学【选修2-3】第3章《统计案例》归纳总结ppt课件

B.75% D.97.5%
第三章 章末归纳总结
成才之路 · 高中新课程 · 学习指导 · 人教A版 · 数学 · 选修2-3
[答案] D [解析] 有关系”. 查表可得K2>5.024.因此有97.5%的把握认为“x和y
第三章
章末归纳总结
成才之路 · 高中新课程 · 学习指导 · 人教A版 · 数学 · 选修2-3
算可得 k≈0.04145,而 0.04145<2.706,所以没有充分的证据表 明该药品对防治 A 疾病有效.
第三章
章末归纳总结
成才之路 · 高中新课程 · 学习指导 · 人教A版 · 数学 · 选修2-3
[点评]
利用独立性检验可以帮助我们定量地分析两个分
第三章
章末归纳总结
成才之路 · 高中新课程 · 学习指导 · 人教A版 · 数学 · 选修2-3
[解析] 将问题中的数据写成 2×2 列联表如下表: 患病 使用 不使用 总计 5 18 23 不患病 100 400 500 总计 105 418 523
2 n ad - bc 将上述数据代入公式 K2= 中,计 a+bc+da+cb+d
3.(2014· 唐山模拟)对具有线性相关关系的变量 x、y 有一 1 ^ 组观测数据(xi,yi)(i=1,2,„,8),其回归直线方程是:y=3x +a, 且 x1+x2+x3+„+x8=2(y1+y2+y3+„+y8)=6, 则实数 a 的值是( 1 A.16 1 C.4 [答案] B ) 1 B.8 1 D.2
成才之路 · 数学
人教A版 · 选修2-3
路漫漫其修远兮 吾将上下而求索
成才之路 · 高中新课程 · 学习指导 · 人教A版 · 数学 · 选修2-3
人教版A版高中数学选修2-3:第三章 统计案例 复习课件

4
xi2 14,
4
xi zi 0 2 8 15 25,
4
i 1
zi2 46,
2
4x 9,
i 1
i 1
4
2
4z 36,
b
i 1 4
xi zi 4x z
xi 2
2
4x
25 18 7 14 9 5
i 1
a z bx 3 7 1.5 9 , z 7 x 9
a
y
i 1
bx.
i 1
例1(安徽卷)某地最近十年粮食需求量逐年上升,下 表是部分统计数据:
年份
2002 2004 2006 2008 2010
需求量(万吨) 236 246 257 276 286
(1)利用所给数据求年需求量与年份之间的回归直线
方程 yˆ=bx a ;(2)利用(1)中所求出的直线方程预测该
yi--y
0
1
3 -4
4
(y y)2
R2
1
i 1 4
(y y)2
i 1
0.1923
1
(1.5)2 02
0.52 12
3.52 (2.5) 32 (4)2
2
回归直线方程是y x 5
R2 0.1923
2
相关指数越大,越 接近于1,模拟的拟 合效果越好;相关 指数越小,拟合的 效果越差!
x 0123 y 2 4 16 32
(1)画出散点图;(2)试建立y与x之间的回归方程.
解:(1)作出散点图如右图所示: 32
y 2c2xc1 ,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• ①用线性回归模型近似真实模型(真实模型是客观存在的 ,通常我们并不知道真实模型是什么)所引起的误差.可 能存在非线性的函数能更好地描述y与x之间的关系,但是 现在却用线性函数来表述这种关系,结果会产生误差.这 种由模型近似所引起的误差包含在e中. • ②忽略了某些因素的影响.影响变量y的因素不只变量x, 可能还包括其他许多因素(例如在描述身高和体重关系的 模型中,体重不仅受身高的影响,还会受遗传基因、饮食 习惯、生长环境等其他因素的影响),它们的影响都体现 在e中. • ③观测误差.由于测量工具等原因,导致y的观测值产生 误差(比如一个人的体重是确定的数,但由于测量工具的
2 2 2 2 = 84 + 64 + … + 57 + 71 =47384, y2 i i=1
xiyi=120×84+108×64+…+108×71=73796,
i=1
10
所以,相关系数为 73796-10×107.8×68 r= 116584-10×107.8247384-10×682 ≈0.7506, 由 0.7506>0.75 知,两次数学考试成绩有显著的线性相关关系.
正相关
负相关
• 二、线性回归分析 • 1.随机误差 • (1)随机误差的概念:当样本点散布在某一条直线的附近, 而不是在一条直线上时,不能用一次函数y=bx+a来描述 y=bx+a+e x y 两个变量之间的关系,而是用线性回归模型 2 e σ 0 _______________来表示,这里_____称为解释变量, _____称为预报变量,_____称为随机误差,E(e)=_____ ,D(e)=_____. • (2)随机误差及其产生的原因 • 从散点图中我们可以看到,样本点散布在某一条直线附近 ,而不是在一条直线上,所以不能用一次函数y=bx+a来
i=1 n
相关指数 R2 的计算公式是 R2=1-
.
y i- y 2
i=1
n
R2 的值越大,说明残差平方和越小,也就是说模型的拟合效果(即回归效果) 好 . 越______
相关系数r___的平方. 在含有一个解释变量的线性模型中,R2 恰好等于__________
• 1.在对两个变量x,y进行线性回归分析时,有下列步骤 : • ①对所求出的回归直线方程作出解释; • ②收集数据(xi,yi),i=1,2,…,n; • ③求线性回归方程; • ④求相关系数; • ⑤根据所搜集的数据绘制散点图. D • 如果根据可行性要求能够作出变量x,y具有线性相关的结 论,则在下列操作顺序中正确的是 ( ) • A.①②⑤③④ B.③②④⑤①
^ a =
相关系数r___来描述线性相关关系的强 3.线性相关关系强与弱的判断:用__________
弱. 对于变量 x、y 随机抽取到的 n 对数据(x1,y1)、(x2,y2)、…、(xn,yn),其相
xi- x yi- y
i =1
n
xiyi-n x y
i =1
n
关系数 r=
=
. x2 i -n i=1
x i- x y i- y
2 i=1 i=1
n
n
2
n
2 x y2 - n y i 2 i=1
n
• 当r>0时,表明两个变量__________;当r<0时,表明两 强 个变量__________.r的绝对值越接近1,表明两个变量的 0.75 线性相关性越______;r的绝对值接近于0时,表明两个变 量之间几乎不存在线性相关关系.通常当|r|大于 _________时,认为两个变量有很强的线性相关关系.
请问:这 10 个学生的两次数学考试成绩是否具有显著的线性相关关系?
[ 解析]
- 1 x =10(120+108+…+99+108)=107.8,
- 1 y =10(84+64+…+57+71)=68,
2 2 2 2 x2 i =120 +108 +…+99 +108 =116584, i=1 10 10
• [解析] 对两个变量进行回归分析时,
• 首先收集数据(xi,yi),i=1,2,…,n;根据所搜集的数据 绘制散点图. • 观察散点图的形状,判断线性相关关系的强弱, • 求相关系数,写出线性回归方程, • 最后依据所求出的回归直线方程作出解释; • 故正确顺序是②⑤④③① • 故选D.
2.(2018· 南充模拟)已知变量 x 与变量 y 之间具有相关关系,并测得如下一组 数据: x y
3.残差图 残差 为纵坐标,____________( 样本编号 或身高数据,或体重的估计值等)为横 以________ 坐标作出的图形,称为残差图.
贡献率 R2 越 4.在线性回归模型中,R2 表示解释变量对预报变量变化的__________.
接近于 1,表示解释变量和预报变量的线性相关性越强;反之,R2 越小,说明随 机误差对预报变量的效应越大. ^ y i- y i 2
• 5.下图是根据变量x、y的观测数据(xi,yi)(i=1,2,…, 10)得到的散点图,由这些散点图可以判断变量x、y具有 D 相关关系的图是 ( )
• A.①② B.①④ • C.②③ D.③④ • [解析] 根据散点图中点的分布情况,可判断③④中的变 量x,y具有相关的关系.
互动探究学案
• 『规律总结』 变量间是否具有线性相关关系,可通过散 点图或相关系数作出判断,散点图只是粗略作出判断,用 相关系数能够较准确的判断相关的程度.
〔跟踪练习 1〕 现随机抽取了我校 10 名学生在入学考试中的数学成绩(x)与入学后的第一次 考试数学成绩(y),数据如下表: 学生号 x y 1 120 84 2 108 64 3 117 84 4 104 68 5 103 69 6 110 68 7 104 69 8 105 46 9 99 57 10 108 71
命题方向1 ⇨变量间的相关性检测
典例 1
x y 关于两个变量 x 和 y 的 7 组数据如下表所示: 21 7 23 11 25 21 27 24 29 66 32 115 35 325
试判断 y 与 x 是否线性相关.
[ 解析]
- 1 x =7(21+23+25+27+29+32+35)≈27.4,
3.1 回归分析的基本思想及其初步应用
1 2
自主预习学案
互动探究学案
3
课时作业学案
自主预习学案
• 2015年4月25日尼泊尔发生了8.1级地震,此次地震系本世 纪陆地第5次八级大地震,余震频繁而且震级还高,仅7级 以上余震就发生了2次,你知道地震的震级与地震次数之 间有什么关系吗?
相关关系 的一种统计方法.若两个变 1.回归分析是处理两个变量之间____________ 线性回归分析 . 量之间具有线性相关关系,则称相应的回归分析为________________
- 1 y =7(7+11+21+24+66+115+325)≈81.3,
2 2 2 2 2 2 2 x2 i =21 +23 +25 +27 +29 +32 +35 =5414, i=1 7
7
x iyi = 21×7 + 23×11 + 25×21 + 27×24 + 29×66 + 32×115 + 35×325 =
2.残差 ^ ^ ^ ^ 对于样本点(x1,y1)、(x2,y2)、…、(xn,yn),其回归方程为y=bx+a,用y作
y=bx+a+e 为回归模型 2中 Ee=0,De=σ
bx+a 的估计值,随机误差 ei=yi-bxi-a 的估
^ ^ ^ y - b x - a i ____ i _____(i=1,2,…,n),称为相应于点(xi,yi)的残差. 计值ei=___
^
6 6
5 5
^
10 3
12 2 ( B )
则变量 x 与 y 之间的线性回归直线方程可能为 A.y=0.7x-2.3
^
B.y=-0.7x+10.3
^
C.y=-10.3x+0.7
D.y=10.3x-0.7
[ 解析]
根据表中数据,得;
1 33 x =4(6+5+10+12)= 4 , 1 y =4(6+5+3+2)=4, 且变量 y 随变量 x 的增大而减小,是负相关,
xi- x yi- y
i=1 n
n
^ ^ i= 1 2.回归直线方程为 y = b x+ a ,其中 b =__________________ ^ ( x__ , y __ ) ____称为样本点的中心. y - b x __________ ,____ __
^
^
x i- x 2
i=1
18542.
2 2 2 2 2 2 2 = 7 + 11 + 21 + 24 + 66 + 115 + 325 =124393, y2 i i=1 7
-- x y - 7 x y ii
i=1
7
∴r=
7 2 2 2 xi -7 x y2 - 7 y i i=1 i=1
7
18542-7×27.4×81.3 = 5414-7×27.42×124393-7×81.32 2948.66 ≈3520.92=0.8639. 由于 r=0.8639>0.75,∴x 与 y 具有线性相关关系.
^ 33 33 所以,验证 x = 4 时,y=-0.7× 4 +10.3≈4, ^
即回归直线y=-0.7x+10.3 过样本中心点( x , y ). 故选 B.
3.(2016· 武汉高二检测)在一次对人体脂肪含量和年龄关系的研究中,研究人 员获得了一组样本数据: 年龄 脂肪 23 9.5 27 17.8 39 21.2 41 25.9 45 27.5 49 26.3 50 28.2 53 29.6 56 31.4 58 33.5 60 35.2