复习课:变量间的相关关系

合集下载

高考数学(理)一轮复习课件:统计与概率-3变量间的相关关系与统计案例(人教A版)

高考数学(理)一轮复习课件:统计与概率-3变量间的相关关系与统计案例(人教A版)
第十章 统计与概率
第3课时 变量间的相关关系与统计案例
考纲下载 1.会作两个有关联变量的数据的散点图,会利用散点 图认识变量间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归方 程系数公式建立线性回归方程.
3.了解独立性检验(只要求 2×2 列联表)的基本思想、 方法及其简单应用.
4.了解回归分析的基本思想、方法及其简单应用.
y2 总计
x1
a
x2
2
总计 b
21 73 25 27 46
则表中a、b处的值分别为( )
A.94、96
B.52、50
C.52、54
D.54、52
答案:C 解析:a=73-21=52,b=a+2=54,故选C.
5. [原创]某医疗研究所为了了解某种血清预防感冒的 作用,把 500 名使用过血清的人与另外 500 名未使用血清 的人一年中的感冒记录作比较,提出假设 H0:“这种血清 不能起到预防感冒的作用”,利用 2×2 列联表计算得 K2 ≈3.918,经查临界值表知 P(K2≥3.841)≈0.05.则下列结论 中,正确结论的序号是________.
x1 x2 总计
y1 a c a+c
y2 b d b+d
总计 a+b c+d a+b+c+d
随机变量 K2=(a+b)(cn+(da)d-(bac+)c2)(b+d), 其中 n=a+b+c+d 为样本容量.
(3)独立性检验 利用随机变量 K2 来确定在多大程度上可以认为“两
个分分类类变变量量有有关关系系”的方法称为两个分类变量的独立性
nn
(xi - x )(y i- y )
ii==11
为:^b=
, ^a=y-y---^b^bx-x- .

变量之间的关系(带答案)

变量之间的关系(带答案)

变量之间的关系(带答案)变量之间的关系、表达⽅法复习知识要点表⽰变量的三种⽅法:列表法、解析法(关系式法)、图象法◆要点1 变量、⾃变量、因变量(1) 在⼀变化的过程中,可以取不同数值的量叫做变量,数值保持不变的量叫做常量,常量和变量往往是相对的,相对于某个变化过程。

(2) 在⼀变化的过程中,主动发⽣变化的量,称为⾃变量,⽽因变量是随着⾃变量的变化⽽发⽣变化的量。

例如⼩明出去旅⾏,路程S、速度V、时间T三个量中,速度V⼀定,路程S则随着时间T的变化⽽变化。

则T为⾃变量,路程为因变量。

◆要点2 列表法与变量之间的关系(1) 列表法是表⽰变量之间关系的⽅法之⼀,可表⽰因变量随⾃变量的变化⽽变化的情况。

(2) 从表格中获取信息,找出其中谁是⾃变量,谁是因变量。

找⾃变量和因变量时,主动发⽣变化的是⾃变量,因变量随⾃变量的增⼤⽽增⼤或减⼩◆要点3 ⽤关系式表⽰变量之间的关系(1) ⽤来表⽰⾃变量与因变量之间关系的数学式⼦,叫做关系式,是表⽰变量之间关系的⽅法之⼀。

(2) 写变化式⼦,实际上根据题意,找到等量关系,列⽅程,但关系式的写法⼜不同于⽅程,必须将因变量单独写在等号的左边。

即实质是⽤含⾃变量的代数式表⽰因变量。

(3) 利⽤关系式求因变量的值,①已知⾃变量与因变量的关系式,欲求因变量的值,实质就是求代数式的值;②对于每⼀个确定的⾃变量的值,因变量都有⼀个确定的与之对应的值。

◆要点4 ⽤图象法表⽰变量的关系(1) 图象是刻画变量之间关系的⼜⼀重要⽅式,特点是⾮常直观。

(2) 通常⽤横轴(⽔平⽅向的数轴)上的点表⽰⾃变量,⽤纵轴(竖直⽅向的数轴)上的点表⽰因变量。

(3) 从图象中可以获取很多信息,关键是找准图象上的点对应的横轴和纵轴上的位置,才能准确获取信息。

如利⽤图象求两个变量的对应值,由图象得关系式,进⾏简单计算,从图象上变量的变化规律进⾏预测,判断所給图象是否满⾜实际情景,所给变量之间的关系等。

(4) 对⽐看:速度—时间、路程—时间两图象★若图象表⽰的是速度与时间之间的关系,随时间的增加即从左向右,“上升的线段”①表⽰速度在增加;“⽔平线段”②表⽰速度不变,也就是做匀速运动,“下降的线段”③表⽰速度在减少。

高中高中数学第二章统计2.3.1变量之间的相关关系2.3.2两个变量的线性相关课件新人教A版必修3

高中高中数学第二章统计2.3.1变量之间的相关关系2.3.2两个变量的线性相关课件新人教A版必修3

解:(1)画出散点图.
(2)判断变量x,y是否具有相关关系?如果具有相关关系,那么是正相关还是 负相关?
解:(2)具有相关关系.根据散点图,左下角到右上角的区域,变量x的值由小 变大时,另一个变量y的值也由小变大,所以它们具有正相关关系.
方法技巧 两个随机变量x和y是否具有相关关系的确定方法: (1)散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断 (如本题); (2)表格、关系式法:结合表格或关系式进行判断; (3)经验法:借助积累的经验进行分析判断.
4
4
解:(2)由表中的数据得: xi yi =52.5, x =3.5, y =3.5, xi2 =54,
i 1
i 1
n
所以 b =
xi yi n x y
i 1
n
xi2

2Hale Waihona Puke nx=52.5 4 3.5 3.5 54 4 3.52
=0.7,
i 1
a = y - b x =3.5-0.7×3.5=1.05,
年份x
储蓄存款 y(千亿元)
2013 5
2014 6
2015 7
2016 8
2017 10
为了研究计算的方便,工作人员将上表的数据进行了处理,t=x-2 012,z=y-5 得到表2:
时间代号t
1
2
3
4
5
z
0
1
2
3
5
(1)求z关于t的线性回归方程;
5
5
解:(1) t =3, z =2.2, ti zi=45, ti2 =55,
知识探究
1.相关关系与函数关系不同 函数关系中的两个变量间是一种确定性关系,相关关系是一种不确定性关系. 2.正相关和负相关 (1)正相关 在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关 关系,我们就称它为正相关. (2)负相关 在散点图中,点散布在从左上角到右下角的区域,对于两个变量的这种相关 关系,我们就称它为负相关.

数学七年级下册知识点总结之变量之间的关系

数学七年级下册知识点总结之变量之间的关系

数学七年级下册知识点总结之变量之间的关系变量之间的关系知识点:一理论理解1、若Y随X的变化而变化,则X是自变量 Y是因变量。

自变量是主动发生变化的量,因变量是随着自变量的变化而发生变化的量,数值保持不变的量叫做常量。

2、能确定变量之间的关系式:相关公式①路程=速度时间②长方形周长=2(长+宽)③梯形面积=(上底+下底)高2 ④本息和=本金+利率本金时间。

⑤总价=单价总量。

⑥平均速度=总路程总时间3、若等腰三角形顶角是y,底角是x,那么y与x的关系式为y=180-2x.二、列表法:采用数表相结合的形式,运用表格可以表示两个变量之间的关系。

列表时要选取能代表自变量的一些数据,并按从小到大的顺序列出,再分别求出因变量的对应值。

列表法最大的特点是直观,可以直接从表中找出自变量与因变量的对应值,但缺点是具有局限性,只能表示因变量的一部分。

三.关系式法:关系式是利用数学式子来表示变量之间关系的等式,利用关系式,可以根据任何一个自变量的值求出相应的因变量的值,也可以已知因变量的值求出相应的自变量的值。

四、图像注意:a.认真理解图象的含义,注意选择一个能反映题意的图象;b.从横轴和纵轴的实际意义理解图象上特殊点的含义(坐标),特别是图像的起点、拐点、交点八、事物变化趋势的描述:对事物变化趋势的描述一般有两种:1.随着自变量x的逐渐增加(大),因变量y逐渐增加(大)(或者用函数语言描述也可:因变量y随着自变量x的增加(大)而增加(大));2. 随着自变量x的逐渐增加(大),因变量y逐渐减小(或者用函数语言描述也可:因变量y随着自变量x的增加(大)而减小).注意:如果在整个过程中事物的变化趋势不一样,可以采用分段描述.例如在什么范围内随着自变量x的逐渐增加(大),因变量y逐渐增加(大)等等.九、估计(或者估算) 对事物的估计(或者估算)有三种:1.利用事物的变化规律进行估计(或者估算).例如:自变量x每增加一定量,因变量y的变化情况;平均每次(年)的变化情况(平均每次的变化量=(尾数-首数)/次数或相差年数)等等;2.利用图象:首先根据若干个对应组值,作出相应的图象,再在图象上找到对应的点对应的因变量y的值;3.利用关系式:首先求出关系式,然后直接代入求值即可.拓展:数学学习技巧一、课内重视听讲,课后及时复习。

高中数学第二章统计23变量间的相关关系课件新人教A版必修3(2)

高中数学第二章统计23变量间的相关关系课件新人教A版必修3(2)

总费用y/万元 2.2 3.8 5.5 6.5 7.0
(1)根据表格数据,画出散点图;
(2)求线性回归方程y^=b^x+a^的系数a^,b^; (3)估计使用年限为 10 年时,车的使用总费用是多少?
【解题探究】(1)利用描点法作出散点图; (2)把数据代入公式,可得回归方程的系数; (3)把x=10代入回归方程得y值,即为总费用的估计 值.
【答案】A 【解析】在A中,若b确定,则a,b,c都是常数,Δ= b2-4ac也就唯一确定了,因此,这两者之间是确定性的函数 关系;一般来说,光照时间越长,果树亩产量越高;降雪量越 大,交通事故发生率越高;施肥量越多,粮食亩产量越高,所 以B,C,D是相关关系.故选A.
两个变量x与y相关关系的判断方法 1.散点图法:通过散点图,观察它们的分布是否存在 一定规律,直观地判断.如果发现点的分布从整体上看大致在 一条直线附近,那么这两个变量就是线性相关的,注意不要受 个别点的位置的影响. 2.表格、关系式法:结合表格或关系式进行判断. 3.经验法:借助积累的经验进行分析判断.
变量之间的相关关系的判断
【 例 1】 下 列 变 量 之 间 的 关 系 不 是 相 关 关 系 的 是 ()
A.二次函数y=ax2+bx+c中,a,c是已知常数,取b 为自变量,因变量是判别式Δ=b2-4ac
B.光照时间和果树亩产量 C.降雪量和交通事故发生率 D.每亩田施肥量和粮食亩产量
【解题探究】判断两个变量之间具有相关关系的关键是 什么?
①反映^y与 x 之间的函数关系;
②反映 y 与 x 之间的函数关系;
③表示^y与 x 之间的不确定关系;
④表示最接近 y 与 x 之间真实关系的一条直线.
A.①②

高三数学人教版A版数学(理)高考一轮复习教案变量间的相关关系、统计案例1

高三数学人教版A版数学(理)高考一轮复习教案变量间的相关关系、统计案例1

第四节 变量间的相关关系、统计案例变量间的相关关系、统计案例 1.变量间的相关关系(1)会作两个有关联变量的数据的散点图,会利用数点图认识变量间的相关关系. (2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 2.统计案例了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题. (1)独立性检验了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用. (2)回归分析了解回归分析的基本思想、方法及其简单应用. 知识点一 回归分析 1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.(2)回归方程为y ^=b ^x +a ^,其中b ^=∑ni =1x i y i -n x y∑ni =1x 2i -n x 2,a ^=y -b ^x . (3)通过求Q =∑ni =1(y i -bx i -a )2的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫作最小二乘法.(4)相关系数:当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.易误提醒1.易混淆相关关系与函数关系,两者的区别是函数关系是一种确定的关系,而相关关系是一种非确定的关系,函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(x ,y )点,可能所有的样本数据点都不在直线上 .3.利用回归方程分析问题时,所得的数据易误认为准确值,而实质上是预测值(期望值).[自测练习]1.已知x ,y 的取值如下表,从散点图可以看出y 与x 线性相关,且回归方程为y ^=0.95x +a ^,则a ^=( )x 0 1 3 4 y2.24.3 4.86.7A.3.25 B .2.6 C .2.2D .0解析:∵回归直线必过样本点的中心(x ,y ),又x =2,y =4.5,代入回归方程,得a ^=2.6.答案:B2.(2016·镇江模拟)如图所示,有A ,B ,C ,D ,E 5组(x ,y )数据,去掉________组数据后,剩下的4组数据具有较强的线性相关关系.解析:由散点图知呈带状区域时有较强的线性相关关系,故去掉D . 答案:D知识点二 独立性检验 独立性检验假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为:y1y2总计x1 a b a+bx2 c d c+d总计a+c b+d a+b+c+dK2=n(ad-bc)2(a+b)(a+c)(b+d)(c+d)(其中n=a+b+c+d为样本容量).易误提醒(1)独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.(2)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表.在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果做出错误的解释.[自测练习]3.下面是2×2列联表:y1y2总计x1 a 2173x2222547总计 b 46120则表中a,b的值分别为()A.94,72B.52,50C.52,74 D.74,52解析:∵a+21=73,∴a=52,又a+22=b,∴b=74.答案:C考点一相关关系的判断|1.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()A.r2<r4<0<r3<r1B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1D.r2<r4<0<r1<r3解析:易知题中图(1)与图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图(2)中的样本点集中分布在一条直线附近,则r2<r4<0<r3<r1.答案:A2.(2015·高考湖北卷)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关解析:因为y=-0.1x+1,x的系数为负,故x与y负相关;而y与z正相关,故x与z 负相关.答案:C相关关系的判断的两种方法(1)散点图法.(2)相关系数法:利用相关系数判定,当|r|越趋近于1相关性越强.考点二回归分析|(2015·高考全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费x i和年销售量y i(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.xyw∑8i =1(x i -x)2∑8i =1(w i -w)2∑8i =1(x i -x )(y i-y )∑8i =1(w i -w )(y i -y ) 46.6 563 6.8 289.8 1.6 1 469108.8表中w i =x i ,w =18∑i =1w i.(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β^=∑ni =1 (u i -u )(v i -v )∑ni =1(u i -u )2,α^=v -β^ u . [解] (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程.由于 d ^=∑8i =1(w i -w )(y i -y )∑8i =1 (w i -w )2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w ,因此y 关于x 的回归方程为y ^=100.6+68x .(3)①由(2)知,当x =49时,年销售量y 的预报值 y ^=100.6+6849=576.6, 年利润z 的预报值 z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值 z ^=0.2(100.6+68x )-x =-x +13.6x +20.12. 所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.回归直线方程的求法(1)利用公式,求出回归系数b ^,a ^.(2)待定系数法:利用回归直线过样本点中心求系数.1.(2016·银川一中模拟)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.x 3 4 5 6 y2.5344.5(1)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^. (2)已知该厂技改前,100吨甲产品的生产能耗为90吨标准煤,试根据(1)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)解:(1)由对照数据,计算得∑4i =1x 1y 1=66.5,∑4i =1x 21=32+42+52+62=86,x =4.5,y =3.5,b ^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,a ^=y -b ^x =3.5-0.7×4.5=0.35,所求的回归方程为y ^=0.7x +0.35.(2)x =100,y ^=100×0.7+0.35=70.35,预测生产100吨甲产品的生产能耗比技改前降低90-70.35=19.65(吨标准煤).考点三 独立性检验|(2016·邯郸模拟)为了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对30名六年级学生进行了问卷调查得到如下列联表.平均每天喝500 mL 以上为常喝,体重超过50 kg 为肥胖.常喝 不常喝 合计 肥胖 2 不肥胖 18 合计30已知在全部30人中随机抽取1人,抽到肥胖的学生的概率为415.(1)请将上面的列联表补充完整.(2)是否有99.5%的把握认为肥胖与常喝碳酸饮料有关?说明你的理由.(3)设常喝碳酸饮料且肥胖的学生中有2名女生,现从常喝碳酸饮料且肥胖的学生中抽取2人参加电视节目,则正好抽到一男一女的概率是多少?参考数据:K 2≥k 0 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 02.0722.7063.8415.0246.6357.87910.828参考公式:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .[解] (1)设常喝碳酸饮料肥胖的学生有x 人,x +230=415,解得x =6.常喝 不常喝 合计 肥胖 6 2 8 不肥胖 4 18 22 合计102030(2)由已知数据可求得K 2=30×(6×18-2×4)210×20×8×22≈8.523>7.879.因此有99.5%的把握认为肥胖与常喝碳酸饮料有关.(3)设常喝碳酸饮料的肥胖男生为A ,B ,C ,D ,女生为E ,F ,任取两人的取法有AB ,AC ,AD ,AE ,AF ,BC ,BD ,BE ,BF ,CD ,CE ,CF ,DE ,DF ,EF ,共15种.其中一男一女的取法有AE ,AF ,BE ,BF ,CE ,CF ,DE ,DF ,共8种.故抽出一男一女的概率是P =815.解独立性检验的应用问题的关注点(1)两个明确: ①明确两类主体; ②明确研究的两个问题. (2)两个关键:①准确画出2×2列联表; ②准确理解K 2.提醒:准确计算K 2的值是正确判断的前提.2.通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下的列联表:男 女 总计 走天桥 40 20 60 走斑马线 20 30 50 总计6050110K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),n =a +b +c +d .附表:P (K 2≥k 0)0.050 0.010 0.001 k 03.8416.63510.828A .有99%以上的把握认为“选择过马路的方式与性别有关”B .有99%以上的把握认为“选择过马路的方式与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关” 解析:K 2=110×(40×30-20×20)260×50×60×50≈7.8.P (K 2≥6.635)=0.01=1-99%,∴有99%以上的把握认为“选择过马路的方式与性别有关”,故选A.答案:A12.独立性检验与概率交汇综合问题的答题模板【典例】(12分)(2016·保定调研)某高校为调查学生喜欢“应用统计”课程是否与性别有关,随机抽取了选修课程的55名学生,得到数据如下表:(1)判断是否有(2)用分层抽样的方法从喜欢统计课程的学生中抽取6名学生做进一步调查,将这6名学生作为一个样本,从中任选2人,求恰有1个男生和1个女生的概率.下面的临界值表供参考:(参考公式:K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d)[规范解答](1)由公式K2=55×(20×20-10×5)230×25×25×30≈11.978>7.879,(3分) 所以有99.5%的把握认为喜欢“应用统计”课程与性别有关.(6分)(2)设所抽样本中有m个男生,则630=m20,得m=4,所以样本中有4个男生,2个女生,分别记作B1,B2,B3,B4,G1,G2.从中任选2人的基本事件有(B1,B2),(B1,B3),(B1,B4),(B1,G1),(B1,G2),(B2,B3),(B2,B4),(B2,G1),(B2,G2),(B3,B4),(B3,G1),(B3,G2),(B4,G1),(B4,G2),(G1,G2),共15个,(9分)其中恰有1个男生和1个女生的事件有(B1,G1),(B1,G2),(B2,G1),(B2,G2),(B3,G1),(B3,G2),(B4,G1),(B4,G2),共8个.(11分)所以恰有1个男生和1个女生的概率为815.(12分)[模板形成]分析2×2列联表数据↓利用K 2公式计算K 2值↓对分类变量的相关性作出判断↓求相应事件的概率↓反思解题过程,注意规范化[跟踪练习] 某班主任对全班50名学生学习积极性和参加社团活动情况进行调查,统计数据见下表所示:(1)加社团活动且学习积极性一般的学生的概率是多少?(2)运用独立性检验的思想方法分析:学生的学习积极性与参加社团活动情况是否有关系?并说明理由.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d );其中n =a +b +c +d .解:(1)随机从该班抽查一名学生,抽到参加社团活动的学生的概率是2250=1125;抽到不参加社团活动且学习积极性一般的学生的概率是2050=25.(2)因为K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=50×(17×20-5×8)225×25×22×28≈11.688>10.828,所以大约有99.9%的把握认为学生的学习积极性与参加社团活动情况有关系.A 组 考点能力演练1.根据如下样本数据得到的回归方程为y ^=b ^x +a ^,则( )A.a ^>0,b ^>0 B.a >0,b <0 C.a ^<0,b ^>0D.a ^<0,b ^<0解析:把样本数据中的x ,y 分别当作点的横、纵坐标,在平面直角坐标系xOy 中作出散点图(图略),由图可知b ^<0,a ^>0.故选B.答案:B2.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能为( )A.y ^=0.4x +2.3 B.y ^=2x -2.4 C.y ^=-2x +9.5D.y^=-0.3x +4.4解析:依题意知,相应的回归直线的斜率应为正,排除C ,D.且直线必过点(3,3.5),代入A ,B 得A 正确.答案:A3.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:附表及公式K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .则下面的正确结论是( )A .有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”B .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”D .有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”解析:由2×2列联表得到a =45,b =10,c =30,d =15,则a +b =55,c +d =45,a +c =75,b +d =25,ad =675,bc =300,n =100,计算得K 2的观测值k 0=100×(675-300)255×45×75×25≈3.030.因为2.706<3.030<3.841,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”,故选A.答案:A4.根据如下样本数据:得到的回归方程为y =b x +a .若样本点的中心为(5,0.9),则当x 每增加1个单位时,y 就( )A .增加1.4个单位B .减少1.4个单位C .增加7.9个单位D .减少7.9个单位解析:依题意得,a +b -25=0.9,故a ^+b ^=6.5①;又样本点的中心为(5,0.9),故0.9=5b ^+a ^②,联立①②,解得b ^=-1.4,a ^=7.9,则y ^=-1.4x +7.9,可知当x 每增加1个单位时,y 就减少1.4个单位,故选B.答案:B5.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为y =b x +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′ B.b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′解析:由两组数据(1,0)和(2,2)可求得直线方程为y =2x -2,b ′=2,a ′=-2.而利用线性回归方程的公式与已知表格中的数据,可求得b ^=∑6i =1x i y i -6x ·y ∑6i =1x 2i -6x2=58-6×72×13691-6×⎝⎛⎭⎫722=57,a ^=y -b ^x =136-57×72=-13,所以b ^<b ′,a ^>a ′.答案:C6.(2016·忻州联考)已知x ,y 的取值如下表:从散点图分析,y 与x 线性相关,且回归方程为y =1.46x +a ,则实数a ^的值为________. 解析:x =2+3+4+54=3.5,y =2.2+3.8+5.5+6.54=4.5,回归方程必过样本的中心点(x ,y ).把(3.5,4.5)代入回归方程,计算得a ^=-0.61.答案:-0.617.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:(请用百分数表示).解析:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=50×(20×15-5×10)225×25×30×20≈8.333>7.879.答案:0.5%8.已知下表所示数据的回归直线方程为y ^=4x +242,则实数a =________.解析:回归直线y ^=4x +242必过样本点的中心点(x ,y ),而x =2+3+4+5+65=4,y =251+254+257+a +2665=1 028+a 5,∴1 028+a 5=4×4+242,解得a =262.答案:2629.(2015·东北三校联考)某学生对其亲属30人的饮食习惯进行了一次调查,并用下图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)(1)根据以上数据完成下列2×2列联表:主食蔬菜主食肉类合计 50岁以下 50岁以上 合计(2)能否有99% 解:(1)2×2列联表如下:主食蔬菜主食肉类合计 50岁以下 4 8 12 50岁以上 16 2 18 合计201030(2)因为K 2=30×(8-128)212×18×20×10=10>6.635,所以有99%的把握认为其亲属的饮食习惯与年龄有关.10.(2015·高考重庆卷)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份 2010 2011 2012 2013 2014 时间代号t12345(1)求y 关于t 的回归方程y =b t +a ;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款. 附:回归方程y ^=b ^t +a ^中, b ^=∑ni =1t i y i -n t y ∑ni =1t 2i -n t2,a ^=y -b ^t .解:(1)列表计算如下这里n =5,t =1n ∑n i =1t i =155=3,y =1n ∑n i =1y i =365=7.2. 又l tt =∑ni =1t 2i -n t2=55-5×32=10,l ty =∑ni =1t i y i-n t y =120-5×3×7.2=12,从而b ^=l ty l tt =1210=1.2,a ^=y -b ^t =7.2-1.2×3=3.6,故所求回归方程为y ^=1.2t +3.6.(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^=1.2×6+3.6=10.8(千亿元).B 组 高考题型专练1.(2015·高考福建卷)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C.12.0万元D.12.2万元^=0.76,∴a^=8-0.76×10=0.4,∴回归方程为y^=0.76x 解析:∵x=10.0,y=8.0,b+0.4,把x=15代入上式得,y^=0.76×15+0.4=11.8(万元),故选B.答案:B2.(2015·高考北京卷)高三年级267位学生参加期末考试,某班37位学生的语文成绩、数学成绩与总成绩在全年级中的排名情况如图所示,甲、乙、丙为该班三位学生.从这次考试成绩看,(1)在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是________;(2)在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是________.解析:(1)由题图分析乙的语文成绩名次略比甲的语文成绩名次靠前,但总成绩名次靠后,所以甲、乙两人中语文成绩名次比总成绩靠前的是乙;(2)丙同学的数学成绩名次位于中间稍微靠后,而总成绩名次相对靠后,所以丙同学的语文成绩名次比较靠后,所以丙同学的成绩名次靠前的科目是数学.答案:乙数学。

【精品课件】新教材一轮复习北师大版第10章第3讲变量间的相关关系、统计案例课件

【精品课件】新教材一轮复习北师大版第10章第3讲变量间的相关关系、统计案例课件

求得回归方程^y=0.67x+54.9.
零件数 x(个) 10 20 30 40 50
加工时间 y(min) 62
75 81 89
现发现表中有一个数据看不清,请你推断出该数据的值为__6_8__.
第十章 统计、统计案例
高考一轮总复习 • 数学(新高考)
[解析] 由-x =30,得-y =0.67×30+54.9=75. 设表中的“模糊数字”为 a, 则 62+a+75+81+89=75×5,∴a=68.
第十章 统计、统计案例
高考一轮总复习 • 数学(新高考)
返回导航
5.(2019·高考全国Ⅰ卷)某商场为提高服务质量,随机调查了 50 名 男顾客和 50 名女顾客,每位顾客对该商场的服务给出满意或不满意的评 价,得到下面列联表:
满意 不满意 男顾客 40 10 女顾客 30 20
第十章 统计、统计案例
高考一轮总复习 • 数学(新高考)
考点一
相关关系的判断——自主练透
(1)(2021·四 川 资 阳 模
拟)在一次对人体脂肪含量和年龄关
系的研究中,研究人员获得了一组样
本数据,并制作成如图所示的人体脂
肪含量与年龄关系的散点图.根据该
图,下列结论中正确的是 ( )
返回导航
第十章 统计、统计案例
高考一轮总复习 • 数学(新高考)
积相近的 200 个地块,从这些地块中用简单随机抽样的方法抽取 20 个作
为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中 xi 和 yi 分别表 示第 i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计
20
20
20
算得xi=60,yi=1 200,

高考新课标数学(理)大一轮复习课时作业66变量间的相关关系、统计案例 Word版含解析

高考新课标数学(理)大一轮复习课时作业66变量间的相关关系、统计案例 Word版含解析

课时作业变量间的相关关系、统计案例
一、选择题
.在一组样本数据(,),(,),…,(,)(≥,,,…,不全相等)的散点图中,若所有样本点(,)(=,,…,)都在直线=
+上,则这组样本数据的样本相关系数为( )
.-.

解析:样本点都在一条直线上时,其样本数据的相关系数为.
答案:
.根据如下样本数据
得到的回归方程为=+,则().>,> .>,<
.<,> .<,<
解析:由表中数据画出散点图,如图,
由散点图可知<,>,选.
答案:
.(·辽宁大连双基)已知,的取值如表所示:
如果与线性相关,且线性回归方程为=+,则的值为()
.-
.-
解析:将=,=代入到=+中,得=-.故选.
答案:
.(·湖北武汉调考)根据如下样本数据
得到的回归直线方程为=+.若=,则每增加个单位,就()
.增加个单位
.减少个单位
.减少个单位
.增加个单位
解析:=(++++)=,=(+-+-)=,所以样本中心为(,),代入
回归直线方程可得=×+⇒
=-,所以每增加个单位,就减少个单位,故选.
答案:.(·兰州、张掖联考)对具有线性相关关系的变量,有一组观测数据(,)(=,,…,),其回归直线方程是=+,且+++…+=(+++…+)=,则实数的值是()
解析:依题意可知样本中心点为,则=×+,解得=.
答案:.(·东营一模)某商品的销售量(件)与销售价格(元件)存在线性相关关。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

求回归方程的关键是如何用数学的方法来 刻画“从整体上来看,各点与此直线的距离最 小”
回归方程的斜率与截距的一般公式
n ì ï ï å xi yi - nx y ï ï ï b = i= 1 ï n í 2 2 ï å xi - nx ï ï i= 1 ï ï a = y - bx ï î 其 中 b是 回 归 方 程 的 斜 率 , a 是 截 距 .
n n
邋 xi
i= 1
y=
1 n
yi
i= 1
则 ( x , y )为 样 本 点 的 中 心 , 回 归 直 线 一 定 过 这 一 点 .
三、利用回归方程进行预测
年龄 脂肪 年龄 脂肪 23 9.5 53 29.6 表2--3 27 17.8 54 30.2 人体脂肪百分比和年龄 39 41 45 49 21.2 25.9 27.5 26.3 56 57 58 60 31.4 30.8 33.5 35.2 50 28.2 61 34.6
人体脂肪百分比和年龄 年龄 23 27 脂肪 9.5 17.8
年龄 脂肪
探究:人体脂肪含量和年龄的关系
39 21.2 41 25.9 45 27.5 49 26.3 50 28.2
53 54 56 57 58 60 61 29.6 30.2 31.4 30.8 33.5 35.2 34.6 根据上述数据,人体的脂肪含量与年龄之间有怎样的关系?
请你进行类比:比照平均数与样本数据之
间的关系,你能说说回归直线与散点图中各点之 间的关系吗? 平均数是样本数据的中心, 类似的,回归直线通过样 本点的中心且处于散点图中各点的“中心位臵”。 何为样本点的中心呢?
假 设 样 本 点 为 ( x 1 , y 1 ), ( x 2 , y 2 ), … , ( x n , y n ), 记 x= 1 n
ˆ 所 求 回 归 方 程 为 : y = 0 .5 7 7 x - 0 .4 4 8
将表2—3中的某个年龄作为x(如50)代入 上述回归方程,看看求出回归值与真实数 值之间的关系. 从中你体会到什么?
通过比较发现表中样本个体脂肪值和由 回归方程计算得到的值很接近,体会到有时 可用回归方程来预测特定年龄的人的脂肪值.
二、 回归直线、回归方程
如果散点图中点的分布从整体上看大致在一条直 线附近,我们就称两个变量之间具有线性相关关系;这 条直线叫做回归直线;这条回归直线的方程简称回归 方程.
60 50 40 30 20 10 0 -10 -10 0 10 20 30 40
y = -1.3336x + 42.125
那么,我们应当如何求出这个回归方程呢?
作散点图:
请观察图形,你能 提取什么信息? 1.年龄越大, 脂肪 含量越高
40
脂肪含量
30 20 10 0 0 20 40 60 年龄 80
2. 散布在从左下角 到右上角的区域
40
脂肪含量
30 20 10 0 0 20 40 60 年龄 80
正相关----指的是两个变量有相同的变化趋势,
即从总体上看一个变量会随另一个变大而变大.
通过求②式的最小值得出回归直线的方法, 即求 回归直线,使得样本数据的点到它距离的平方和最小, 这 一 方 法 叫 最 小 二 乘 法.
线性回归方程和它所作的预测具有随机性 的特点. 实际上,线性回归方程中的截距和斜 率都是通过样本估计出来的, 存在随机误差, 这种误差可以导致预测结果的偏差;即使截距 和斜率的估计没有误差, 也不可能百分之百地 保证预测值与实际值很接近, 因为该点可能离 回归直线较远.
你能举出一些生活中的变量成正相关或负相关的例子吗?
相关关系的强与弱 用相关系数r进行相关程度的判断标准:
n
å
r=
n i= 1
( x i - x )( y i n i 2 i= 1
y)
2
邋( x
i= 1
- x)
( yi -
y)
当r>0时,表明两个变量正相关;当r<0时,表明两个 变量负相关. r的绝对值越接近1,表明两个变量的线 性相关性越强; r的绝对值越接近0, 表明两个变量 之间几乎不存在线性相关关系. 通常当r>0.75时, 认为两个变量有很强的线性相关关系.
6 5 4 3 2 1 0
( x i , yi )
ˆ yi - yi
{
0
2
4
6
6 5 4 3 2 1
0
ˆ yi - yi
( x i , yi )
{
2
4
6
ˆ 1 . y i = b x i + a ( i = 1, 2 , , n ).它 与 实 际 收 集 到 的 之 间 的 偏 差 是 : yi 差 ” ,由 于 ( y i n
ˆ yi = yi - (bx i + a ) ˆ y )可 正 可 负 , 会 相 互 抵 消 .
2 .用 这 n 个 偏 差 的 和 来 刻 画 “ 各 点 与 此 直 线 的 整 体 偏
3 .考 虑 用 å
i= 1
yi -
ˆ y来代替, 但由于它含有绝对值, 运
算不太方便;.
6 5 4 3 2 1
复习课 变量间的相关关系
一、相关关系
在现实问题中,处于同一个过程中的一些变量,往 往是相互依赖和相互制约的,它们之间的相互关系大 致可分为两种. (1)确定性关系——函数关系; (2)非确定性关系——相关关系; 当自变量的取值一定,因变量的取值带有一定 随机性时,两个变量之间的关系称为相关关系. 相关关系表现为这些变量之间有一定的依赖关 系,但这种关系并不完全确定,它们之间的关系不能 精确地用函数表示出来,这些变量其实是随机变 量,或至少有一个是随机变量.
散点图的特点:这些点分布在从左下角到右
上角的区域
与此相应,负相关指的是什么? 散点图有什么特点? 负相关----指的是两个变量有相反的变化趋势,即从 总体上看一个变量会随另一个变大反而变小. 散点图的特点是:这些点分布在从左上角到右下角 60 的区域
50 40 30 20 10 0 -10 0 10 20 30 40
四、小结:
研究两变量线性相关关系的一般步骤: 1)收集数据; 2)画散点图; 3)判断相关关系; 4)求回归方程; 5)进行预测.
0
( x i , yi )
ˆ yi - yi
{
4
2
2
2
6
2
4.改 用 Q 来 刻 画 n 个 点 与 回 归 直 线 在 整 体 上 的 偏 差 :
Q = ( y 1 - bx 1 - a ) + ( y 2 - bx 2 - a ) + + ( y n - bx n - a ) ②
5 .问 题 就 归 结 为 : 当 a 、 取 什 么 值 时 Q 最 小 , 的体内脂肪含量可能是多少? 20.87%
注:这个脂肪含量是对年龄为37岁的人群
中的大部分人所作的估计.
我们不需要记忆这个公式,但我们应该了解得出它的 原理——最小二乘法
假设我们已经得到两个具有线性相关关系的变量 的 一 组 数 据 :x 1 , y 1 ), ( x 2 , y 2 ), … , ( x n , y n ), 且 所 求 回 归 方 ( ˆ 程 是 y = b x + a , 其 中 a 、b 是 待 定 的 系 数 .
你能举出现实生活中具有相关关系的例子吗?
1.商品销售收入与广告支出经费之间的关系 2.粮食产量与施肥量之间的关系 3.人体内的脂肪含量与年龄之间的关系 4.吸烟与健康 5.收入与消费……
知识要点
1,上述例子中,两个变量之间是一种不确定性的关 系,产生这种关系的原因是受到许多不确定的随机 因素的影响; 2.既然变量之间的相关关系带有不确定性,就需要 通过收集大量的数据(调查、实验),在对数据进行 统计分析的基础上,发现其中的规律.
相关文档
最新文档