人教B版高中数学选修12 1.2 回归分析(二)测试(教师版)
高中数学新人教B版选修1-2回归分析

回归分析1.线性回归模型在回归直线方程y =bx + a 中n______' x i y i — nx yi = 1y —— y ——,a = y — b x .n—、x 2 —代1 2i = 11 n — 1 n其中x = -v x i , y = 一Vy i, ( x , y )称为样本点的中心.n i = 1n i = 12. 线性相关性检验(1) 对于变量x 与Y 随机抽取到的n 对数据(X 1, y 1),(X 2, y 2)…,(X n , y n ),检验统计量是 样本相关系数刀 0i — x 加一y ) 寸刀0— x 徑(yj —y $刀 X i y i — n x y''刀x 2 — n x 2 E y i 2— n y 2r 具有以下性质:|r|w 1,并且r 越接近1,线性相关程度越强;|r|越接近0,线性相关 程度越弱. 2 检验步骤如下: ① 作统计假设:x 与Y 不具有线性相关关系.② 根据小概率0.05与n — 2在附表中查岀r 的一个临界值「。
皿③ 根据样本相关系数计算公式算出 r 的值.④作出统计推断.如果|r|>r °05,表明有95%把握认为x 与Y 之间具有线性相关关系. 如果辿型,我们没有理由拒绝原来的假设,这时寻找回归直线方程是毫无意义的.[归纳*升华.领悟] --------------------------------- '1•线性回归分析的方法、步骤(1) 确定研究对象,明确是求哪一个变量对哪一个变量的回归方程. (2) 画散点图或计算相关系数 r ,判断两个变量之间是否线性相关.恬*辿盲瓷匕叮m.咅[对应学生用书P6]1.2i 邛一 x y - y⑶若两变量线性相关,可用公式计算b , a 的值.(4)写出线性回归方程,利用它来预测一些变量的对应值.2 •在求线性回归直线方程时,要先判断两变量的相关性,否则求出的回归直线方程, 可能没有任何意义.LZSI|回归直线方程[例1]假设某设备的使用年限 x(年)和所支出的维修费用Y(万元)有如下的统计资料: x 2 3 4 5 6 Y2.23.85.56.57.0试求:(1)Y 对x 的回归直线方程;(2)当使用年限为10年时,估计维修费用是多少?[思路点拨]先作出散点图,再根据散点图分析支出的维修费用与使用年限是否线性相关,若相关,再利用线性回归方程求解,最后根据求得的方程估计[精解详析](1)根据表中数据作散点图,如图所示:y呂7 5 4 3 2 1 °C从散点图可以看出,样本点都集中分布在一条直线附近, 因此Y 与x 之间具有线性相关 关系•禾U用题中数据得:12 3 4 5 X i 2 3 4 5 6 y i 2.2 3.8 5.5 6.5 7.0 X i y i4.4 11.4 22.0 32.5 42.0 2 X i49162536离龌琴点题组化.名师一点就通[对应学生用书P6]10年时的维修费用. BA W0比「、「A S X i y i— 5 x y112.3 5 4 5所以b= —5 = l = 1.23,戸 3 4 5 x 290 —5 x 4厶x i — 5 x1=1A _ A _a= y —b x = 5 —1.23 x 4= 0.08,•••线性回归方程为y= 1.23x + 0.08.(2)当x= 10时,y= 1.23x 10+ 0.08= 12.38(万元),即当使用10年时,估计维修费用是12.38万元.[一点通]求回归直线方程的步骤:(1)作出散点图,从直观上分析相关关系;__ __ n n⑵计算x , y ,二X2,' X i y i ;i= 1 i =1(3) 代入公式计算a, b的值;(4) 写出回归方程.必处龜値弟剎公%1. (辽宁高考)调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:y= 0.254x + 0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加万元.解析:以x+ 1代替x,得A= 0.254(x+ 1) + 0.321,与y= 0.254x+ 0.321相减得年饮食支出平均增加0.254万元.答案:0.2542. 某班5名学生的数学和物理成绩如下表:3 画出散点图;4 求物理成绩Y对数学成绩x的回归直线方程;⑶一名学生的数学成绩是96,试预测他的物理成绩.解: (1)如图所示.5 _ _9080- .70- •t )0-• ••50 L L I J J J I.55 60 65 70 75 80 85 9D x1⑵因为 x = 5X (88+ 76+ 73+ 66+ 63) = 73.2, — 1y =丄X (78 + 65 + 71 + 64 + 61) = 67.8,55、X i y i = 88 X 78 + 76 X 65 + 73 X 71 + 66 X 64 + 63 X 61= 25 054 ,i = 15' x 2= 882+ 762+ 732 + 662+ 632= 27 174.i = 1a = y —b x ~67.8 — 0.625 X 73.2= 22.05. 所以Y 对x 的回归直线方程是y = 0.625x + 22.05. ⑶当 x = 96 时,则 y = 0.625X 96 + 22.05~ 82, 即可以预测他的物理成绩是 82.[据:⑵如果Y 与x 之间具有线性相关关系,求 Y 对x 的回归直线方程.[思路点拨]利用相关系数计算公式求出 r ;与临界值比较判断其相关性.5 vX i y i - 5 x yi = 1所以b ==Z x 2- 5亍i = 125 054- 5X 73.2X 67.8 27 174-5 X 73.220.625,7143.56 732 6 3427 2686897.57 0207393.57 5207 1107 987x = 157, y = 45.45,10 10 10 为并=246 598, X y2= 20 688.75,》x i y i = 71 413.5 i= 1 i = 1 i = 110 _于是' x2- 10V2= 246 598- 10X 1572= 108,i= 110 _\ y2- 10丁2= 20 688.75 - 10 X 45.452= 31.725 , 匸110 ________________' X i y—10 x y = 71 413.5- 10 X 157X 45.45= 57 , i = 110 _______________x X i y i - 10 x yi =10.974.57.108X 31.725查相关性检验的临界值表,得“a = 0.632.由于|r|>r°.05,因此认为Y与x之间有较强的线性相关关系.⑵设Y对x的回归直线方程为y= bx+ 则10一X i y i- 10 x yi =1Ab=10 —、X2- 10^2i = 1 571080.528,a= y - b x 疋 45.45 - 0.528X 157=- 37.446,故所求的Y对x的回归直线方程为y= 0.528x- 37.466.[一点通](1)在研究两个变量之间的关系时,一般通过散点图进行相关性检验,若具备线性相关关系,再求回归直线方程.如果两个变量不具备线性相关关系,即使求出回归直线方程也是毫无意义的,而且用其估计和预测的量也是不可信的.于是所求得的回归方程为: Q = 0.196 h 2.51. (12分)(2) 回归直线方程能定量地描述两个变量的关系,系数 a , b 刻画了两个变量之间的变化趋势,其中b 表示x 变化一个单位时,y 的平均变化量•利用回归直线可以对问题进行预测, 由一个变量的变化去推测另一个变量的变化. (3) 线性回归分析中: 相关系数r 的绝对值越大说明y 与x 的线性相关性越强. 3.某种产品的广告费支出 x 与销售额Y(单位:百万元)之间有如下对应数据:(1) 画出散点图;(2) 对两个变量进行相关性检验;(3) 求回归直线方程. 解:⑴散点图如图所示70^ •60 - + 50 • 40 - • 30 - 20・诃L ..................................... 广告费O 1^345678 *(右号元)广一告貴(2)计算各数据如下:1 380- 5X 5 X 50,145 — 5X 52 13 500— 5X 5020.92,查得 r o 』5= 0.878, r>r o.o5,故有 95%的把握认为该产品的广告费支出与销售额之间具有线性相关关系.5 _____v'x i y i —5 x yi=1 1 380—5X 5X 50 “A-5 ------------- = 2——=6・5 ,x2—5 廿145- 5 X 52i =1a= y —b x = 50 —6.5 X 5= 17.5,于是所求的回归直线方程是y = 6.5x+ 17.5.[例3](12[精解详析]由表中测得的数据可以作出散点图,如图150*10050 ‘■' :i !::■二(4 分)观察散点图中样本点的分布规律,可以判断样本点分布在某一条曲线附近,表示该曲线的函数模型是Q = m h n(m, n是正的常数)两边取常用对数,贝U lg Q= lg m + n lg h.令y = lg Q, x= lg h,那么y= nx+ lg m,即为线性函数模型y = bx+ a的形式(其中b= n, a = lg m). (6分)由下面的数据表,用最小二乘法可求得b~2.5 097, a =—0.7 077,所以n~2.51 ,m~ 0.196.于是所求得的回归方程为:Q = 0.196 h2.51. (12分)[一点通]非线性回归问题有时并不给出经验公式•这时我们可以画出已知数据的散点图,把它与学过的各种函数 (幕函数、指数函数、对数函数等 )图像作比较,挑选一种跟这些 散点拟合得最好的函数, 然后像本例这样,采用适当的变量变换, 把问题化为线性回归分析 问题,使之得到解决•其一般步骤为:曲us 原婦数据Ct, f )柞出祉点国 恨据散点團,选择恰当的拟合国数 作洽当的变决.捋其粹优成笛性圉 數*求贱性回归方桎在上面逋一步的星鼬上通i±相应的 菠换,即可释非戦牲回归方程试建立Y 对x 之间的回归方程.解:作出变量Y 与x 之间的散点图如图所示.由图可知变量 Y 与x 近似地呈反比例函数关系.k 1设Y = -,令t =-,则Y = kt •由Y 与x 的数据表可得 Y 与t 的数据表:x xt4 2 1 0.5 0.25 Y1612521作出Y 与t 的散点图如图所示交换4 •在一次抽样调查中测得样本的 x 0.25 0.5 1 2 4 Y16125215个样本点,数值如下表:y1614 1210 8 6^6420-864 2 .11 11 IL II -由图可知Y 与t 呈近似的线性相关关系__55又 t = 1.55, y = 7.2,、、t i y i = 94.25,t f = 21.3125.i = 1i = 194.25 — 5X 1.55X 7.221.312 5 — 5X 1.555 6a = y —b t = 7.2— 4.134 4 X 1.55疋 0.8, y = 4.134 4t + 0.8.所以Y 对x 的回归方程是y =詈+ 08[方法・规律•少结]1 •求回归直线方程时,一般不直接代入公式计算,可以分别计算公式中的相关部分 (统计量),从而减少运算出错的可能性.2•利用回归直线方程求出的值,大多数时候是个预报值,与真实值之间可能有差异, 因为真实值还会受到其他因素的影响.3•两个变量之间的相关关系的样本相关系数,可用于线性相关的定性检验,衡量是否 线性相关以及线性相关关系的强弱.5 •关于用最小二乘法求得的变量 Y 对x 的回归直线方程,下列叙述正确的是( )A .表示Y 与x 之间的一种确定性关系B •表示Y 与x 之间的相关关系C .表示Y 与x 之间的最真实的关系D •表示Y 与x 之间真实关系的一种效果最好的拟合 解析:线性回归方程能最大可能地反映 Y 与x 之间的真实关系.答案:D2・(湖北高考)四名同学根据各自的样本数据研究变量 x , y 之间的相关关系,并求得回 归直线方程,分别得到以下四个结论:①y 与x 负相关且y = 2.347x — 6.423;②y 与x 负相关且y =— 3.476x + 5.648:③y 与x 正 相关且 y = 5.437X + 8.493 :④ y 与 x 正相关且 y =— 4.326x — 4.578.〜4.134 4. 5xt i y i — 5 t yi =1冷- 5T 2i = 1课下训练经典化.贵在紬类旁通[对应学生用书P9]¥ING VCNG其中一定不正确的结论的序号是()A .①②B .②③C.③④ D .①④解析:①中y与x负相关而斜率为正,不正确;④中y与x正相关而斜率为负,不正确.A.点(2,3) B .点(1.5,4)C.点(2.5,4) D .点(2.5,5)解析:回归直线必过样本点的中心, 7 ),即(2.5,4).答案:C4. 一位母亲记录了儿子3岁〜9岁的身高.由此建立的身高与年龄的回归模型为y = 7.19x + 73.93.用这个模型预测这个孩子10岁时的身高,则正确的叙述是()A .身高一定是145.83 cmB .身高在145.83 cm以上C.身高在145.83 cm以下D.身高在145.83 cm左右解析:当x= 10 时,y= 7.19X 10+ 73.93= 145.83.答案:D5. 为了考查两个变量Y与x的线性相关性,测得x, Y的13对数据,若Y与x具有线性相关关系,则相关系数r绝对值的取值范围是.解析:相关系数临界值So5= 0.553,所以Y与x若具有线性相关关系,则相关系数r 绝对值的范围是(0.553,1].答案:(0.553,1]6. 某医院用光电比色计检验尿汞时,得尿汞含量(mg/L)与消光系数计数的结果如下:尿汞含量x246810消光系数Y64138205285360若Y与x具有线性相关关系,则回归直线方程是.5 2解析:由已知表格中的数据,利用科学计算器进行计算得x = 6, y = 210.4, x2= 220,i =15二缈=7 790 ,i = 1' x i y i — 5 x yi = 1所以 b = -------------- 36.95, a = y — b x =— 11.3.5、x 2- 5^i = 1所以回归直线方程为y =— 11.3+ 36.95x. 答案:y =— 11.3+ 36.95x7.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 x (吨)与相应的生产能耗Y (吨标准煤)的几组对照数据:x 3 4 5 6 Y2.5344.5(1) 请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出Y 关于x 的回归直线方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据⑵求出的回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤.(参考数3X 2.5 + 4 X 3+ 5X 4+ 6X 4.5= 66.5)解:(1)如下图.4(2)^x i y i = 3X 2.5 + 4X 3+ 5 X 4 + 6X 4.5= 66.5,4巴 x 2 = 32 + 42 + 52+ 62= 86.i = 166.5 — 4 X 4.5 X 3.5 66.5— 63 .b = 2 = =(86 — 4 X 4.5 86 — 81A ---------- A -----------a = y —b x = 3.5— 0.7X 4.5 = 0.35.因此,所求的回归直线方程为 y = 0.7x + 0.35.3+ 4+ 5+ 6 4 =4.5 2.5+ 3+ 4 + 4.54=3.5,⑶根据回归直线方程的预测,现在生产100吨产品消耗的标准煤的数量为0.7 X 100 +0.35= 70.35,故耗能减少了90—70.35= 19.65(吨).施化肥量对水稻产量影响的试验,&在7块并排的形状大小相同的试验田上进行施肥,得到如下表所示的一组数据施化肥量x 15 20 25 30 35 40 45 水稻产量Y330345365405445450455试对x 与Y 进行线性回归分析,并预测施化肥量为 50时,水稻的产量为多少?1 1 解:•/ x = 7X (15 + 20+ 25+ …+ 45) =子 210= 30,-- 1y = 7X (330 + 345 +…+ 455)~ 399.3, 々=152+ 202+ …+ 402+ 452= 7 000,i = 1'y 2= 3302 + 3452+ …+ 4552= 1 132 725,i = 17、x i y i = 15X 330+ 20 X 345+ …+ 45X 455 = 87 175,i = 1_________ 87 175 — 7X 30 X 399.3 ______—■— 2 2,7 000 — 7X 30 1 132 725 — 7X 399.3=0.973 3.•••|r|= 0.973 3>0.754,从而有95%的把握认为x 与Y 之间具有线性相关关系. 设Y 对x 的线回归直线方程为 J = a + bx7 ' x i y i — 7 x y 87 175— 7X 30X 399.3 = 27 000— 7 X 30〜4.746,• a = y — b x ~ 399.3 — 4.74 6 X 30= 256.9.•••回归直线方程为 y = 256.9 + 4.746x.当x = 50时,y = 256.9 + 4.746X 50= 494.2,这就是说当施化肥量为 50时,水稻的产量 大致接近 494.2.7i = 1'x f — 7x 2i =1。
人教B版高中数学选修(1-2)-1.2例题解析:认识线性回归方程与回归分析

例题解析:认识线性回归方程与回归分析一、线性回归方程设x 与y 是具有相关关系的两个变量,且相应于n 个观测值的n 个点大致分布在一条直线的附近,这条直线就叫做回归直线.例1.假设关于某设备的使用年限x (年)和所支出的维修费用y (万元)有如下的统计资料:若由资料知y 对x 呈线性相关关系,试求: (1)线性回归方程y a bx =+;(2)估计使用年限10年时,维修费用是多少?分析:因为y 对x 呈线性相关关系,所以可以用线性相关的方法解决问题. 解:(1)制表于是有21.239054b ==-⨯,5 1.2340.08a y bx =-=-⨯=.∴线性回归方程为 1.230.08y x =+;(2)当10x =时, 1.23100.0812.38y =⨯+=(万元),即估计使用10年时维修费用约是12.38万元.评注:已知y 对x 呈线性相关关系,无须进行相关性检验,否则应首先进行相关性检验. 二、回归分析通过对有关数据的分析,作出散点图,并利用散点图直观地认识两个变量的相关关系,也可以用相关系数r 来确定两个变量的线性相关关系.例2.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下:(1)y 与x 是否具有线性相关关系?(2)如果y 与x 具有线性相关关系,求回归直线方程.分析:先求出r 的值,r 的值越接近于1,表明两个变量的线性相关关系越强.解:(1)列出下表,并用科学计算器进行计算.1010i ix y x yr -=∑0.9998=≈。
∵0.99980.632>,∴y 与x 具有线性相关关系; (2)设所求的回归直线方程为y a bx =+,。
人教B版选修12高中数学1.2回归分析同步练习2

1.2 回归分析例题: 1. 在画两个变量的散点图时,下面哪个叙述是正确的( )(A)预报变量在x 轴上,解释变量在y 轴上(B)解释变量在x 轴上,预报变量在y 轴上(C)可以选择两个变量中任意一个变量在x 轴上(D)可以选择两个变量中任意一个变量在y 轴上解析:通常把自变量x 称为解析变量,因变量y 称为预报变量.选B2. 若一组观测值(x 1,y 1)(x 2,y 2)…(x n ,y n )之间满足y i =bx i +a+e i (i=1、2. …n)若e i 恒为0,则R 2为 解析: e i 恒为0,说明随机误差对y i 贡献为0.答案:1.3. 假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:x 2 3 4 5 6y 22 38 55 65 70若由资料可知y 对x 呈线性相关关系试求:(1)线性回归方程;(2)估计使用年限为10年时,维修费用是多少?解:(1i 1 2 3 4 52 3 4 5 622 38 55 65 7044 114 220 325 420 4 916 25 36 4=x , 5=y , 90512=∑=i i x , 3.11251=∑=i i i y x于是23.145905453.112552251251=⨯-⨯⨯-=--=∑∑==x x y x y x b i i i i i, ∴线性回归方程为:08.023.1^+=+=x a bx y (2)当x=10时,38.1208.01023.1^=+⨯=y (万元) 即估计使用10年时维修费用是1238万元课后练习:1. 一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93用这个模型预测这个孩子10岁时的身高,则正确的叙述是( )A.身高一定是145.83cm;B.身高在145.83cm 以上;C.身高在145.83cm 以下;D.身高在145.83cm 左右.2. 两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数2R 如下 ,其中拟合效果最好的模型是( )A.模型1的相关指数2R 为0.98B.模型2的相关指数2R 为0.80C.模型3的相关指数2R 为0.50D.模型4的相关指数2R 为0.253.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( )A.总偏差平方和B.残差平方和C.回归平方和D.相关指数R 2 4.工人月工资(元)依劳动生产率(千元)变化的回归直线方程为ˆ6090yx =+,下列判断正确的是()A.劳动生产率为1000元时,工资为50元B.劳动生产率提高1000元时,工资提高150元C.劳动生产率提高1000元时,工资提高90元D.劳动生产率为1000元时,工资为90元5.线性回归模型y=bx+a+e 中,b=_______,a=_________e 称为_________6. 若有一组数据的总偏差平方和为100,相关指数为0.5,则期残差平方和为_______ 回归平方和为____________7. 一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验转速x(转/秒) 16 14 12 8每小时生产有缺点的零件数y (件) 11 9 8 5(1)变量y 对x 进行相关性检验; (2)如果y 对x 有线性相关关系,求回归直线方程; (3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么机器的运转速度应控制在什么范围内?第一章:统计案例答案1.2 回归分析1. D2.A3.B4.C5.a=ˆy bx-,e 称为随机误差 6. 50,507. (1)r=0.995,所以y 与x 有线性性相关关系(2)y=0.7286x-0.8571(3)x 小于等于14.9013。
高中数学人教B版选修1-2练习课件1.2 回归分析精选ppt课件

课时作业32 回归分析
[目标导航] 1.通过典型案例的探究进一步了解回归分 析的基本思想、方法及其初步应用. 2.会求回归直线方程,并进行预报.
1 课堂对点训练 2 课后提升训练
课堂对点训练
知识点一
线性回归方程
1.某商品销售量 y(件)与销售价格 x(元/件)负相关,则 其回归方程可能是( )
再见
原料有效成分含量 x 之间的相关关系,现取 8 对观测值,
8
8
8
8
计算得∑ i=1xi=52,∑ i=1yi=228,∑ i=1x2i =478,∑ i=1xiyi=1849,则
y 与 x 之间的回归方程为________.
n
^
解析:利用公式b
=∑ i=1xniyi-n x
y^ ,a
= y -b^ x 代入
i∑=1xi2-n x 2
数据即可求得.
答案:^y =11.47+2.62x
知识点二
回归分析的基本思想
4.关于 x 与 y 有如下数据:
x2 4 5 6 8
y 30 40 60 50 70
为了对 x、y 两个变量进行统计分析,现有以下两种线
^
^
性模型:甲模型y =6.5x+17.5,乙模型y =7x+17,试比
较哪一个模型拟合的效果更好.
5
^
∑ 解:R21=1-i=51
∑
i=1
yi-y yi- y
i22=1-1105050=0.845,
5
^
∑ R22=-i=51
∑
i=1
yi-y yi- y
i22=1-1108000=0.82,
2021-2022学年人教B版数学选修1-2(检测):1.2 回归分析 Word版含答案

课时作业2-2(限时:10分钟)1.设两个变量x 和y 之间具有线性相关关系,它们的相关系数是r ,y 关于x 的回归直线的斜率是b ^,纵截距是a ^,那么必有( )A.b ^与r 的符号相同 B.a ^与r 的符号相同 C.b ^与r 的 符号相反 D.a ^与r 的符号相反解析:由回归直线方程的斜率b ^与相关系数r 的计算公式可以得出结论. 答案:A2.工人月工资y (元)依劳动生产率x (千元)变化的回归直线方程为y ^=50+80x ,则下列推断正确的是( )①劳动生产率为1 000元时,工资为130元; ②劳动生产率提高1 000元时,工资平均提高80元; ③劳动生产率提高1 000元时,工资平均提高130元; ④当月工资为210元时,劳动生产率为2 000元. A .① B .② C .③ D .④解析:回归直线方程本身就不够精确,y ^i 与数据y i 很可能不相等,所以①④不正确.由回归系数b ^的意义,知b ^是一个估量值.答案:B3.已知y 与x 之间的一组数据如下:x 0 1 2 3 4 y13556则拟合这5对数据的回归直线肯定经过点__________. 解析:回归直线y ^=b ^x +a ^肯定过样本点的中心(x ,y ).答案:(2,4)4.很多因素都会影响贫困,训练就是其中之一.在争辩贫困和训练的关系时收集了美国50个州的成年人受过9年或更少时间训练的人数占本州人数的百分比(x )和收入低于官方规定的贫困线的人数占本州人数的百分比(y )的数据,建立回归直线方程为y ^=0.8x +4.6,斜率的估量值等于0.8说明__________,成年人受过9年或更少时间训练的人数占本州人数的百分比(x )和收入低于官方的贫困线的人数占本州人数的百分比(y )之间的相关系数__________(填“大于0”或“小于0”).答案:一个地区受过9年或更少时间训练的人数占本州人数百分比每增加1%,收入低于官方规定的贫困线的人数占本州人数的百分比将增加0.8%左右 大于0(限时:30分钟)1.对于线性相关系数r ,下列叙述正确的是( )A .|r|∈(0,+∞),|r|越大,相关程度越强,反之,相关程度越弱B .|r|∈(0,+∞),r 越大,相关程度越强,反之,相关程度越弱C .|r|≤1且|r|越接近于1,相关程度越强;|r|越接近于0,相关程度越弱D .以上说法都不对 答案:C2.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n≥2,x 1,x 2,…,x n 不全相等)的散点图中,若全部样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12D .1 解析:样本相关系数越接近1,相关性越强,若全部的样本点都在直线y =12x +1上,则样本相关系数应为1.答案:D3.为争辩变量x 和y 的线性相关性,甲、乙二人分别作了争辩,利用线性回归方法得到回归直线方程l 1和l 2,两人计算知x 相同,y 也相同,则l 1与l 2的关系为( )A .肯定重合B .肯定平行C .肯定相交于点(x ,y )D .无法推断解析:回归直线经过样本中心点(x ,y ),故选C. 答案:C4.对四组变量y 和x 进行线性相关检验,已知n 是观测值组数,r 是相关系数.已知①n =7,r =0.954 5;②n =15,r =0.381 2;③n =17,r =0.498 5;④n =3,r =0.987 0,则变量y 与x 具有线性相关关系的是__________.解析:①r >r 0.05=0.754,②r <r 0.05=0.514,③r >r 0.05=0.482,④r <r 0.05=0.997,从而①③正确. 答案:①③5.回归分析用于分析一个变量对另一个变量的依靠关系.相关分析用于分析两个变量间的相关关系.当两变量间存在线性关系时,不仅可以用__________表示变量y 与x 线性相关的亲密程度,还可以用一个二元一次方程y ^=a ^+b ^x 来表示y 与x 的线性关系.答案:相关系数r6.如图所示,有5组(x ,y )数据,去掉__________这组数据后,剩下的4组数据的线性相关系数最大.答案:D (3,10)7.图书馆工作人员想知道每天到图书馆的人数x (百人)与借出的图书本数y (百本)之间的关系,已知上个月图书馆共开放25天,且得到资料:∑x i =200,∑y i =300,∑x 2i =1 660,∑y 2i =3 696,∑x i y i =2 436,则y 对x 的回归直线方程为__________.解析:将已知量代入回归直线方程可得a ^=7.2,b ^=0.6. 答案:y ^=7.2+0.6x8.某5名同学的数学成果和化学成果如下表所示:数学成果x/分 88 76 73 66 63化学成果y/分7865716461(1)画出散点图;(2)假如x 与y 具有线性相关关系, ①求y 对x 的线性回归方程; ②求x 对y 的线性回归方程.解析:(1)散点图略.(2)由数据计算,得x =73.2,y =67.8,∑5i =1x 2i=27 174,∑5i =1y 2i=23 167,∑5i =1x i y i =25 054.①设y ^=a ^+b ^x ,则由公式, 求得a ^=22.05,b ^=0.625, ∴y ^=22.05+0.625x. ②设x ^=c ^+d ^y ,则d ^=25 054-5×73.2×67.823 167-5×67.82=1.31, c ^=x -d ^y =73.2-1.31×67.8=-15.62, 即回归方程为x ^=1.31y -15.62.9.为了对2011年佛山市某中学的中考成果进行分析,在60分以上的全体同学中随机抽出8位,他们的数学成果(已折算为百分制)从小到大排列是60,65,70,75,80,85,90,95,物理成果从小到大排列是72,77,80,84,88,90,93,95,化学成果从小到大排列是67,72,76,80,84,87,90,92.(1)若这8位同学的数学、物理、化学分数事实上对应如下表:同学编号 1 2 3 4 5 6 7 8 数学成果x/分 60 65 70 75 80 85 90 95 物理成果y/分 72 77 80 84 88 90 93 95 化学成果z/分6772768084879092用变量y 与x ,z 与x 的相关系数说明物理成果与数学成果、化学成果与数学成果的相关程度; (2)求y 与x ,z 与x 的回归直线方程(系数精确到0.01).参考数据:x =77.5,y =84.875,z =81,∑8i =1(x i -x )2=1 050,∑8i =1(y i -y )2=456.875,∑8i =1(z i-z )2=550,∑8i =1(x i -x )(y i -y )=687.5,∑8i =1(x i -x )(z i -z )=755, 1 050≈32.404,456.875≈21.375,550≈23.452.解析:(1)变量y 与x ,z 与x 的相关系数分别是r =∑8i =1 x i -xy i -y∑8i =1x i -x 2∑8i =1y i -y2=687.51 050×456.875=0.993,r′=∑8i =1x i -xz i -z∑8i =1x i -x 2∑8i =1z i -z2=7551 050×550=0.994,可以看出物理成果与数学成果、化学成果与数学成果之间都是高度正相关的.(2)设y 与x ,z 与x 的回归直线方程分别是y ^=b ^x +a ^,z ^=b ^′x +a ^′,依据所给数据,可以计算出b ^=∑8i =1x i -xy i -y∑8i =1x i -x2=687.51 050≈0.65, a ^=y -b ^x ≈34.5,b ^′=∑8i =1 x i -xz i -z∑8i =1x i -x2=7551 050≈0.72,a ^′=z -b ^x ≈25.2, 所以y 与x ,z 与x 的回归直线方程分别为y ^=0.65x +34.5,z ^=0.72x +25.2.。
高中数学 1-2《回归分析》同步练习 新人教B版选修1-2

选修1-2 1.2回归分析一、选择题1.已知回归直线方程y ^=2-2.5x ,若变量x 每增加1个单位,则( ) A .y 平均增加2.5个单位 B .y 平均增加1个单位 C .y 平均减少2.5个单位 D .y 平均减少2个单位 [答案] C2.已知x ,y 的一组数据如下表所示:则y 与x 之间的线性回归方程y =β0x +β1必过定点( ) A .(0,0) B .(x ,0) C .(0,y ) D .(x ,y ) [答案] D[解析] 回归直线过样本点的中心(x ,y ).3.一位母亲记录了儿子3~9岁的身高,数据如下表所示,由此建立了身高对年龄的回归模型y =7.1x +79.93.用这个模型预测这个孩子10岁时的身高,则下列叙述中正确的是( )B .身高在145.83 cm 以上C .身高在145.83 cm 左右D .身高在145.83 cm 以下 [答案] C[解析] 由回归直线方程所得的预报变量y 的值,并不是预报变量的精确值,而是预报变量可能取值的平均值.4.三点(3,10),(7,20),(11,24)的回归方程是( ) A.y ^=5-17x B.y ^=-17+5x C.y ^=17+5xD.y ^=17-5x[答案] B5.对于线性相关系数r ,以下说法正确的是( ) A .r 只能为正值,不能为负值B .|r |≤1,且|r |越接近于1,相关程度越大;相反则越小C .|r |≤1,且|r |越接近于1,相关程度越小;相反则越大D .不能单纯地以r 来确定线性相关程度 [答案] B6.(2010·湖南文,3)某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( )A.y ^=-10x +200 B.y ^=10x +200 C.y ^=-10x -200D.y ^=10x -200[答案] A[解析] 本题主要考查变量的相关性. 由负相关的定义知,A 正确. 7.有下列说法:①在残差图中,若残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;②用相关指数R 2来刻画回归的效果,R 2越大,说明模型的拟合效果越好; ③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.其中正确命题的个数是( ) A .0个 B .1个 C .2个 D .3个 [答案] D8.在建立两个变量y 与x 的回归模型中,分别选择了4个不同的模型,它们的相关指数R 2的值如下,其中拟合效果最好的模型是( )A .模型1的相关指数R 2为0.98B .模型2的相关指数R 2为0.80C .模型3的相关指数R 2为0.50D .模型4的相关指数R 2为0.25 [答案] A[解析] R 2的值越大,模型的拟合效果越好.故选A. 9.下列关于残差图的描述中错误的是( ) A .残差图的横坐标可以是样本编号B .残差图的模坐标可以是解释变量或预报变量C .残差点分布的带状区域的宽度越窄,相关指数越小D .残差点分布的带状区域的宽度越窄,回归平方和越大 [答案] C[解析] 残差图和相关指数都可以刻画回归模型的拟合效果.残差点分布的带状区域越窄,相关指数R 2越大,说明回归模型的拟合效果越好.故选C.10.三点(3,10),(7,20),(11,24)的回归方程是( ) A.y ^=5-17x B.y ^=-17+5x C.y ^=17+5xD.y ^=17-5x[答案] B 二、填空题11.回归分析是处理变量之间________关系的一种数量统计方法. [答案] 相关12.已知回归直线方程为y ^=0.50x -0.81,则x =25时,y 的估计值为________. [答案] 11.6913.对于同一资料,如果将x 作自变量,y 作因变量,得回归系数b ;将y 作自变量,x 作因变量,得回归系数b ′.则相关系数r 与b 、b ′的关系是________.[答案] bb ′=r 2 三、解答题14.假设关于某种设备的使用年限x (年)与所支出的维修费用y (万元)有如下统计资料:已知∑x 2i =90,∑y i i i 79≈8.9,2≈1.4,n -2=3时,r 0.05=0.878.(1)求x ,y ;(2)对x ,y 进行线性相关性检验;(3)如果x 与y 具有线性相关关系,求出回归直线方程; (4)估计使用年限为10年时,维修费用约是多少? [解析] (1)x =2+3+4+5+65=4,y =2.2+3.8+5.5+6.5+7.05=5.0.(2)步骤如下:①作统计假设:x 与y 不具有线性相关关系. ②n -2=3时,r 0.05=0.878.③∑x i y i -5x ·y =112.3-5×4×5=12.3,∑x 2i -5x 2=90-5×42=10,∑y 2i -5y 2=140.8-125=15.8,∴r =12.310×15.8=12.32·79=12.31.4×8.9≈0.987.④|r |=0.987>0.878,即|r |>r 0.05,所以有95%的把握认为“x 与y 之间具有线性相关关系”,再求回归直线方程是有意义的.(3)由于b ^=∑x i y i -5x ·y∑x 2i -5x2=112.3-5×4×590-5×42=1.23, a ^=y -b x =5-1.23×4=0.08,所以回归直线方程为y ^=1.23x +0.08.(4)当x =10时,y ^=1.23×10+0.08=12.38(万元),即估计用10年时间,维修费用约为12.38万元.15.一台机器由于使用时间较长,按不同的转速生产出来的某机械零件有一些会有疵点,每小时生产有疵点零件的多少随机器运转的速度而变化,下表为抽样试验结果:(1)对变量y与x进行相关性检验;(2)如果y与x有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有疵点的零件最多为10个,那么机器运转速度应控制在什么范围内?[解析] (1)y与x有线性相关关系;(2)y=0.7286x-0.8571;(3)机器的转速应控制在14.9013转/秒以下.16.已知某地每单位面积菜地年平均使用氮肥量x(kg)与每单位面积蔬菜年平均产量y(t)之间的关系有如下数据:(1)求x与y之间的相关系数,并检验是否线性相关;(2)若线性相关,求蔬菜产量y与使用氮肥量x之间的回归直线方程,并估计每单位面积施氮肥150kg时,每单位面积蔬菜的年平均产量.[解析](1)列出下表,并用科学计算器进行相关计算:x =15=101,y =15≈10.11, ∑i =115x 2i =161125,∑i =115y 2i =1628.55,∑i =115x i y i =16076.8.故蔬菜产量与施用氮肥量的相关系数r =16076.8-15×101×10.11(161125-15×1012)(1628.55-15×10.112)≈0.8643.由小概率0.05与n -2在附表中查得相关系数临界值r 0.05=0.514,则r >r 0.05,说明有95%的把握认为蔬菜产量与施用氮肥量之间存在着线性相关关系.(2)设所求的回归直线方程为y ^=b ^x +a ^,则b ^=∑i =115x i y i -15x y∑i =115x 2i -15x2=16076.8-15×101×10.11161125-15×1012≈0.0937, a ^=y -b x ≈10.11-0.0937×101=0.6463,∴回归直线方程为y ^=0.0937x +0.6463.∴当每单位面积施氮肥150kg 时,每单位面积蔬菜年平均产量为0.0937×150+0.6463≈14.701(t).[说明] 本题主要考查对两个变量的相关性检验和回归分析.(1)使用样本相关系数计算公式来完成;(2)先作统计假设,由小概率0.05与n -2在附表中查得相关系数临界值r 0.05,若r >r 0.05则线性相关,否则不线性相关.。
高中数学新人教B版选修1-2课时跟踪训练(二)回归分析

课时跟踪训练(二)回归分析1 •关于用最小二乘法求得的变量Y对x的回归直线方程,下列叙述正确的是()A .表示Y与x之间的一种确定性关系B •表示Y与x之间的相关关系C.表示Y与x之间的最真实的关系D •表示Y与x之间真实关系的一种效果最好的拟合2. (湖北高考)四名同学根据各自的样本数据研究变量x, y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y与x负相关且y = 2.347X—6.423;②y与x负相关且y=- 3.476x+ 5.648:③y与x正相关且y= 5.437X+ 8.493 :④ y 与x 正相关且y=—4.326x—4.578.其中一定不正确的结论的序号是()A .①②B .②③C.③④ D .①④3. 下表是x和Y之间的一组数据,则Y对x的回归直线必过()A .点(2,3)B .点(1.5,4)C.点(2.5,4) D .点(2.5,5)4. 一位母亲记录了儿子3岁〜9岁的身高.由此建立的身高与年龄的回归模型为y = 7.19x + 73.93.用这个模型预测这个孩子10岁时的身高,则正确的叙述是()A .身高一定是145.83 cmB .身高在145.83 cm以上C.身高在145.83 cm以下D .身高在145.83 cm左右5. 为了考查两个变量Y与x的线性相关性,测得x, Y的13对数据,若Y与x具有线性相关关系,则相关系数r绝对值的取值范围是__________ .6. 某医院用光电比色计检验尿汞时,得尿汞含量(mg/L)与消光系数计数的结果如下:若Y与x具有线性相关关系,则回归直线方程是 ________________________________________ .7. 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗Y(吨标准煤)的几组对照数据:(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出Y关于x的回归直线方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据⑵求出的回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤.(参考数值:3X 2.5 + 4 X 3+ 5X 4+ 6X 4.5= 66.5)&在7块并排的形状大小相同的试验田上进行施肥,施化肥量对水稻产量影响的试验,得到如下表所示的一组数据•试对x答案1•选D 线性回归方程能最大可能地反映Y与x之间的真实关系.2. 选D ①中y与x负相关而斜率为正,不正确;④中y与x正相关而斜率为负,不正确.3. 选C 回归直线必过样本点的中心(x , y ),即(2.5,4).4. 选D 当x= 10 时,y= 7.19X 10+ 73.93= 145.83.5. 解析:相关系数临界值r o.05 = 0.553,所以Y与x若具有线性相关关系,则相关系数r绝对值的范围是(0.553,1].答案:(0.553,1]6. 解析:由已知表格中的数据,利用科学计算器进行计算得_ _ 5 5x = 6, y = 210.4 , ' x f= 220,二x i y i = 7 790,i=1 i=15 _____X'x i y i —5 x yi=1所以b= -------------------- =36.95, a = y —b x =—11.3.52 2' X i —5 xi=1所以回归直线方程为y=—11.3+ 36.95x.答案:y =—11.3+ 36.95x7.解:(1)如下图.y5*4■3■21O 1 2 3 d 5 6 ar4(2)初X i y i = 3X 2.5+ 4X 3+ 5X 4 + 6X 4.5= 66.5,—3+ 4+ 5+ 6 2.5+ 3+ 4 + 4.5x = = 4.5, y = = 3.5,4 44巴x2 = 32+ 42+ 52+ 62= 86.i = 1A 66.5 —4 X 4.5 X 3.5 66.5—63 _ -b= 2 = = 0.7,86 —4 X 4.5 86 —81a= y —b x = 3.5—0.7X 4.5 = 0.35.因此,所求的回归直线方程为y= 0.7x+ 0.35.0.7 X 100 +⑶根据回归直线方程的预测,现在生产100吨产品消耗的标准煤的数量为0.35= 70.35,故耗能减少了90—70.35= 19.65(吨).1 18. 解:•/ x =扌X (15 + 20+ 25+…+ 45) = :X 210 = 30,7 = ^X (330 + 345 + …+ 455)〜399.3,7 ' x2= 152+ 202+ …+ 402+ 452= 7 000,i = 17' y2= 3302+ 3452+ …+ 4552= 1 132 725,i = 17\ X i y i = 15X 330+ 20 X 345+ …+ 45X 455 = 87 175,i = 1________ 87 175 — 7X 30 X 399.3 ______ —.7 000 — 7X 302 j[1 132 725 — 7X 399.32 ) =0.973 3.•••|r|= 0.973 3>0.754,从而有95%的把握认为x 与Y 之间具有线性相关关系.设Y 对x 的线回归直线方程为y = a + bx87 175-7 X 30X警〜4.746,7 000 — 7X 30• a = y — b x ~ 399.3— 4.74 6 X 30 = 256.9.•••回归直线方程为 y = 256.9 + 4.746x.当x = 50时,y = 256.9 + 4.746X 50= 494.2,这就是说当施化肥量为 50时,水稻的产量大致接近494.2.二X i y i — 7 xyi =1 b= --------------'x 2- 7匚2i=17。
人教B版高考数学选修1-2同步练习题 第1章 1.2 回归分析

§1.2 回归分析学习目标 1.会建立线性回归模型分析两个变量间的相关关系.2.能通过相关系数判断两个变量间的线性相关程度.知识点一 回归分析及回归直线方程 思考1 什么叫回归分析?答案 回归分析是对具有相关关系的两个变量进行统计分析的一种方法. 思考2 回归分析中,利用回归直线方程求出的函数值一定是真实值吗? 答案 不一定是真实值,利用回归直线方程求的值,在很多时候是个预测值.梳理 (1)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.若两个变量之间具有线性相关关系,则称相应的回归分析为线性回归分析.(2)回归直线方程为y ^=b ^x +a ^,且b ^=i =1n(x i -x )(y i -y )i =1n(x i -x )2,a ^=y -b ^x ,其中x =1n ∑i =1n x i ,y =1n ∑i =1ny i ,(x ,y )称为样本点的中心,回归直线一定过样本点的中心. 知识点二 相关系数1.对于变量x 与Y 随机抽到的n 对数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),检验统计量是样本相关系数r =∑n i =1 (x i -x )(y i -y )∑ni =1(x i -x )2∑ni =1(y i -y )2=∑n i =1x i y i -n x y(∑ni=1x 2i-n x 2)(∑n i =1y 2i-n y 2).2.相关系数r 的取值范围是[-1,1],|r|越接近1,变量之间的线性相关程度越强;|r|越接近0,变量之间的线性相关程度越弱.当|r|>r 0.05时,表明有95%的把握认为两个变量之间具有线性相关关系.1.求回归直线方程前可以不进行相关性检验.( × ) 2.利用回归直线方程求出的值是准确值.( × )类型一 回归直线方程例1 若从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:求根据女大学生的身高预测体重的回归直线方程,并预测一名身高为172cm 的女大学生的体重. 考点 线性回归分析 题点 回归直线的应用 解 (1)画散点图选取身高为自变量x ,体重为因变量y ,画出散点图,展示两个变量之间的关系,并判断二者是否具有线性关系.由散点图可以发现,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用回归直线方程y ^=b ^x +a ^来近似刻画它们之间的关系.(2)建立回归方程由计算器可得b ^=0.848,a ^=-85.632.于是得到回归直线方程为y ^=0.848x -85.632. (3)预测和决策当x =172时,y ^=0.848×172-85.632=60.224(kg). 即一名身高为172cm 的女大学生的体重预测值为60.224kg. 反思与感悟 在使用回归直线方程进行预测时要注意 (1)回归直线方程只适用于我们所研究的样本的总体. (2)我们所建立的回归直线方程一般都有时间性. (3)样本取值的范围会影响回归直线方程的适用范围. (4)不能期望回归直线方程得到的预测值就是因变量的精确值.跟踪训练1 假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有如下的统计数据:由此资料可知y 对x 呈线性相关关系.(1)求回归直线方程;(2)求使用年限为10年时,该设备的维修费用为多少? 考点 回归直线方程 题点 求回归直线方程 解 (1)由题干表中的数据可得x =4,y =5,∑i =15x 2i=90,∑i =15x i y i =112.3,∴b ^=∑i =15x i y i -5x·y∑i =15x 2i -5x 2=112.3-5×4×590-5×42=1.23, ∴a ^=y -b ^x =5-1.23×4=0.08.∴回归直线方程为y ^=1.23x +0.08.(2)当x =10时,y ^=1.23×10+0.08=12.38.即使用年限为10年时,该设备的维修费用约为12.38万元. 类型二 相关性检验例2 维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y 来衡量,这个指标越高,耐热水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x(g/L)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据:(1)画散点图; (2)求回归直线方程;(3)求相关系数r ,并进行相关性检验. 考点 线性相关系数题点 线性相关系数的概念及计算 解 (1)散点图如图.(2)可以看出,两变量之间有近似的线性相关关系,下面用列表的方法计算a ^,b ^.x =1687=24,y =7, b ^=∑7i =1x i y i -7x y ∑7i =1x 2i -7x 2=4900.16-7×24×202.9474144-7×242≈0.2643, a ^=y -b ^x =202.947-0.2643×24≈22.648, ∴回归直线方程为y ^=22.648+0.2643x.(3)∑7i =1y 2i≈5892,r =∑7i =1x i y i -7x y(∑7i =1x 2i-7x 2)(∑7i =1y 2i-7y 2)=4900.16-7×24×202.947(4144-7×242)×[5892-7×⎝ ⎛⎭⎪⎫202.9472]≈0.96.∵r =0.96>r 0.05=0.754.∴有95%的把握认为“甲醛浓度与缩醛化度有线性相关关系”,求得的回归直线方程有意义.反思与感悟 根据已知数据求得回归直线方程后,可以利用相关系数和临界值r 0.05比较,进行相关性检验. 跟踪训练2 为了研究3月下旬的平均气温(x)与4月20日前棉花害虫化蛹高峰日(y)的关系,某地区观察了2012年至2017年的情况,得到了下面的数据:(1)对变量x,y进行相关性检验;(2)据气象预测,该地区在2019年3月下旬平均气温为27℃,试估计2019年4月化蛹高峰日为哪天.考点线性相关系数题点线性相关系数的概念及计算解 由已知条件可得下表:(1)r =∑i =16x i y i -6xy(∑i =16x 2i-6x 2)(∑i =16y 2i -6y 2)≈-0.9341.查表知:r 0.05=0.811.由|r|>r 0.05可知,变量y 和x 存在线性相关关系.(2)b ^=1222.6-6×29.13×7.55130.92-6×29.132≈-2.23, a ^=y -b ^x ≈72.46.所以回归直线方程为y ^=-2.23x +72.46.当x =27时,y ^=-2.23×27+72.46≈12.据此,可估计该地区2019年4月12日为化蛹高峰日.1.某商品销售量y(件)与销售价格x(元/件)呈负相关,则其回归直线方程可能是( )A.y ^=-10x +200B.y ^=10x +200C.y ^=-10x -200D.y ^=10x -200 考点 线性回归分析 题点 回归直线的应用 答案 A解析 由于销售量y 与销售价格x 成负相关,故排除B ,D.又当x =10时,A 中y =100,而C 中y =-300,C 不符合题意,故选A.2.下表是x和y之间的一组数据,则y关于x的回归直线必过( )A.点(2,3) B.点(1.5,4)C.点(2.5,4) D.点(2.5,5)考点回归直线方程题点样本点中心的应用答案 C解析回归直线必过样本点中心(x,y),即(2.5,4).3.对变量y和x进行相关性检验,已知n为数据的对数,r是相关系数,且已知①n=3,r=0.9950;②n =7,r=0.9533;③n=15,r=0.3012;④n=17,r=0.4991.则变量y和x具有线性相关关系的是( ) A.①和②B.①和③C.②和④D.③和④考点线性相关系数题点线性相关系数的应用答案 C解析①当n=3时,r0.05=0.997,所以|r|<r0.05,我们没有理由拒绝原来的假设,这时寻找回归直线方程是毫无意义的;②当n=7时,r0.05=0.754,所以|r|>r0.05,表明有95%的把握认为x与y之间具有线性相关关系;③当n=15时,r0.05=0.514,所以|r|<r0.05,我们没有理由拒绝原来的假设,这时寻找回归直线方程是毫无意义的;④当n=17时,r0.05=0.482,所以|r|>r0.05,表明有95%的把握认为x与y之间具有线性相关关系,所以②和④满足题意,故选C.4.某产品在某零售摊位的零售价x(单位:元)与每天的销售量y(单位:个)的统计资料如下表所示:由上表可得回归直线方程y ^=b ^x +a ^中的b ^=-5,据此模型预测当零售价为14.5元时,每天的销售量为( )A .51个B .50个C .54个D .48个 考点 线性回归分析 题点 回归直线方程的应用 答案 C解析 由题意知x =17.5,y =39,代入回归直线方程得a ^=126.5,126.5-14.5×5=54,故选C. 5.已知x ,y 之间的一组数据如下表:(1)分别计算:x ,y ,x 1y 1+x 2y 2+x 3y 3+x 4y 4,x 21+x 22+x 23+x 24; (2)已知变量x 与y 线性相关,求出回归直线方程. 考点 回归直线方程 题点 求回归直线方程 解 (1)x =0+1+2+34=1.5,y =1+3+5+74=4, x 1y 1+x 2y 2+x 3y 3+x 4y 4=0×1+1×3+2×5+3×7=34, x 21+x 22+x 23+x 24=02+12+22+32=14.(2)b ^=34-4×1.5×414-4×1.52=2,a ^=y -b ^x =4-2×1.5=1,故回归直线方程为y ^=2x +1.1.对具有线性相关关系的两个变量进行统计分析,可从散点图观察大致呈条状分布,可以求回归直线方程并进行预报.2.通过求相关系数并和临界值r 0.05比较可以判断两个变量是否有线性相关关系,求得的回归直线方程是否有意义.一、选择题1.根据如下样本数据得到的回归直线方程为y ^=b ^x +a ^,则( )A.a ^>0,b ^>0B.a ^>0,b ^<0C.a ^<0,b ^>0 D.a ^<0,b ^<0考点 线性回归分析 题点 回归直线方程的应用 答案 B解析 作出散点图如下:观察图象可知,回归直线y ^=b ^x +a ^的斜率b ^<0,当x =0时,y ^=a ^>0.故a ^>0,b ^<0.2.某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:若x ,y 线性相关,回归直线方程为y ^=0.7x +a ^,估计该制药厂6月份生产甲胶囊产量为( ) A .8.0万盒B .8.1万盒C .8.9万盒D .8.6万盒 考点 回归直线方程题点 样本点中心的应用 答案 B解析 回归直线一定过样本点中心.由已知数据可得x =3,y =6,代入回归方程,可得a ^=y -0.7x=3.9,即回归直线方程为y ^=0.7x +3.9.把x =6代入,可近似得y ^=8.1,故选B.3.某化工厂为预测某产品的回收率y ,而要研究它和原料有效成分含量之间的相关关系,现取了8对观测值,计算得∑i =18x i =52,∑i =18y i =228,∑i =18x 2i=478,∑i =18x i y i =1849,则y 与x 的回归直线方程是( )A.y ^=2.62x +11.47B.y ^=2.62x -11.47C.y ^=11.47x +2.62 D.y ^=-2.62x +11.47考点 回归直线方程 题点 求回归直线方程 答案 A解析 由题中数据得x =6.5,y =28.5,∴b ^=∑i =18x i y i -8xy ∑i =18x 2i -8x 2=1849-8×6.5×28.5478-8×6.52=367140≈2.62, a ^=y -b ^x ≈28.5-2.62×6.5=11.47,∴y 与x 的回归直线方程是y ^=2.62x +11.47,故选A.4.给定x 与y 的一组样本数据,求得相关系数r =-0.690,则( ) A .y 与x 的线性相关性很强 B .y 与x 的相关性很强 C .y 与x 正相关 D .y 与x 负相关 考点 线性相关系数 题点 线性相关系数的应用 答案 D解析 因为r<0,所以y 与x 负相关,又|r|∈[0.75,1]才表示y 与x 具有很强的线性相关性,所以选D. 5.甲、乙、丙、丁四位同学各自对A ,B 两变量的线性相关试验,并用回归分析方法分别求得相关系数r 如表:则这四位同学的试验结果能体现出A ,B 两变量有更强的线性相关性的是( ) A .甲B .乙C .丙D .丁 考点 线性相关系数题点 线性相关系数的概念及计算 答案 D解析 由相关系数的意义可知,相关系数的绝对值越接近于1,相关性越强,结合题意可知丁的线性相关性更强,故选D.6.每一吨铸铁成本y c (元)与铸件废品率x%建立的回归方程为y c =56+8x ,那么下列说法正确的是( ) A .废品率每增加1%,成本每吨增加64元 B .废品率每增加1%,成本每吨增加8% C .废品率每增加1%,成本每吨增加8元 D .如果废品率增加1%,则每吨成本为56元 考点 回归直线方程 题点 回归直线方程的应用 答案 C 二、填空题7.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n)都在直线y =12x +1上,则这组样本数据的样本相关系数为________.考点 线性相关系数题点 线性相关系数的概念及计算 答案 1解析 根据样本相关系数的定义可知,当所有样本点都在一条直线上时,相关系数为1.8.已知一个回归直线方程为y ^=1.5x +45,x ∈{1,5,7,13,19},则y =________. 考点 回归直线方程 题点 样本点中心的应用 答案 58.5解析 ∵x =1+5+7+13+195=9,且y ^=1.5x +45,∴y =1.5×9+45=58.5.9.从某高校在校大学生中随机选取5名女大学生,由她们身高和体重的数据得到的回归直线方程为y ^=0.79x -73.56,数据列表是:则其中的数据a =________. 考点 回归直线方程 题点 样本点中心的性质 答案 163解析 由表中数据计算y =15×(49+53+56+58+64)=56,根据回归直线经过样本点中心(x ,y ), 可得56=0.79x -73.56,解得x =164. 由x =15×(155+161+a +167+174)=164,解得a =163.10.2018年3月1日,某地物价部门对该地的5家商场的某商品一天的销售量及其价格进行调查,5家商场该商品的售价x 元和销售量y 件之间的一组数据如表所示,由散点图可知,销售量y 与价格x 之间有较好的线性相关关系,其回归直线方程是y ^=-3.2x +a ^,则a ^=________.考点 线性回归分析 题点 回归直线的应用 答案 40解析 由题意,得x =9+9.5+10+10.5+115=10,y =11+10+8+6+55=8,∵回归直线方程是y ^=-3.2x +a ^,∴8=-3.2×10+a ^,∴a ^=40. 三、解答题11.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:(1)求y 关于x 的回归直线方程y ^=b ^x +a ^; (2)试预测加工10个零件需要多少时间? 考点 回归直线方程 题点 求回归直线方程解 (1)由表中数据得∑i =14x i y i =52.5,x =3.5,y =3.5,∑i =14x 2i =54,所以b ^=∑i =14x i y i -4xy∑i =14x 2i -4x 2=0.7,所以a ^=y -b ^x =1.05.所以y ^=0.7x +1.05.(2)将x =10代入回归直线方程,得y ^=0.7×10+1.05=8.05,所以预测加工10个零件需要8.05小时.12.已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:判断y 与x 是否具有线性相关关系?若有,求出其回归直线方程. 考点 回归直线方程 题点 求回归直线方程解 作出散点图如图,可看出y 与x 具有线性相关关系.x =15(14+16+18+20+22)=18,y =15(12+10+7+5+3)=7.4,∑5i =1x 2i =142+162+182+202+222=1660,∑5i =1x i y i =14×12+16×10+18×7+20×5+22×3=620,所以b ^=∑5i =1x i y i -5x y∑5i =1x 2i -5x 2=620-5×18×7.41660-5×182=-1.15, a ^=7.4+1.15×18=28.1,所以所求的回归直线方程是y ^=-1.15x +28.1. 四、探究与拓展13.如图是x 和y 的一组样本数据的散点图,去掉一组数据________后,剩下的4组数据的相关系数最大.考点 线性相关系数 题点 线性相关系数的应用 答案 D(3,10)解析 经计算,去掉D(3,10)这一组数据后,其他4组数据对应的点都集中在某一条直线附近,即两变量的线性相关性最强.14.为了分析某高三学生学习状态,对其下一阶段的学习提供指导性建议,现对他前7次考试的数学成绩x 、物理成绩y 进行分析,下面是该生7次考试的成绩.(单位:分)(1)他的数学成绩与物理成绩哪个更稳定?请给出你的理由;(2)已知该学生的物理成绩y 与数学成绩x 是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少分,并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理建议.考点 线性回归分析 题点 回归直线的应用解 (1)x =100+-12-17+17-8+8+127=100,y =100+-6-9+8-4+4+1+67=100,s 2数学=142,s 2物理=2507,因为s 2数学>s 2物理,所以他的物理成绩更稳定. (2)由于x 与y 之间具有线性相关关系,经计算得b ^=0.5,a ^=100-0.5×100=50.所以回归直线方程为y ^=0.5x +50. 当y =115时,x =130. 估计他的数学成绩是130分.建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于物理成绩的进一步提高.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.2 回归分析(二) (检测教师版)
时间:50分钟 总分:80分
班级: 姓名:
一、 选择题(共6小题,每题5分,共30分)
1.有下列数据:
下列四个函数中,模拟效果最好的为 A .132x y -=⨯ B .2log y x = C .3y x =
D .2y x =
【答案】A
【解析】当x =1,2,3时,分别代入求y 值,离y 最近的值模拟效果最好,可知A 模拟效果最好.故选A .
2.以模型e kx y c =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程为
0.34z x =+,则c =
A .0.3
B .0.3e
C .4
D .4e
【答案】D
【解析】由e kx y c =,等式两边取对数得ln ln e ln kx y c c kx ==+,令ln z y =,则
ln z c kx =+,由
0.34z x =+,得ln 4c =,故4e c =.故选D .
3.已知人的年龄x 与人体脂肪含量的百分数y 的回归方程为y ^
=0.577x -0.448,如果某人36岁,那么这个人的脂肪含量( ) A .一定是20.3%
B .在20.3%附近的可能性比较大
C .无任何参考数据
D .以上解释都无道理 【答案】 B
【解析】 将x =36代入回归方程得y ^
=0.577×36-0.448≈20.3.由回归分析的意义知,这个人的脂肪含量在20.3%附近的可能性较大,故选B.
4.若一函数模型为y =ax 2+bx +c (a ≠0),为将y 转化为t 的线性回归方程,则需作变换t =( ) A .x 2 B .(x +a )2 C.⎝⎛⎭⎫x +b 2a 2 D .以上都不对
【答案】 C
【解析】 y 关于t 的线性回归方程,实际上就是y 关于t 的一次函数,又因为y =a ⎝⎛⎭
⎫x +b
2a 2
+4ac -b 2
4a
,所以可知选项C 正确.
5.某学校开展研究性学习活动,某同学获得一组实验数据如下表:
A .y =2x -2
B .y =(1
2)x
C .y =log 2x
D .y =1
2
(x 2-1)
【答案】 D
【解析】可以代入检验,当x 取相应的值时,所求y 与已知y 相差平方和最小的便是拟合程度最高的.
6.甲、乙、丙、丁四位同学各自对A 、B 两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r 与残差平方和m 如下表:
) A .甲 B .乙 C .丙 D .丁
【答案】 D
【解析】 r 越接近1,相关性越强,残差平方和m 越小,相关性越强,故选D . 二、 填空题(共4小题,每题5分,共20分)
7.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =1
2x +1上,则这组样本数据的样本相
关系数为________. 【答案】 1
【解析】 根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为1. 8.已知方程y ^
=0.85x -82.71是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm ,y ^
的单位是kg ,那么针对某个体(160,53)的残差是________. 【答案】 -0.29
【解析】 把x =160代入y ^
=0.85x -82.71, 得y ^
=0.85×160-82.71=53.29, 所以残差e ^=y -y ^
=53-53.29=-0.29.
9.当建立了多个模型来拟合某一组数据时,为了比较各个模型的拟合效果,我们可以通过计算________来确定.
(1)残差平方和;(2)相关指数R 2;
(3)相关系数r
【答案】 (1)(2)
10.在研究身高和体重的关系时,求得相关指数R 2
≈ ,可以叙述为“身高解释了64%的体重变化,而随机误差贡献了剩余的36%”,所以身高对体重的效应比随机误差的效应大得多.
【答案】0.64
【解析】结合R 2
的计算公式R 2
=n
2
i
i i 1n 2
i
i 1
(y
y )1(y
y)==--
-∑∑可知,当R 2
=0.64时,身高解释了64%的体重
变化.
三、解答题(共3小题,每题10分,共30分)
11.某地区不同身高x (单位cm )的未成年男性的体重y (单位kg )的平均值如下表:
试建立y 与x 之间的回归方程.
【答案】0.020.693ˆe x y
+=. 【解析】根据上表中的数据,画出散点图如图1所示:
由图1可以看出,样本点分布在某条指数型函数曲线21e c x
y c =的周围,于是令ln z y =,
图1
图2
则题中表变换后为
画出散点图如图2所示,从图中可以看出,变换后的样本点分布在某条直线的附近,因此可用线性回归模型来拟合.由表中数据易得,z 与
x 之间的线性回归方程为
ˆ0.020.693z
x =+, 则y 与x 之间的非线性回归方程为0.020.693ˆe x y
+=. 12.关于x 与y 有如下数据关系:
为了对x,y 两个变量进行统计分析,现有以下两种线性模型:甲模型y =6.5x+17.5,乙模型
y =7x+17,试比较哪一个模型拟合的效果更好.
【答案】见解析.
【解析】=
5
2
i i
i1
5
2
i
i1
(y y)
1
(y y)
=
=
-
-
-
∑
∑
=1-
=0.845,
=
5
2
i i
i1
5
2
i
i1
(y y)
1
(y y)
=
=
-
-
-
∑
∑
=1-=0.82,
84.5%>82%,所以甲模型拟合效果更好.
13.下表是某年美国旧轿车价格的调查资料,以x(年)表示轿车的使用年数,y(美元)表示相应的年均价格,求y关于x的非线性回归方程.
【答案】见解析.
【解析】画散点图如图1所示,
看出y与x呈指数关系,于是令
z=lny.变换后得数据:
画散点图如图2所示,由图可知各点基本处于一条直线,
由于==5.5,
==6.5274,
10
i i i 110
2
2i
i 1
x z
10xz b 0.298,a z bx 6.527 40.298 5.58.166,x
10x
==-=
=
-=-=+⨯≈-∑∑
所以由表中数据可得线性回归方程为z =8.166-0.298x,因此旧轿车的平均价格对使用年数的非线性回归方程为y =e 8.166-0.298x .。