数学课后巩固及单元测试-第三章统计案例题
高中数学第三章统计案例3_2回归分析课后训练苏教版选修2-3(7页)

高中数学第三章统计案例3_2回归分析课后训练苏教版选修2-3(7页)文档来源为:从网络收集整理文档来源为:从网络收集整理.word版本可编辑?欢迎下载支持.PAGEPAGE #文档收集于互联网.已整理.word版本可编辑.文档来源为:从网络收集整理文档来源为:从网络收集整理.word版本可编辑?欢迎下载支持.PAGEPAGE #文档收集于互联网.已整理.word版本可编辑.3.2回归分析练习对某种机器购苣后运营年限次序x(l,2,3,…),与当年增加利润y的统计分析知具备线性相关关系,回归方程为:y =10.47—1.3<估计该台机器使用年最合算.假设关于某设备的使用年限x与所支出的维修费用y(万元)有如下的统汁数据X234—6y2.23.85.56.5若由此资料知y与龙呈线性关系,则线性回归方程是?假设关于某市房屋而积/平方米)与购房费用y(万元),有如下的统汁数据: 龙(平方米)8090100110y(万元)42465359由资料表明y对%呈线性相关,若在该市购买120平方米的房屋,估计购房费用是万元.下表是关于某设备的使用年限(年)和所需要的维修费用y(万元)的几组统计数据:X234厂6y2.23.85.56.5请根孺上表提供的数据,用最小二乘法求出y关于”的线性回归方程?某车间为了规泄工时左额,需要确左加工零件所花费的时间,为此作了四次试验, 得到的数据如下:零件的个数*(个)234厂加工的时间y(小时)2.5344.5试预测加工10个零件需要多少时间?6 ?某研究性学习小组对春季昼夜温差大小与某花卉种子发芽多少之间的关系进行研究, 他们分别记录了 3月1日至3月5日的每天昼夜温差与实验室每天每100颗种子浸泡后的发芽数,得到如下资料:日期3月1日3月2日3月3日3月4日3月5日温差H°C)1011138发芽数y(颗)2325302616(1)若选取的是3月1日与3月5日的两组数据,请根据3月2日至3月4日的数据,求出p关于X的线性回归方程y =从+“;(2)若由线性回归方程得到的估计数据与所选岀的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?7.某种产品的广告费支出x与销售额y(单位:百万元)之间有如下对应数据:X21568y3040506070如果y与x之间具有线性相关关系.(1)作岀这些数据的散点图:(2)求这些数据的线性回归方程:(3)预测当广告费支出为9百万元时的销售额.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统汁,得到一个卖出的热饮杯数与当天气温的对比表,如下表所示:摄氏温度/°c—54712151923273136热饮杯数15615013212813011610489937654(1)画出散点图:(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律;(3)求回归方程:(4)如果某天的气温是2 r,预测这天卖出的热饮杯数.某个服装店经营某种服装,在某周内获纯利y(元),与该周每天销售这种服装件数x 之间的一组数据关系见表:X3456789y666973818990917 7 n已知.2 =280,工牙2 =45309,工舌牙=3487?⑴求x, y;(2)判断纯利y与每天销售件数*之间是否线性相关,如果线性相关,求岀回归方程?—个车间为了规左工时左额,需要确左加工零件所花费的时间,为此进行了 10次试验?测得的数据如下.零件数龙(个)102030405060708090100加工时间y(分)626875818995102108115122(1)求y对*的回归直线方程:⑵据此估计加工200个零件所用的时间是多少?文档来源为:从网络收集整理文档来源为:从网络收集整理.word版本可编辑?欢迎下载支持. PAGEPAGE #文档收集于互联网.已整理.word版本可编辑.文档来源为:从网络收集整理文档来源为:从网络收集整理.word版本可编辑?欢迎下载支持.774文档收集于互联网.已整理.word版本可编辑.参考答案1.答案:8解析:令即 10.47 — l?3x$o,.SW8,.:?估计该台机器使用8年较为合算.2?答案:y=0?08+l?23%5 __解析:代入 b =弋—= 1.23, y = a + bx,Ev-5?i-l/. a =0. 08..?.线性回归方程是y =0. 08+1. 23x.3?答案:64.5解析:V x =95, y =50 代入公式求得 b=0. 58, a=—5.1,.线性回归方程为y=0. 58.Y-5. 1.将x=120代入线性回归方程得y =64. 5(万元).估计购买120平方米的房屋时,购买房屋费用是64. 5万元.4.答案:y=l?23x+0?085 _解析:》彳=4+9+16+25+36 = 90,且x=4, y =5,刀=5, r-l.f_112?3 — 5x4x5_12?390 — 5x16 10a =5-1.23X4=0. 08,回归直线为y=l. 23x+0?08.5?解:5?解:2+3+4+5~~4-=3.5,齐2.5+3+4+4.5“5,4= 2X2. 5+3X3+4X4 + 5X4.5 = 52.5,x/ =4 + 9+16+25=54,、52.5-4x3.5x3.5 「54 — 4x3.5261=3.5-0.7X3.5 = 1.05.回归直线方程为y =0. 7x+l. 05,当 x=10 时,y=0.7X10+1.05=8. 05,预测加工10个零件需要8. 05小时._ 16?解:(1)由数拯,求得 x = —(11 + 13+12)=12,3- 1y = - (25+30+26)=27,33x y =972.3工兀牙=11X25 + 13X30 + 12X26=977,工舛2 =113+133+12”=434,3? = 432 ?97 /-I线性回归方程为y=7w+15?当”=9时,y=78?即当广告费支出为9百万元时,销售额为78百万元.解:(1)散点图如下图所示:从上图看到,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间呈负相关,即气温越髙,卖出去的热饮杯数越少.从散点图可以看岀,这些点大致分布在一条直线的附近,因此.可用公式求岀回归方程的系数._ _ 11 11x 215.364, y~lll?636,工x「=4335,工召开=14778./-I /-I112>必-1伐亍b = —__— p -2.352 ■X,2 -1 lx2 -1 lx2/-Ia = y-bx ?. 767.回归方程为:y=-2. 352x4-147. 767.⑷当x=2时,严143.因此,某天的气温为2 °C时,这天大约可以卖岀143杯热饮.9?解:9?解:(1) x = = 6 ,-66+69+73+81+89+90+91 右“? 7(2)画出散点图可知,y与%有线性相关关系, 设回归直线方程:y = bx + a. 559 3487-7x6x—严 b = =空=4.75,280-7x36 28?=79. 86-6X4. 75 = 51.36,■11215678910 X 10 20 30 10 50 60 70 80 90 100 X 62 68 75 S1 S9 95 102 108 1156201 3602 2503 2404 4505 7007 1408 6401035012200x =55, y =91. 7>10 10 10工彳=38500,工)「=87777,工兀’=55950/-I /-1 /-I回归直线方程V =4?75%+51?36.10.解:⑴列出下表,并用科学计算器进行计算.设所求的回归直线方程为y = bx + a.10 __2>川-10心/-I同时,利用上表可得… =55950-10x55x91.7r-la = y-bx =91. 7—0. 668X55=54. 96,38500-10x552即所求的回归直线方程为y =0. 668x4-54. 96?(2)这个回归直线方程的意义是当*增大1时,y的值约增加0?668,而54. 96是y不随 x增大而变化的部分.因此当 x=200 时,y 的估计值为 y=54. 96 + 0. 668X200=188. 56=189.故加工200个零件时所用的时间约为189分.。
高中数学第三章统计案例3_2回归分析课后导练苏教版选修23

高中数学 第三章 统计案例 回归分析课后导练 苏教版选修2-3基础达标某运动员训练次数与运动成绩之间的数据关系如下: 次数(x ) 32 33 35 37 39 44 46 成绩(y )25343739424851试求y 与x 之间的回归直线方程. 解析:∵x =38,y =,∴∑=71i i i y x =10 756,∑=712i i x =10 280,∑=712i i y =11 340.∴b ^=∑∑==--71227177i ii iixxy x yx =,a ^=y -b ^x =.∴回归直线方程为y^=考察硫酸铜在水中的溶解度y 与温度x 的关系时,做了9组试验,其数据如下: 温度x /℃ 0 10 20 30 40 50 60 70 80 溶解度y /g求:(1)回归直线方程;(2)相关系数r . 解析:(1)利用计算器分别求出x ,y ,∑=712i i x ,∑=912i iy,∑=91i ii yx ,利用回归直线公式可求出b ^= 2,a ^=可知,回归直线方程为y^= 2x +.(2)将上述数据代入相关系数公式,可得r= 4.水深x /m 流速y /(m·s -1)(2)预测水深为 m 时水的流速是多少?序号 xy x 2x y1 2 3 4 5 6 7 8 ∑于是,x =81×=,y =81×= 5. b ^=694.0151175.1892.249775.175.18993.272≈=⨯-⨯⨯- =1511≈. a ^= 5-1511×≈.y 对x 的回归直线方程为y^=a ^+b ^x =+.回归系数b ^=的意思是,在此灌溉渠道中,水深每增加 m ,水的流速平均增加 m /s(本例数据是以 m 为水深间隔测得的),a ^=可以解释为水的流速中不受水深影响的部分. (2)由(1)中求出的回归直线方程,把x =代入,易得y^=+×≈(m /s). 计算结果表明,当水深为 m 时可以预测水的流速约为 m /s.4.从某地成年男子中随机抽取n 人,测得平均身高x =172 c m,标准差s x = c m,平均体重y =72k g,标准差s y = k g,相关系数r =yyxx xy l l l =.求由身高估计平均体重的回归方程y ^=β^0+β^1x ,以及由体重估计平均身高的回归方程x ^=a ^+b ^y .解析:∵s x =n l xx,s y =nl yy ,∴nl n l nl yy xxxy •==××=. ∴β^1=26.776.57=nl n l xxxy=1. 于是可得b =212122121)125.18(12808.298475.2125.1812243.541212⨯-⨯⨯-=--∑∑==i ii iixxy x yx ≈. β^0=y -x β^1=72-172×1=-100,∴由身高估计平均体重的回归方程为y^=x -100.由x 、y 位置的对称性,得b^=22.1576.57=nlnlyyxy=.∴a^= x-y b^=172-72×=154.∴由体重估计平均身高的回归方程为x^=+154.5.一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间有如下一组数据: xy(1)画出散点图;(2)求月总成本y与月产量x之间的回归直线方程.解析:(1)画出的散点图如图所示.(2)通过计算器可得b^≈,a^=y-b^x= ×125.18≈.因此所求的回归直线方程是y^=+.6.已知10只狗的血球体积及红血球数的测量值如下表:血球体积x(mm)45 42 46 48 42 35 58 40 39 50红血球数y(百万)思路分析:求回归直线方程,就是由公式计算b^与a^的值.解析:由题意,得x=,y=,设回归直线方程为同y^=b^x+a^则b^=∑∑==--niiniiix nxy x nyx1221≈,a^=.故所求的回归直线方程为y^=调查者通过询问男、女大学生在购买食品时是否看营养说明得到的数据如下表所示:看营养说明不看营养说明总计男大学生23 32 55女大学生9 25 34总计32 57 89利用列联表的独立性检验估计看营养说明是否与性别有关系?思路分析:根据列联表中的数据代入公式求得χ2的值,进行比较判断得出相应结论.解:由公式得χ2=57323455)9322523(89))()()(()(22⨯⨯⨯⨯-⨯⨯=++++-d b c a d c b a bc ad n ≈<,所以我们没有理由认为看营养说明与男女性别有关,尽管在这次调查中男性看营养说明的比例5523比女性看营养说明的比例349高,但我们不能认为这些男、女大学生中男性比女性看营养说明的多.8.某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系,从这个工业部门内随机抽选了10个企业作样本,有如下资料: 产量(千件) x 生产费用(千元)y 40 150 42 140 48 160 55 170 65 150产量(千件)x 生产费用(千元)y 79 162 88 185 100 165 120 190 140185(2)对这两个变量之间是否线性相关进行相关性检验;(3)设回归直线方程为y ^=b ^x +a ^,求系数a ^,b ^. i x iy i x i 2y i 2x i y i1 40 150 1600 22500 60002 42 140 1764 19600 58803 48 160 2304 25600 7680 4 55 170 3 025 28 900 9 350 5 65 150 4 225 22 500 9 7506 79 162 6 241 26 244 12 7987 88 185 7 744 34 225 16 280 8 100 165 10 000 27 225 16 5009 120 190 14 400 36 100 22 800 10 140 185 19 600 34 225 25 900 合计7771 65770 903277 119132 929x =,y=,∑=1012i i x =70 903,∑=1012i i y =277 119,∑=101i ii yx =132 929r=)7.16510277119)(7.771070903(7.1657.771013292922⨯-⨯-⨯⨯-,即x 与y 的相关系数r≈.(2)查表显著性水平,自由度10-2=8.相应的相关系数临界值r = 9;因为r>,所以可以认为x 与y 之间具有线性相关关系. (3)b ^=27.7710709037.1657.7710132929⨯-⨯⨯-≈; a ^=综合运用9.已知10只狗的血球体积及红血球数的测量值如下表:x :血球体积(mm)y :红血球数(百万)45 42 46 48 42 39 50 35 58 40(1)画出上表的散点图;(2)求出回归直线并画出图形. 解析:(1)见下图:(2)x =101(45+42+46+48+42+35+58+40+39+50)=, y =101+++++++++=. 设回归直线的方程为y ^=b ^x +a ^,则b ^=∑∑==--ni ini iixn xy x n yx 1221 =,a ^=y -b x =.所以所求的回归直线为y ^=炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时钢水的含碳量x 与冶炼时间y (从炉料熔化完毕到出钢的时间)的一列数据,如下表所示:x %) 104 180 190 177 147 134 150 191 204 121 y (mi n ) 100 200 210 185 155 135 170205235125(1)y 与x 是否具有线性相关关系?(2)如果y 与x 具有线性相关关系,求回归直线方程.(3)预测当钢水含碳量为160个%时,应冶炼多少分钟? 思路分析:(1)判定两个变量是否具有线性相关关系,可通过计算相关系数与临界值关系;(2)设回归直线方程,依公式代入相关量计算可得;(3)把x =160代入回归直线方程求解可得. 解:(1)根据题意列表并计算如下: i1 2 3 4 5 6 7 8 9 10 x i104 180 190 177 147 134 150 191 204 121 y i100200210185155135170205235125x i y i 10400 36000 39900 32745 22785 18090 25500 39155 47940 15125x =,y =172,∑=1012i ix=265 448,∑=1012i iy=312 350,∑=101i ii yx i=287 640于是r=∑∑∑===---1011012222101)10(1010i i i ii iiy y x xyx yx ≈ 6,查表得显著性水平与n -2的相关系数临界值=, ∴r>.∴y 与x 具有线性相关关系. (2)设所求的回归直线方程为y^=b ^x +a ^,b ^=∑∑==--101221011010i ii iixxy x yx ≈,a ^≈,即所求的回归直线方程为y ^=当x =160时,y ^=×≈172(m i n ),即大约冶炼172 m i n . 11.研究某特殊药物A 有无副作用(比如服用后恶心),给50个患者服用此药,给另外50个患者服用安慰剂,记录每类样本中出现恶心的数目如下表: 有恶心 无恶心 合计 给药A 153550给安慰剂 4 46 50 合计1981100试问此药物有无恶心的副作用?思路分析:根据列联表中的数据代入公式求得χ2的值,与临界值进行比较判断得出相应结论.解:由题意,问题可以归纳为独立检验假设H 1:服该药物(A )与恶心(B )独立.为了检验假设,计算统计量χ2=81195050)3544615(1002⨯⨯⨯⨯-⨯⨯≈>.故拒绝H 1,即不能认为药物无恶心副作用,也可以说,我们有99%的把握说,该药物与副作用(恶心)有关.12.为了了解某地母亲身高x 与女儿身高y 的相关关系,随机测得10对母女的身高,如下表所示:母亲身高x /c m 159 160 160 163 159 154 159 158 159 157 女儿身高y /c m158 159 160161161155162157162156试对x 与y 进行一元线性回归分析,并预测当母亲身高为161 c m 时女儿的身高为多少? 解析:先对x 与y 作相关性检验.(1)作统计假设:x 与y 不具有线性相关关系. (2)由小概率与n -2=8在附表中查得=. (3)x =101(159+160+…+157)=, y =101(158+159+…+156)=, ∑=-1012210i i x x =(1592+1602+…+1572)-10×=,∑=101i ii yx -10x y =(159×158+160×159+…+157×156)-10××=,∑=1012i iy-10y 2=(1582+1592+…+1562)-10×=,所以r=9.566.472.37⨯≈.(4)|r|=>,即|r|>.从而有95%的把握认为x 与y 之间具有线性相关关系,去求回归直线方程是有意义的. 回归系数b ^=6.472.37≈≈, a ^=所以y 对x 的回归直线方程是y ^=+.回归系数反映出当母亲身高每增加1 c m时女儿身高平均增加 c m,a^=可以解释为女儿身高不受母亲身高变化影响的部分.当x=161时,y^=+×161=.这就是说当母亲身高为161 c m时女儿的身高大致也接近161 c m.。
高中数学《第三章统计案例复习参考题》10PPT课件

实数b 复数z=a+ bia,b∈R虚数b
0,
纯虚数a 0,
b
0,
0非纯虚数a≠0,
b≠0.
(3)复数相等
a+bi=c+di⇔__a_=__c_且__b_=__d___(a,b,c,d∈R).
(4)共轭复数 a+bi与c+di共轭⇔_a_=__c_且__b_=__-__d____(a,b,c,d∈R).
(4)复数的除法:除法的关键是分子、分母同乘以分 母的共轭复数,解题中要注意把i的幂写成最简形 式.
• 二、复习任务
• 1.理解复数的基本概念,理解复数相等的充要 条件.
• 2.了解复数的代数表示法和几何意义,会进行 复数代数形式的四则运算.
• 3.了解复数代数形式的加、减运算的几何意义 .
三、温故知新
(1)复数的定义 形如a+bi(a,b∈R)的数叫做复数,其中实部是________ ,虚部是________.
3、复数3-2i的虚部为__________. 4、复数2+3i的共轭复数是______.
五、真题展示
1、(2017·全国卷Ⅰ)设有下面四个命题
p1:若复数z满足∈R,则z∈R; p2:若复数z满足z2∈R,则z∈R; p3:若复数z1,z2满足z1z2∈R,则z1=z2; p4:若复数z∈R,则z∈R. 其中的真命题为( )
• A.第一象限 B.第二象限
• C.第三象限 D.第四象限
• 六、课堂练习
• 1、已知i是虚数单位,若复数z=-i的实部与虚
部相等,则z的共轭复数
.
• 2、已知复数z1=-1+2i,z2 =1-i,z3=3-4i, 它们在复平面上所对应的点分别为A、B、C,
若=λ+μ(λ,μ∈R),则λ+μ的值是
高中数学《第三章统计案例复习参考题》2PPT课件

再从中选4人作为新纳税法知识宣讲员,用a表示抽到作为宣讲员的收
入在 3000,5000 元的人数,b抽到作为宣讲员的收入在 5000,7000 元的人数,
随机变量 Z a b ,求Z的分布列与数学期望;
①由频数分布表可知从[3000,5000)及[5000,7000)的人群中抽 取7人,其中[3000,5000)中占3人,[5000,7000)的人中占4人, 再从这7人中选4人,所以Z的取值可能为0,2,4
(i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为 X , 求 EX ;
思路一: 发现不合格品数量服从二项分布
思路二: 直接以检验费用和赔偿费用的和为随机变量
令Y 表示余下的 180 件产品中的不合格品件 数,依题意知Y : B(180,0.1) ,
X 202 25Y ,即 X 40 25Y .
(1)记 20 件产品中恰有 2 件不合格品的概率为 f p ,求 f p 的最大值点 p0 ;
(2)现对一箱产品检验了 20 件,结果恰有 2 件不合格品,以(1)中确定的 p0 作为 p 的值.已知每件产品的检验费用为 2 元,若有不合格品进入用户手中,则工厂要对每 件不合格品支付 25 元的赔偿费用. (i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为 X , 求 EX ; (ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品 作检验?
(2)某企业统计2018年其充电站100天中各天充电车辆数,得如下的频数分布表:
辆数
天数
20
30
40
10
(同一组数据用该区间的中点值作代表) 2018年1月,国家出台政策,将纯电动汽车财政补贴逐步转移到充电基础设施建设上 来.该企业拟将转移补贴资金用于添置新型充电设备.现有直流、交流两种充电桩可供 购置.直流充电桩5万元/台,每台每天最多可以充电30辆车,每天维护费用500元/台; 交流充电桩1万元/台,每台每天最多可以充电4辆车,每天维护费用80元/台. 该企业现有两种购置方案: 方案一:购买100台直流充电桩和900台交流充电桩; 方案二:购买200台直流充电桩和400台交流充电桩. 假设车辆充电时优先使用新设备,且充电一辆车产生25元的收入, 用2018年的统计数据,分别估计该企业在两种方案下新设备产生的日利润. (日利润日收入日维护费用).
高中数学《第三章统计案例复习参考题》6PPT课件

n
( yi $ yi )2
R2=1-
i1 n
.
( yi y)2
i1
R2 的值越大,说明残差平方和越小,也就是说模型的拟合
效果越好.在线性回归模型中,R2 表示解释变量对于预报变量变
化的贡献率,R2 越接近于 1,表示回归的效果越好.
1.已知变量 x 与 y 正相关,且由观测数据算得样本平均数 x
年份 卷别 设问特点 涉及知识点
求解析式;求
全国
Ⅰ
数据最小值; 求费用平均 数;并据此决
柱状图、分 段函数、频 率、平均值
策
2016 全国 频率估计概 频率、概
Ⅱ 率;求平均值 率、平均值
全国
Ⅲ
求相关系数; 求回归方程, 并进行预测
样本折线 图、相关系 数、回归方 程
题目类型 解题思想方法
-4-
样本估计 观察、分析、
解析:由题意知,父亲的身高 x(单位:cm)与儿子的身高 y(单位:cm)对应关系如下表:
x
173
170
176
y
170
176
182
则 x =173+1730+176=173, y =170+1736+182=176,
3
( xi- x )(yi- y )=(173-173)×(170-176)+(170-173)
项 A 和 B 中的直线方程进行检验,可以排除 B.故选 A.
2.(2012 年新课标)在一组样本数据(x1,y1),(x2,y2),…, (xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样 本点(xi,yi)(i=1,2,…,n)都在直线 y=12x+1 上,则这组样本 数据的样本相关系数为( D )
高中数学 第三章 统计案例单元测评1(含解析)新人教A版选修2-3(2021年最新整理)

2017年高中数学第三章统计案例单元测评1(含解析)新人教A版选修2-3 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2017年高中数学第三章统计案例单元测评1(含解析)新人教A版选修2-3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2017年高中数学第三章统计案例单元测评1(含解析)新人教A版选修2-3的全部内容。
统计案例(时间:90分钟满分:120分)第Ⅰ卷(选择题,共50分)一、选择题:本大题共10小题,共50分.1.下列说法正确的是()A.相关关系是一种不确定的关系,回归分析是对相关关系的分析,因此没有实际意义B.独立性检验对分类变量关系的研究没有100%的把握,所以独立性检验研究的结果在实际中也没有多大的实际意义C.相关关系可以对变量的发展趋势进行预报,这种预报可能会是错误的D.独立性检验如果得出的结论有99%的可信度就意味着这个结论一定是正确的解析:相关关系虽然是一种不确定关系,但是回归分析可以在某种程度上对变量的发展趋势进行预报,这种预报在尽量减小误差的条件下可以对生产与生活起到一定的指导作用,独立性检验对分类变量的检验也是不确定的,但是其结果也有一定的实际意义.答案:C2.在对两个变量x,y进行线性回归分析时有下列步骤:①对所求出的回归方程作出解释;②收集数据(x i,y i),i=1,2,…,n;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图.如果根据可靠性要求能够作出变量x,y具有线性相关结论,则下列操作顺序正确的是( )A.①②⑤③④B.③②④⑤①C.②④③①⑤D.②⑤④③①解析:由对两个变量进行回归分析的步骤,知选D。
厦门市高中数学选修2-3第三章《统计案例》检测(包含答案解析)
一、选择题1.设(1+x)n =a 0+a 1x+…+a n x n ,若a 1+a 2+…+a n =63,则展开式中系数最大的项是( ) A .15x 2B .20x 3C .21x 3D .35x 32.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( ) 表1表2表3表4A .成绩B .视力C .智商D .阅读量3.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==4.对两个分类变量A ,B 的下列说法中正确的个数为( ) ①A 与B 无关,即A 与B 互不影响; ②A 与B 关系越密切,则K 2的值就越大; ③K 2的大小是判定A 与B 是否相关的唯一依据 A .0 B .1 C .2 D .3 5.下列命题正确的个数是:( )①对于两个分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握程度越大;②在相关关系中,若用211c x y c e =拟合时的相关指数为21R ,用2y bx a =+拟合时的相关指数为22R ,且2212R R >,则1y 的拟合效果好;③利用计算机产生0~1之间的均匀随机数a ,则事件“310a ->”发生的概率为23; ④“0,0a b >>”是“2b aa b+≥”的充分不必要条件 A .1B .2C .3D .46.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bc K a c b d a d b c -++++,其中n a b c d =+++.20()P K k ≥0.100.050.01 0.0050k 2.7063.8416.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们( )A .没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B .有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C .有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”7.近年来,由于大学生不理智消费导致财务方面的新闻层出不穷,无力偿还校园贷,跳楼自杀也偶有发生,一时间人们对大学生的消费观充满了质疑.为进一步了解大学生的消费情况,对S 城某大学的10000名(其中男生6000名,女生4000名)在校本科生,按性别采用分层抽样的方式抽取了1000名学生进行了问卷调查,其中有一项是针对大学生每月的消费金额进行调查统计,通过整理得如图所示的频率分布直方图.已知在抽取的学生中,月消费金额超过2000元的女生有150人.根据上述数据和频率分布直方图,判断下列说法正确的是( )参考数据与参考公式:003 1.732,sin150.258,sin7.50.1305=≈≈.A .月消费金额超过2000元的女生人数少于男生人数B .所调查的同学中月消费金额不超过500元的共有4人C .样本数据的中位数约为1750元D .在犯错的概率不超过0.1%的情况下认为月消费金额在2000元以上的大学生与性别有关 8.某中学采取分层抽样的方法从高二学生中按照性别抽出20名学生,其选报文科、理科的情况如下表所示,男 女文科2 5理科 10 3参考公式和数据:22()()()()()n ad bc K a c b d a b c d -=++++,其中n a b c d =+++.20()P K k ≥0.25 0.15 0.10 0.05 0.025 0.010 0.0050k 1.323 2.072 2.706 3.841 5.024 6.635 7.879则以下判断正确的是A .至少有97.5%的把握认为学生选报文理科与性别有关B .至多有97.5%的把握认为学生选报文理科与性别有关C .至少有95%的把握认为学生选报文理科与性别有关D .至多有95%的把握认为学生选报文理科与性别有关9.某种产品的广告费支出x 与销售额y (单位:万元)之间有下表关系: x 2 4 5 6 8 y3040605070y 与x 的线性回归方程为 6.5175ˆ.y x =+,当广告支出5万元时,随机误差的效应(残差)为( ) A .40 B .20 C .30D .1010.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e ,众数为m 0,平均数为x -,则( )A .m e =m 0=x -B .m 0<x -<m e C .m e <m 0<x -D .m 0<m e <x -11.通过随机询问72名不同性别的大学生在购买食物时是否看营养说明,得到如下列联表:性别与读营养说明列联表请问性别和读营养说明之间在多大程度上有关系 ()A.99%的可能性B.99.75%的可能性C.99.5%的可能性D.97.5%的可能性12.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,统计数据如下表附:经计算2 4.514K≈,现判断数学成绩与物理成绩有关系,则判断出错的概率不会超过A.0.5% B.1% C.2% D.5%二、填空题13.针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的13,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数的23.若有95%的把握认为是否喜欢韩剧和性别有关,求男生至少有______人.k 3.841 6.63510.828PM是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,下图是14. 2.5PM监测点统计的数据(单位:毫克/每立方据某地某日早7点至晚8点甲、乙两个2.5米)列出的茎叶图,则甲、乙两地浓度的方差较小的是_________.15.已知方程是根据女大学生的身高预报她的体重的回归方程,其中的单位是,的单位是,那么针对某个体的残差是______.16.已知下列说法:①分类变量A与B的随机变量越大,说明“A与B有关系”的可信度越大;②以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别是和;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为,若,,,则.其中说法正确的为_____________.(填序号)17.在2017年3月15日,某市物价部门对本市的5家商场的某种商品的一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示:价格x99.51010.511销售量y1110865由散点图可知,销售量y与价格x之间有较好的线性相关关系,其线性回归方程是:=-+,则a=__________.y x a3.218.某班运动队由足球运动员18人、篮球运动员12人、乒乓球运动员6人组成(每人只参加一项),现从这些运动员中抽取一个容量为n的样本,若分别采用系统抽样法和分层抽样法,则都不用剔除个体;当样本容量为n+1时,若采用系统抽样法,则需要剔除1个个体,那么样本容量n为________.19.已知x、y之间的一组数据如下:x0123y8264则线性回归方程ˆy a bx=+所表示的直线必经过点________.20.为了了解司机开车时礼让斑马线行人的情况,交警部门调查了100名机动车司机,得到以下统计数据:若以2χ为统计量进行独立性检验,则2χ的值是__________.(结果保留2位小数)参考公式()11221221 21212n n n n nn n n nχ++++-=三、解答题21.司机在开机动车时使用手机是违法行为,会存在严重的安全隐患,危及自己和他人的生命. 为了研究司机开车时使用手机的情况,交警部门调查了100名机动车司机,得到以下统计:在55名男性司机中,开车时使用手机的有40人,开车时不使用手机的有15人;在45名女性司机中,开车时使用手机的有20人,开车时不使用手机的有25人.(1)完成下面的22⨯列联表,并判断是否有99.5%的把握认为开车时使用手机与司机的性别有关;(2)以上述的样本数据来估计总体,现交警部门从道路上行驶的大量机动车中随机抽检3辆,记这3辆车中司机为男性且开车时使用手机的车辆数为X,若每次抽检的结果都相互独立,求X的分布列和数学期望()E X.参考公式与数据:参考数据:参考公式()()()()()22n ad bc a b c d a c b d χ-=++++,其中n a b c d =+++.22.为提高全民身体素质,加强体育运动意识,某校体育部从全校随机抽取了男生、女生各100人进行问卷调查,以了解学生参加体育运动的积极性是否与性别有关,得到如下列联表(单位:人):(1)根据以上数据,判断能否在犯错误的概率不超过10%的情况下认为该校参加体育运动的积极性与性别有关;(2)用频率估计概率,现从该校所有女生中随机抽取3人.记被抽取的3人中“偶尔运动或不运动”的人数为X ,求X 的分布列、期望()E X 和方差()D X .附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.2.07223.为了促进我国人口均衡发展,从2016年1月1日起,全国统一实施全面放开二孩政策,这也是为了重建大国人口观,重新认识人口价值、人口规律、人口问题,某研究机构为了了解人们对全面放开生育二孩政策的态度,随机调查了200人,得到的统计数据如下面的不完整的2×2列联表所示(单位:人):(1)完成2×2列联表,并求是否有90%的把握认为是否“支持生育二孩”与性别有关? (2)该研究机构从样本中筛选出4名男性和3名女性共7人作为代表,这7个代表中有2名男性和2名女性支持生育二孩现从这7名代表中任选3名男性和2名女性参加座谈会,记ξ为参加会议的支持生育二孩的人数,求ξ的分布列及数学期望()E ξ.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:24.某媒体对“男女延迟退休”这一公众关注的问题进行了民意调查,下表是在某单位调查后得到的数据(人数):(1)能否有90%以上的把握认为对这一问题的看法与性别有关? (2)进一步调查:①从赞同“男女延迟退休”的16人中选出3人进行陈述发言,求事件“男士和女士各至少有1人发言”的概率;②从反对“男女延迟退休”的9人中选出3人进行座谈,设选出的3人中女士人数为X ,求X 的分布列和数学期望.附:()21122122121212n n n n n n n n n χ++++-=25.某企业是否支持进军新的区域市场,在全体员工中进行了抽样调查,调查结果如下表所示:(1)根据表中数据,问是否有99%的把握认为“新员工和老员工是否支持进军新的区域市场有差异”;(2)已知在被调查的新员工中有6名来自市场部,其中2名支持进军新的区域市场,现在从这6人中随机抽取3人,设其中支持进军新的区域市场人数为随机变量X,求X的分布列和数学期望.附:()22()()()()n ac bdKa b a c b d c d-=++++26.为了了解某班学生喜欢数学是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表,已知在全部50人中随机抽取1人抽到喜欢数学的学生的概率为3 5 .(1)能否在犯错误的概率不超过0.005的前提下认为喜欢数学与性别有关?说明你的理由;()20P K k ≥ 0.150.100.050.025 0.010 0.005 0.001 0k 2.702 2.7063.8415.0246.6357.87910.828(2)现从女生中抽取2人进一步调查,设其中喜欢数学的女生人数为ξ,求ξ的分布列与期望.临界表供参考:(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++)【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【解析】 令x=1,则(1+1)n =++…+=64.∴n=6.故(1+x)6的展开式中系数最大的项为T 4=x 3=20x 3.2.D解析:D 【分析】计算得到22322214χχχχ>>>,得到答案. 【详解】计算得到:222152(6221410)5281636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯; 222252(4201612)521121636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯ ; 222352(824128)52961636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯ ; 222452(143062)524081636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯;故22322214χχχχ>>>. 故选:D . 【点睛】本题考查了独立性检验,意在考查学生的计算能力和应用能力.3.D解析:D 【解析】【分析】根据公式()()()()()22n ad bcKa b c d a c b d-=++++,分别利用4个选项中所给数据求出2K的值,比较所求值的大小即可得结果.【详解】选项A:22160(535155)3204010502K⨯⨯-⨯==⨯⨯⨯,选项B:22260(5251515)152040204016K⨯⨯-⨯==⨯⨯⨯,选项C:22360(5201520)24204025357K⨯⨯-⨯==⨯⨯⨯,选项D:22 460(5101530)96 204035257K⨯⨯-⨯==⨯⨯⨯,可得222431K K K>>22K>,所以由选项D中的数据得到的2K值最大,说明X与Y有关系的可能性最大,故选D.【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2K越大两个变量有关的可能性越大这一性质.4.B解析:B【解析】【分析】根据独立性检验的思想,对题目中的命题进行分析、判断正误即可.【详解】对于①,对事件A与B无关时,说明两事件的影响较小,不是两个互不影响,①错误;对于②,事件A与B关系密切,说明事件A与B的相关性就越强,K2就越大,②正确;对于③,K2的大小不是判定事件A与B是否相关的唯一根据,判定两事件是否相关除了公式外;还可以用三维柱形图和二维条形图等方法来判定,③错误;故选:B.【点睛】本题考查了独立性检验思想的应用问题,属于基础题.K2值是用来判断两个变量相关的把握度的,不是用来判断两个变量是否相关的.5.C解析:C【解析】分析:根据独立性检验的性质可判断①;根据回归分析的基本原理可判断②;根据几何概型概率公式可判断③;根据不等式的性质可判断④.详解:①对于两个分类变量X与Y的随机变量2K的观测值k来说,k越小,判断“X与Y 有关系”的把握程度越小,①错误;②在相关关系中,若用211c xy c e =拟合时的相关指数为21R ,用2y bx a =+拟合时的相关指数为22R ,且2212R R >,则1y 的拟合效果好,②正确;③利用计算机产生0~1之间的均匀随机数a ,则事件“310a ->”发生的概率为1123103-=-,正确;④“0,0a b >>”可得到“2b a a b +≥”, “2b aa b+≥”时“0,0a b >>”不一定成立,所以“0,0a b >>”是“2b aa b+≥”的充分不必要条件,正确,即正确命题的个数是3,故选C. 点睛:本题主要通过对多个命题真假的判断,主要综合独立性检验、回归分析、几何概型概率公式、不等式的性质,属于中档题.这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.6.B解析:B 【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K 的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人, 又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人, 又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530) 4.762 3.8412109075225K ⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”, 故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.7.D解析:D 【解析】分析:由题意首先求得a 的值,然后结合分层抽样的定义和独立性检验的结论逐一考查所给选项是否正确即可.详解:由直方图知,(0.004+0.013+0.014+a +0.027+0.039+0.08)×5=1,解得a =0.023, 故月消费金额超过2000元的大学生人数为(0.023+0.014+0.013)×5×1000=250人, 由分层抽样知,男生、女生抽样的人数分别为600人和400人, 由题知,月消费金额超过2000元的男生人数为100人,故A 选项错误; 月消费金额不超过500元的人数为0.004×5×1000=20人,故选项B 错误; 又由频率分布直方图知,当消费金额小于1750元时, 频率为(0.004+0.027+0.039)×5+0.08×5×12=0.55>0.5.选项C 错误; 由条件可以列出列联表:故K 2的观测值()()()()50010.8289n ad bc k a b c d a c b d -==>++++, 所以在犯错的概率不超过0.1%的情况下可以判断月消费金额在2000元以上的大学生与性别有关. 本题选择D 选项.点睛:解决频率分布直方图的问题,关键在于找出图中数据之间的联系.这些数据中,比较明显的有组距、频率组距,间接的有频率、小长方形的面积,合理使用这些数据,再结合两个等量关系:小长方形面积=组距×频率组距=频率,小长方形面积之和等于1,即频率之和等于1,就可以解决直方图的有关问题.8.C解析:C由题易得22⨯列联表如下:则2K 的观测值为()22023510 4.432 3.841128713k ⨯⨯-⨯=≈>⨯⨯⨯,所以至少有95%的把握认为学生选报文理科与性别有关,故选:C .【解题必备】(1)独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握认为两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系.(2)列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此,需要用独立性检验的方法确认所得结论在多大程度上适用于总体.即独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释. (3)独立性检验的具体做法:①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α, 然后查下表确定临界值0k ; ②利用公式()()()()()22n ad bc K a c b d a b c d -=++++,计算随机变量2K 的观测值k ;③如果0k k ≥,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”.说明:通常认为 2.706k ≤时,样本数据就没有充分的证据显示“X 与Y 有关系”.9.D解析:D 【解析】∵y 与x 的线性回归方程为 6.5175ˆ.y x =+ 当5x =时,ˆ50y=. 当广告支出5万元时,由表格得:60y = 故随机误差的效应(残差)为605010.-=10.D解析:D 【解析】由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数为m 0=5,平均数为x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m 0<m e <x . 故答案为D.点睛:这个题目考查的是条型分布直方表的应用,以及基本量:均值,平均数的考查;一般在这类图中平均数就是将数据加到一起除以数据的个数即可,在频率分布直方表中是取每个长方条的中点乘以相应的频率并相加即可.11.C解析:C 【详解】由题意可知16,28,20,8a b c d ====,44,28,36,36a b c d a c c d +=+=+=+=,72n a b c d =+++=,代入公式()()()()()22n ad bc K a b c d a c b d -=++++得()227216828208.4244283636K ⨯⨯-⨯=≈⨯⨯⨯,由于28.427.879K ≈>,我们就有0099.5的把握认为性别和读营养说明之间有关系,即性别和读营养说明之间有0099.5的可能是有关系的,故选C .12.D解析:D 【解析】23.841 4.514 6.635k <=<,则0.010.05P <<,出错概率不超过5%选D.二、填空题13.【分析】设男生人数为依题意填写列联表计算观测值列出不等式求出的取值范围再根据题意求出男生的人数【详解】设男生人数为由题意可得列联表如下: 喜欢韩剧 不喜欢韩剧 总计 男生 女生 总 解析:18【分析】设男生人数为x ,依题意填写列联表,计算观测值,列出不等式求出x 的取值范围,再根据题意求出男生的人数. 【详解】设男生人数为x ,由题意可得列联表如下:喜欢韩剧 不喜欢韩剧 总计男生6x 56x x女生29x 9x 3x 总计718x 718x 43x 若有的把握认为是否喜欢韩剧和性别有关,则 3.841k >,即2452()3636969 3.84171711931818x x x x x x k x x x x ⋅-⋅==>⋅⋅⋅, 解得12.697x >.因为各部分人数均为整数,所以若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有18人. 故答案为:18. 【点睛】本题考查独立性检验的应用,解题关键是列出列联表,然后进行计算,属于常考题.14.甲【解析】根据茎叶图中的数据可知甲地的数据都集中在006和007之间数据分布比较稳定而乙地的数据分布比较分散不如甲地数据集中故甲地的方差小故答案为甲解析:甲 【解析】根据茎叶图中的数据可知,甲地的数据都集中在0.06和0.07之间,数据分布比较稳定,而乙地的数据分布比较分散,不如甲地数据集中,故甲地的方差小,故答案为甲.15.【解析】试题分析:由回归直线方程可知当时所以针对个体的残差是考点:线性回归方程 解析:0.29-【解析】试题分析:由回归直线方程可知当160x =时,53.29y =,所以针对个体的残差是5353.290.29-=-.考点:线性回归方程.16.①②③【解析】①正确因为k2越大说明A 和B 有关系的把握性就越大;②正确因为y=cekx 那么lny=lncekx=kx+lnc 即z=kx+lnc=03x+4解得k=03lnc=4解得:k=03c=e4解析:①②③【解析】①正确,因为越大,说明“和有关系”的把握性就越大;②正确,因为,那么,即,解得,解得:所以正确;③在回归直线上,所以,解得:,所以正确,那么正确的有①②③.【点睛】本题是以命题形式考查了回归方程和独立性检验的相关知识,样本中心点必在回归直线上,独立性检验中越大,说明犯错误的概率越小,即认为两个变量有关的把握性就越大.17.40【解析】根据题意:解析:40【解析】根据题意:99.51010.511105x++++==,111086585y++++==,3.2y x a=-+, 3.210840a∴=⨯+=18.6【解析】n为18+12+6=36的正约数因为18:12:6=3:2:1所以n为6的倍数因此因为当样本容量为时若采用系统抽样法则需要剔除1个个体所以n+1为35的正约数因此解析:6【解析】n为18+12+6=36的正约数,因为18:12:6=3:2:1,所以n为6的倍数,因此6,12,18,24,30,36n=因为当样本容量为1n+时,若采用系统抽样法,则需要剔除1个个体,所以n+1为35的正约数,因此6n=19.(155)【解析】由题意可得:线性回归方程过样本中心点即线性回归方程所表示的直线必经过点(155)点睛:(1)正确理解计算的公式和准确的计算是求线性回归方程的关键(2)回归直线方程必过样本点中心解析:(1.5,5)【解析】由题意可得:01231.54x+++==,826454y+++==,线性回归方程过样本中心点,即线性回归方程ˆy a bx=+所表示的直线必经过点(1.5,5)点睛:(1)正确理解计算,b a的公式和准确的计算是求线性回归方程的关键.(2)回归直线方程y bx a=+必过样本点中心(),x y.20.【解析】分析:根据题意填写2×2列联表计算观测值对照临界值得出结论详解:填写2×2列联表如下:根据数表计算=≈825>7879所以有995的把握认为开车时使用手机与司机的性别有关;点睛:独立性检验的 解析:8.25【解析】分析:根据题意填写2×2列联表,计算观测值,对照临界值得出结论. 详解:填写2×2列联表,如下:根据数表,计算()()()()()22n ad bc a b c d a c b d -X =++++=()21004025201555456040⨯⨯-⨯⨯⨯⨯≈8.25>7.879,所以有99.5%的把握认为开车时使用手机与司机的性别有关;点睛:独立性检验的一般步骤:(I )根据样本数据制成22⨯列联表;(II )根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(III ) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)三、解答题21.(1)列联表见解析,有;(2)分布列见解析,1.2. 【分析】(1)根据已知数据即可得到列联表;计算出28.2497.879χ≈>,对比临界值表可得到结果;(2)由样本估计总体思想,可得到随机抽检1辆,司机为男性且开车使用手机的概率为25,可知235X B ⎛⎫⎪⎝⎭,,由二项分布概率公式可计算得到每个取值所对应的概率,从而得到分布列;由二项分布数学期望计算公式可得()E X . 【详解】(1)由已知数据可得22⨯列联表如下:开车时使用手机 开车时不使用手机合计男性司机人数 40 1555女性司机人数2025 45()2100402515208.2497.87960405545χ⨯⨯-⨯=≈⨯⨯⨯>∴有99.5%的把握认为开车时使用手机与司机的性别有关(2)随机抽检1辆,司机为男性且开车时使用手机的概率4021005p == 有题意可知:X 可取值是0,1,2,3,且235XB ⎛⎫ ⎪⎝⎭, ()03032327055125P X C ⎛⎫⎛⎫∴=== ⎪ ⎪⎝⎭⎝⎭;()12132354155125P X C ⎛⎫⎛⎫=== ⎪⎪⎝⎭⎝⎭; ()21232336255125P X C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭;()333238355125P X C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭ 则X 的分布列为:数学期望()3 1.25E X =⨯= 【点睛】本题考查独立性检验的应用、二项分布的分布列及数学期望的求解等知识,对学生的计算和求解能力有一定要求,属于常考题型.22.(1)不能在犯错误的概率不超过10%的情况下认为该校参加体育运动的积极性与性别有关;(2)分布列答案见解析,6()5E X =,18()25D X =. 【分析】(1)代入2K 即可得出结论;(2)X 服从二项分布,分别求出概率,即可得出X 的分布列,然后代入数据求出期望和方差即可. 【详解】(1)由列联表可知2200(70406030)2002.1981307010010091k ⨯⨯-⨯==≈⨯⨯⨯,因为2.198 2.706<,所以不能在犯错误的概率不超过10%的情况下认为该校参加体育运动的积极性与性别有关. (2)由题意可知2(3,)5XB ,X 的所有可能取值为0,1,2,3,033327(0)()5125P X C ===,1232354(1)()()55125P X C ==⨯=,2232336(2)()55125P X C ==⨯=,33328(3)()5125P X C ===. 所以X 的分布列为()355E X =⨯=,()3(1)5525D X =⨯⨯-=.【点睛】本题主要考查独立性检验原理以及利用二项分布求期望和方差.属于中档题. 23.(1)答案见解析,没有;(2)答案见解析,176. 【分析】(1)由表中的已知数据先补充列联表,再计算2K 与临界值2.706比较大小即可; (2))设参加座谈会的男性中支持生育二孩的人数为m ,女性中支持生育二孩的人数为n ,则m n ξ=+,且ξ的可能取值为2,3,4,利用离散型随机变量的取值求概率,画出分布列,求出数学期望即可. 【详解】(1)补充完整的2×2列联表如下:()()()()()()220070403060 2.198 2.70613070100100n ad bc K a b c d a c b d -⨯⨯-⨯==≈<++++⨯⨯⨯,所以没有90%的把握认为是否“支持生育二孩”与性别有关.(2)设参加座谈会的男性中支持生育二孩的人数为m ,女性中支持生育二孩的人数为n ,则m n ξ=+,且ξ的可能取值为2,3,4.()()121122213243121,13C C C C P P m n C C ξ======, ()()()2111122222122232324343132,11,22C C C C C C C P P m n P m n C C C C ξ====+===+=, 22222324131(4)(2,2)6C C C P P m n C C ξ======, 所以ξ的分布列为。
高中数学第三章统计案例2独立性检验课后巩固提升北师大版选修2_3
2 独立性检验[A组基础巩固]1.如果有99%的把握认为“X与Y有关系”,那么具体算出的数据满足( ) A.χ2>6.635 B.χ2>5.024C.χ2>4.879 D.χ2>3.841解析:当χ2>6.635时,有99%的把握认为“X与Y有关系”.答案:A2.分类变量X和Y的列联表如下:A.ad-bc越小,说明X与Y关系越弱B.ad-bc越大,说明X与Y关系越强C.(ad-bc)2越大,说明X与Y关系越强D.(ad-bc)2越接近于0,说明X与Y关系越强解析:因为χ2=n(ad-bc)2(a+b)(a+c)(b+d)(c+d),当(ad-bc)2越大时,χ2越大,说明X与Y 关系越强.答案:C3.下列关于χ2的说法正确的是( )A.χ2在任何问题中都可以用来检验两个变量有关还是无关B.χ2的值越大,两个分类变量的相关性就越大C.χ2是用来判断两个变量是否有关系的随机变量,当χ2的值很小时可以判定两个分类变量不相关D.χ2=n(ad-bc)(a+b)(c+d)(a+c)(b+d)解析:χ2只适用于2×2列联表问题,故A错;χ2只能判断两个变量相关,不能判断两个分类变量不相关,故C错;选项D中公式错误,分子应为n(ad-bc)2.故选B.答案:B4.如果根据性别与是否爱好运动的列联表得到χ2≈3.852>3.841,所以判断性别与运动有关,那么这种判断犯错的可能性不超过( )A .2.5 %B .0.5 %C .1 %D .5 %解析:∵χ2>3.841,∴有95 %的把握认为性别与运动有关,这种判断犯错的可能性不超过5 %.答案:D5.根据下面的列联表得到如下四个判断:①至少有99.9%的把握认为“患肝病与嗜酒有关”;②至少有99%的把握认为“患肝病与嗜酒有关”;③在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒有关”;④在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒无关”.A .0B .1C .2D .3解析:由列联表中数据可求得随机变量χ2=992×(700×32-60×200)2760×232×900×92≈7.349>6.635,所以在犯错误的概率不超过0.01的前提下,认为“患肝病与嗜酒有关系”,即至少有99%的把握认为“患肝病与嗜酒有关系”.因此②③正确,故选C.答案:C6.若由一个2×2列联表中的数据计算得χ2=4.013,那么在犯错误的概率不超过________的前提下认为两个变量之间有关系.解析:因χ2=4.013>3.841,因此,在犯错误的概率不超过0.05的前提下,认为两个变量之间有关系.答案:0.057.某高校《统计初步》课程的教师随机调查了选该课的学生的一些情况,具体数据如下表:则χ2=________,有________的把握判定主修统计专业与性别有关.解析:χ2=50×(13×20-10×7)220×30×23×27≈4.844>3.841,故有95%的把握认为主修统计专业与性别有关. 答案:4.844 95%8.为探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠,在照射后14天内的结果如下表所示:________. 解析:χ2=50×(14×19-6×11)220×30×25×25≈5.333.答案:5.3339.某教育机构为了研究人具有大学专科以上学历(包括大学专科)和对待教育改革态度的关系,随机抽取了392名成年人进行调查,所得数据如下表所示:解析:由公式得χ2=392×(39×167-157×29)2196×196×68×324≈1.78,∵1.78<2.706,∴我们没有充分的理由说人具有大学专科以上学历(包括大学专科)和对待教育改革的态度有关.10.动物园对某种动物进行接种试验,预防传染病,经试验得到如下数据:解析:由已知数据得2×2列联表如下:则χ2=86×86×24×148≈6.973,∵6.973>6.635,∴有99%的把握认为“接种”与“染病”有关.又设A 为接种未染病,B 为未接种未染病,则由数据得P (A )=8086≈0.930 2,P (B )=6886≈0.790 7.∴我们有99%的把握认为接种能够更有效地预防传染病.[B 组 能力提升]1.下列说法正确的个数为( )①对事件A 与B 的检验无关时,即两个事件互不影响;②事件A 与B 关系越密切,则χ2就越大;③χ2的大小是判定事件A 与B 是否相关的唯一根据;④若判定两事件A 与B 有关,则A 发生B 一定发生.A .1B .2C .3D .4解析:对于①,对事件A 与B 的检验无关,只是说两事件的相关性较小,并不一定是两事件互不影响,故①错;②是正确的;对于③,判断A 与B 是否相关的方式很多,可以用图表,也可以借助于概率运算,故③错;对于④,两事件A 与B 有关,说明两者同时发生的可能性相对来说较大,但并不是A 发生B 一定发生,故④错.答案:A2.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )表1表2表3表4A .成绩B .视力C .智商D .阅读量解析:因为χ21=52×(6×22-14×10)216×36×32×20=52×8216×36×32×20,χ22=52×(4×20-16×12)216×36×32×20=52×112216×36×32×20,χ23=52×(8×24-12×8)216×36×32×20=52×96216×36×32×20,χ24=52×(14×30-6×2)216×36×32×20=52×408216×36×32×20,则有χ24>χ22>χ23>χ21,所以阅读量与性别关联的可能性最大.答案:D3.某企业为了更好地了解设备改造前后与生产合格品的关系,随机抽取了180件产品进行分析.其中设备改造前生产的合格品有36件,不合格品有49件;设备改造后生产的合格品有65件,不合格品有30件.根据上面的数据,计算χ2的值约为________.(精确到0.001)解析:由已知数据得到下表:根据公式χ2=95×85×101×79≈12.379.答案:12.3794.某卫生机构对366人进行健康体检,有阳性家族史者糖尿病发病的有16例,不发病的有93例,阴性家族史者糖尿病发病的有17例,不发病的有240例,那么,在犯错误的概率不超过________的前提下认为糖尿病患者与遗传有关系.解析:列出2×2列联表:所以χ2=366×(109×257×33×333≈6.067>3.841.因此,在犯错误的概率不超过0.05的前提下认为糖尿病患者与遗传有关. 答案:0.055.某种产品的质量以其质量指标值衡量,质量指标值大于或等于98且小于106的产品为优质品,现用两种新配方(分别称为A 配方和B 配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值,得到下面试验结果:A 配方的频数分布表(2)由以上统计数据填写2×2列联表,问是否有90%的把握认为“A 配方与B 配方的质量有差异”?解析:(1)由试验结果知,用A 配方生产的产品中优质品的频率为42+22100=64100=0.64,所以用A 配方生产的产品的优质品率的估计值为0.64.由试验结果知,用B 配方生产的产品中优质品的频率为42+32100=74100=0.74,所以用B 配方生产的产品的优质品率的估计值为0.74.(2)2×2列联表:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=200×(64×26-74×36)2138×62×100×100≈2.3375.由于2.3375<2.706,所以没有90%的把握认为“A 配方与B 配方的质量有差异”. 6.某学校发现有大批学生不进行正常午休,于是开始对学生进行正确教育,并施行了一些奖罚措施,但是仍有些学生不能正常午休,教师进行谈话教育时这些学生总能找到许多理由,如“不午休不影响我的学习,不午休是我多年的习惯,我下午、晚上精力仍然很充沛”等等,使教师的说服教育效果很差,于是一位数学老师就对一次数学考试成绩进行了如下的统计(数据如下表):那么请你利用这些数据统计分析来说明午休与学习的关系.解析:首先我们可以把考试成绩分成两个方面,及格与不及格.完成列联表:这时通过表格会发现午休学生的及格率P 1=80180=49,不午休学生的及格率P 2=65200=1340,显然P 1>P 2,那么我们有多大的把握承认这个结论?于是进行χ2检验.计算得χ2=380×(80×135-65×100)2180×200×145×235≈5.727 8>3.841.所以我们有95%的把握认为:午休可以提高你的成绩.因此我们的结论是:适当午休有助于保持我们良好的学习状态,提高我们的学习成绩.。
高中数学第三章统计案例本章测评(含解析)新人教A版选修2_3
第三章测评(时间:90分钟满分:100分)一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列说法中错误的是( )A.如果变量x与y之间存在线性相关关系,则我们根据试验数据得到的点(x i,y i)(i=1,2,…,n)将散布在某一条直线的附近B.如果两个变量x与y之间不存在线性关系,那么根据它们的一组数据(x i,y i)(i=1,2,…,n)不能写出一个线性方程C.设x,y是具有相关关系的两个变量,且y关于x的线性回归方程为x+叫做回归系数D.为使求出的线性回归方程有意义,可用统计检验的方法来判断变量y与x之间是否存在线性相关关系解析:任何一组(x i,y i)(i=1,2,…,n)都能写出一个线性方程,只是有的无意义.答案:B2.在建立两个变量y与x的回归模型时,分别选择了4个不同的模型,它们的相关指数R2如下,其中拟合得最好的模型为( )A.模型1的相关指数R2为0.75B.模型2的相关指数R2为0.90C.模型3的相关指数R2为0.25D.模型4的相关指数R2为0.55解析:相关指数R2的值越大,意味着残差平方和越小,也就是说拟合效果越好.答案:B3.下列关于独立性检验的说法中,错误的是( )A.独立性检验依据小概率原理B.独立性检验得到的结论一定正确C.样本不同,独立性检验的结论可能有差异D.独立性检验不是判定两类事物是否相关的唯一方法答案:B4.一位母亲记录了儿子3~9岁的身高,数据略,由此建立的身高与年龄的回归模型为A.身高一定是145.83cmB.身高在145.83cm以上C.身高在145.83cm左右D.身高在145.83cm以下解析:只能预测,不能确定实际值.答案:C5.为了调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了200位老年人,结构如下:附:K2=参照附表,得到的正确结论是( ).A.在犯错误的概率不超过0.1%的前提下认为“该地区的老年人是否需要志愿者提供帮助与性别有关”B.在犯错误的概率不超过0.1%的前提下认为“该地区的老年人是否需要志愿者提供帮助与性别无关”C.最多有99%的把握认为“该地区的老年人是否需要志愿者提供帮助与性别有关”D.最多有99%的把握认为“该地区的老年人是否需要志愿者提供帮助与性别无关”解析:由公式可计算K2的观测值k==≈18.18>10.828,所以在犯错误的概率不超过0.1%的前提下认为“该地区的老年人是否需要志愿者提供帮助与性别有关”,故选A.答案:A6.三点(3,10),(7,20),(11,24)确定的线性回归方程是( )A.=1.75x-5.75B.=1.75x+5.75C.=-1.75x+5.75D.=-1.75x-5.75xz解析:设回归直线为x+,则由公式得=1.75,=5.75.答案:B7.下列说法:①若r>0,则x增大时,y也相应增大;②若r<0,则x增大时,y也相应增大;③若r=1,或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上.正确的有( )A.①②B.②③C.①③D.①②③解析:由相关系数的定义可知①③正确.答案:C8.某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程为=0.66x+1.562,若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均工资收入的百分比约为( )A.83%B.72%C.67%D.66%解析:因为当=7.675时,x=≈9.262,所以≈0.829≈83%.答案:A9.若对于变量y与x的10组统计数据的回归模型中,相关指数R2=0.95,又知残差平方和为120.53,那么(y i-)2的值为( )A.241.06B.2410.6C.253.08D.2530.8解析:由R2=1-,得0.95=1-,得(y i-)2==2410.6.答案:B10.为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线l1和l2,已知在两人的试验中发现变量x的观测数据的平均值恰好相等,都为s,变量y的观测数据的平均值也恰好相等,都为t,那么下列说法正确的是( )A.直线l1和直线l2有交点(s,t)B.直线l1和直线l2相交,但交点未必是点(s,t)C.直线l1和直线l2由于斜率相等,所以必定平行D.直线l1和直线l2必定重合解析:l1与l2都过样本中心点(s,t).答案:A二、填空题(本大题共5小题,每小题5分,共25分.把答案填在题中的横线上)11.有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系;⑤学生与他(她)的学号之间的关系.其中具有相关关系的是.解析:②⑤中两个变量之间的关系是确定性关系,不是相关关系.①③④中两个变量之间具有相关关系.答案:①③④12.由数据:(1,2),(3,4),(2,2),(4,4),(5,6),(3,3.6)得出的线性回归方程x必经过的定点是以上点中的.解析:易知,线性回归方程x必经过定点(),而根据计算可知这几个点中满足条件的是(3,3.6).答案:(3,3.6)13.下列是关于男婴与女婴出生时间调查的列联表晚上白天总计那么a=,b=,c=,d=,e=.解析:∵45+e=98,∴e=53;∵e+35=c,∴c=88;∵98+d=180,∴d=82;∵a+35=d,∴a=47;∵45+a=b,∴b=92.答案:47 92 88 82 5314.某学校对校选课程“人与自然”的选修情况进行了统计,得到如下数据:那么,在犯错误的概率不超过的前提下认为选修“人与自然”与性别有关.解析:K2=,k≈163.8>10.828,即在犯错误的概率不超过0.001的前提下认为选修“人与自然”与性别有关.答案:0.00115.对有关数据的分析可知,每立方米混凝土的水泥用量x(单位:kg)与28天后混凝土的抗压度y(单位:kg/cm2)之间具有线性相关关系,其线性回归方程为=0.30x+9.99.根据建设项目的需要,28天后混凝土的抗压度不得低于89.7kg/cm2,则每立方米混凝土的水泥用量最少应为kg.(精确到0.1kg)解析:由已知,0.30x+9.99≥89.7,解得x≥265.7.答案:265.7三、解答题(本大题共2小题,共25分.解答时应写出文字说明、证明过程或演算步骤)16.(10分)某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关系?并说明理由.分析:(1)运用古典概型概率公式求值.(2)求出随机变量,说明关系.解:(1)积极参加班级工作的学生有24人,不太主动参加班级工作且学习积极性一般的学生有19人,总人数为50人,∴抽到积极参加班级工作的学生的概率为;抽到不太主动参加班级工作且学习积极性一般的学生的概率为.(2)k=≈11.5,∵k>10.828,∴在犯错误的概率不超过0.001的前提下认为学习积极性与对待班级工作的态度有关系.17.(15分)在关于人的脂肪含量(百分比)和年龄的关系的研究中,研究人员获得了一组数据如下表:(1)作出散点图,并判断y与x是否线性相关,若线性相关,求线性回归方程;(2)求相关指数R2,并说明其含义;(3)给出37岁时人的脂肪含量的预测值.分析:先作出样本数据的散点图,进而求出回归模型,并依据公式求出R2,进而说明拟合效果.解:(1)散点图如图所示.由散点图可知样本点呈条状分布,脂肪含量与年龄有比较好的线性相关关系,因此可以用线性回归方程来刻画它们之间的关系.设线性回归方程为x+,则由计算器算得≈0.576,=-0.448,所以线性回归方程为=0.576x-0.448.(2)(y i-)2≈37.78.(y i-)2≈644.99.R2=1-≈0.941.R2≈0.941,表明年龄解释了94.1%的脂肪含量变化.(3)当x=37时,=0.576×37-0.448≈20.9,故37岁时人的脂肪含量约为20.9%.。
(常考题)北师大版高中数学高中数学选修2-3第三章《统计案例》检测题(有答案解析)
一、选择题1.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是()A.①回归分析,②取平均值B.①独立性检验,②回归分析C.①回归分析,②独立性检验D.①独立性检验,②取平均值2.某中学采取分层抽样的方法从高二学生中按照性别抽出20名学生,其选报文科、理科的情况如下表所示,参考公式和数据:22()()()()()n ad bcKa cb d a bc d-=++++,其中n a b c d=+++.则以下判断正确的是A.至少有97.5%的把握认为学生选报文理科与性别有关B.至多有97.5%的把握认为学生选报文理科与性别有关C.至少有95%的把握认为学生选报文理科与性别有关D.至多有95%的把握认为学生选报文理科与性别有关3.某班主任对全班50名学生进行了作业量的调查,数据如表:若推断“学生的性别与认为作业量大有关”,则这种推断犯错误的概率不超过()附:()()()()()22n ad bcKa b c d a c b d-=++++A.0.01 B.0.025 C.0.10 D.0.054.为了考查两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是( )A.l1和l2有交点(s,t)B.l1与l2相交,但交点不一定是(s,t)C.l1与l2必定平行D.l1与l2必定重合5.某市政府调查市民收入与旅游欲望时,采用独立性检验法抽取3 000人,计算发现k2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游欲望有关系的把握是()P(K2≥k)…0.250.150.100.0250.0100.005…k…1.3232.0722.7065.0246.6357.879…A.90% B.95% C.97.5% D.99.5%6.以下四个命题中:①在回归分析中,可用相关指数R2的值判断拟合的效果,R2越大,模型的拟合效果越好;②两个随机变量的线性相关性越强,相关系数的绝对值越接近1; ③若数据x 1,x 2,x 3,…,x n 的方差为1,则2x 1,2x 2,2x 3,…,2x n 的方差为2;④对分类变量x 与y 的随机变量K 2的观测值k 来说,k 越小,判断“x 与y 有关系”的把握程度越大.其中真命题的个数为( ) A .1 B .2 C .3 D .47.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女人患色盲的频率分别为0.038,0.006B .男、女人患色盲的概率分别为,C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关8.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A .平均数与方差 B .回归分析 C .独立性检验 D .概率 9.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程ˆ35yx =-,变量x 增加一个单位时,y 平均增加5个单位; ③线性回归方程^^^y b x a =+必过(),x y ;④在一个22⨯列联表中,由计算得213.079K =,则有99%以上的把握认为这两个变量间有关系.其中错误..的个数是( ) A .0 B .1 C .2D .310.若在区间[-5,5]内任取一个实数a ,则使直线x +y +a =0与圆(x -1)2+(y +2)2=2有公共点的概率为( ) A .25B .25C .35D .321011.由某个22⨯列联表数据计算得随机变量2K 的观测值k 6.879=,则下列说法正确的是 ( )0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0.7081.3232.0722.7063.8415.0246.6357.87910.828A .两个分类变量之间有很强的相关关系B .有99%的把握认为两个分类变量没有关系C .在犯错误的概率不超过1.0%的前提下认为这两个变量间有关系D .在犯错误的概率不超过0.5%的前提下认为这两个变量间有关系 12.某商场为了解毛衣的月销售量y (件)与月平均气温()x C 之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: )C(件)由表中数据算出线性回归方程ˆybx a =+中的2b =-,气象部门預测下个月的平均气温约为6C ,据此估计该商场下个月毛衣销售量约为( )件. A .46B .40C .38D .58二、填空题13.针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的13,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数的23.若有95%的把握认为是否喜欢韩剧和性别有关,求男生至少有______人.14.以下结论正确..的序号有_________ (1)根据22⨯列联表中的数据计算得出2K ≥6.635, 而P (2K ≥6.635)≈0.01,则有99% 的把握认为两个分类变量有关系.(2)在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关.(3)在线性回归分析中,相关系数为r ,r 越接近于1,相关程度越大;r 越小,相关程度越小.(4)在回归直线0.585y x =-中,变量200x =时,变量y 的值一定是15.15.某高校《统计初步》课程的教师随机调查了选该课的一些学生的情况,具体数据如下表: 专业 性别非统计专业统计专业男生1310女生720为了检验主修统计专业是否与性别有关系,根据表中的数据得到随机变量K 2的观测值为.因为k >3.841,所以确认“主修统计专业与性别有关系”,这种判断出现错误的可能性为________.16.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温.由表中数据得线性方程=+x 中=﹣2,据此预测当气温为5℃时,用电量的度数约为_____.17.以下四个命题中:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1;③某项测量结果ξ服从正态分布()21,σN ,()50.81ξP ≤=,则()30.19ξP ≤-=;④对于两个分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握程度越大.以上命题中其中真命题的个数为___________.18.从某高校在校大学生中随机选取5名女大学生,由她们身高和体重的数据得到的回归直线方程为ˆ0.7973.56yx =-,数据列表是:则其中的数据a =__________.19.以下4个命题中,正确命题的序号为_________.①“两个分类变量的独立性检验”是指利用随机变量2K 来确定是否能以给定的把握认为“两个分类变量有关系”的统计方法;②将参数方程cos sin x y θθ=⎧⎨=⎩(θ是参数,[]0,θπ∈)化为普通方程,即为221x y +=;③极坐标系中,22,3A π⎛⎫⎪⎝⎭与()3,0B 的距离是19; ④推理:“因为所有边长相等的凸多边形都是正多边形,而菱形是所有边长都相等的凸多边形,所以菱形是正多边形”,推理错误在于“大前提”错误. 20.下列说法:①线性回归方程y bx a =+必过(),x y ;②命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃<+<” ③相关系数r 越小,表明两个变量相关性越弱;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系;其中正确..的说法是__________.(把你认为正确的结论都写在横线上) 本题可参考独立性检验临界值表:三、解答题21.网购是当前人们购物的新方式,某公司为了改进营销方式,随机调查了100名市民,统计了不同年龄的人群网购的人数如下表: 年龄段(岁) ()0,20[)20,40[)40,60[)60100,网购人数 2632348 男性人数1510 105(1)若把年龄在[2060,的人称为“网购迷”,否则称为“非网购迷”,请完成下面的22⨯列联表,并判断能否在犯错误的概率不超过1%的前提下,认为网购与性别有关?网购迷 非网购迷 总计男性 女性 总计附:()()()()()22n ad bc K a b c d a c b d -=++++. ()20P K k ≥0.10 0.05 0.01 0.001两人年龄都小于20岁的概率.22.为了解使用手机是否对学生的学习有影响,某校随机抽取50名学生,对学习成绩和使用手机情况进行了调查,统计数据如表所示(不完整):与使用手机有关;(2)现从上表不使用手机的学生中按学习成绩是否优秀分层抽样选出9人,再从这9人中随机抽取3人,记这3人中“学习成绩优秀”的人数为X,试求X的分布列与数学期望.参考公式:()()()()()22n ad bca b c d a c b dχ-=++++,其中n a b c d=+++.参考数据:23.第十八届中国国际农产品交易会于11月27日在重庆国际博览中心开幕,我市全面推广“遂宁红薯”及“遂宁鲜”农产品区域公用品牌,并组织了100家企业、1000个产品进行展示展销,扩大优质特色农产品市场的占有率和影响力,提升遂宁特色农产品的社会认知度和美誉度,让来自世界各地的与会者和消费者更深入了解遂宁,某记者对本次农交会进行了跟踪报道和实际调查,对某特产的最满意度()%x和对应的销售额y(万元)进行了调查得到以下数据:关系数r的绝对值在0.95以上(含0.95)是线性相关性较强;否则,线性相关性较弱.请你对线性相关性强弱作出判断,并给出理由;(2)如果没有达到较强线性相关,则采取“末位淘汰”制(即销售额最少的那一天不作为计算数据),并求在剔除“末位淘汰”的那一天后的销量额y 关于最满意度x 的线性回归方程(系数精确到0.1). 参考数据:24x =,81y =,52215146ii xx =-=∑, 52215176i i y y =-=∑,515151i ii x y xy =-=∑13.27≈≈.附:对于一组数据()()()1122,,,,,,n n x y x y x y ⋅⋅⋅.其回归直线方程 ˆˆˆy bx a =+的斜率和截距的最小二乘法估计公式分别为:1221ˆ·ni ii n ii x y nx y bxnx ==-=-∑∑,ˆa y bx=-,线性相关系数·ni ix y nx y r -=∑24.某实验学校为提高学习效率,开展学习方式创新活动,提出了完成某项学习任务的两种新的学习方式.为比较两种学习方式的效率,选取40名学生,将他们随机分成两组,每组20人,第一组学生用第一种学习方式,第二组学生用第二种学习方式.40名学生完成学习任务所需时间的中位数40min m =,并将完成学习任务所需时间超过min m 和不超过min m 的学生人数得到下面的列联表:(Ⅰ)估计第一种学习方式且不超过m 的概率、第二种学习方式且不超过m 的概率; (Ⅱ)能否有99%的把握认为两种学习方式的效率有差异?附:()()()()()22n ad bc K a b c d a c b d -=++++,25.为了响应国家号召,某校组织部分学生参与了“垃圾分类,从我做起”的知识问卷作答,并将学生的作答结果分为“合格”与“不合格”两类与“问卷的结果”有关?(1)是否有90%以上的把握认为“性别”与“问卷的结果”有关?(2)在成绩合格的学生中,利用性别进行分层抽样,共选取9人进行座谈,再从这9人中随机抽取5人发送奖品,记拿到奖品的男生人数为X,求X的分布列及数学期望()E X.附:22()()()()()n ad bcKa b c d a c b d-=++++26.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,P(K2≥k)0.050 0.010 0.001k 3.841 6.63510.828【参考答案】***试卷处理标记,请不要删除一、选择题1.B解析:B【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案.【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验,回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析,综上可知①是独立性检验,②是回归分析,故选B.【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.2.C解析:C【解析】由题易得22⨯列联表如下:则2K的观测值为()220235104.432 3.841128713k⨯⨯-⨯=≈>⨯⨯⨯,所以至少有95%的把握认为学生选报文理科与性别有关,故选:C.【解题必备】(1)独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握认为两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系.(2)列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此,需要用独立性检验的方法确认所得结论在多大程度上适用于总体.即独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释. (3)独立性检验的具体做法:①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α, 然后查下表确定临界值0k ; ②利用公式()()()()()22n ad bc K a c b d a b c d -=++++,计算随机变量2K 的观测值k ;③如果0k k ≥,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”.说明:通常认为 2.706k ≤时,样本数据就没有充分的证据显示“X 与Y 有关系”.3.B解析:B 【解析】分析:根据表格中所给数据,代入公式()()()()()22n ad bc K a b c d a c b d -=++++,求出观测值,把所求的观测值同临界值进行比较,从而可得结果. 详解:根据表中数据得到()2250181589 5.059 5.024********K ⨯⨯-⨯=≈>⨯⨯⨯,所以,若推断“学生的性别与认为作业量大有关”, 则这种推断犯错误的概率不超过0.025,故选B.点睛:本题主要考查独立性检验的应用,解题的关键是正确求出这组数据的观测值,计算过程一定要细心,避免出现计算错误,属于基础题.4.A解析:A 【解析】回归直线方程过样本中心点,过A 选项正确.5.C解析:C 【详解】∵2 6.023 5.024K=>∴可断言市民收入增减与旅游欲望有关的把握为97.5%.故选C.点睛:本题主要考查独立性检验的实际应用.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式22()()()()()n ad bcKa b c d a c b d-=++++,计算出2K的值;(3)查表比较2K与临界值的大小关系,作统计判断.6.B解析:B【解析】由题意得,若数据x1,x2,x3,…,x n的方差为1,则2x1,2x2,2x3,…,2x n的方差为4,所以③不正确;对分类变量x与y的随机变量K2的观测值k来说,k越小,判断“x与y 有关系”的把握程度越小,所以④不正确.其中①、②是正确的,故选B.7.C解析:C【解析】男人中患色盲的比例为,要比女人中患色盲的比例大,其差值为,差值较大,所以认为患色盲与性别是有关的.考点:独立性检验.8.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C.考点:独立性检验的意义.9.B解析:B【解析】一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①正确;回归方程中x的系数具备直线斜率的功能,对于回归方程y35x=-,当x增加一个单位时,y平均减少5个单位,②错误;由线性回归方程的定义知,线性回归方程y= b x+a必过点(),x y,③正确;因为213.079 6.635K=>,故有0099以上的把握认为这两个变量间有关系,④正确,即错误的个数为1,故选B. 10.B解析:B【解析】∵直线0x y a ++=与圆()()22122x y -+=+有公共点,∴≤13a -≤≤,∴在区间[55]-,内任取一个实数a ,使直线0x y a ++=与圆()()22122x y -+=+有公共点的概率为312555+=+,故选B. 点睛:本题主要考查了几何概型的概率,以及直线与圆相交的性质,解题的关键弄清概率类型,同时考查了计算能力,属于基础题;利用圆心到直线的距离小于等于半径可得到直线与圆有公共点,可求出满足条件的a ,最后根据几何概型的概率公式可求出所求.11.C解析:C 【解析】由22⨯列联表数据计算得随机变量2K 的观测值是 6.879 6.635k =>,通过对照表中数据得,在犯错误的概率不超过1.0%的前提下,认为这两个变量间有关系,故选C.12.A解析:A 【解析】试题分析:根据题意,样本中心点的坐标为()10,38,所以38210,58a a =-⨯+∴=,因此回归直线方程为2ˆ58yx =-+,所以当6x =时,估计该商场下个月毛衣销售量约为26ˆ5846y=-⨯+=,故选A. 考点:回归直线方程.二、填空题13.【分析】设男生人数为依题意填写列联表计算观测值列出不等式求出的取值范围再根据题意求出男生的人数【详解】设男生人数为由题意可得列联表如下: 喜欢韩剧 不喜欢韩剧 总计 男生 女生 总 解析:18【分析】设男生人数为x ,依题意填写列联表,计算观测值,列出不等式求出x 的取值范围,再根据题意求出男生的人数. 【详解】设男生人数为x ,由题意可得列联表如下:则 3.841k>,即2452()3636969 3.84171711931818x x x x xxkx x xx⋅-⋅==>⋅⋅⋅,解得12.697x>.因为各部分人数均为整数,所以若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有18人.故答案为:18.【点睛】本题考查独立性检验的应用,解题关键是列出列联表,然后进行计算,属于常考题. 14.(1)(3)【解析】分析:根据独立性检验残差图相关系数回归分析的定义及性质逐一分析四个答案的真假即可详解:对于(1)根据2×2列联表中的数据计算得出≥6635而P(≥6635)≈001则有99的把握解析:(1)(3).【解析】分析:根据独立性检验、残差图、相关系数、回归分析的定义及性质,逐一分析四个答案的真假即可.详解:对于(1),根据2×2列联表中的数据计算得出2K≥6.635, 而P(2K≥6.635)≈0.01,则有99%的把握认为两个分类变量有关系,故(1)正确.对于(2),根据残差图的意义可得,当带状区域的宽度较小时,说明选用的模型比价合适,而当带状区域的宽度较大时,说明选用的模型不合适,故(2)不正确.对于(3),在线性回归分析中,相关系数为r,|r|越接近于1,则相关程度越大;|r|越接近于0,则相关程度越小.故(3)正确.对于(4),在回归直线y=0.5x−85中,当x=200时,y=15,但实际观测值可能不是15,故(4)不正确.综上可得(1)(3)正确.点睛:本题考查回归分析和独立性检验的基本知识,属于基础类题目,解题的关键是熟记相关的的概念和性质.15.5【解析】因为随机变量K2的观测值k>3841所以在犯错误的概率不超过005的前提下认为主修统计专业与性别有关系故这种判断出现错误的可能性为5考点:独立性检验思想解析:5% 【解析】因为随机变量K 2的观测值k >3.841,所以在犯错误的概率不超过0.05的前提下认为“主修统计专业与性别有关系”.故这种判断出现错误的可能性为5%. 考点:独立性检验思想.16.40【解析】试题分析:根据所给的表格做出本组数据的样本中心点根据样本中心点在线性回归直线上利用待定系数法做出a 的值现在方程是一个确定的方程根据所给的x 的值代入线性回归方程预报要销售的件数解:由表格得解析:40 【解析】试题分析:根据所给的表格做出本组数据的样本中心点,根据样本中心点在线性回归直线上,利用待定系数法做出a 的值,现在方程是一个确定的方程,根据所给的x 的值,代入线性回归方程,预报要销售的件数.解:由表格得=(14+12+8+6)÷4=10,=(22+26+34+38)÷4=30 即样本中心点的坐标为:(10,40), 又∵样本中心点(10,40)在回归方程 上且b=﹣2∴30=10×(﹣2)+a , 解得:a=50, ∴当x=5时,y=﹣2×(5)+50=40. 故答案为40.考点:回归分析的初步应用.17.【解析】试题分析:对于①从匀速传递的新产品生产流水线上质检员每20分钟抽取一件新产品进行某项指标检测这样的抽样是系统抽样而不是分层抽样故①错;对于②两个随机变量的相关性知识可知②正确;对于③变量所以 解析:2【解析】试题分析:对于①,从匀速传递的新产品生产流水线上,质检员每20分钟抽取一件新产品进行某项指标检测,这样的抽样是系统抽样,而不是分层抽样,故①错;对于②,两个随机变量的相关性知识可知②正确;对于③变量2(1,)N ξσ~,所以()()30.191510.810.19ξξP ≤-==-P ≤=-=,故③正确;对于④,随机变量2K 观测值k 来说,k 越大,“X 与Y 有关系”的把握程度越大,故④错,所以真命题有2个. 考点:1. 回归分析的基本思想及其应用初步;2.统计与概率.18.163【解析】由根据回归直线经过样本中心即得由得故答案为解析:163 【解析】由4953565864565y ++++==,根据回归直线经过样本中心(),x y ,即560.7973.56x =⨯-,得164x =,由1551611671741645a x ++++==,得163a =,故答案为163.19.①③④【解析】①是独立性检验的应用①对②中由于所以显然是半个圆②错③中由极坐标中两点距离公式=③对④中所有边长相等的凸多边形都是正多边形为大前提是错误的因为只需要正多边形挤压变形使之仍为凸多边形即可解析:①③④ 【解析】①是独立性检验的应用,①对.②中由于[]0,θπ∈,所以01y ≤≤,显然是半个圆,②错.③中,由极坐标中两点距离公式2221212212cos()AB ρρρρθθ=+--=14912()19,2+-⨯-=AB ③对.④中“所有边长相等的凸多边形都是正多边形”为大前提,是错误的,因为只需要正多边形挤压变形,使之仍为凸多边形即可.④对.所以填①③④.20.①④【解析】分析:根据性回归方程独立性检验相关关系以及命题的否定等知识选出正确的得到结果详解:线性回归方程必过样本中心点故①正确命题的否定是故②错误③相关系数r 绝对值越小表明两个变量相关性越弱故不正解析:①④ 【解析】分析:根据性回归方程,独立性检验,相关关系,以及命题的否定等知识,选出正确的,得到结果.详解:线性回归方程ˆˆˆy bx a =+必过样本中心点(),x y ,故①正确.命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃≥+<” 故②错误 ③相关系数r 绝对值越小,表明两个变量相关性越弱,故不正确;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系,正确. 故答案为①④.点睛:本题以命题真假的判断为载体,着重考查了相关系数、命题的否定、独立性检验、回归直线方程等知识点,属于中档题.三、解答题21.(1)列联表答案见解析,能在犯错误的概率不超过1%的前提下,认为网购与性别有关;(2)310.【分析】(1)根据表格中的数据可题中信息可完善22⨯列联表,计算出2K 的观测值,结合临界值表可得出结论;(2)计算得出年龄段()0,20应抽取3人,分别记为1、2、3;年龄段[)20,40应抽取2人,分别记为a 、b ,列举出所有的基本事件,并确定事件“所抽的两人年龄都小于20岁”所包含的基本事件,利用古典概型的概率公式可求得所求事件的概率. 【详解】(1)由题中信息可完善22⨯列联表如下表所示:计算得()2100201446207.605 6.63566344060K ⨯⨯-⨯=≈>⨯⨯⨯,故能在犯错误的概率不超过1%的前提下,认为网购与性别有关;(2)年龄在()0,20、[)20,40网购男性分别有15人、10人.按分层抽样的方法随机抽取5人,年龄段()0,20应抽取3人,分别记为1、2、3;年龄段[)20,40应抽取2人,分别记为a 、b .从中随机抽取2人的一切可能结果所组成的基本事件共10个:()1,2、()1,3、()1,a 、()1,b 、()2,3、()2,a 、()2,b 、()3,a 、()3,b 、(),a b .用A 表示“两人年龄都小于20岁”这一事件,则事件A 由3个基本事件组成:()1,2、()1,3、()2,3.故事件A 的概率为()310P A =. 【点睛】方法点睛:求解古典概型的概率方法如下: (1)列举法; (2)列表法; (3)树状图法; (4)排列、组合数的应用.22.(1)没有99.9%的把握认为学生的学习成绩与使用手机有关;(2)分布列见解析,()2E X =.【分析】(1)根据表格中数据和题中信息可完善22⨯列联表,计算出2χ的观测值,结合临界值表可得出结论;(2)由题意可知,随机变量X 的可能取值有0、1、2、3,计算出随机变量X 在不同取值下的概率,可得出随机变量X 的分布列,进而可求得随机变量X 的数学期望值. 【详解】(1)22⨯列联表如下表所示:()22505102015258.33310.828203025253χ⨯⨯-⨯==≈<⨯⨯⨯,所以,没有99.9%的把握认为学生的学习成绩与使用手机有关;(2)9人中学习成绩优秀的人有209630⨯=人,学习成绩一般的有109330⨯=人, X 可能的取值有0、1、2、3,()3911084P X C ===,()1263393114C C P X C ===,()21633915228C C P X C ===,()363953?21C P X C ===.所以,随机变量X 的分布列为()1232142821E X =⨯+⨯+⨯=. 【点睛】思路点睛:求解随机变量分布列的基本步骤如下:(1)明确随机变量的可能取值,并确定随机变量服从何种概率分布; (2)求出每一个随机变量取值的概率;(3)列成表格,对于抽样问题,要特别注意放回与不放回的区别,一般地,不放回抽样由排列、组合数公式求随机变量在不同取值下的概率,放回抽样由分步乘法计数原理求随机变量在不同取值下的概率.23.(1)0.94r ≈,线性相关性较弱;(2) +77.3ˆyx =。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章 综合测试题
一、选择题(本大题共12小题,每小题5分,共60分.每小题中只有一项符合题目要求)
1.在对两个变量x, y进行线性回归分析时有下列步骤:
①对所求出的回归直线方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求线性
回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图.
若根据可靠性要求能够作出变量x,y具有线性相关结论,则下列操作顺序正确的是( )
A.①②⑤③④ B.③②④⑤①
C.②④③①⑤ D.②⑤④③①
答案 D
解析 由对两个变量进行回归分析的步骤,知选D.
2.为了考查两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了10次
和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知两个人在试验中发
现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法
正确的是( )
A.l1和l2有交点(s,t)
B.l1与l2相交,但交点不一定是(s,t)
C.l1与l2必定平行
D.l1与l2必定重合
答案 A
解析 由回归直线定义知选A.
3.实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线
方程为( )
A.y∧=x+1 B.y∧=x+2
C.y∧=2x+1 D.y∧=x-1
答案 A
解析 求出样本中心(x,y)代入选项检验知选A.
4.今有一组实验数据如下:
t
** ** ** ** **
v ** ** ** 12
**
现准备用下列函数中的一个近似地表示这些数据满足的规律,其中最接近的一个是
( )
A.v=log2t B.v=log12 t
C.v=t2-12 D.v=2t-2
答案 C
解析 先画出散点图,利用散点图直观认识变量间的关系,可选出较合适的模型为C,或
将数据代入所给选项进行验证.
5.对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程中
的截距为( )
A.a=y-bx B.a=y-b∧x
C.a∧=y-bx D.a∧=y-b∧x
答案 D
解析 本题考查回归方程中的截距公式a∧=y-b∧x.故选D.
6.下面是一个2×2列联表
y1 y2
总计
x1 a 21
73
x2 2 25
27
总计 b 46 100
其中a、b处填的值分别为( )
A.52 54 B.54 52
C.94 146 D.146 94
答案 A
解析 由a+21=73,得a=52,a+2=b,得b=54.故选A.
7.设有一个回归方程为y∧=3-5x,则变量x增加一个单位时( )
A.y平均增加3个单位
B.y平均减少5个单位
C.y平均增加5个单位
D.y平均减少3个单位
答案 B
解析 ∵-5是斜率的估计值,说明x每增加一个单位时,y平均减少5个单位.故选B.
8.在一个2×2列联表中,由其数据计算得K2=13.097,则其两个变量间有关系的可能
性为( )