高中数学第三章统计案例单元测评北师大版选修2-3

合集下载

数学北师大版选修2-3单元检测:第三章 统计案例附答案

数学北师大版选修2-3单元检测:第三章 统计案例附答案

数学北师版2-3第三章统计案例单元检测(时间:45分钟满分:100分)一、选择题(每小题6分,共48分)1.下列说法正确的是().A.任何两个变量都具有相关关系B.球的体积与该球的半径具有相关关系C.农作物产量与施肥量之间是一种确定性关系D.某商品的生产量与该商品的价格是一种非确定性关系2.该商品的销售额与利润之间的线性相关系数是0.78,这说明二者之间存在着().A.高度相关 B.中度相关C.弱度相关D.极弱相关3. 如图所示,有5组数据(x,y),去掉哪组数据后,剩下的4组数据的线性相关系数最大().A.A B.B C.C D.D4.下表是某厂1~4由散点图可知,其线性回归直线方程是y=-0.7x+a,则a=().A.5B.5.05C.5.25D.65.一位母亲记录了她儿子3到9岁的身高,建立了她儿子身高与年龄的回归模型y=73.93+7.19x.她用这个模型预测儿子10岁时的身高,则下面的叙述正确的是().A.她儿子10岁时的身高一定是145.83 cmB.她儿子10岁时的身高在145.83 cm以上C.她儿子10岁时的身高在145.83 cm左右D.她儿子10岁时的身高在145.83 cm以下6.在一个2×2列联表中,由数据计算得χ2=13.097,则其两个变量间有关系的可能性为().A.99%B.95%C.90%D.无关系7.下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从下图可以看出().A.性别与喜欢理科无关B.女生中喜欢理科的比例为80%C.男生比女生喜欢理科的可能性大些D.男生不喜欢理科的比例为60%8.某科研机构为了研究中年人秃发与患心脏病是否有关,随机调查了一些中年人的情况,具体数据如表,根据表中数据则可判定秃发与患心脏病有关,那么这种判定出错的可能性为( ).A .0.1B .0.05C .0.01D .0.99二、填空题(每小题6分,共18分)9.由一组观测数据(x 1,y 1),(x 2,y 2),…,(x 10,y 10)得x =1.542,y =2.847,101i x =∑2i=29.808,101i y =∑2i =99.208,101ii x =∑y i=54.243,则线性回归方程是______.10.在两个变量的回归分析中,作散点图的目的是______________________________. 11.许多因素都会影响贫穷,教育也许是其中之一,在研究这两个因素的关系时收集了美国50个州的成年人受过9年或更少教育的百分比(x )和收入低于官方规定的贫困线的人数占本州人数的百分比(y )的数据,建立的回归直线方程如下:y =0.8x +4.6,斜率的估计等于0.8说明________________________________________________________________________________________________________________________________________________ ________________________________________________________________________. 三、解答题(共34分)12.(10分)在500名患者身上试验某种血清治疗SARS 的作用,与另外500名未用血清的患者进行比较研究,结果如下表:问该种血清能否起到治疗SARS 的作用?13.(12分)保险公司统计的资料表明:居民住宅区到最近消防站的距离x (单位:千米)(1)用计算器计算线性回归方程及相关系数r ;(2)若发生火灾的某居民区与最近的消防站相距7.8千米,评估一下火灾的损失.14.(12分)某教育机构为了研究人具有大学专科以上学历(包括大学专科)和对待教育改革态度的关系,随机抽取了392名成年人进行调查,所得数据如下表所示:对于教育机构的研究项目,根据所给数据能得出什么结论?参考答案1.答案:D解析:任何两个变量不一定有相关关系,故A错;球的体积与该球的半径是函数关系而不是相关关系,故B错;农作物产量与施肥量之间是一种非确定的相关关系,故C错;某商品的生产量与该商品的销售价格之间是一种非确定性的关系,故D对.2.答案:A解析:r>0.75,说明二者之间存在着高度相关.3.答案:D解析:去掉D点,其他四点大致分布在一条直线附近.4.答案:C解析:x=2.5,y=3.5,∵回归直线方程过定点(x,y),∴3.5=-0.7×2.5+A.∴a =5.25.5.答案:C解析:当x=10时,y=73.93+7.19×10=145.83(cm).∴她儿子10岁时的身高在145.83 cm左右.6.答案:A解析:∵χ2=13.097>6.635,∴有99%以上的把握认为两个变量之间有关系.7.答案:C解析:图中,男生喜欢理科的比例为60%,而女生比例仅为20%,这两个比例差别较大,说明性别与是否喜欢理科是有关系的,因此,男生比女生喜欢理科的可能性更大一些.8.答案:C解析:χ2=2775(204505300)25750320455⨯⨯⨯⨯⨯⨯-≈15.968>6.635.∴有99%以上的把握认为秃发与患心脏病有关.∴出错的可能性在1%=0.01.9.答案:y=1.715x+0.202解析:由b=10110221i iiiix y nx yx nx==--∑∑=254.243101.542 2.84729.808101.542⨯⨯⨯--≈1.715,a=y-b x≈0.202,所以,线性回归方程是y=1.715x+0.202.10.答案:(1)判断两变量是否相关;(2)判断两变量更近似于什么函数关系11.答案:一个地区受过9年或更少教育的百分比每增加1%,收入低于官方规定的贫困线的人数占本州人数的百分比将增加0.8%左右12.解:由列联表给出的数据,χ2=2 254277246223) 500500477523⨯⨯⨯⨯⨯-≈3.852 2.因为3.852 2>3.841,所以我们有95%的把握认为这种血清能起到治疗SARS的作用.13.解:(1)b=661166222 11()()6 y ()6i i i ii ii ii ix x y y x y xx x x x ====---=--∑∑∑∑≈5.615 4,a=y-b x≈7.333 3,∴线性回归方程为y=5.615 4x+7.333 3. ∵r=0.9778>0.75,∴y与x有很强的相关关系.(2)当x=7.8,代入回归方程有y=5.615 4×7.8+7.333 3≈51.133 4(千元).14.解:由表中数据计算可得,χ2=2392(3916715729)19619668324⨯⨯⨯⨯⨯⨯-≈1.78.因为1.78<2.706,所以我们没有理由说人具有大学专科以上学历(包括大学专科)和对待教育改革的态度有关.。

北师大版高中数学高中数学选修2-3第三章《统计案例》测试(含答案解析)

北师大版高中数学高中数学选修2-3第三章《统计案例》测试(含答案解析)

一、选择题1.为了调查某校高二学生的身高是否与性别有关,随机调查该校64名高二学生,得到2×2列联表如表:附:K 2()()()()2()n ad bc a b c d a c b d -=++++由此得出的正确结论是( )A .在犯错误的概率不超过0.01的前提下,认为“身高与性别无关”B .在犯错误的概率不超过0.01的前提下,认为“身高与性别有关”C .有99.9%的把握认为“身高与性别无关”D .有99.9%的把握认为“身高与性别有关” 2.下列说法中错误的是( )A .先把高二年级的2000名学生编号:1到2000,再从编号为1到50的学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +,100m +,150m +,……的学生,这种抽样方法是系统抽样法.B .一组数据的方差为2s ,平均数为x ,将这组数据的每一个数都乘以2,所得的一组新数据的方差和平均数为24s ,2x .C .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1.D .若一组数据1,a ,3的平均数是2,则该组数据的方差是23. 3.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是( ) A .①回归分析,②取平均值 B .①独立性检验,②回归分析 C .①回归分析,②独立性检验 D .①独立性检验,②取平均值4.为了解高中生对电视台某节目的态度,在某中学随机调查了110名学生,根据得到的联表算得2K 的观测值 5.278k ≈. 附表:参照附表,得到的正确结论是 ( )A .在犯错误的概率不超过1%的前提下,认为“喜欢该节目与性别有关”B .在犯错误的概率不超过1%的前提下,认为“喜欢该节目与性别无关”C .有97.5%以上的把握认为“喜欢该节目与性别有关”D .有97.5%以上的把握认为“喜欢该节目与性别无关” 5.对于独立性检验,下列说法正确的是( ) A .2 3.841K >时,有95%的把握说事件A 与B 无关 B .2 6.635K >时,有99%的把握说事件A 与B 有关 C .2 3.841K ≤时,有95%的把握说事件A 与B 有关 D .2 6.635K >时,有99%的把握说事件A 与B 无关 6.下列命题中正确命题的个数是(1)对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握越大;(2)若将一组样本数据中的每个数据都加上同一个常数后,则样本的方差不变;(3)在残差图,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高; (4)设随机变量ξ服从正态分布()0,1N ; 若()1P p ξ>=,则()1102P p ξ-<<=-( ) A .4B .3C .2D .17.某种产品的广告费支出x 与销售额y (单位:万元)之间有下表关系:y 与x 的线性回归方程为 6.5175ˆ.y x =+,当广告支出5万元时,随机误差的效应(残差)为( ) A .40 B .20 C .30 D .108.通过随机询问72名不同性别的大学生在购买食物时是否看营养说明,得到如下列联表:性别与读营养说明列联表请问性别和读营养说明之间在多大程度上有关系 ( ) A .99%的可能性 B .99.75%的可能性 C .99.5%的可能性D .97.5%的可能性9.某班主任对全班50名学生进行了作业量的调查,数据如下表:( )附:()()()()()22n ad bc K a b c d a c b d -=++++k 0 2.072 2.706 3.841 5.024 6.635 10.828A .0.01B .0.025C .0.10D .0.0510.某商场为了解毛衣的月销售量y (件)与月平均气温()x C 之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: 月平均气温()xC17 1382月销售量y (件)24 33 40 55由表中数据算出线性回归方程ˆybx a =+中的2b =-,气象部门預测下个月的平均气温约为6C ,据此估计该商场下个月毛衣销售量约为( )件. A .46B .40C .38D .5811.若在区间[-5,5]内任取一个实数a ,则使直线x +y +a =0与圆(x -1)2+(y +2)2=2有公共点的概率为( ) A .25B .25C .35D .321012.已知回归方程0.8585.7y x ∧=-,则该方程在样本()165,57 处的残差为( ) A .111.55B .54.5C .3.45D .2.45二、填空题13.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③线性回归方程=x +必过(,);④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得K 2=13.079,则其两个变量之间有关系的可能性是90%.其中错误的个数是________.14.如果根据性别与是否爱好运动的列联表得到K 2≈3.852>3.841,则判断性别与是否爱好运动有关,那么这种判断犯错的可能性不超过________. 15.已知的取值如表所示:若与呈线性相关,且回归方程为,则等于 .2 3 45 4 616.炼钢时,通过加入有特定化学元素的材料,使炼出的钢满足一定的指标要求,假设为了炼出某特定用途的钢,每吨需要加入某元素的量在500g 到1000g 之间,用0.618法安排实验,则第二次试点加入量可以是____g .17.以下4个命题中,正确命题的序号为_________.①“两个分类变量的独立性检验”是指利用随机变量2K 来确定是否能以给定的把握认为“两个分类变量有关系”的统计方法;②将参数方程cos sin x y θθ=⎧⎨=⎩(θ是参数,[]0,θπ∈)化为普通方程,即为221x y +=;③极坐标系中,22,3A π⎛⎫⎪⎝⎭与()3,0B 19 ④推理:“因为所有边长相等的凸多边形都是正多边形,而菱形是所有边长都相等的凸多边形,所以菱形是正多边形”,推理错误在于“大前提”错误.18.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品 不喜欢甜品 合计 南方学生 60 20 80 北方学生 10 10 20 合计7030100根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”__________.(填有或没有)附:()()()()()22n ad bc K a b c d a c b d -=++++()20P K k ≥0.10 0.05 0.010 0.005 0k 2.7063.8416.6357.87919.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程ˆ35yx =-,若变量x 增加一个单位时,则y 平均增加5个单位;③线性回归方程^^^y b x a =+所在直线必过(),x y ; ④曲线上的点与该点的坐标之间具有相关关系;⑤在一个22⨯列联表中,由计算得213.079K =,则其两个变量之间有关系的可能性是0090.其中错误的是________.20.下列说法正确的个数有_________(1)已知变量x 和y 满足关系23y x =-+,则x 与y 正相关;(2)线性回归直线必过点(),x y ;(3)对于分类变量A 与B 的随机变量2k ,2k 越大说明“A 与B 有关系”的可信度越大 (4)在刻画回归模型的拟合效果时,残差平方和越小,相关指数2R 的值越大,说明拟合的效果越好.三、解答题21.近年来,共享单车进驻城市,绿色出行引领时尚.某公司计划对未开通共享单车的A 县城进行车辆投放,为了确定车辆投放量,对过去在其他县城的投放量情况以及年使用人次进行了统计,得到了投放量x (单位:千辆)与年使用人次y (单位:千次)的数据如下表所示,根据数据绘制投放量x 与年使用人次y 的散点图如图所示.x1 2 3 4 5 67y6 112134 66 101196(1)观察散点图,可知两个变量不具有线性相关关系,拟用对数函数模型lg =+y a b x 或指数函数模型(0,0)=⋅>>x y c d c d 对两个变量的关系进行拟合,请问哪个模型更适宜作为投放量x 与年使用人次y 的回归方程类型(给出判断即可,不必说明理由),并求出y 关于x 的回归方程;(2)已知每辆单车的购入成本为200元,年调度费以及维修等的使用成本为每人次0.2元,按用户每使用一次,收费1元计算,若投入8000辆单车,则几年后可实现盈利? 参考数据:其中lg i i v y =,117i i v v ==∑.参考公式:对于一组数据()11,u v ,()22,u v ,…,(),n n u v ,其回归直线ˆˆˆv a u β=+的斜率和截距的最小二乘估计公式分别为1221ˆni i i nii u v nu vunu β==-=-∑∑,ˆˆa v u β=-. 22.有治疗某种疾病的A B 、两种药物,为了分析药物的康复效果进行了如下随机抽样调查:AB 、两种药物各有100位病人服用,他们服用药物后的康复时间(单位:天数)及人数记录如下: 服用A 药物:(1)若康复时间低于15天(不含15天),记该种药物对某病人为“速效药物”.当17a >时,请完成下列22⨯列联表,并判断是否有99%的把握认为病人服用药物A 比服用药物B 更速效?A 药物的7人为Ⅰ组,服用B 药物的7人为Ⅱ组.现从Ⅰ、Ⅱ两组中随机各选一人,分别记为甲、乙.①a 为何值时,Ⅰ、Ⅱ两组人康复时间的方差相等(不用说明理由); ②在①成立且12a >的条件下,求甲的康复时间比乙的康复时间长的概率. 参考数据:P (K 2≥k 0) 0.15 0.10 0.05 0.025 0.010 0.005 k 02.0722.7063.8415.0246.6357.879参考公式:22()()()()()n ad bc K a b c b a c b d -=++++,其中n =a +b +c +d.23.某校从高三年级的男女生中各随机抽取了100人的体育测试成绩(以下称体测成绩,单位:分),数据都落在[)60100,内,其统计数据如表所示(其中不低于80分的学生为优秀).(1)请根据如表数据完成22⨯列联表,并通过计算判断,是否有95%的把握认为体测成绩与性别有关?(2)视频率为概率,在全校的高三学生中任取3人,记取出的3人中优秀的人数为X ,求X 的分布列和数学期望.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++24.2017年10月9日,教育部考试中心下发了《关于2018年普通高考考试大纲修订内容的通知》,在各科修订内容中明确提出,增加中华优秀传统文化的考核内容,积极培育和践行社会主义核心价值观,充分发挥高考命题的育人功能和积极导向作用.鞍山市教育部门积极回应,编辑传统文化教材,在全是范围内开设书法课,经典诵读等课程.为了了解市民对开设传统文化课的态度,教育机构随机抽取了200位市民进行了解,发现支持开展的占75%,在抽取的男性市民120人中支持态度的为80人.(1)完成22⨯列联表(2)判断是否有99.9%的把握认为性别与支持有关?附:22()()()()()n ad bcKa b c d a c b d-=++++.25.某中学在2020年元旦校运动会到来之前,在高三年级学生中招募了16名男性志愿者和14名女性志愿者,其中男性志愿者,女性志愿者中分别有10人和6人喜欢运动会,其他人员均不喜欢运动会.(1)根据题设完成下列22⨯列联表:(2)在犯错误的概率不超过0.050的前提下能否有95%的把握认为喜欢运动会与性别有关?并说明理由.(3)如果喜欢运动会的女性志愿者中只有3人懂得医疗救护,现从喜欢运动会的女性志愿者中随机抽取2人负责医疗救护工作,求“抽取得2名志愿者都懂得医疗救护”的概率.注:()()()()()()22n ad bcK n a b c da b c d a c b d-==+++ ++++临界值表k 3.841 5.024 6.63510.82826.2016年欧洲杯将于2016年6月10日到7月10日在法国举行.为了使得赛会有序进行,欧足联在全球范围内选聘了30名志愿者(其中男性16名,女性14名).调查发现,男性中有10人会英语,女性中有6人会英语.(1)根据以上数据完成以下2×2列联表:并回答能否在犯错的概率不超过0.10的前提下认为性别与会英语有关?参考公式:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++参考数据:(2)会英语的6名女性志愿者中曾有4人在法国工作过,若从会英语的6名女性志愿者中随机抽取2人做导游,则抽出的2人都在法国工作过的概率是多少?【参考答案】***试卷处理标记,请不要删除一、选择题1.D解析:D【分析】根据22⨯列联表,计算2k,与临界值表比较即可得出结论.【详解】K的观测值:K2264(862426)34303232⨯⨯-⨯=≈⨯⨯⨯20.330;由于20.330>10.828,∴有99.9%的把握认为“身高与性别有关”,即在犯错误的概率不超过0.001的前提下,认为“身高与性别有关” 故选:D . 【点睛】本题主要考查了独立性检验的应用问题,K 2的计算,22⨯列联表,考查了运算能力,属于中档题.2.C解析:C 【分析】根据题意,对选项中的命题进行分析,判断真假性即可. 【详解】对于A ,根据抽样方法特征是数据多,抽样间隔相等,是系统抽样,所以A 正确; 对于B ,一组数据的方差为2s ,平均数为x ,将这组数据的每一个数都乘以2,所得的一组新数据的方差和平均数为24s ,2x ,所以B 正确;对于C ,两个随机变量的线性相关性越强,则相关系数||r 的值越接近于1,所以C 错误;对于D ,一组数据1、a 、3的平均数是2,所以2a =;所以该组数据的方差是222212[(12)(22)(32)]33s =⨯-+-+-=,所以D 正确.故选:C . 【点睛】本题主要考查抽样和统计,考查方差和平均数的计算,考查两个随机变量的相关性,意在考查学生对这些知识的理解掌握水平3.B解析:B 【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案. 【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验, 回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析, 综上可知①是独立性检验,②是回归分析,故选B . 【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.4.C解析:C 【分析】因为5.278 6.635<,根据附表中的数据,即可得到判断的结论,得到答案. 【详解】因为5.278 6.635<,所以不能在犯错误的概率不超过1%的前提下,认为“喜欢该节目与性别有关”;又5.278 5.024>,所以有97.5%以上的把握认为“喜欢该节目与性别有关”,故选C . 【点睛】本题主要考查独立性检验的应用,独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式计算2K 的观测值k ;(3)查表比较k 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误)5.B解析:B 【分析】根据独立性检验中卡方的概念知,选B. 【详解】根据独立性检验中卡方的概念知,2 6.635K >时,有99%的把握说事件A 与B 有关选B. 【点睛】本题主要考查了独立性检验中卡方的概念,属于中档题.6.B解析:B 【解析】 【分析】根据独立性检验的定义可判断(1);根据方差的性质可判断(2);根据残差的性质可判断(3);根据正态分布的对称性可判断(4). 【详解】(1)对分类变量X 与Y 的随机变量2K 的观测值K 来说,K 越大,判断“X 与Y 有关系”的把握越大,故(1)错误;(2)若将一组样本数据中的每个数据都加上同一个常数后,数据的离散程度不变,则样本的方差不变,故(2)正确;(3)根据残差的定义可知,在残差图,残差点分布的带状区域的宽度越狭窄,预测值与实际值越接近,其模型拟合的精度越高,(3)正确;(4)设随机变量ξ服从正态分布()0,1N ,若()1P p ζ>=,则()1P p ζ<-=,则()1112P p ζ-<<=-,则()1102P p ζ-<<=-,故(4)正确, 故正确的命题的个数为3个,故选B. 【点睛】本题主要通过对多个命题真假的判断,主要综合考查独立性检验的定义、方差的性质、残差的性质以及正态分布的对称性,属于中档题. 这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.7.D解析:D 【解析】∵y 与x 的线性回归方程为 6.5175ˆ.y x =+ 当5x =时,ˆ50y=. 当广告支出5万元时,由表格得:60y = 故随机误差的效应(残差)为605010.-= 故选D .8.C解析:C 【详解】由题意可知16,28,20,8a b c d ====,44,28,36,36a b c d a c c d +=+=+=+=,72n a b c d =+++=,代入公式()()()()()22n ad bc K a b c d a c b d -=++++得()227216828208.4244283636K ⨯⨯-⨯=≈⨯⨯⨯,由于28.427.879K ≈>,我们就有0099.5的把握认为性别和读营养说明之间有关系,即性别和读营养说明之间有0099.5的可能是有关系的,故选C .9.B解析:B 【解析】 K 2=≈5.059>5.024,因为P(K 2>5.024)=0.025,所以这种推断犯错误的概率不超过0.025.选B10.A解析:A 【解析】试题分析:根据题意,样本中心点的坐标为()10,38,所以38210,58a a =-⨯+∴=,因此回归直线方程为2ˆ58yx =-+,所以当6x =时,估计该商场下个月毛衣销售量约为26ˆ5846y=-⨯+=,故选A. 考点:回归直线方程.11.B解析:B 【解析】∵直线0x y a ++=与圆()()22122x y -+=+有公共点,∴1222a-+≤13a -≤≤,∴在区间[55]-,内任取一个实数a ,使直线0x y a ++=与圆()()22122x y -+=+有公共点的概率为312555+=+,故选B. 点睛:本题主要考查了几何概型的概率,以及直线与圆相交的性质,解题的关键弄清概率类型,同时考查了计算能力,属于基础题;利用圆心到直线的距离小于等于半径可得到直线与圆有公共点,可求出满足条件的a ,最后根据几何概型的概率公式可求出所求.12.D解析:D 【解析】57(0.85165ˆ85.7) 2.45Y Yσ=-=-⨯-= 二、填空题13.3【解析】【分析】逐一分析各个说法即可得到结论【详解】由方差的性质知:方差反映一组数据的波动大小将一组数据中的每个数据都加上或者减去同一个常数后方差恒不变①正确;一个回归方程=3-5x 变量x 增加一个解析:3 【解析】 【分析】逐一分析各个说法即可得到结论 【详解】由方差的性质知:方差反映一组数据的波动大小,将一组数据中的每个数据都加上或者减去同一个常数后,方差恒不变,①正确;一个回归方程ˆy=3-5x ,变量x 增加一个单位时,y 平均减少5个单位,②错误 线性回归方程必过样本中心点,③正确;曲线上的点与该点的坐标之间具有一一对应关系④错误.在一个2×2列联表中,由计算得K 2=13.079,则其两个变量之间有关系的可能性是99.90%,故⑤错误综上所述,其中错误的个数是3个 故答案为3 【点睛】本题主要考查了线性回归方程,考查了独立性检验,考查了方差的变化特点,考查了相关关系,是一道考查的知识点比较多的题目,综合性较强,注意分析,本题不需要计算,只要理解概念即可得到结论14.【解析】∵P(K2≥3841)≈005∴判断性别与是否爱好运动有关出错的可能性不超过5点睛:根据卡方公式计算再与参考数据比较就可确定可能性 解析:5%【解析】∵P (K 2≥3.841)≈0.05.∴判断性别与是否爱好运动有关,出错的可能性不超过5%. 点睛:根据卡方公式计算2K ,再与参考数据比较,就可确定可能性.15.5【解析】试题分析:考点:回归方程【方法点睛】求回归直线中的参数ba 需要先求得b 再求a 因为所以要根据列表中的数据求得公式中相关的量将这些数据代入公式中即可求得参数b 对于参数a 需要将b 代入回归直线求得解析:5【解析】试题分析:3125344646i ii x y==⨯+⨯+⨯=∑, 32222123429i i x ==++=∑,3x =, 5y =, ∴ 31322130.53ˆi i i i i x y xyb x x==-==-∑∑. 考点:回归方程.【方法点睛】求回归直线中的参数b ,a ,需要先求得b ,再求a ,因为,所以要根据列表中的数据求得公式中相关的量,将这些数据代入公式中,即可求得参数b .对于参数a ,需要将b ,代入回归直线求得.16.【分析】由题意知试验范围为区间长度为故可利用黄金分割法(法)选取试点进行计算【详解】由题意知试验范围为可得区间长度为用法安排试验则第二次试点加入量可以是故答案为【点睛】本题考查黄金分割法的应用解题的解析:691. 【分析】由题意知试验范围为[]500,1000,区间长度为500,故可利用黄金分割法(0.618法)选取试点进行计算. 【详解】由题意知试验范围为[]500,1000,可得区间长度为500,用0.618法安排试验,则第二次试点加入量可以是()10000.6181000500691-⨯-=, 故答案为691. 【点睛】本题考查黄金分割法的应用,解题的关键是要了解黄金分割法(0.618法),考查分析问题与解决问题的能力,属于基础题.17.①③④【解析】①是独立性检验的应用①对②中由于所以显然是半个圆②错③中由极坐标中两点距离公式=③对④中所有边长相等的凸多边形都是正多边形为大前提是错误的因为只需要正多边形挤压变形使之仍为凸多边形即可解析:①③④ 【解析】①是独立性检验的应用,①对.②中由于[]0,θπ∈,所以01y ≤≤,显然是半个圆,②错.③中,由极坐标中两点距离公式2221212212cos()AB ρρρρθθ=+--=14912()19,2+-⨯-=AB ③对.④中“所有边长相等的凸多边形都是正多边形”为大前提,是错误的,因为只需要正多边形挤压变形,使之仍为凸多边形即可.④对.所以填①③④.18.有【解析】根据表中数据计算观测值对照临界值知有95的把握认为南方学生和北方学生在选用甜品的饮食习惯方面有差异解析:有 【解析】根据表中数据,计算观测值22100(60102010)1003.8417030802021K ⨯-⨯==>⨯⨯⨯,对照临界值知,有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”。

新北师大版高中数学高中数学选修2-3第三章《统计案例》测试(含答案解析)(3)

新北师大版高中数学高中数学选修2-3第三章《统计案例》测试(含答案解析)(3)

一、选择题1.设(1+x)n =a 0+a 1x+…+a n x n ,若a 1+a 2+…+a n =63,则展开式中系数最大的项是( ) A .15x 2B .20x 3C .21x 3D .35x 32.下列关于回归分析与独立性检验的说法正确的是() A .回归分析和独立性检验没有什么区别;B .回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系;C .独立性检验可以100%确定两个变量之间是否具有某种关系.D .回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验;3.假设有两个分类变量X 和Y 的22⨯列联表为:X Y1y2y 总计1x 5b5b + 2x15d15d + 总计20 4060对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由 列联表算得7.8k ≈参照附表,得到的正确结论是( ).A .在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.001的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.001的前提下,认为“爱好该项运动与性别无关”5.为了普及环保知识,增强环保意识,某大学从理工类专业的A 班和文史类专业的B 班各抽取20名同学参加环保知识测试,统计得到成绩与专业的列联表:( )优秀 非优秀 总计 A 班14 6 20 B 班7 13 20 总计211940附:参考公式及数据:(1)统计量:()()()()()22n ad bc K a b c d a c b d -=++++,(n a b c d =+++).(2)独立性检验的临界值表:()20P K k ≥0.050 0.010 0k 3.8416.635则下列说法正确的是A .有95%的把握认为环保知识测试成绩与专业有关B .有95%的把握认为环保知识测试成绩与专业无关C .有99%的把握认为环保知识测试成绩与专业有关D .有99%的把握认为环保知识测试成绩与专业无关6.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bc K a c b d a d b c -++++,其中n a b c d =+++.20()P K k ≥0.10 0.05 0.01 0.005已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们( )A .没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B .有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C .有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”7.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9% 8.某种产品的广告费支出x 与销售额y (单位:万元)之间有下表关系:y 与x 的线性回归方程为 6.5175ˆ.y x =+,当广告支出5万元时,随机误差的效应(残差)为( ) A .40 B .20 C .30D .109.某市政府调查市民收入与旅游欲望时,采用独立性检验法抽取3 000人,计算发现k 2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游欲望有关系的把握是( )A .90%B .95%C .97.5%D .99.5%10.某班主任对全班50名学生进行了作业量的调查,数据如下表:( )附:()()()()()22n ad bc K a b c d a c b d -=++++A .0.01B .0.025C .0.10D .0.0511.若在区间[-5,5]内任取一个实数a ,则使直线x +y +a =0与圆(x -1)2+(y +2)2=2有公共点的概率为( )A B .25C .35D 12.下列说法中正确的是①相关系数r 用来衡量两个变量之间线性关系的强弱, r 越接近于1,相关性越弱; ②回归直线y bx a =+一定经过样本点的中心(),x y ; ③随机误差e 的方差()D e 的大小是用来衡量预报的精确度;④相关指数2R 用来刻画回归的效果, 2R 越小,说明模型的拟合效果越好.( ) A .①②B .③④C .①④D .②③二、填空题13.以下四个命题中:①在回归分析中,可用相关系数r 的值判断模型的拟合效果,|r |越大,模拟的拟合效果越好;②在一组样本数据()()()112212,,,,...,,(2,,,...,n n n x y x y x y n x x x ≥不全相等)的散点图中,若所有样本点()()11,1,2,...x y i n =都在直线112y x =-+上,则这组样本数据的线性相关系数为12-;③对分类变量x 与y 的随机变量2k 来说,2k 越小,判断“x 与y 有关系”的把握程度越大.其中真命题的个数为__________. 14.给出下列命题:①线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;②由变量x 和y 的数据得到其回归直线方程:l ˆybx a =+,则l 一定经过点(),x y P ; ③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;⑤在回归直线方程0.110ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 增加0.1个单位,其中真命题的序号是___________.15.已知的取值如表所示:若与呈线性相关,且回归方程为,则等于 .23454616.一个三位自然数百位,十位,个位上的数字依次为a ,b ,c ,当且仅当有两个数字的和等于第三个数字时称为“有缘数”(如213,134等),若{},,1234a b c ∈,,,,且a ,b ,c 互不相同,则这个三位数为”有缘数”的概率是__________. 17.以下四个命题,其中正确的序号是____________________.①从匀速传递的产品生产流水线上,每20分钟从中抽取一件产品进行检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程0.212ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 平均增加0.2个单位;④分类变量X 与Y ,它们的随机变量2K 的观测值为k ,当k 越小,“X 与Y 有关系”的把握程度越大. 18.已知下列说法: ①分类变量A 与B 的随机变量越大,说明“A 与B 有关系”的可信度越大;②以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别是和;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为,若,,,则.其中说法正确的为_____________.(填序号)19.从某高校在校大学生中随机选取5名女大学生,由她们身高和体重的数据得到的回归直线方程为ˆ0.7973.56yx =-,数据列表是:则其中的数据a =__________. 20.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________.三、解答题21.第十八届中国国际农产品交易会于11月27日在重庆国际博览中心开幕,我市全面推广“遂宁红薯”及“遂宁鲜”农产品区域公用品牌,并组织了100家企业、1000个产品进行展示展销,扩大优质特色农产品市场的占有率和影响力,提升遂宁特色农产品的社会认知度和美誉度,让来自世界各地的与会者和消费者更深入了解遂宁,某记者对本次农交会进行了跟踪报道和实际调查,对某特产的最满意度()%x 和对应的销售额y (万元)进行了调查得到以下数据: 时间第一天 第二天 第三天 第四天 第五天 最满意度()%x 22 34 25 20 19 销售额y (万元)7890867675y x r y x 关系数r 的绝对值在0.95以上(含0.95)是线性相关性较强;否则,线性相关性较弱.请你对线性相关性强弱作出判断,并给出理由;(2)如果没有达到较强线性相关,则采取“末位淘汰”制(即销售额最少的那一天不作为计算数据),并求在剔除“末位淘汰”的那一天后的销量额y 关于最满意度x 的线性回归方程(系数精确到0.1). 参考数据:24x =,81y =,52215146ii xx =-=∑, 52215176i i y y =-=∑,515151i ii x y xy =-=∑14617613.27≈≈.附:对于一组数据()()()1122,,,,,,n n x y x y x y ⋅⋅⋅.其回归直线方程 ˆˆˆy bx a=+的斜率和截距的最小二乘法估计公式分别为:1221ˆ·ni ii nii x y nx y bxnx ==-=-∑∑,ˆa y bx=-,线性相关系数1222211·ni ii n ni i i i x y nx y r x nx y ny ===-=⎛⎫⎛⎫-- ⎪⎪⎝⎭⎝⎭∑∑∑.22.黑人乔治•弗洛伊德被残杀死亡事件,引发了全世界的抗议.近期某校高二年级A 班班主任对该班进行了一次调查,发现全班50名同学中,对此事关注的占25,他们在本学期期末考试中的政治成绩(满分100分)如下面的频率分布直方图:(1)根据频率分布直方图,求对此事关注的学生政治成绩的中位数的估计值(精确到0.1);(2)若政治成绩不低于80分的为优秀,请以是否优秀为分类变量, ①补充下面的22⨯列联表:政治成绩优秀 政治成绩不优秀 合计对此事关注 对此事不关注 合计②是否有90%以上的把握认为“对此事是否关注”与政治期末成绩是否优秀有关系?参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据: P(20K k ≥)0.15 0.10 0.05 0.025 0.010 0.005 0.001 0k 2.0722.7063.8415.0246.6357.87910.82823.受新冠肺炎疫情影响,本学期同学们在家上网课时间达三个多月,电脑屏幕代替了黑板,对同学们的视力造成了很大的损伤.某学校为了了解同学们现阶段的视力情况,对全校高三1000名学生的视力情况进行了调查,从中随机抽取了100名学生的体检表,绘制了频率分布直方图如图:(1)求a 的值,并估计这1000名学生视力的中位数(精确到0.01);(2)为了进一步了解视力与学生成绩是否有关,对本年级名次在前50名与后50名的学生进行了调查,得到如下数据:前50名 后50名 近视4232 不近视 818根据表中数据,能否有95%把握认为视力与学习成绩有关?(3)若报考某高校某专业的资格为:视力不低于5.0,以该样本数据来估计全市高三学生的视力,现从全市视力在4.8以上的同学中随机抽取4名同学,这4名同学中有资格报该校该专业的人数为X,求X的分布列及数学期望.24.中央电视台“国家品牌计划”栏目组为了做好新能源汽车的品牌推介,利用网络平台对年龄(单位:岁)在[20,60]内的人群进行了调查,并从参与调查者中随机选出600人,把这600人分为对新能源汽车比较关注和不太关注两类,并制成如下表格:(1)填写列联表,并根据列联表判断能否在犯错误的概率不超过0.01的前提下认为性别与对新能源汽车关注度有关;这600人中选出6人进行访谈,最后从这6人中随机选出3人参与电视直播节目,记3人中女性的人数为X,求X的分布列与期望.附:0)k0k2.072 2.7063.841 5.024 6.635 7.879 10.82822()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++. 25.某私营业主为确定下一年度投入某种产品的宣传费,需了解月宣传费x (单位:百元)对月销售量y (单位:t )和月利润z (单位:百元)的影响,对8个月的宣传费i x 和销售量i y (i =1,2,...,8)数据作了初步处理,得到如图的散点图及一些统计量的值.x y w()821ii x x =-∑()821ii w w =-∑()()81iii x x y y =--∑ ()()81iii w w yy =--∑5.4 563 2.2 63.88 3.7 645.188 151.7(1)根据散点图判断出y =c +x y 关于月宣传费x 的回归方程类型,求y 关于x 的回归方程;(表中i i w x =(2)已知这种产品的每月利润z 与x 、y 的关系为2z y x =-,根据(1)的结果,当月宣传费用x =16时,求月利润的预报值.参考公式:1122211()()()()n ni iiii i nniii i x y nx y x x y y b xn x x x ====-⋅--==--∑∑∑∑, ˆˆa y bx=- 26.为了了解某班学生喜欢数学是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表,已知在全部50人中随机抽取1人抽到喜欢数学的学生的概率为35.喜欢数学 不喜欢数学 合计男生5女生 10合计50(1)能否在犯错误的概率不超过0.005的前提下认为喜欢数学与性别有关?说明你的理由;()20P K k ≥ 0.150.100.050.025 0.010 0.005 0.001 0k 2.702 2.7063.8415.0246.6357.87910.828(2)现从女生中抽取2人进一步调查,设其中喜欢数学的女生人数为ξ,求ξ的分布列与期望.临界表供参考:(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++)【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【解析】 令x=1,则(1+1)n =++…+=64.∴n=6.故(1+x)6的展开式中系数最大的项为T 4=x 3=20x 3.2.D解析:D 【分析】根据题意可知,利用回归分析和独立性检验的定义,排除错误选项,即可求解出答案. 【详解】回归分析是指将具有相关关系的两个变量之间的数量关系进行测定,通过建立数学表达式进行统计估计和预测的统计研究方法.独立性检验是对两个变量之间是否具有某种关系的分析,并且可以分析这两个变量在多大程度上具有这种关系,但不能100%肯定这种关系.根据以上定义,可知A 、B 、C 均错误,故答案选D . 【点睛】本题主要考查了回归分析与独立性检验的定义的区别.3.D解析:D 【解析】 【分析】 根据公式()()()()()22n ad bc K a b c d a c b d -=++++,分别利用4个选项中所给数据求出2K 的值,比较所求值的大小即可得结果. 【详解】选项A :22160(535155)3204010502K ⨯⨯-⨯==⨯⨯⨯,选项B :22260(5251515)152040204016K ⨯⨯-⨯==⨯⨯⨯,选项C :22360(5201520)24204025357K ⨯⨯-⨯==⨯⨯⨯,选项D :22460(5101530)96204035257K ⨯⨯-⨯==⨯⨯⨯,可得222431K K K >>22K >,所以由选项D 中的数据得到的2K 值最大,说明X 与Y 有关系的可能性最大,故选D . 【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2 K 越大两个变量有关的可能性越大这一性质.4.A解析:A 【解析】 【分析】由题意结合独立性检验的结论和临界值表给出结论即可. 【详解】由独立性检验的结论,观测值7.8k ≈,结合临界值表:7.8 6.635>,据此可给出结论:在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别有关”. 本题选择A 选项. 【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.5.A解析:A 【解析】分析:首先计算观测值k 0的值,然后给出结论即可.详解:由列联表计算观测值:()2401413672804.912 3.8412119202057k⨯⨯-⨯==≈>⨯⨯⨯,则有95%的把握认为环保知识测试成绩与专业有关.本题选择A选项.点睛:本题主要考查独立性检验及其应用等知识,意在考查学生的转化能力和计算求解能力.6.B解析:B【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人,又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人,又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530)4.762 3.8412109075225K⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”,故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.7.A解析:A【解析】分析:根据列联表中数据代入公式计算k的值,和临界值表比对后即可得到答案.详解:将列联表中数据代入公式可得()210045153010 3.030 2.70675255545k ⨯⨯-⨯=≈>⨯⨯⨯,所以有0090的把握认为“该市居民能否做到‘光盘’”与性别有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)8.D解析:D 【解析】∵y 与x 的线性回归方程为 6.5175ˆ.yx =+ 当5x =时,ˆ50y=. 当广告支出5万元时,由表格得:60y = 故随机误差的效应(残差)为605010.-= 故选D .9.C解析:C 【详解】∵2 6.023 5.024K =>∴可断言市民收入增减与旅游欲望有关的把握为97.5%. 故选C.点睛:本题主要考查独立性检验的实际应用.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式22()()()()()n ad bc K a b c d a c b d -=++++,计算出2K 的值;(3)查表比较2K 与临界值的大小关系,作统计判断.10.B解析:B 【解析】 K 2=≈5.059>5.024,因为P(K 2>5.024)=0.025,所以这种推断犯错误的概率不超过0.025.选B11.B解析:B 【解析】∵直线0x y a ++=与圆()()22122x y -+=+有公共点,∴1222a -+≤13a -≤≤,∴在区间[55]-,内任取一个实数a ,使直线0x y a ++=与圆()()22122x y -+=+有公共点的概率为312555+=+,故选B. 点睛:本题主要考查了几何概型的概率,以及直线与圆相交的性质,解题的关键弄清概率类型,同时考查了计算能力,属于基础题;利用圆心到直线的距离小于等于半径可得到直线与圆有公共点,可求出满足条件的a ,最后根据几何概型的概率公式可求出所求.12.D解析:D 【解析】①相关系数r 用来衡量两个变量之间线性关系的强弱,r 越接近于1,则相关性越强,所以错误;②回归直线y bx a =+一定经过样本点的中心(),x y ,正确; ③随机误差e 的方差()D e 的大小是用来衡量预报的精确度,正确;④相关指数2R 用来刻画回归的效果,2R 越小,说明模型的拟合效果越不好,所以错误. 所以正确的有②③.故选D .二、填空题13.1【分析】根据相关系数的概念以及两变量把握程度的概念进行判断【详解】①在回归分析中可用相关系数r 的值判断模型的拟合效果|r|越大模拟的拟合效果越好①正确;②相关系数反映的是两变量之间线性相关程度的强解析:1 【分析】根据相关系数的概念以及两变量把握程度的概念进行判断. 【详解】①在回归分析中,可用相关系数r 的值判断模型的拟合效果,|r |越大,模拟的拟合效果越好,①正确;②相关系数反映的是两变量之间线性相关程度的强弱,与回归直线斜率无关,题中样本数据的线性相关系数为-1,②错误;③对分类变量x 与y 的随机变量2k 来说,2k 越大,判断“x 与y 有关系”的把握程度越大.③错误. 故正确命题个数为1. 故答案为1. 【点睛】本题考查回归分析中相关系数的概念,考查两变量的把握程度的判断,属于基础题.14.②④⑤【解析】试题分析:线性相关系数越大两个变量的线性相关性越强;反之线性相关性越弱故①错;回归直线方程一定经过样本中心点所以②正确;③的抽样方式为系统抽样故③错;由在含有一个解释变量的线性模型中R解析:②④⑤ 【解析】试题分析:线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱,故①错;回归直线方程一定经过样本中心点(),x y P ,所以②正确;③的抽样方式为系统抽样,故③错;由在含有一个解释变量的线性模型中,R 2恰好等于相关系数r 的平方.显然,R 2取值越大,意味着残差平方和越小,也就是模型的拟合效果越好,故④正确;由回归直线方程可知,当解释变量x 每增加一个单位时,预报变量ˆy增加0.1个单位的解释是正确的,故⑤正确;所以正确的序号为②④⑤. 考点:回归分析的基本思想及其应用初步.15.5【解析】试题分析:考点:回归方程【方法点睛】求回归直线中的参数ba 需要先求得b 再求a 因为所以要根据列表中的数据求得公式中相关的量将这些数据代入公式中即可求得参数b 对于参数a 需要将b 代入回归直线求得解析:5【解析】试题分析:3125344646i ii x y==⨯+⨯+⨯=∑, 32222123429i i x ==++=∑,3x =, 5y =, ∴ 31322130.53ˆi i i i i x y xy b x x==-==-∑∑. 考点:回归方程.【方法点睛】求回归直线中的参数b ,a ,需要先求得b ,再求a ,因为,所以要根据列表中的数据求得公式中相关的量,将这些数据代入公式中,即可求得参数b .对于参数a ,需要将b ,代入回归直线求得.16.【解析】试题分析:由123组成的三位自然数为123132213231312321共6个;同理由124组成的三位自然数共6个;由134组成的三位自然数也是6个;由234组成的三位自然数也是6个所以共有解析:12【解析】试题分析:由1,2,3组成的三位自然数为123,132,213,231,312,321,共6个; 同理由1,2,4组成的三位自然数共6个; 由1,3,4组成的三位自然数也是6个; 由2,3,4组成的三位自然数也是6个. 所以共有6+6+6+6=24个.由1,2,3组成的三位自然数,共6个”有缘数”.由1,3,4组成的三位自然数,共6个”有缘数”.所以三位数为”有缘数”的概率121242P==.考点:1.分类加法;2.古典概型.17.②③【分析】利用系统抽样的定义判断①利用独立性检验判断④;利用相关系数的性质判断②;由回归方程的性质判断③【详解】①为系统抽样①不正确;④分类变量与它们的随机变量的观测值为当越小与有关系的把握程度越解析:②③【分析】利用系统抽样的定义判断①利用独立性检验判断④;利用相关系数的性质判断②;由回归方程的性质判断③.【详解】①为系统抽样, ①不正确;④分类变量X与Y,它们的随机变量2K的观测值为k,当k 越小,“X与Y有关系”的把握程度越小,④不正确;根据相关系数的性质可知②正确;由回归方程的性质可知③正确.故答案为②③.【点睛】本题通过对多个命题真假的判断,综合考查系统抽样、相关系数、回归方程、独立性检验,属于中档题.这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.18.①②③【解析】①正确因为k2越大说明A和B有关系的把握性就越大;②正确因为y=cekx那么lny=lncekx=kx+lnc即z=kx+lnc=03x+4解得k=03lnc=4解得:k=03c=e4解析:①②③【解析】①正确,因为越大,说明“和有关系”的把握性就越大;②正确,因为,那么,即,解得,解得:所以正确;③在回归直线上,所以,解得:,所以正确,那么正确的有①②③.【点睛】本题是以命题形式考查了回归方程和独立性检验的相关知识,样本中心点必在回归直线上,独立性检验中越大,说明犯错误的概率越小,即认为两个变量有关的把握性就越大.19.163【解析】由根据回归直线经过样本中心即得由得故答案为解析:163【解析】 由4953565864565y ++++==,根据回归直线经过样本中心(),x y ,即560.7973.56x =⨯-,得164x =,由1551611671741645a x ++++==,得163a =,故答案为163.20.①④【解析】对于①从匀速传递的产品生产流水线上质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测这样的抽样方法是系统抽样故①正确;对于②两个变量的线性相关程度越强则相关系数的绝对值越接近于1解析:①④ 【解析】对于①,从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样,故①正确;对于②,两个变量的线性相关程度越强,则相关系数的绝对值越接近于1,故②错误; 对于③,两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越小,故③错误;对于④,∵随机变量X ∼N (0,1),设P (|X |<1)=p ,则1(1)(1)2pP X P X ->=<-=, ∴11(1)1(1)122p pP X P X -+<=->=-=, ∴2(1)1P X p <-=,即(1)2(1)1P X P X <=<-,故④正确。

高中数学 第三章 统计案例单元测试 北师大版选修23

高中数学 第三章 统计案例单元测试 北师大版选修23

高中数学第三章统计案例单元测试北师大版选修2-3(时间:90分钟满分:100分)一、选择题(本大题共10小题,每小题4分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)1下面变量之间的关系是函数关系的是( )A.已知二次函数y=ax2+bx+c,其中a、c是已知常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4acB.光照时间和果树亩产量C.降雪量和交通事故发生率D.每亩施用肥料量和粮食亩产量2设有一个回归方程为y=3-5x,变量x增加一个单位时,则( )A.y平均增加3个单位B.y平均减少5个单位C.y平均增加5个单位D.y平均减少3个单位3若线性回归方程中的回归系数b=0时,则相关系数为( )A.r=1 B.r=-1C.r=0 D.无法确定4在一个2×2列联表中,由其数据计算得χ2=13.097,则其两个变量间有关系的可能性为( )A.99% B.95%C.90% D.无关系5(2010山东烟台专项训练)考查四个班的学生数学、物理成绩,得到列联表如下:随机变量χ2的值为( )A.34 B.20 C.37 D.246已知回归直线的斜率的估计值是 1.23,样本点的中心为(4,5),则线性回归方程是( )A.y=1.23x+4 B.y=1.23x+5C.y=1.23x+0.08 D.y=0.08x+1.237已知x与y之间的一组数据:则y与x的线性回归方程y=bx+a必过点( )A.(2,2) B.(1.5,0)C.(1,2) D.(1.5,4)8下列结论正确的是( )①函数关系是一种确定性关系②相关关系是一种非确定性关系③回归分析是对具有函数关系的两个变量进行统计分析的一种方法④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法A.①② B.①②③C.①②④ D.①②③④9下列现象的相关程度最高的是( )A.某商店的职工人数与商品销售额之间的相关系数为0.87B.流通费用率与商业利润率之间的相关系数为-0.94C.商品销售额与商业利润率之间的相关系数为0.51D.商品销售额与流通费用率之间的相关系数为-0.8110某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设:“这种血清不能起到预防感冒的作用”,利用列联表计算,得χ2≈3.918,而已知P(χ2≥3.841)≈0.05.则下列结论正确的是( )A.有95%的把握认为“这种血清能起到预防感冒的作用”B.若某人未使用该血清,那么他在一年中有95%的可能性得感冒C.这种血清预防感冒的有效率为95%D.这种血清预防感冒的有效率为5%二、填空题(本大题共5小题,每小题4分,共20分.把答案填在题中的横线上) 11某化工厂为预测某产品的回收率y ,需要研究它和原料有效成分含量之间的相关关系.现取了8对观测值,计算得∑i =18x i =52,∑i =18y i =228,∑i =18x 2i=478,∑i =18x i y i =1 849,则y 对x的线性回归方程是________.12若施化肥量x kg 与水稻产量y kg 之间的线性回归方程为y =5x +250,则当施化肥量为80 kg 时,预计水稻产量为________ kg.13(2010江苏高邮中学高三模拟考试)甲、乙两同学各自独立地考察两个变量X 、Y 的线性相关关系时,发现两人对X 的观察数据的平均值相等,都是s ,对Y 的观察数据的平均值也相等,都是t ,各自求出的回归直线分别是l 1、l 2,则直经l 1与l 2必经过同一点__________.14为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下2×2列联表:理科 文科 男 13 10 女720已知P(χ2≥3.841)≈0.05,P(χ2≥5.024)≈0.025. 根据表中数据,得到χ2=50×13×20-10×7223×27×20×30≈4.844.则认为选修文科与性别有关系出错的可能性小于__________.15(2010山东泰安高三模拟)某调查者从调查中获知某公司近年来科研费用支出x(万元)与公司所获得利润y(万元)的统计资料如下表:序号 科研费用支出x i利润y i x i y i x 2i 1 5 31 155 25 2 11 40 440 121 3 4 30 120 16 4 5 34 170 25 5 3 25 75 9 6 2 20 40 4 合计301801 000200则利润y对科研费用支出x的线性回归方程为__________.三、解答题(本大题共4小题,共40分.解答时应写出文字说明、证明过程或演算步骤)16(9分)部分国家13岁学生数学测验平均分数如下表:试作出该数据的散点图并由图判断是否存在回归直线,若存在,求出直线方程.17(10分)两所学校的计算机算法语言学习小组统一测验成绩如下:甲校:16,12,20,15,23,8,16,19.乙校:22,17,26,24,8,7,25,28.(1)求共同的中位数.(2)统计中位数上下的频数.(3)两所学校的计算机算法语言学习小组的成绩有无差异?18(10分)在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2的列联表;(2)判断性别与休闲方式是否有关系.19(11分)为了研究某种细菌随时间x变化繁殖的个数,收集数据如下:(1)用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图;(2)描述解释变量与预报变量之间的关系.参考答案1解析:B 、C 、D 是相关关系,A 是确定性关系,即函数关系. 答案:A2解析:斜率b =-5的意义是:变量x 增加1个单位时,y 平均增加-5个单位,即y 平均减少5个单位.答案:B3解析:当b =0时,即∑i =1nx i y i -n xy∑i =1nx 2i -n x 2=0∑i =1nx i y i -n xy =0,∴r=∑i =1nx i y i -n xyi =1n x i 2-n x2i =1n y i 2-n y2=0.答案:C4解析:当χ2>6.635时,有99%的把握认为两个变量之间有关系. 答案:A 5答案:D6解析:由题知b =1.23,直线经过中心(4,5),则a =0.08,∴线性回归方程为y =1.23x +0.08.答案:C7解析:线性回归方程y =bx +a 必过点(x ,y ). 答案:D 8答案:C9解析:|r|越接近1,相关程度越高. 答案:B10解析:由题意,知x 2≈3.918,且P(x 2≥3.841)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”.答案:A11解析:b =∑i =1nx i y i -n xy∑i =1nx 2i -n x 2≈2.621 4,a =y -b x ≈11.46,∴线性回归方程为y =11.46+2.62x. 答案:y =11.46+2.62x12解析:将x =80代入线性回归方程,得y =650(kg). 答案:650 13答案:(s ,t)14解析:∵χ2=4.844>3.841,∴至少有95%的把握认为是否选修文科与性别有关,故这种判断出错的可能性小于5%. 答案:5%15解析:设回归直线方程为y =a +bx , 由表中数据,得b =1 000-6×5×30200-6×52=2,∴a=y -b x =30-2×5=20. ∴回归直线方程为y =2x +20. 答案:y =2x +20 16解:散点图如图所示.∵x =203,∑i =1nx 2i =416 824,y =64.5,∑i =1nx i y i =132 418,∴b=132 418-10×203×64.5416 824-10×2032≈0.313 3,a =64.5-0.313 3×203=0.900 1.∴线性回归方程是y =0.313 3x +0.900 1.17解:(1)将两组数据合在一起,从小到大的排列,寻找共同的中位数,由于n 1+n 2=8+8=16,则第8与第9个位置上的数据之平均数即为共同的中位数,共同中位数为18.(2)校别 中位数以上中位数以下合 计 甲 3 5 8 乙 5 3 8 合计8816(3)χ2=163×3-5×528×8×8×8=1≤2.706,∴两所学校的计算机算法语言成绩无显著差异.18解:(1)2×2的列联表如下:(2)假设“休闲方式与性别无关”. 计算χ2=124×43×33-27×21270×54×64×60≈6.201.因为χ2>3.841,所以有理由认为假设“休闲方式与性别无关”是不合理的, 即有95%的把握认为“休闲方式与性别有关”. 19解:(1)散点图如图所示.(2)由散点图看出样本点分布在一条指数函数y=C1eC2x的周围,于是令Z=lny,则由计算器算得Z=0.69x+1.112,则有y=e0.69x+1.112.。

(北师大版)上海市高中数学选修2-3第三章《统计案例》检测卷(包含答案解析)

(北师大版)上海市高中数学选修2-3第三章《统计案例》检测卷(包含答案解析)

一、选择题1.利用独立性检验的方法调查大学生的性别与爱好某项运动是否有关,通过随机询问400名不同的大学生是否爱好某项运动,利用22⨯列联表,计算可得2K 的观测值7.556k ≈,附表:20()P K k ≥0.15 0.100.050.025 0.010 0.005 0.001 0k 2.0722.7063.8415.0246.6357.87910.828参照附表,得到的正确结论是A .有99%以上的把握认为“爱好该项运动与性别无关”B .有99%以上的把握认为“爱好该项运动与性别有关”C .在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过1%的前提下,认为“爱好该项运动与性别无关”2.两个分类变量X 和Y ,值域分别为{x 1,x 2}和{y 1,y 2},其样本频数分别是a =10,b =21,c +d =35,若X 与Y 有关系的可信程度为90%,则c =( ) A .4 B .5 C .6D .73.某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:附表:经计算2K 的观测值10k =,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响 C .有99.9%的把握认为使用智能手机对学习有影响 D .有99.9%的把握认为使用智能手机对学习无影响 4.下列命题正确的个数是:( )①对于两个分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握程度越大;②在相关关系中,若用211c x y c e =拟合时的相关指数为21R ,用2y bx a =+拟合时的相关指数为22R ,且2212R R >,则1y 的拟合效果好;③利用计算机产生0~1之间的均匀随机数a ,则事件“310a ->”发生的概率为23; ④“0,0a b >>”是“2b aa b+≥”的充分不必要条件 A .1B .2C .3D .45.给出下列说法:①用()()221211ˆni i i n i i i y y R y y ==-=--∑∑刻画回归效果,当2R 越大时,模型的拟合效果越差,反之则越好;②归纳推理是由特殊到一般的推理,而演绎推移则是由一般到特殊的推理;③综合法证明数学问题是“由因索果”,分析法证明数学问题是“执果索因”;④设有一个回归方程ˆ35yx =+,变量x 增加1个单位时,y 平均增加5个单位;⑤线性回归方程ˆˆˆy bx a =+必过点(),x y .其中错误的个数有( )A .0个B .1个C .2个D .3个6.某班主任对全班50名学生进行了作业量的调查,数据如表:若推断“学生的性别与认为作业量大有关”,则这种推断犯错误的概率不超过( )附:()()()()()22n ad bc K a b c d a c b d -=++++A .0.01B .0.025C .0.10D .0.057.某研究型学习小组调查研究学生使用智能手机对学习的影响,部分统计数据如下表:使用智能手机 不使用智能手机 总计 学习成绩优秀 4 8 12 学习成绩不优秀 16 2 18 总计201030计算得K 2=10,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响B.有99.5%的把握认为使用智能手机对学习无影响C.在犯错误的概率不超过0.1%的前提下,认为使用智能手机对学习有影响D.在犯错误的概率不超过1%的前提下,认为使用智能手机对学习无影响8.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,得到下面的列联表:现判断数学成绩与物理成绩有关系,则犯错误的概率不超过()A.0.005 B.0.01 C.0.02 D.0.059.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”,得到如下的列联表:由此表得到的正确结论是()A.在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别有关”D.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别无关”10.以下四个命题中:①在回归分析中,可用相关指数R2的值判断拟合的效果,R2越大,模型的拟合效果越好;②两个随机变量的线性相关性越强,相关系数的绝对值越接近1;③若数据x1,x2,x3,…,x n的方差为1,则2x1,2x2,2x3,…,2x n的方差为2;④对分类变量x与y的随机变量K2的观测值k来说,k越小,判断“x与y有关系”的把握程度越大.其中真命题的个数为()A.1 B.2C.3 D.411.利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅临界值表来确定推断“X与Y有关系”的可信度,如果k>5.024,那么就推断“X和Y有关系”,这种推断犯错误的概率不超过()A .0.25B .0.75C .0.025D .0.97512.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列表:由上表中数据计算得2K =()21051030204555503075⨯⨯-⨯⨯⨯⨯≈6.109,请根据下表,估计有多大把握认为“文化程度与月收入有关系”( )A .1%B .99%C .2.5%D .97.5%二、填空题13.在一次独立试验中,有200人按性别和是否色弱分类如下表(单位:人)男 女 正常 73 117 色弱73你能在犯错误的概率不超过_____的前提下认为“是否色弱与性别有关”?14.利用独立性检验考察两个分类变量X 与Y 是否有关系时,若K2的观测值k=6.132,则有__________的把握认为“X 与Y 有关系”. P(K2≥k0) 0.05 0.025 0.010 0.005 k03.8415.0246.6357.87915.已知的取值如表所示:若与呈线性相关,且回归方程为,则等于 .2 3 454616.下列4个命题:①为了了解800名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔为40;②四边形ABCD 为长方形,2AB =,1BC =,O 为AB 中点,在长方形ABCD 内随机取一点P ,取得的P 点到O 的距离大于1的概率为12π-; ③把函数3sin 23y x π⎛⎫=+⎪⎝⎭的图象向右平移6π个单位,可得到3sin 2y x =的图象; ④已知回归直线的斜率的估计值为1.23,样本点的中心为()4,5,则回归直线方程为1.230.08y x =+.其中正确的命题有__________.(填上所有正确命题的编号)17.4月16日摩拜单车进驻大连市旅顺口区,绿色出行引领时尚,旅顺口区进行了“经常使用共享单车与年龄关系”的调查,得下列22⨯列联表:年轻人 非年轻人 合计 经常使用单车用户 100 20 120 不常使用单车用户 60 20 80 合计16040200则得到的2χ=__________.(小数点后保留一位) (附:()()()()()22χ-=++++n ad bc a b c d a c b d )18.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________. 19.给出下列四个结论:(1)相关系数r 的取值范围是1r <;(2)用相关系数r 来刻画回归效果,r 的值越大,说明模型的拟合效果越差;(3)一个袋子里装有大小相同的5个白球和5个黑球,从中任取4个,则其中所含白球个数的期望是2;(4) 一个篮球运动员投篮一次得3分的概率为a ,得2分的概率为b ,不得分的概率为c ,且(),,0,1a b c ∈,已知他投篮一次得分的数学期望为2,则213a b+的最小值为163.其中正确结论的序号为______________.20.2018年春季,世界各地相继出现流感疫情,这已经成为全球性的公共卫生问题.为了考察某种流感疫苗的效果,某实验室随机抽取100只健康小鼠进行试验,得到如下列联表:感染 未感染 总计 注射 10 40 50 未注射 20 30 50 总计3070100参照附表,在犯错误的概率最多不超过____的前提下,可认为“注射疫苗”与“感染流感”有关系.(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++.) 20()P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k 2.7063.8415.0246.6357.87910.828三、解答题21.我国新型冠状病毒肺炎疫情期间,以网络购物和网上服务所代表的新兴消费展现出了强大的生命力,新兴消费将成为我国消费增长的新动能.某市为了了解本地居民在2020年2月至3月两个月网络购物消费情况,在网上随机对1000人做了问卷调查,得如表频数分布表:(1)作出这些数据的频率分布直方图,并估计本市居民此期间网络购物的消费平均值; (2)在调查问卷中有一项是填写本人年龄,为研究网购金额和网购人年龄的关系,以网购金额是否超过4000元为标准进行分层抽样,从上述1000人中抽取200人,得到如表列联表,请将表补充完整并根据列联表判断,在此期间是否有95%的把握认为网购金额与网购人年龄有关.参考公式和数据:()()()()()22n ad bcKa b c d a c b d-=++++.(其中n a b c d=+++为样本容量)22.2020年3月,因为新冠肺炎疫情的影响,我市全体学生只能在网上在线学习,为了研究学生在线学习情况,市教研院数学学科随机从市区各高中学校抽取120名学生对线上教学情况进行调查(其中,男生与女生的人数之比为3:1),结果发现:男生中有40名对于线上教学满意,女生中有10名表示对于线上教学不满意.(1)请完成如表2×2列联表,并回答能否有95%的把握认为对“线上教学是否满意与性别有关”;态度性别满意不满意合计男生女生合计120(2)采用分层抽样的方法,从被调查的对线上教学满意的学生中,抽取6名学生,再从这6名学生中抽取2名学生,作线上学习的经验介绍,求所选取的2名学生性别不同的概率.附:参考公式及临界值表()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++23.新冠肺炎疫情防控时期,各级各类学校纷纷组织师生开展了“停课不停学”活动,为了解班级线上学习情况,某位班主任老师进行了有关调查研究.(1)从班级随机选出5名同学,对比研究了线上学习前后两次数学考试成绩,如下表:参考公式:在线性回归方程y bx a=+,()()()() 1122211n ni i i ii in ni ii ix x y y x y nx ybx x x n x ====---==--∑∑∑∑,a y bx=-(2)针对全班45名同学(25名女生,20名男生)的线上学习满意度调查中,女姓满意率为80%,男生满意率为75%,填写下面列联表,判断能否在犯错误概率不超过0.01的前提下,认为线上学习满意度与学生性别有关?参考公式和数据:()()()()()2n ad bcxa b c d a c b d-=++++,()20.0500.0100.0013.8416.63510.828P x kk≥24.某足球运动员进行射门训练,若打进球门算成功,否则算失败.已知某天该球员射门成功次数与射门距离的统计数据如下:(1)请问是否有90%的把握认为该球员射门成功与射门距离是否超过30米有关?参考公式及数据:22(),()()()()n ad bc K n a b c d a b c d a c b d -==+++++++.(2)当该球员距离球门30米射门时,设射门角(射门点与球场底线中点的连线和底线所成的锐角或直角)为([0,])2πθθ∈,其射门成功率为2+3()cos sin 4f θθθθθ=+⋅-,求该球员射门成功率最高时射门角θ的值.25.某大学读书协会为了解本校大学生网上阅读与传统纸质阅读的情况,调查了该大学1000名大学生(男、女各占一半),就偏向网上阅读和偏向传统纸质阅读的情况做了调查记录.记录显示,偏向网上阅读的男大学生比偏向传统纸质阅读的男大学生多300人,这1000名大学生中,偏向传统纸质阅读的大学生共有400人. (1)根据题意,完成下列2×2列联表;(2)根据列联表,判断能否有99.9%的把握认为该大学的大学生的阅读方式与性别有关,说明你的理由.附: 22(-)()()()()n ad bc K a b c d a c b d =++++(n=a+b+c+d ).26.2016年欧洲杯将于2016年6月10日到7月10日在法国举行.为了使得赛会有序进行,欧足联在全球范围内选聘了30名志愿者(其中男性16名,女性14名).调查发现,男性中有10人会英语,女性中有6人会英语. (1)根据以上数据完成以下2×2列联表:并回答能否在犯错的概率不超过0.10的前提下认为性别与会英语有关?参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++参考数据:(2)会英语的6名女性志愿者中曾有4人在法国工作过,若从会英语的6名女性志愿者中随机抽取2人做导游,则抽出的2人都在法国工作过的概率是多少?【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据2K 的观测值7.556k ≈,对照表中数据,即可得到相应的结论. 【详解】根据2K 的观测值7.556k ≈,对照表中数据得出有0.01的几率说明这两个变量之间的关系是不可信的,即有10.0199%-=的把握说明两个变量之间有关系,故选B . 【点睛】本题主要考查独立性检验的应用,独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式计算2K 的观测值k ;(3)查表比较k 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误)2.B解析:B 【解析】【分析】根据22⨯列联表,以及独立检验随机变量的临界值参考表,计算2K 对应的值,验证24,5,6,7,c K =是否恰好满足即可【详解】列22⨯列联表可知:()22661030521 3.024 2.70615513135K ⨯⨯-⨯=≈>⨯⨯⨯,所以5c =时,X 与Y 有关系的可信程度为90%,而其余的值4,6,7c c c ===皆不满足,故选B . 【点睛】独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)3.A解析:A 【解析】 【分析】由题意结合2K 的观测值k 由独立性检验的数学思想给出正确的结论即可. 【详解】由于2K 的观测值10k =7.879>,其对应的值0.0050.5%=,据此结合独立性检验的思想可知:有99.5%的把握认为使用智能手机对学习有影响. 本题选择A 选项. 【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.4.C解析:C 【解析】分析:根据独立性检验的性质可判断①;根据回归分析的基本原理可判断②;根据几何概型概率公式可判断③; 根据不等式的性质可判断④.详解:①对于两个分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握程度越小,①错误;②在相关关系中,若用211c x y c e =拟合时的相关指数为21R ,用2y bx a =+拟合时的相关指数为22R ,且2212R R >,则1y 的拟合效果好,②正确;③利用计算机产生0~1之间的均匀随机数a ,则事件“310a ->”发生的概率为1123103-=-,正确; ④“0,0a b >>”可得到“2b a a b +≥”, “2b aa b+≥”时“0,0a b >>”不一定成立,所以“0,0a b >>”是“2b aa b+≥”的充分不必要条件,正确,即正确命题的个数是3,故选C. 点睛:本题主要通过对多个命题真假的判断,主要综合独立性检验、回归分析、几何概型概率公式、不等式的性质,属于中档题.这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.5.B解析:B 【解析】分析:①可由相关指数的概念判断;②③由推理,综合法和反证法的概念判断;④和⑤由线性回归分析判断即可.详解:①相关指数2R 越大,则相关性越强,模型的拟合效果越好.错误;② 归纳推理是由特殊到一般的推理,而演绎推理是由一般到特殊的推理,由归纳推理与演绎推理的概念可知正确.③综合法证明数学问题是“由因索果”,分析法证明数学问题是“执果索因”,由概念可知正确. ④由回归方程的系数意义知,当变量x 增加1个单位时,y 平均增加5个单位,正确;⑤线性回归方程ˆˆˆy bx a =+必过样本中心点(),x y ,正确.故选B.点睛:本题是一道综合性考题,即考查了推理与证明的原理,又考查了利用2R 判断模型拟合程度,同时还考查了线性回归分析的相关概念,属于中档题.6.B解析:B分析:根据表格中所给数据,代入公式()()()()()22n ad bcKa b c d a c b d-=++++,求出观测值,把所求的观测值同临界值进行比较,从而可得结果.详解:根据表中数据得到()22501815895.059 5.02427232426K⨯⨯-⨯=≈>⨯⨯⨯,所以,若推断“学生的性别与认为作业量大有关”,则这种推断犯错误的概率不超过0.025,故选B.点睛:本题主要考查独立性检验的应用,解题的关键是正确求出这组数据的观测值,计算过程一定要细心,避免出现计算错误,属于基础题.7.A解析:A【解析】因为7.879<K2<10.828,所以有99.5%的把握认为使用智能手机对学习有影响.故选A.8.D解析:D【解析】因为K2的观测值k=2300(371433585) 12217872228⨯-⨯⨯⨯⨯≈4.514>3.841,所以在犯错误的概率不超过0.05的前提下认为数学成绩与物理成绩有关系. 选D. 9.C解析:C【解析】由2×2列联表得到a=45,b=10,c=30,d=15.则a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100.所以K2的观测值k=2100675-30055457525⨯⨯⨯()≈3.030.因为2.706<3.030<3.841.选C.点睛:根据卡方公式求K2,再与参考数据比较,最后作出判断.10.B解析:B【解析】由题意得,若数据x1,x2,x3,…,x n的方差为1,则2x1,2x2,2x3,…,2x n的方差为4,所以③不正确;对分类变量x与y的随机变量K2的观测值k来说,k越小,判断“x与y 有关系”的把握程度越小,所以④不正确.其中①、②是正确的,故选B.11.C解析:C【解析】∵P(k>5.024)=0.025,故在犯错误的概率不超过0.025的条件下,认为“X和Y考点:独立性检验.12.D解析:D 【解析】 试题由题根据二列联表得出;2K =()21051030204555503075⨯⨯-⨯⨯⨯⨯≈6.109,对应参考值得 2 5.024K >,则有10.0250.975-=,即有97.5%的把握认为文化程度与月收入有关系。

高中数学第三章统计案例单元测评北师大版选修2-3(6页)

高中数学第三章统计案例单元测评北师大版选修2-3(6页)

高中数学第三章统计案例单元测评北师大版选修2-3(6页)文档来源为:从网络收集整理文档来源为:从网络收集整理.word版本可编辑?欢迎下载支持.PAGEPAGE #文档收集于互联网.已整理.word版本可编辑.文档来源为:从网络收集整理文档来源为:从网络收集整理.word版本可编辑?欢迎下载支持.22文档收集于互联网,已整理,word版本可编借.《统计案例》测评(时间90分钟,满分100分)一、选择题(本大题共12小题,每小题4分,共48分)下面变量之间的关系是函数关系的是扎已知二次函数y二a€+bx+c,其中a、c是已知常数,取b为自变量,因变量是这个函数的判别式A=bs-4ac光照时间和果树亩产量降雪疑和交通事故发生率每亩施用肥料呈:和粮食亩产量答案:A解析:B、C、D是相关关系,A是确雄性关系,即函数关系.设有一个回归方程为y二3-5x,变量x增加一个单位时扎y平均增加3个单位 B. y平均减少5个单位C. y平均增加5个单位D. y平均减少3个单位答案:B解析:斜率b二-5的意义是:变量x增加1个单位时,y平均增加-5个单位,即y 平均减少5个单位.若回归直线方程中的回归系数b二0时,则相关系数为扎 r=l B.r二-1 C. r=0 D.无法确定答案:C4?在一个2X2列联表中,由其数据计算得x ±13.097,则其两个变量间有关系的可能性为D.无关系99% B. 95% C.D.无关系答案:A解析:当x=>6. 635时,有99%的把握认为两个变量之间有关系.5.线性回归方程y=bx+a必过A. (0, 0)C. (0,A. (0, 0)答案:D解析:Va=y-bxt 即 y 二b X +a.回归方程y=bx+a 一定过(x , y ).6.下面是一个2X2列联表Yi先总计X1A2173X:22527总计B16则表中冬b处的值分别为A.94、96B.52、50C.52、54D. 54. 52答案:C 解析:a+21 二73=>a二52,b二52+2二54.设两个变量x和y之间具有线性相关关系,它们的样本相关系数是r, y关于x的回归直线的斜率是b,截距是a,那么必有扎b与r的符号相同 B. a与r的符号相同C. b与r的符号相反D. a与I?的符号相反答案:A工(旺―0(儿一亍)解析:由公式:b二——丈(兀一 02乞(兀-x)(yr -刃与r二[- _ 「可知分子相同,分母都大于0,故b与r同号.相关系数r的取值范围是A. -oo6. 635,、J520 x (237 x 522 -83 x 678 )=32. 52>6. 635,&#039; 915x605x320x1200所以有99$的把握认为“父母吸烟影响子女”?(本小题满分9分)两所学校的计算机算法语言学习小组统一测验成绩如下: 甲校:16, 12, 20, 15, 23, 8, 16, 19.乙校:22, 17, 26, 24, 8, 7, 25, 28.(1)求共同的中位数:16(3x3 — 5x5)2x ?—8x8x8x816(3x3 — 5x5)2x ?—8x8x8x8校别中位数以上中位数以下合计甲合计(3)两所学校的计算机算法语言学习小组的成绩有无差异?答案:解:(1)将两组数据合在一起,从小到大的排列,寻找共同的中位数,由于n:+n:=8+8=16, 则第8与第9个位置上的数据之平均数即为共同的中位数,共同中位数为18.(2)校别中位数以上中位数以下合计甲358乙538合计SS16(3)二 1W2. 706,两所学校的汁算机算法语言成绩无显著差异.20.(本小题满分10分)如下表所示,某地区一段时间内观察到的大于或等于某震级x的地農次数N.试建立回归方程表述二者之间的关系.箴级3.23.43.63. 84地震数 28 381 20 380 11 795 10 695 7 641 5 502箴级4.24.41.64.85.05.2地震数 3 812 2 698 1 919 1 356 973746箴级5.45.666.26.4地箴数60443527420614898箴级6.66.87地震数571125答案:解:散点图如图可以发现,散点图分布在一条指数函数y=menx |B|线周【亂令z=lny,则表格中的数据变为震级X33.23.43.63.8z=lny10. 25359. 602 0 9. 277 5 8. 941 3震级X44.24.44.64.8z=lny8.612 9 8. 253 7 1.997 2 7. 559 6 7.212 3震级X55.25.45.65.8z 二 lny 6. 880 4 6. 611 7 6. 403 6 6. 075 3 5.613 1震级X66.26.46. 66.8z 二 lny5. 327 94. 997 24. 585 04. 043 13.713 6震级X7z 二 lny3. 218 9作散点图利用信息技术得:z=-1.705 lx+15. 43. y=e。

高中数学 第三章 统计案例单元测评 北师大版选修23

高中数学 第三章 统计案例单元测评 北师大版选修23

《统计案例》测评(时间90分钟,满分100分)一、选择题(本大题共12小题,每小题4分,共48分) 1.下面变量之间的关系是函数关系的是A.已知二次函数y=ax 2+bx+c ,其中a 、c 是已知常数,取b 为自变量,因变量是这个函数的判别式Δ=b 2-4acB.光照时间和果树亩产量C.降雪量和交通事故发生率D.每亩施用肥料量和粮食亩产量答案:A 解析:B 、C 、D 是相关关系,A 是确定性关系,即函数关系. 2.设有一个回归方程为y=3-5x ,变量x 增加一个单位时A.y 平均增加3个单位B.y 平均减少5个单位C.y 平均增加5个单位D.y 平均减少3个单位答案:B 解析:斜率b=-5的意义是:变量x 增加1个单位时,y 平均增加-5个单位,即y 平均减少5个单位.3.若回归直线方程中的回归系数b=0时,则相关系数为A.r=1B.r=-1C.r=0D.无法确定答案:C解析:当b=0时,即∑∑==--ni ini iixn xy x n yx 1221=⇒∑=ni ii yx 1-n x y =0,∴r=∑∑∑===---ni i ni i ni iiyn y xn x yx n yx 1221221=0.4.在一个2×2列联表中,由其数据计算得χ2=13.097,则其两个变量间有关系的可能性为 A.99% B.95% C.90% D.无关系答案:A 解析:当χ2>6.635时,有99%的把握认为两个变量之间有关系. 5.线性回归方程y=bx+a 必过A.(0,0)B.(x ,0)C.(0,y )D.(x ,y )答案:D 解析:∵a=y -b x , 即y =b x +a.∴回归方程y=bx+a 一定过(x ,y ).6.下面是一个2×2列联表A.94、96B.52、50C.52、54D.54、52 答案:C 解析:a+21=73⇒a=52, b=52+2=54.7.设两个变量x 和y 之间具有线性相关关系,它们的样本相关系数是r ,y 关于x 的回归直线的斜率是b ,截距是a ,那么必有A.b 与r 的符号相同B.a 与r 的符号相同C.b 与r 的符号相反D.a 与r 的符号相反 答案:A解析:由公式:b=∑∑==---ni ini i ix xy y x x121)())((与r=∑∑∑===----ni ini ini i iy yx xy y x x12121)()())((可知分子相同,分母都大于0,故b 与r 同号.8.相关系数r 的取值范围是A.-∞<r <+∞B.-1≤r≤1C.-1<r <1D.0≤r≤1 答案:B 解析:由|r|≤1知-1≤r≤1.9.相关系数的绝对值接近1时,说明两变量相关关系的密切程度是A.不相关B.微弱相关C.高度相关D.不确定 答案:C 解析:|r|越大,两个变量的相关关系越密切. 10.现象之间相互依存关系的程度越低,则相关系数A.越接近于0B.越接近于-1C.越接近于1D.越接近于0.5 答案:A解析:|r|越小,两个变量间的相互依存程度越低. 11.r 值越接近于-1,表明两变量间A.无相关关系B.线性相关关系越弱C.负相关关系越强D.负相关关系越弱 答案:C解析:r <0两变量间负相关,|r|越接近1,两变量间的相关关系越强. 12.下列现象的相关密切程度最高的是A.某商店的职工人数与商品销售额之间的相关系数为0.87B.流通费用率与商业利润率之间的相关系数为-0.94C.商品销售额与商业利润率之间的相关系数为0.51D.商品销售额与流通费用率之间的相关系数为-0.81 答案:B 解析:|r|越接近1,相关密切程度越高.二、填空题(本大题共4小题,每小题4分,共16分)13.某化工厂为预测某产品的回收率y,需要研究它和原料有效成分含量之间的相关关系.现取了8对观测值,计算得∑=81i ix=52,∑=81i iy=228,∑=81i ix2=478,∑=81i ixy i =1 849,则y 对x 的线性回归方程是______________.解析:b=∑∑==--ni ini iixn xyx n yx 1221≈2.621 4,a=y -b x ≈11.46,∴回归方程为y=11.46+2.62x. 答案:y=11.46+2.62xX 100 120 140 160 180 Y4554627592那么变量Y 关于X 的线性回归方程是__________________. 解析:由线性回归参数公式可得:b=0.575,a=-14.9. ∴回归方程为y=0.575x-14.9. 答案:y=0.575x-14.9. 15.若施化肥量x kg 与水稻产量y kg 之间的线性回归方程为y=5x+250,则当施化肥量为80 kg 时,预计水稻产量为__________________.解析:将x=80代入回归方程,得y=650 (kg ). 答案:650 kg16.在检验吸烟与患肺癌是否有关系时,利用独立性检验求得χ2的观测值约56.632,且P(χ2≥6.635)≈0.1,据此,我们可得到“吸烟与患肺癌的关系”的结论是________________.答案:我们有99%的把握认为“吸烟与患肺癌有关系”. 三、解答题(本大题共4小题,共36分)中国 韩国 瑞士 俄罗斯 法国 以色列 加拿大 英国 美国 德国 授课天数 251 222 207 210 174 215 188 192 180 191 分数80737170646362615546试作出该数据的散点图并由图判断是否存在回归直线,若存在,求出直线方程. 答案:解:散点图略. 因为x =203,∑=ni ix12=416 824,y=64.5,∑=ni ii yx 1=132 418,所以b=2203104168245.6420310132418⨯-⨯⨯-≈0.313 3,a=64.5-0.313 3×203=0.900 1,∴回归直线方程是y=0.313 3x+0.900 1. 18.(本小题满分9分)为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:答案:解:由列联表中的数据得到χ2=1200320605915)67883522237(15202⨯⨯⨯⨯-⨯⨯≈32.52>6.635,所以有99%的把握认为“父母吸烟影响子女”.19.(本小题满分9分)两所学校的计算机算法语言学习小组统一测验成绩如下: 甲校:16,12,20,15,23,8,16,19. 乙校:22,17,26,24,8,7,25,28. (1)求共同的中位数;(3)两所学校的计算机算法语言学习小组的成绩有无差异? 答案:解:(1)将两组数据合在一起,从小到大的排列,寻找共同的中位数,由于n 1+n 2=8+8=16,则第8与第9个位置上的数据之平均数即为共同的中位数,共同中位数为18.(3)χ2=8888)5533(162⨯⨯⨯⨯-⨯=1≤2.706,∴两所学校的计算机算法语言成绩无显著差异.20.(本小题满分10分)如下表所示,某地区一段时间内观察到的大于或等于某震级x 的地地震数604 435 274 206 148 98 震级 6.6 6.8 7地震数57 41 25答案:解:散点图如图可以发现,散点图分布在一条指数函数y=me nx曲线周围,令z=lny,则表格中的数据变为震级x 3 3.2 3.4 3.6 3.8 z=lny 10.2535 9.922 3 9.602 0 9.277 5 8.941 3 震级x 4 4.2 4.4 4.6 4.8 z=lny 8.612 9 8.253 7 4.997 2 7.559 6 7.212 3 震级x 5 5.2 5.4 5.6 5.8 z=lny 6.880 4 6.614 7 6.403 6 6.075 3 5.613 1 震级x 6 6.2 6.4 6.6 6.8 z=lny 5.327 9 4.997 2 4.585 0 4.043 1 3.713 6 震级x 7z=lny 3.218 9利用信息技术得:z=-1.705 1x+15.43.∴y=e-1.705 1x+15.43.。

新北师大版高中数学高中数学选修2-3第三章《统计案例》检测卷(有答案解析)(3)

新北师大版高中数学高中数学选修2-3第三章《统计案例》检测卷(有答案解析)(3)

一、选择题1.某商场为了了解不同厂家生产的散装面包的月销售量y (千克)与售价x (元/千克)之间的关系,随机统计了某几个月的月销售量与当月各散装面包的售价,相关数据如下表:由表中数据算出线性回归方程为 3.1ˆˆyx a =-+,则样本在()18180,处的残差为( ) A .0B .1.4C .2D .2.12.下列说法中错误的是( )A .先把高二年级的2000名学生编号:1到2000,再从编号为1到50的学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +,100m +,150m +,……的学生,这种抽样方法是系统抽样法.B .一组数据的方差为2s ,平均数为x ,将这组数据的每一个数都乘以2,所得的一组新数据的方差和平均数为24s ,2x .C .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1.D .若一组数据1,a ,3的平均数是2,则该组数据的方差是23. 3.利用独立性检验的方法调查大学生的性别与爱好某项运动是否有关,通过随机询问400名不同的大学生是否爱好某项运动,利用22⨯列联表,计算可得2K 的观测值7.556k ≈,附表:参照附表,得到的正确结论是A .有99%以上的把握认为“爱好该项运动与性别无关”B .有99%以上的把握认为“爱好该项运动与性别有关”C .在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过1%的前提下,认为“爱好该项运动与性别无关”4.为了解高中生对电视台某节目的态度,在某中学随机调查了110名学生,根据得到的联表算得2K 的观测值 5.278k ≈. 附表:参照附表,得到的正确结论是 ( )A .在犯错误的概率不超过1%的前提下,认为“喜欢该节目与性别有关”B .在犯错误的概率不超过1%的前提下,认为“喜欢该节目与性别无关”C .有97.5%以上的把握认为“喜欢该节目与性别有关”D .有97.5%以上的把握认为“喜欢该节目与性别无关”5.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是A .10200ˆyx =-+ B .10200ˆyx =+ C .10200ˆyx =-- D .10200ˆyx =- 6.两个分类变量X 和Y ,值域分别为{x 1,x 2}和{y 1,y 2},其样本频数分别是a =10,b =21,c +d =35,若X 与Y 有关系的可信程度为90%,则c =( ) A .4 B .5 C .6D .77.设导弹发射的事故率为0.01,若发射10次,其出事故的次数为ξ,则下列结论正确的是 ( ) A .0.1E ξ=B .•01D ξ=C .10()0.01?0.99k k P k ξ-==D .1010()0.99?0.01kkkP k C ξ-==8.某市政府调查市民收入与旅游欲望时,采用独立性检验法抽取3 000人,计算发现k 2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游欲望有关系的把握是( )A .90%B .95%C .97.5%D .99.5%9.某班主任对全班50名学生进行了作业量的调查,数据如下表:合计 26 24 50若推断“学生的性别与认为作业量大有关”,则这种推断犯错误的概率不超过( )附:()()()()()22n ad bc K a b c d a c b d -=++++ P(K 2>k 0) 0.15 0.10 0.05 0.025 0.01 0.001 k 02.0722.7063.8415.0246.63510.828A .0.01B .0.025C .0.10D .0.0510.如表为某公司员工工作年限x (年)与平均月薪y (千元)对照表.已知y 关于x 的线性回归方程为0.70.35y x =+,则下列结论错误的是( ) x 3 4 5 6 y2.5t44.5A .回归直线一定过点(4.5,3.5)B .工作年限与平均月薪呈正相关C .t 的取值是3.5D .工作年限每增加1年,工资平均提高700元11.下列命题中:①线性回归方程y bx a =+必过点(),x y ;②在回归方程35y x =-中,当变量增加一个单位时,y 平均增加5个单位; ③在回归分析中,相关指数2R 为0.80的模型比相关指数2R 为0.98的模型拟合的效果要好;④在回归直线0.58ˆyx =-中,变量2x =时,变量y 的值一定是-7. 其中假命题的个数是 ( ) A .1B .2C .3D .412.下列说法:①将一组数据中的每个数据都乘以同一个非零常数a 后,标准差也变为原来的a 倍; ②设有一个回归方程35y x =-,变量x 增加1个单位时,y 平均减少5个单位; ③线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;④在某项测量中,测量结果ξ服从正态分布()()21,0N σσ>,若ξ位于区域()0,1的概率为0.4,则ξ位于区域()1,+∞内的概率为0.6⑤利用统计量2χ来判断“两个事件,X Y 的关系”时,算出的2χ值越大,判断“X 与Y 有关”的把握就越大其中正确的个数是 A .1B .2C .3D .4二、填空题13.如图所示是世界20个地区受教育程度的人口百分比与人均收入的散点图,样本点基本集中在一个条型区域,因此两个变量呈线性相关关系.利用散点图中的数据建立的回归方程为ˆ 3.19388.193yx =+,若受教育的人口百分比相差10%,则其人均收入相差_________.14.对相关系数r ,①r 越大,线性相关程度越大; ②r 越小,线性相关程度越大;③|r|越大,线性相关程度越小,|r|越接近0,线性相关程度越大; ④|r|≤1且|r|越接近1,线性相关程度越大,|r|越接近0,线性相关程度越小 以上说法中,正确说法的序号是__________.15.如果根据性别与是否爱好运动的列联表得到K 2≈3.852>3.841,则判断性别与是否爱好运动有关,那么这种判断犯错的可能性不超过________. 16.某班主任对全班50名学生作了一次调查,所得数据如表:认为作业多认为作业不多总计喜欢玩电脑游戏18927不喜欢玩电脑游戏81523总计262450由表中数据计算得到K 2的观测值k≈5.059,于是________(填“能”或“不能”)在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.17.已知方程是根据女大学生的身高预报她的体重的回归方程,其中x的单位是cm ,的单位是kg ,那么针对某个体(160,53)的残差是________.18.下列命题中,正确的命题有__________.①回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,且至少过一个样本点;②将一组数据的每个数据都加一个相同的常数后,方差不变;③用相关指数2R 来刻面回归效果;表示预报变量对解释变量变化的贡献率,越接近于1,说明模型的拟合效果越好;④若分类变量X 和Y 的随机变量2K 的观测值K 越大,则“X 与Y 相关”的可信程度越小;⑤.对于自变量x 和因变量y ,当x 取值一定时,y 的取值具有一定的随机性,x ,y 间的这种非确定关系叫做函数关系;⑥.残差图中残差点比较均匀的地落在水平的带状区域中,说明选用的模型比较合适; ⑦.两个模型中残差平方和越小的模型拟合的效果越好. 19.给出下列四个结论:(1)相关系数r 的取值范围是1r <;(2)用相关系数r 来刻画回归效果,r 的值越大,说明模型的拟合效果越差;(3)一个袋子里装有大小相同的5个白球和5个黑球,从中任取4个,则其中所含白球个数的期望是2;(4) 一个篮球运动员投篮一次得3分的概率为a ,得2分的概率为b ,不得分的概率为c ,且(),,0,1a b c ∈,已知他投篮一次得分的数学期望为2,则213a b+的最小值为163.其中正确结论的序号为______________.20.2018年春季,世界各地相继出现流感疫情,这已经成为全球性的公共卫生问题.为了考察某种流感疫苗的效果,某实验室随机抽取100只健康小鼠进行试验,得到如下列联表:感染 未感染 总计 注射 10 40 50 未注射 20 30 50 总计3070100关系.(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++.) 20()P K k ≥ 0.100.05 0.025 0.010 0.005 0.001三、解答题21.某共享单车经营企业欲向甲巿投放单车,为制定适宜的经营策略﹐该企业首先在已投放单车的乙市进行单车使用情况调查.调查过程分随机问卷﹑整理分析及开座谈会三个阶段.在随机问卷阶段,A ,B 两个调查小组分赴全市不同区域发放问卷并及时收回﹔在整理分析阶段,两个调查小组从所获取的有效问卷中,针对15岁至45岁的人群,按比例随机抽取了300份,进行了数据统计,具体情况如下表:参考公式:()()()()()2n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:样本,再用分层抽样的方法将“年龄达到35岁”的被抽个体数分配到“经常使用单车”和“偶尔使用单车”中去.①求这60人中“年龄达到35岁且偶尔使用单车”的人数﹔②为听取对发展共享单车的建议,调查组专门组织所抽取的"年龄达到35岁且偶尔使用单车的人员召开座谈会,会后共有3份礼品赠送给其中3人,每人1份(其余人员仅赠送骑行优惠券).已知参加座谈会的人员中有且只有4人来自A 组,求A 组这4人中得到礼品的人数X 的分布列和数学期望;(2)从统计数据可直观得出“是否经常使用共享单车与年龄有关”的结论.在用独立性检验的方法说明该结论成立时,为使犯错误的概率尽可能小,当年龄设定为25岁时,根据已有数据,完成下列2×2列联表(单位:人),并判断是否在犯错误的概率不超过1%的前提下有把握认为“经常使用共享单车与年龄有关”?22.为考察某种药物预防禽流感的效果,进行动物家禽试验,调查了100个样本,统计结果为:服用药的共有60个样本,服用药但患病的仍有20个样本,没有服用药且未患病的有20个样本.(1)根据所给样本数据画出22⨯列联表;(2)请问能有多大把握认为药物有效?附公式:()()()()()22=n ad bc K a b c d a c b d -++++.23.新高考,取消文理科,实行“33+”,成绩由语文、数学、外语统一高考 成绩和自主选考的3门普通高中学业水平考试等级性考试科目成绩构成.为了解各年龄层对新高考的了解情况,随机调查50人(把年龄在[)15,45称为中青年,年龄在[)45,75称为中老年),并把调查结果制成下表:(1)分别估计中青年和中老年对新高考了解的概率;(2)请根据上表完成下面22⨯列联表,是否有95%的把握判断对新高考的了解与年龄(中青年、中老年)有关?附:()()()()()22n ad bcKa b c d a c b d-=++++.24.十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的政策要求,带领广大农村地区人民群众脱贫奔小康,经过不懈的努力奋斗拼搏,新农村建设取得了巨大进步,农民年收入也逐年增加.为了实现2020年脱贫的工作计划,该地扶贫办随机收集了以下50位农民的统计数据,以此研究脱贫攻坚的效果是否与农民的受教育的发展状况有关:(1)根据列联表运用独立性检验的思想方法分析:能否有99%的把握认为“脱贫攻坚的效果与农民的受教育的发展状况有关”,并说明理由;(2)现用分层抽样的方法在全部受过教育的农民中随机抽取5位农民作为代表,再从这5位农民代表中任选2位继续调查,求这2位农民代表中至少有1位脱贫攻坚效果明显的概率.参考附表:参考公式:()()()()()22n ad bcKa b a c b d c d+=++++,其中n a b c d=+++.25.新冠状病毒严重威胁着人们的身体健康,我国某医疗机构为了调查新冠状病毒对我国公民的感染程度,选了某小区的100位居民调查结果统计如下:(1)根据已知数据,把表格数据填写完整;(2)能否在犯错误的概率不超过5%的前提下认为感染新冠状病与不同年龄有关?(3)已知在被调查的年龄大于50岁的感染者中有5名女性,其中2位是女教师,现从这5名女性中随机抽取3人,求至多有1位教师的概率.附:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++.26.电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取100名观众进行调查,将日均收看体育节目时间不低于40分钟的观众称为“体育迷”,数据统计如下表:(1)是否有99%的把握认为“体育迷”与性别有关?(2)该体育类节目为了提升收视率,规定“体育迷”每天奖励积分2分,“非体育迷”每天奖励积分1分,积分累计一定数量可以用积分换购自己喜爱的物品.用表中的样本频率作为概率的估计值.某日3名观众来领取积分,记此3人当日的积分总和为随机变量ξ,求ξ的分布列和数学期望.附:()()()()()22n ad bc a b c d a c b d χ-=++++,其中n a b c d =+++.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据表中的数据求出(),x y ,利用回归直线方程经过样本中心点(),x y 求出ˆa ,把18x = 代入回归直线方程求出ˆy,利用残差的定义ˆy y -即可求解. 【详解】由表格得(),x y 为()24,160 ,又回归直线方程 3.1ˆˆyx a =-+经过样本中心点(),x y , 所以160 3.124ˆa=-⨯+,解得ˆ234.4a =, 所以回归直线方程为 3.123.4ˆ4yx =-+, 把18x = 代入回归直线方程可得,ˆ178.6y=, 故样本在()18180, 处的残差为180178.6 1.4-=. 故选:B 【点睛】本题考查回归直线方程经过样本中心点和利用回归直线方程求某点处的残差;考查运算求解能力;熟练掌握回归直线方程经过样本中心点和残差的定义是求解本题的关键;属于中档题.2.C解析:C 【分析】根据题意,对选项中的命题进行分析,判断真假性即可. 【详解】对于A ,根据抽样方法特征是数据多,抽样间隔相等,是系统抽样,所以A 正确; 对于B ,一组数据的方差为2s ,平均数为x ,将这组数据的每一个数都乘以2,所得的一组新数据的方差和平均数为24s ,2x ,所以B 正确;对于C ,两个随机变量的线性相关性越强,则相关系数||r 的值越接近于1,所以C 错误;对于D ,一组数据1、a 、3的平均数是2,所以2a =;所以该组数据的方差是222212[(12)(22)(32)]33s =⨯-+-+-=,所以D 正确.故选:C . 【点睛】本题主要考查抽样和统计,考查方差和平均数的计算,考查两个随机变量的相关性,意在考查学生对这些知识的理解掌握水平3.B解析:B 【分析】根据2K 的观测值7.556k ≈,对照表中数据,即可得到相应的结论. 【详解】根据2K 的观测值7.556k ≈,对照表中数据得出有0.01的几率说明这两个变量之间的关系是不可信的,即有10.0199%-=的把握说明两个变量之间有关系,故选B . 【点睛】本题主要考查独立性检验的应用,独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式计算2K 的观测值k ;(3)查表比较k 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误)4.C解析:C 【分析】因为5.278 6.635<,根据附表中的数据,即可得到判断的结论,得到答案. 【详解】因为5.278 6.635<,所以不能在犯错误的概率不超过1%的前提下,认为“喜欢该节目与性别有关”;又5.278 5.024>,所以有97.5%以上的把握认为“喜欢该节目与性别有关”,故选C . 【点睛】本题主要考查独立性检验的应用,独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式计算2K 的观测值k ;(3)查表比较k 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误)5.A解析:A 【解析】试题分析:因为商品销售量x 与销售价格ˆy负相关,所以排除B ,D 选项, 将0x =代入10200ˆyx =--可得2000ˆy =-<,不符合实际.故A 正确. 考点:线性回归方程.【方法点睛】本题主要考查线性回归方程,属容易题.线性回归方程ˆˆˆy bx a =+当ˆ0b<时ˆ,x y 负相关;当ˆ0b >时ˆ,x y 正相关. 6.B解析:B 【解析】 【分析】根据22⨯列联表,以及独立检验随机变量的临界值参考表,计算2K 对应的值,验证24,5,6,7,c K =是否恰好满足即可【详解】列22⨯列联表可知:()22661030521 3.024 2.70615513135K ⨯⨯-⨯=≈>⨯⨯⨯,所以5c =时,X 与Y 有关系的可信程度为90%,而其余的值4,6,7c c c ===皆不满足,故选B . 【点睛】独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)7.A解析:A【解析】【分析】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,实验的结果只有发生和不发生两种结果,故本题符合独立重复试验,由独立重复试验的期望公式得到结果.【详解】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,故本题符合独立重复试验,即ξ~(10,0.01)B.∴100.010.1Eξ=⨯=故选A.【点睛】解决离散型随机变量分布列和期望问题时,主要依据概率的有关概念和运算,同时还要注意题目中离散型随机变量服从什么分布,若服从特殊的分布则运算要简单的多.8.C解析:C【详解】∵2 6.023 5.024K=>∴可断言市民收入增减与旅游欲望有关的把握为97.5%.故选C.点睛:本题主要考查独立性检验的实际应用.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式22()()()()()n ad bcKa b c d a c b d-=++++,计算出2K的值;(3)查表比较2K与临界值的大小关系,作统计判断.9.B解析:B【解析】K2=≈5.059>5.024,因为P(K2>5.024)=0.025,所以这种推断犯错误的概率不超过0.025.选B10.C解析:C【解析】由已知中的数据可得:34564.54x+++==,2.54 4.51144t ty++++==,∵数据中心点(),x y 一定在回归直线上,∴110.7 4.50.354t+=⨯+解得3t =,故C 错误;故11 3.54t+=, 回归直线一定过点(4.53.5,),ABD 正确;故选C . 11.C解析:C 【解析】对于①,线性回归方程 ˆˆˆybx a =+必过点)x y (,,满足回归直线的性质,所以①正确;对于②,在回归方程ˆ35y x =-中,当变量x 增加一个单位时,y 平均减少5个单位,不是增加5个单位;所以②不正确;对于③,在回归分析中,相关指数2R 为0.80的模型比相关指数2R 为0.98的模型拟合的效果要好,该判断恰好相反;所以③不正确;对于④,在回归直线0.58ˆy x =-中,变量2x =时,变量y 的值一定是-7.不是一定为7,而是可能是7,也可能在7附近,所以④不正确;故选C.12.B解析:B 【解析】逐一考查所给的说法:①将一组数据中的每个数据都乘以同一个非零常数a 倍,原说法错误;②设有一个回归方程35y x =-,变量x 增加1个单位时,y 平均减少5个单位,原说法正确;③线性相关系数r 的绝对值越大,两个变量的线性相关性越强;反之,线性相关性越弱,原说法错误;④在某项测量中,测量结果ξ服从正态分布()()21,0N σσ>,若ξ位于区域()0,1的概率为0.4,则ξ位于区域()1,+∞内的概率为0.5,原说法错误;⑤利用统计量2χ来判断“两个事件,X Y 的关系”时,算出的2χ值越大,判断“X 与Y 有关”的把握就越大,原说法正确. 本题选择B 选项.二、填空题13.93美元【分析】设所受教育百分比分别为且利用回归方程计算即可【详解】设所受教育百分比分别为且根据回归方程为收入相差大约为:即受教育的人口百分比相差则其人均收入相差约美元故答案为:3193美元【点睛】解析:93美元 【分析】设所受教育百分比分别为%,%a b ,且10a b -=,利用回归方程计算即可. 【详解】设所受教育百分比分别为%,%a b ,且10a b -= 根据回归方程为 3.19388.193y x ∧=+, 收入相差大约为:()3.19388.193 3.19388.193 3.1931031.93a b ⨯+-⨯+=⨯=,即受教育的人口百分比相差10%,则其人均收入相差约31.93美元. 故答案为:31.93美元. 【点睛】本题考查了线性回归方程的应用问题,属于中档题.14.④【解析】两个变量之间的相关系数r 的绝对值越接近于1表示两个变量的线性相关性越强r 的绝对值非常接近于0时表示两个变量之间几乎不存在线性相关故答案为④解析:④ 【解析】两个变量之间的相关系数,r 的绝对值越接近于1,表示两个变量的线性相关性越强,r 的绝对值非常接近于0时,表示两个变量之间几乎不存在线性相关.故答案为④.15.【解析】∵P(K2≥3841)≈005∴判断性别与是否爱好运动有关出错的可能性不超过5点睛:根据卡方公式计算再与参考数据比较就可确定可能性 解析:5%【解析】∵P (K 2≥3.841)≈0.05.∴判断性别与是否爱好运动有关,出错的可能性不超过5%. 点睛:根据卡方公式计算2K ,再与参考数据比较,就可确定可能性.16.不能【解析】查表知若要在犯错误的概率不超过001的前提下认为喜欢玩电脑游戏与认为作业多有关则临界值k0=6635本题中k≈5059<6635所以不能在犯错误的概率不超过001的前提下认为喜欢玩电脑游解析:不能 【解析】查表知若要在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关,则临界值k 0=6.635.本题中,k≈5.059<6.635,所以不能在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关. 考点:独立性检验.17.【解析】将x =160代入得所以残差考点:线性回归方程残差 解析:【解析】将x =160代入,得,所以残差考点:线性回归方程,残差.18.②⑥⑦【解析】①回归直线恒过样本点的中心可以不过任何一个样本点;②将一组数据中的每个数据都加上同一个常数后根据方差公式可知方差恒不变;③用相关指数来刻面回归效果;表示预报变量对解释变量变化的贡献率越解析:②⑥⑦ 【解析】①回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,可以不过任何一个样本点;②将一组数据中的每个数据都加上同一个常数后,根据方差公式可知方差恒不变; ③用相关指数2R 来刻面回归效果;表示预报变量对解释变量变化的贡献率,越接近于0,说明模型的拟合效果越好;④若分类变量X 和Y 的随机变量2K 的观测值K 越大,则“X 与Y 相关”的可信程度越大;⑤.对于自变量x 和因变量y ,当x 取值一定时,y 的取值具有一定的随机性,x ,y 间的这种非确定关系叫做相关关系;⑥.残差图中残差点比较均匀的地落在水平的带状区域中,说明选用的模型比较合适; ⑦.两个模型中残差平方和越小的模型拟合的效果越好. 故答案为:②⑥⑦19.(3)(4)【解析】分析:(1)相关系数的范围;(2)由相关指数r 的含有知|r|的值越大说明模型的拟合效果越好;(3)离散型随机变量的期望;(4)根据期望公式得到3a+2b=2进而利用均值不等式求最解析:(3)(4) 【解析】分析:(1)相关系数的范围;(2)由相关指数r 的含有知,|r|的值越大,说明模型的拟合效果越好;(3)离散型随机变量的期望;(4)根据期望公式得到3a+2b=2,进而利用均值不等式求最值.详解:(1)相关系数r 的取值范围是1r ≤,故(1)错误;(2)用相关指数r 来刻画回归效果,|r|的值越大,说明模型的拟合效果越好,故(2)错误;(3)含零个白球的概率为5210,含一个白球的概率为50210,含二个白球的概率为100210,含三个白球的概率为50210,含四个白球的概率为5210,白球个数的期望为:550100505012342210210210210210⨯+⨯+⨯+⨯+⨯=,故(3)正确;(4)∵3a+2b+0•c=2,a ,b ,c ∈(0,1),∴213a b +=(213a b +)•12(3a+2b )=12(6+4b a +a b +23)≥12(203 =12(203+4)=163(当且仅当a=2b ,即a=12,b=14时取“=”),故(4)正确. 其中正确结论的序号为:(3)(4). 故答案为(3)(4).点睛:本题考查相关系数的有关概念,考查离散型随机变量的期望及概率统计与基本不等式的综合应用,属于中档题.20.05【详解】分析:直接利用独立性检验公式计算即得解详解:由题得所以犯错误的概率最多不超过005的前提下可认为注射疫苗与感染流感有关系故答案为005点睛:本题主要考查独立性检验和的计算意在考查学生对这解析:05 【详解】分析:直接利用独立性检验2K 公式计算即得解.详解:由题得22100(10302040)100 4.762 3.8413070505021K ⨯-⨯==≈>⨯⨯⨯,所以犯错误的概率最多不超过0.05的前提下,可认为“注射疫苗”与“感染流感”有关系. 故答案为0.05.点睛:本题主要考查独立性检验和2K 的计算,意在考查学生对这些知识的掌握水平和解决实际问题的能力.三、解答题21.(1)① 9人;②分布列答案见解析,数学期望:43;(2)列联表答案见解析,在犯错误的概率不超过1%的前提下没有把握认为“经常使用共享单车与年龄有关”. 【分析】(1)利用分层抽样,按比例计算这60人中“年龄达到35岁且偶尔使用单车”的人数﹔直接分析X 服从超几何分布,求概率,写出分布列,求出数学期望;(2)根据题意,25m =填写2×2列联表,套公式计算 3.063K ≈,对应参考值下结论. 【详解】解:(1)①从300人中抽取60人,其中“年龄达到35岁”的有1006020300⨯=人, 再将这20人用分层抽样法按"是否经常使用单车"进行名额划分,其中“年龄达到35岁且偶尔使用单车”的人数为45209100⨯=. ②A 组这4人中得到礼品的人数X 的可能取值为0,1,2,3,相应概率为:()35395042C P X C ===,()12453910121C C P X C ===, ()214539C C 52C 14P X ===,()3439C 13C 21P X ===.故其分布列为∴数学期望()0123422114213E X =⨯+⨯+⨯+⨯= (2)25m =时,按“年龄是否达到25岁”对数据进行整理,得到如下列联表()2300678711333300210049 3.06320010018012020010018012016K ⨯⨯-⨯⨯===≈⨯⨯⨯⨯⨯⨯ ∴3.063 6.635<所以在犯错误的概率不超过1%的前提下没有把握认为“经常使用共享单车与年龄有关”. 【点睛】(1) 求离散型随机变量的分布列时,要特别注意. 随机变量是否服从二项分布、超几何分布等特殊的分布;(2)独立性检验的题目直接根据题意完成完成2×2列联表,直接套公式求出K ,对照参数下结论,一般较易.22.(1)列联表见解析;(2)大概有90%把握认为药物有效. 【分析】(1)根据服用药的共有60个样本,服用药但患病的仍有20个样本,没有服用药且未患病的有20个样本,根据各种数据,列好表格,填好数据,得到列联表.(2)根据列联表数据,代入临界值公式,做出观测值,进行比较,即可得出结果. 【详解】(1)根据服用药的共有60个样本,服用药但患病的仍有20个样本,没有服用药且未患病的有20个样本,得到列联表。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《统计案例》测评
(时间90分钟,满分100分)
一、选择题(本大题共12小题,每小题4分,共48分) 1.下面变量之间的关系是函数关系的是
A.已知二次函数y=ax 2
+bx+c ,其中a 、c 是已知常数,取b 为自变量,因变量是这个函数的
判别式Δ=b 2
-4ac
B.光照时间和果树亩产量
C.降雪量和交通事故发生率
D.每亩施用肥料量和粮食亩产量
答案:A 解析:B 、C 、D 是相关关系,A 是确定性关系,即函数关系. 2.设有一个回归方程为y=3-5x ,变量x 增加一个单位时
A.y 平均增加3个单位
B.y 平均减少5个单位
C.y 平均增加5个单位
D.y 平均减少3个单位
答案:B 解析:斜率b=-5的意义是:变量x 增加1个单位时,y 平均增加-5个单位,即y 平均减少5个单位.
3.若回归直线方程中的回归系数b=0时,则相关系数为
A.r=1
B.r=-1
C.r=0
D.无法确定
答案:C
解析:当b=0时,即
∑∑==--n
i i
n
i i
i
x
n x
y x n y
x 1
2
21=⇒
∑=n
i i
i y
x 1
-n x y =0,
∴r=
∑∑∑===---n
i i n
i i n
i i
i
y
n y x
n x y
x n y
x 1
2
2
1
2
2
1
=0.
4.在一个2×2列联表中,由其数据计算得χ2
=13.097,则其两个变量间有关系的可能性为 A.99% B.95% C.90% D.无关系
答案:A 解析:当χ2
>6.635时,有99%的把握认为两个变量之间有关系. 5.线性回归方程y=bx+a 必过
A.(0,0)
B.(x ,0)
C.(0,y )
D.(x ,y )
答案:D 解析:∵a=y -b x , 即y =b x +a.
∴回归方程y=bx+a 一定过(x ,y ).
6.下面是一个2×2列联表
A.94、96
B.52、50
C.52、54
D.54、52 答案:C 解析:a+21=73⇒a=52, b=52+2=54.
7.设两个变量x 和y 之间具有线性相关关系,它们的样本相关系数是r ,y 关于x 的回归直线的斜率是b ,截距是a ,那么必有
A.b 与r 的符号相同
B.a 与r 的符号相同
C.b 与r 的符号相反
D.a 与r 的符号相反 答案:A
解析:由公式:b=
∑∑==---n
i i
n
i i i
x x
y y x x
1
2
1
)()
)((
与r=
∑∑∑===----n
i i
n
i i
n
i i i
y y
x x
y y x x
1
2
1
2
1
)()()
)((可知分子相同,分母都大于0,故b 与r 同号.
8.相关系数r 的取值范围是
A.-∞<r <+∞
B.-1≤r≤1
C.-1<r <1
D.0≤r≤1 答案:B 解析:由|r|≤1知-1≤r≤1.
9.相关系数的绝对值接近1时,说明两变量相关关系的密切程度是
A.不相关
B.微弱相关
C.高度相关
D.不确定 答案:C 解析:|r|越大,两个变量的相关关系越密切. 10.现象之间相互依存关系的程度越低,则相关系数
A.越接近于0
B.越接近于-1
C.越接近于1
D.越接近于0.5 答案:A
解析:|r|越小,两个变量间的相互依存程度越低. 11.r 值越接近于-1,表明两变量间
A.无相关关系
B.线性相关关系越弱
C.负相关关系越强
D.负相关关系越弱 答案:C
解析:r <0两变量间负相关,|r|越接近1,两变量间的相关关系越强. 12.下列现象的相关密切程度最高的是
A.某商店的职工人数与商品销售额之间的相关系数为0.87
B.流通费用率与商业利润率之间的相关系数为-0.94
C.商品销售额与商业利润率之间的相关系数为0.51
D.商品销售额与流通费用率之间的相关系数为-0.81 答案:B 解析:|r|越接近1,相关密切程度越高.
二、填空题(本大题共4小题,每小题4分,共16分)
13.某化工厂为预测某产品的回收率y,需要研究它和原料有效成分含量之间的相关关系.现取了8对观测值,计算得
∑=8
1
i i
x
=52,
∑=8
1
i i
y
=228,
∑=8
1
i i
x
2
=478,
∑=8
1
i i
x
y i =1 849,则y 对x 的
线性回归方程是______________.
解析:b=
∑∑==--n
i i
n
i i
i
x
n x
y
x n y
x 1
2
21≈2.621 4,a=y -b x ≈11.46,
∴回归方程为y=11.46+2.62x. 答案:y=11.46+2.62x
X 100 120 140 160 180
Y
455
462
75
92
那么变量Y 关于X 的线性回归方程是__________________. 解析:由线性回归参数公式可得:b=0.575,a=-14.9. ∴回归方程为y=0.575x-14.9. 答案:y=0.575x-14.9. 15.若施化肥量x kg 与水稻产量y kg 之间的线性回归方程为y=5x+250,则当施化肥量为80 kg 时,预计水稻产量为__________________.
解析:将x=80代入回归方程,得y=650 (kg ). 答案:650 kg
16.在检验吸烟与患肺癌是否有关系时,利用独立性检验求得χ2
的观测值约56.632,且
P(χ2
≥6.635)≈0.1,据此,我们可得到“吸烟与患肺癌的关系”的结论是________________.
答案:我们有99%的把握认为“吸烟与患肺癌有关系”. 三、解答题(本大题共4小题,共36分)
中国 韩国 瑞士 俄罗斯 法国 以色列 加拿大 英国 美国 德国 授课天数 251 222 207 210 174 215 188 192 180 191 分数
80
73
71
70
64
63
62
61
55
46
试作出该数据的散点图并由图判断是否存在回归直线,若存在,求出直线方程. 答案:解:散点图略. 因为
x =203,
∑=n
i i
x
1
2
=416 824,
y
=64.5,
∑=n
i i
i y
x 1
=132 418,所以
b=
2
203104168245
.6420310132418⨯-⨯⨯-≈0.313 3,
a=64.5-0.313 3×203=0.900 1,
∴回归直线方程是y=0.313 3x+0.900 1. 18.(本小题满分9分)为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:
答案:解:由列联表中的数据得到
χ2
=1200
320605915)67883522237(15202⨯⨯⨯⨯-⨯⨯≈32.52>6.635,
所以有99%的把握认为“父母吸烟影响子女”.
19.(本小题满分9分)两所学校的计算机算法语言学习小组统一测验成绩如下: 甲校:16,12,20,15,23,8,16,19. 乙校:22,17,26,24,8,7,25,28. (1)求共同的中位数;
(3)两所学校的计算机算法语言学习小组的成绩有无差异? 答案:解:(1)将两组数据合在一起,从小到大的排列,寻找共同的中位数,由于n 1+n 2=8+8=16,则第8与第9个位置上的数据之平均数即为共同的中位数,共同中位数为18.
(3)χ2
=8
888)5533(162
⨯⨯⨯⨯-⨯=1≤2.706,
∴两所学校的计算机算法语言成绩无显著差异.
20.(本小题满分10分)如下表所示,某地区一段时间内观察到的大于或等于某震级x 的地
答案:解:散点图如图
nx
作散点图
利用信息技术得:z=-1.705 1x+15.43.
∴y=e-1.705 1x+15.43.。

相关文档
最新文档