统计案例试题及答案
高三数学统计案例试题答案及解析

高三数学统计案例试题答案及解析1.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是()D.阅读量【答案】D【解析】根据公式分别计算得:A., B. C. D. ,选项D的值最大,所以与性别有关联的可能性最大为D. 【考点】关联判断2. 对100只小白鼠进行某种激素试验,其中雄性小白鼠、雌性小白鼠对激素的敏感情况统计得到如下列联表由附表:则下列说法正确的是:( ) A .在犯错误的概率不超过的前提下认为“对激素敏感与性别有关”; B .在犯错误的概率不超过的前提下认为“对激素敏感与性别无关”; C .有以上的把握认为“对激素敏感与性别有关”; D .有以上的把握认为“对激素敏感与性别无关”; 【答案】C 【解析】因为,所以有以上的把握认为“对激素敏感与性别有关”.3. 设A 是由m×n 个实数组成的m 行n 列的数表,满足:每个数的绝对值不大于1,且所有数的和为零,记s(m ,n)为所有这样的数表构成的集合。
对于A ∈S(m,n),记r i (A)为A 的第ⅰ行各数之和(1≤ⅰ≤m ),C j (A)为A 的第j 列各数之和(1≤j≤n ):记K(A)为∣r 1(A)∣,∣R 2(A)∣,…,∣Rm(A)∣,∣C 1(A)∣,∣C 2(A)∣,…,∣Cn(A)∣中的最小值。
对如下数表A ,求K (A )的值;11-0.8(2)设数表A ∈S (2,3)形如求K (A )的最大值;(3)给定正整数t,对于所有的A∈S(2,2t+1),求K(A)的最大值。
【答案】(1)0.7 (2)1 (3)【考点定位】此题作为压轴题难度较大,考查学生分析问题解决问题的能力,考查学生严谨的逻辑思维能力【解析】(1)因为,所以不妨设.由题意得.又因为,所以,于是,,所以,当,且时,取得最大值1。
(3)对于给定的正整数t,任给数表如下,…任意改变A的行次序或列次序,或把A中的每一个数换成它的相反数,所得数表,并且,因此,不妨设,且。
(完整版)高三复习高中数学统计案例习题(有详细答案)

2015年高三复习高中数学统计案例习题(有详细答案)一.选择题(共15小题)1.(2014•四川模拟)为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单的随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样2.(2014•湖北模拟)某社区现有480个住户,其中中等收入家庭200户、低收入家庭160户,其他为高收入家庭.在建设幸福广东的某次分层抽样调查中,高收入家庭被抽取了6户,则该社区本次被抽取的总户数为()A.20 B.24 C.30 D.363.(2014•湖南一模)从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A.5,10,15,20,25 B.3,13,23,33,43 C.1,2,3,4,5 D.2,4,8,16,324.(2014•锦州一模)为了研究一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出的样本频率分布直方图如图,那么在这片树木中底部周长大于100cm的株树大约中()A.3000 B.6000 C.7000 D.80005.(2014•许昌二模)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列{a n}.已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为()A.100 B.120 C.150 D.2006.(2014•云南模拟)已知一组数据如图所示,则这组数据的中位数是()A.27.5 B.28.5 C.27 D.287.(2014•青浦区三模)已知图1、图2分别表示A、B两城市某月1日至6日当天最低气温的数据折线图(其中横轴n表示日期,纵轴x表示气温),记A、B两城市这6天的最低气温平均数分别为和,标准差分别为s A和s B,则它们的大小关系是()A.>,sA>s B B.>,sA<s BC.<,sA<s BD.<,sA>s B8.(2014•天门模拟)如图是根据变量x,y的观测数据(x i,y i)(i=1,2,…10)得到的散点图,由这些散点图可以判断变量x,y具有相关关系的图是()A.①②B.①④C.②③D.③④9.(2014•邯郸二模)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程,利用下表中数据推断a的值为()零件数x(个)10 20 30 40 50加工时间y(min)62 a 75 81 89A.68.2 B.68 C.69 D.6710.(2013•福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588 B.480 C.450 D.12011.(2013•陕西)对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为()A.0.09 B.0.20 C.0.25 D.0.4512.(2013•辽宁)某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[20,40),[40,60),[60,80),[80,100).若低于60分的人数是15人,则该班的学生人数是()A.45 B.50 C.55 D.6013.(2012•成都一模)某小区有125户高收入家庭、280户中等收入家庭、95户低收人家庭.现采用分层抽样的方法从中抽取100户,对这些家庭社会购买力的某项指标进行调查,则中等收入家庭中应抽选出的户数为()A.70 户B.17 户C.56 户D.25 户14.(2012•泸州一模)某校高三680名学生(其中男生360名、女生320名)在学术报告厅听了应考心理讲座,为了解有关情况,学校用分层抽样的方法抽取了一个样本,已知该样本中的女生人数为16名,那么该样本中的男生人数为()A.15 B.16 C.17 D.1815.(2012•绵阳二模)要从60人中抽取6人进行身体健康检查,现釆用分层抽样方法进行抽取,若这60人中老年人和中年人分别是40人,20人,则老年人中被抽取到参加健康检查的人数是()A.2人B.3人C.4人D.5人二.解答题(共15小题)16.为了了解学生的身体发育情况,某校对年满16周岁的60名男生的身高进行测量,其结果如下:身高(m)1.57 1.59 1.60 1.62 1.63 1.64 1.65 1.66 1.68人数 2 1 4 2 3 4 2 7 6身高(m)1.69 1.70 1.71 1.72 1.73 1.74 1.75 1.76 1.77人数8 7 4 3 2 1 2 1 1(1)根据上表,估计这所学校,年满16周岁的男生中,身高不低于1.65m且不高于1.71m的约占多少?不低于1.63m 的约占多少?(2)将测量数据分布6组,画出样本频率分布直方图;(3)根据图形说出该校年满16周岁的男生在哪一范围内的人数所占的比例最大?如果年满16周岁的男生有360人,那么在这个范围的人数估计约有多少人?17.改革开放以来,我国高等教育事业有了突飞猛进的发展,有人记录了某村2001到2005年五年间每年考入大学的人数,为了方便计算,2001年编号为1,2002年编号为2,…,2005年编号为5,数据如下:年份(x) 1 2 3 4 5人数(y) 3 5 8 11 13求y关于x的回归方程=x+所表示的直线必经的点.18.甲、乙两位同学参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取4次,绘制成茎叶图如图:甲乙9 7 78 1 2 8 535(Ⅰ)从甲、乙两人的成绩中各随机抽取一个,求甲的成绩比乙高的概率;(Ⅱ)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.19.下表是某单位在2013年1﹣5月份用水量(单位:百吨)的一组数据:月份x 1 2 3 4 5用水量y 4.5 4 3 2.5 1.8(Ⅰ)若由线性回归方程得到的预测数据与实际检验数据的误差不超过0.05,视为“预测可靠”,通过公式得,那么由该单位前4个月的数据中所得到的线性回归方程预测5月份的用水量是否可靠?说明理由;(Ⅱ)从这5个月中任取2个月的用水量,求所取2个月的用水量之和小于7(单位:百吨)的概率.参考公式:回归直线方程是:,.20.某校高三数学竞赛初赛考试后,对考生的成绩进行统计(考生成绩均不低于90分,满分为150分),将成绩按如下方式分成六组,第一组[90,100)、第二组[100,110)…,第六组[140,150],如图为其频率分布直方图的一部分,若第四、五、六组的人数依次成等差数列,且第六组有4人.(Ⅰ)求第四和第五组频率,并补全频率分布直方图;(Ⅱ)若不低于120分的同学进入决赛,不低于140分的同学为种子选手,完成下面2×2列联表(即填写空格处的数据),并判断是否有99%的把握认为“进入决赛的同学成为种子选手与专家培训有关”.[120,140)[140,150]合计参加培训8 8未参加培训合计 4附:K2=P(K2≥k0)0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001K0 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.82821.为了了解某中学高二女生的身高情况,该校对高二女生的身高进行了一次随机抽样测量,所得数据整理后列出了频率分布表如下:(单位:cm)(1)表中m、n、M、N所表示的数分别是多少?(2)绘制频率分布直方图;(3)估计该校女生身高小于162.5cm的百分比.22.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100].(1)求x值;(2)(理科)从成绩不低于80分的学生中随机的选取2人,该2人中成绩在90以上(含90分)的人数记为ξ,求ξ的概率分布列及数学期望Eξ.(文)从从成绩不低于80分的学生中随机的选取3人,该3人中至少有2人成绩在90以上(含90分)的概率.23.某网站针对2014年中国好声音歌手A,B,C三人进行网上投票,结果如下观众年龄支持A 支持B 支持C20岁以下200 400 80020岁以上(含20岁)100 100 400(1)在所有参与该活动的人中,用分层抽样的方法抽取n人,其中有6人支持A,求n的值.(2)在支持C的人中,用分层抽样的方法抽取6人作为一个总体,从这6人中任意选取2人,求恰有1人在20岁以下的概率.24.某校100名学生期中考试数学成绩的频率分布直方图如图,其中成绩分组区间如下:组号第一组第二组第三组第四组第五组分组[50,60)[60,70)[70,80)[80,90)[90,100](Ⅰ)求图中a的值;(Ⅱ)根据频率分布直方图,估计这100名学生期中考试数学成绩的平均分;(Ⅲ)现用分层抽样的方法从第3、4、5组中随机抽取6名学生,将该样本看成一个总体,从中随机抽取2名,求其中恰有1人的分数不低于90分的概率?25.从某实验中,得到一组样本容量为60的数据,分组情况如下:(Ⅰ)求出表中m,a的值;分组5~15 15~25 25~35 35~45频数 6 2l m频率 a 0.05(Ⅱ)估计这组数据的平均数.26.某校高三文科分为四个班.高三数学调研测试后,随机地在各班抽取部分学生进行测试成绩统计,各班被抽取的学生人数恰好成等差数列,人数最少的班被抽取了22人.抽取出来的所有学生的测试成绩统计结果的频率分布条形图如图所示,其中120~130(包括120分但不包括130分)的频率为0.05,此分数段的人数为5人.(1)问各班被抽取的学生人数各为多少人?(2)求平均成绩;(3)在抽取的所有学生中,任取一名学生,求分数不小于90分的概率.27.在参加世界杯足球赛的32支球队中,随机抽取20名队员,调查其年龄为25,21,23,25,27,29,25,28,30,29,26,24,25,27,26,22,24,25,26,28.(1)填写下面的频率分布表(2)并画出频率分布直方图.(3)据此估计全体队员在哪个年龄段的人数最多?占总数的百分之几?分组频数频率20.5~22.522.5~24.524.5~26.526.5~28.528.5~30.5合计28.如图是调查某地某公司1000名员工的月收入后制作的直方图.(1)求该公司员工的月平均收入及员工月收入的中位数;(2)在收入为1000至1500元和收入为3500至4000元的员工中用分层抽样的方法抽取一个容量15的样本,员工甲、乙的月收入分别为1200元、3800元,求甲乙同时被抽到的概率.29.某市为了解全市居民日常用水量的分布情况,现采用抽样调查的方式,获得了n位居民某年的月均用水量(单位:t),样本统计结果如图表:(Ⅰ)分别求出x,n,y的值;(Ⅱ)若从样本中月均用水量在[5,6]内的5位居民a,b,c,d,e中任选2人作进一步的调查研究,求居民a被选中的概率.分组频数频率[0,1)25 y[1,2)0.19[2,3)50 x[3,4)0.23[4,5)0.18[5,6] 530.为了分析某次考试数学成绩情况,用简单随机抽样从某班中抽取25名学生的成绩(百分制)作为样本,得到频率分布表如下:分数[50,60)[60,70)[70,80)[80,90)[90,100]频数2 3 9 a 1频率0.08 0.12 0.36 b 0.04(Ⅰ)求样本频率分布表中a,b的值,并根据上述频率分布表,在下表中作出样本频率分布直方图;(Ⅱ)计算这25名学生的平均数及方差(同一组中的数据用该组区间的中点值作代表);(Ⅲ)从成绩在[50,70)的学生中任选2人,求至少有1人的成绩在[60,70)中的概率.参考答案与试题解析一.选择题(共15小题)1.(2014•四川模拟)为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单的随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样考点:分层抽样方法.专题:阅读型.分析:若总体由差异明显的几部分组成时,经常采用分层抽样的方法进行抽样解答:解:我们常用的抽样方法有:简单随机抽样、分层抽样和系统抽样,而事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.了解某地区中小学生的视力情况,按学段分层抽样,这种方式具有代表性,比较合理.故选C.点评:本小题考查抽样方法,主要考查抽样方法,属基本题.2.(2014•湖北模拟)某社区现有480个住户,其中中等收入家庭200户、低收入家庭160户,其他为高收入家庭.在建设幸福广东的某次分层抽样调查中,高收入家庭被抽取了6户,则该社区本次被抽取的总户数为()A.20 B.24 C.30 D.36考点:分层抽样方法.专题:计算题.分析:根据社区里的高收入家庭户和高收入家庭户要抽取的户数,得到每个个体被抽到的概率,用求到的概率乘以低收入家庭户的户数,得到结果.解答:解:∵区现有480个住户,高收入家庭120户,抽取了6户∴每个个体被抽到的概率是∴该社区本次被抽取的总户数为=24,故选B.点评:本题考查分层抽样方法,这种题目类型是高考题目中一定会出现的题目,运算量不大,是一个必得分题目.3.(2014•湖南一模)从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A.5,10,15,20,25 B.3,13,23,33,43 C.1,2,3,4,5 D.2,4,8,16,32考点:系统抽样方法.专题:计算题.分析:由系统抽样的特点知,将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,这时间隔一般为总体的个数除以样本容量.从所给的四个选项中可以看出间隔相等且组距为10的一组数据是由系统抽样得到的.解答:解:从50枚某型导弹中随机抽取5枚,采用系统抽样间隔应为=10,只有B答案中导弹的编号间隔为10,故选B.点评:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本.4.(2014•锦州一模)为了研究一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出的样本频率分布直方图如图,那么在这片树木中底部周长大于100cm的株树大约中()A.3000 B.6000 C.7000 D.8000考点:频率分布直方图.专题:概率与统计.分析:在频率分布表中,频数的和等于样本容量,频率的和等于1,每一小组的频率等于这一组的频数除以样本容量.频率分布直方图中,小矩形的面积等于这一组的频率.底部周长小于100cm的矩形的面积求和乘以样本容量即可.解答:解:由图可知:底部周长小于100cm段的频率为(0.01+0.02)×10=0.3,则底部周长大于100cm的段的频率为1﹣0.3=0.7那么在这片树木中底部周长大于100cm的株树大约10000×0.7=7000人.故选C.点评:本小题主要考查样本的频率分布直方图的知识和分析问题以及解决问题的能力.统计初步在近两年高考中每年都以小题的形式出现,基本上是低起点题.5.(2014•许昌二模)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列{a n}.已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为()A.100 B.120 C.150 D.200考点:频率分布直方图.专题:概率与统计.分析:根据直方图中的各个矩形的面积代表了频率,各个矩形面积之和为1,求出小长方形面积最大的一组的频率,再根据频数=频率×样本容量,求出频数即可.解答:解:∵直方图中的各个矩形的面积代表了频率,这5个小方形的面积由小到大构成等差数列{a n},a2=2a1,∴d=a1,a3=3a1,a4=4a1,a5=5a1根据各个矩形面积之和为1,则a1+a2+a3+a4+a5=15a1=1∴a1=,小长方形面积最大的一组的频率为a5=5×=根据频率=可求出频数=300×=100故选:A.点评:本题考查了频率、频数的应用问题,各小组频数之和等于样本容量,各小组频率之和等于1.6.(2014•云南模拟)已知一组数据如图所示,则这组数据的中位数是()A.27.5 B.28.5 C.27 D.28考点:众数、中位数、平均数.专题:概率与统计.分析:利用中位数的定义即可得出.解答:解:这组数据为16,17,19,22,25,27,28,30,30,32,36,40的中位数是=27.5.故选:A.点评:本题考查了中位数的定义及其计算方法,属于基础题.7.(2014•青浦区三模)已知图1、图2分别表示A、B两城市某月1日至6日当天最低气温的数据折线图(其中横轴n表示日期,纵轴x表示气温),记A、B两城市这6天的最低气温平均数分别为和,标准差分别为s A和s B,则它们的大小关系是()A.>,sA>s B B.>,sA<s BC.<,sA<s BD.<,sA>s B考点:众数、中位数、平均数.专题:概率与统计.分析:本题可以由折线图上的数据做出两个城市的平均气温和方差,也可以根据两个折线图的高低和变化的趋势即波动的大小,得到结果.解答:解:由折线图可知A市的平均气温是,B市的平均气温是=11.7,由折线图也可以看出B市的气温较高,可以看出B市的气温的变化不大,方差较小;故选D.点评:本题考查了折线图以及平均数和方差的求法;求两组数据的平均值和方差是研究数据常做的两件事,平均值反映数据的平均水平,而方差反映数据的波动大小,从两个方面可以准确的把握数据的情况.8.(2014•天门模拟)如图是根据变量x,y的观测数据(x i,y i)(i=1,2,…10)得到的散点图,由这些散点图可以判断变量x,y具有相关关系的图是()A.①②B.①④C.②③D.③④考点:散点图.专题:计算题.分析:通过观察散点图可以知道,y随x的增大而减小,各点整体呈下降趋势,x与y负相关,u随v的增大而增大,各点整体呈上升趋势,u与v正相关.解答:解:由题图③可知,y随x的增大而减小,各点整体呈下降趋势,x与y负相关,由题图④可知,u随v的增大而增大,各点整体呈上升趋势,u与v正相关.故选D.点评:本题考查散点图,是通过读图来解决问题,考查读图能力,粗略的反应两个变量之间的关系,是不是线性相关,是正相关还是负相关.9.(2014•邯郸二模)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程,利用下表中数据推断a的值为()零件数x(个)10 20 30 40 50加工时间y(min)62 a 75 81 89A.68.2 B.68 C.69 D.67考点:线性回归方程.专题:计算题;概率与统计.分析:由题意,将20代入可得68.2,故可能值为68.解答:解:由题意,y=0.68×20+54.6=68.2,又由表可知加工时间y(min)都是以整数记,故a可能为68,故选B.点评:本题考查了线性回归方程的应用及数学问题与实际问题的转化,属于基础题.10.(2013•福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588 B.480 C.450 D.120考点:频率分布直方图.专题:图表型.分析:根据频率分布直方图,成绩不低于60分的频率,然后根据频数=频率×总数可求出所求.解答:解:根据频率分布直方图,成绩不低于60(分)的频率为1﹣10×(0.005+0.015)=0.8.由于该校高一年级共有学生600人,利用样本估计总体的思想,可估计该校高一年级模块测试成绩不低于60(分)的人数为600×0.8=480人.故选B.点评:本小题主要考查频率、频数、统计和概率等知识,考查数形结合、化归与转化的数学思想方法,以及运算求解能力.11.(2013•陕西)对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为()A.0.09 B.0.20 C.0.25 D.0.45考点:频率分布直方图.分析:在频率分布表中,频数的和等于样本容量,频率的和等于1,小矩形的面积等于这一组的频率,则所以面积和为1,建立等量关系即可求得长度在[25,30)内的频率即得.解答:解:设长度在[25,30)内的频率为a,根据频率分布直方图得:a+5×0.02+5×0.06+5×0.03=1⇒a=0.45.则根据频率分布直方图估计从该批产品中随机抽取一件,则其为二等品的概率为0.45.故选D.点评:本小题主要考查样本的频率分布直方图的知识和分析问题以及解决问题的能力.统计初步在近两年高考中每年都以小题的形式出现,基本上是低起点题.12.(2013•辽宁)某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[20,40),[40,60),[60,80),[80,100).若低于60分的人数是15人,则该班的学生人数是()A.45 B.50 C.55 D.60考点:频率分布直方图.专题:概率与统计.分析:由已知中的频率分布直方图,我们可以求出成绩低于60分的频率,结合已知中的低于60分的人数是15人,结合频数=频率×总体容量,即可得到总体容量.解答:解:∵成绩低于60分有第一、二组数据,在频率分布直方图中,对应矩形的高分别为0.005,0.01,每组数据的组距为20则成绩低于60分的频率P=(0.005+0.010)×20=0.3,又∵低于60分的人数是15人,则该班的学生人数是=50.故选B.点评:本题考查的知识点是频率分布直方图,结合已知中的频率分布直方图,结合频率=矩形的高×组距,求出满足条件的事件发生的频率是解答本题的关键.13.(2012•成都一模)某小区有125户高收入家庭、280户中等收入家庭、95户低收人家庭.现采用分层抽样的方法从中抽取100户,对这些家庭社会购买力的某项指标进行调查,则中等收入家庭中应抽选出的户数为()A.70 户B.17 户C.56 户D.25 户考点:分层抽样方法.专题:概率与统计.分析:由分层抽样的计算方法:中等收入家庭的户数占总户数的比例再乘以要抽取的户数,即可得出答案.解答:解:由已知可得中等收入家庭中应抽选出的户数==56.故选C.点评:本题考查了分层抽样,掌握分层抽样的计算方法是解决问题的关键.14.(2012•泸州一模)某校高三680名学生(其中男生360名、女生320名)在学术报告厅听了应考心理讲座,为了解有关情况,学校用分层抽样的方法抽取了一个样本,已知该样本中的女生人数为16名,那么该样本中的男生人数为()A.15 B.16 C.17 D.18考点:分层抽样方法.专题:计算题.分析:设该样本中的男生人数为x,则由分层抽样的定义和方法可得=,由此解得x 的值.解答:解:设该样本中的男生人数为x,则由分层抽样的定义和方法可得=,解得x=18,故选D.点评:本题主要考查分层抽样的定义和方法,利用了总体中各层的个体数之比等于样本中对应各层的样本数之比,属于基础题.15.(2012•绵阳二模)要从60人中抽取6人进行身体健康检查,现釆用分层抽样方法进行抽取,若这60人中老年人和中年人分别是40人,20人,则老年人中被抽取到参加健康检查的人数是()A.2人B.3人C.4人D.5人考点:分层抽样方法.专题:计算题.分析:先求出每个个体被抽到的概率,用该层的个体数乘以每个个体被抽到的概率,就等于该层应抽取的个体数.解答:解:每个个体被抽到的概率等于=,老年人中被抽取到参加健康检查的人数是40×=4,故选C.点评:本题主要考查分层抽样的定义和方法,用每层的个体数乘以每个个体被抽到的概率等于该层应抽取的个体数,属于基础题.二.解答题(共15小题)16.为了了解学生的身体发育情况,某校对年满16周岁的60名男生的身高进行测量,其结果如下:身高(m)1.57 1.59 1.60 1.62 1.63 1.64 1.65 1.66 1.68人数 2 1 4 2 3 4 2 7 6身高(m)1.69 1.70 1.71 1.72 1.73 1.74 1.75 1.76 1.77人数8 7 4 3 2 1 2 1 1(1)根据上表,估计这所学校,年满16周岁的男生中,身高不低于1.65m且不高于1.71m的约占多少?不低于1.63m 的约占多少?(2)将测量数据分布6组,画出样本频率分布直方图;(3)根据图形说出该校年满16周岁的男生在哪一范围内的人数所占的比例最大?如果年满16周岁的男生有360人,那么在这个范围的人数估计约有多少人?考点:频率分布直方图;频率分布表.专题:概率与统计.分析:(1)根据上表求出身高不低于1.65m且不高于1.71m的频率与不低于1.63m的频率;(2)将测量数据分组,求频数与频率,列出频率分布表,画出频率分布直方图;(3)根据图形得出正确的结论以及估计结果.解答:解:(1)根据上表得,身高不低于1.65m且不高于1.71m的频率是=≈0.567,∴约占总体的56.7%;不低于1.63m的频率是1﹣=1﹣0.15=0.85,约占总体的85%;(2)将测量数据分布6组,∴=0.033,∴组距是0.04,计算频数与频率,列出频率分布表,如下;分组频数频率156.5﹣160.5 7 0.11160.5﹣164.5 9 0.15164.5﹣168.5 15 0.25168.5﹣172.5 22 0.37172.5﹣176.5 6 0.10176.5﹣180.5 1 0.02合计60 1.00画出样本频率分布直方图,如图所示;(3)根据图形知,该校年满16周岁的男生在168.5﹣172.5内的人数所占的比例最大,如果年满16周岁的男生有360人,那么在这个范围的人数估计约为360×0.37=133人.点评:本题考查了频率分布直方图的应用问题,也考查了列表和画图的能力,解题时应根据图中数据进行有关的计算,是基础题.17.改革开放以来,我国高等教育事业有了突飞猛进的发展,有人记录了某村2001到2005年五年间每年考入大学的人数,为了方便计算,2001年编号为1,2002年编号为2,…,2005年编号为5,数据如下:年份(x) 1 2 3 4 5人数(y) 3 5 8 11 13求y关于x的回归方程=x+所表示的直线必经的点.考点:回归分析的初步应用.专题:计算题;概率与统计.分析:求平均值,回归直线必过样本点的中心.解答:解:==3,==8,故回归方程=x+所表示的直线必经过点(3,8).点评:本题考查了回归分析,回归直线必过样本点的中心,同时考查了平均数的求法,属于基础题.18.甲、乙两位同学参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取4次,绘制成茎叶图如图:甲乙9 7 78 1 2 8 535(Ⅰ)从甲、乙两人的成绩中各随机抽取一个,求甲的成绩比乙高的概率;(Ⅱ)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.考点:茎叶图;众数、中位数、平均数;极差、方差与标准差.专题:概率与统计.分析:(I)由茎叶图知甲乙两同学的成绩分别为:甲:82 81 79 88 乙:85 77 83 85.利用“列举法”及其古典概型的概率计算公式即可得出.(II)分别计算出甲乙的平均成绩及其方差即可得出.。
(北师大版)上海市高中数学选修2-3第三章《统计案例》检测卷(包含答案解析)

一、选择题1.利用独立性检验的方法调查大学生的性别与爱好某项运动是否有关,通过随机询问400名不同的大学生是否爱好某项运动,利用22⨯列联表,计算可得2K 的观测值7.556k ≈,附表:20()P K k ≥0.15 0.100.050.025 0.010 0.005 0.001 0k 2.0722.7063.8415.0246.6357.87910.828参照附表,得到的正确结论是A .有99%以上的把握认为“爱好该项运动与性别无关”B .有99%以上的把握认为“爱好该项运动与性别有关”C .在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过1%的前提下,认为“爱好该项运动与性别无关”2.两个分类变量X 和Y ,值域分别为{x 1,x 2}和{y 1,y 2},其样本频数分别是a =10,b =21,c +d =35,若X 与Y 有关系的可信程度为90%,则c =( ) A .4 B .5 C .6D .73.某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:附表:经计算2K 的观测值10k =,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响 C .有99.9%的把握认为使用智能手机对学习有影响 D .有99.9%的把握认为使用智能手机对学习无影响 4.下列命题正确的个数是:( )①对于两个分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握程度越大;②在相关关系中,若用211c x y c e =拟合时的相关指数为21R ,用2y bx a =+拟合时的相关指数为22R ,且2212R R >,则1y 的拟合效果好;③利用计算机产生0~1之间的均匀随机数a ,则事件“310a ->”发生的概率为23; ④“0,0a b >>”是“2b aa b+≥”的充分不必要条件 A .1B .2C .3D .45.给出下列说法:①用()()221211ˆni i i n i i i y y R y y ==-=--∑∑刻画回归效果,当2R 越大时,模型的拟合效果越差,反之则越好;②归纳推理是由特殊到一般的推理,而演绎推移则是由一般到特殊的推理;③综合法证明数学问题是“由因索果”,分析法证明数学问题是“执果索因”;④设有一个回归方程ˆ35yx =+,变量x 增加1个单位时,y 平均增加5个单位;⑤线性回归方程ˆˆˆy bx a =+必过点(),x y .其中错误的个数有( )A .0个B .1个C .2个D .3个6.某班主任对全班50名学生进行了作业量的调查,数据如表:若推断“学生的性别与认为作业量大有关”,则这种推断犯错误的概率不超过( )附:()()()()()22n ad bc K a b c d a c b d -=++++A .0.01B .0.025C .0.10D .0.057.某研究型学习小组调查研究学生使用智能手机对学习的影响,部分统计数据如下表:使用智能手机 不使用智能手机 总计 学习成绩优秀 4 8 12 学习成绩不优秀 16 2 18 总计201030计算得K 2=10,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响B.有99.5%的把握认为使用智能手机对学习无影响C.在犯错误的概率不超过0.1%的前提下,认为使用智能手机对学习有影响D.在犯错误的概率不超过1%的前提下,认为使用智能手机对学习无影响8.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,得到下面的列联表:现判断数学成绩与物理成绩有关系,则犯错误的概率不超过()A.0.005 B.0.01 C.0.02 D.0.059.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”,得到如下的列联表:由此表得到的正确结论是()A.在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别有关”D.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别无关”10.以下四个命题中:①在回归分析中,可用相关指数R2的值判断拟合的效果,R2越大,模型的拟合效果越好;②两个随机变量的线性相关性越强,相关系数的绝对值越接近1;③若数据x1,x2,x3,…,x n的方差为1,则2x1,2x2,2x3,…,2x n的方差为2;④对分类变量x与y的随机变量K2的观测值k来说,k越小,判断“x与y有关系”的把握程度越大.其中真命题的个数为()A.1 B.2C.3 D.411.利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅临界值表来确定推断“X与Y有关系”的可信度,如果k>5.024,那么就推断“X和Y有关系”,这种推断犯错误的概率不超过()A .0.25B .0.75C .0.025D .0.97512.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列表:由上表中数据计算得2K =()21051030204555503075⨯⨯-⨯⨯⨯⨯≈6.109,请根据下表,估计有多大把握认为“文化程度与月收入有关系”( )A .1%B .99%C .2.5%D .97.5%二、填空题13.在一次独立试验中,有200人按性别和是否色弱分类如下表(单位:人)男 女 正常 73 117 色弱73你能在犯错误的概率不超过_____的前提下认为“是否色弱与性别有关”?14.利用独立性检验考察两个分类变量X 与Y 是否有关系时,若K2的观测值k=6.132,则有__________的把握认为“X 与Y 有关系”. P(K2≥k0) 0.05 0.025 0.010 0.005 k03.8415.0246.6357.87915.已知的取值如表所示:若与呈线性相关,且回归方程为,则等于 .2 3 454616.下列4个命题:①为了了解800名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔为40;②四边形ABCD 为长方形,2AB =,1BC =,O 为AB 中点,在长方形ABCD 内随机取一点P ,取得的P 点到O 的距离大于1的概率为12π-; ③把函数3sin 23y x π⎛⎫=+⎪⎝⎭的图象向右平移6π个单位,可得到3sin 2y x =的图象; ④已知回归直线的斜率的估计值为1.23,样本点的中心为()4,5,则回归直线方程为1.230.08y x =+.其中正确的命题有__________.(填上所有正确命题的编号)17.4月16日摩拜单车进驻大连市旅顺口区,绿色出行引领时尚,旅顺口区进行了“经常使用共享单车与年龄关系”的调查,得下列22⨯列联表:年轻人 非年轻人 合计 经常使用单车用户 100 20 120 不常使用单车用户 60 20 80 合计16040200则得到的2χ=__________.(小数点后保留一位) (附:()()()()()22χ-=++++n ad bc a b c d a c b d )18.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________. 19.给出下列四个结论:(1)相关系数r 的取值范围是1r <;(2)用相关系数r 来刻画回归效果,r 的值越大,说明模型的拟合效果越差;(3)一个袋子里装有大小相同的5个白球和5个黑球,从中任取4个,则其中所含白球个数的期望是2;(4) 一个篮球运动员投篮一次得3分的概率为a ,得2分的概率为b ,不得分的概率为c ,且(),,0,1a b c ∈,已知他投篮一次得分的数学期望为2,则213a b+的最小值为163.其中正确结论的序号为______________.20.2018年春季,世界各地相继出现流感疫情,这已经成为全球性的公共卫生问题.为了考察某种流感疫苗的效果,某实验室随机抽取100只健康小鼠进行试验,得到如下列联表:感染 未感染 总计 注射 10 40 50 未注射 20 30 50 总计3070100参照附表,在犯错误的概率最多不超过____的前提下,可认为“注射疫苗”与“感染流感”有关系.(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++.) 20()P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k 2.7063.8415.0246.6357.87910.828三、解答题21.我国新型冠状病毒肺炎疫情期间,以网络购物和网上服务所代表的新兴消费展现出了强大的生命力,新兴消费将成为我国消费增长的新动能.某市为了了解本地居民在2020年2月至3月两个月网络购物消费情况,在网上随机对1000人做了问卷调查,得如表频数分布表:(1)作出这些数据的频率分布直方图,并估计本市居民此期间网络购物的消费平均值; (2)在调查问卷中有一项是填写本人年龄,为研究网购金额和网购人年龄的关系,以网购金额是否超过4000元为标准进行分层抽样,从上述1000人中抽取200人,得到如表列联表,请将表补充完整并根据列联表判断,在此期间是否有95%的把握认为网购金额与网购人年龄有关.参考公式和数据:()()()()()22n ad bcKa b c d a c b d-=++++.(其中n a b c d=+++为样本容量)22.2020年3月,因为新冠肺炎疫情的影响,我市全体学生只能在网上在线学习,为了研究学生在线学习情况,市教研院数学学科随机从市区各高中学校抽取120名学生对线上教学情况进行调查(其中,男生与女生的人数之比为3:1),结果发现:男生中有40名对于线上教学满意,女生中有10名表示对于线上教学不满意.(1)请完成如表2×2列联表,并回答能否有95%的把握认为对“线上教学是否满意与性别有关”;态度性别满意不满意合计男生女生合计120(2)采用分层抽样的方法,从被调查的对线上教学满意的学生中,抽取6名学生,再从这6名学生中抽取2名学生,作线上学习的经验介绍,求所选取的2名学生性别不同的概率.附:参考公式及临界值表()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++23.新冠肺炎疫情防控时期,各级各类学校纷纷组织师生开展了“停课不停学”活动,为了解班级线上学习情况,某位班主任老师进行了有关调查研究.(1)从班级随机选出5名同学,对比研究了线上学习前后两次数学考试成绩,如下表:参考公式:在线性回归方程y bx a=+,()()()() 1122211n ni i i ii in ni ii ix x y y x y nx ybx x x n x ====---==--∑∑∑∑,a y bx=-(2)针对全班45名同学(25名女生,20名男生)的线上学习满意度调查中,女姓满意率为80%,男生满意率为75%,填写下面列联表,判断能否在犯错误概率不超过0.01的前提下,认为线上学习满意度与学生性别有关?参考公式和数据:()()()()()2n ad bcxa b c d a c b d-=++++,()20.0500.0100.0013.8416.63510.828P x kk≥24.某足球运动员进行射门训练,若打进球门算成功,否则算失败.已知某天该球员射门成功次数与射门距离的统计数据如下:(1)请问是否有90%的把握认为该球员射门成功与射门距离是否超过30米有关?参考公式及数据:22(),()()()()n ad bc K n a b c d a b c d a c b d -==+++++++.(2)当该球员距离球门30米射门时,设射门角(射门点与球场底线中点的连线和底线所成的锐角或直角)为([0,])2πθθ∈,其射门成功率为2+3()cos sin 4f θθθθθ=+⋅-,求该球员射门成功率最高时射门角θ的值.25.某大学读书协会为了解本校大学生网上阅读与传统纸质阅读的情况,调查了该大学1000名大学生(男、女各占一半),就偏向网上阅读和偏向传统纸质阅读的情况做了调查记录.记录显示,偏向网上阅读的男大学生比偏向传统纸质阅读的男大学生多300人,这1000名大学生中,偏向传统纸质阅读的大学生共有400人. (1)根据题意,完成下列2×2列联表;(2)根据列联表,判断能否有99.9%的把握认为该大学的大学生的阅读方式与性别有关,说明你的理由.附: 22(-)()()()()n ad bc K a b c d a c b d =++++(n=a+b+c+d ).26.2016年欧洲杯将于2016年6月10日到7月10日在法国举行.为了使得赛会有序进行,欧足联在全球范围内选聘了30名志愿者(其中男性16名,女性14名).调查发现,男性中有10人会英语,女性中有6人会英语. (1)根据以上数据完成以下2×2列联表:并回答能否在犯错的概率不超过0.10的前提下认为性别与会英语有关?参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++参考数据:(2)会英语的6名女性志愿者中曾有4人在法国工作过,若从会英语的6名女性志愿者中随机抽取2人做导游,则抽出的2人都在法国工作过的概率是多少?【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据2K 的观测值7.556k ≈,对照表中数据,即可得到相应的结论. 【详解】根据2K 的观测值7.556k ≈,对照表中数据得出有0.01的几率说明这两个变量之间的关系是不可信的,即有10.0199%-=的把握说明两个变量之间有关系,故选B . 【点睛】本题主要考查独立性检验的应用,独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式计算2K 的观测值k ;(3)查表比较k 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误)2.B解析:B 【解析】【分析】根据22⨯列联表,以及独立检验随机变量的临界值参考表,计算2K 对应的值,验证24,5,6,7,c K =是否恰好满足即可【详解】列22⨯列联表可知:()22661030521 3.024 2.70615513135K ⨯⨯-⨯=≈>⨯⨯⨯,所以5c =时,X 与Y 有关系的可信程度为90%,而其余的值4,6,7c c c ===皆不满足,故选B . 【点睛】独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)3.A解析:A 【解析】 【分析】由题意结合2K 的观测值k 由独立性检验的数学思想给出正确的结论即可. 【详解】由于2K 的观测值10k =7.879>,其对应的值0.0050.5%=,据此结合独立性检验的思想可知:有99.5%的把握认为使用智能手机对学习有影响. 本题选择A 选项. 【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.4.C解析:C 【解析】分析:根据独立性检验的性质可判断①;根据回归分析的基本原理可判断②;根据几何概型概率公式可判断③; 根据不等式的性质可判断④.详解:①对于两个分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握程度越小,①错误;②在相关关系中,若用211c x y c e =拟合时的相关指数为21R ,用2y bx a =+拟合时的相关指数为22R ,且2212R R >,则1y 的拟合效果好,②正确;③利用计算机产生0~1之间的均匀随机数a ,则事件“310a ->”发生的概率为1123103-=-,正确; ④“0,0a b >>”可得到“2b a a b +≥”, “2b aa b+≥”时“0,0a b >>”不一定成立,所以“0,0a b >>”是“2b aa b+≥”的充分不必要条件,正确,即正确命题的个数是3,故选C. 点睛:本题主要通过对多个命题真假的判断,主要综合独立性检验、回归分析、几何概型概率公式、不等式的性质,属于中档题.这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.5.B解析:B 【解析】分析:①可由相关指数的概念判断;②③由推理,综合法和反证法的概念判断;④和⑤由线性回归分析判断即可.详解:①相关指数2R 越大,则相关性越强,模型的拟合效果越好.错误;② 归纳推理是由特殊到一般的推理,而演绎推理是由一般到特殊的推理,由归纳推理与演绎推理的概念可知正确.③综合法证明数学问题是“由因索果”,分析法证明数学问题是“执果索因”,由概念可知正确. ④由回归方程的系数意义知,当变量x 增加1个单位时,y 平均增加5个单位,正确;⑤线性回归方程ˆˆˆy bx a =+必过样本中心点(),x y ,正确.故选B.点睛:本题是一道综合性考题,即考查了推理与证明的原理,又考查了利用2R 判断模型拟合程度,同时还考查了线性回归分析的相关概念,属于中档题.6.B解析:B分析:根据表格中所给数据,代入公式()()()()()22n ad bcKa b c d a c b d-=++++,求出观测值,把所求的观测值同临界值进行比较,从而可得结果.详解:根据表中数据得到()22501815895.059 5.02427232426K⨯⨯-⨯=≈>⨯⨯⨯,所以,若推断“学生的性别与认为作业量大有关”,则这种推断犯错误的概率不超过0.025,故选B.点睛:本题主要考查独立性检验的应用,解题的关键是正确求出这组数据的观测值,计算过程一定要细心,避免出现计算错误,属于基础题.7.A解析:A【解析】因为7.879<K2<10.828,所以有99.5%的把握认为使用智能手机对学习有影响.故选A.8.D解析:D【解析】因为K2的观测值k=2300(371433585) 12217872228⨯-⨯⨯⨯⨯≈4.514>3.841,所以在犯错误的概率不超过0.05的前提下认为数学成绩与物理成绩有关系. 选D. 9.C解析:C【解析】由2×2列联表得到a=45,b=10,c=30,d=15.则a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100.所以K2的观测值k=2100675-30055457525⨯⨯⨯()≈3.030.因为2.706<3.030<3.841.选C.点睛:根据卡方公式求K2,再与参考数据比较,最后作出判断.10.B解析:B【解析】由题意得,若数据x1,x2,x3,…,x n的方差为1,则2x1,2x2,2x3,…,2x n的方差为4,所以③不正确;对分类变量x与y的随机变量K2的观测值k来说,k越小,判断“x与y 有关系”的把握程度越小,所以④不正确.其中①、②是正确的,故选B.11.C解析:C【解析】∵P(k>5.024)=0.025,故在犯错误的概率不超过0.025的条件下,认为“X和Y考点:独立性检验.12.D解析:D 【解析】 试题由题根据二列联表得出;2K =()21051030204555503075⨯⨯-⨯⨯⨯⨯≈6.109,对应参考值得 2 5.024K >,则有10.0250.975-=,即有97.5%的把握认为文化程度与月收入有关系。
高三数学统计案例试题

高三数学统计案例试题1.一台机器由于使用时间较长,但还可以使用,它按不同的转速生产出来的某机器零件有一些会有缺点,每小时生产有缺点零件的多少随机器运转的速度而变化,下表是抽样试验结果:若实际生产中,允许每小时的产品中有缺点的零件数最多为10个,那么机器的转速应该控制所在的范围是()A.10转/s以下B.15转/s以下C.20转/s以下D.25转/s以下【答案】B【解析】则a=-b=-0.857 5.∴回归直线方程为=0.728 6x-0.857 5.要使y≤10,则0.728 6x-0.857 5≤10,∴x≤14.901 9.因此,机器的转速应该控制在15转/s以下.故选B.2.登山族为了了解某山高y(km)与气温x(°C)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表:气温x(°C)181310-1由表中数据,得到线性回归方程,由此请估计出山高为72(km)处气温的度数为()A.-10B.-8C.-6D.-6【答案】C【解析】由题意可得=10,=40.5,所以=+2=40.5+2×10=60.5,所以,当=72时,,解得x≈-6,故选C.【考点】回归分析3.为了调查某大学学生在周日上网的时间,随机对名男生和名女生进行了不记名的问卷调查,得到了如下的统计结果:表1:男生上网时间与频数分布表上网时间(分5253025151020402010(Ⅰ)若该大学共有女生750人,试估计其中上网时间不少于60分钟的人数;(Ⅱ)完成表3的列联表,并回答能否有90%的把握认为“学生周日上网时间与性别有关”?(Ⅲ)从表3的男生中“上网时间少于60分钟”和“上网时间不少于60分钟”的人数中用分层抽样的方法抽取一个容量为5的样本,再从中任取两人,求至少有一人上网时间超过60分钟的概率.表3 :上网时间少于60分钟上网时间不少于60分钟合计附:,其中【答案】(I)225;(II)否;(III).【解析】(I)统计得到女生样本中的上网时间不少于60分钟的频数,根据频数与容量之比等于频率,易得到全校上网时间不少于60分钟的人数;(II)由以上列联表1、2的数据,可统计得到表3的数据,根据独立性检验原理可知:没有90%的把握认为“学生周日上网时间与性别有关”;(III)五名男生中任取两人的基本事件数10个,根据表3可知男生上网超过60分钟与不超过60分钟的人数比为3:2,再写出至少一人超过60分钟的事件数7个,易求得概率为.试题解析:(1)设估计上网时间不少于60分钟的人数,依据题意有,解得:,所以估计其中上网时间不少于60分钟的人数是225人.(2)根据题目所给数据得到如下列联表:上网时间少于60分钟上网时间不少于60分钟合计其中 ,因此,没有90%的把握认为“学生周日上网时间与性别有关”.(3)因为上网时间少于60分钟与上网时间不少于60分钟的人数之比为,所以5人中上网时间少于60分钟的有3人,记为上网时间不少于60分钟的有2人,记为从中任取两人的所有基本事件为:(),(),(),(),(),(),(),(),(),(),共10种,其中“至少有一人上网时间超过60分钟”包含了7种, .【考点】1、用样本估计总体; 2、独立性检验;3、古典概型的概率求法.4.为了研究玉米品种对产量的影响,某农科院对一块试验田种植的一批玉米共10000 株的生长情况进行研究,现采用分层抽样方法抽取50株作为样本,统计结果如下:高茎矮茎合计10株玉米,再从这10株玉米中随机选出3株,求选到的3株之中既有圆粒玉米又有皱粒玉米的概率;(2) 根据对玉米生长情况作出的统计,是否能在犯错误的概率不超过0.050的前提下认为玉米的圆粒与玉米的高茎有关?(下面的临界值表和公式可供参考:,其中)【答案】(1);(2) 能在犯错误的概率不超过0.050的前提下认为玉米的圆粒与玉米的高茎有关.【解析】本小题通过统计与概率的相关知识,具体涉及到随机变量的分布列、数学期望的求法和统计案例中独立性检验等知识内容,考查学生对数据处理的能力,对考生的运算求解能力、推理论证能力都有较高要求. 本题属于统计概率部分综合题,对考生的统计学的知识考查比较全面,是一道的统计学知识应用的基础试题. .(1)采用分层抽样的比例关系确定个数,然后利用排列组合的知识,借助随机事件的概率求解;(2)根据已知的公式,经过仔细的计算出的值,然后借助表格进行数据对比,得到相关性的结论.试题解析:(1) 现采用分层抽样的方法,从样本中取出的10株玉米中圆粒的有6株,皱粒的有4株,所以从中再次选出3株时,既有圆粒又有皱粒的概率为. (6分) (2) 根据已知列联表:所以.又,因此能在犯错误的概率不超过0.050的前提下认为玉米的圆粒与玉米的高茎有关. (12分)【考点】(1)随机变量的分布列;(2)统计案例中独立性检验5.(本小题共12分)现对某市工薪阶层关于“楼市限购令”的态度进行调查,随机抽调了50人,他们月收入的频数分布及对“楼市限购令”赞成人数如下表.月收入(单[15,25[25,35[35,45[45,55[55,65[65,75510151055(1)由以上统计数据填下面2乘2列联表并问是否有99%的把握认为“月收入以5500为分界点对“楼市限购令” 的态度有差异;(2)若对在[15,25),[25,35)的被调查中各随机选取两人进行追踪调查,记选中的4人中不赞成“楼市限购令”人数为,求随机变量的分布列。
(必考题)高中数学高中数学选修2-3第三章《统计案例》检测(含答案解析)

一、选择题1.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e2.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是( ) A .①回归分析,②取平均值 B .①独立性检验,②回归分析 C .①回归分析,②独立性检验D .①独立性检验,②取平均值3.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==4.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:2()P K k≥0.0500.0250.0100.0050.001k 3.841 5.024 6.6357.87910.828由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是() A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关5.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bcKa cb d a d b c-++++,其中n a b c d=+++.2()P K k≥0.100.050.010.005k 2.706 3.841 6.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们()A.没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B.有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C.有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”6.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘” 能做到“光盘” 男 45 10 女3015则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()20P K k ≥0.100 0.050 0.010 0.001 0k 2.7063.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%7.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e ,众数为m 0,平均数为x -,则( )A .m e =m 0=x -B .m 0<x -<m e C .m e <m 0<x -D .m 0<m e <x -8.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:心脏病 无心脏病 秃发 20 300 不秃发5450根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.0019.给出以下四个说法:①绘制频率分布直方图时,各小长方形的面积等于相应各组的组距;②在刻画回归模型的拟合效果时,R2的值越大,说明拟合的效果越好;③设随机变量ξ服从正态分布N(4,22),则P(ξ>4)=12;④对分类变量X与Y,若它们的随机变量K2的观测值k越小,则判断“X与Y有关系”的犯错误的概率越小.其中正确的说法是()A.①④B.②③C.①③D.②④10.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.平均数与方差 B.回归分析C.独立性检验 D.概率11.某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下的列联表:由()()()()()22n ad bcka b c d a c b d-=++++并参照附表,得到的正确结论是A.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C.有99.9%的把握认为“爱好游泳运动与性别有关”D.有99.9%的把握认为“爱好游泳运动与性别无关”12.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K=,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是()2()P K k≥…0.250.150.100.0250.0100.005…k… 1.323 2.072 2.706 5.024 6.6357.879…A.90%B.95%C.97.5%D.99.5%二、填空题13.给出下列结论:①在回归分析中,可用相关指数2R的值判断模型的拟合效果,2R越大,模型的拟合效果越好;②某工厂加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量;③随机变量的方差和标准差都反映了随机变量的取值偏离均值的平均程度,它们越小,则随机变量偏离均值的平均程度越小;④甲、乙两人向同一目标同时射击一次,事件A:“甲、乙中至少一人击中目标”与事件B:“甲、乙都没有击中目标”是相互独立事件.其中结论正确的是______.14.新闻媒体为了了解观众对央视某节目的喜爱与性别是否有关,随机调查了观看该节目的观众110名,得到如下的2×2列联表:试根据样本估计总体的思想,估计约有________的把握认为“喜爱该节目与否和性别有关”.参考附表:(参考公式:K2=()()()()()2n ad bca b c d a c b d-++++,其中n=a+b+c+d)15.某市电信宽带私人用户月收费标准如下表:假定每月初可以和电信部门约定上网方案.若某用户每月上网时间为66小时,应选择__________方案最合算.16.下列是某厂1~4月份用水量(单位:百吨)的一组数据,由其散点图可知,用水量y与月份x 之间有较好的线性相关关系,其线性回归方程是=﹣0.7x+,则= . 月 份x 1 2 3 4 用水量y4.5432.517.为了判断高中二年级学生是否喜欢足球运动与性别的关系,现随机抽取50名学生,得到22⨯列联表:喜欢 不喜欢 总计 男 15 10 25 女520 25 总计 203050(参考公式22()()()()()n ad bc k a b c d a c b d -=++++,()n a b c d =+++)20()P K k ≥ 0.010 0.005 0.0010k 6.635 7.879 10.828则有___________以上的把握认为“喜欢足球与性别有关”.18.为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:理科 文科 总计 男 13 10 23 女 7 20 27 总计203050已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到≈4.844,则认为选修文理科与性别有关系出错的可能性约为________. 19.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,1,1,3b x y ===则1a =.正确的序号是________________.20.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________.三、解答题21.为研究男、女生的身高差异,现随机从高三某班选出男生、女生各10人,并测量他们的身高,测量结果如下(单位:厘米): 男:173 178 174 185 170 169 167 164 161 170 女:165 166 156 170 163 162 158 153 169 172(1)根据测量结果完成身高的茎叶图(单位:厘米),并分别求出男、女生身高的平均值;(2)请根据测量结果得到20名学生身高的中位数h (单位:厘米),将男、女生身高不低于h 和低于h 的人数填入下表中,并判断是否有90%的把握认为男、女生身高有差异? 人数 男生 女生身高h ≥ 身高h <参照公式:()()()()()22n ad bc k a b c d a c b d -=++++()20P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k2.7063.8415.0246.6357.87910.828175厘米为偏高.采用分层抽样的方法从以上男生中抽取5人作为样本.若从样本中任取2人,试求恰有1人身高属于正常的概率.22.某实验学校为提高学习效率,开展学习方式创新活动,提出了完成某项学习任务的两种新的学习方式.为比较两种学习方式的效率,选取40名学生,将他们随机分成两组,每组20人,第一组学生用第一种学习方式,第二组学生用第二种学习方式.40名学生完成学习任务所需时间的中位数40min m =,并将完成学习任务所需时间超过min m 和不超过min m 的学生人数得到下面的列联表:(Ⅰ)估计第一种学习方式且不超过m 的概率、第二种学习方式且不超过m 的概率; (Ⅱ)能否有99%的把握认为两种学习方式的效率有差异?附:()()()()()22n ad bc K a b c d a c b d -=++++,23.某科研小组为了验证一种治疗新冠肺炎的新药的效果,选60名患者服药一段时间后,记录了这些患者的生理指标x 和y 的数据,并统计得到如下的22⨯列联表(不完整):在生理指标 1.8x >的人中,设A 组为生理指标65y ≤的人,B 组为生理指标65y >的人,将他们服用这种药物后的康复时间(单位:天)记录如下: A 组:10,11,12,13,14,15,16,17,19. B 组:12,13,14,15,16,17,20,21,25.(1)填写上表,并判断是否有95%95%的把握认为患者的两项生理指标x 和y 有关系; (2)从A ,B 两组人中随机各选1人,A 组选出的人记为甲,B 组选出的人记为乙,求乙的康复时间比甲的康复时间长的概率.附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)20k0.2524.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关?(2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X,若用样本的频率作为概率,求随机变量X的分布列和期望.附:K2=2()()()()()n ad bca b c d a c b d-++++,其中n=a+b+c+d.25.某足球运动员进行射门训练,若打进球门算成功,否则算失败.已知某天该球员射门成功次数与射门距离的统计数据如下:(1)请问是否有90%的把握认为该球员射门成功与射门距离是否超过30米有关?参考公式及数据:22(),()()()()n ad bc K n a b c d a b c d a c b d -==+++++++.(2)当该球员距离球门30米射门时,设射门角(射门点与球场底线中点的连线和底线所成的锐角或直角)为([0,])2πθθ∈,其射门成功率为2+3()cos sin 4f θθθθθ=+⋅-,求该球员射门成功率最高时射门角θ的值.26.已知某种新型病毒的传染能力很强,给人们生产和生活带来很大的影响,所以创新研发疫苗成了当务之急.为此,某药企加大了研发投入,市场上这种新型冠状病毒的疫苗A 的研发费用x (百万元)和销量y (万盒)的统计数据如下:(1)根据上表中的数据,建立y 关于x 的线性回归方程y bx a =+(用分数表示); (2)根据所求的回归方程,估计当研发费用为1600万元时,销售量为多少?参考公式:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e=.故选:B.【点睛】本题考查非线性回归问题的转化,是基础题.2.B解析:B【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案.【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验,回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析,综上可知①是独立性检验,②是回归分析,故选B.【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.3.D解析:D【解析】【分析】根据公式()()()()()22n ad bcKa b c d a c b d-=++++,分别利用4个选项中所给数据求出2K的值,比较所求值的大小即可得结果.【详解】选项A:22160(535155)3204010502K⨯⨯-⨯==⨯⨯⨯,选项B:22260(5251515)152040204016K⨯⨯-⨯==⨯⨯⨯,选项C:22360(5201520)24204025357K⨯⨯-⨯==⨯⨯⨯,选项D:22 460(5101530)96 204035257K⨯⨯-⨯==⨯⨯⨯,可得222431K K K>>22K>,所以由选项D中的数据得到的2K值最大,说明X与Y有关系的可能性最大,故选D.【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2K越大两个变量有关的可能性越大这一性质.4.D解析:D【解析】【分析】由题意结合独立性检验的结论和临界值表给出结论即可.【详解】根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.本题选择D选项.【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.5.B解析:B【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人,又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人,又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530)4.762 3.8412109075225K⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”,故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.6.A解析:A【解析】分析:根据列联表中数据代入公式计算k 的值,和临界值表比对后即可得到答案. 详解:将列联表中数据代入公式可得()210045153010 3.030 2.70675255545k ⨯⨯-⨯=≈>⨯⨯⨯,所以有0090的把握认为“该市居民能否做到‘光盘’”与性别有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)7.D解析:D 【解析】由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数为m 0=5,平均数为x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m 0<m e <x . 故答案为D.点睛:这个题目考查的是条型分布直方表的应用,以及基本量:均值,平均数的考查;一般在这类图中平均数就是将数据加到一起除以数据的个数即可,在频率分布直方表中是取每个长方条的中点乘以相应的频率并相加即可.8.D解析:D 【解析】010.828,10.0010.99999.90k ≥∴-==,则有0099.9以上的把握认为秃发与患心脏病有关,故这种判断出错的可能性为10.9990.001-=,故选D.【方法点睛】本题主要考查独立性检验的实际应用,属于难题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)9.B解析:B 【解析】①中各小长方形的面积等于相应各组的频率;②正确,相关指数R 2越大,拟合效果越好,R 2越小,拟合效果越差;③随机变量ξ服从正态分布N (4,22),正态曲线对称轴为x =4,所以P (ξ>4)=;④对分类变量X 与Y ,若它们的随机变量K 2的观测值k 越小,则说明“X 与Y 有关系”的犯错误的概率越大.故选B.10.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C. 考点:独立性检验的意义.11.A解析:A 【解析】()22110403020207.8 6.63560506050k ⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为“爱好游泳运动与性别有关”,所以在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”12.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。
深圳龙岗中学选修1-2第一章《统计案例》检测卷(含答案解析)

一、选择题1.某校高二(1)班甲、乙两同学进行投篮比赛,他们进球的概率分别是34和45,现甲、乙各投篮一次,恰有一人进球的概率是( ) A .120B .320C .15D .7202.下列说法:①对于独立性检验,2χ的值越大,说明两事件相关程度越大;②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则c ,k 的值分别是4e 和0.3;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程y a bx =+中,2b =,1x =,3y =,则1a =;④通过回归直线y bx a =+及回归系数b ,可以精确反映变量的取值和变化趋势,其中正确的个数是( ) A .1B .2C .3D .43.下列命题不正确的是( )A .研究两个变量相关关系时,相关系数r 为负数,说明两个变量线性负相关B .研究两个变量相关关系时,相关指数R 2越大,说明回归方程拟合效果越好.C .命题“∀x ∈R ,cos x ≤1”的否定命题为“∃x 0∈R ,cos x 0>1”D .实数a ,b ,a >b 成立的一个充分不必要条件是a 3>b 3 4.下列命题:①在一个22⨯列联表中,由计算得2 6.679K =,则有99%的把握确认这两类指标间有关联②若二项式22nx x ⎛⎫+ ⎪⎝⎭的展开式中所有项的系数之和为243,则展开式中4x -的系数是40 ③随机变量X 服从正态分布()1,2N ,则()()02P X P X <=> ④若正数,x y 满足230x y +-=,则2x yxy+的最小值为3 其中正确命题的序号为( ) A .①②③B .①③④C .②④D .③④5.一个盒子里有7个红球,3个白球,从盒子里先取一个小球,然后不放回的再从盒子里取出一个小球,若已知第1个是红球的前提下,则第2个是白球的概率是( ) A .310B .13C .710D .236.在“新零售”模式的背景下,自由职业越来越流行,诸如:淘宝网店主、微商等等,现调研某自由职业者的工资收入情况,记x 表示该自由职业者的平均水平每天工作的小时数,y 表示平均每天工作x 个小时的月收入.假设y 与x 具有线性相关关系,则y 关与x 的线性回归方程ˆˆˆy bx a =+必经过点( )A .()33,B .()34,C .()44,D .()45,7.已知变量,X Y ,由它们的样本数据计算得到2K 的观测值 4.328k ≈,2K 的部分临界值表如下:以下判断正确的是( )A .在犯错误的概率不超过0.05的前提下认为变量,X Y 有关系B .在犯错误的概率不超过0.05的前提下认为变量,X Y 没有关系C .有97.5%的把握说变量,X Y 有关系D .有97.5%的把握说变量,X Y 没有关系 8.已知12P(B|A)=,P(A)=35,则()P AB 等于( ) A .56B .910 C .215D .1159.一射手对同一目标独立地进行4次射击,且射击结果之间互不影响.已知至少命中一次的概率为8081,则此射手的命中率为( ) A .19 B .13 C .23D .8 910.以下四个命题,其中正确的个数有( )①由独立性检验可知,有99%的把握认为物理成绩与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程^0.212y x =+中,当解释变量x 每增加一个单位时,预报变量ˆy平均增加0.2个单位;④对分类变量X 与Y ,它们的随机变量2K 的观测值k 来说,k 越小,“X 与Y 有关系”的把握程度越大.A .1B .2C .3D .411.对具有线性相关关系的变量x ,y 有一组观测数据(),i i x y (1,2,,8i =),其回归直线方程是1ˆ8ˆybx =+,且1238x x x x ++++=()123826y y y y ++++=,则实数ˆb的值是( ) A .116B .14C .13D .1212.下面给出四种说法:①用相关指数R 2来刻画回归效果,R 2越小,说明模型的拟合效果越好; ②命题P :“∃x 0∈R ,x 02﹣x 0﹣1>0”的否定是¬P :“∀x ∈R ,x 2﹣x ﹣1≤0”; ③设随机变量X 服从正态分布N (0,1),若P (x >1)=p 则P (﹣1<X <0)=12﹣p ④回归直线一定过样本点的中心(,x y ). 其中正确的说法有( ) A .①②③B .①②④C .②③④D .①②③④二、填空题13.甲、乙两位同学进行篮球三分球投篮比赛,甲每次投中的概率为13,乙每次投中的概率为12,每人分别进行三次投篮.乙恰好比甲多投进2次的概率是______. 14.为了了解司机开车时礼让斑马线行人的情况,交警部门调查了100名机动车司机,得到以下统计数据:若以2χ为统计量进行独立性检验,则2χ的值是__________.(结果保留2位小数) 参考公式()1122122121212n n n n n n n n n χ++++-=15.在一场对抗赛中,,A B 两人争夺冠军,若比赛采用“五局三胜制”,A 每局获胜的概率均为23,且各局比赛相互独立,则A 在第一局失利的情况下,经过五局比赛最终获得冠军的概率是_____.16.某质检员检验一件产品时,把正品误判为次品的概率是0.1,把次品误判为正品的概率是0.05.如果一箱产品中含有8件正品,2件次品,现从中任取1件让该质检员检验,那么出现误判的概率为___________.17.某校高三年级要从5名男生和2名女生中任选3名代表参加数学竞赛(每人被选中的机会均等),则在男生甲被选中的情况下,男生乙和女生丙至少一个被选中的概率是______.18.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”__________.(填有或没有)附:()()()()()22n ad bc K a b c d a c b d -=++++19.甲罐中有5个红球,2个白球和3个黑球,乙罐中有4个红球,3个白球和3个黑球.先从甲罐中随机取出一球放入乙罐,分别以1A ,2A 和3A 表示由甲罐取出的球是红球,白球和黑球的事件;再从乙罐中随机取出一球,以B 表示由乙罐取出的球是红球的事件,则下列结论中正确的是___________. ①()25P B =;②()1511P B A =;③事件B 与事件1A 相互独立;④1A ,2A ,3A 是两两互斥的事件20.近年来,新能源汽车技术不断推陈出新,新产品不断涌现,在汽车市场上影响力不断增大.动力蓄电池技术作为新能源汽车的核心技术,它的不断成熟也是推动新能源汽车发展的主要动力.假定现在市售的某款新能源汽车上,车载动力蓄电池充放电循环次数达到2000次的概率为85%,充放电循环次数达到2500次的概率为35%.若某用户的自用新能源汽车已经经过了2000次充电,那么他的车能够充电2500次的概率为______.三、解答题21.某士特产超市为预估2021年元旦期间游客购买土特产的情况,对2020年元且期间的90位游客购买情况进行统计,得到如下人数分布表.60元与性别有关.60元可抽奖3次,每次中奖概率为P (每次抽奖互不影响,且P 的值等于人数分布表中购买金额不少于60元的频率),中奖1次减5元,中奖2次减10元,中奖3次减15元若游客甲计划购买80元的土特产,请列出实际付款数X (元)的分布列并求其数学期望. 参考公式及数据:22()()()()()n ad bc K a b c d a c b d -=++++,n a b c d =+++ 附表:22.某县为了在全县营造“浪费可耻、节约为荣”的氛围,制定施行“光盘行动”有关政策,为进一步了解此项政策对市民的影响程度,县政府在全县随机抽取了100名市民进行调查,其中男士比女士少20人,表示政策无效的25人中有10人是女士.(1)完成下列22⨯列联表,并判断是否有99%的把握认为“政策是否有效与性别有关”;5名市民中任意抽取2名,对政策的有效性进行调研分析,求抽取的2人中有男士的概率.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++(n a b c d =+++)23.消费者信心指数是反映消费者信心强弱的指标;它是预测经济走势和消费趋向的一个先行指标,是监测经济周期变化的重要依据.消费者信心指数值介于0和200之间.指数超过100时,表明消费者信心处于强信心区;指数等于100时,表示消费者信心处于强弱临界点;指数小于100时,表示消费者信心处于弱信心区.我国某城市从2016年到2019年各季度的消费者信心指数如下表1:记2016年至2019年年份序号为,该城市各年消费者信心指数的年均值(四舍五入取整)为y ,x 与y 的关系如下表2:的消费者信心指数不小于2017年的消费者信心指数的概率;(2)根据表2得到线性回归方程为:ˆˆ4.4yx a =+,求ˆa 的值,并预报该城市2020年消费者信心指数的年平均值.(3)根据表2计算(,)x y 的相关系数r (保留两位小数),并判断是否正相关很强.参考数据和公式:ˆˆa y bx =-;12342.54x +++==;105112114119112.54y +++==23.45≈22.47≈;()()niix x y y r --=∑0.751r ≤≤时,y 与x 正相关很强.24.某沙漠地区经过治理,生态系统得到改善.为调查该地区植物覆盖面积(单位:公顷)和某种野生动物的数量的关系,将该地区分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(),i i x y (i =1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积和这种野生动物的数量,并计算得20160i i x ==∑,2011200i i y ==∑,()202180i i x x =-=∑,()20219000i i y y =-=∑,()()201800i ii x xy y =--=∑.(1)求样本(),i i x y (i =1,2,…,20)的相关系数(精确到0.01),并用相关系数说明各样区的这种野生动物的数量与植物覆盖面积的相关性.(2)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数()()20ii xx y y r --=∑.25.某学校六年级1、2两个班级同时进行一次数学竞赛考试,已知满分100分,分数不小于60视为及格,否则视为不及格,现随机抽取两个班级各40名学生的数学成绩,其结果如下表:(1)根据表中数据,分别估计六年级1、2两个班级数学竞赛考试的及格率;(2)根据以上数据,完成下面的22⨯列联表,并判断能否在犯错误的概率不超过0.1的情况下认为此次数学竞赛考试中学生数学及格与班级有关?(3)若按高分(大于等于80分为高分)与非高分的比例,从1班考试的分数中抽取4个分数,从2班考试的分数中抽取5个分数,记事件A:从上面4个1班考试的分数中随机抽取2个,且都不是高分;事件B:从上面5个2班考试的分数中随机抽取2个,一个是高分,一个不是高分.试通过计算说明这两个事件中哪一个事件发生的概率大.附:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.26.近年来,网络电商已经悄然进入了广大市民的日常生活,并慢慢改变了人们的消费方式为了更好地服务民众,某电商在其官方APP中设置了用户评价反馈系统,以了解用户对商品状况和优惠活动的评价现从评价系统中随机抽出200条较为详细的评价信息进行统计,商品状况和优惠活动评价的2×2列联表如下:(I)能否在犯错误的概率不超过0.001的前提下认为优惠活动好评与商品状况好评之间有关系?(Ⅱ)为了回馈用户,公司通过APP向用户随机派送每张面额为0元,1元,2元的三种优惠券用户每次使用APP购物后,都可获得一张优惠券,且购物一次获得1元优惠券,2元优惠券的概率分别是12,13,各次获取优惠券的结果相互独立若某用户一天使用了APP购物两次,记该用户当天获得的优惠券面额之和为X,求随机变量X的分布列和数学期望.参考数据参考公式:K 2()()()()2()n ad bc a b c d a c b d -=++++,其中n =a +b +c +d【参考答案】***试卷处理标记,请不要删除一、选择题1.D 解析:D 【分析】利用相互独立事件的概率乘法公式求得 甲投进而乙没有投进的概率,以及乙投进而甲没有投进的概率,相加即得所求. 【详解】甲投进而乙没有投进的概率为343(1)4520⨯-=,乙投进而甲没有投进的概率为341(1)455-⨯=,故甲、乙各投篮一次,恰有一人投进球的概率是 31720520+=,故选:D 【点睛】本题主要考查了相互独立事件的概率乘法公式的应用,体现了分类讨论的数学思想,属于中档题.2.C解析:C 【分析】根据独立性检验、非线性回归方程以及回归直线方程相关知识进行判断. 【详解】对于命题①,根据独立性检验的性质知,两个分类变量2χ越大,说明两个分类变量相关程度越大,命题①正确;对于命题②,由kx y ce =,两边取自然对数,可得ln ln y c kx =+, 令ln z y =,得ln z kx c =+,0.34z x =+,所以ln 40.3c k =⎧⎨=⎩,则40.3c e k ⎧=⎨=⎩,命题②正确;对于命题③,回归直线方程y a bx =+中,3211a y bx =-=-⨯=,命题③正确; 对于命题④,通过回归直线y bx a =+及回归系数b ,可估计和预测变量的取值和变化趋势,命题④错误.故选C. 【点睛】本题考查了回归直线方程、非线性回归方程变换以及独立性检验相关知识,考查推理能力,属于中等题.3.D解析:D 【分析】根据相关系数、相关指数的知识、全称命题的否定的知识,充分、必要条件的知识对四个选项逐一分析,由此得出命题不正确的选项. 【详解】相关系数r 为负数,说明两个变量线性负相关,A 选项正确. 相关指数2R 越大,回归方程拟合效果越好,B 选项正确.根据全称命题的否定是特称命题的知识可知C 选项正确.对于D 选项,由于33a b a b >⇔>,所以33a b >是a b >的充分必要条件,故D 选项错误.所以选D. 【点睛】本小题主要考查相关系数、相关指数的知识,考查全称命题的否定是特称命题,考查充要条件的判断,属于基础题.4.B解析:B 【解析】 【分析】根据2 6.679 6.635K =>可知①正确;代入1x =可求得5n =,利用展开式通项,可知3r =时,为含4x -的项,代入可求得系数为80,②错误;根据正态分布曲线的对称性可知③正确;由2121223x y x yxy y x y x ⎛⎫++=+=+⋅ ⎪⎝⎭,利用基本不等式求得最小值,可知④正确. 【详解】①2 6.679 6.635K =>,则有99%的把握确认这两类指标间有关联,①正确;②令1x =,则所有项的系数和为:3243n =,解得:5n = 52222n x x x x ⎛⎫⎛⎫∴+=+ ⎪ ⎪⎝⎭⎝⎭则其展开式通项为:()55355222rrrr r rC x C x x --⎛⎫=⋅⋅ ⎪⎝⎭当534r -=-,即3r =时,可得4x -系数为:335280C ⋅=,②错误;③由正态分布()1,2N 可知其正态分布曲线对称轴为1X = ()()02P X P X ∴<=>,③正确; ④212122122533x y x y x yxy y x y x y x ⎛⎫⎛⎫++=+=+⋅=++ ⎪ ⎪⎝⎭⎝⎭0x,0y > 20x y ∴>,20y x>224x y y x ∴+≥=(当且仅当22x y y x =,即x y =时取等号) ()214533x y xy +∴≥+=,④正确. 本题正确选项:B 【点睛】本题考查命题真假性的判断,涉及到独立性检验的基本思想、二项展开式各项系数和与指定项系数的求解、正态分布曲线的应用、利用基本不等式求解和的最小值问题.5.B解析:B 【解析】分析:设已知第一次取出的是红球为事件A ,第二次是白球为事件B ,先求出P AB ()的概率,然后利用条件概率公式进行计算即可.详解:设已知第一次取出的是红球为事件A ,第二次是白球为事件B .则由题意知,77371010930PA P AB ⨯===⨯(),(), 所以已知第一次取出的是白球,则第二次也取到白球的概率为7130|.7310PB A ()== . 故选B .点睛:本题主要考查条件概率的求法,熟练掌握条件概率的概率公式是关键. 6.C解析:C 【解析】分析:由题意结合回归方程的性质确定回归方程经过样本中心点即可. 详解:由题意可得:2345645x ++++==, 2.534 4.5645y ++++==,由线性回归方程的性质可知线性回归方程ˆˆˆy bx a =+经过样本中心点:()4,4.本题选择C 选项.点睛:本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.7.A解析:A 【解析】分析:根据所给的观测值,对照临界值表中的数据,即可得出正确的结论. 详解:∵观测值 4.328 3.841k ≈>, 而在观测值表中对应于3.841的是0.05,∴在犯错误的概率不超过0.05的前提下认为变量,X Y 有关系. 故选:A .点睛:本题考查了独立性检验的应用问题,是基础题.8.C解析:C 【解析】分析:根据条件概率的计算公式,即可求解答案. 详解:由题意,根据条件概率的计算公式()()|()P AB P B A P A =, 则()()()122|3515P AB P B A P A =⋅=⨯=,故选C. 点睛:本题主要考查了条件概率的计算公式的应用,其中熟记条件概率的计算公式是解答的关键,着重考查了推理与运算能力.9.C解析:C 【解析】设此射手未射中目标的概率为p ,则1-p 4=8081,所以p =13,故此射手的命中率为1-p =23. 故选C10.B解析:B 【解析】对于命题①认为数学成绩与物理成绩有关,不出错的概率是99%,不是数学成绩优秀,物理成绩就有99%的可能优秀,不正确;对于④,随机变量K 2的观测值k 越小,说明两个相关变量有关系的把握程度越小,不正确;容易验证②③正确,应选答案B 。
(常考题)北师大版高中数学高中数学选修2-3第三章《统计案例》检测题(有答案解析)
一、选择题1.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是()A.①回归分析,②取平均值B.①独立性检验,②回归分析C.①回归分析,②独立性检验D.①独立性检验,②取平均值2.某中学采取分层抽样的方法从高二学生中按照性别抽出20名学生,其选报文科、理科的情况如下表所示,参考公式和数据:22()()()()()n ad bcKa cb d a bc d-=++++,其中n a b c d=+++.则以下判断正确的是A.至少有97.5%的把握认为学生选报文理科与性别有关B.至多有97.5%的把握认为学生选报文理科与性别有关C.至少有95%的把握认为学生选报文理科与性别有关D.至多有95%的把握认为学生选报文理科与性别有关3.某班主任对全班50名学生进行了作业量的调查,数据如表:若推断“学生的性别与认为作业量大有关”,则这种推断犯错误的概率不超过()附:()()()()()22n ad bcKa b c d a c b d-=++++A.0.01 B.0.025 C.0.10 D.0.054.为了考查两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是( )A.l1和l2有交点(s,t)B.l1与l2相交,但交点不一定是(s,t)C.l1与l2必定平行D.l1与l2必定重合5.某市政府调查市民收入与旅游欲望时,采用独立性检验法抽取3 000人,计算发现k2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游欲望有关系的把握是()P(K2≥k)…0.250.150.100.0250.0100.005…k…1.3232.0722.7065.0246.6357.879…A.90% B.95% C.97.5% D.99.5%6.以下四个命题中:①在回归分析中,可用相关指数R2的值判断拟合的效果,R2越大,模型的拟合效果越好;②两个随机变量的线性相关性越强,相关系数的绝对值越接近1; ③若数据x 1,x 2,x 3,…,x n 的方差为1,则2x 1,2x 2,2x 3,…,2x n 的方差为2;④对分类变量x 与y 的随机变量K 2的观测值k 来说,k 越小,判断“x 与y 有关系”的把握程度越大.其中真命题的个数为( ) A .1 B .2 C .3 D .47.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女人患色盲的频率分别为0.038,0.006B .男、女人患色盲的概率分别为,C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关8.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A .平均数与方差 B .回归分析 C .独立性检验 D .概率 9.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程ˆ35yx =-,变量x 增加一个单位时,y 平均增加5个单位; ③线性回归方程^^^y b x a =+必过(),x y ;④在一个22⨯列联表中,由计算得213.079K =,则有99%以上的把握认为这两个变量间有关系.其中错误..的个数是( ) A .0 B .1 C .2D .310.若在区间[-5,5]内任取一个实数a ,则使直线x +y +a =0与圆(x -1)2+(y +2)2=2有公共点的概率为( ) A .25B .25C .35D .321011.由某个22⨯列联表数据计算得随机变量2K 的观测值k 6.879=,则下列说法正确的是 ( )0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0.7081.3232.0722.7063.8415.0246.6357.87910.828A .两个分类变量之间有很强的相关关系B .有99%的把握认为两个分类变量没有关系C .在犯错误的概率不超过1.0%的前提下认为这两个变量间有关系D .在犯错误的概率不超过0.5%的前提下认为这两个变量间有关系 12.某商场为了解毛衣的月销售量y (件)与月平均气温()x C 之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: )C(件)由表中数据算出线性回归方程ˆybx a =+中的2b =-,气象部门預测下个月的平均气温约为6C ,据此估计该商场下个月毛衣销售量约为( )件. A .46B .40C .38D .58二、填空题13.针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的13,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数的23.若有95%的把握认为是否喜欢韩剧和性别有关,求男生至少有______人.14.以下结论正确..的序号有_________ (1)根据22⨯列联表中的数据计算得出2K ≥6.635, 而P (2K ≥6.635)≈0.01,则有99% 的把握认为两个分类变量有关系.(2)在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关.(3)在线性回归分析中,相关系数为r ,r 越接近于1,相关程度越大;r 越小,相关程度越小.(4)在回归直线0.585y x =-中,变量200x =时,变量y 的值一定是15.15.某高校《统计初步》课程的教师随机调查了选该课的一些学生的情况,具体数据如下表: 专业 性别非统计专业统计专业男生1310女生720为了检验主修统计专业是否与性别有关系,根据表中的数据得到随机变量K 2的观测值为.因为k >3.841,所以确认“主修统计专业与性别有关系”,这种判断出现错误的可能性为________.16.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温.由表中数据得线性方程=+x 中=﹣2,据此预测当气温为5℃时,用电量的度数约为_____.17.以下四个命题中:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1;③某项测量结果ξ服从正态分布()21,σN ,()50.81ξP ≤=,则()30.19ξP ≤-=;④对于两个分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握程度越大.以上命题中其中真命题的个数为___________.18.从某高校在校大学生中随机选取5名女大学生,由她们身高和体重的数据得到的回归直线方程为ˆ0.7973.56yx =-,数据列表是:则其中的数据a =__________.19.以下4个命题中,正确命题的序号为_________.①“两个分类变量的独立性检验”是指利用随机变量2K 来确定是否能以给定的把握认为“两个分类变量有关系”的统计方法;②将参数方程cos sin x y θθ=⎧⎨=⎩(θ是参数,[]0,θπ∈)化为普通方程,即为221x y +=;③极坐标系中,22,3A π⎛⎫⎪⎝⎭与()3,0B 的距离是19; ④推理:“因为所有边长相等的凸多边形都是正多边形,而菱形是所有边长都相等的凸多边形,所以菱形是正多边形”,推理错误在于“大前提”错误. 20.下列说法:①线性回归方程y bx a =+必过(),x y ;②命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃<+<” ③相关系数r 越小,表明两个变量相关性越弱;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系;其中正确..的说法是__________.(把你认为正确的结论都写在横线上) 本题可参考独立性检验临界值表:三、解答题21.网购是当前人们购物的新方式,某公司为了改进营销方式,随机调查了100名市民,统计了不同年龄的人群网购的人数如下表: 年龄段(岁) ()0,20[)20,40[)40,60[)60100,网购人数 2632348 男性人数1510 105(1)若把年龄在[2060,的人称为“网购迷”,否则称为“非网购迷”,请完成下面的22⨯列联表,并判断能否在犯错误的概率不超过1%的前提下,认为网购与性别有关?网购迷 非网购迷 总计男性 女性 总计附:()()()()()22n ad bc K a b c d a c b d -=++++. ()20P K k ≥0.10 0.05 0.01 0.001两人年龄都小于20岁的概率.22.为了解使用手机是否对学生的学习有影响,某校随机抽取50名学生,对学习成绩和使用手机情况进行了调查,统计数据如表所示(不完整):与使用手机有关;(2)现从上表不使用手机的学生中按学习成绩是否优秀分层抽样选出9人,再从这9人中随机抽取3人,记这3人中“学习成绩优秀”的人数为X,试求X的分布列与数学期望.参考公式:()()()()()22n ad bca b c d a c b dχ-=++++,其中n a b c d=+++.参考数据:23.第十八届中国国际农产品交易会于11月27日在重庆国际博览中心开幕,我市全面推广“遂宁红薯”及“遂宁鲜”农产品区域公用品牌,并组织了100家企业、1000个产品进行展示展销,扩大优质特色农产品市场的占有率和影响力,提升遂宁特色农产品的社会认知度和美誉度,让来自世界各地的与会者和消费者更深入了解遂宁,某记者对本次农交会进行了跟踪报道和实际调查,对某特产的最满意度()%x和对应的销售额y(万元)进行了调查得到以下数据:关系数r的绝对值在0.95以上(含0.95)是线性相关性较强;否则,线性相关性较弱.请你对线性相关性强弱作出判断,并给出理由;(2)如果没有达到较强线性相关,则采取“末位淘汰”制(即销售额最少的那一天不作为计算数据),并求在剔除“末位淘汰”的那一天后的销量额y 关于最满意度x 的线性回归方程(系数精确到0.1). 参考数据:24x =,81y =,52215146ii xx =-=∑, 52215176i i y y =-=∑,515151i ii x y xy =-=∑13.27≈≈.附:对于一组数据()()()1122,,,,,,n n x y x y x y ⋅⋅⋅.其回归直线方程 ˆˆˆy bx a =+的斜率和截距的最小二乘法估计公式分别为:1221ˆ·ni ii n ii x y nx y bxnx ==-=-∑∑,ˆa y bx=-,线性相关系数·ni ix y nx y r -=∑24.某实验学校为提高学习效率,开展学习方式创新活动,提出了完成某项学习任务的两种新的学习方式.为比较两种学习方式的效率,选取40名学生,将他们随机分成两组,每组20人,第一组学生用第一种学习方式,第二组学生用第二种学习方式.40名学生完成学习任务所需时间的中位数40min m =,并将完成学习任务所需时间超过min m 和不超过min m 的学生人数得到下面的列联表:(Ⅰ)估计第一种学习方式且不超过m 的概率、第二种学习方式且不超过m 的概率; (Ⅱ)能否有99%的把握认为两种学习方式的效率有差异?附:()()()()()22n ad bc K a b c d a c b d -=++++,25.为了响应国家号召,某校组织部分学生参与了“垃圾分类,从我做起”的知识问卷作答,并将学生的作答结果分为“合格”与“不合格”两类与“问卷的结果”有关?(1)是否有90%以上的把握认为“性别”与“问卷的结果”有关?(2)在成绩合格的学生中,利用性别进行分层抽样,共选取9人进行座谈,再从这9人中随机抽取5人发送奖品,记拿到奖品的男生人数为X,求X的分布列及数学期望()E X.附:22()()()()()n ad bcKa b c d a c b d-=++++26.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,P(K2≥k)0.050 0.010 0.001k 3.841 6.63510.828【参考答案】***试卷处理标记,请不要删除一、选择题1.B解析:B【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案.【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验,回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析,综上可知①是独立性检验,②是回归分析,故选B.【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.2.C解析:C【解析】由题易得22⨯列联表如下:则2K的观测值为()220235104.432 3.841128713k⨯⨯-⨯=≈>⨯⨯⨯,所以至少有95%的把握认为学生选报文理科与性别有关,故选:C.【解题必备】(1)独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握认为两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系.(2)列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此,需要用独立性检验的方法确认所得结论在多大程度上适用于总体.即独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释. (3)独立性检验的具体做法:①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α, 然后查下表确定临界值0k ; ②利用公式()()()()()22n ad bc K a c b d a b c d -=++++,计算随机变量2K 的观测值k ;③如果0k k ≥,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”.说明:通常认为 2.706k ≤时,样本数据就没有充分的证据显示“X 与Y 有关系”.3.B解析:B 【解析】分析:根据表格中所给数据,代入公式()()()()()22n ad bc K a b c d a c b d -=++++,求出观测值,把所求的观测值同临界值进行比较,从而可得结果. 详解:根据表中数据得到()2250181589 5.059 5.024********K ⨯⨯-⨯=≈>⨯⨯⨯,所以,若推断“学生的性别与认为作业量大有关”, 则这种推断犯错误的概率不超过0.025,故选B.点睛:本题主要考查独立性检验的应用,解题的关键是正确求出这组数据的观测值,计算过程一定要细心,避免出现计算错误,属于基础题.4.A解析:A 【解析】回归直线方程过样本中心点,过A 选项正确.5.C解析:C 【详解】∵2 6.023 5.024K=>∴可断言市民收入增减与旅游欲望有关的把握为97.5%.故选C.点睛:本题主要考查独立性检验的实际应用.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式22()()()()()n ad bcKa b c d a c b d-=++++,计算出2K的值;(3)查表比较2K与临界值的大小关系,作统计判断.6.B解析:B【解析】由题意得,若数据x1,x2,x3,…,x n的方差为1,则2x1,2x2,2x3,…,2x n的方差为4,所以③不正确;对分类变量x与y的随机变量K2的观测值k来说,k越小,判断“x与y 有关系”的把握程度越小,所以④不正确.其中①、②是正确的,故选B.7.C解析:C【解析】男人中患色盲的比例为,要比女人中患色盲的比例大,其差值为,差值较大,所以认为患色盲与性别是有关的.考点:独立性检验.8.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C.考点:独立性检验的意义.9.B解析:B【解析】一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①正确;回归方程中x的系数具备直线斜率的功能,对于回归方程y35x=-,当x增加一个单位时,y平均减少5个单位,②错误;由线性回归方程的定义知,线性回归方程y= b x+a必过点(),x y,③正确;因为213.079 6.635K=>,故有0099以上的把握认为这两个变量间有关系,④正确,即错误的个数为1,故选B. 10.B解析:B【解析】∵直线0x y a ++=与圆()()22122x y -+=+有公共点,∴≤13a -≤≤,∴在区间[55]-,内任取一个实数a ,使直线0x y a ++=与圆()()22122x y -+=+有公共点的概率为312555+=+,故选B. 点睛:本题主要考查了几何概型的概率,以及直线与圆相交的性质,解题的关键弄清概率类型,同时考查了计算能力,属于基础题;利用圆心到直线的距离小于等于半径可得到直线与圆有公共点,可求出满足条件的a ,最后根据几何概型的概率公式可求出所求.11.C解析:C 【解析】由22⨯列联表数据计算得随机变量2K 的观测值是 6.879 6.635k =>,通过对照表中数据得,在犯错误的概率不超过1.0%的前提下,认为这两个变量间有关系,故选C.12.A解析:A 【解析】试题分析:根据题意,样本中心点的坐标为()10,38,所以38210,58a a =-⨯+∴=,因此回归直线方程为2ˆ58yx =-+,所以当6x =时,估计该商场下个月毛衣销售量约为26ˆ5846y=-⨯+=,故选A. 考点:回归直线方程.二、填空题13.【分析】设男生人数为依题意填写列联表计算观测值列出不等式求出的取值范围再根据题意求出男生的人数【详解】设男生人数为由题意可得列联表如下: 喜欢韩剧 不喜欢韩剧 总计 男生 女生 总 解析:18【分析】设男生人数为x ,依题意填写列联表,计算观测值,列出不等式求出x 的取值范围,再根据题意求出男生的人数. 【详解】设男生人数为x ,由题意可得列联表如下:则 3.841k>,即2452()3636969 3.84171711931818x x x x xxkx x xx⋅-⋅==>⋅⋅⋅,解得12.697x>.因为各部分人数均为整数,所以若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有18人.故答案为:18.【点睛】本题考查独立性检验的应用,解题关键是列出列联表,然后进行计算,属于常考题. 14.(1)(3)【解析】分析:根据独立性检验残差图相关系数回归分析的定义及性质逐一分析四个答案的真假即可详解:对于(1)根据2×2列联表中的数据计算得出≥6635而P(≥6635)≈001则有99的把握解析:(1)(3).【解析】分析:根据独立性检验、残差图、相关系数、回归分析的定义及性质,逐一分析四个答案的真假即可.详解:对于(1),根据2×2列联表中的数据计算得出2K≥6.635, 而P(2K≥6.635)≈0.01,则有99%的把握认为两个分类变量有关系,故(1)正确.对于(2),根据残差图的意义可得,当带状区域的宽度较小时,说明选用的模型比价合适,而当带状区域的宽度较大时,说明选用的模型不合适,故(2)不正确.对于(3),在线性回归分析中,相关系数为r,|r|越接近于1,则相关程度越大;|r|越接近于0,则相关程度越小.故(3)正确.对于(4),在回归直线y=0.5x−85中,当x=200时,y=15,但实际观测值可能不是15,故(4)不正确.综上可得(1)(3)正确.点睛:本题考查回归分析和独立性检验的基本知识,属于基础类题目,解题的关键是熟记相关的的概念和性质.15.5【解析】因为随机变量K2的观测值k>3841所以在犯错误的概率不超过005的前提下认为主修统计专业与性别有关系故这种判断出现错误的可能性为5考点:独立性检验思想解析:5% 【解析】因为随机变量K 2的观测值k >3.841,所以在犯错误的概率不超过0.05的前提下认为“主修统计专业与性别有关系”.故这种判断出现错误的可能性为5%. 考点:独立性检验思想.16.40【解析】试题分析:根据所给的表格做出本组数据的样本中心点根据样本中心点在线性回归直线上利用待定系数法做出a 的值现在方程是一个确定的方程根据所给的x 的值代入线性回归方程预报要销售的件数解:由表格得解析:40 【解析】试题分析:根据所给的表格做出本组数据的样本中心点,根据样本中心点在线性回归直线上,利用待定系数法做出a 的值,现在方程是一个确定的方程,根据所给的x 的值,代入线性回归方程,预报要销售的件数.解:由表格得=(14+12+8+6)÷4=10,=(22+26+34+38)÷4=30 即样本中心点的坐标为:(10,40), 又∵样本中心点(10,40)在回归方程 上且b=﹣2∴30=10×(﹣2)+a , 解得:a=50, ∴当x=5时,y=﹣2×(5)+50=40. 故答案为40.考点:回归分析的初步应用.17.【解析】试题分析:对于①从匀速传递的新产品生产流水线上质检员每20分钟抽取一件新产品进行某项指标检测这样的抽样是系统抽样而不是分层抽样故①错;对于②两个随机变量的相关性知识可知②正确;对于③变量所以 解析:2【解析】试题分析:对于①,从匀速传递的新产品生产流水线上,质检员每20分钟抽取一件新产品进行某项指标检测,这样的抽样是系统抽样,而不是分层抽样,故①错;对于②,两个随机变量的相关性知识可知②正确;对于③变量2(1,)N ξσ~,所以()()30.191510.810.19ξξP ≤-==-P ≤=-=,故③正确;对于④,随机变量2K 观测值k 来说,k 越大,“X 与Y 有关系”的把握程度越大,故④错,所以真命题有2个. 考点:1. 回归分析的基本思想及其应用初步;2.统计与概率.18.163【解析】由根据回归直线经过样本中心即得由得故答案为解析:163 【解析】由4953565864565y ++++==,根据回归直线经过样本中心(),x y ,即560.7973.56x =⨯-,得164x =,由1551611671741645a x ++++==,得163a =,故答案为163.19.①③④【解析】①是独立性检验的应用①对②中由于所以显然是半个圆②错③中由极坐标中两点距离公式=③对④中所有边长相等的凸多边形都是正多边形为大前提是错误的因为只需要正多边形挤压变形使之仍为凸多边形即可解析:①③④ 【解析】①是独立性检验的应用,①对.②中由于[]0,θπ∈,所以01y ≤≤,显然是半个圆,②错.③中,由极坐标中两点距离公式2221212212cos()AB ρρρρθθ=+--=14912()19,2+-⨯-=AB ③对.④中“所有边长相等的凸多边形都是正多边形”为大前提,是错误的,因为只需要正多边形挤压变形,使之仍为凸多边形即可.④对.所以填①③④.20.①④【解析】分析:根据性回归方程独立性检验相关关系以及命题的否定等知识选出正确的得到结果详解:线性回归方程必过样本中心点故①正确命题的否定是故②错误③相关系数r 绝对值越小表明两个变量相关性越弱故不正解析:①④ 【解析】分析:根据性回归方程,独立性检验,相关关系,以及命题的否定等知识,选出正确的,得到结果.详解:线性回归方程ˆˆˆy bx a =+必过样本中心点(),x y ,故①正确.命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃≥+<” 故②错误 ③相关系数r 绝对值越小,表明两个变量相关性越弱,故不正确;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系,正确. 故答案为①④.点睛:本题以命题真假的判断为载体,着重考查了相关系数、命题的否定、独立性检验、回归直线方程等知识点,属于中档题.三、解答题21.(1)列联表答案见解析,能在犯错误的概率不超过1%的前提下,认为网购与性别有关;(2)310.【分析】(1)根据表格中的数据可题中信息可完善22⨯列联表,计算出2K 的观测值,结合临界值表可得出结论;(2)计算得出年龄段()0,20应抽取3人,分别记为1、2、3;年龄段[)20,40应抽取2人,分别记为a 、b ,列举出所有的基本事件,并确定事件“所抽的两人年龄都小于20岁”所包含的基本事件,利用古典概型的概率公式可求得所求事件的概率. 【详解】(1)由题中信息可完善22⨯列联表如下表所示:计算得()2100201446207.605 6.63566344060K ⨯⨯-⨯=≈>⨯⨯⨯,故能在犯错误的概率不超过1%的前提下,认为网购与性别有关;(2)年龄在()0,20、[)20,40网购男性分别有15人、10人.按分层抽样的方法随机抽取5人,年龄段()0,20应抽取3人,分别记为1、2、3;年龄段[)20,40应抽取2人,分别记为a 、b .从中随机抽取2人的一切可能结果所组成的基本事件共10个:()1,2、()1,3、()1,a 、()1,b 、()2,3、()2,a 、()2,b 、()3,a 、()3,b 、(),a b .用A 表示“两人年龄都小于20岁”这一事件,则事件A 由3个基本事件组成:()1,2、()1,3、()2,3.故事件A 的概率为()310P A =. 【点睛】方法点睛:求解古典概型的概率方法如下: (1)列举法; (2)列表法; (3)树状图法; (4)排列、组合数的应用.22.(1)没有99.9%的把握认为学生的学习成绩与使用手机有关;(2)分布列见解析,()2E X =.【分析】(1)根据表格中数据和题中信息可完善22⨯列联表,计算出2χ的观测值,结合临界值表可得出结论;(2)由题意可知,随机变量X 的可能取值有0、1、2、3,计算出随机变量X 在不同取值下的概率,可得出随机变量X 的分布列,进而可求得随机变量X 的数学期望值. 【详解】(1)22⨯列联表如下表所示:()22505102015258.33310.828203025253χ⨯⨯-⨯==≈<⨯⨯⨯,所以,没有99.9%的把握认为学生的学习成绩与使用手机有关;(2)9人中学习成绩优秀的人有209630⨯=人,学习成绩一般的有109330⨯=人, X 可能的取值有0、1、2、3,()3911084P X C ===,()1263393114C C P X C ===,()21633915228C C P X C ===,()363953?21C P X C ===.所以,随机变量X 的分布列为()1232142821E X =⨯+⨯+⨯=. 【点睛】思路点睛:求解随机变量分布列的基本步骤如下:(1)明确随机变量的可能取值,并确定随机变量服从何种概率分布; (2)求出每一个随机变量取值的概率;(3)列成表格,对于抽样问题,要特别注意放回与不放回的区别,一般地,不放回抽样由排列、组合数公式求随机变量在不同取值下的概率,放回抽样由分步乘法计数原理求随机变量在不同取值下的概率.23.(1)0.94r ≈,线性相关性较弱;(2) +77.3ˆyx =。
(必考题)高中数学选修1-2第一章《统计案例》检测(答案解析)(1)
一、选择题1.为了提升全民身体素质,学校十分重视学生体育锻炼.某校篮球运动员进行投篮练习,若他前一球投进则后一球投进的概率为34,若他前一球投不进则后一球投进的概率为14.若他第1球投进的概率为34,则他第3球投进的概率为( ) A .34B .58C .116D .9162.甲、乙两人进行乒乓球比赛,假设每局比赛甲胜的概率是0.6,乙胜的概率是0.4.那么采用5局3胜制还是7局4胜制对乙更有利?( ) A .5局3胜制B .7局4胜制C .都一样D .说不清楚3.某研究性学习小组调查研究学生玩手机对学习的影响,部分统计数据如表经计算2K 的值,则有( )的把握认为玩手机对学习有影响. A .95%B .99%C .99.5%D .99.9%4.袋中装有10个形状大小均相同的小球,其中有6个红球和4个白球.从中不放回地依次摸出2个球,记事件A =“第一次摸出的是红球”,事件B =“第二次摸出的是白球”,则(|)P B A =( )A .25B .415C .49D .595.某射手射击一次命中的概率为0.8,连续两次射击均命中的概率是0.6,已知该射击手某次射中,则随后一次射中的概率是( ) A .34B .45C .35D .7106.已知12P(B|A)=,P(A)=35,则()P AB 等于( ) A .56B .910 C .215D .1157.甲罐中有5个红球,2个白球和3个黑球,乙罐中有6个红球,2个白球和2个黑球,先从甲罐中随机取出一个球放入乙罐,分别以1A ,2A ,3A 表示由甲罐取出的球是红球、白球和黑球的事件,再从乙罐中随机取出一个球,以B 表示由乙罐取出的球是红球的事件,下列结论中不正确...的是( ) A .事件B 与事件1A 不相互独立 B .1A 、2A 、3A 是两两互斥的事件 C .17(|)11P B A =D .3()5P B =8.下列说法中正确的是( )A .设随机变量~(10,0.01)X N ,则1(10)2P X >= B .线性回归直线不一定过样本中心点(,)x yC .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1D .先把高三年级的2000名学生编号:1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +,100m +,150m +,……的学生,这样的抽样方法是分层抽样9.若对于变量x 的取值为3,4,5,6,7时,变量y 对应的值依次分别为4.0,2.5,-0.5,-1,-2;若对于变量u 的取值为1,2,3,4时,变量v 对应的值依次分别为2,3,4,6,则变量x 和y ,变量u 和v 的相关关系是( ) A .变量x 和y 是正相关,变量u 和v 是正相关 B .变量x 和y 是正相关,变量u 和v 是负相关 C .变量x 和y 是负相关,变量u 和v 是负相关 D .变量x 和y 是负相关,变量u 和v 是正相关 10.在一次独立性检验中,得出列表如下:且最后发现,两个分类变量A 和B 没有任何关系,则a 的可能值是( ) A .720B .360C .180D .9011.下列有关结论正确的个数为( )①小赵、小钱、小孙、小李到4个景点旅游,每人只去一个景点,设事件A =“4个人去的景点不相同”,事件B =“小赵独自去一个景点”,则()2|9P A B =; ②设,a b ∈R ,则“22log log a b >”是“21a b ->的充分不必要条件;③设随机变量ξ服从正态分布(),7N μ,若()()24P P ξξ<=>,则μ与D ξ的值分别为3,7D μξ==. A .0B .1C .2D .312.通过随机询问72名不同性别的学生在购买食物时是否看营养说明,得到如下列联表:女 男 总计 读营养说明 16 28 44 不读营养说明 20 8 28 总计363672参考公式:22()()()()()n ad bc K a b c d a c b d -=++++20()P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k 2.7063.8415.0246.6357.87910.828则根据以上数据:A .能够以99.5%的把握认为性别与读营养说明之间无关系;B .能够以99.9%的把握认为性别与读营养说明之间无关系;C .能够以99.5%的把握认为性别与读营养说明之间有关系;D .能够以99.9%的把握认为性别与读营养说明之间有关系;二、填空题13.甲、乙两名同学参加一项射击比赛游戏,其中任何一人每射击一次击中目标得2分,未击中目标得0分.若甲、乙两人射击的命中率分别为35和p,且甲、乙两人各射击一次得分之和为2的概率为920.假设甲、乙两人射击互不影响,则p 值为______. 14.对标有不同编号的6件正品和4件次品的产品进行检测,不放回地依次摸出2件.在第一次摸出正品的条件下,第二次也摸到正品的概率是_________.15.如图, A, B, C 表示3种开关,设在某段时间内它们正常工作的概率是分别是0.9 , 0.8 , 0.7 , 如果系统中至少有1个开关能正常工作,则该系统就能正常工作, 那么该系统正常工作的概率是____________16.关于变量,x y 的一组样本数据11()a b ,,22()a b ,,……,(),n n a b (2n ≥,12,,,n a a a ⋅⋅⋅不全相等)的散点图中,若所有样本点(,)i i a b (1,2,,i n =⋅⋅⋅)恰好都在直线21y x =-+上,则根据这组样本数据推断的变量,x y 的相关系数为_____________.17.用线性回归模型求得甲、乙、丙3组不同的数据对应的2R的值分别为0.81,0.98,0.63,其中__________(填甲、乙、丙中的一个)组数据的线性回归的效果最好.18.甲、乙两篮球运动员进行定点投篮,每人各投4个球,甲投篮命中的概率为12,乙投篮命中的概率为23,求甲至多命中2个且乙至少命中2个概率____.19.甲、乙两个小组各10名学生的英语口语测试成绩的茎叶图如图所示.现从这 20名学生中随机抽取一人,将“抽出的学生为甲小组学生”记为事件A;“抽出的学生英语口语测试成绩不低于85分”记为事件B.则P(A|B)的值是_____.20.近年来,新能源汽车技术不断推陈出新,新产品不断涌现,在汽车市场上影响力不断增大.动力蓄电池技术作为新能源汽车的核心技术,它的不断成熟也是推动新能源汽车发展的主要动力.假定现在市售的某款新能源汽车上,车载动力蓄电池充放电循环次数达到2000次的概率为85%,充放电循环次数达到2500次的概率为35%.若某用户的自用新能源汽车已经经过了2000次充电,那么他的车能够充电2500次的概率为______.三、解答题21.2020年1月24日,中国疾控中心成功分离中国首株新型冠状病毒毒种.6月19日,中国首个新冠mRNA疫苗获批启动临床试验,截至2020年10月20日,中国共计接种了约6万名受试者,为了研究年龄与疫苗的不良反应的统计关系,现从受试者中采取分层抽样抽取100名,其中大龄受试者有30人,舒张压偏高或偏低的有10人,年轻受试者有70人,舒张压正常的有60人.(1)根据已知条件完成下面的22⨯列联表,并据此资料你是否能够以99%的把握认为受试者的年龄与舒张压偏高或偏低有关?大龄受试者年轻受试者合计舒张压偏高或偏低舒张压正常合计6人,从抽出的6人中任取3人,设取出的大龄受试者人数为X,求X的分布列和数学期望.运算公式:()()()()()22n ad bcKa b c d a c b d-=++++,对照表:22.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:乙厂:(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面22⨯列联表,并问是否有0099的把握认为“两个分厂生产的零件的质量有差异”.附:22()()()()()n ad bcKa b c d a c b d-=++++23.为推动更多人阅读,联合国教科文组织确定每年的4月23日为“世界读书日”.设立目的是希望居住在世界各地的人,无论你是年老还是年轻,无论你是贫穷还是富裕,都能享受阅读的乐趣,都能尊重和感谢为人类文明做出过巨大贡献的思想大师们,都能保护知识产权.为了解不同年龄段居民的主要阅读方式,某校兴趣小组在全市随机调查了200名居民,经统计这200人中通过电子阅读与纸质阅读的人数之比为3:1,将这200人按年龄分组,其中统计通过电子阅读的居民得到的频率分布直方图如图所示. (1)求a 的值及通过电子阅读的居民的平均年龄;(2)把年龄在第123,,组的居民称为青少年组,年龄在第45,组的居民称为中老年组,若选出的200人中通过纸质阅读的中老年有30人,请完成上面22⨯列联表,则是否有97.5%的把握认为阅读方式与年龄有关? ()()()()()22n ad bc K a b a d b c c d -=++++()2P K k >0.15 0.100.050.025 0.010 0.005 0.001k2.0722.7063.8415.0246.6357.879 10.82824.微信是腾讯公司推出的一种手机通讯软件,它支持发送语音短信、视频、图片和文字,一经推出便风靡全国,甚至涌现出一批在微信的朋友圈内销售商品的人(被称为微商).为子调查每天微信用户使用微信的时间,某经销化妆品的微商在一广场随机采访男性、女性用户各50名,将男性、女性使用微信的时间分成5组:(]0,2,(]2,4,(]4,6,(]6,8,(]8,10分别加以统计,得到如图所示的频率分布直方图.(1)根据女性频率分布直方图估计女性使用微信的平均时间;(2)若每天再微信超过4个小时的用户列为“微信控”,否则称其为“非微信控”,请你根据已知条件完成22⨯的列联表,并判断是否有90%的把握认为“微信控”与“性别有关”? 25.2019年,中国的国内生产总值(GDP )已经达到约100万亿元人民币,位居世界第二,这其中实体经济的贡献功不可没实体经济组织一般按照市场化原则运行,某生产企业一种产品的成本由原料成本及非原料成本组成,每件产品的非原料成本y (元)与生产该产品的数量x (千件)有关,经统计得到如下数据:x1 2 3 4 5 6 7 8 y1126144.53530.5282524根据以上数据,绘制了如下的散点图.现考虑用反比例函数模型by a x=+和指数函数模型dx y ce =分别对两个变量的关系进行拟合.为此变换如下:令1xμ=,则y a b μ=+,即y 与μ满足线性关系;令ln νμ=,则ln c dx ν=+,即ν与x 也满足线性关系.这样就可以使用最小二乘法求得非线性的回归方程.已求得用指数函数模型拟合的回归方程为96.54dx y e =,ν与x 的相关系数10.94r =-,其他参考数据如表(其中1ln i i i iy x μν==).(1)求指数函数模型和反比例函数模型中y 关于x 的回归方程;(2)试计算y 与μ的相关系数2r ,并用相关系数判断:选择反比例函数和指数函数两个模型中的哪一个拟合效果更好(计算精确到0.01)?(3)根据(2)小题的选择结果,该企业采取订单生产模式(即根据订单数量进行生产,产品全部售出).根据市场调研数据,该产品单价定为100元时得到签订订单的情况如表:已知每件产品的原料成本为10元,试估算企业的利润是多少?(精确到1千元) 参考公式:对于一组数据()11,μν,()22,μν,⋅⋅⋅,(),n n μν,其回归直线ναβμ=+的斜率和截距的最小二乘估计分别为:1221ni i i nii n n μνμνβμμ==-=-∑∑,ανβμ=-,相关系数ni in r μνμν-=∑26.为更好地落实农民工工资保证金制度,南方某市劳动保障部门调查了2018年下半年该市100名农民工(其中技术工、非技术工各50名)的月工资,得到这100名农民工的月工资均在[]25,55(百元)内,且月工资收入在[45,50)(百元)内的人数为15,并根据调查结果画出如图所示的频率分布直方图:(1)求n 的值;(2)已知这100名农民工中月工资高于平均数的技术工有31名,非技术工有19名. ①完成如下所示22⨯列联表技术工 非技术工 总计 月工资不高于平均数 50 月工资高于平均数50 总计5050100②则能否在犯错误的概率不超过0.001的前提下认为是不是技术工与月工资是否高于平均数有关系?参考公式及数据:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()20P K k ≥0.050.01 0.005 0.001 0k 3.8416.6357.87910.828【参考答案】***试卷处理标记,请不要删除一、选择题 1.D解析:D 【分析】分两种情况讨论:第2球投进和第2球投不进,利用独立事件的概率公式可得出所求事件的概率. 【详解】分以下两种情况讨论: (1)第2球投进,其概率为3311544448⨯+⨯=,第3球投进的概率为53158432⨯=; (2)第2球投不进,其概率为53188-=,第3球投进的概率为3138432⨯=. 综上所述:第3球投进的概率为1539323216+=,故选D. 【点睛】本题考查概率的求法,考查独立事件概率乘法公式的应用,同时也考查对立事件概率公式的应用,解题时要注意对事件进行分类讨论,考查运算求解能力,属于中等题.2.A解析:A 【分析】分别计算出乙在5局3胜制和7局4胜制情形下对应的概率,然后进行比较即可得出答案. 【详解】当采用5局3胜制时,乙可以3:0,3:1,3:2战胜甲,故乙获胜的概率为:322222340.4+0.40.60.40.40.60.40.3174C C ⨯⨯+⨯⨯≈;当采用7局4胜制时,乙可以4:0,4:1,4:2,4:3战胜甲,故乙获胜的概率为:4333323334560.4+0.40.60.40.40.60.4+0.40.60.40.2898C C C ⨯⨯+⨯⨯⨯⨯≈,显然采用5局3胜制对乙更有利,故选A. 【点睛】本题主要考查相互独立事件同时发生的概率,意在考查学生的计算能力和分析能力,难度中等.3.C解析:C 【解析】分析:利用公式求得观测值2K ,对照数表,即可得出正确的结论. 详解:根据列联表可得()223042168=1020101218K ⨯⨯-⨯=⨯⨯⨯,27.8791010.828K <=<,对照数表知,有99.5%的把握认为玩手机对学习有影响,故选C.点睛:本题考查了独立性检验的应用问题,是基础题目. 独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.4.C解析:C 【解析】分析:利用概率的计算公式,求解事件A 和事件A B 的概率,即可利用条件概率的计算公式,求解答案.详解:由题意,事件A =“第一次摸出的是红球”时,则63()105P A ==, 事件A =“第一次摸出的是红球”且事件B =“第二次摸出白球”时,则6412()10945P AB =⨯=, 所以()4(|)()9P AB P B A P A ==,故选C . 点睛:本题主要考查了条件概率的计算,其中熟记条件概率的计算公式和事件的概率是解答的关键,着重考查了分析问题和解答问题的能力,以及推理与计算能力.5.A解析:A 【解析】分析:某次射中,设随后一次射中的概率为p ,利用相互独立事件概率乘法公式能求出p 的值.详解:某次射中,设随后一次射中的概率为p ,∵某射击手射击一次命中的概率为0.8,连续两次均射中的概率是0.5,0.80.6p ,∴= 解得34p =.故选:A .点睛:本题考查概率的求法,涉及到相互独立事件概率乘法公式的合理运用,考查推理论证能力、运算求解能力、数据处理能力,考查化归与转化思想,是基础题.6.C解析:C 【解析】分析:根据条件概率的计算公式,即可求解答案. 详解:由题意,根据条件概率的计算公式()()|()P AB P B A P A =, 则()()()122|3515P AB P B A P A =⋅=⨯=,故选C. 点睛:本题主要考查了条件概率的计算公式的应用,其中熟记条件概率的计算公式是解答的关键,着重考查了推理与运算能力.7.D解析:D 【解析】分析:由题意1A ,2A ,3A是两两互斥事件,条件概率公式求出1(|)P B A ,()()()()123P B P A B P A B P A B =++,对照选项即可求出答案.详解:由题意1A ,2A ,3A是两两互斥事件, ()()()12351213,,10210510P A P A P A =====, ()()()111177211|1112P BA P B A P A ⨯===,()23|11P B A =,()33|11P B A =,而()()()()123P B P A B P A B P A B =++()()()()()()112233|||P A P B A P A P B A P A P B A =++1713332115111011=⨯+⨯+⨯ 511=. 所以D 不正确. 故选:D.点睛:本题考查相互独立事件,解题的关键是理解题设中的各个事件,且熟练掌握相互独立事件的概率简洁公式,条件概率的求法,本题较复杂,正确理解事件的内蕴是解题的关键.8.A解析:A 【解析】在A 中,设随机变量X 服从正态分布N (10,0.01),则由正态分布性质得1(10)2P X >=,故A 正确; 在B 中,线性回归直线一定过样本中心点(),x y ,故B 错误;在C 中,若两个随机变量的线性相关性越强,则相关系数r 的绝对值越接近于1,故C 错误;在D 中,先把高三年级的2000名学生编号:1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为m+50,m+100,m+150…的学生,这样的抽样方法是系统抽样法,故D 错误. 故选:A9.D解析:D 【解析】变量x 增加,变量y 减少,所以变量x 和y 是负相关;变量u 增加,变量v 增加,所以变量u 和v 是正相关,因此选D.10.B解析:B 【解析】∵两个分类变量A 和B 没有任何关系,∴()()()()2259010090400 2.70219040090500a a K a a +-⨯=<⨯++,代入验证可知360a =满足,故选B.11.D解析:D 【解析】对于①,4344443273()()464432A PB P AB ⨯====,,所以()2()()9P AB P A B P B ==,故①正确;对于②,当22log log a b >,有0a b >>,而由21a b ->有a b >,因为0,0a b a b a b a b >>⇒>>≠>>> ,所以22log log a b >是21a b ->的充分不必要条件,故②正确;对于③,由已知,正态密度曲线的图象关于直线3ξ=对称,且27σ= 所以3,7D μξ==,故③正确.点睛:本题主要考查了条件概率,充分必要条件,正态分布等,属于难题.这几个知识点都是属于难点,容易做错.12.C解析:C 【解析】2272(1682028)=8.427.87944283636K ⨯⨯-⨯≈⨯⨯⨯>∴性别和读营养说明之间有99.5%的可能性. 本题选择C 选项.二、填空题13.【分析】根据甲乙两人各射击一次得分之和为2的概率为列方程解方程求得的值【详解】甲乙两人各射击一次得分之和为2可能是甲击中乙未击中或者乙击中甲未击中故解得故答案为:【点睛】本小题主要考查相互独立事件概解析:34【分析】根据甲、乙两人各射击一次得分之和为2的概率为920列方程,解方程求得p 的值. 【详解】甲、乙两人各射击一次得分之和为2,可能是甲击中乙未击中,或者乙击中甲未击中,故()339115520p p ⎛⎫⋅-+⋅-= ⎪⎝⎭,解得34p =. 故答案为:34【点睛】本小题主要考查相互独立事件概率计算,属于基础题.14.【解析】设第一次摸出正品为事件第二次摸出正品为事件则事件和事件相互独立在第一次摸出正品的条件下第二次也摸到正品的概率为:故答案为 解析:【解析】设“第一次摸出正品”为事件A ,“第二次摸出正品”为事件B , 则事件A 和事件B 相互独立,在第一次摸出正品的条件下,第二次也摸到正品的概率为:()()655109|6910P AB P B A P A ⨯===().故答案为5915.994【解析】由题意知本题是一个相互独立事件同时发生的概率种开关中至少有个开关能正常工作的对立事件是种开关都不能工作分别记开关能正常工作分别为事件故答案为解析:994 【解析】由题意知本题是一个相互独立事件同时发生的概率,,,A B C ,3种开关中至少有1 个开关能正常工作的对立事件是3种开关都不能工作,分别记,,A B C 开关能正常工作分别为事件123,,A A A ,()()1231,,10.10.20.30.994P E P A A A =-=-⨯⨯=, 故答案为0.994. 16.-【解析】所有样本点都在直线上说明这两个变量间完全负相关故其相关系数为-1故填-1解析:-1 【解析】所有样本点都在直线上,说明这两个变量间完全负相关,故其相关系数为-1,故填-1.17.乙【解析】线性回归模型中越接近1效果越好故乙效果最好解析:乙 【解析】线性回归模型中2R 越接近1,效果越好,故乙效果最好.18.【分析】甲至多命中2个且乙至少命中2个包含的两个事件是相互独立事件分别做出甲至多命中2个球的概率和乙至少命中两个球的概率根据相互独立事件的概率公式得到结果【详解】甲至多命中2个且乙至少命中2个包含的解析:1118【分析】甲至多命中2个且乙至少命中2个包含的两个事件是相互独立事件,分别做出甲至多命中2个球的概率和乙至少命中两个球的概率,根据相互独立事件的概率公式得到结果. 【详解】甲至多命中2个且乙至少命中2个包含的两个事件是互相独立事件, 设“甲至多命中2个球”为事件A ,“乙至少命中2个球”为事件B ,由题意()41322124411111112222216P A C C ⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫=+⨯+⨯= ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭, ()22342344212128333339P B C C ⎛⎫⎛⎫⎛⎫⎛⎫=⨯+⨯+= ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭, ∴甲至多命中2个球且乙至少命中2个球的概率为()()1181116918P A P B ⋅=⨯=,故答案为1118. 【点睛】本题考查独立重复试验,考查离散型随机变量,是一个综合题,解题时注意进球的个数对应的是乙所得的分数,注意分数与进球个数的对应.19.【解析】试题分析:抽出的学生英语口语测试成绩不低于85分的有9种其中抽出的学生为甲小组学生的事件有5种所以概率为考点:条件概率 解析:【解析】试题分析:抽出的学生英语口语测试成绩不低于85分的有9种,其中抽出的学生为甲小组学生”的事件有5种,所以概率为59. 考点:条件概率.20.【分析】记某用户的自用新能源汽车已经经过了2000次充电为事件A 他的车能够充电2500次为事件B 即求条件概率:由条件概率公式即得解【详解】记某用户的自用新能源汽车已经经过了2000次充电为事件A 他的解析:717【分析】记“某用户的自用新能源汽车已经经过了2000次充电”为事件A ,“他的车能够充电2500次”为事件B ,即求条件概率:(|)P B A ,由条件概率公式即得解. 【详解】记“某用户的自用新能源汽车已经经过了2000次充电”为事件A ,“他的车能够充电2500次”为事件B ,即求条件概率:()35%7(|)()85%17P A B P B A P A ===故答案为:717【点睛】本题考查了条件概率的应用,考查了学生概念理解,数学应用,数学运算的能力,属于基础题.三、解答题21.(1)没有99%的把握认为受试者的年龄与舒张压偏高或偏低有关;(2)分布列见解析,()32E X = 【分析】(1)根据题意列出列联表,再计算2 4.762 6.635K ≈<,故没有99%的把握认为受试者的年龄与舒张压偏高或偏低有关;(2)由分层抽样得抽得样本的大龄受试者有3人,年轻受试者有3人,X 的可能取值为0,1,2,3,再结合超几何分布求概率和期望即可.【详解】解:()122⨯列联表如下:()210010601020 4.762 6.63530702080K ⨯⨯-⨯∴=≈<⨯⨯⨯所以,没有99%的把握认为受试者的年龄与舒张压偏高或偏低有关.(2)由题意得,采用分层抽样抽取的6人中,大龄受试者有3人,年轻受试者有3人, 所以大龄受试者人数为X 的可能取值为0,1,2,3,所以()33361020C P X C ===,()2133369120C C P X C ===, ()1233369220C C P X C ===,()33361320C P X C ===,所以X 的分布列为:所以()0123202020202E X =⨯+⨯+⨯+⨯=. 【点睛】本题第二问解题的关键在于根据题意得抽取的6人中,大龄受试者有3人,年轻受试者有3人,进而根据超几何分布求概率分布列与数学期望,考查运算求解能力,是中档题.22.(1) 72% 64% (2) 有99%的把握认为“两个分厂生产的零件的质量有差异” 【解析】解:(1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360500=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320500=64%. (2)χ2=()1000360180320140500500680320⨯⨯-⨯⨯⨯⨯≈7.35>6.635,所以有99%的把握认为“两个分厂生产的零件的质量有差异”. 23.(1)0.035,41.5;(2)有. 【分析】(1)由频率分布直方图求出a 的值,再计算数据的平均值;(2)由题意填写列联表,计算观测值,对照临界值得出结论. 【详解】(1)由频率分布直方图可得:10×(0.01+0.015+a +0.03+0.01)=1, 解得a =0.035,所以通过电子阅读的居民的平均年龄为:20×10×0.01+30×10×0.015+40×10×0.035+50×10×0.03+60×10×0.01=41.5;(2)由题意200人中通过电子阅读与纸质阅读的人数之比为3:1, ∴纸质阅读的人数为20014⨯=50,其中中老年有30人,∴纸质阅读的青少年有20人,电子阅读的总人数为150,青少年人数为1500.10.150.35⨯++()=90,则中老年有60人, 得2×2列联表,计算()2200903060202006.061 5.024501501109033K ⨯-⨯==≈>⨯⨯⨯,所以有97.5%的把握认为认为阅读方式与年龄有关. 【点睛】本题考查了频率分布直方图与独立性检验的应用问题,考查了阅读理解的能力,是基础题.24.(1)4.76;(2)有90%的把握认为“微信控”与“性别”有关 【解析】 试题分析:(1)由频率直方图中各概率乘以各方块中点频率相加后即得;(2)从频率直方图中可计算出“微信控”和“非微信控”的男女生人数,再计算出2K 可得. 试题(1)女性平均使用微信的时间为:0.16×1+0.24×3+0.28×5+0.2×7+0.12×9=4.76. (2)2(0.04+a +0.14+2×0.12)=1,解得a =0.08. 由题设条件得列联表:所以K 2==≈2.941>2.706.所以有90%的把握认为“微信控”与“性别”有关.25.(1)指数模型回归方程为0.296.54x y e -=,反比例函数回归方程为10011y x=+;(2)20.99r ≈;用反比例函数模型拟合效果更好;(3)612(千元). 【分析】(1)由96.54dx y e =,得ln ln96.54 4.6y dx dx ν=+⇔=+,将 3.7ν=, 4.5x =代入可得指数模型回归方程.令1xμ=,则y b a μ=+,代入y ,求得b ,a ,可得反比例函数回归方程.(2)求得y 与u 的相关系数为2r ,由12r r <,可得结论. (3)设该企业的订单期望为S (千件),则109811011111123101122222S ⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫=⨯+⨯+⨯+⋅⋅⋅+⨯+⨯ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭,可求得订单的期望,从而求得该企业的利润约. 【详解】解:(1)因为96.54dx y e =,所以ln ln96.54 4.6y dx dx ν=+⇔=+, 将 3.7ν=, 4.5x =代入上式,得0.2d =-,所以0.296.54x y e -=.令1xμ=,则y b a μ=+, 因为360458y ==,所以182218183.480.34451001.5380.1158ni ii i i u y u yb u u==-⋅-⨯⨯===-⨯-∑∑,则451000.3411a y b u =-⋅=-⨯=,所以11100y u =+, 所以y 关于x 的回归方程为10011y x=+. 综上,指数模型回归方程为0.296.54x y e -=,反比例函数回归方程为10011y x=+. (2)y 与u 的相关系数为812882222118610.9961.40.616185.588i ii i i i i u y u yr u u y y ===-⋅===≈⨯⎛⎫⎛⎫-- ⎪⎪⎝⎭⎝⎭∑∑∑,因为12r r <,所以用反比例函数模型拟合效果更好. (3)设该企业的订单期望为S (千件),则109811011111123101122222S ⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫=⨯+⨯+⨯+⋅⋅⋅+⨯+⨯ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭, 令109811111123102222T ⎛⎫⎛⎫⎛⎫⎛⎫=⨯+⨯+⨯+⋅⋅⋅+⨯ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭①, 则111092111111*********T ⎛⎫⎛⎫⎛⎫⎛⎫=⨯+⨯+⨯+⋅⋅⋅+⨯ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭②, ②-①,得11109211111522222T ⎛⎫⎛⎫⎛⎫⎛⎫-=+++⋅⋅⋅+- ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭,化简得10192T ⎛⎫=+ ⎪⎝⎭,所以101391292256S ⎛⎫=+⨯=+ ⎪⎝⎭,所以该企业的利润约为:3310091009101161232562569256⎡⎤⎢⎥⎛⎫⎛⎫+⨯-+⨯++≈ ⎪ ⎪⎢⎥⎝⎭⎝⎭+⎢⎥⎣⎦(千元). 【点睛】本题考查线性回归方程的求得,相关系数的比较,以及运用数学期望求利润,属于中档题. 26.(1)0.05n =;(2)①列联表见解析;②不能在犯错误的概率不超过0.001的前提下,认为是不是技术工与月工资是否高于平均数有关 【分析】(1)根据频率分布直方图列方程组求得n 的值;(2)根据题意得到22⨯列联表,计算观测值,对照临界值表得出结论. 【详解】 (1)月工资收入在[45,50)(百元)内的人数为15月工资收入在[45,50)(百元)内的频率为:150.15100=; 由频率分布直方图得:(0.020.0420.01)50.151n +++⨯+=0.05n ∴=(2)①根据题意得到列联表:技术工 非技术工总计月工资不高于平均数193150月工资高于平均数3119 50总计 50 50 1002 5.7610.82850505050K ==<⨯⨯⨯ 不能在犯错误的概率不超过0.001的前提下,认为是不是技术工与月工资是否高于平均数有关.【点睛】本题主要考查了独立性检验和频率分布直方图的应用问题,也考查了计算能力及频率应用问题,是基础题.。
(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试(包含答案解析)(3)
一、选择题1.已知x 与y 之间的几组数据如下表: x 1 2 3 4 y1mn4参考公式:线性回归方程y bx a =+,其中()()()121niii nii x x y y b x x ==--=-∑∑,a y bx =-;相关系数()()()()12211niii nniii i x x y y r x x y y ===--=--∑∑∑.上表数据中y 的平均值为2.5,若某同学对m 赋了三个值分别为1.5,2,2.5得到三条线性回归直线方程分别为11y b x a =+,22y b x a =+,33y b x a =+,对应的相关系数分别为1r ,2r ,3r ,下列结论中错误..的是( ) A .三条回归直线有共同交点 B .相关系数中,2r 最大 C .12b b >D .12a a >2.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e3.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是A .10200ˆyx =-+ B .10200ˆyx =+ C .10200ˆyx =-- D .10200ˆyx =- 4.设导弹发射的事故率为0.01,若发射10次,其出事故的次数为ξ,则下列结论正确的是 ( ) A .0.1E ξ=B .•01D ξ=C .10()0.01?0.99k k P k ξ-==D .1010()0.99?0.01k k kP k C ξ-==5.某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:附表:经计算2K 的观测值10k =,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响 C .有99.9%的把握认为使用智能手机对学习有影响 D .有99.9%的把握认为使用智能手机对学习无影响 6.下列命题中正确命题的个数是(1)对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握越大;(2)若将一组样本数据中的每个数据都加上同一个常数后,则样本的方差不变; (3)在残差图,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高; (4)设随机变量ξ服从正态分布()0,1N ; 若()1P p ξ>=,则()1102P p ξ-<<=-( ) A .4B .3C .2D .17.在独立性检验中,统计量2χ有三个临界值:2.706、3.841和6.635,在一项打鼾与患心脏病的调查中,共调查了1000人,经计算的2χ=18.87,根据这一数据分析,认为打鼾与患心脏病之间 ( )A .有95%的把握认为两者无关B .约有95%的打鼾者患心脏病C .有99%的把握认为两者有关D .约有99%的打鼾者患心脏病8.对于独立性检验,下列说法正确的是( ) A .K 2>3.841时,有95%的把握说事件A 与B 无关 B .K 2>6.635时,有99%的把握说事件A 与B 有关 C .K 2≤3.841时,有95%的把握说事件A 与B 有关 D .K 2>6.635时,有99%的把握说事件A 与B 无关9.利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅临界值表来确定推断“X 与Y 有关系”的可信度,如果k >5.024,那么就推断“X 和Y 有关系”,这种推断犯错误的概率不超过( ) A .0.25 B .0.75 C .0.025 D .0.97510.已知,x y 的取值如下表:( )x0 1, 2 3 4 y11.33.25.68.9若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-11.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K =,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是( )A .90%B .95%C .97.5%D .99.5%12.下列说法:①将一组数据中的每个数据都乘以同一个非零常数a 后,标准差也变为原来的a 倍; ②设有一个回归方程35y x =-,变量x 增加1个单位时,y 平均减少5个单位; ③线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;④在某项测量中,测量结果ξ服从正态分布()()21,0N σσ>,若ξ位于区域()0,1的概率为0.4,则ξ位于区域()1,+∞内的概率为0.6⑤利用统计量2χ来判断“两个事件,X Y 的关系”时,算出的2χ值越大,判断“X 与Y 有关”的把握就越大 其中正确的个数是 A .1B .2C .3D .4二、填空题13.在一次独立试验中,有200人按性别和是否色弱分类如下表(单位:人)你能在犯错误的概率不超过_____的前提下认为“是否色弱与性别有关”?14.某中学为了调研学生的数学成绩和物理成绩是否有关系,随机抽取了189名学生进行调查,调查结果如下:在数学成绩较好的94名学生中,有54名学生的物理成绩较好,有40名学生的物理成绩较差;在成绩较差的95名学生中,有32名学生的物理成绩较好,有63名学生的物理成绩较差.根据以上的调查结果,利用独立性检验的方法可知,约有________的把握认为“学生的数学成绩和物理成绩有关系”.15.为了解适龄公务员对放开生育二胎政策的态度,某部门随机调查了200位30~40岁之间的公务员,得到的情况如下表:男公务员 女公务员 生二胎 80 40 不生二胎4040则________(填“有”或“没有”)99%以上的把握认为“生二胎与性别有关”. 附:K 2=. P (K 2≥k 0) 0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.82816.为了解某班学生喜爱打篮球是否与性别有关,对该班50名 学生进行了问卷调查, 得到了如下22⨯ 列联表喜爱打篮球 不喜爱打篮球 合计男生20 525 女生 10 1525合计30 2050则至少有_____的把握认为喜爱打篮球与性别有关(请用百分数表示). 17.给出下列命题:①线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;②由变量x 和y 的数据得到其回归直线方程:l ˆybx a =+,则l 一定经过点(),x y P ; ③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;⑤在回归直线方程0.110ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 增加0.1个单位,其中真命题的序号是___________.18.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温(如表),并求得线性回归方程为^=-2x +60.不小心丢失表中数据c ,d ,那么由现有数据知2c+d=______. x c 13 10 -1 y243438d19.下列4个命题:①为了了解800名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔为40;②四边形ABCD 为长方形,2AB =,1BC =,O 为AB 中点,在长方形ABCD 内随机取一点P ,取得的P 点到O 的距离大于1的概率为12π-; ③把函数3sin 23y x π⎛⎫=+⎪⎝⎭的图象向右平移6π个单位,可得到3sin 2y x =的图象; ④已知回归直线的斜率的估计值为1.23,样本点的中心为()4,5,则回归直线方程为1.230.08y x =+.其中正确的命题有__________.(填上所有正确命题的编号)20.2018年春季,世界各地相继出现流感疫情,这已经成为全球性的公共卫生问题.为了考察某种流感疫苗的效果,某实验室随机抽取100只健康小鼠进行试验,得到如下列联表:关系.(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++.)三、解答题21.第十八届中国国际农产品交易会于11月27日在重庆国际博览中心开幕,我市全面推广“遂宁红薯”及“遂宁鲜”农产品区域公用品牌,并组织了100家企业、1000个产品进行展示展销,扩大优质特色农产品市场的占有率和影响力,提升遂宁特色农产品的社会认知度和美誉度,让来自世界各地的与会者和消费者更深入了解遂宁,某记者对本次农交会进行了跟踪报道和实际调查,对某特产的最满意度()%x 和对应的销售额y (万元)进行了调查得到以下数据:关系数r 的绝对值在0.95以上(含0.95)是线性相关性较强;否则,线性相关性较弱.请你对线性相关性强弱作出判断,并给出理由;(2)如果没有达到较强线性相关,则采取“末位淘汰”制(即销售额最少的那一天不作为计算数据),并求在剔除“末位淘汰”的那一天后的销量额y 关于最满意度x 的线性回归方程(系数精确到0.1). 参考数据:24x =,81y =,52215146ii x x =-=∑, 52215176i i y y =-=∑,515151i ii x y xy =-=∑13.27≈≈.附:对于一组数据()()()1122,,,,,,n n x y x y x y ⋅⋅⋅.其回归直线方程 ˆˆˆy bx a =+的斜率和截距的最小二乘法估计公式分别为:1221ˆ·ni ii ni i x y nx y bx nx ==-=-∑∑,ˆa y bx=-,线性相关系数·ni ix y nx y r -=∑22.为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:质量监督员甲在生产现场时,990件产品中合格品有982件,次品有8件;甲不在生产现场时,510件产品中合格品有493件,次品有17件,试分别用列联表、独立性检验的方法分析监督员甲是否在生产现场对产品质量好坏有无影响?23.2020年初,新型冠状病毒(2019-nCoV )肆虐,全民开启防疫防控.新型冠状病毒的传染主要是人与人之间进行传播,感染人群年龄大多数是40岁以上人群.该病毒进入人体后有潜伏期,潜伏期是指病原体侵入人体至最早出现临床症状的这段时间.潜伏期越长,感染到他人的可能性越高,现对200个病例的潜伏期(单位:天)进行调查,统计发现潜伏期平均数为7.1,方差为22.25.如果认为超过8天的潜伏期属于“长潜伏期”,按照年龄统计样本,得到下面的列联表:(1)是否有95%的把握认为“长期潜伏”与年龄有关;(2)假设潜伏期X 服从正态分布()2,N μσ,其中μ近似为样本平均数x ,2σ近似为样本方差2s .(ⅰ)现在很多省份对入境旅客一律要求隔离14天,请用概率的知识解释其合理性;(ⅱ)以题目中的样本频率估计概率,设1000个病例中恰有()*k k ∈N 个属于“长期潜伏”的概率是()g k ,当k 为何值时,()g k 取得最大值. 附:()()()()()22n ad bc a b c d a c b d χ-=++++若()2,N ξμσ则()0.6862P μσξμσ-<<+=.()220.9544P μσξμσ-<<+=,()330.9974P μσξμσ-<<+=.24.某地一所妇产科医院为了解婴儿性别与出生时间(白天或晚上)之间的联系,从该医院最近出生的200名婴儿获知如下数据:这200名婴儿中男婴的比例为55%,晚上出生的男婴比白天出生的男婴多75%,晚上出生的女婴人数与白天出生的男婴人数恰好相等. (1)根据题意,完成下列2×2列联表;(2)根据列联表,判断能否有99%的把握认为婴儿的性别与出生时间有关,说明你的理由.附:22()()()()()n ad bcKa b c d a c b d-=++++(n=a+b+c+d),参考数据:221999≈0.0368.25.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关?(2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X,若用样本的频率作为概率,求随机变量X的分布列和期望.附:K2=2()()()()()n ad bca b c d a c b d-++++,其中n=a+b+c+d.26.“微粒贷”是腾讯旗下2015年9月开发上市的微众银行网货产品.腾讯公司为了了解“微粒贷”上市以来在C市的使用情况,统计了C市2015年至2019年使用了“微粒货”贷款的累计人数,统计数据如表所示:(1)已知变量x ,y 具有线性相关关系,求累计人数y (万人)关于年份代号x 的线性回归方程y bx a =+;并预测2020年使用“微粒贷“贷款的累计人数;(2)“微粒贷”用户拥有的贷款额度是根据用户的账户信用资质判定的,额度范围在500元至30万元不等,腾讯公司在统计使用人数的同时,对他们所拥有的贷款额度也作了相应的统计.我们把拥有货款额度在500元至5万元(不包括5万元)的人群称为“低额度贷款人群”,简称“A 类人群”;把拥有贷款额度在5万元及以上的人群称为“高额度贷款人群”,简称“B 类人群”.根据统计结果,随机抽取6人,其中A 类人群4人,B 类人群2人.现从这6人中任取3人,记随机变量ξ为A 类人群的人数,求ξ的分布列及其期望.参考公式:1122211()()()()nni iiii i nniii i x y nx y x x y y b xn x x x ====---==--∑∑∑∑, a y bx =-参考数据:5162i ii x y=≈∑【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】由题意可得5m n +=,分别取m 与n 的值,由公式计算出1122123,,,,,,b a b a r r r 的值,逐一分析四个选项,即可得到答案. 【详解】由题意,1410m n +++=,即5m n +=. 若 1.5m =,则 3.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 1.5 2.53 2.5 3.5 2.54 2.54 2.5 5.5iii x x y y =--=--+--+--+--=∑ ,()()()42222211.50.50.5 1.55i i x x =-=-+-++=∑ ,()()()42222211.511 1.5 6.5i i y y =-=-+-++=∑.则1 5.51.15b ==,1 2.5 1.1 2.50.25a =-⨯=- ,1r =≈; 若2m =,则3n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.52 2.53 2.53 2.54 2.54 2.55iii x x y y =--=--+--+--+--=∑,()4215ii x x =-=∑,()()()42222211.50.50.5 1.55i i y y =-=-+-++=∑.2515b ==,2 2.51 2.50a =-⨯=,21r ==; 若 2.5m =,则 2.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 2.5 2.53 2.5 2.5 2.54 2.54 2.5 4.5iii x x y y =--=--+--+--+--=∑,()4215i i x x =-=∑,()()422211.5 1.5 4.5i i y y =-=-+=∑,3r ==由样本点的中心相同,故A 正确;由以上计算可得,相关系数中,2r 最大,12b b >,12a a <,故B ,C 正确,D 错误. 故选:D . 【点睛】本题考查线性回归方程与相关系数的求法,考查计算能力,是中档题.2.B解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e =.故选:B. 【点睛】本题考查非线性回归问题的转化,是基础题.3.A解析:A 【解析】试题分析:因为商品销售量x 与销售价格ˆy负相关,所以排除B ,D 选项, 将0x =代入10200ˆyx =--可得2000ˆy =-<,不符合实际.故A 正确. 考点:线性回归方程.【方法点睛】本题主要考查线性回归方程,属容易题.线性回归方程ˆˆˆy bx a =+当ˆ0b<时ˆ,x y 负相关;当ˆ0b >时ˆ,x y 正相关. 4.A解析:A 【解析】 【分析】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,实验的结果只有发生和不发生两种结果,故本题符合独立重复试验,由独立重复试验的期望公式得到结果. 【详解】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,故本题符合独立重复试验,即ξ~(10,0.01)B . ∴100.010.1E ξ=⨯= 故选A . 【点睛】解决离散型随机变量分布列和期望问题时,主要依据概率的有关概念和运算,同时还要注意题目中离散型随机变量服从什么分布,若服从特殊的分布则运算要简单的多.5.A解析:A 【解析】 【分析】由题意结合2K 的观测值k 由独立性检验的数学思想给出正确的结论即可. 【详解】由于2K 的观测值10k =7.879>,其对应的值0.0050.5%=,据此结合独立性检验的思想可知:有99.5%的把握认为使用智能手机对学习有影响. 本题选择A 选项. 【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.6.B解析:B 【解析】 【分析】根据独立性检验的定义可判断(1);根据方差的性质可判断(2);根据残差的性质可判断(3);根据正态分布的对称性可判断(4).【详解】(1)对分类变量X 与Y 的随机变量2K 的观测值K 来说,K 越大,判断“X 与Y 有关系”的把握越大,故(1)错误;(2)若将一组样本数据中的每个数据都加上同一个常数后,数据的离散程度不变,则样本的方差不变,故(2)正确;(3)根据残差的定义可知,在残差图,残差点分布的带状区域的宽度越狭窄,预测值与实际值越接近,其模型拟合的精度越高,(3)正确;(4)设随机变量ξ服从正态分布()0,1N ,若()1P p ζ>=,则()1P p ζ<-=,则()1112P p ζ-<<=-,则()1102P p ζ-<<=-,故(4)正确, 故正确的命题的个数为3个,故选B. 【点睛】本题主要通过对多个命题真假的判断,主要综合考查独立性检验的定义、方差的性质、残差的性质以及正态分布的对称性,属于中档题. 这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.7.C解析:C 【解析】因为统计量2χ有三个临界值:2.706、3.841和6.635,而2χ=18.87>6.635,所以有99%的把握认为两者有关,选C.8.B解析:B【解析】由独立性检验的知识知:K 2>3.841时,有95%的把握认为“变量X 与Y 有关系”;K 2>6.635时,有99%的把握认为“变量X 与Y 有关系”.故选项B 正确.9.C解析:C【解析】∵P (k >5.024)=0.025,故在犯错误的概率不超过0.025的条件下,认为“X 和Y 有关系”. 考点:独立性检验.10.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A.点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 11.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。
定量资料案例分析 (统计)
案例1 欲了解某年某市正常成年男性的平均血铅含量,有研究者随机调查了当 。 年该市200名正常成年男性的血铅含量。将所获血铅值整理成频率分布表,据此 认为该地正常成年男性血铅值资料不服从正态分布,应先对数据进行对数变换, 再用式 X 1.96S X 来估计当年正常成年男性平均血铅含量的95%置信区间。 表1 某年某市200名正常成人血铅含量(μg/L)分布 频率(%) 组段 频数 40~ 25 12.5 80~ 32 16.0 120~ 36 18.0 160~ 30 15.0 200~ 25 12.5 240~ 22 11.0 280~ 11 5.5 320~ 8 4.0 360~ 4 2.0 400~ 4 2.0 440~ 1 0.5 480~ 1 0.5 520~560 1 0.5 合计 200 100.0
t=4.78,查表可得,P=0.001,治疗前后血红蛋白 差别有统计学意义,治疗后高于治疗前。
t=(d –0)/(Sd/ √ n) n=9 d =34.5g/l v=8
Sd=21.67g/l
案例四
研究2种单味中药对小鼠细胞免疫功能的影响,并设一个空白对 照组,将30只小鼠随机分为3组,每组10只,雌雄各半,用药15 天后,测定E-玫瑰结形成率(%),结果如下。
案例五
• 某研究所研制了3个降血脂中药复方制剂,现拟对 3个复方与标准降脂药(安妥明)的疗效进行比较, 取品种相同,健康的雄性家兔16只,按其体重大 小分为4个组,各组动物均饲以同样高脂饮食,并 每日分别灌以不同药物,第45天处死动物,观察 冠状动脉硬化斑块面积,见下表。研究者用完全 随机设计资料的方差分析对资料进行了假设检验, F=56.952,P=0.000,故认为3个降血脂中药复方制 剂疗效不全相同。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
10-4统计案例 基 础 巩 固 一、选择题 1.对于事件A和事件B,通过计算得到χ2的观测值χ2≈4.514,下列说法正确的是( ) A.有99%的把握说事件A和事件B有关 B.有95%的把握说事件A和事件B有关 C.有99%的把握说事件A和事件B无关 D.有95%的把握说事件A和事件B无关 [答案] B [解析] 由独立性检验知有95%的把握说事件A与B有关. 2.r是相关系数,则下列叙述中正确的个数为( ) ①r∈[-1,-0.75]时,两变量负相关很强; ②r∈[0.75,1]时,两变量正相关很强; ③r∈(-0.75,-0.3]或[0.3,0.75)时,两变量相关性一般; ④r=0.1时,两变量相关性很弱. A.1 B.2 C.3 D.4 [答案] D 3.某化工厂为预测某产品的回收率y,需要研究它和原料有效
成分含量x之间的相关关系,现取了8对观察值,计算得i=18xi=52,i=18y
i=228,i=18x2i=478,i=1nxiyi=1849,则y与x的回归方程是( ) A.y^=11.47+2.62x B.y^=-11.47+2.62x C.y^=2.62+11.47x D.y^=11.47-2.62x [答案] A 4.(2011·湖南理,4)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表: 男 女 总计 爱好 40 20 60
不爱好 20 30 50
总计 60 50 110
由K2=nad-bc2a+bc+da+cb+d算得,K2= 110×40×30-20×20260×50×60×50≈7.8.
附表: P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828 参照附表,得到的正确结论是( ) A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” C.有99%以上的把握认为“爱好该项运动与性别有关” D.有99%以上的把握认为“爱好该项运动与性别无关” [答案] C [解析] 本小题考查内容为独立性检验. 6.635或者说在犯错的概率不超过1%的前提下二者有关. 5.(2012·长春模拟)若变量y与x之间的相关系数r=-0.936 2,则变量y与x之间( ) A.不具有线性相关关系 B.具有线性相关关系 C.它们的线性相关关系还要进一步确定 D.不确定 [答案] B [解析] 因为r=-0.936 2,说明变量y与x之间具有线性相关关系,且为负相关. 6.在第29届奥运会上,中国健儿取得了51金、21银、28铜的好成绩,稳居世界金牌榜榜首,由此许多人认为中国进入了世界体育强国之列,也有许多人持反对意见.有网友为此进行了调查,在参加调查的2 548名男性公民中有1 560名持反对意见,2 452名女性公民中有1 200人持反对意见,在运用这些数据说明中国的奖牌是否与中国进入体育强国有无关系时用什么方法最有说服力( ) A.平均数与方差 B.回归直线方程 C.独立性检验 D.概率 [答案] C [解析] 由于参加讨论的公民按性别被分成了两组,而且每一组又被分成了两种情况:认为有关与无关,故该资料取自完全随机统计,符合2×2列联表的要求,故用独立性检验最有说服力. 二、填空题 7.(2012·石家庄模拟)某医疗研究所为了了解某种血清预防感冒的作用,把500名使用过血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918,经查临界值表知P(χ2≥3.841)≈0.05,则下列结论中,正确结论的序号是________. ①有95%的把握认为“这种血清能起到预防感冒的作用”; ②若某人未使用该血清,那么他在一年中有95%的可能性得感冒; ③这种血清预防感冒的有效率为95%; ④这种血清预防感冒的有效率为5%. [答案] ① [解析] 因为χ2≈3.918≥3.841,则P(χ2≥3.814)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”.要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆. 8.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果: 冷漠 不冷漠 总计 多看电视 68 42 110
少看电视 20 38 58
总计 88 80 168
则大约有________的把握认为多看电视与人变冷漠有关系. [答案] 99.9% [解析] 首先算得χ2≈11.377,然后查表可得概率. 三、解答题 9.(2012·佛山模拟)有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩后,得到如下的列联表. 优秀 非优秀 总计 甲班 10
乙班 30
合计 105
已知从全部105人中随机抽取1人优秀的概率为27. (1)请完成上面的列联表; (2)根据列联表的数据,若按95%的可靠性要求,能否认为“成绩与班级有关系”; (3)若按下面的方法从甲班优秀的学生中抽取一人:把甲班优秀的10名学生从2到11进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号.试求抽到6号到10号的概率.
附:χ2=nad-bc2a+bc+da+cb+d, P(χ2≥k) 0.05 0.01
k 3.841 6.635 [解析] (1)
优秀 非优秀 总计 甲班 10 45 55
乙班 20 30 50
合计 30 75 105
(2)根据列联表中的数据,得到 k=105×10×30-20×45255×50×30×75≈6.109>3.841, 因此有95%的把握认为“成绩与班级有关系”. (3)设“抽到6号或10号”为事件A,先后两次抛掷一枚均匀的骰子,出现的点数为(x,y),则所有的基本事件有(1,1)、(1,2)、(1,3)、„(6,6),共36个. 事件A包含的基本事件有(1,5),(2,4),(3,3),(4,2),(5,1),(4,6),(5,5),(6,4),共8个,
∴P(A)=836=29. 能 力 提 升 一、选择题 1.下列关于χ2的说法中正确的是( ) A.χ2在任何相互独立问题中都可以用来检验有关还是无关 B.χ2的值越大,两个事件的相关性就越大 C.χ2是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合
D.χ2的观测值的计算公式为χ2=nad-bca+bc+da+cb+d [答案] C [解析] χ2值是用来判断两个分类变量是否有关系的一个随机变量,并不是适应于任何独立问题的相关性检验. 2.(文)对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),„,(xn,yn),则下列说法中不正确的是( )
A.由样本数据得到的回归方程y^=bx+a必过样本中心(x-,y-) B.残差平方和越小的模型,拟合的效果越好 C.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好 D.若变量y和x之间的相关系数为r=-0.936 2,则变量y和x之间具有线性相关关系 [答案] C [解析] C中应为R2越大拟合效果越好. (理)(2011·江西理,6)变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则( ) A.r2[答案] C [解析] 由散点图可得出结论:变量Y与X正相关,变量V与U负相关,故r1>0,r2<0,因此选C. 二、填空题 3.某高校“初步统计”课程的教师随机调查了选该课的一些学生情况,具体数据如下表: 专业 性别 非统计专业 统计专业 男 13 10
女 7 20
为了判断主修统计专业是否与性别有关系,根据表中的数据,得
到χ2=50×13×20-10×7223×27×20×30≈4.844,因为χ2≥3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________. [答案] 5% [解析] 因为3.841<4.844<6.635,所以有95%的把握认为主修统计专业与性别有关,这种判断出错的可能性为5%. 4.已知两个变量x和y线性相关,5次试验的观测数据如下: x 100 120 140 160 180 y 45 54 62 75 92 那么变量y关于x的回归方程是________.
[答案] y^=0.575x-14.9 [解析] 由线性回归参数公式可求出b=0.575,a=-14.9,∴回
归方程为y^=0.575x-14.9. 三、解答题 5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表.试问能以多大把握认为婴儿的性别与出生时间有关系. 出生时间 性别 晚上 白天 合计
男婴 24 31 55
女婴 8 26 34
合计 32 57 89
[分析] 利用表中的数据通过公式计算出χ2统计量,可以用它的值的大小来推断独立性是否成立.
[解析] 由公式χ2=89×24×26-8×31255×34×32×57 ≈3.688 92>2.706,有90%把握认为有关系. 6.在调查的480名男性中有38名患有色盲,520名女性中有6名患有色盲,分别利用图形和独立性检验的方法来判断色盲是否与性