2021届全国新高考数学备考复习 统计与统计案例
2021届高考数学(理)复习之小题必练12 统计与统计案例(理)-学生版

统计与统计案例是高中数学的重要内容,高考主要考查排列组合,二项式定理,随机抽样,用样本估计总体,变量的相关性,随机事件的概率,古典概型,几何概型,回归分析,独立性检验,离散型随机变量的分布列、期望、方差,正态分布.考查重点是用样本估计总体,古典概率,离散型随机变量的分布列、期望、方差,应用回归分析与独立性检验思想方法解决简单实际问题的能力.试题强调应用性,以实际问题为背景,构建数学模型,突出考查统计与概率的思想和考生的数据处理能力及应用意识.1.【2020全国Ⅰ卷】某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)i ix y(1,2,20)i=得到下面的散点图:由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()A.y a bx=+B.2y a bx=+C.xy a be=+D.lny a b x=+2.【2020全国Ⅲ卷】在一组样本数据中,1,2,3,4出现的频率分别为1234,,,p p p p,且411iip==∑,则下面四种情形中,对应样本的标准差最大的一组是()A.140.1p p==,230.4p p==B.140.4p p==,230.1p p==C.140.2p p==,230.3p p==D.140.3p p==,230.2p p==一、选择题.1.近年来,随着“一带一路”倡议的推进,中国与沿线国家旅游合作越来越密切,中国到“一带一路”沿线国家的游客人也越来越多,如图是20132018-年中国到“一带一路”沿线国家的游客人次情况,则下列说法正确的是( )①20132018-年中国到“一带一路”沿线国家的游客人次逐年增加②20132018-年这6年中,2014年中国到“一带一路”沿线国家的游客人次增幅最小 ③20162018-年这3年中,中国到“一带一路”沿线国家的游客人次每年的增幅基本持平 A .①②③B .②③C .①②D .③2.盒子里装有大小相同的2个红球和1个白球,从中随机取出1个球,取到白球的概率是( ) A .13B .12C .23D .13.设随机变量ξ的分布列如下:其中1a ,2a ,…,6a 构成等差数列,则16a a ⋅的( ) A .最大值为19B .最大值为136C .最小值为19D .最小值为1364.某同学进行3分投篮训练,若该同学投中的概率为12,他连续投篮n 次至少得到3分的概率大于0.9, 那么n 的最小值是( ) A .3B .4C .5D .65.为了调查患胃病是否与生活不规律有关,在患胃病与生活不规律这两个分类变量的计算中,下列说法正确的是( )A .k 越大,“患胃病与生活不规律没有关系”的可信程度越大B .k 越大,“患胃病与生活不规律有关系”的可信程度越小。
2021新高考数学精选考点专项突破:统计与统计案例

统计与统计案例一、单选题1、(江苏金陵中学开学初调研)已知变量x 与y 正相关,且由观测数据算得样本平均数3x =, 3.5y =,则由该观测的数据算得的线性回归方程可能是( )A .0.4.3ˆ2yx =+ B .2 2.4ˆyx =- C .9ˆ2.5yx =-+ D .0.3 4.4ˆyx =-+ 【答案】A 【解析】 因为与正相关,排除选项C 、D ,又因为线性回归方程恒过样本点的中心,故排除选项B ;故选A .2、(山东青岛中学调研)已知两个变量x 和y 之间有线性相关关系,经调查得到如下样本数据,根据表格中的数据求得同归方程ˆˆˆybx a =+,则下列说法正确的是( ) A .0a >,0b > B .0a >,0b < C .0a <,0b > D .0a <,0b <【答案】B【解析】由已知数据,可知y 随着x 的增大而减小, 则变量x 和变量y 之间存在负相关的关系,0b ∴<, 当0x =时,则 3.50a y =>>, 即:0a >,0b <. 故选:B.3、(2020届山东省济宁市高三3月月考)下列说法正确的是( )A .回归直线ˆˆˆy bx a =+至少经过其样本数据()()()122,,,,,i n n x y x y x y 中的一个点B .从独立性检验可知有99%的把握认为吃地沟油与患胃肠癌有关系时,我们就说如果某人吃地沟油,那么他有99%可能患胃肠癌C .在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D .将一组数据的每一个数据都加上或减去同一个常数后,其方差也要加上或减去这个常数 【答案】C【解析】回归直线ˆˆˆy bx a =+可以不经过其样本数据()()()122,,,,,i n n x y x y x y 中的一个点,则A 错误;从独立性检验可知有99%的把握认为吃地沟油与患胃肠癌有关系时,我们就说如果某人吃地沟油,那么他有99%可能患胃肠癌,则B 错误;在残差图中,残差点分布的带状区域的宽度越窄,表示数据的残差越小,其模型拟合的精度越高,即C 正确;将一组数据的每一个数据都加上或减去同一个常数后,其平均数也加上或减去同一个常数,则其方差不变,故D 错误, 故选:C4、(江西省抚州市临川区第一中学2017-2018学年高二下学期期末)临川一中舞蹈社为了研究男女学生对舞蹈的喜爱程度,随机调查学校110名学生是否喜欢跳舞,由列联表和公式()()()()()22n ad bc K a b c d a c b d -=++++计算出2K ,并由此作出结论:“有99%的可能性认为学生喜欢跳舞与性别有关”,则2K 可以为( )A.3.565B.4.204C.5.233D.6.842【答案】D 【解析】利用所给数据,在2 6.635K ≥时,可作出结论:“有99%的可能性认为学生喜欢跳舞与性别有关”,只有D 满足. 故选D.5、(2020年高考全国Ⅰ卷理数)某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( ) A .y a bx =+ B .2y a bx =+ C .e x y a b =+D .ln y a b x =+【答案】D【解析】由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+. 故选:D.6、(2020届山东省济宁市第一中学高三一轮检测)某次考试,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理分数对应如下表:绘出散点图如下:根据以上信息,判断下列结论:①根据此散点图,可以判断数学成绩与物理成绩具有线性相关关系;②根据此散点图,可以判断数学成绩与物理成绩具有一次函数关系;③甲同学数学考了80分,那么,他的物理成绩一定比数学只考了60分的乙同学的物理成绩要高.其中正确的个数为().A.0B.3C.2D.1【答案】D【解析】对于①,根据此散点图知,各点都分布在一条直线附近,可以判断数学成绩与物理成绩具有较强的线性相关关系,①正确;对于②,根据此散点图,可以判断数学成绩与物理成绩具有较强的线性相关关系,不是一次函数关系,②错误;对于③,甲同学数学考了80分,他的物理成绩可能比数学只考了60分的乙同学的物理成绩要高,所以③错误.综上,正确的命题是①,只有1个.故选:D.7、(2020年山东一中调研)学生会为了调查学生对2018年俄罗斯世界杯的关注是否与性别有关,抽样调查100人,得到如下数据:根据表中数据,通过计算统计量()()()()()22n ad bcKa b c d a c b d-=++++,并参考以下临界数据:若由此认为“学生对2018年俄罗斯世界杯的关注与性别有关”,则此结论出错的概率不超过()A.0.10 B.0.05 C.0.025 D.0.01【答案】A 【解析】因为()()()()()()22210030101545=3.030 2.70645255575n ad bc K a b c d a c b d -⨯-⨯=≈>++++⨯⨯⨯,所以若由此认为“学生对2018年俄罗斯世界杯的关注与性别有关”,则此结论出错的概率不超过0.10,故选A..8、(江苏淮阴中学调研)通过随机询问110名不同的大学生是否爱好某项运动,得到如下的列联表:由2222()110(40302030),7.8()()()()60506050n ad bc K K a b c d a c b d -⨯⨯-⨯==≈++++⨯⨯⨯算得 附表:参照附表,得到的正确结论是( )A .有99%以上的把握认为“爱好该项运动与性别有关”B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” 【答案】A 【解析】由27.8 6.635K ≈>,而()2 6.6350.010P K ≥=,故由独立性检验的意义可知选A9、(江苏南通中学开学初调研)下列说法中,正确说法的个数是( )①在用22⨯列联表分析两个分类变量A 与B 之间的关系时,随机变量2K 的观测值k 越大,说明“A 与B 有关系”的可信度越大②以模型kxy ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0. 3③已知两个变量具有线性相关关系,其回归直线方程为y a bx =+,若2b =,1,3x y ==,则1a = A .0 B .1 C .2 D .3【答案】D【解析】对于①,分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大,正确; 对于②,kx y ce =,∴两边取对数,可得()ln ln ln ln ln kx kxy ce c e c kx ==+=+,令ln z y =,可得ln ,0.34,ln 4,0.3z c kx z x c k =+=+∴==, 4c e ∴=.即②正确;对于③,根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,2,1b x ==,3y =,则1a =.故 ③正确因此,本题正确答案是:①②③ 答案选D10、(南京一中学情调研)某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据如下表:根据表中数据得到()2277520450530025750320455K ⨯⨯-⨯=⨯⨯⨯≈15.968,因为2K ≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) 附表:A. 0.1B. 0.05C. 0.01D. 0.001 【答案】D点睛:独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.二、多选题11、(2021年山东日照一中开学调研)经过对2K 的统计量的研究,得到了若干个临界值,当2K 的观测值3.841k >时,我们( )A .在犯错误的概率不超过0.05的前提下可认为A 与B 有关 B .在犯错误的概率不超过0.05的前提下可认为A 与B 无关C .有99%的把握说A 与B 有关D .有95%的把握说A 与B 有关 【答案】AD .【解析】:根据独立性检验原理知,当2K 的观测值 3.841k >时,我们有以下结论:在犯错误的概率不超过0.05的前提下可认为A 与B 有关; 即有95%的把握说A 与B 有关; 所以选项A 、D 正确. 故选:AD .12、(2020届山东省德州市高三上期末)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的45,女生喜欢抖音的人数占女生人数35,若有95%的把握认为是否喜欢抖音和性别有关则调查人数中男生可能有( )人 附表:附:()()()()()22n ad bc K a b c d a c b d -=++++ A .25 B .45C .60D .75【答案】BC【解析】设男生的人数为()5n n N*∈,根据题意列出22⨯列联表如下表所示:则()221042310557321n n n n n n K n n n n ⨯⨯-⨯==⨯⨯⨯,由于有95%的把握认为是否喜欢抖音和性别有关,则23.841 6.632K ≤<, 即103.841 6.63221n≤<,得8.066113.9272n ≤<, n N *∈,则n 的可能取值有9、10、11、12,因此,调查人数中男生人数的可能值为45或60. 故选:BC.13、(2020届山东省烟台市高三上期末)某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如图所示的列联表.经计算2K 的观测值 4.762k ≈,则可以推断出( )A .该学校男生对食堂服务满意的概率的估计值为5B .调研结果显示,该学校男生比女生对食堂服务更满意C .有95%的把握认为男、女生对该食堂服务的评价有差异D .有99%的把握认为男、女生对该食堂服务的评价有差异 【答案】AC【解析】对于选项A,该学校男生对食堂服务满意的概率的估计值为30330205=+,故A 正确;对于选项B,该学校女生对食堂服务满意的概率的估计值为4043401055=>+,故B 错误; 因为 4.762 3.841k ≈>,所以有95%的把握认为男、女生对该食堂服务的评价有差异,故C 正确,D 错误 故选:AC14、(2010德州期末)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的45,女生喜欢抖音的人数占女生人数35,若有95%的把握认为是否喜欢抖音和性别有关则调查人数中男生可能有( )人 附表:k附:2()()()()()n ad bc K a b c d a c b d -=++++A .25B .45C .60D .75【答案】BCD .【解析】:设男生可能有x 人,依题意可得列联表如下;若有95%的把握认为是否喜欢抖音和性别有关,则2 3.841K >,由2242312()25555 3.841732155x x x x x x K x x x x -==>,解得40.335x >, 由题意知0x >,且x 是5的整数倍,所以45,60,和75都满足题意. 故选:BCD .15、(2020·山东滕州市第一中学高三3月模拟)(多选题)下列说法中,正确的命题是( ) A .已知随机变量ξ服从正态分布()22,N δ,()40.84P ξ<=,则()240.16P ξ<<=.B .以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则c ,k 的值分别是4e 和0.3.C .已知两个变量具有线性相关关系,其回归直线方程为y a bx =+,若2b =,1x =,3y =,则1a =.D .若样本数据1x ,2x ,…,10x 的方差为2,则数据121x -,221x -,…,1021x -的方差为16. 【答案】BC【解析】因为随机变量ξ服从正态分布()22,N δ,()40.84P ξ<=,所以()()2440.50.840.50.340.16P P ξξ<<=<-=-=≠,即A 错;ln ln()ln ln kx kx y ce y ce y kx c =∴=∴=+,0.34ln 0.34z x y x =+∴=+,从而40.3,ln 40.3,k c k c e ==∴==,即B 正确;y a bx =+过(,)x y , 321a b b a =+=∴=,即C 正确;因为样本数据1x ,2x ,…,10x 的方差为2,所以数据121x -,221x -,…,1021x -的方差为222=8⨯,即D 错误; 故选:BC16、下列命题中正确的命题是( )A .标准差越小,则反映样本数据的离散程度越大B .在回归直线方程ˆ0.43yx =-+中,当解释变量x 每增加1个单位时,则预报变量y 减少0.4个单位 C .对分类变量X 与Y 来说,它们的随机变量2K 的观测值k 越小,“X 与Y 有关系”的把握程度越大 D .在回归分析模型中,残差平方和越小,说明模型的拟合效果越好 【答案】BD【解析】:标准差越小,则反映样本数据的离散程度越小,因此A 不正确;在回归直线方程ˆ0.43y x =-+中,当解释变量x 每增加1个单位时,则预报变量y 减少0.4个单位,B 正确;对分类变量X 与Y 来说,它们的随机变量2K 的观测值k 越小,“X 与Y 有关系”的把握程度越小,因此C 不正确;在回归分析模型中,残差平方和越小,说明模型的拟合效果越好,D 正确. 故选:BD . 三、填空题17、(山东师范大学附属中学调研)某设备的使用年限x 与所支出的维修费用y 的统计数据如下表:根据上表可得回归直线方程为 1.3y x a =+,据此模型预测,若使用年限为14年,估计维修费约为__________万元. 【答案】18 【解析】23456 1.5 4.5 5.5 6.57.04,555x y ++++++++====,则中心点为()4,5,代入回归直线方程可得5 1.34.2ˆ0a=-⨯=-, 1.30.2y x =-. 当14x =时, 1.3140.218y =⨯-=(万元), 即估计使用14年时,维修费用是18万元. 故答案为:18.18、(江苏南通一中调研)如果根据性别与是否爱好运动的列联表得到K 2≈3.852>3.841,则判断性别与是否爱好运动有关,那么这种判断犯错的可能性不超过________. 【答案】5%19、(江苏栟茶中学开学初调研)某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:在犯错误的概率不超过________的前提下性别与休闲方式有关系.【答案】0.10【解析】由列联表中的数据,得K 2的观测值为k =()289242631855343257⨯⨯-⨯⨯⨯⨯ ≈3.689>2.706,因此,在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系. 故答案:0.1020、(江苏徐州一中调研)为了了解司机开车时礼让斑马线行人的情况,交警部门调查了100名机动车司机,得到以下统计数据:若以2χ为统计量进行独立性检验,则2χ的值是__________.(结果保留2位小数)参考公式()1122122121212n n n n n n n n n χ++++-=【答案】8.25【解析】填写2×2列联表,如下:根据数表,计算()()()()()22n ad bc a b c d a c b d -X =++++=()21004025201555456040⨯⨯-⨯⨯⨯⨯≈8.25>7.879,所以有99.5%的把握认为开车时使用手机与司机的性别有关; 21、(2021年江苏淮阴中学调研)某单位为了了解用电量y 度与气温之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:由表中数据得线性回归方程中,,预测当气温为时,用电量的度数约为。
2021版新高考数学一轮复习课件:第10章 统计、统计案例(共3个课时)

可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合
适的抽样方法是____________.
分层抽样
• [解析] 因为不同年龄段客户对其服务的评价有较大差异,所以根据三 种抽样方法的特点可知最合适的抽样方法是分层抽样.
• 5.(2019·课标全国Ⅰ)某学校为了解1 000名新生的身体素质,将这些
• 知识点四 分层抽样
• 一般地,在抽样时将总体分成互不交叉的层,然后按一照定的比例 ______________,从各层独立地抽取一定数量的个体,将各层取出的 个体合在一起作为样本,这种抽样方法叫做分层抽样.
• 分层抽样的应用范围:当总体是由______________________组成时,
往往选用分层抽样的方法.
第十章 统计、统计案例
第一讲 随机抽样
1 知识梳理 • 双基自测 2 考点突破 • 互动探究 3 名师讲坛 • 素养提升
知识梳理 • 双基自测
• 知识点一 总体、个体、样本、样本容量的概念
• 统计中所考察对象的全体构成的集合看做总体,构成总体的每个元素 作样为本个 中体 个, 体从 的总___体__中_一_抽_部叫取分做的个样_体_本___容_量___._____所组成的集合叫做样本,
()
• A.33,34,33 B.25,56,19
B
• C.30,40,30 D.30,50,20
• [解析] 因为125 280 95=25 56 19,所以抽取人数分别为 25,56,19.
• 3取.一(P个59容T2)量某为班4共的有样5本2人,,已现知根3号据,学2生9号的,学4号2号,学用生系在统样抽本样中的,方那法么,样抽
本中还有一个学生的学号是
()
新高考数学复习专题-专题二十 统计与统计案例(原卷版)

专题二十 统计与统计案例一、单选题1.(2021·河南高二月考(文))有下列四个命题:( ) ①在回归分析中,残差的平方和越小,模型的拟合效果越好;②在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适; ③若数据1x ,2x ,…,n x 的平均数为1,则12x ,22x ,…2n x 的平均数为2; ④对分类变量x 与y 的随机变量2K 的观测值k 来说,k 越小,判断“x 与y 有关系”的把握越大.其中真命题的个数为( ) A .1B .2C .3D .42.(2021·全国高二课时练习)若由一个22⨯列联表中的数据计算得2 4.013K =,那么有( )把握认为两个变量有关系.20()P K k ≥ 0.150.10 0.05 0.025 0.010 0.005 0.0010k2.072 2.7063.841 5.024 6.635 7.879 10.828A .95%B .97.5%C .99%D .99.9%第II 卷(非选择题)请点击修改第II 卷的文字说明二、解答题3.(2021·广东汕头市·高三一模)为确保我国如期全面建成小康社会,实现第一个百年奋斗目标打下了坚实的基础.在产业扶贫政策的大力支持下,某玩具厂对原有的生产线进行技术升级,为了更好地对比升级前和升级后的效果,其中甲生产线继续使用旧的生产模式,乙生产线采用新的生产模式.质检部门随机抽检了甲、乙两条生产线的各100件玩具,在抽取的200件玩具中,根据检测结果将它们分为“A ”、“B ”、“C ”三个等级,,A B 等级都是合格品,C 等级是次品,统计结果如表所示:等级ABC频数 100 75 25(表二)合格品 次品 合计 甲 80 乙 5 合计在相关政策扶持下,确保每件合格品都有对口销售渠道,但从安全起见,所有的次品必须由厂家自行销毁.(1)请根据所提供的数据,完成上面的22⨯列联表(表二),并判断是否有99.5%的把握认为产品的合格率与技术升级有关?(2)每件玩具的生产成本为20元,,A B 等级产品的出厂单价分别为m 元、40元.若甲生产线抽检的玩具中有35件为A 等级,用样本的频率估计概率,若进行技术升级后,平均生产一件玩具比技术升级前多盈利12元,则A 等级产品的出产单价为多少元?附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()20P K k ≥0.05 0.025 0.010 0.005 0.0010k3.841 5.024 6.635 7.879 10.8284.(2021·河南高二月考(文))某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,得出以下22⨯列联表:积极参加班级工作不太主动参加班级工作总计 学习积极性高 18725 学习积极性一般ab25 总计cd50如果随机抽查该班的一名学生,那么抽到积极参加班级工作的学生的概率是1225. (1)求a ,b ,c ,d 的值.(2)试运用独立性检验的思想方法分析:能否有99.9%的把握认为学生的学习积极性与对待班级工作的态度有关系?并说明理由.参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:20()P K k ≥0.10 0.05 0.025 0.010 0.005 0.0010k2.7063.841 5.024 6.635 7.879 10.8285.(2021·内蒙古包头市·高三一模(文))某贫困县为了响应国家精准扶贫的号召,特地承包了一块土地,已知土地的使用面积以及相应的管理时间的关系如下表: 土地使用面积x (单位:亩) 1 2 3 4 5 管理时间y (单位:月)911142620并调查了某村300名村民参与管理的意愿,得到的部分数据如下表所示:愿意参与管理不愿意参与管理男性村民 140 60 女性村民40(1)求相关系数r 的大小(精确到0.01),并判断管理时间y 与土地使用面积x 的线性相关程度;(2)是否有99.9%的把握认为村民的性别与参与管理的意愿具有相关性?参考公式:()()()()12211niii nniii i x x y y r x x y y ===--=--∑∑∑,()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.临界值表:()20P K k ≥0.100 0.050 0.025 0.010 0.0010k2.7063.841 5.024 6.635 10.82848522.02≈.6.(2021·聊城市·山东聊城一中高三一模)已知某班有50位学生,现对该班关于“举办辩论赛”的态度进行调查,,他们综合评价成绩的频数分布以及对“举办辩论赛”的赞成人数如下表:综合评价成绩(单位:分) [40,50)[50,60)[60,70)[70,80)[80,90)[90,100)频数 510151055赞成人数4812431(1)请根据以上统计数据填写下面2×2列联表,并回答:是否有95%的把握认为“综合评价成绩以80分位分界点”对“举办辩论赛”的态度有差异?综合评价成绩小于80分的人数综合评价成绩不小于80分的人数合计赞成 不赞成 合计(2)若采用分层抽样在综合评价成绩在[60,70),[70,80)的学生中随机抽取10人进行追踪调查,并选其中3人担任辩论赛主持人,求担任主持人的3人中至少有1人在[60,70)的概率.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:P()20Kk ≥0.10 0.050.010 0.005 k 02.7063.8416.6357.8797.(2021·全国高三月考(理))某购物网站统计了,A B 两款手机在2020年7月至11月的总销售量y (单位:百部),得到以下数据: 月份x 7 8 9 10 11 销售量y100120110120200(Ⅰ)已知销售量y 与月份x 满足线性相关关系,求出y 关于x 的线性回归方程,ˆˆˆybx a =+,并预测12月的手机销售量; (Ⅱ)网站数据分析人员发现:,A B 两款手机11月的销售量与顾客性别有关.请填写下面的22⨯列联表,并判断能否有超过99.5%的把握认为“,A B 两款手机11月的销售量与顾客性别有关”?男性顾客女性顾客合计A 款销售量90B 款销售量50合计90参考公式:()()()121niii ni i x x y y b x x ==--=-∑∑,ˆˆay bx =-, ()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.临界值表:()20P K k ≥ 0.010 0.005 0.0010k6.6357.879 10.8288.(2021·湖北高三月考)近年来,明代著名医药学家李时珍故乡黄冈市蕲春县大力发展大健康产业,蕲艾产业化种植已经成为该县脱贫攻坚的主要产业之一,已知蕲艾的株高y (单位:cm)与一定范围内的温度x (单位:℃)有关,现收集了蕲艾的13组观测数据,得到如下的散点图:现根据散点图利用y a x =+dy c x=+建立y 关于x 的回归方程,令s x =,1t x=得到如下数据: xyst10.15109.943.040.16113ni ii s y s y =-⋅∑ 13113i ii t yt y =-⋅∑1322113ik ss =-∑1322113ii tt =-∑1322113ii yy =-∑13.94 -2.1 11.67 0.21 21.22且(i s ,i y )与(i t ,i y )(i =1,2,3,…,13)的相关系数分别为1r ,2r ,且2r =﹣0.9953. (1)用相关系数说明哪种模型建立y 与x 的回归方程更合适; (2)根据(1)的结果及表中数据,建立y 关于x 的回归方程;(3)已知蕲艾的利润z 与x 、y 的关系为1202z y x =-,当x 为何值时,z 的预报值最大.参考数据和公式:0.21×21.22=4.4562,11.67×21.22=247.6374,247.637415.7365,对于一组数据(i u ,i v )(i =1,2,3,…,n ),其回归直线方程v u αβ=+的斜率和截距的最小二乘法估计分别为1221ni i i nii u vnu v unuβ==-⋅=-∑∑,v u αβ=-,相关系数222211ni i nniii i u vnu vr unu vnv==-⋅=-⋅-∑∑∑.9.(2021·辽宁高三期末(文))2019年4月,中国电信公布了2019年的终端洞察报告,其中,国产手机品牌表现抢眼,统治地位不容置疑.在2018年6—11月上市的新机中,用户最满意机型与用户推荐机型的项目中国产手机优势明显,华为及荣耀手机分别占据不同价位段的榜单第一,OPPO 、vivo 、小米、魅族均有机型占据榜单.在用户满意机型调研项目中,曾经位于神坛地位的苹果手机也仅仅只有iPhoneXR 一款位列第三.最满意度机型TOP3 中国电信大于3500 2500-3499 1500-2499 1000-1499 1000元以下 第一名华为P30 ProvivoiQoo荣耀9X Vivo Z5x华为畅享9e第二名三星S10+荣耀20Pro红米K20ProOPPO A9红米7第三名iPhone XRVivo X27化为 麦芒8华为畅享9plus中兴BladeA7 (1)从上表中“华为(不含荣耀)”和“iPhoneXR ”的5个机型中任取2个,求这两个机型都是华为的概率;(2)测试数据源于消费者的反馈,从反馈信息中随机抽取500个“华为畅享9plus ”消费者,其中来自城市300个,来自农村200个,统计他们对“华为畅想9plus ”的满意情况如下:满意不满意城市 270 30 农村17030根据上表数据,问是否有95%的把握认为消费者是否满意与城市用户还是农村用户有关?(附:()()()()()22n ad bc X a b c d a c b d -=++++;当2 3.841X >时,有95%的把握说事件A与B 有关;当2 6.635X >时,有99%的把握说事件A 与B 有关;当2 3.841X ≤时,认为事件A 与B 是无关的)10.(2021·全国高三其他模拟)在我国,大学生就业压力日益严峻,伴随着政府政策的引导与社会观念的转变,大学生的创业意识与就业方向也悄然发生转变.某大学生在国家提供的税收,担保贷款等多方面的政策扶持下选择加盟某专营店自主创业,该专营店统计了近五年来创收利润数i y (单位:万元)与时间i t (单位:年)的数据,列表如下:i t1 2 3 4 5i y2.4 2.7 4.1 6.4 7.9(1)依据表中给出的数据,是否可用线性回归模型拟合与t 的关系,请计算相关系数r 并加以说明(计算结果精确到0.01).(若0.75r>,则线性相关程度很高,可用线性回归模型拟合)(2)该专营店为吸引顾客,特推出两种促销方案. 方案一:每满500元可减50元;方案二:每满500元可抽奖一次,每次中奖的概率都为25,中奖就可以获得100元现金奖励,假设顾客每次抽奖的结果相互独立.(ⅰ)某位顾客购买了1050元的产品,该顾客选择参加两次抽奖,求该顾客换得100元现金奖励的概率(ⅱ)某位顾客购买了2000元的产品,作为专营店老板,是希望该顾客直接选择方案一返回200元现金,还是选择方案二参加四次抽奖?说明理由.附:相关系数公式:()()()()()()1122221111nnii i ii i nnnniiiii i i i tt y y t yntyr tt yy tt yy ======---=----∑∑∑∑∑∑,参考数据:56.957.547≈,5185.2i i i t y ==∑,()52110i i t t =-=∑,()52122.78i i y y =-∑11.(2021·全国高三其他模拟)人均可支配收入是反映一个地区居民收入水平和城市经济发展水平的重要指标,并且对人均消费水平有重大影响,下图是根据国家统计局发布的《2020年上半年居民收入和消费支出情况》绘制的,是我国31个省(区、市)2020年上半年人均可支配收入x (单位:元)与人均消费支出y (单位:元)的散点图.(1)由散点图可以看出,可以用线性回归模型ˆˆybx a =+拟合人均消费支出y 与人均可支配收入x 的关系,请用相关系数加以说明; (2)建立y 关于x 的线性回归方程(精确到0.01);(3)根据(2)的结论,规定半年人均盈余(人均可支配收入-人均消费支出)不低于4620元的省(区、市)达到阶段小康的标准,则估计达到阶段小康标准的省(区、市)的半年人均可支配收入至少为多少元? 参考数据:xy()3121=-∑ii xx()()311=--∑ii i xx y y()3121=-∑ii xx()3121=-∑ii yy15500 9632 1412000000 683900000 38000 18400参考公式:相关系数()()()()12211niii nniii i x x y y r x x y y ===--=--∑∑∑回归方程ˆˆˆybx a =+中斜率和截距的最小二乘估计公式分别为()()()121ˆniii nii x x y y b x x ==--=-∑∑,ˆˆay bx =-. 12.(2021·甘肃兰州市·高三其他模拟(文))某校高二生物研究性学习小组的同学们为了研究当地某种昆虫的产卵数与温度的变化关系,他们收集了一只该种昆虫在温度C x ︒时相对应产卵数个数为y 的8组数据,为了对数据进行分析,他们绘制了如下散点图:(1)根据散点图,甲、乙两位同学分别用y bx a =+和z dx c =+(其中ln z y =)两种模型进行回归分析,试判断这两位同学得到的回归方程中,哪一个的相关指数2R 更接近1;(给出判断即可,不必说明理由)(2)根据(1)的结论选定上述两个模型中更适宜作为对昆虫产卵数与温度变化关系进行回归分析的模型,并利用下表中数据,计算该模型的回归方程: (方程表示为()y f x =的形式,数据计算结果保留两位小数) xyz81i ii x y =∑81i i i x z =∑821ii x=∑26 72 3.3 11871 757 5722(3)据测算,若只此种昆虫的产卵数超过4e ,则会发生虫害.研究性学习小组的同学通过查阅气象资料得知近期当地温度维持在25C ︒左右,试利用(2)中的回归方程预测近期当地是否会发生虫害.附:对于一组数据()()()1122,,,,,,n n u v u v u v ,其回归直线v u βα=+的斜率和截距的最小二乘估计分别为1221ˆˆˆ,nl i i ni i u v nuvv u unu βαβ==-==--∑∑. 13.(2021·全国高三月考(文))2020年11月24日我国使用长征五号运载火箭成功发射嫦娥五号月球探测器,12月17日嫦娥五号返回器携带月球样品在预定地区安全着陆,探月工程嫦娥五号任务取得圆满成功.某大学为此举行了与嫦娥系列探测工程有关的知识测试,测试满分为100分,该校某专业的100名大一学生参加了学校举行的测试,记录这100名学生的分数,将数据分成7组; [)[)[]30,40,40,50,,90,100⋯,并整理得到如下频率分布直方图:(1)估计这100名学生测试分数的中位数;(2)把分数不低于80分的称为优秀,已知这100名学生中男生有70人,其中测试优秀的男生有45人,填写下面列联表,并根据列联表判断是否有95%的把握认为测试优秀与性别有关: 男生 女生 优秀 不优秀附:20()P K k ≥0.050 0.010 0.0010k 3.841 6.635 10.828()()()()()22n ad bc K a b c d a c b d -=++++ (3)对于样本中分数在[)[]80,90,90,100的人数,学校准备按比例从这2组中抽取12人,在从这12人中随机抽取3人参与学校有关的宣传活动,记这3人分数不低于90分的学生数为,X 求X 的分布列.14.(2021·江西高三其他模拟(文))某疫苗进行安全性临床试验.该疫苗安全性的一个重要指标是:注射疫苗后人体血液中的高铁血红蛋白(MetHb )的含量(以下简称为“M 含量”)不超过1%,则为阴性,认为受试者出现血症.若一批受试者的M 含量平均数不超过0.65%,出现血症的被测试者的比例不超过5%,同时满足这两个条件则认为该疫苗在M 含量指标上是“安全的”;否则为“不安全”.现有男、女志愿者各200名接受了该疫苗注射.经数据整理,制得频率分布直方图如图.(注:在频率分布直方图中,同一组数据用该区间的中点值作代表.)(1)请说明该疫苗在M 含量指标上的安全性;(2)按照性别分层抽样,随机抽取50名志愿者进行M 含量的检测,其中女性志愿者被检测出阳性的恰好1人.请利用样本估计总体的思想,完成这400名志愿者的22⨯列联表,并判断是否有超过95%的把握认为,注射该疫苗后,高铁血红蛋白血症与性别有关?性别 阴性阳性男 女 合计阳性 阴性合计附:()()()()()22n ad bcKa b c d a c b d-=++++.()2P K k≥0.050 0.010 0.001 0k 3.841 6.635 10.82815.(2021·全国高三专题练习(文))在关研究表明,正确佩戴安全头盔,规范使用安全带能够将交通事故死亡风险大幅降低,对保护群众生命安全具有重要作用.2020年4月,“一盔一带”安全守护行动在全国各地开展.行动期间,公安交管部门将加强执法管理,依法查纠摩托车和电动自行车骑乘人员不佩戴安全头盔,汽车驾乘人员不使用安全带的行为,助推养成安全习惯.该行动开展一段时间后,某市针对电动自行车骑乘人员是否佩戴安全头盔问题进行调查,在随机调查的1000名骑行人员中,记录其年龄和是否佩戴头盔情况,得到如下的统计图表:(Ⅰ)估算该市电动自行车骑乘人员的平均年龄;(Ⅱ)根据所给的数据,完成下面的列联表:是否佩戴头盔年龄是否[)20,40[]40,70(Ⅲ)根据(Ⅱ)中的列联表,判断是否有99%把握认为遵守佩戴安全头盔与年龄有关?附:()()()()()22n ad bcKa b c d a c b d-=++++,()2P K k≥0.050 0.010 0.001k 3.841 6.635 10.82816.(2021·全国高三专题练习(文))针对偏远地区因交通不便、消息闭塞导致优质农产品藏在山中无人识的现象,各地区开始尝试将电商扶贫作为精准扶贫的重要措施.为了解电商扶贫的效果,某部门随机就100个贫困地区进行了调查,其当年的电商扶贫年度总投入(单位:万元)及当年人均可支配年收入(单位:元)的贫困地区数目的数据如下表:人均可支配年收入(元)电商扶贫年度总投入(万元)(5000,10000] (10000,15000] (15000,20000] (0,500] 5 3 2(500,1000] 3 21 6(1000,3000) 2 34 24(1)估计该年度内贫困地区人均可支配年收入过万的概率,并求本年度这100个贫困地区的人均可支配年收入的平均值的估计值(同一组数据用该组数据区间的中间值代表);(2)根据所给数据完成下面的列联表,并判断是否有99%的把握认为当地的人均可支配年收入是否过万与当地电商扶贫年度总投入是否超过千万有关.人均可支配年收入≤10000元人均可支配年收入>10000元电商扶贫年度总投入不超过1000万电商扶贫年度总投入超过1000万附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()2P K k ≥0.050 0.01 0.005 k3.8416.6357.87917.(2021·全国高三专题练习(文))为研究男、女生的身高差异,现随机从高三某班选出男生、女生各10人,并测量他们的身高,测量结果如下(单位:厘米): 男:173 178 174 185 170 169 167 164 161 170 女:165 166 156 170 163 162 158 153 169 172(1)根据测量结果完成身高的茎叶图(单位:厘米),并分别求出男、女生身高的平均值;(2)请根据测量结果得到20名学生身高的中位数h (单位:厘米),将男、女生身高不低于h 和低于h 的人数填入下表中,并判断是否有90%的把握认为男、女生身高有差异?(3)若男生身高低于165厘米为偏矮,不低于165厘米且低于175厘米为正常,不低于175厘米为偏高.采用分层抽样的方法从以上男生中抽取5人作为样本.若从样本中任取2人,试求恰有1人身高属于正常的概率.()20P K k ≥ 0.100.05 0.025 0.010 0.005 0.0010k2.7063.8415.0246.6357.879 10.828参照公式:()()()()()22n ad bc k a b c d a c b d -=++++ 18.(2021·全国高三专题练习(文))某生物研究所研发了某种型号的新冠疫苗,为检验该种型号疫苗的效果,研究所将疫苗用在小白鼠身上进行科研实验,得到如下数据:未感染病毒感染病毒 总计未注射疫苗 a 60 m 注射疫苗 b30 n总计11090200从未注射疫苗的小白鼠中任取1只,取到“未感染病毒”的小白鼠的概率为5. (1)能否有99.9%的把握认为注射此疫苗有效?(2)在感染病毒的小白鼠中,按未注射疫苗和注射疫苗的比例抽取6只进行病理分析,然后从这6只小白鼠中随机抽取2只对注射疫苗的情况进行核实,求至少有1只为注射过疫苗的概率.附:()()()()()22n ad bc K a b c d a c b d -=++++. ()2P K k ≥0.05 0.025 0.010 0.005 0.001 k3.8415.0246.6357.87910.82819.(2021·全国高三专题练习(文))某研究部门为了研究气温变化与患流感人数多少之间的关系,在某地随机对50人进行了问卷调查得到如下列表:(附22()()()()()n ad bc K a b c d a c b d -=++++)高于22.5C ︒ 不高于22.5C ︒ 合计 患流感2025不患流感15合计50(1)对上述22⨯列联表进行填空,并判断是否有99%的把握认为患流感与温度有关,说明你的理由;(2)为了了解患流感与年龄的关系,已知某地患有流感的老年、中年、青年的人数分别为108人,72人,36人.按分层抽样的方法随机抽取6人进行问卷调查,再从6人中随机抽取2人进行调查结果对比,求这2人中至少一人是中年人的概率.()2>0.10 0.05 0.025 0.01 P K kk 2.701 3.841 5.024 6.63520.(2021·山东德州市·高三一模)2021年春晚首次采用“云”传播,“云”互动形式,实现隔空连线心意相通,全球华人心连心“云团圆”,共享新春氛围,“云课堂”亦是一种真正完全突破时空限制的全方位互动性学习模式.某市随机抽取200人对“云课堂”倡议的了解情况进行了问卷调查,记Y表示了解,N表示不了解,统计结果如下表所示:(表一)了解情况Y N人数140 60(表二)男女合计Y80N40合计(1)请根据所提供的数据,完成上面的22⨯列联表(表二),并判断是否有99%的把握认为对“云课堂”倡议的了解情况与性别有关系;(2)用样本估计总体,将频率视为概率,在男性市民和女性市民中各随机抽取4人,记“4名男性中恰有3人了解云课堂倡议”的概率为1P,“4名女性中恰有3人了解云课堂倡议”的概率为2P .试求出1P 与2P ,并比较1P 与2P 的大小. 附:临界值参考表的参考公式()20p K K ≥0.10 0.05 0.025 0.010 0.005 0.0010K 2.7063.841 5.024 6.635 7.879 10.828()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++) 21.(2021·吉林长春市·高三二模(理))随着互联网行业、传统行业和实体经济的融合不断加深,互联网对社会经济发展的推动效果日益显著,某大型超市计划在不同的线上销售平台开设网店,为确定开设网店的数量,该超市在对网络上相关店铺做了充分的调查后,得到下列信息,如图所示(其中x 表示开设网店数量,y 表示这x 个分店的年销售额总和),现已知55118850,2000i ii i i x yy ====∑∑,求解下列问题;(1)经判断,可利用线性回归模型拟合y 与x 的关系,求解y 关于x 的回归方程; (2)按照经验,超市每年在网上销售获得的总利润w (单位:万元)满足25140w y x =--,请根据(1)中的线性回归方程,估算该超市在网上开设多少分店时,才能使得总利润最大.参考公式;线性回归方程y bx a =+,其中515221,i ii ii x y nx ya y bxb xnx==-=-=-∑∑22.(2021·河南高三月考(文))2020年初,新冠病毒肆虐.疫情期间,停课不停教学,各学校以网课形式进行教学.教育局抽样对某所学校的高三1000名学生某一周每天学习时间以及考试进行了调查,得如下频数分布表 学习时间(分钟) [)7,7.5[)7.5,8[)8,8.5[)8.5,9[)9,9.5[]9.5,10人数160190200180150120从1000名学生中抽取50名学生,调查学习时间与成绩的关系,得如下二阶列联表学习时间9小时以上(含9小时)学习时间9小时以下合计总分600分以上(含600分) 7 3 10 总分600分以下 17 23 40 合计242650(1)求出第一星期这1000名学生学习时间的中位数;(2)为了解学生们的学习状况,一次考试结束,从全年级随机抽取50人根据学习时间的多少和成绩的是否优秀列成以下列联表计算说明:有没有90%的把握认为总分600分以上和学习时间超过9小时有关附公式及表如下:()()()()()22n ad bc K a b c d a c b d -=++++ ()20P K K ≥ 0.150.10 0.05 0.025 0.010 0.005 0.0010k2.0722.7063.841 5.024 6.635 7.879 10.82823.(2021·全国高三专题练习)垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成分复杂多样,且具有污染性,所以需要无害化、减量化处理.某市为调查产生的垃圾数量,采用简单随机抽样的方法抽取20个县城进行了分析,得到样本数据()(),1,2,,20i i x y i =⋅⋅⋅,其中i x 和i y 分别表示第i 个县城的人口(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得20180i i x ==∑,2014000i i y ==∑,()202180i i x x=-=∑,()20218000ii y y =-=∑,()()201700i ii x xy y =--=∑.(1)请用相关系数说明该组数据中y 与x 之间的关系可用线性回归模型进行拟合; (2)求y 关于x 的线性回归方程,用所求回归方程预测该市10万人口的县城年垃圾产生总量约为多少吨?参考公式:相关系数()()()()12211niii nniii i x x y y r x x y y ===--=--∑∑∑,对于一组具有线性相关关系的数据()(),1,2,3,,i i x y i n =⋅⋅⋅,其回归直线y bx a =+的斜率和截距的最小二乘估计分别为()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-.24.(2021·全国高三专题练习(文))随着冬季的到来,是否应该自觉佩戴口罩成为了人们热议的一个话题.为了调查佩戴口罩的态度与性别是否具有相关性,研究人员作出相应调查,并统计数据如表所示: 认为冬季佩戴口罩十分必要 认为冬季佩戴口罩没有必要 男性 300 200 女性150150(1)判断是否有99.9%的把握认为佩戴口罩的态度与性别有关?(2)若按照分层抽样的方法从男性中随机抽取5人,再从这5人中随机抽取2人,求恰有1人认为冬季佩戴口罩十分必要的概率.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:()20P K k0.100 0.050 0.010 0.001k 2.706 3.841 6.635 10.82825.(2021·全国高三专题练习)在新型冠状病毒疫情期间,某高中学校实施线上教学,为了解线上教学的效果,随机抽取了100名学生对线上教学效果进行评分(满分100分),记低于80的评分为“效果一般”,不低于80分为“效果较好”.(1)请补充完整22⨯列联表;通过计算判断,有没有99%的把握认为线上教学效果评分为“效果较好”与性别有关?效果一般效果较好合计男20女1555合计(2)用(1)中列联表的数据估计全校线上教学的效果,用频率估计概率.从该校学生中任意抽取3人,记所抽取的3人中线上教学“效果较好”的人数为X,求X的分布列和数学期望.附表及公式:()2P K k0.150.100.050.0250.010 0k 2.072 2.706 3.841 5.024 6.635其中()()()()()22n ad bcka b c d a c b d-=++++,n a b c d=+++.26.(2021·全国高三专题练习)近年来,我国的电子商务行业发展迅速,与此同时,相关管理部门建立了针对电商的商品和服务评价系统.现从评价系统中选出200次成功的交易,并对其评价进行统计,对商品的好评率为35,对服务的好评率为710;其中对商品和服务均为好评的有80次(1)是否可以在犯错误概率不超过0.1的前提下,认为商品好评与服务好评有关?(2)若将频率视为概率,某人在该购物平台上进行的4次购物中,设对商品和服务全好评的次数为随机变量X:求对商品和服务全好评的次数X的分布列及其期望.()20P K k 0.15 0.10 0.05 0.025 0.010 0.005 0.0010k2.072 2.7063.841 5.024 6.635 7.879 10.82822()()()()()n ad bc K a b c d a c b d -=++++(其中n a b c d =+++)27.(2021·全国高三专题练习)某校高一年级进行安全知识竞赛(满分为100分),所有学生的成绩都不低于75分,从中抽取100名学生的成绩进行分组调研,第一组[)75,80,第二组[)80,85,,第五组[]95,100(单位:分),得到如下的频率分布直方图.(1)若竞赛成绩不低于85分为优秀,低于85分为非优秀,且成绩优秀的男学生人数为35,成绩非优秀的女学生人数为25,请判断是否有95%的把握认为竞赛成绩的优秀情况与性别有关;(2)用分层抽样方法,在成绩不低于85的学生中抽取6人,再从这6人中随机选3人发言谈体会,设这3人中成绩在[)85,90的人数为ξ,求ξ的分布列与数学期望.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.临界值表:()20P K k ≥ 0.10 0.05 0.025 0.01 0.0050k2.7063.841 5.024 6.635 7.87928.(2021·全国高三专题练习)支付宝为人们的生活带来许多便利,为了了解支付宝在某市的使用情况,某公司随机抽取了100名支付宝用户进行调查,得到如下数据: 每周使用支付宝次数 1 2 3 4 5 6及以上 40岁及以下人数 3 3 4 8 7 30 40岁以上人数 4 5 6 6 4 20 合计7810141150(1)如果认为每周使用支付宝超过3次的用户“喜欢使用支付宝”,完成下面22⨯列联表,并判断能否在犯错误概率不超过0.05的前提下,认为是否“喜欢使用支付宝”与年龄有关?不喜欢使用支付宝 喜欢使用支付宝 合计 40岁及以下人数 40岁以上人数 合计(2)每周使用支付宝6次及以上的用户称为“支付宝达人”,视频率为概率,在该市所有“支付宝达人”中,随机抽取3名用户.①求抽取的3名用户中,既有40岁及以下“支付宝达人”又有40岁以上“支付宝达人”的概率;②为了鼓励40岁以上用户使用支付宝,对抽出的40岁以上“支付宝达人”每人奖励500元,记奖励总金额为X (单位:元),求X 的数学期望.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()20P K k ≥ 0.15 0.10 0.05 0.025 0.010 0.005 0.0010k2.0722.7063.841 5.024 6.635 7.879 10.82829.(2021·全国高三专题练习)2019年4月,江苏省发布了高考综合改革实施方案,试行“312++”高考新模式.为调研新高考模式下,某校学生选择物理或历史与性别是否有。
2021年高考数学一轮复习考点与题型总结第十章统计与统计案例

第十章统计与统计案例第一节随机抽样一、基础知识1.简单随机抽样(1)定义:一般地,设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.(2)常用方法:抽签法和随机数法.2.分层抽样(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.3.系统抽样(1)定义:当总体中的个体数较多时,可以将总体分成均衡的几部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需的样本,这种抽样的方法叫做系统抽样.(2)系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本.n 是样本容量)是整数时,取k=Nn当总体中的个体数不能被样本容量整除时,可先用简单随机抽样的方法从总体中剔除几个个体,使剩下的个体数能被样本容量整除,然后再按系统抽样进行.这时在整个抽样过程中每个个体被抽取的可能性仍然相等.;二、常用结论(1)不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.(3)分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.(4)三种抽样方法的特点、联系及适用范围考点一简单随机抽样[典例] 下列抽取样本的方式属于简单随机抽样的个数有( )①从无限多个个体中抽取100 个个体作为样本;②盒子里共有80 个零件,从中选出5 个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里;③用抽签方法从10 件产品中选取3 件进行质量检验;④某班有56 名同学,指定个子最高的 5 名同学参加学校组织的篮球赛.A.0 个B.1 个C.2 个D.3 个[解析] ①不是简单随机抽样,因为被抽取样本的总体的个数是无限的,而不是有限的;②不是简单随机抽样,因为它是有放回抽样;③明显为简单随机抽样;④不是简单随机抽样,因为不是等可能抽样.[答案] B[解题技法] 应用简单随机抽样应注意的问题(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的 数字舍去.[题组训练]A.08 C .02 D .012.利用简单随机抽样,从 n 个个体中抽取一个容量为 10 的样本.若第二次抽取时,余 下的每个个体被抽到的概率为1,则在整个抽样过程中,每个个体被抽到的概率为()3A.1 4C. 5 14解析:选 C 根据题意, 9 1B.1 3 D.10 27解得 n =28.= , n -1 3故在整个抽样过程中每个个体被抽到的概率为10= 5.28 14考点二 系统抽样[典例] (1)某校为了解 1 000 名高一新生的身体生长状况,用系统抽样法(按等距的规A .16B .17C .18D .19(2)中央电视台为了解观众对某综艺节目的意见,准备从 502 名现场观众中抽取 10%进行座谈,现用系统抽样的方法完成这一抽样,则在进行分组时,需剔除个个体,抽样间隔为 .[解析] (1)因为从 1 000 名学生中抽取一个容量为 40 的样本,所以系统抽样的分段间隔 为1 000=25,40设第一组随机抽取的号码为 x ,(2)把 502 名观众平均分成 50 组,由于 502 除以 50 的商是 10,余数是 2,所以每组有 10 名观众,还剩 2 名观众,采用系统抽样的方法抽样时,应先用简单随机抽样的方法从 502500,并均匀分成 50 段,每段含50010 个个体.所以需剔除 2 个个体,抽样间隔为 10. 50[答案] (1)C (2)2 10[变透练清]解析:从 1 000 名学生中抽取一个容量为 40 的样本,系统抽样分 40 组,每组1 000=2540 个号码,每组抽取一个,从 501 到 750 恰好是第 21 组到第 30 组,共抽取 10 人.答案:10本,若在第 1 组中随机抽取的号码为 5,则在第 6 组中抽取的号码为.解析:由题知分组间隔为64=8,又第 1 组中抽取的号码为 5,所以第 6 组中抽取的号8 码为 5×8+5=45.答案:45系统抽样又称等距抽样,所以依次抽取的样本对应的号码就是一个等差数列,首项就是 第 1 组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.[提醒] 系统抽样时,如果总体中的个数不能被样本容量整除时,可以先用简单随机抽 样从总体中剔除几个个体,然后再按系统抽样进行.考点三 分层抽样=[典例] 某电视台在网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有20 000 人,其中各种态度对应的人数如下表所示:电视台为了了解观众的具体想法和意见,打算从中抽取100 人进行详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中应抽取的人数分别为( ) A.25,25,25,25 B.48,72,64,16C.20,40,30,10 D.24,36,32,8[ 解析] 法一:因为抽样比为100 = 1 ,所以每类人中应抽取的人数分别为20 000 2004 800×1=24,7 200×1=36,6 400×1=32,1 600×1=8. 200 200 200 200法二:最喜爱、喜爱、一般、不喜欢的比例为4 800∶7 200∶6 400∶1 600=6∶9∶8∶2,所以每类人中应抽取的人数分别为6×100=24,9×100=36,6+9+8+28 2×100=32,×100=8.6+9+8+26+9+8+2[答案] D6+9+8+2[解题技法] 分层抽样问题的类型及解题思路(1)求某层应抽个体数量:按该层所占总体的比例计算.(2)已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.(3) 分层抽样的计算应根据抽样比构造方程求解,其中“ 抽样比=样本容量=总体容量各层样本数量”.各层个体数量[题组训练]1.(2019·山西五校联考)某校为了解学生的学习情况,采用分层抽样的方法从高一1 000 人、高二1 200 人、高三n 人中抽取81 人进行问卷调查,若高二被抽取的人数为30,则n =( )A.860 B.720C.1 020 D.1 040解析:选D 由已知条件知抽样比为30=1,从而81=1,解得n=1 200 40 1 000+1 200+n 40= ,06 32 35 92 46 22 54 10 02 78 49 82 18 86 70 48 05 46 88 15 19 20 491 040,故选 D.2.(2018·广州高中综合测试)已知某地区中小学学生人数如图所示.为 了解该区学生参加某项社会实践活动的意向,拟采用分层抽样的方法来进 行调查.若高中需抽取 20 名学生,则小学与初中共需抽取的学生人数为.解析:设小学与初中共需抽取的学生人数为 x ,依题意可得1 20020解得 x =85.答案:85[课时跟踪检测]2 700+2 400+1 200 x +201.从 2 019 名学生中选取 50 名学生参加全国数学联赛,若采用以下方法选取:先用简 单随机抽样法从 2 019 名学生中剔除 19 名学生,剩下的 2 000 名学生再按系统抽样的方法抽取,则每名学生入选的概率()A .不全相等B .均不相等C .都相等,且为 502 019解析:选 C 从 N 个个体中抽取 M名学生入选的概率都相等,且为 50.2 019D .都相等,且为 140个个体,则每个个体被抽到的概率都等于M,故每N2.福利彩票“双色球”中红球的号码可以从 01,02,03,…,32,33 这 33 个两位号码中选取,小明利用如下所示的随机数表选取红色球的 6 个号码,选取方法是从第 1 行第 9 列的数字开始,从左到右依次读取数据,则第四个被选中的红色球的号码为( )A.12 B .33 C .06D .16解析:选 C 被选中的红色球的号码依次为 17,12,33,06,32,22,所以第四个被选中的红色球的号码为 06.3.某班共有学生 52 人,现根据座号,用系统抽样的方法,抽取一个容量为 4 的样本.已知 5 号、18 号、44 号同学在样本中,那么样本中还有一个同学的座号是()A .23B .2781 47 23 68 63 93 17 90 12 69 86 81 62 93 50 60 91 33 75 85 61 39 85C .31D .33解析:选 C 分段间隔为52=13,故样本中还有一个同学的座号为 18+13=31.4 4.某工厂在 12 月份共生产了 3 600 双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为 a ,b ,c ,且 a ,b , c 构成等差数列,则第二车间生产的产品数为()A .800 双B .1 000 双C .1 200 双D .1 500 双解析:选 C 因为 a ,b ,c 成等差数列,所以 2b =a +c ,即第二车间抽取的产品数占抽样产品总数的三分之一,根据分层抽样的性质可知,第二车间生产的产品数占 12 月份生产 总数的三分之一,即为 1 200 双皮靴.5.(2018·南宁摸底联考)已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取 2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A .100,20B .200,20C .200,10D .100,10解析:选 B 由题图甲可知学生总人数是 10 000,样本容量为 10 000×2%=200,抽取的高中生人数是 2 000×2%=40,由题图乙可知高中生的近视率为 50%,所以抽取高中生的近视人数为 40×50%=20,故选 B.=6,则在第 7 组中抽取的号码是() A .63 B .64 C .65D .66解析:选 A 若 m =6,则在第 7 组中抽取的号码个位数字与 13 的个位数字相同,而第A .7B .9C .10D .15解析:选 C 960÷32=30,故由题意可得抽到的号码构成以 9 为首项,以 30 为公差的等差数列,其通项公式为 a n =9+30(n -1)=30n -21.由 450<30n -21≤750,解得 15.7< n ≤25.7.又 n 为正整数,所以 16≤n ≤25,故做问卷 B 的人数为 25-16+1=10.故选 C.8.某企业三月中旬生产 A ,B ,C 三种产品共 3 000 件,根据分层抽样的结果,企业统计员制作了如下的统计表格:产品类别 A B C产品数量(件) 1 300 样本容量(件)130A 产品的样本容量比 C 产品的样本容量多 10,根据以上信息,可得 C 的产品数量是件.解析:设样本容量为 x ,则 x ×1 300=130,∴x =300.3 000 ∴A 产品和 C 产品在样本中共有 300-130=170(件). 设 C 产品的样本容量为 y ,则 y +y +10=170,∴y =80.∴C 产品的数量为3 00080=800(件). 300 答案:8009.某企业三个分厂生产同一种电子产品,三个分厂产量分布如图所示,现在用分层抽样方法从三个分厂生产的该产品中共抽取 100 件做使用寿命的测试,则第一分厂应抽取的件数为;由所得样品的测试结果计算出一、二、三分厂取出的产品的使用寿命平均值分别为 1 020 小时、980 小时、1 030 小时,估计这个企业所生产的该产品的平均使用寿命为小时.解析:第一分厂应抽取的件数为 100×50%=50;该产品的平均使用寿命为 1 020×0.5 +980×0.2+1 030×0.3=1 015.答案:50 1 015×5 抽得的号码为 004,这 600 名选手穿着三种颜色的衣服,从 001 到 301 穿红色衣服,从 302 到 496 穿白色衣服,从 497 到 600 穿黄色衣服,则抽到穿白色衣服的选手人数为.2 5≤k ≤42,因此抽到穿白色衣服的选手人数为 42-25=17(人). 6答案:1711.某初级中学共有学生 2 000 名,各年级男、女生人数如下表:(1)求 x 的值;(2)现用分层抽样的方法在全校抽取 48 名学生,问应在初三年级抽取多少名? 解 :(1)∵ x=0.19,∴x =380.2 000(2)初三年级人数为 y +z =2 000-(373+377+380+370)=500,现用分层抽样的方法在 全校抽取 48 名学生,应在初三年级抽取的人数为 48×500=12(名).2 000第二节 用样本估计总体一、基础知识1.频率分布直方图(1)纵轴表示频率频率;(2),即小长方形的高= 组距 组距频率=频率; 小长方形的面积=组距×组距(3)各个小方形的面积总和等于 1 . 2.频率分布表的画法极差第一步:求极差,决定组数和组距,组距= ;组数第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. 3.茎叶图茎叶图是统计中用来表示数据的一种图, 茎是指中间的一列数,叶就是从茎的旁 边生长出来的数.4.中位数、众数、平均数的定义 (1)中位数将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数) 叫做这组数据的中位数.(2)众数一组数据中出现次数最多的数据叫做这组数据的众数. (3)平均数一组数据的算术平均数即为这组数据的平均数,n 个数据 x 1,x 2,…,x n 的平均数 x = 1(x 1+x 2+…+x n ). n5.样本的数字特征如果有 n 个数据 x 1,x 2,…,x n ,那么这 n 个数的(1)平均数 x =1(x 1+x 2+…+x n ).n(2)标准差 s =(3)方差s2=1-x )2+(x -x )2+…+(x -x )2].[(x1 2 nn二、常用结论1.频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.2.平均数、方差的公式推广(1)若数据x1,x2,…,x n的平均数为x ,则mx1+a,mx2+a,mx3+a,…,mx n+a 的平均数是m x +a.(2)若数据x1,x2,…,x n的方差为s2,则数据ax1+b,ax2+b,…,ax n+b 的方差为a2s2.考点一茎叶图[典例] (2017·山东高考)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )A.3,5 B.5,5C.3,7 D.5,7[解析] 由两组数据的中位数相等可得65=60+y,解得y=5,又它们的平均值相等,所以15×[56+62+65+74+(70+x)]=1×(59+61+67+65+78),解得x=3.5[答案] A[解题技法] 茎叶图的应用(1)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.(2)给定两组数据的茎叶图,比较数字特征时,“重心”下移者平均数较大,数据集中者方差较小.甲 乙[题组训练]1.在如图所示一组数据的茎叶图中,有一个数字被污染后模糊不清, 但曾计算得该组数据的极差与中位数之和为 61,则被污染的数字为()A .1B .2C .3D .4解析:选 B 由图可知该组数据的极差为 48-20=28,则该组数据的中位数为 61-28 =33,易得被污染的数字为 2.2.甲、乙两名篮球运动员 5 场比赛得分的原始记录如茎叶图所示,若甲、乙两人的平均得分分别为 x 甲, x 乙,则下列结论正确的是()A. x 甲< x 乙;乙比甲得分稳定B. x 甲> x 乙;甲比乙得分稳定C. x 甲> x 乙;乙比甲得分稳定D. x 甲< x 乙;甲比乙得分稳定解析:选 A 因为 x =2+7+8+16+22=11, x 5 =8+12+18+21+25=16.8,所5以 x < x 且乙比甲成绩稳定.考点二 频率分布直方图[典例] 某城市 100 户居民的月平均用电量(单位:千瓦时),以[160,180),[180,200), [200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中 x 的值;(2)求月平均用电量的众数和中位数.[解] (1)由(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1,解得 x =0.007 5.即直方图中 x 的值为 0.007 5.甲乙=(2)月平均用电量的众数是220+240=230. 2∵(0.002+0.009 5+0.011)×20=0.45<0.5, (0.002+0.009 5+0.011+0.012 5)×20=0.7>0.5, ∴月平均用电量的中位数在[220,240)内.设中位数为 a ,则 0.45+0.012 5×(a -220)=0.5,解得 a =224,即中位数为 224. [变透练清]1.某校随机抽取 20 个班,调查各班有出国意向的人数,所得数据的茎叶图如图所示.以 5 为组距将数据分组为[0,5),[5,10),…,[30,35),[35,40],所作的频率分布直方图是()解析:选 A 以 5 为组距将数据分组为[0,5),[5,10),…,[30,35),[35,40],各组的频数依次为 1,1,4,2,4,3,3,2,可知画出的频率分布直方图为选项 A 中的图.2.(变结论)在本例条件下,在月平均电量为[220,240),[240,260),[260,280),[280,300] 的四组用户中,用分层抽样的方法抽取 11 户居民,则月平均用电量在[220,240)的用户中应抽取户.解析:月平均用电量在[220,240)的用户有 0.012 5×20×100=25(户).同理可得月平均 用电量在[240,260)的用户有 15 户,月平均用电量在[260,280]的用户有 10 户,月平均用电 量在[280,300]的用户有 5 户,故抽取比例为111.25+15+10+5 5所以月平均用电量在[220,240)的用户中应抽取 25×1=5(户).5 答案:53.我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年 100 位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9 组,制成了如图所示的频率分布直方图.(1) 求直方图中 a 的值;(2)设该市有30 万居民,估计全市居民中月均用水量不低于3 吨的人数,说明理由.解:(1)由频率分布直方图可知,月均用水量在[0,0.5)的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]6组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.(2)估计全市居民中月均用水量不低于3 吨的人数为3.6 万.理由如下:由(1)知,100 位居民中月均用水量不低于3 吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30 万居民中月均用水量不低于 3 吨的人数为300 000×0.12=36 000=3.6(万).考点三样本的数字特征考法(一) 样本的数字特征与频率分布直方图交汇[典例] (2019·辽宁师范大学附属中学模拟)某校初三年级有400 名学生,随机抽查了40 名学生测试1 分钟仰卧起坐的成绩(单位:次),将数据整理后绘制成如图所示的频率分布直方图.用样本估计总体,下列结论正确的是( )A.该校初三学生1 分钟仰卧起坐的次数的中位数为25B.该校初三学生1 分钟仰卧起坐的次数的众数为24C.该校初三学生1 分钟仰卧起坐的次数超过30 的人数约有80D.该校初三学生1 分钟仰卧起坐的次数少于20 的人数约为8[解析] 第一组数据的频率为0.02×5=0.1,第二组数据的频率为0.06×5=0.3,第三.组数据的频率为 0.08×5=0.4,∴中位数在第三组内,设中位数为 25+x ,则 x ×0.08=0.5 -0.1-0.3=0.1,∴x =1.25,∴中位数为 26.25,故 A 错误;第三组数据所在的矩形最高, 第三组数据的中间值为 27.5,∴众数为 27.5,故 B 错误;1 分钟仰卧起坐的次数超过 30 的频率为 0.2,∴超过 30 次的人数为 400×0.2=80,故 C 正确;1 分钟仰卧起坐的次数少于20 的频率为 0.1,∴1 分钟仰卧起坐的次数少于 20 的人数为 400×0.1=40,故 D 错误.故选 C.[答案] C [解题技法]频率分布直方图与众数、中位数、平均数的关系(1)最高的小长方形底边中点的横坐标为众数; (2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.考法(二) 样本的数字特征与茎叶图交汇[典例] 将某选手的 9 个得分去掉 1 个最高分,去掉 1 个最低分,7 个剩余分数的平均分为 91.现场作的 9 个分数的茎叶图后来有 1 个数据模糊,无法辨认,在图中以 x 表示,则7 个剩余分数的方差为.[解析] 由茎叶图可知去掉的两个数是 87,99,所以 87+90×2+91×2+94+90+x =91×7,解得 x =4.故 s 2=1[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=36 [答案] 367 [解题技法]7 7样本的数字特征与茎叶图综合问题的注意点(1)在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.(2)茎叶图既可以表示两组数据,也可以表示一组数据,用它表示的数据是完整的数据, 因此可以从茎叶图中看出数据的众数(数据中出现次数最多的数)、中位数(中间位置的一个数,或中间两个数的平均数)等.考法(三) 样本的数字特征与优化决策问题交汇[典例] (2018·周口调研)甲、乙两人在相同条件下各射击 10 次,每次中靶环数情况如图所示.(1)请填写下表(写出计算过程):平均数 方差命中 9环及 9 环以上的次数甲 乙(2)①从平均数和方差相结合看(分析谁的成绩更稳定);②从平均数和命中 9 环及 9 环以上的次数相结合看(分析谁的成绩好些); ③从折线图上两人射击命中环数的走势看(分析谁更有潜力). [解] 由题图,知甲射击 10 次中靶环数分别为 9,5,7,8,7,6,8,6,7,7. 将它们由小到大排列为 5,6,6,7,7,7,7,8,8,9. 乙射击 10 次中靶环数分别为 2,4,6,8,7,7,8,9,9,10. 将它们由小到大排列为 2,4,6,7,7,8,8,9,9,10.(1) x = 1 ×(5+6×2+7×4+8×2+9)=7(环), 10x = 1 ×(2+4+6+7×2+8×2+9×2+10)=7(环), 10 s 2 = 1 ×[(5-7)2+(6-7)2×2+(7-7)2×4+(8-7)2×2+(9-7)2]= 1 ×(4+2+0+2+4) 10 10 =1.2,s 2 = 1 ×[(2-7)2+(4-7)2+(6-7)2+(7-7)2×2+(8-7)2×2+(9-7)2×2+(10-7)2] 10 = 1×(25+9+1+0+2+8+9)=5.4. 10 填表如下:平均数 方差 命中 9 环及 9 环以上的次数甲乙甲乙(2)甲乙∴甲成绩比乙稳定.②∵平均数相同,命中9 环及9 环以上的次数甲比乙少,∴乙成绩比甲好些.③∵甲成绩在平均数上下波动,而乙处于上升势头,从第三次以后就没有比甲少的情况发生,∴乙更有潜力.[解题技法]利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.[题组训练]1.对某商店一个月内每天的顾客人数进行统计,得到样本的茎叶图(如图所示),则该样本中的中位数、众数、极差分别是( )A.46,45,56 B.46,45,53C.47,45,56 D.45,47,53解析:选A 样本共3045+47个,中位数为=46;显然样本数据出现次数最多的为45,2故众数为45;极差为68-12=56,故选A.2.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:平均环数x8.3 8.88.8 8.7方差s2 3.5 3.6 2.2 5.4) A.甲B.乙C.丙D.丁解析:选C 由表格中数据可知,乙、丙平均环数最高,但丙方差最小,说明成绩好,且技术稳定,选C.3.某仪器厂从新生产的一批零件中随机抽取40 个进行检测,如图是根据抽样检测得到的零件的质量(单位:克)绘制的频率分布直方图,样本数据按照[80,82),[82,84),[84,86),[86,88),[88,90),[90,92),[92,94),[94,96]分成8 组,将其按从左到右的顺序分别记为第一组,第二组,……,第八组.则样本数据的中位数在第组.解析:由题图可得,前四组的频率为(0.037 5+0.062 5+0.075 0+0.100 0)×2=0.55,则其频数为40×0.55=22,且第四组的频数为40×0.100 0×2=8,故中位数在第四组.答案:四[课时跟踪检测]A 级1.一个频数分布表(样本容量为30)不小心被损坏了一部分,只记得样本中数据在[20,60) 上的频率为0.8,则估计样本在[40,60)内的数据个数为( )A.14 B.15C.16 D.17解析:选B 由题意,样本中数据在[20,60)上的频数为30×0.8=24,所以估计样本在[40,60)内的数据个数为24-4-5=15.2.(2019·长春质检)如图所示是某学校某年级的三个班在一学期内的六次数学测试的平均成绩 y 关于测试序号 x 的函数图象,为了容易看出一个班级的成绩变化,将离散的点用虚线连接,根据图象,给出下列结论:①一班成绩始终高于年级平均水平,整体成绩比较好; ②二班成绩不够稳定,波动程度较大;③三班成绩虽然多数时间低于年级平均水平,但在稳步提升. 其中正确结论的个数为()A .0B .1C .2D .3解析:选 D ①由图可知一班每次考试的平均成绩都在年级平均成绩之上,故①正确.② 由图可知二班平均成绩的图象高低变化明显,可知成绩不稳定,波动程度较大,故②正确.③ 由图可知三班平均成绩的图象呈上升趋势,并且图象的大部分都在年级平均成绩图象的下方,故③正确.故选 D.3.(2018·贵阳检测)在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行 整理后分为 5 组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是 40,则成绩在 80~100 分的学生人数是()A .15B .18C .20D .25解析:选 A 根据频率分布直方图,得第二小组的频率是 0.04×10=0.4,∵频数是 40, ∴样本容量是40=100,又成绩在 80~100 分的频率是(0.01+0.005)×10=0.15,∴成绩在0.4 80~100 分的学生人数是 100×0.15=15.故选 A.4.2017 年 4 月,泉州有四处湿地被列入福建省首批重要湿地名录,某同学决定从其中 A ,B 两地选择一处进行实地考察.因此,他通过网站了ABA B A B解上周去过这两个地方的人对它们的综合评分,并将评分数据记录为右图的茎叶图,记 A ,B 两地综合评分数据的均值分别为 x A , x B ,方差分别为 s 2 ,s 2 .若以备受好评为依据,则AB下述判断较合理的是( )A .因为 x A > xB ,s 2 >s 2,所以应该去A 地B .因为 x > x ,s 2 <s 2 ,所以应该去 A 地ABABC .因为 x < x ,s 2 >s 2 ,所以应该去 B 地ABABD .因为 x A < x B ,s 2 <s 2 ,所以应该去 B 地解析:选 B 因 为 x A =1×(72+86+87+89+92+94)≈86.67,x B =1×(74+73+88 6 6 +86+95+94)=85,s 2 ≈1[(72-86.67)2+(86-86.67)2+(87-86.67)2+(89-86.67)2+(92-86.67)2+(94- 6 86.67)2]≈50.56,s 2 =1[(74-85)2+(73-85)2+(88-85)2+(86-85)2+(95-85)2+(94-85)2]=76, 6所以 x > x ,s 2 <s 2 (A 数据集中,B 数据分散),ABAB所以 A 地好评分高,且评价稳定.故选 B.5.(2018·青岛三中期中)已知数据 x 1,x 2,…,x n 的平均数 x =5,方差 s 2=4,则数据 3x 1+7,3x 2+7,…,3x n +7 的平均数和标准差分别为()A .15,36B .22,6C .15,6D .22,36解析:选 B ∵x 1,x 2,x 3,…,x n 的平均数为 5, x 1+x 2+…+x n 3x 1+3x 2+…+3x n 3(x 1+x 2+…+x n ) ∴ =5,∴ n +7= n n +7=3×5+7=22.∵x 1,x 2,x 3,…,x n 的方差为 4,∴3x 1+7,3x 2+7,3x 3+7,…,3x n +7 的方差是 32×4 =36,故数据 3x 1+7,3x 2+7,…,3x n +7 的平均数和标准差分别为 22,6,故选 B.6.(2018·江苏高考)已知5 位裁判给某运动员打出的分数的茎叶图如图所示那么这 5 位裁判打出的分数的平均数为 .解析:这 5 位裁判打出的分数分别是 89,89,90,91,91,因此这 5 位裁判打出的分数的平89+89+90+91+91均数为 5答案:90=90.7.为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前 3 个小组的频率之比为 1∶ 3∶5,第 2 个小组的频数为 15,则被抽查的美术生的人数是.解析:设被抽查的美术生的人数为n ,因为后2 个小组的频率之和为(0.037 5+ 0.0125)×5=0.25,所以前 3 个小组的频率之和为 0.75.又前 3 个小组的频率之比为 1∶3∶5,第 2个小组的频数为 15,所以前 3 个小组的频数分别为 5,15,25,所以 n =5+15+25 60.0.75答案:608.某人 5 次上班途中所花的时间(单位:分钟)分别为 x ,y,10,11,9.已知这组数据的平均数为 10,方差为 2,则|x -y |的值为.解析:由题意知这组数据的平均数为 10,方差为 2, 可得 x +y =20,(x -10)2+(y -10)2=8,设 x =10+t ,y =10-t ,由(x -10)2+(y -10)2=8 得 t 2=4, 所以|x -y |=2|t |=4. 答案:49.某班 100 名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中 a 的值;(2)根据频率分布直方图,估计这 100 名学生语文成绩的平均分;(3)若这 100 名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比如表所示,求数学成绩在[50,90)之外的人数.分数段 [50,60) [60,70) [70,80) [80,90) x ∶y1∶12∶13∶44∶5(2)因为55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73.所以这100 名学生语文成=。
高三数学复习专题三统计与案例

专题三统计与案例学校:___________姓名:___________班级:___________考号:___________一、解答题1.某高校数学系为了控制大一学生上课使用手机,针对上课使用手机情况,进行量化比,若发现上课使用手机则扣除其对应的积分,根据调查发现每次被扣分数与本系一大学生每周上课使用手机人数的关系如下表所示:(1)试根据以上数据,建立y 关于x 的回归直线方程(结果保留一位小数);参考公式:线性回归方程y bx a =+中,1221,ni ii nii x ynxy b a y bx xnx==-==--∑∑.(2)根据上述回归直线方程分析:每次扣分为多少时(精确到整数分)该系大一新生被扣分的总数最大; (3)若学校规定,大一新生每学期(按20周上课计算)因为上课使用手机被扣分总数不超过1000分,则该系大一被定为控制手机合格,那么,每周上课使用手机至少扣多少分时(扣分不低于5分,精确到整数),31.6≈)2.我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金,现该企业为了解年研发资金投入额x (单位:亿元)对年盈利额y (单位:亿元)的影响,研究了“十二五”和“十三五”规划发展期间近10年年研发资金投入额i x 和年盈利额i y 的数据.通过对比分析,建立了两个函数模型:①2y x αβ=+;②e x t y λ+=,其中,,,tαβλ均为常数,e 为自然对数的底数.令2i i u x =,ln (1,2,,10)i v y i ==,经计算得如下数据:(1)请从相关系数的角度,分析哪一个模型拟合程度更好;(2)根据(1)的选择及表中数据,建立y 关于x 的回归方程(回归系数精确到0.01).附:相关系数()()niix x y y r --=∑线性回归直线方程y bx a =+,其中附:()()()121niii nii x x y y b x x ==--=-∑∑,a y bx =-.3.2021年10月16日,搭载“神州十三号”的火箭发射升空,这是一件让全国人民普遍关注的大事,因此每天有很多民众通过手机、电视等方式观看有关新闻.某机构将每天关注这件大事的时间在2小时以上的人称为“天文爱好者”,否则称为“非天文爱好者”,该机构通过调查,并从参与调查的人群中随机抽取了100人进行分析,得到下表(单位:人)(1)将上表中的数据填写完整,并判断能否在犯错误的概率不超过0.005的前提下认为“天文爱好者”或“非天文爱好者”与性别有关?(2)现从抽取的女性人群中,按“天文爱好者”和“非天文爱好者”这两种类型进行分层抽样抽取5人,然后再从这5人中随机选出3人,求其中至少有1人是“天文爱好者”的概率.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.4.COP15大会原定于2020年10月15-28日在昆明举办,受新冠肺炎疫情影响,延迟到今年10月11-24日在云南昆明举办,同期举行《生物安全议定书》、《遗传资源议定书》缔约方会议.为助力COP15的顺利举行,来自全省各单位各部门的青年志愿者们发扬无私奉献精神,用心用情服务,展示青春风采.会议结束后随机抽取了50名志愿者,统计了会议期间每个人14天的志愿服务总时长,得到如图的频率分布直方图:(1)求x的值,估计抽取的志愿者服务时长的中位数;20,40,80,100这两组样本中随机抽取6名志愿者,记录每个人的服务总时长得(2)用分层抽样的方法从[)[)到如图所示的茎叶图:①已知这6名志愿者服务时长的平均数为67,求m的值;80,100这组的概率.②若从这6名志愿者中随机抽取2人,求所抽取的2人恰好都是[)5.为了了解高二学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3;第二小组频数为12.(1)第二小组的频率是多少,样本容量是多少;(2)若次数在110以上(含110次)为达标,试估计该学校全体高二学生的达标率是多少;(3)在这次测试中,估计学生跳绳次数的众数和中位数、平均数各是多少.(结果均保留整数.)6.2021年10月16日,搭载“神州十三号”的火箭发射升空,这是一件让全国人民普遍关注的大事,因此每天有很多民众通过手机、电视等方式观看有关新闻.某机构将每天关注这件大事的时间在2小时以上的人称为“天文爱好者”,否则称为“非天文爱好者”,该机构通过调查,并从参与调查的人群中随机抽取了100人进行分析,得到下表(单位:人):(1)将上表中的数据填写完整,并判断能否在犯错误的概率不超过0.005的前提下认为“天文爱好者”或“非天文爱好者”与性别有关?(2)现从抽取的女性人群中,按“天文爱好者”和“非天文爱好者”这两种类型进行分层抽样抽取5人,然后再从这5人中随机选出3人,记其中“天文爱好者”的人数为X,求X的分布列和数学期望.附:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.7.某投资公司2012年至2021年每年的投资金额x (单位:万元)与年利润增量y (单位:万元)的散点图如图:该投资公司为了预测2022年投资金额为20万元时的年利润增量,建立了y 关于x 的两个回归模型;模型①:由最小二乘公式可求得y 与x 的线性回归方程: 2.5020ˆ.5yx =-;模型②:由图中样本点的分布,可以认为样本点集中在由线:ln y b x a =+的附近,对投资金额x 做换元,令ln t x =,则y b t a =⋅+,且有101010102111122.00,230,569.00,50.92ii i i i i i i i ty t y t ========∑∑∑∑,(1)根据所给的统计量,求模型②中y 关于x 的回归方程;(2)分别利用这两个回归模型,预测投资金额为20万元时的年利润增量(结果保留两位小数);附:样本()()1,1,2,,i t y i n =⋯的最小乘估计公式为()()()121ˆˆˆ,niii ni i t t y y bay bt t t ==--==--∑∑;参考数据:ln20.6931,ln5 1.6094≈≈.8.下图是立德学校高二育才班摸底考试数学成绩不低于90分的人数的频率分布直方图,为激励学生的学习热情,班级决定对数学成绩高于110分的同学进行奖励.(1)若图中成绩在[100,110)分数段的人数为12人,求此次考试应奖励的人数;(2)用统计学知识估计数学成绩在90分及以上学生的数学成绩的中位数和平均数.(结果保留整数)9.某城市在进行新冠疫情防控中,为了解居民对新冠疫情防控的满意程度,组织居民给活动打分(分数为40,100内﹒现将这些分整数,满分为100分),从中随机抽取一个容量为180的样本,发现所有数据均在[]数分成以下6组并画出了样本的频率分布直方图,但不小心污损了部分图形,如图所示﹒观察图形,回答下列问题:60,70的频数;(1)算出第三组[)(2)请根据频率分布直方图,估计样本的众数、中位数和平均数﹒(每组数据以区间的中点值为代表) 10.某生物小组为了研究温度对某种酶的活性的影响进行了一组实验,实验数据经整理得到如下的折线图:由图可以看出,这种酶的活性指标值y 与温度x 具有较强的线性相关关系,请用相关系数加以说明.附:()()6185i ii x xy y =--=∑5.5= 2.65≈,样本相关系数()()niix x y y r --=∑11.新个体经济是中国经济社会数字化转型条件下出现的新生事物,指微商电商,网络直播、职业创作者等,下表是2021年1至4月份某市新增“微商电商”的统计数据:(1)请利用所给数据求新增微商电商个数y 与月份x 之间的线性回归方程ˆˆˆybx a =+,并预测该市2021年5月新增“微商电商”的个数(结果用四舍五入法保留整数);(2)一般认为当||0.9r ≥时,线性回归方程的拟合效果非常好;当0.75|0.9|r <≤时,线性回归方程的拟合效果良好.试问该线性回归方程的拟合效果是非常好还是良好?说明你的理由.1122211()()ˆ()()n ni iiii i nniii i x y nxy x x y x bxn x x x ====---==--∑∑∑∑,()()nni iiix y nxyx x yy r---=∑∑ˆˆ17.0294ay bx =-≈18.1659≈19.2354≈.。
2021高考数学一复习统计与统计案例专项练习(含答案)题型归纳

2021高考数学一复习统计与统计案例专项练习(含答案)题型归纳每一门科学都有其建立、发展和客观条件,统计科学则是统计工作经验、社会经济理论、计量经济方法融合、提炼、发展而来的一种边缘性学科。
以下是____-____高考数学一复习统计与统计案例专项练习,请考生掌握。
一、选择题11.(文)(____重庆理,3)已知变量_与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得线性回归方程可能为()A.=0.4_+2.3B.=2_-2.4C.=-2_+9.5D.=-0.3_+4.4[答案] A[解析] 因为变量_和y正相关,所以回归直线的斜率为正,排除C、D;又将点(3,3.5)代入选项A和B的方程中检验排除B,所以选A.(理)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了8次试验,收集数据如下:零件数_(个) 10 20 30 40 50 60 70 80 加工时间y(min) 62 68 75 81 89 95 102 108 设回归方程为y=b_+a,则点(a,b)在直线_+45y-10=0的()A.左上方B.左下方C.右上方D.右下方[答案] C[解析] =45,=85,a+45b=85,a+45b-100,故点(a,b)在直线_+45y-10=0的右上方,故选C.12.(____沈阳市质检)某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试.现随机调查了24名笔试者的成绩,如下表所示:分数段 [60,65) [65,70) [70,75) [75,80) [80,85) [85,90) 人数 2 3 4 9 51 据此估计允许参加面试的分数线大约是()A.75B.80C.85D.90[答案] B[解析] 由题可知,在24名笔试者中应选出6人参加面试.由表可得面试分数线大约为80.故选B.13.(____陕西文,5)对一批产品的长度(单位:毫米)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上为一等品,在区间[15,20)和[25,30)上为二等品,在区间[10,15)和[30,35]上为三等品.用频率估计概率,现从该批产品中随机抽取1件,则其为二等品的概率是()A.0.09B.0.20C.0.25D.0.45[答案] D[解析] 解法1:用样本估计总体.在区间[15,20)和[25,30)上的概率为0.045+[1-(0.02+0.04+0.06+0.03)5=0.45.解法2:由图可知,抽得一等品的概率P1=0.065=0.3;抽得三等品的概率为P3=(0.02+0.03)5=0.25.故抽得二等品的概率为1-(0.3+0.25)=0.45.14.(____江西理,6)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()A.成绩B.视力C.智商D.阅读量[答案] D[解析] A中,K2==;B中,K2==;C中,K2==;D中,K2==.因此阅读量与性别相关的可能性最大,所以选D.15.(文)某养兔场引进了一批新品种,严格按照科学配方进行喂养,四个月后管理员称其体重(单位:kg),将有关数据进行整理后分为五组,并绘制频率分布直方图(如图所示).根据标准,体重超过6kg属于超重,低于5kg的不够分量.已知图中从左到右第一、第三、第四、第五小组的频率分别为0.25、0.20、0.10、0.05,第二小组的频数为400,则该批兔子的总数和体重正常的频率分别为()A.1000,0.50B.800,0.50C.800,0.60D.1000,0.60[答案] D[解析] 第二组的频率为1-0.25-0.20-0.10-0.05=0.40,所以兔子总数为=1000只,体重正常的频率为0.40+0.20=0.60.故选D.(理)(____山东理,7)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,,第五组.下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6B.8C.12D.18[答案] C[解析] 第一、二两组的频率为0.24+0.16=0.4志愿者的总人数为=50(人).第三组的人数为:500.36=18(人)有疗效的人数为18-6=12(人)二、填空题16.(____辽宁文,16)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________.[答案] 10[解析] 设5个班级中参加的人数分别为_1,_2,_3,_4,_5,则=7,=4,即5个整数平方和为20,_1,_2,_3,_4,_5这5个数中最大数比7大,但不能超过10,因此最大为10,平方和20=0+1+1+9+9=(7-7)2+(8-7)2+(6-7)2+(10-7)2+(4-7)2.因此参加的人数为4,6,7,8,10,故最大值为10,最小值为4.三、解答题17.(文)(____重庆文,17)20名学生某次数学考试成绩(单位:分)的频率分布直方图如下:(1)求频率分布直方图中a的值;(2)分别求出成绩落在[50,60)与[60,70)中的学生人数;(3)从成绩在[50,70)的学生中任选2人,求此2人的成绩都在[60,70)中的概率. [分析] 由频率之和为1,求a,然后求出落在[50,60)和[60,70)中的人数,最后用列举法求古典概型的概率.[解析] (1)组距为10,(2a+3a+6a+7a+2a)10=200a=1,a==0.005.(2)落在[50,60)中的频率为2a10=20a=0.1,落在[50,60)中的人数为2.落在[60,70)中的学生人数为3a1020=30.0051020=3.(3)设落在[50,60)中的2人成绩为A1,A2,落在[60,70)中的3人为B1,B2,B3.则从[50,70)中选2人共有10种选法,={(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),(B1,B2),(B1,B3),(B2,B3)}其中2人都在[60,70)中的基本事件有3个:(B1,B2),(B1,B3),(B2,B3),故所求概率p=.(理)(____辽宁理,18)一家面包房根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图,如图所示.将日销售量落入各组的频率视为概率,并假设每天的销售量相互独立.(1)求在未来连续3天里,有连续2天的日销售量都不低于100个且另1天的日销售量低于50个的概率;(2)用_表示在未来3天里日销售量不低于100个的天数,求随机变量_的分布列,期望E(_)及方差D(_).[解析] (1)设A1表示事件日销售量不低于100个,A2表示事件日销售量低于50个,B表示事件在未来连续3天是有连续2天日销售量不低于100个且另一天销售量低于50个,因此P(A1)=(0.006+0.004+0.002)50=0.6P(A2)=0.00350=0.15,P(B)=0.60.60.152=0.108.(2)_可能取的值为0,1,2,3,相应的概率为P(_=0)=C(1-0.6)3=0.064,P(_=1)=C0.6(1-0.6)2=0.288.P(_=2)=C0.62(1-0.6)=0.432.P(_=3)=C0.63=0.216.分布列为_ 0 1 2 3 P 0.064 0.288 0.432 0.216 因为_~B(3,0.6)所以期望E(_)=30.6=1.8,方差D(_)=30.6(1-0.6)=0.72.18.(文)为加强中学生实践、创新能力和团队精神的培养,促进教育教学改革,郑州市教育局举办了全市中学生创新知识竞赛.某校举行选拔赛,共有200名学生参加,为了解成绩情况,从中选取50名学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表,解答下列问题:分组频数频率一 60.5~70.5 a 0.26 二 70.5~80.5 15 c 三 80.5~90.5 18 0.36 四 90.5~100.5 b d 合计 50 e (1)若用系统抽样的方法抽取50个样本,现将所有学生随机地编号为000,001,002,,199,试写出第二组第一位学生的编号;(2)求出a、b、c、d、e的值(直接写出结果),并作出频率分布直方图;(3)若成绩在85.5~95.5分的学生为二等奖,问参赛学生中获得二等奖的学生约为多少人.[解析] (1)004(2)a,b,c,d,e的值分别为13,4,0.30,0.08,1.频率分布直方图如下:(3)由样本中成绩在80.5~90.5的频数为18,成绩在90.5~100.5的频数为4,可估计成绩在85.5~95.5的人数为11人,故获得二等奖的学生约为11=44人. (理)(____山西省高考联合模拟)为了了解某年级1000名学生的百米成绩情况,随机抽取了若干学生的百米成绩,成绩全部介于13s与18s之间,将成绩按如下方式分成五组:第一组[13,14);第二组[14,15);第五组[17,18].按上述分组方法得到的频率分布直方图如图所示,已知图中从左到右的前3个组的频率之比为3819,且第二组的频数为8.(1)将频率当作概率,求调查中随机抽取了多少个学生的百米成绩;(2)若从第一、五组中随机取出两个成绩,求这两个成绩的差的绝对值大于1秒的概率.[解析] (1)设图中从左到右前3个组的频率分别为3_,8_,19_依题意,得3_+8_+19_+0.321+0.081=1,_=0.02,设调查中随机抽取了n个学生的百米成绩,则80.02=,n=50,调查中随机抽取了50个学生的百米成绩.(2)百米成绩在第一组的学生数为30.02150=3,记他们的成绩为a、b、c百米成绩在第五组的学生数有0.08150=4,记他们的成绩为m、n、p、q,则从第一、五组中随机取出两个成绩,基本事件有{a,b}、{a,c}、{a,m}、{a,n}、{a,p}、{a,q}、{b,c}、{b,m}、{b,n}、{b,p}、{b,q}、{c,m}、{c,n}、{c,p}、{c,q}、{m,n}、{m,p}、{m,q}、{n,p}、{n,q}、{p,q},共21个其中满足成绩的差的绝对值大于1s所包含的基本事件有{a,m}、{a,n}、{a,p}、{a,q}、{b,m}、{b,n}、{b,p}、{b,q}、{c,m}、{c,n}、{c,p}、{c,q},共12个,所以P==.____-____高考数学一复习统计与统计案例专项练习及答案解析的全部内容就是这些,希望考生可以取得优异的成绩。
高考数学考点二十《统计与统计案例》课件

100
200
则 K2=2001×00(×6100×0×601-004×0×10400)2=8>6.635,
所以有 99%以上的把握认为是否持乐观态度与国内外差异有关.
四、解答题 13.(2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设 备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了 10 件产品,得到各件产品该项指标数据如下:
考点二十 统计与统计案例
一、选择题(在每小题给出的四个选项中,只有一项符合题目要求) 1.(2021·河北张家口第三次模拟)某中学春季运动会上,12 位参加跳高 半决赛同学的成绩各不相同,按成绩从高到低取前 6 位进入决赛,如果小明 知道了自己的成绩后,则他可根据其他 11 位同学成绩的哪个数据判断自己 能否进入决赛( )
A.r2<r4<0<r3<r1 C.r4<r2<0<r3<r1
B.r4<r2<0<r1<r3 D.r2<r4<0<r1<r3
答案 A 解析 易知题中图(1)和图(3)是正相关,图(2)与图(4)是负相关,且图(1) 与图(2)中的样本点集中分布在一条直线附近,则 r2<r4<0<r3<r1.故选 A.
5.通过随机询问 110 名性别不同的大学生是否爱好某项运动,得到如
下列联表:
男
女
总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
由
K2
=
n(ad-bc)2 (a+b)(c+d)(a+c)(b+d)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ˆ 7)建立模型②:y =99+17.5t.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值. (2)你认为用哪个模型得到的预测值更可靠?并说明理由.
【解】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为 (亿元).
利用模型②,该地区2018年的环境基础设施投资额的预测值为 (亿元).
第5节 统计与统计案例
(2)利用模型②得到的预测值更可靠.
理由如下:
(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线
上下,这说明利用2000年至2016年的数据建立的线性模型
①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环
(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值 226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型② 得到的预测值更可靠. (给出了2种理由,答出其中任意一种或其他合理理由均可)
第5节 统计与统计案例
4.[山东省2020届一模]如图给出了根据我国2012年~2018年水果人均占有量y(单位:kg)和 年份代码x绘制的散点图和线性回归方程的残差图(2012年~2018年的年份代码x为1~7).
【解析】∵对两个变量的散点图而言, 若样本点成带状分布,则两个变量具有 线性相关关系,∴两个变量具有线性相 关关系的图是①和④.
【答案】B
第5节 统计与统计案例
2.[湖南长沙长郡中学2019二模]某统计部门对四组数据进行统计分析后,获得如图所示 的散点图,关于相关系数的比较,其中正确的是( )
A.r4<r2<0<r1<r3 B.r2<r4<0<r1<r3 C.r2<r4<0<r3<r1 D.r4<r2<0<r3<r1
这样,回归直线的斜率为 ,截距为 ,即回归方程为
回归直线一定经过样本点的中心
,据此性质可以解决有关的计算问题
.同时可以应用回归方程作出预测.
第5节 统计与统计案例
4.相关系数r
①|r|≤1,当r>0时,两个变量________; 当r<0时,两个变量负相关.
②|r|越接近于1,两个变量的线性相关关 系________;|r|越接近于0,两个变量的线性 相关关系_________.通常当|r|>________时, 我们认为两个变量之间存在较强的线性相关关 系.当|r|=1时,所有点均在直线上.
第5节 统计与统计案例
2.两个变量线性相关的类型
①正相关:如果两个变量的散点图中的点散布在从__左_下__角___到__右__上__角__的区域,
对于两个变量的这种相关关系,我们将它称为正相关.
②负相关:如果两个变量的散点图中的点散布在从__左பைடு நூலகம்_上__角__到__右__下__角__的区域,
对于两个变量的这种相关关系,我们将它称为负相关.
第5节 统计与统计案例
5.相关指数R2
R2表达式中的
为确定的数,因此R2越大,意味着残差平方和
越小,即模型的拟合效果越好;R2越小,残差平方和越大,即模型的拟合效果越差.R2
2021届全国新高考数学备考复习 统计与统计案例
统计与统计案例
真题自测 考向速览 必备知识 整合提升 考点精析 考法突破
第5节 统计与统计案例
真题自测 考向速览
考点1 变量的相关性
1.[四川广元2019统考]下列四个图各反映了两个变量的某种关系,其中可以看作具有线 性相关关系的是( ) A.①③ B.①④ C.②③ D.①②
第5节 统计与统计案例
3.回归直线和回归方程
(1)如果散点图中点的分布从整体上看大致在__________附近,就称这两个变量之间 具有线性相关关系,这条直线叫做回归直线.这条回归直线的方程简称回归方程. (2)使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. 利用最小二乘法求回归方程:
境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直
线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长
趋势,利用2010年至2016年的数据建立的线性模型
可以较好
地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到
的预测值更可靠.
第5节 统计与统计案例
第5节 统计与统计案例
第5节 统计与统计案例
第5节 统计与统计案例
考点3 独立性检验
第5节 统计与统计案例
第5节 统计与统计案例
第5节 统计与统计案例
第5节 统计与统计案例
必备知识 整合提升
1.散点图
将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,表示具有相关关系的 两个变量的一组数据的图形叫做散点图,如图所示.
第5节 统计与统计案例
【解析】根据散点图的特征,数据大致呈增长趋势的是正相关,数据呈递减趋势 的是负相关;数据越集中分布在一条线附近,说明相关性越强.由题中数据,可 知图(1)(3)为正相关,图(2)(4)为负相关,故r1>0,r3>0,r2<0,r4<0. 又图(1)与(2)中的点更集中分布于一条直线附近,故r1>r3,r2<r4. 因此r2<r4<0<r3<r1.
【答案】C
第5节 统计与统计案例
考点2 回归分析
3.[课标全国Ⅱ2018·18]下图是某地区2000年至2016年环境基础设施投资额y(单位:
亿元)的折线图.
第5节 统计与统计案例
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回 归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型
第5节 统计与统计案例
利用散点图识别两个变量之间的关系 ①如果所有的样本点都落在某一直线附近,两变量之间就有线性相关关系, 如图(1). ②如果所有的样本点都落在某一函数曲线(不是一条直线)附近,两变量之间 就有非线性相关关系,如图(2). ③如果散点图中的点的分布几乎没有什么规则,这两个变量之间就不具有相 关关系,即两个变量之间是相互独立的,如图(3).