最全高考数学统计专题解析版[真题]

合集下载

高考数学试题解析分项版 专题13 统计 理

高考数学试题解析分项版 专题13 统计 理

高考数学试题解析分项版 专题13 统计 理一、选择题:1. (2011年高考山东卷理科7) 某产品的广告费用x 与销售额y 的统计数据如下表广告费用x (万元) 4 2 3 5 销售额y (万元)49263954根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为(A)63.6万元 (B)65.5万元 (C)67.7万元 (D)72.0万元3. (2011年高考湖南卷理科4)通过随即询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表: 男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计6050110由()()()()()d b c a d c b a bc ad n K ++++-=22算得,()8.7506050602020304011022≈⨯⨯⨯⨯-⨯=K . 附表:()k K P ≥20.050 0.010 0.001 k3.8416.63510.828参照附表,得到的正确结论是A.在犯错的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B. 在犯错的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C. 由99%以上的把握认为“爱好该项运动与性别有关”D. 由99%以上的把握认为“爱好该项运动与性别无关”5.(2011年高考陕西卷理科9)设11(,)x y ,22(,)x y ,, (,)n n x y 是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是(A )x 和y 相关系数为直线l 的斜率 (B )x 和y 的相关系数在0到1之间(C )当n 为偶数时,分布在l 两侧的样本点的个数一定相同 (D )直线l 过点(,)x y 【答案】D【解析】:由y bx a =+得y bx a =+又a y bx =-,所以y bx y bx y =+-=则直线l 过点(,)x y ,故选D6. (2011年高考四川卷理科1)有一个容量为66的样本,数据的分组及各组的频数如下: [11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 1l [31.5,35.5) 12 [35.5.39.5) 7 [39.5,43.5) 3 根据样本的频率分布估计,数据落在[31.5,43.5)的概率约是( ) (A)16 (B)13 (C)12 (D )23答案:B解析:大于或等于31.5的数据所占的频数为12+7+3=22,该数据所占的频率约为221663=. 二、填空题:3. (2011年高考广东卷理科13)某数学老师身高176cm ,他爷爷、父亲和儿子的身高分别是173cm 、170cm 、和182cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为 cm. 【解析】185cm.22217017618217317633(173173)(170176)(170173)(176176)(176173)(182176)1(173173)(170173)(176173)x y b a y b ∧∧∧++∴====--+--+--∴==-+-+-∴=-•由题得父亲和儿子的身高组成了三个坐标(173,170)、(170,176)、(176,182),其中前面的是父亲的身高,173+170+17617617331182+3=185.x y b x a y cm ∧∧∧∧=-=∴=+∴=•孙子的身高为4.(2011年高考安徽卷江苏6)某老师从星期一到星期五收到信件数分别是10,6,8,5,6,则该组数据的方差___2=s 【答案】7【解析】因为信件数的平均数为10685675++++=,所以方差为2s =222221[1(107)2(67)3(87)4(57)5(67)]5⨯-+⨯-+⨯-+⨯-+⨯-=7.三、解答题:1. (2011年高考辽宁卷理科19)(本小题满分12分)某农场计划种植某种新作物,为此对这种作物的两个品种(分别称为品种甲和品种乙)进行田间试验.选取两大块地,每大块地分成n 小块地,在总共2n 小块地中,随机选n 小块地种植品种甲,另外n 小块地种植品种乙.(I )假设n=4,在第一大块地中,种植品种甲的小块地的数目记为X ,求X 的分布列和数学期望;(II )试验时每大块地分成8小块,即n=8,试验结束后得到品种甲和品种乙在个小块地上的每公顷产量(单位:kg/hm 2)如下表:分别求品种甲和品种乙的每公顷产量的样本平均数和样本方差;根据试验结果,你认为应该种植哪一品种?附:样本数据x 1,x 2,…,x a 的样本方差()()()2222111n s x x x x x x n ⎡⎤=-+-+⋅⋅⋅+-⎢⎥⎣⎦,其中x 为样本平均数.解析:(I )X 可能的取值为0,1,2,3,4,且()48110,70P X C === ()13444881,35C C P X C === ()224448182,35C C P X C ===()31444883,35C CP X C ===()48110,70P X C ===即X 的分布列为X 01234P170 835 1835 835 170X 的数学期望是:()1818810123427035353570E X =⨯+⨯+⨯+⨯+⨯=. 2. (2011年高考全国新课标卷理科19)(本小题满分12分)某种产品的质量以其质量指标值衡量,质量指标值越大表明质量越好,且质量指标值大于或等于102的产品为优质品,现用两种新配方(分别称为A 配方和B 配方)做试验,各生产了100件这种产品,并测试了每件产品的质量指标值,得到下面试验结果: A 配方的频数分布表 指标值分组 [)94,90[)98,94[)102,98[)106,102[)110,106频数82042228B 配方的频数分布表 指标值分组 [)94,90[)98,94[)102,98[)106,102[)110,106频数41242328(Ⅰ)分别估计用A 配方,B 配方生产的产品的优质品率;(Ⅱ)已知用B 配方生成的一件产品的利润y(单位:元)与其质量指标值t 的关系式为)102(10294()94(422≥<≤<⎪⎩⎪⎨⎧-=t t t y从用B 配方生产的产品中任取一件,其利润记为X (单位:元),求X 的分布列及数学期望.(以实验结果中质量指标值落入各组的频率作为一件产品的质量指标值落入相应组的概率)3. (2011年高考广东卷理科17)(本小题满分13分)为了解甲、乙两厂的产品质量,采用分层抽样的方法从甲、乙两厂生产的产品中分别抽取14件和5件,测量产品中微量元素x ,y 的含量(单位:毫克).下表是乙厂的5件产品的测量数据:(1)已知甲厂生产的产品共98件,求乙厂生产的产品数量;(2)当产品中的微量元素x ,y 满足≥175且y ≥75,该产品为优等品,用上述样本数据估计乙厂生产的优等品的数量;(3)从乙厂抽出的上述5件产品中,随即抽取2件,求抽取的2件产品中优等品数ξ的分布列及其均值(即数学期望).【解析】解:(1)987,573514=⨯=,即乙厂生产的产品数量为35件。

高考数学复习专题训练—统计与概率解答题(含解析)

高考数学复习专题训练—统计与概率解答题(含解析)

高考数学复习专题训练—统计与概率解答题1.(2021·广东广州二模改编)根据相关统计,2010年以后中国贫困人口规模呈逐年下降趋势,2011~2019年全国农村贫困发生率的散点图如下:注:年份代码1~9分别对应年份2011年~2019年.(1)求y 关于t 的经验回归方程(系数精确到0.01);(2)已知某贫困地区的农民人均年纯收入X (单位:万元)满足正态分布N (1.6,0.36),若该地区约有97.72%的农民人均纯收入高于该地区最低人均年纯收入标准,则该地区最低人均年纯收入标准大约为多少万元?参考数据与公式:∑i=19y i =54.2,∑i=19t i y i =183.6. 经验回归直线y ^=b ^t+a ^的斜率和截距的最小二乘估计分别为b ^=∑i=1n t i y i -nt y ∑i=1n (t i -t )2 ,a ^=y −b ^t . 若随机变量X 服从正态分布N (μ,σ2),则P (μ-σ≤X ≤μ+σ)≈0.682 7,P (μ-2σ≤X ≤μ+2σ)≈0.954 5,P (μ-3σ≤X ≤μ+3σ)≈0.997 3.2.(2021·湖北黄冈适应性考试改编)产品质量是企业的生命线.为提高产品质量,企业非常重视产品生产线的质量.某企业引进了生产同一种产品的A,B 两条生产线,为比较两条生产线的质量,从A,B 生产线生产的产品中各自随机抽取了100件产品进行检测,把产品等级结果和频数制成了如图的统计图.(1)依据小概率值α=0.025的独立性检验,分析数据,能否据此推断是否为一级品与生产线有关.(2)生产一件一级品可盈利100元,生产一件二级品可盈利50元,生产一件三级品则亏损20元,以频率估计概率.①分别估计A,B生产线生产一件产品的平均利润;②你认为哪条生产线的利润较为稳定?并说明理由.附:①参考公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.②临界值表:3.(2021·福建宁德模拟改编)某工厂为了检测一批新生产的零件是否合格,从中随机抽测100个零件的长度d(单位:mm).该样本数据分组如下:[57,58),[58,59),[59,60),[60,61),[61,62),[62,63],得到如图所示的频率分布直方图.经检测,样本中d大于61的零件有13个,长度分别为61.1,61.1,61.2,61.2,61.3,61.5,61.6,61.6,61.8,61.9,62.1,62.2,62.6.(1)求频率分布直方图中a,b,c的值及该样本的平均长度x(结果精确到1 mm,同一组数据用该区间的中点值作代表);(2)视该批次样本的频率为总体的概率,从工厂生产的这批新零件中随机选取3个,记ξ为抽取的零件长度在[59,61)的个数,求ξ的分布列和数学期望;(3)若变量X满足|P(μ-σ≤X≤μ+σ)-0.682 7|<0.03且|P(μ-2σ≤X≤μ+2σ)-0.954 5|≤0.03,则称变量X满足近似于正态分布N(μ,σ2)的概率分布.如果这批样本的长度d满足近似于正态分布N(x,12)的概率分布,则认为这批零件是合格的,将顺利出厂;否则不能出厂.请问,能否让该批零件出厂?4.(2021·山东潍坊期末)在一个系统中,每一个设备能正常工作的概率称为设备的可靠度,而系统能正常工作的概率称为系统的可靠度,为了增加系统的可靠度,人们经常使用“备用冗余设备”(即正在使用的设备出故障时才启动的设备).已知某计算机网络服务器系统采用的是“一用两备”(即一台正常设备,两台备用设备)的配置,这三台设备中,只要有一台能正常工作,计算机网络就不会断掉.设三台设备的可靠度均为r(0<r<1),它们之间相互不影响.(1)要使系统的可靠度不低于0.992,求r的最小值;(2)当r=0.9时,求能正常工作的设备数X的分布列;(3)已知某高科技产业园当前的计算机网络中每台设备的可靠度是0.7,根据以往经验可知,计算机网络断掉可能给该产业园带来约50万元的经济损失.为减少对该产业园带来的经济损失,有以下两种方案:方案1:更换部分设备的硬件,使得每台设备的可靠度维持在0.9,更新设备硬件总费用为8万元; 方案2:对系统的设备进行维护,使得设备可靠度维持在0.8,设备维护总费用为5万元.请从期望损失最小的角度判断决策部门该如何决策?答案及解析1.解 (1)t =1+2+3+4+5+6+7+8+99=5, y =12.7+10.2+8.5+7.2+5.7+4.5+3.1+1.7+0.69≈6.02, b ^=∑i=19t i y i -9t y∑i=19(t i -5)2=183.6-270.960≈-1.46,a ^=y −b ^t =6.02-(-1.46)×5=13.32.故y 关于t 的经验回归方程为y ^=-1.46t+13.32.(2)因为P (μ-2σ≤X ≤μ+2σ)≈0.954 5,所以P (X>μ-2σ)=0.954 5+1-0.954 52=0.977 25. 因为某贫困地区的农民人均年纯收入X 满足正态分布N (1.6,0.36),所以μ=1.6,σ=0.6,μ-2σ=0.4,P (X>0.4)=0.977 25,故该地区最低人均年纯收入标准大约为0.4万元.2.解 (1)根据已知数据可建立列联表如下:零假设为H 0:是否为一级品与生产线无关.χ2=n (ad -bc )2(a+b )(c+d )(a+c )(b+d )=200×(20×65-35×80)255×145×100×100≈5.643>5.024=x 0.025,依据小概率值α=0.025的独立性检验,推断H 0不成立,即认为是否为一级品与生产线有关.(2)A 生产线生产一件产品为一、二、三级品的概率分别为15,35,15.记A 生产线生产一件产品的利润为X ,则X 的取值为100,50,-20,其分布列为B生产线生产一件产品为一、二、三级品的概率分别为720,25 ,14.记B生产线生产一件产品的利润为Y,则Y的取值为100,50,-20, 其分布列为①E(X)=100×15+50×35+(-20)×15=46,E(Y)=100×720+50×25+(-20)×14=50.故A,B生产线生产一件产品的平均利润分别为46元、50元.②D(X)=(100-46)2×15+(50-46)2×35+(-20-46)2×15=1 464.D(Y)=(100-50)2×720+(50-50)2×25+(-20-50)2×14=2 100.因为D(X)<D(Y),所以A生产线的利润更为稳定.3.解(1)由题意可得P(61≤d<62)=10100=0.1,P(62≤d≤63)=3100=0.03,P(59≤d<60)=P(60≤d<61)=12(1-2×0.03-0.14-0.1)=0.35,所以a=0.031=0.03,b=0.11=0.1,c=0.351=0.35.x=(57.5+62.5)×0.03+58.5×0.14+(59.5+60.5)×0.35+61.5×0.1=59.94≈60.(2)由(1)可知从该工厂生产的新零件中随机选取1件,长度d在(59,61]的概率P=2×0.35=0.7,且随机变量ξ服从二项分布ξ~B(3,0.7),所以P(ξ=0)=C30×(1-0.7)3=0.027,P(ξ=1)=C31×0.7×(1-0.7)2=0.189,P(ξ=2)=C32×0.72×(1-0.7)=0.441,P(ξ=3)=C33×0.73=0.343,所以随机变量ξ的分布列为E(ξ)=0×0.027+1×0.189+2×0.441+3×0.343=2.1.(3)由(1)及题意可知x=60,σ=1.所以P(x-σ≤X≤x-σ)=P(59≤X≤61)=0.7.|P(x-σ≤X≤x+σ)-0.682 7|=|0.7-0.682 7|=0.017 3≤0.03,P(x-2σ≤X≤x-2σ)=P(58≤X≤62)=0.14+0.35+0.35+0.1=0.94,|P(x-2σ≤X≤x+2σ)-0.954 5|=|0.94-0.954 5|=0.014 5≤0.03.所以这批新零件的长度d满足近似于正态分布N(x,12)的概率分布.所以能让该批零件出厂.4.解(1)要使系统的可靠度不低于0.992,则P(X≥1)=1-P(X<1)=1-P(X=0)=1-(1-r)3≥0.992,解得r≥0.8,故r的最小值为0.8.(2)X为正常工作的设备数,由题意可知,X~B(3,r),P(X=0)=C30×0.90×(1-0.9)3=0.001,P(X=1)=C31×0.91×(1-0.9)2=0.027,P(X=2)=C32×0.92×(1-0.9)1=0.243,P(X=3)=C33×0.93×(1-0.9)0=0.729,从而X的分布列为(3)设方案1、方案2的总损失分别为X1,X2,采用方案1,更换部分设备的硬件,使得设备可靠度达到0.9,由(2)可知计算机网络断掉的概率为0.001,不断掉的概率为0.999,故E(X1)=80000+0.001×500 000=80 500元.采用方案2,对系统的设备进行维护,使得设备可靠度维持在0.8,由(1)可知计算机网络断掉的概率为0.008,故E(X2)=50 000+0.008×500 000=54 000元,因此,从期望损失最小的角度,决策部门应选择方案2.。

高考真题与模拟训练 专题26 计数原理与概率统计(解析版)

高考真题与模拟训练 专题26 计数原理与概率统计(解析版)

专题26 计数原理与概率统计第一部分 真题分类1.(2021·天津高考真题)甲、乙两人在每次猜谜活动中各猜一个谜语,若一方猜对且另一方猜错,15,且每次活动中甲、乙猜对与否互不影响,各次活动也互不影响,则一次活动中,甲获胜的概率为____________,3次活动中,甲至少获胜2次的概率为______________.4253=;则在3次活动中,甲至少获胜22.(2021·江苏高考真题)下图是某项工程的网络图(单位:天),则从开始节点①到终止节点⑧的路径共有( )A.14条B.12条C.9条D.7条【答案】B3条路径,由④→⑥有22条路径,根据分步乘法.故选:B3.(2021·40A.5B.6C.7D.8【答案】A【解析】()()222221nC x n n x-=-,所以()21405n n n-=⇒=.故选:A.4.(2021·个评分数据分为8组:[)66,70、[)70,74、 、A B C D .80【答案】D故选:D.5.(2020·天津高考真题)从一批零件中抽取809组:A .10B .18C .20D .36【答案】B【解析】根据直方图,直径落在区间[)5.43,5.47之间的零件频率为:()6.25 5.000.020.225+⨯=,故选:B.6.(2020·A B .5C D .10【答案】C展开式的通项公式为:()()515522rrrr r r T CC -+=-=-1r =故选:C.7.(2020·海南高考真题)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是A .这11天复工指数和复产指数均逐日增加;B .这11天期间,复产指数增量大于复工指数的增量;C .第3天至第11天复工复产指数均超过80%;D .第9天至第11天复产指数增量大于复工指数的增量;【答案】CD【解析】由图可知,第1天到第2天复工指数减少,第7天到第8天复工指数减少,第10天到第11复工指数减少,第8天到第9天复产指数减少,故A 错误;由图可知,第一天的复产指标与复工指标的差大于第11天的复产指标与复工指标的差,所以这11天期间,复产指数增量小于复工指数的增量,故B 错误;由图可知,第3天至第11天复工复产指数均超过80%,故C 正确;由图可知,第9天至第11天复产指数增量大于复工指数的增量,故D 正确;8.(2021·的二次函数()24f x ax bx a =-+.(1}的概率;(2[]0,2b ∈.【答案】(12【解析】(1)根据题意有:0a >,且对称轴21bx a =….(2,1)5个,A(2)方程240ax bx a-+=无实根,则22(4)40ab a≠⎧⎨--<⎩,又[1a∈,2],[0b∈,2],如图,11(1)1322()28B+⨯==.9.(2021·全国高考真题)一种微生物群体可以经过自身繁殖不断生存下来,设一个这种微生物为第0代,经过一次繁殖后为第1代,再经过一次繁殖后为第2代……,该微生物每代繁殖的个数是相互独立的且有相同的分布列,设X表示1(1)已知01230.4,0.3,0.2,0.1p p p p====,求()E X;(2)设p表示该种微生物经过多代繁殖后临近灭绝的概率,p是关于x的一个最小正实根,求证:(3)根据你的理解说明(2)问结论的实际含义.【答案】(1)1;(2)见解析;(3)见解析.【解析】(1(2)设()()3232101f x p x p x p x p=++-+,因若()1E X≤,则123231p p p++≤,故2302p p p+≤.因,()230120f p p p '=+-≤,1201x x <<≤,且()()12,,x x x ∈-∞⋃+∞时,()0f x '>;()12,x x x ∈时,()0f x '<;()12,x x 上为减函数,若21x =,因为()f x 在()2,x +∞为增函数且()10f =,,因()12,x x因1为230123p p x p x p x x +++=的一个最小正实根,综上,若()1E X ≤此时()()20300f p p p '=-++<,()230120f p p p '=+->,34,x x ,且3401x x <<<,上为增函数,在()34,x x 上为减函数,而()10f =,故()40f x <,故当()1E X >时(3)意义:每一个该种微生物繁殖后代的平均数不超过1,则若干代必然灭绝,若繁殖后代的平均数超过1,则若干代后被灭绝的概率小于1.10.(2020·海南高考真题)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽空气(1)估计事件“该市一天空气不超过75,且不超过150”的概率;(2)根据所给数据,完成联表:(3)根据(2)中的列联表,判把握认为该市一天空气有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,【答案】(12)答案见解析;(3)有.【解析】(1)由表格可知,该市100天中,空气中的 2.5PM 浓度不超过75,且2SO 浓度不超过150的所以该市一天中,空气中的 2.5PM 浓度不超过75,且2SO 浓度不超过1500.64=;(2)由所给联表为:22()()()()()n ad bc K a b c d a c b d -==++++36007.4844 6.635481≈>,因为根据临界值把握认为该市一天空气中 2.5PM 浓度有关.第二部分 模拟训练1.三国时代吴国数学家赵爽所注《周髀算经》中给出了勾股定理的绝妙证明,下面是赵爽的弦图及注文,弦图是一个以勾股形之弦为边的正方形,其面积称为弦实,图中包含四个全等的勾股形及一个小正方形,分别涂成红(朱)色及黄色,其面积称为朱实、黄实,利用+(股-勾实+黄实=弦实,化简,得股2=勾股中勾股比向弦图内随机抛掷1000颗图钉(大小忽略不计),则落在红(朱)色图形内的图钉数大约为( )(参 1.732≈≈)A .866B .500C .300D .134【答案】A【解析】不妨设则朱色面积大正方形的边长积为224=,所以落在红(朱)色图形内的图钉数大约故选:A2.琵琶、二胡、编钟、箫、笛、瑟、琴、埙、笙和鼓这十种民族乐器被称为“中国古代十大乐器”.为弘扬中国传统文化,某校以这十种乐器为题材,在周末学生兴趣活动中开展了“中国古代乐器”知识讲座,共连续安排四节课,一节课只讲一种乐器,一种乐器最多安排一节课,则琵琶、二胡一定安排,且这两种乐器互不相邻的概率为( )ABCD .715【答案】C【解析】由题意得:10种乐器种任选4种,故总的可能性有410A 种,琵琶、二胡一定安排且不相邻的可能性有2283A A 种,所以两种乐器互不相邻故选:C3.造纸术、印刷术、指南针、火药被称为中国古代四大发明,这四种发明对中国古代的政治、经济、文化的发展产生了巨大的推动作用;2017年5月,来自“一带一路”沿线的20国青年评选出了“中国的新四大发明”:高铁、扫码支付、共享单车和网购.若从这8个发明中任取两个发明,则两个都是新四大发明的概率为( )ABCD .14【答案】C【解析】从8个发明中任取两个发明两个都是新四大发明的有24C 6=种,∴故选:C4.蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率x (每分钟鸣叫的次数)与气温y (单位:℃)存在着较强的线性相关关系.某地观测人员根据下表的观测数据,建立了y 关于x 的线性回归方程ˆ0.25yx k =+x (次数/分钟)2030405060y (℃)2527.52932.536则当蟋蟀每分钟鸣叫60次时,该地当时的气温预报值为( )A .33℃B .34℃C .35℃D .35.5℃【答案】C40=,30y =,则0.25300.254020k y x =-=-⨯=;,35y =.故选:C.5.将一线段AB 分为两线段AC ,CB ,使得其中较长的一段AC 是全长AB 与另一段CB 的比例中项,即≈0.618,后人把这个数称为黄金分割,把点C 称为线段AB 的黄金分割点.图中在ABC 中,若点P ,Q 为线段BC 的两个黄金分割点,在ABC 内任取一点M ,则点M落在AB2C.14D【答案】B【解析】由几何概型公式知,故选:B.6.在新冠疫情的持续影响下,全国各地电影院等密闭式文娱场所停业近半年,电影行业面临巨大损失.2011~2020年上半年的票房走势如下图所示,则下列说法正确的是( )A.自2011年以来,每年上半年的票房收入逐年增加B.自2011年以来,每年上半年的票房收入增速为负的有5年C.2018年上半年的票房收入增速最大D.2020年上半年的票房收入增速最小【答案】D【解析】由图易知自2011年以来,每年上半年的票房收入相比前一年有增有减,增速为负的有3年,故A,B错误;2017年上半年的票房收入增速最大,故C错误;2020年上半年的票房收入增速最小,故D正确.故选:D7.某士特产超市为预估2021年元旦期间游客购买土特产的情况,对2020年元且期间的90位游客购买情况进行统计,得到如下人数分布表.60元与性别有关.不小于60元小于60元合计男40女18合计90(2)为吸引游客,该超市推出一种优惠方案,购买金额不少于60元可抽奖3次,每次中奖概率为P(每次抽奖互不影响,且P的值等于人数分布表中购买金额不少于60元的频率),中奖1次减5元,中奖2次减10元,中奖3次减15元若游客甲计划购买80元的土特产,请列出实际付款数X(元)的分布列并求其数学期望.参考公式及数据:附表:【答案】(1)列联表见解析,有95%的把握认为购买金额是否少于60元与性别有关;(2)分布列见解【解析】(1联表如下:不少于60元少于60元合计男124052女182038合计3060902290(12204018)1440 5.830 3.84130605238247K ⨯⨯-⨯==≈>⨯⨯⨯,因此有95%的把握认为购买金额是否少于60元与性别有关. (2)X 可能取值为65,70,75,80,且10201903p +==.由题意知:30328(80)327P X C ⎛⎫=== ⎪⎝⎭,所以X 的分布列为X657075808.一年一度的剁手狂欢节——“双十一”,使千万女性朋友们非常纠结.2020年双十一,淘宝点燃火炬瓜分2.5个亿,淘宝、京东、天猫等各大电商平台从10月20号就开始预订,进行了强大的销售攻势.天猫某知名服装经营店,在10月21号到10月27号一周内,每天销售预定服装(百件)与获得的纯利润y (单位:百元)之间的一组数据关系如下表:(1)若y (2)试性回归方程;(3)该服装经营店打算11月2号结束双十一预定活动,预计在结束活动之前,每天销售服装(百件)与获得的纯利润y (单位:百元)之间的关系仍然服从(1)中的线性关系,若结束当天能销售服装14百件,估计这一天获得的纯利润与前一周的平均利润相差多少百元?(有关计算精确到小数点后两位)参考公式与数据:【答案】(1)y 2)ˆ 4.7551.36yx =+;(3)结束当天获得的纯利润比前一周的平均利润多38.00百元.【解析】解:(1)由题目中的数据表格可以看出,y而增大,∴判断(2)由题设知,721280i i x==∑,6669738189909155977++++++==,∴线性回归直线方程为ˆ 4.7551.36yx =+;(3)由(1)知,, 4.751451.361ˆ17.86y=⨯+=(百元),∴11月2号这天估计可获得的纯利润大约为117.86百元;由(1)知,前一周的平均利润百元),故结束当天获得的纯利润比前一周的平均利润多38.00百元.。

高考数学真题汇编12 统计 理 解析 试题

高考数学真题汇编12 统计 理 解析 试题

卜人入州八九几市潮王学校2021高考真题分类汇编:统计1.【2021高考真题理17】设443211010≤<<<≤x x x x ,5510=x ,随机变量1ξ取值54321x x x x x 、、、、的概率均为2.0,随机变量2ξ取值222221554433221x x x x x x x x x x +++++、、、、的概率也均为2.0,假设记21ξξD D 、分别为21ξξ、的方差,那么〔〕A .21ξξD D >B .21ξξD D =C .21ξξD D <D .1ξD 与2ξD 的大小关系与4321x x x x 、、、的取值有关【答案】A【解析】由题意可知21ξξE E =,又由题意可知,1ξ的波动性较大,从而有21ξξD D >.注意:此题也可利用特殊值法。

2.【2021高考真题理6】从甲乙两个城分别随机抽取16台自动售货机,对其销售额进展统计,统计数据用茎叶图表示〔如下列图〕,设甲乙两组数据的平均数分别为x 甲,x 乙,中位数分别为m 甲,m 乙,那么〔〕 A.x x <甲乙,m 甲>m 乙 B.x x <甲乙,m 甲<m 乙 C.x x >甲乙,m 甲>m 乙 D.x x >甲乙,m 甲<m 乙【答案】B.【解析】根据平均数的概念易计算出乙甲x x <,又2022218=+=甲m ,2923127=+=乙m 应选B. 3.【2021高考真题理4】采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[]1,450的人做问卷A ,编号落入区间[]451,750的人做问卷B ,其余的人做问卷C .那么抽到的人中,做问卷B 的人数为〔A 〕7〔B 〕9〔C 〕10〔D 〕15 【答案】C【解析】从960中用系统抽样抽取32人,那么每30人抽取一人,因为第一组号码为9,那么第二组为39,公差为30.所以通项为2130)1(309-=-+=n n a n ,由7502130451≤-≤n ,即302125302215≤≤n ,所以25,17,16 =n ,一共有1011625=+-人,选C. 4.【2021高考真题理9】样本〔12,,,n x x x 〕的平均数为x ,样本〔12,,m y y y 〕的平均数为()y x y ≠,假设样本〔12,,,n x x x ,12,,m y y y 〕的平均数(1)z ax a y =+-,其中102α<<,那么n,m 的大小关系为 A .nm <B .n m >C .n m =D .不能确定【答案】A【解析】由题意知样本),,,(11m n y y x x 的平均数为y nm mx n m n n m y m x n z +++=++=,又y x z )1(αα-+=,即nm mn m n +=-+=αα1,。

最全高考数学统计专题解析版【真题】doc资料(19页)

最全高考数学统计专题解析版【真题】doc资料(19页)

最全高考数学统计专题解析版【真题】doc资料(19页)0]的人数为A. 11A. 11B. 12C. 13D. 14WORD版))某班级有500.030WORD版))某班级有500.0300.0250CI50.0100.005o 讯甜70 80卿W2 . ( 20xx年普通高等学校招生统一考试安徽数学(理)试题(纯名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93. 下列说法一定正确的是()A ?这种抽样方法是一种分层抽样B ?这种抽样方法是一种系统抽样C.这五名男生成绩的方差大于这五名女生成绩的方差D ?该班级男生成绩的平均数小于该班女生成绩的平均数3 . ( 20xx年普通高等学校招生统一考试福建数学(理)试题(纯WORD版))某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分为6组:[40,50), [50,60),[60,70), [70,80), [80,90), [90,100)加以统计,得到如图所示的频率分布直方图,已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()588 B. 480 C. 450 D. 1204 . (20xx年高考xx卷(理))总体有编号为01,02,…,19,20的20个个体组成。

利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为7816657208026314070243699728019832049234493582003623486969387481A . 08B . 07C . 02D . 01(20xx年高考上海卷(理))盒子中装有编号为 1,2,3,4,5,6,7,8,9 的九个球,从中任意取出两个,则这两个球的编号之积为偶数的概率是(结果用最简分数表示)6.( 20xx年高考湖北卷(理))从某小区抽取100户居民进行月用电量调查,发现其用电量都在50到350度之间,频率分布直方图所示.(I)直方图中X的值为;7. ( 20xx年普通高等学校招生全国统一招生考试江苏卷(数学)(II)在这些用户中,用电量落在区间7. ( 20xx年普通高等学校招生全国统一招生考试江苏卷(数学)(已校对纯WORD版含附加题))抽样统计甲、乙两位设计运动员的5此训练成绩(单位:环),结果如下:运动员第1次第2次第3次第4次第5次甲8791908993乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为.8. (20xx年高考上海卷(理))设非零常数d是等差数列X1,X2,X3,L ,X19的公差,随机变量等可能地取值X1,X2,X3,L ,X19,则方差D9.(20xx年普通高等学校招生统一考试xx省数学(理)卷(纯 WORD版))某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,9.为个位数?第17第17题图((I )根据茎叶图计算样本均值;(n)日加工零件个数大于样本均值的工人为优秀工人,根据茎叶图推断该车间 12名工人中有几名优秀工人;(川)从该车间12名工人中,任取2人,求恰有1名优秀工人的概率?( 20xx年普通高等学校招生统一考试天津数学(理)试题(含答案))一个盒子里装有 7张卡片,其中有红色卡片4张,编号分别为1, 2, 3, 4;白色卡片3张,编号分别为2, 3,从盒子中任取4张卡片(假设取到任何一张卡片的可能性相同).(I )求取出的4张卡片中,含有编号为3的卡片的概率.(n)再取出的4张卡片中,红色卡片编号的最大值设为X求随机变量X 的分布列和数学期望?11 . (20xx年高考陕西卷(理))在一场娱乐晚会上,有5位民间歌手(1至5号)登台演唱,由现场数百名观众投票选出最受欢迎歌手?各位观众须彼此独立地在选票上选3名歌手,其中观众甲是1号歌手的歌迷,他必选1号,不选2号,另在3至5号中随机选2名.观众乙和丙对5位歌手的演唱没有偏爱,因此在1至5号中随机选3名歌手.(I )求观众甲选中3号歌手且观众乙未选中 3号歌手的概率;(n ) X表示3号歌手得到观众甲、乙、丙的票数之和,求X的分布列和数学期望.12. ( 20xx年普通高等学校招生统一考试xx数学(理)试题(含答案))某商场举行的“三色球”购物摸奖活动规定:在一次摸奖中,摸奖者先从装有 3个红球与4个白球的袋中任意摸出3个球,再从装有1个蓝球与2个白球的袋中任意摸出中红球与蓝球的个数,设一.二.三等奖如下:1个球,根据摸出4个球奖级摸出红.蓝球个数一等奖3红1蓝二等奖3红0蓝三等奖2红1蓝获奖金额200元50元10元其余情况无奖且每次摸奖最多只能获得一个奖级(1)求一次摸奖恰好摸到 1个红球的概率;(2)求摸奖者在一次摸奖中获奖金额X的分布列与期望 E X20xx年高考题【20xx 新课标文】在一组样本数据(X1, y1), (X2, y2),...,(xn, yn)(n>2, X1,X2, (x)1不全相等)的散点图中,若所有样本点(Xi, yi)(i=1,2,…,n)都在直线尸?x+1上,则这组样本数据的样本相关系数为1(A)— 1 ( B) 0 ( C)( D) 1【20xx山东文】(4)在某次测量中得到的 A样本数据如下:82, 84, 84, 86, 86 , 86,88, 88, 88, 88.若B样本数据恰好是 A样本数据都加2后所得数据,则 A, B两样本的下列数字特征对应相同的是(A)众数(B)平均数(C)中位数(D)标准差【20xx四川文】交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查。

高考数学专题统计测评含解析

高考数学专题统计测评含解析

第14章测评(时间:120分钟 满分:150分)一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.1.一个容量为20的样本,已知某组的频率为0.25,则该组的频数为( )A.2B.5C.15D.8020×0.25=5.2.某单位有职工750人,其中青年职工350人、中年职工250人、老年职工150人.为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为( ) A.7 B.15C.25D.35n,则n750=7350,解得n=15.3.有一个容量为66的样本,数据的分组及各组的频数如下: [11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9[23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12[35.5,39.5) 7 [39.5,43.5) 3则总体中大于或等于31.5的数据约占( )A.211B.13C.12D.2366,而落在[31.5,43.5)内的样本数为12+7+3=22,故总体中大于或等于31.5的数据约占2266=13.4.甲组数据为5,12,16,21,25,37,乙组数据为1,6,14,18,38,39,则甲、乙的平均数、极差及中位数相同的是( )A.极差B.平均数C.中位数D.都不相同,可知极差不同,甲的中位数为16+212=18.5,乙的中位数为14+182=16,x 甲=5+16+12+25+21+376=583,x 乙=1+6+14+18+38+396=583,所以甲、乙的平均数相同.故选B.5.下表记录了某地区一年之内的月平均降水量.月份123456789101112月平均降水量/cm5.84.85.34.65.65.65.17.15.65.36.46.625百分位数为( )A.5.1B.5.2C.5.3D.5.64.6,4.8,5.1,5.3,5.3,5.6,5.6,5.6,5.8,6.4,6.6,7.1,因为12×25%=3,所以25百分位数为5.1+5.32=5.2,故选B.6.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率直方图如图所示.由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为a ,最大频率为0.32,则a 的值为( )A.64B.54C.48D.27100×(0.05+0.11)=16.因为后五组频数和为62,所以前三组频数和为38.所以第三组频数为38-16=22.又最大频率为0.32,故第四组频数为0.32×100=32.所以a=22+32=54.故选B.7.记样本x 1,x 2,…,x m 的平均数为x ,样本y 1,y 2,…,y n 的平均数为y (x ≠y ).若样本x 1,x 2,…,x m ,y 1,y 2,…,y n 的平均数为z =14x +34y ,则m n 的值为( )A.3B.4C.14D.13x 1+x 2+…+x m =m x ,y 1+y 2+…+y n =n y ,z =(x 1+x 2+…+x m )+(y 1+y 2+…+y n )m +n =mx +ny m +n =mx m +n +ny m +n =14x +34y .所以m m +n =14,n m +n =34,可得3m=n ,所以m n =13.8.从某项综合能力测试中抽取了100人的成绩,统计如下表所示,则这100人成绩的标准差为( )分数54321人数2010303010A.3B.2105C.3D.85∵x =5×20+4×10+3×30+2×30+1×10100=3,∴s 2=1100×(20×22+10×12+30×12+10×22)=160100=85,∴s=2105.二、选择题:本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.9.下列说法正确的是( )A.在统计里,最常用的简单随机抽样方法有抽签法和随机数表法B.一组数据的平均数一定小于这组数据中的每个数据C.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D.一组数据的方差越大,说明这组数据的波动越大,不小于最小值,B 项错误,其余全对.10.如图①为某省2020年1~4月份快递业务量统计图,图②为该省2020年1~4月份快递业务收入统计图,对统计图理解正确的是( )①②A.2020年1~4月份快递业务量3月份最高,2月份最低,差值接近2 000万件B.2020年1~4月份快递业务量同比增长率均超过50%,在3月份最高,和春节蛰伏后网购迎来喷涨有关C.从两图中看,业务量与业务收入变化高度一致D.从1~4月份来看,业务量与业务收入有波动,但整体保持高速增长①可知快递业务量3月份为4 397万件,2月份为2 411万件,差值为4 397-2 411=1 986(万件),故A正确;由图①可知B也正确;对于C,由两图易知业务量从高到低变化排序是3月,4月,1月,2月,业务收入从高到低变化排序是3月,4月,1月,2月,保持高度一致,所以C正确;对于D,由图知业务收入2月比1月减少,4月比3月减少,整体不具备高速增长之说,所以D不正确.11.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”,根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A.甲地:总体平均数为3,中位数为4B.乙地:中位数为2,众数为3C.丙地:极差为3,80百分位数为4D.丁地:总体平均数为2,总体方差为37人,故A不正确;乙地中位数为2,众数为3,可以有一天的感染人数为8,故B不正确;C中数据的最大可能取值为7,故C正确;当总体平均数是2,若有一个数据超过7,则s2>110(8-2)2=3.6,则方差就超过3,所以总体平均数是2,总体方差为3时,没有数据超过7,故D正确.12.如图是某公司2020年1月至12月空调销售任务及完成情况的气泡图,气泡的大小表示完成率的高低,如10月份销售任务是400台,完成率为90%,则下列叙述不正确的是( )A.2020年3月的销售任务是400台B.2020年月销售任务的平均值不超过600台C.2020年第一季度总销量为900台D.2020年月销量最大的是6月份3月份的销售任务是400台,所以A正确;由题图得2020年月销售任务超过600台的只有3个月,则平均值不超过600台,所以B正确;由题图得第一季度的总销量为300×50%+200×100%+400×120%=830(台),故C不正确;由题图得销量最大的月份是5月份,为800台,故D不正确.三、填空题:本题共4小题,每小题5分,共20分.13.某网站针对“是否支持某节目上春晚”对网民进行调查,得到如下数据:网民态度支持反对无所谓人数(单位:人)8000600010 000若采用分层抽样的方法从中抽取48人进行座谈,则持“支持”态度的网民抽取的人数为 .每个个体被抽到的概率等于488000+6000+10000=1500,∴1500×8 000=16.14.下列调查的样本不合理的是 .①在校内发出一千张印有全校各班级的选票,要求被调查学生在其中一个班级旁画“√”,以了解最受欢迎的教师是谁;②从一万多名工人中,经过选举,确定100名代表,然后投票表决,了解工人们对厂长的信任情况;③到老年公寓进行调查,了解全市老年人的健康状况;④为了了解全班同学每天的睡眠时间,在每个小组中各选取3名学生进行调查.在班级旁画“√”,与了解最受欢迎的教师没关系,故调查的样本不合理;②样本合理,属于合理的调查;③样本不合理,老年公寓中的老年人不能代表全市老年人,故样本缺少代表性;④在每个小组中各选取3名学生进行调查,属于合理调查.故调查的样本不合理的是①③.15.如图是样本容量为200的频率直方图.根据样本的频率直方图估计,样本数据落在[6,14)内的频数为 ,数据落在[2,14)内的频率约为 . 0.76样本数据落在[6,14)内的频率=0.08×4+0.09×4=0.68,且样本容量为200,∴样本数据落在[6,14)内的频数=0.68×200=136;∵数据落在[2,14)内的频率=(0.02+0.08+0.09)×4=0.76.16.某市2020年各月平均房价同比(与上一年同月比较)和环比(与相邻上月比较)涨幅情况如图所示,根据此图考虑该市2020年各月平均房价:①同比2019年有涨有跌;②同比涨幅3月份最大,12月份最小;③1月份最高;④5月比9月高.其中正确结论的编号为 .2020年各月平均房价同比(与上一年同月比较)和环比(与相邻上月比较)涨幅情况折线图,知该市2020年各月平均房价:①同比2019年一直在涨,故①错误;②同比涨幅3月份最大,12月份最小,故②正确;③因为1至4月房价一直在涨,所以1月份最高错误,故③错误;④因为5月至9月房价一直在涨,所以5月比9月低,故④错误.四、解答题:本题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤.17.(10分)已知数据x 1,x 2,…,x 10的平均数x =20,方差s 2=0.015.求:(1)3x 1,3x 2,…,3x 10的平均数和方差;(2)4x 1-2,4x 2-2,…,4x 10-2的平均数和方差.设3x 1,3x 2,…,3x 10的平均数为x ',方差为s'2,x '=110(3x 1+3x 2+…+3x 10)=310(x 1+x 2+…+x 10)=3x =3×20=60;s'2=110[(3x 1-3x )2+(3x 2-3x )2+…+(3x 10-3x )2]=910[(x 1-x )2+(x 2-x )2+…+(x 10-x )2]=9s 2=9×0.015=0.135.(2)设4x 1-2,4x 2-2,…,4x 10-2的平均数是x ″,方差为s ″2,∵x =110(x 1+x 2+…+x 10)=20,∴x ″=110(4x 1-2+4x 2-2+…+4x 10-2)=110(4x 1+4x 2+…+4x 10-20)=410(x 1+x 2+…+x 10)-2=4x -2=4×20-2=78.∵s 2=110[(x 1-x )2+(x 2-x )2+…+(x 10-x )2]=0.015,s ″2=110[(4x 1-2-4x +2)2+(4x 2-2-4x +2)2+…+(4x 10-2-4x +2)2]=1610[(x 1-x )2+(x 2-x )2+…+(x 10-x )2]=16×0.015=0.24.故4x 1-2,4x 2-2,…,4x 10-2的平均数和方差分别是78和0.24.18.(12分)随着“互联网+交通”模式的迅猛发展,“共享助力单车”在很多城市相继出现.某“共享助力单车”运营公司为了解某地区用户对该公司所提供的服务的满意度,随机调查了100名用户,得到用户的满意度评分,现将评分分为5组,如表:组别一二三四五满意度评分[0,2)[2,4)[4,6)[6,8)[8,10]频数510a 3216频率0.05b 0.37c.16(1)求表格中的a ,b ,c 的值;(2)估计用户的满意度评分的平均数;(3)若从这100名用户中随机抽取25人,估计满意度评分低于6分的人数为多少?由频数分布表得50.05=10b =a 0.37=32c ,解得a=37,b=0.1,c=0.32.(2)估计用户的满意度评分的平均数为1×0.05+3×0.1+5×0.37+7×0.32+9×0.16=5.88.(3)从这100名用户中随机抽取25人,估计满意度评分低于6分的人数为25×(0.05+0.1+0.37)=13.19.(12分)下表给出了某学校120名12岁男生的身高统计分组与频数(单位:cm).区间[122,126)[126,130)[130,134)[134,138)[138,142)[142,146)[146,150)[150,154)[154,158]人数58102233201165(1)列出样本的频率分布表;(2)画出频率直方图;(3)试估计身高小于134 cm的数据约占多少百分比(精确到1%).样本的频率分布表如下:区间[122,126)[126,130)[130,134)[134,138)[138,142)[142,146)[146,150)[150,154)[154,158]频数58102233201165频率124115112116011401611120120124(2)频率直方图如下:(3)根据样本的频率分布表估计身高小于134 cm的人数占总人数的23120×100%≈19%.20.(12分)现有A,B两个班级,每个班级各有45名学生参加测验,参加的每名学生可获得0分,1分,2分,3分,4分,5分,6分,7分,8分,9分这几种不同分值中的一种,A班的测试结果如下表所示:分数/分0123456789人数/名1357686432B班的成绩如图所示.(1)你认为哪个班级的成绩比较稳定?(2)若两班共有60人及格,则参加者最少获得多少分才可能及格.由表格得,A班的平均成绩=(1×3+2×5+3×7+4×6+5×8+6×6+7×4+8×3+9×2)÷45≈4.53(分),由图得,B班的平均成绩为(1×3+2×3+3×8+4×18+5×10+6×3)÷45≈3.84(分),∴A班的平均成绩高;又A班的成绩0~9分都有,B班成绩在1~6分之间,即A班分数更分散,B班分数更集中,∴A班的方差较大,∴B班的成绩比较稳定.(2)若两个班合计共有60人及格,即有30人不及格,从两表中可得出,3分(含3分)以下的有1+3+5+7+3+3+8=30(人),即参加者最少获4分才可以及格.21.(12分)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面统计图:记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),n表示购机的同时购买的易损零件数.(1)若n=19,求y与x的函数解析式;(2)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n的最小值;(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?当x≤19时,y=3 800;当x>19时,y=3 800+500(x-19)=500x-5 700.所以y与x的函数解析式为y=3800,x≤19,500x-5700,x>19(x∈N).(2)由统计图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n的最小值为19.(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800,20台的费用为4 300,10台的费用为4 800,因此这100台机器在购买易损零件上所需费用的平均数为1100×(3 800×70+4 300×20+4 800×10)=4 000,若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000,10台的费用为4 500,因此这100台机器在购买易损零件上所需费用的平均数为1100×(4 000×90+4 500×10)=4 050.比较两个平均数可知,购买1台机器的同时应购买19个易损零件.22.(12分)某工厂有工人1 000名,其中250名工人参加过短期培训(称为A 类工人),另外750名工人参加过长期培训(称为B 类工人).现用分层抽样方法(按A 类、B 类分两层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(生产能力指一天加工的零件数).(1)A 类工人中和B 类工人中各抽查多少工人?(2)从A 类工人中的抽查结果和从B 类工人中的抽查结果分别如表1和表2.表1生产能力分组[100,110)[110,120)[120,130)[130,140)[140,150]人数48x 53表2生产能力分组[110,120)[120,130)[130,140)[140,150]人数6y 3618①先确定x ,y ,再补全频率直方图(如图).就生产能力而言,A 类工人中个体间的差异程度与B 类工人中个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回答结论)②分别估计A 类工人和B 类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表).A 类工人生产能力的频率直方图B 类工人生产能力的频率直方图类工人中和B 类工人中分别抽查25名和75名.(2)①由4+8+x+5+3=25,得x=5.由6+y+36+18=75,得y=15.频率直方图如图:A 类工人生产能力的频率直方图B 类工人生产能力的频率直方图从图可以判断,B 类工人中个体间的差异程度更小.②x A =425×105+825×115+525×125+525×135+325×145=123,x B =675×115+1575×125+3675×135+1875×145=133.8,x =25100×123+75100×133.8=131.1.A类工人生产能力的平均数、B类工人生产能力的平均数以及全厂工人生产能力的平均数的估计值分别为123,133.8和131.1.。

概率与统计(选择、填空题)(理科专用)(解析版)-五年(18-22)高考数学真题分项汇编(全国通用)

概率与统计(选择、填空题)(理科专用)(解析版)-五年(18-22)高考数学真题分项汇编(全国通用)

专题15概率与统计(选择题、填空题)(理科专用)1.【2022年全国乙卷】某棋手与甲、乙、丙三位棋手各比赛一盘,各盘比赛结果相互独立.已知该棋手与甲、乙、丙比赛获胜的概率分别为1,2,3,且3>2>1>0.记该棋手连胜两盘的概率为p,则()A.p与该棋手和甲、乙、丙的比赛次序无关B.该棋手在第二盘与甲比赛,p最大C.该棋手在第二盘与乙比赛,p最大D.该棋手在第二盘与丙比赛,p最大【答案】D【解析】【分析】该棋手连胜两盘,则第二盘为必胜盘.分别求得该棋手在第二盘与甲比赛且连胜两盘的概率;该棋手在第二盘与乙比赛且连胜两盘的概率乙;该棋手在第二盘与丙比赛且连胜两盘甲的概率丙.并对三者进行比较即可解决【详解】该棋手连胜两盘,则第二盘为必胜盘,记该棋手在第二盘与甲比赛,且连胜两盘的概率为甲则甲=2(1−2)13+221(1−3)=21(2+3)−4123记该棋手在第二盘与乙比赛,且连胜两盘的概率为乙则乙=2(1−1)23+212(1−3)=22(1+3)−4123记该棋手在第二盘与丙比赛,且连胜两盘的概率为丙则丙=2(1−1)32+213(1−2)=23(1+2)−4123则甲−乙=21(2+3)−4123−22(1+3)−4123=21−23<0乙−丙=22(1+3)−4123−23(1+2)−4123=22−31<0即甲<乙,乙<丙,则该棋手在第二盘与丙比赛,最大.选项D判断正确;选项BC判断错误;与该棋手与甲、乙、丙的比赛次序有关.选项A判断错误.故选:D2.【2022年新高考1卷】从2至8的7个整数中随机取2个不同的数,则这2个数互质的概率为()A.16B.13C.12D.23【答案】D【解析】【分析】由古典概型概率公式结合组合、列举法即可得解.【详解】从2至8的7个整数中随机取2个不同的数,共有C 72=21种不同的取法,若两数不互质,不同的取法有:(2,4),(2,6),(2,8),(3,6),(4,6),(4,8),(6,8),共7种,故所求概率=21−721=23.故选:D.3.【2021年甲卷理科】已知12,F F 是双曲线C 的两个焦点,P 为C 上一点,且121260,3F PF PF PF ∠=︒=,则C 的离心率为()A 72B .132C D 【答案】A 【解析】【分析】根据双曲线的定义及条件,表示出12,PF PF ,结合余弦定理可得答案.【详解】因为213PF PF =,由双曲线的定义可得12222PF PF PF a -==,所以2PF a =,13PF a =;因为1260F PF ∠=︒,由余弦定理可得2224923cos60c a a a a =+-⨯⋅⋅︒,整理可得2247c a =,所以22274a c e ==,即2e =.故选:A 【点睛】关键点睛:双曲线的定义是入手点,利用余弦定理建立,a c 间的等量关系是求解的关键.4.【2021年甲卷理科】将4个1和2个0随机排成一行,则2个0不相邻的概率为()A .13B .25C .23D .45【答案】C 【解析】【分析】采用插空法,4个1产生5个空,分2个0相邻和2个0不相邻进行求解.【详解】将4个1和2个0随机排成一行,可利用插空法,4个1产生5个空,若2个0相邻,则有155C =种排法,若2个0不相邻,则有2510C =种排法,所以2个0不相邻的概率为1025103=+.故选:C.5.【2021年乙卷理科】在区间(0,1)与(1,2)中各随机取1个数,则两数之和大于74的概率为()A .79B .2332C .932D .29【答案】B 【解析】【分析】设从区间()()0,1,1,2中随机取出的数分别为,x y ,则实验的所有结果构成区域为(){},01,12x y x y Ω=<<<<,设事件A 表示两数之和大于74,则构成的区域为()7,01,12,4A x y x y x y ⎧⎫=<<<+⎨⎬⎩⎭,分别求出,A Ω对应的区域面积,根据几何概型的的概率公式即可解出.【详解】如图所示:设从区间()()0,1,1,2中随机取出的数分别为,x y ,则实验的所有结果构成区域为(){},01,12x y x y Ω=<<<<,其面积为111SΩ=⨯=.设事件A 表示两数之和大于74,则构成的区域为()7,01,12,4A x y x y x y ⎧⎫=<<<+⎨⎬⎩⎭,即图中的阴影部分,其面积为13323124432A S =-⨯⨯=,所以()2332A S P A S Ω==.故选:B.【点睛】本题主要考查利用线性规划解决几何概型中的面积问题,解题关键是准确求出事件,A Ω对应的区域面积,即可顺利解出.6.【2021年新高考1卷】有6个相同的球,分别标有数字1,2,3,4,5,6,从中有放回的随机取两次,每次取1个球,甲表示事件“第一次取出的球的数字是1”,乙表示事件“第二次取出的球的数字是2”,丙表示事件“两次取出的球的数字之和是8”,丁表示事件“两次取出的球的数字之和是7”,则()A .甲与丙相互独立B .甲与丁相互独立C .乙与丙相互独立D .丙与丁相互独立【答案】B 【解析】【分析】根据独立事件概率关系逐一判断【详解】11561()()()()6636366P P P P =====甲,乙,丙丁,1()0()()()()()36P P P P P P =≠==甲丙甲丙,甲丁甲丁,1()()()()0()()36P P P P P P =≠=≠乙丙乙丙,丙丁丁丙,故选:B 【点睛】判断事件,A B 是否独立,先计算对应概率,再判断()()()P A P B P AB =是否成立7.【2021年新高考2卷】某物理量的测量结果服从正态分布()210,N σ,下列结论中不正确的是()A .σ越小,该物理量在一次测量中在(9.9,10.1)的概率越大B .该物理量在一次测量中大于10的概率为0.5C .该物理量在一次测量中小于9.99与大于10.01的概率相等D .该物理量在一次测量中落在(9.9,10.2)与落在(10,10.3)的概率相等【答案】D 【解析】【分析】由正态分布密度曲线的特征逐项判断即可得解.【详解】对于A ,2σ为数据的方差,所以σ越小,数据在10μ=附近越集中,所以测量结果落在()9.9,10.1内的概率越大,故A 正确;对于B ,由正态分布密度曲线的对称性可知该物理量一次测量大于10的概率为0.5,故B正确;对于C ,由正态分布密度曲线的对称性可知该物理量一次测量结果大于10.01的概率与小于9.99的概率相等,故C 正确;对于D ,因为该物理量一次测量结果落在()9.9,10.0的概率与落在()10.2,10.3的概率不同,所以一次测量结果落在()9.9,10.2的概率与落在()10,10.3的概率不同,故D 错误.故选:D.8.【2020年新课标1卷理科】某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i = 得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是()A .y a bx =+B .2y a bx =+C .e x y a b =+D .ln y a b x=+【答案】D 【解析】【分析】根据散点图的分布可选择合适的函数模型.【详解】由散点图分布可知,散点图分布在一个对数函数的图象附近,因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+.故选:D.【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.9.【2020年新课标2卷理科】在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1200份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1600份的概率为0.05,志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者()A .10名B .18名C .24名D .32名【答案】B 【解析】【分析】算出第二天订单数,除以志愿者每天能完成的订单配货数即可.【详解】由题意,第二天新增订单数为50016001200900+-=,9001850=,故至少需要志愿者18名.故选:B 【点晴】本题主要考查函数模型的简单应用,属于基础题.10.【2020年新课标3卷理科】在一组样本数据中,1,2,3,4出现的频率分别为1234,,,p p p p ,且411i i p ==∑,则下面四种情形中,对应样本的标准差最大的一组是()A .14230.1,0.4p p p p ====B .14230.4,0.1p p p p ====C .14230.2,0.3p p p p ====D .14230.3,0.2p p p p ====【答案】B 【解析】【分析】计算出四个选项中对应数据的平均数和方差,由此可得出标准差最大的一组.【详解】对于A 选项,该组数据的平均数为()()140.1230.4 2.5A x =+⨯++⨯=,方差为()()()()222221 2.50.12 2.50.43 2.50.44 2.50.10.65As =-⨯+-⨯+-⨯+-⨯=;对于B 选项,该组数据的平均数为()()140.4230.1 2.5B x =+⨯++⨯=,方差为()()()()222221 2.50.42 2.50.13 2.50.14 2.50.4 1.85Bs =-⨯+-⨯+-⨯+-⨯=;对于C 选项,该组数据的平均数为()()140.2230.3 2.5C x =+⨯++⨯=,方差为()()()()222221 2.50.22 2.50.33 2.50.34 2.50.2 1.05Cs =-⨯+-⨯+-⨯+-⨯=;对于D 选项,该组数据的平均数为()()140.3230.2 2.5D x =+⨯++⨯=,方差为()()()()222221 2.50.32 2.50.23 2.50.24 2.50.3 1.45Ds =-⨯+-⨯+-⨯+-⨯=.因此,B 选项这一组的标准差最大.故选:B.【点睛】本题考查标准差的大小比较,考查方差公式的应用,考查计算能力,属于基础题.11.【2020年新高考1卷(山东卷)】某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是()A .62%B .56%C .46%D .42%【答案】C 【解析】【分析】记“该中学学生喜欢足球”为事件A ,“该中学学生喜欢游泳”为事件B ,则“该中学学生喜欢足球或游泳”为事件A B +,“该中学学生既喜欢足球又喜欢游泳”为事件A B ⋅,然后根据积事件的概率公式()P A B ⋅=()()()P A P B P A B +-+可得结果.【详解】记“该中学学生喜欢足球”为事件A ,“该中学学生喜欢游泳”为事件B ,则“该中学学生喜欢足球或游泳”为事件A B +,“该中学学生既喜欢足球又喜欢游泳”为事件A B ⋅,则()0.6P A =,()0.82P B =,()0.96P A B +=,所以()P A B ⋅=()()()P A P B P A B +-+0.60.820.960.46=+-=所以该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例为46%.故选:C.【点睛】本题考查了积事件的概率公式,属于基础题.12.【2019年新课标1卷理科】我国古代典籍《周易》用“卦”描述万物的变化.每一“重卦”由从下到上排列的6个爻组成,爻分为阳爻“——”和阴爻“——”,如图就是一重卦.在所有重卦中随机取一重卦,则该重卦恰有3个阳爻的概率是A .516B .1132C .2132D .1116【答案】A【分析】本题主要考查利用两个计数原理与排列组合计算古典概型问题,渗透了传统文化、数学计算等数学素养,“重卦”中每一爻有两种情况,基本事件计算是住店问题,该重卦恰有3个阳爻是相同元素的排列问题,利用直接法即可计算.【详解】由题知,每一爻有2种情况,一重卦的6爻有62情况,其中6爻中恰有3个阳爻情况有36C ,所以该重卦恰有3个阳爻的概率为3662C =516,故选A .【点睛】对利用排列组合计算古典概型问题,首先要分析元素是否可重复,其次要分析是排列问题还是组合问题.本题是重复元素的排列问题,所以基本事件的计算是“住店”问题,满足条件事件的计算是相同元素的排列问题即为组合问题.13.【2019年新课标2卷理科】演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是A .中位数B .平均数C .方差D .极差【答案】A 【解析】【分析】可不用动笔,直接得到答案,亦可采用特殊数据,特值法筛选答案.【详解】设9位评委评分按从小到大排列为123489x x x x x x ≤≤≤≤≤ .则①原始中位数为5x ,去掉最低分1x ,最高分9x ,后剩余2348x x x x ≤≤≤ ,中位数仍为5x ,∴A 正确.②原始平均数1234891()9x x x x x x x =+++++ ,后来平均数234817x x x x x '=+++ ()平均数受极端值影响较大,∴x 与x '不一定相同,B 不正确③()()()222219119S x x x x x x ⎡⎤=-+-++-⎣⎦ ()()()222223817s x x x x x x ⎡⎤'=-'+-'++-'⎢⎥⎣⎦ 由②易知,C 不正确.④原极差91=x -x ,后来极差82=x -x 可能相等可能变小,D 不正确.本题旨在考查学生对中位数、平均数、方差、极差本质的理解.14.【2019年新课标3卷理科】《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为A.0.5B.0.6C.0.7D.0.8【答案】C【解析】根据题先求出阅读过西游记的人数,进而得解.【详解】由题意得,阅读过《西游记》的学生人数为90-80+60=70,则其与该校学生人数之比为70÷100=0.7.故选C.【点睛】本题考查容斥原理,渗透了数据处理和数学运算素养.采取去重法,利用转化与化归思想解题.15.【2018年新课标1卷理科】某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半【答案】A【解析】【分析】首先设出新农村建设前的经济收入为M ,根据题意,得到新农村建设后的经济收入为2M ,之后从图中各项收入所占的比例,得到其对应的收入是多少,从而可以比较其大小,并且得到其相应的关系,从而得出正确的选项.【详解】设新农村建设前的收入为M ,而新农村建设后的收入为2M ,则新农村建设前种植收入为0.6M ,而新农村建设后的种植收入为0.74M ,所以种植收入增加了,所以A 项不正确;新农村建设前其他收入我0.04M ,新农村建设后其他收入为0.1M ,故增加了一倍以上,所以B 项正确;新农村建设前,养殖收入为0.3M ,新农村建设后为0.6M ,所以增加了一倍,所以C 项正确;新农村建设后,养殖收入与第三产业收入的综合占经济收入的30%28%58%50%+=>,所以超过了经济收入的一半,所以D 正确;故选A.点睛:该题考查的是有关新农村建设前后的经济收入的构成比例的饼形图,要会从图中读出相应的信息即可得结果.16.【2018年新课标1卷理科】如图来自古希腊数学家希波克拉底所研究的几何图形.此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC 的斜边BC ,直角边AB ,AC .△ABC 的三边所围成的区域记为I ,黑色部分记为II ,其余部分记为III .在整个图形中随机取一点,此点取自I ,II ,III 的概率分别记为p 1,p 2,p 3,则A .p 1=p 2B .p 1=p 3C .p 2=p 3D .p 1=p 2+p 3【答案】A 【解析】【分析】首先设出直角三角形三条边的长度,根据其为直角三角形,从而得到三边的关系,然后应用相应的面积公式求得各个区域的面积,根据其数值大小,确定其关系,再利用面积型几何概型的概率公式确定出p 1,p 2,p 3的关系,从而求得结果.【详解】设,,AC b AB c BC a ===,则有222b c a +=,从而可以求得ABC ∆的面积为112=S bc ,黑色部分的面积为22221()()[()]2222c b a S bc πππ=⋅+⋅-⋅-2221(4442c b a bc π=+-+22211422c b a bc bc π+-=⋅+=,其余部分的面积为22311122282a a S bc bc ππ⎛⎫=⋅-=- ⎪⎝⎭,所以有12S S =,根据面积型几何概型的概率公式,可以得到12p p =,故选A.点睛:该题考查的是面积型几何概型的有关问题,题中需要解决的是概率的大小,根据面积型几何概型的概率公式,将比较概率的大小问题转化为比较区域的面积的大小,利用相关图形的面积公式求得结果.17.【2018年新课标2卷理科】我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,如30723=+.在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是A .112B .114C .115D .118【答案】C【解析】【详解】分析:先确定不超过30的素数,再确定两个不同的数的和等于30的取法,最后根据古典概型概率公式求概率.详解:不超过30的素数有2,3,5,7,11,13,17,19,23,29,共10个,随机选取两个不同的数,共有21045C =种方法,因为7+23=11+19=13+17=30,所以随机选取两个不同的数,其和等于30的有3种方法,故概率为31=4515,选C.点睛:古典概型中基本事件数的探求方法:(1)列举法.(2)树状图法:适合于较为复杂的问题中的基本事件的探求.对于基本事件有“有序”与“无序”区别的题目,常采用树状图法.(3)列表法:适用于多元素基本事件的求解问题,通过列表把复杂的题目简单化、抽象的题目具体化.(4)排列组合法:适用于限制条件较多且元素数目较多的题目.18.【2018年新课标3卷理科】某群体中的每位成员使用移动支付的概率都为p ,各成员的支付方式相互独立,设X 为该群体的10位成员中使用移动支付的人数, 2.4DX =,()()46P X P X =<=,则p =A .0.7B .0.6C .0.4D .0.3【答案】B【解析】【详解】分析:判断出为二项分布,利用公式()()D X np 1p =-进行计算即可.()()D X np 1p =- p 0.4∴=或p 0.6=()()()()6444661010P X 41P X 61C p p C p p ==-<==-,()221p p ∴-<,可知p 0.5>故答案选B.点睛:本题主要考查二项分布相关知识,属于中档题.19.【2021年新高考1卷】有一组样本数据1x ,2x ,…,n x ,由这组数据得到新样本数据1y ,2y ,…,n y ,其中i i y x c =+(1,2,,),i n c =⋅⋅⋅为非零常数,则()A .两组样本数据的样本平均数相同B .两组样本数据的样本中位数相同C .两组样本数据的样本标准差相同D .两组样本数据的样本极差相同【答案】CD【解析】【分析】A 、C 利用两组数据的线性关系有()()E y E x c =+、()()D y D x =,即可判断正误;根据中位数、极差的定义,结合已知线性关系可判断B 、D 的正误.【详解】A :()()()E y E x c E x c =+=+且0c ≠,故平均数不相同,错误;B :若第一组中位数为i x ,则第二组的中位数为i i y x c =+,显然不相同,错误;C :()()()()D y D x D c D x =+=,故方差相同,正确;D :由极差的定义知:若第一组的极差为max min x x -,则第二组的极差为max min max min max min ()()y y x c x c x x -=+-+=-,故极差相同,正确;故选:CD20.【2021年新高考2卷】下列统计量中,能度量样本12,,,n x x x 的离散程度的是()A .样本12,,,n x x x 的标准差B .样本12,,,n x x x 的中位数C .样本12,,,n x x x 的极差D .样本12,,,n x x x 的平均数【答案】AC【解析】【分析】考查所给的选项哪些是考查数据的离散程度,哪些是考查数据的集中趋势即可确定正确选项.【详解】由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势;故选:AC.21.【2020年新高考1卷(山东卷)】信息熵是信息论中的一个重要概念.设随机变量X 所有可能的取值为1,2,,n ,且1()0(1,2,,),1ni i i P X i p i n p ===>==∑ ,定义X 的信息熵21()log n i i i H X p p ==-∑.()A .若n =1,则H (X )=0B .若n =2,则H (X )随着1p 的增大而增大C .若1(1,2,,)i p i n n == ,则H (X )随着n 的增大而增大D .若n =2m ,随机变量Y 所有可能的取值为1,2,,m ,且21()(1,2,,)j m j P Y j p p j m +-==+= ,则H (X )≤H (Y )【答案】AC【解析】【分析】对于A 选项,求得()H X ,由此判断出A 选项;对于B 选项,利用特殊值法进行排除;对于C 选项,计算出()H X ,利用对数函数的性质可判断出C 选项;对于D 选项,计算出()(),H X H Y ,利用基本不等式和对数函数的性质判断出D 选项.【详解】对于A 选项,若1n =,则11,1i p ==,所以()()21log 10H X =-⨯=,所以A 选项正确.对于B 选项,若2n =,则1,2i =,211p p =-,所以()()()121121X log 1log 1H p p p p =-⋅+-⋅-⎡⎤⎣⎦,当114p =时,()221133log log 4444H X ⎛⎫=-⋅+⋅ ⎪⎝⎭,当13p 4=时,()223311log log 4444H X ⎛⎫=-⋅+⋅ ⎪⎝⎭,两者相等,所以B 选项错误.对于C 选项,若()11,2,,i p i n n== ,则()222111log log log H X n n nn n ⎛⎫=-⋅⨯=-= ⎪⎝⎭,则()H X 随着n 的增大而增大,所以C 选项正确.对于D 选项,若2n m =,随机变量Y 的所有可能的取值为1,2,,m ,且()21j m j P Y j p p +-==+(1,2,,j m = ).()2222111log log m m i i i i i iH X p p p p ===-⋅=⋅∑∑122221222122121111log log log log m m m mp p p p p p p p --=⋅+⋅++⋅+⋅ .()H Y =()()()122221212122211111log log log m m m m m m m m p p p p p p p p p p p p -+-++⋅+⋅+++⋅+++ 12222122212221221121111log log log log m m m m m mp p p p p p p p p p p p ---=⋅+⋅++⋅+⋅++++ 由于()01,2,,2i p i m >= ,所以2111i i m i p p p +->+,所以222111log log i i m i p p p +->+,所以222111log log i i i i m ip p p p p +-⋅>⋅+,所以()()H X H Y >,所以D 选项错误.故选:AC【点睛】本小题主要考查对新定义“信息熵”的理解和运用,考查分析、思考和解决问题的能力,涉及对数运算和对数函数及不等式的基本性质的运用,属于难题.22.【2020年新高考2卷(海南卷)】我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是A .这11天复工指数和复产指数均逐日增加;B .这11天期间,复产指数增量大于复工指数的增量;C.第3天至第11天复工复产指数均超过80%;D.第9天至第11天复产指数增量大于复工指数的增量;【答案】CD【解析】【分析】注意到折线图中有递减部分,可判定A错误;注意考查第1天和第11天的复工复产指数的差的大小,可判定B错误;根据图象,结合复工复产指数的意义和增量的意义可以判定CD 正确.【详解】由图可知,第1天到第2天复工指数减少,第7天到第8天复工指数减少,第10天到第11复工指数减少,第8天到第9天复产指数减少,故A错误;由图可知,第一天的复产指标与复工指标的差大于第11天的复产指标与复工指标的差,所以这11天期间,复产指数增量小于复工指数的增量,故B错误;由图可知,第3天至第11天复工复产指数均超过80%,故C正确;由图可知,第9天至第11天复产指数增量大于复工指数的增量,故D正确;【点睛】本题考查折线图表示的函数的认知与理解,考查理解能力,识图能力,推理能力,难点在于指数增量的理解与观测,属中档题.23.【2022年全国甲卷】从正方体的8个顶点中任选4个,则这4个点在同一个平面的概率为________.【答案】635.【解析】【分析】根据古典概型的概率公式即可求出.【详解】从正方体的8个顶点中任取4个,有=C84=70个结果,这4个点在同一个平面的有= 6+6=12个,故所求概率==1270=635.故答案为:635.24.【2022年新高考2卷】已知随机变量X服从正态分布2,2,且o2<≤2.5)=0.36,则o>2.5)=____________.【答案】0.14##750.【解析】【分析】根据正态分布曲线的性质即可解出.【详解】因为∼2,2,所以<2=>2=0.5,因此>2.5=>2−2<≤2.5=0.5−0.36=0.14.故答案为:0.14.25.【2019年新课标1卷理科】甲、乙两队进行篮球决赛,采取七场四胜制(当一队赢得四场胜利时,该队获胜,决赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客客主客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立,则甲队以4∶1获胜的概率是____________.【答案】0.18【解析】【分析】本题应注意分情况讨论,即前五场甲队获胜的两种情况,应用独立事件的概率的计算公式求解.题目有一定的难度,注重了基础知识、基本计算能力及分类讨论思想的考查.【详解】前四场中有一场客场输,第五场赢时,甲队以4:1获胜的概率是30.60.50.520.108,⨯⨯⨯=前四场中有一场主场输,第五场赢时,甲队以4:1获胜的概率是220.40.60.520.072,⨯⨯⨯=综上所述,甲队以4:1获胜的概率是0.1080.0720.18.q =+=【点睛】由于本题题干较长,所以,易错点之一就是能否静心读题,正确理解题意;易错点之二是思维的全面性是否具备,要考虑甲队以4:1获胜的两种情况;易错点之三是是否能够准确计算.26.【2019年新课标2卷理科】我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为___________.【答案】0.98.【解析】【分析】本题考查通过统计数据进行概率的估计,采取估算法,利用概率思想解题.【详解】由题意得,经停该高铁站的列车正点数约为100.97200.98100.9939.2⨯+⨯+⨯=,其中高铁个数为10+20+10=40,所以该站所有高铁平均正点率约为39.20.9840=.【点睛】本题考点为概率统计,渗透了数据处理和数学运算素养.侧重统计数据的概率估算,难度不大.易忽视概率的估算值不是精确值而失误,根据分类抽样的统计数据,估算出正点列车数量与列车总数的比值.。

历年(2019-2024)全国高考数学真题分类(统计与数字特征)汇编(附答案)

历年(2019-2024)全国高考数学真题分类(统计与数字特征)汇编(附答案)

历年(2019-2024)全国高考数学真题分类(统计与数字特征)汇编考点01 随机抽样1.(2023∙全国新Ⅱ卷∙高考真题)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则不同的抽样结果共有( ).A .4515400200C C ⋅种B .2040400200C C ⋅种 C .3030400200C C ⋅种D .4020400200C C ⋅种考点02 图表类统计图综合1.(2022∙天津∙高考真题)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,右图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .8B .12C .16D .182.(2021∙天津∙高考真题)从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:[)66,70、[)70,74、L 、[]94,98,并整理得到如下的频率分布直方图,则评分在区间[)82,86内的影视作品数量是( )A.20 B.40 C.64 D.804.(2021∙全国甲卷∙高考真题)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间5.(2020∙全国新Ⅱ卷∙高考真题)(多选)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是A.这11天复工指数和复产指数均逐日增加;B.这11天期间,复产指数增量大于复工指数的增量;C.第3天至第11天复工复产指数均超过80%;D.第9天至第11天复产指数增量大于复工指数的增量;5.(2020∙天津∙高考真题)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[)[)[)[],并整理得到如下频率分布直方图,则在被抽取的零件中,5.31,5.33,5.33,5.35,,5.45,5.47,5.47,5.49直径落在区间[5.43,5.47)内的个数为()A.10 B.18 C.20 D.36考点03 样本的数字特征一、单选题1.(2024∙全国新Ⅱ卷∙高考真题)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理如下表亩产[900,950) [950,1000) [1000,1050) [1050,1100) [1100,1150) [1150,1200) 量频数 6 12 18 30 24 10根据表中数据,下列结论中正确的是()A.100块稻田亩产量的中位数小于1050kgB.100块稻田中亩产量低于1100kg的稻田所占比例超过80%C.100块稻田亩产量的极差介于200kg至300kg之间D.100块稻田亩产量的平均值介于900kg至1000kg之间2.(2022∙全国乙卷∙高考真题)分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:h),得如下茎叶图:则下列结论中错误的是()A.甲同学周课外体育运动时长的样本中位数为7.4B.乙同学周课外体育运动时长的样本平均数大于8C .甲同学周课外体育运动时长大于8的概率的估计值大于0.4D .乙同学周课外体育运动时长大于8的概率的估计值大于0.63.(2022∙全国甲卷∙高考真题)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则( )A .讲座前问卷答题的正确率的中位数小于70%B .讲座后问卷答题的正确率的平均数大于85%C .讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D .讲座后问卷答题的正确率的极差大于讲座前正确率的极差4.(2020∙全国∙高考真题)在一组样本数据中,1,2,3,4出现的频率分别为1234,,,p p p p ,且411i i p ==∑,则下面四种情形中,对应样本的标准差最大的一组是( )A .14230.1,0.4p p p p ====B .14230.4,0.1p p p p ====C .14230.2,0.3p p p p ====D .14230.3,0.2p p p p ====5.(2020∙全国∙高考真题)设一组样本数据x 1,x 2,…,xn 的方差为0.01,则数据10x 1,10x 2,…,10xn 的方差为( )A .0.01B .0.1C .1D .106.(2019∙全国∙高考真题)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是A .中位数B .平均数C .方差D .极差二、多选题9.(2023∙全国新Ⅰ卷∙高考真题)有一组样本数据126,,,x x x ⋅⋅⋅,其中1x 是最小值,6x 是最大值,则( ) A .2345,,,x x x x 的平均数等于126,,,x x x ⋅⋅⋅的平均数B .2345,,,x x x x 的中位数等于126,,,x x x ⋅⋅⋅的中位数C .2345,,,x x x x 的标准差不小于126,,,x x x ⋅⋅⋅的标准差D .2345,,,x x x x 的极差不大于126,,,x x x ⋅⋅⋅的极差10.(2021∙全国新Ⅱ卷∙高考真题)下列统计量中,能度量样本12,,,n x x x 的离散程度的是( )A .样本12,,,n x x x 的标准差B .样本12,,,n x x x 的中位数C .样本12,,,n x x x 的极差D .样本12,,,n x x x 的平均数11.(2021∙全国新Ⅰ卷∙高考真题)有一组样本数据1x ,2x ,…,n x ,由这组数据得到新样本数据1y ,2y ,…,n y ,其中i i y x c =+(1,2,,),i n c =⋅⋅⋅为非零常数,则( )A .两组样本数据的样本平均数相同B .两组样本数据的样本中位数相同C .两组样本数据的样本标准差相同D .两组样本数据的样本极差相同三、填空题12.(2020∙江苏∙高考真题)已知一组数据4,2,3,5,6a a -的平均数为4,则a 的值是 .13.(2019∙江苏∙高考真题)已知一组数据6,7,8,8,9,10,则该组数据的方差是 .考点04 变量间的相关关系1.(2024∙天津∙高考真题)下列图中,线性相关性系数最大的是( )A .B .C .D .2.(2023∙天津∙高考真题)鸢是鹰科的一种鸟,《诗经∙大雅∙旱麓》曰:“鸢飞戾天,鱼跃余渊”. 鸢尾花因花瓣形如鸢尾而得名,寓意鹏程万里、前途无量.通过随机抽样,收集了若干朵某品种鸢尾花的花萼长度和花瓣长度(单位:cm ),绘制散点图如图所示,计算得样本相关系数为0.8642r =,利用最小二乘法求得相应的经验回归方程为 0.75010.6105y x =+,根据以上信息,如下判断正确的为( )A .花瓣长度和花萼长度不存在相关关系B .花瓣长度和花萼长度负相关C .花萼长度为7cm 的该品种鸢尾花的花瓣长度的平均值为5.8612cmD .若从样本中抽取一部分,则这部分的相关系数一定是0.86423.(2020∙全国∙高考真题)某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i = 得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( )A .y a bx =+B .2y a bx =+C .e x y a b =+D .ln y a b x =+参考答案考点01 随机抽样1.(2023∙全国新Ⅱ卷∙高考真题)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则不同的抽样结果共有( ).A .4515400200C C ⋅种B .2040400200C C ⋅种 C .3030400200C C ⋅种 D .4020400200C C ⋅种【答案】D【详细分析】利用分层抽样的原理和组合公式即可得到答案. 【答案详解】根据分层抽样的定义知初中部共抽取4006040600⨯=人,高中部共抽取2006020600⨯=, 根据组合公式和分步计数原理则不同的抽样结果共有4020400200C C ⋅种.故选:D.考点02 图表类统计图综合1.(2022∙天津∙高考真题)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,右图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .8B .12C .16D .18【答案】B 【详细分析】结合已知条件和频率分布直方图求出志愿者的总人数,进而求出第三组的总人数,从而可以求得结果. 【答案详解】志愿者的总人数为20(0.240.16)1+⨯=50, 所以第三组人数为50×0.36=18,有疗效的人数为18-6=12.故选:B.2.(2021∙天津∙高考真题)从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:[)66,70、[)70,74、L 、[]94,98,并整理得到如下的频率分布直方图,则评分在区间[)82,86内的影视作品数量是( )A .20B .40C .64D .80【答案】D 【详细分析】利用频率分布直方图可计算出评分在区间[)82,86内的影视作品数量.【答案详解】由频率分布直方图可知,评分在区间[)82,86内的影视作品数量为4000.05480⨯⨯=.故选:D.4.(2021∙全国甲卷∙高考真题)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是( )A .该地农户家庭年收入低于4.5万元的农户比率估计为6%B .该地农户家庭年收入不低于10.5万元的农户比率估计为10%C .估计该地农户家庭年收入的平均值不超过6.5万元D .估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间【答案】C【详细分析】根据直方图的意义直接计算相应范围内的频率,即可判定ABD,以各组的中间值作为代表乘以相应的频率,然后求和即得到样本的平均数的估计值,也就是总体平均值的估计值,计算后即可判定C.【答案详解】因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于4.5万元的农户的比率估计值为0.020.040.066%+==,故A 正确;该地农户家庭年收入不低于10.5万元的农户比率估计值为0.040.0230.1010%+⨯==,故B 正确;该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为0.100.140.2020.6464%50%++⨯==>,故D 正确;该地农户家庭年收入的平均值的估计值为30.0240.0450.1060.1470.2080.2090.10100.10110.04120.02130.02140.027.68⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=(万元),超过6.5万元,故C 错误.综上,给出结论中不正确的是C.故选:C.【名师点评】本题考查利用样本频率直方图估计总体频率和平均值,属基础题,样本的频率可作为总体的频率的估计值,样本的平均值的估计值是各组的中间值乘以其相应频率然后求和所得值,可以作为总体的平均值的估计值.注意各组的频率等于⨯频率组距组距. 5.(2020∙全国新Ⅱ卷∙高考真题)(多选)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是A .这11天复工指数和复产指数均逐日增加;B .这11天期间,复产指数增量大于复工指数的增量;C .第3天至第11天复工复产指数均超过80%;D .第9天至第11天复产指数增量大于复工指数的增量;【答案】CD【详细分析】注意到折线图中有递减部分,可判定A 错误;注意考查第1天和第11天的复工复产指数的差的大小,可判定B 错误;根据图象,结合复工复产指数的意义和增量的意义可以判定CD 正确.【答案详解】由图可知,第1天到第2天复工指数减少,第7天到第8天复工指数减少,第10天到第11复工指数减少,第8天到第9天复产指数减少,故A 错误;由图可知,第一天的复产指标与复工指标的差大于第11天的复产指标与复工指标的差,所以这11天期间,复产指数增量小于复工指数的增量,故B 错误;由图可知,第3天至第11天复工复产指数均超过80%,故C 正确;由图可知,第9天至第11天复产指数增量大于复工指数的增量,故D 正确;【名师点评】本题考查折线图表示的函数的认知与理解,考查理解能力,识图能力,推理能力,难点在于指数增量的理解与观测,属中档题.5.(2020∙天津∙高考真题)从一批零件中抽取80个,测量其直径(单位:mm ),将所得数据分为9组:[)[)[)[]5.31,5.33,5.33,5.35,,5.45,5.47,5.47,5.49 ,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )A .10B .18C .20D .36【答案】B 【详细分析】根据直方图确定直径落在区间[)5.43,5.47之间的零件频率,然后结合样本总数计算其个数即可. 【答案详解】根据直方图,直径落在区间[)5.43,5.47之间的零件频率为:()6.25 5.000.020.225+⨯=, 则区间[)5.43,5.47内零件的个数为:800.22518⨯=.故选:B.【名师点评】本题主要考查频率分布直方图的计算与实际应用,属于中等题.考点03 样本的数字特征一、单选题1.(2024∙全国新Ⅱ卷∙高考真题)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg )并整理如下表 亩产量[900,950) [950,1000) [1000,1050) [1050,1100) [1100,1150) [1150,1200) 频数 6 12 18 30 24 10 根据表中数据,下列结论中正确的是( )A .100块稻田亩产量的中位数小于1050kgB .100块稻田中亩产量低于1100kg 的稻田所占比例超过80%C .100块稻田亩产量的极差介于200kg 至300kg 之间D .100块稻田亩产量的平均值介于900kg 至1000kg 之间【答案】C【详细分析】计算出前三段频数即可判断A ;计算出低于1100kg 的频数,再计算比例即可判断B ;根据极差计算方法即可判断C ;根据平均值计算公式即可判断D.【答案详解】对于 A, 根据频数分布表可知, 612183650++=<,所以亩产量的中位数不小于 1050kg , 故 A 错误;对于B ,亩产量不低于1100kg 的频数为341024=+,所以低于1100kg 的稻田占比为1003466%100-=,故B 错误; 对于C ,稻田亩产量的极差最大为1200900300-=,最小为1150950200-=,故C 正确;对于D ,由频数分布表可得,平均值为1(692512975181025301075241125101175)1067100⨯⨯+⨯+⨯+⨯+⨯+⨯=,故D 错误. 故选;C.2.(2022∙全国乙卷∙高考真题)分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:h ),得如下茎叶图:则下列结论中错误的是( )A .甲同学周课外体育运动时长的样本中位数为7.4B .乙同学周课外体育运动时长的样本平均数大于8C .甲同学周课外体育运动时长大于8的概率的估计值大于0.4D .乙同学周课外体育运动时长大于8的概率的估计值大于0.6【答案】C【详细分析】结合茎叶图、中位数、平均数、古典概型等知识确定正确答案.【答案详解】对于A 选项,甲同学周课外体育运动时长的样本中位数为7.37.57.42+=,A 选项结论正确.对于B 选项,乙同学课外体育运动时长的样本平均数为:6.37.47.68.18.28.28.58.68.68.68.69.09.29.39.810.18.50625816+++++++++++++++=>, B 选项结论正确.对于C 选项,甲同学周课外体育运动时长大于8的概率的估计值60.3750.416=<, C 选项结论错误.对于D 选项,乙同学周课外体育运动时长大于8的概率的估计值130.81250.616=>, D 选项结论正确.故选:C3.(2022∙全国甲卷∙高考真题)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则( )A .讲座前问卷答题的正确率的中位数小于70%B .讲座后问卷答题的正确率的平均数大于85%C .讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D .讲座后问卷答题的正确率的极差大于讲座前正确率的极差【答案】B【详细分析】由图表信息,结合中位数、平均数、标准差、极差的概念,逐项判断即可得解. 【答案详解】讲座前中位数为70%75%70%2+>,所以A 错; 讲座后问卷答题的正确率只有一个是80%,4个85%,剩下全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,所以B 对;讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C 错;讲座后问卷答题的正确率的极差为100%80%20%-=,讲座前问卷答题的正确率的极差为95%60%35%20%-=>,所以D 错.故选:B.4.(2020∙全国∙高考真题)在一组样本数据中,1,2,3,4出现的频率分别为1234,,,p p p p ,且411i i p ==∑,则下面四种情形中,对应样本的标准差最大的一组是( )A .14230.1,0.4p p p p ====B .14230.4,0.1p p p p ====C .14230.2,0.3p p p p ====D .14230.3,0.2p p p p ====【答案】B【详细分析】计算出四个选项中对应数据的平均数和方差,由此可得出标准差最大的一组.【答案详解】对于A 选项,该组数据的平均数为()()140.1230.4 2.5A x =+⨯++⨯=,方差为()()()()222221 2.50.12 2.50.43 2.50.44 2.50.10.65A s =-⨯+-⨯+-⨯+-⨯=; 对于B 选项,该组数据的平均数为()()140.4230.1 2.5B x =+⨯++⨯=,方差为()()()()222221 2.50.42 2.50.13 2.50.14 2.50.4 1.85B s =-⨯+-⨯+-⨯+-⨯=; 对于C 选项,该组数据的平均数为()()140.2230.3 2.5C x =+⨯++⨯=,方差为()()()()222221 2.50.22 2.50.33 2.50.34 2.50.2 1.05C s =-⨯+-⨯+-⨯+-⨯=; 对于D 选项,该组数据的平均数为()()140.3230.2 2.5D x =+⨯++⨯=,方差为()()()()222221 2.50.32 2.50.23 2.50.24 2.50.3 1.45D s =-⨯+-⨯+-⨯+-⨯=. 因此,B 选项这一组的标准差最大.故选:B.【名师点评】本题考查标准差的大小比较,考查方差公式的应用,考查计算能力,属于基础题. 5.(2020∙全国∙高考真题)设一组样本数据x 1,x 2,…,xn 的方差为0.01,则数据10x 1,10x 2,…,10xn 的方差为( )A .0.01B .0.1C .1D .10【答案】C【详细分析】根据新数据与原数据关系确定方差关系,即得结果. 【答案详解】因为数据(1,2,,)i ax b i n +=L ,的方差是数据(1,2,,)i x i n =L ,的方差的2a 倍, 所以所求数据方差为2100.01=1⨯故选:C【名师点评】本题考查方差,考查基本详细分析求解能力,属基础题.6.(2019∙全国∙高考真题)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是A .中位数B .平均数C .方差D .极差【答案】A【详细分析】可不用动笔,直接得到答案,亦可采用特殊数据,特值法筛选答案.【答案详解】设9位评委评分按从小到大排列为123489x x x x x x ≤≤≤≤≤ .则①原始中位数为5x ,去掉最低分1x ,最高分9x ,后剩余2348x x x x ≤≤≤ ,中位数仍为5x ,∴A 正确. ②原始平均数1234891()9x x x x x x x =+++++ ,后来平均数234817x x x x x '=+++ () 平均数受极端值影响较大,∴x 与x '不一定相同,B 不正确 ③()()()222219119S x x x x x x ⎡⎤=-+-++-⎣⎦ ()()()222223817s x x x x x x ⎡⎤'=-'+-'++-'⎢⎥⎣⎦ 由②易知,C 不正确. ④原极差91=x -x ,后来极差82=x -x 可能相等可能变小,D 不正确.【名师点评】本题旨在考查学生对中位数、平均数、方差、极差本质的理解.考点04 变量间的相关关系1.(2024∙天津∙高考真题)下列图中,线性相关性系数最大的是( )A .B .C .D .【答案】A【详细分析】由点的分布特征可直接判断【答案详解】观察4幅图可知,A 图散点分布比较集中,且大体接近某一条直线,线性回归模型拟合效果比较好,呈现明显的正相关,r 值相比于其他3图更接近1.故选:A2.(2023∙天津∙高考真题)鸢是鹰科的一种鸟,《诗经∙大雅∙旱麓》曰:“鸢飞戾天,鱼跃余渊”. 鸢尾花因花瓣形如鸢尾而得名,寓意鹏程万里、前途无量.通过随机抽样,收集了若干朵某品种鸢尾花的花萼长度和花瓣长度(单位:cm ),绘制散点图如图所示,计算得样本相关系数为0.8642r =,利用最小二乘法求得相应的经验回归方程为 0.75010.6105y x =+,根据以上信息,如下判断正确的为( )A .花瓣长度和花萼长度不存在相关关系B .花瓣长度和花萼长度负相关C .花萼长度为7cm 的该品种鸢尾花的花瓣长度的平均值为5.8612cmD .若从样本中抽取一部分,则这部分的相关系数一定是0.8642【答案】C【详细分析】根据散点图的特点及经验回归方程可判断ABC 选项,根据相关系数的定义可以判断D 选项.【答案详解】根据散点的集中程度可知,花瓣长度和花萼长度有相关性,A 选项错误散点的分布是从左下到右上,从而花瓣长度和花萼长度呈现正相关性,B 选项错误,把7x =代入 0.75010.6105y x =+可得 5.8612cm y =,C 选项正确;由于0.8642r =是全部数据的相关系数,取出来一部分数据,相关性可能变强,可能变弱,即取出的数据的相关系数不一定是0.8642,D 选项错误故选:C3.(2020∙全国∙高考真题)某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i = 得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( )A .y a bx =+B .2y a bx =+C .e x y a b =+D .ln y a b x =+ 【答案】D【详细分析】根据散点图的分布可选择合适的函数模型.【答案详解】由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+. 故选:D.【名师点评】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第十一章统计、统计案例第一部分六年高考荟萃2013年高考题1 .(2013年高考卷(理))某单位有840名职工, 现采用系统抽样方法, 抽取42人做问卷调查, 将840人按1, 2, , 840随机编号, 则抽取的42人中, 编号落入区间[481, 720]的人数为()A.11 B.12 C.13 D.142 .(2013年普通高等学校招生统一考试数学(理)试题(纯WORD版))某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是()A.这种抽样方法是一种分层抽样B.这种抽样方法是一种系统抽样C.这五名男生成绩的方差大于这五名女生成绩的方差D.该班级男生成绩的平均数小于该班女生成绩的平均数3 .(2013年普通高等学校招生统一考试数学(理)试题(纯WORD版))某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分为6组:[40,50), [50,60),[60,70), [70,80), [80,90), [90,100)加以统计,得到如图所示的频率分布直方图,已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588 B.480 C.450 D.1204 .(2013年高考卷(理))总体有编号为01,02,…,19,20的20个个体组成。

利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()A.08 B.07 C.02 D.015.(2013年高考卷(理))盒子中装有编号为1,2,3,4,5,6,7,8,9的九个球,从中任意取出两个,则这两个球的编号之积为偶数的概率是___________(结果用最简分数表示)6.(2013年高考卷(理))从某小区抽取100户居民进行月用电量调查,发现其用电量都在50到350度之间,频率分布直方图所示.(I)直方图中x的值为___________;100,250的户数为_____________.(II)在这些用户中,用电量落在区间[)7.(2013年普通高等学校招生全国统一招生考试卷(数学)(已校对纯WORD 版含附加题))运动员 第1次 第2次 第3次 第4次 第5次 甲 87 91 90 89 93 乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为_____________.8.(2013年高考卷(理))设非零常数d 是等差数列12319,,,,x x x x 的公差,随机变量ξ等可能地取值12319,,,,x x x x ,则方差_______D ξ=9.(2013年普通高等学校招生统一考试省数学(理)卷(纯WORD 版))某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数.(Ⅰ) 根据茎叶图计算样本均值;(Ⅱ) 日加工零件个数大于样本均值的工人为优秀工人,根据茎叶图推断该车间12名工人中有几名优秀工人;(Ⅲ) 从该车间12名工人中,任取2人,求恰有1名优秀工人的概率.10.(2013年普通高等学校招生统一考试数学(理)试题(含答案))一个盒子里装有7卡片,其中有红色卡片4, 编号分别为1, 2, 3, 4; 白色卡片3, 编号分别为2, 3, 4. 从盒子中任取4卡片 (假设取到任何一卡片的可能性相同).(Ⅰ) 求取出的4卡片中, 含有编号为3的卡片的概率.(Ⅱ) 再取出的4卡片中, 红色卡片编号的最大值设为X , 求随机变量X 的分布列和数学期望.11.(2013年高考卷(理))1 7 92 0 1 53 0第17题图在一场娱乐晚会上, 有5位民间歌手(1至5号)登台演唱, 由现场数百名观众投票选出最受欢迎歌手. 各位观众须彼此独立地在选票上选3名歌手, 其中观众甲是1号歌手的歌迷, 他必选1号, 不选2号, 另在3至5号中随机选2名. 观众乙和丙对5位歌手的演唱没有偏爱, 因此在1至5号中随机选3名歌手.(Ⅰ) 求观众甲选中3号歌手且观众乙未选中3号歌手的概率;(Ⅱ) X表示3号歌手得到观众甲、乙、丙的票数之和, 求X的分布列和数学期望.12.(2013年普通高等学校招生统一考试数学(理)试题(含答案))某商场举行的“三色球”购物摸奖活动规定:在一次摸奖中,摸奖者先从装有3个红球与4个白球的袋中任意摸出3个球,再从装有1个蓝球与2个白球的袋中任意摸出1个球,根据摸出4个球中红球与蓝球的个数,设一.二.三等奖如下:奖级摸出红.蓝球个数获奖金额一等奖3红1蓝200元二等奖3红0蓝50元三等奖2红1蓝10元其余情况无奖且每次摸奖最多只能获得一个奖级.(1)求一次摸奖恰好摸到1个红球的概率;E X.(2)求摸奖者在一次摸奖中获奖金额X的分布列与期望()2012年高考题1.【2012新课标文】在一组样本数据(x1,y1),(x2,y2),…,(x n,y n)(n≥2,x1,x2,…,x nA .46,45,56B .46,45,53C .47,45,56D .45,47,535.【2012文】小波一星期的总开支分布图如图1所示,一星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比为A.30%B.10%C.3%D.不能确定6.【2012文】设某大学的女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系,根据一组样本数据(x i ,y i )(i=1,2,…,n ),用最小二乘法建立的回归方程为y =0.85x-85.71,则下列结论中不正确...的是 A.y 与x 具有正的线性相关关系 B.回归直线过样本点的中心(x ,y )C.若该大学某女生身高增加1cm ,则其体重约增加0.85kgD.若该大学某女生身高为170cm ,则可断定其体重必为58.79kg 7.【2012文】容量为20的样本数据,分组后的频数如下表则样本数据落在区间[10,40]的频率为A 0.35B 0.45C 0.55D 0.658.【2012文由正整数组成的一组数据1234,,,x x x x ,其平均数和中位数都是2,且标准差等于1,则这组数据为 .(从小到大排列)9.【2012文】右图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为____.10.【2012文】某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为____________.11.【2012文】图2是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为_________.08910352图(注:方差2222121()()()n s x x x x x x n⎡⎤=-+-++-⎣⎦,其中x 为x 1,x 2,…,x n 的平均数)12.【2012文】一支田径运动队有男运动员56人,女运动员42人。

现用分层抽样的方法抽取若干人,若抽取的男运动员有8人,则抽取的女运动员有______人。

13.【2102文】一支田径队有男女运动员98人,其中男运动员有56人.按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员人数是_______.14.【2012】某学校高一、高二、高三年级的学生人数之比为334::,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取 名学生. 15.【2012文】电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名。

下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图;将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性。

(Ⅰ)根据已知条件完成下面的22⨯列联表,并据此资料你是否认为“体育迷”与性别 有关?非体育迷体育迷 合计 男 女 合计(Ⅱ)将日均收看该体育项目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率。

附2 2112212211212(), n n n n nn n n nχ++++-=16.【2012文】若某产品的直径长与标准值的差的绝对值不超过...1mm 时,则视为合格品,否则视为不合格品。

在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5000件进行检测,结果发现有50件不合格品。

计算这50件不合格品的直径长与标准值的差(单位:mm), 将所得数据分组,得到如下频率分布表:分组频数频率[-3, -2) 0.10[-2, -1) 8(1,2] 0.50(2,3] 10(3,4]合计50 1.00(Ⅰ)将上面表格中缺少的数据填在答题卡...的相应位置;(Ⅱ)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]的概率;(Ⅲ)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品。

据此估算这批产品中的合格品的件数。

17.【2012文】(本小题满分13分)某校100名学生期中考试语文成绩的频率分布直方图如图4所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比如下表所示,求数学成绩在[50,90)之外的人数.。

18.【2102文】(本题满分12分)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(I )求回归直线方程y =bx+a ,其中b=-20,a=y -b x ;(II )预计在今后的销售中,销量与单价仍然服从(I )中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)2011年高考题与销售额y 的统计数据如下表广告费用x (万元) 4 235销售额y (万元)49 26 39[ 54根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售A.63.3 B.65.5 C.67.7 D72.0(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).1r 表示变量Y 与X 之间的线性相关系数,2r 表示变量V 与U 之间的线性相关系数,则 ( )A.012<<r rB. 120r r <<C.120r r <<D. 12r r =分数段[50,60) [60,70) [70,80) [80,90):x y 11: 21: 34: 4:53. (2011年高考卷理科4)通过随即询问110名性别不同的大学生是否爱好某项运动,得到 男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计6050110由()()()()()d b c a d c b a bc ad n K ++++-=22算得,()8.7506050602020304011022≈⨯⨯⨯⨯-⨯=K . ()k K P ≥20.050 0.010 0.001 k3.8416.63510.828参照附表,得到的正确结论是A.在犯错的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B. 在犯错的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C. 由99%以上的把握认为“爱好该项运动与性别有关”D. 由99%以上的把握认为“爱好该项运动与性别无关”4.(2011年高考卷理科9)设11(,)x y ,22(,)x y ,, (,)n n x y 是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是(A )x 和y 相关系数为直线l 的斜率 (B )x 和y 的相关系数在0到1之间(C )当n 为偶数时,分布在l 两侧的样本点的个数一定相同 (D )直线l 过点(,)x y5. (2011年高考卷理科13)某数学老师身高176cm ,他爷爷、父亲和儿子的身高分别是173cm 、170cm 、和182cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他子的身高为 cm.2010年高考题一、选择题1.(2010文)4.如图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为A B x x 和,样本标准差分别为sA 和sB,则[B](A) A x >B x ,sA >sB (B) A x <B x ,sA >sB (C) A x >B x ,sA <sB (D)A x <B x ,sA <sB2.(2010文)(5)某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本 . 若样本中的青年职工为7人,则样本容量为(A )7 (B )15 (C )25 (D )35 3.(2010文)(6)在某项体育比赛中,七位裁判为一选手打出的分数如下: 90 89 90 95 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为 (A )92 , 2 (B) 92 , 2.8 (C) 93 , 2 (D) 93 , 2.84.(2010理)7.已知随机变量X 服从正态分布N(3.1),且(24)P X ≤≤=0.6826,则p (X>4)=( )A 、0.1588B 、0.1587C 、0.1586 D0.15855.(2010文)(4)一个单位有职工800人,期中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是(A )12,24,15,9 (B )9,12,12,7 (C )8,15,12,5 (D )8,16,10,6 6.(2010理)(8)某台小型晚会由6个节目组成,演出顺序有如下要求:节目甲必须排在第四位、节目乙不能排在第一位,节目丙必须排在最后一位,该台晚会节目演出顺序的编排方案共有 (A )36种(B )42种(C)48种(D )54种7.(2010理)8.(2010理)9.(2010理)6.将参加夏令营的600名学生编号为:001,002,……600,采用系统抽样方法抽取一个容量为50的样本,且随机抽得的为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495住在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数一次为A.26, 16, 8, B.25,17,8C.25,16,9 D.24,17,9二、填空题10.(2010文)(14)某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户.从普通家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取l00户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收人家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是 ..11.(2010文)(11)在如图所示的茎叶图中,甲、乙两组数据的中位数分别是12(2010理)(11)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图)。

相关文档
最新文档