通用版2020版高考数学大二轮复习专题突破练20统计与统计案例理

合集下载

2020年高考数学二轮限时训练计数原理、概率、随机变量及其分步、统计、统计案例2理

2020年高考数学二轮限时训练计数原理、概率、随机变量及其分步、统计、统计案例2理

第七部分:计数原理、概率、随机变量及其分步、统计、 统计案例(2)(限时:时间45分钟,满分100分)、选择题1 31 •已知(X 2—二)"的展开式中第三项与第五项的系数之比为 帀,则展开式中常数项是()A •— 1B • 1 C.— 45 D • 45r当 20 — 2r — = 0,即当 r = 8 时, 常数项为 C 108( — 1)8= C o 2= 45,选 D.【答案】 D1 n2 •若(x + -)n展开式的二项式系数之和为64,则展开式的常数项为( )XA . 10B • 20 C. 30 D • 120【解析】•.•2n = 64,「. n = 6, 1•••T k +1= C 6kx 6— k(-)k= C 6kx6— 2k,•••当k = 3时,T 4为常数项,3• -T 4= C o = 20.【答案】 B3 • (2020年献县二模)(1 — ,x) 6(1 + ,x)4的展开式中x 的系数是()A • — 4B • — 3C . 3D • 4【解析】 方法一 :(1 — . x) 6(1 + . x)4的展开式中x 的一次项为:C 60•C 42( x)2+ G 2( — x) 2•C 40+ C 61( — x)・C 41( .x)【解析】 由题知第三项的系数为 G 2( — 1)2= G 2,第五项的系数为G 2G 4( — 1)4= G 4,则有吕C n£解得n =10,由 T r + 1= C r 20— 2r oXr rx — 2( —=6x + 15x — 24x = — 3x ,所以(1 — x) 6(1 + x)4的展开式中x 的系数是一3.方法二:由于(1 — x) 6(1 + x) 4= (1 — x) 4(1 — x) 1 2的展开式中x 的一次项为: 。

3( — x) •C 2 + C 4°•C 22( — J x) 2=— 4x + x =— 3x , 所以(1 —■ x) 6(1 + x)4的展开式中x 的系数是一3.【答案】 B8 84 .设(1 + x) = a o + a 1x +…+ a $x ,则 a o , a 1,…,a 8中奇数的个数 为() A . 2 B . 3 C. 4 D . 58 2 8_,【解析】 由(1 + x) = a o + a 1x + a 2x +…+ a $x 可以知道,a o 、a” a 2、…、a 8均为二项式系数,依次是 C 0、Q 4、C 2…、C 8,0 8 1 7 2 6 3 5C 8 = C 8 = 1, C 8 = C 8 = 8, C 8 = C 8 = 28, C = C 8 = 56 ,Q = 70,.・a o , a-1,…,a 8中奇数只有a o 和a s 两个. 【答案】 A1 n 1 15 .若(2x —-)展开式中含 广项的系数与含项的系数之比为一5,则n 等于()入 入 入A . 4B . 6 C. 8 D . 1o 【解析】1kn —kk• T =C (2x) (—x )kk 亠 n —k n — 2k=G ( — 1)・2 x ,n + 2•••令 n — 2k = — 2 得 k = -; n + 4令 n — 2k =— 4 得 k =〒,n +4n +4C2n(— 1)22n—解得n = 6. 【答案】 B 二、填空题6. 1 + 3 + 32+…+ 399被4除所得的余数是 ___________2 991 — 3100【解析】•/ 1+ 3+ 3 +…+ 3 =1 — 34则(1 + x + x 2)(x + p n 的展开式中无常数项.n+2 n+2 C〒n( —1)〒2 n-n+ 2 2 n+ 4 21100 1 99 8 2 9 =—(4 — C 100 4 +…+ C 1009 ・4 — C oo9 4)=8(4 98— C o 。

2020高考数学二轮复习概率与统计.docx

2020高考数学二轮复习概率与统计.docx

2020 高考数学二轮复习 概率与统计概率内容的新概念 多,相近概念容易混淆,本 就学生易犯 作如下 :型一 “非等可能 ”与 “等可能 ”混同 例 1 两枚骰子,求所得的点数之和 6 的概率.解两枚骰子出 的点数之和2, 3, 4, ⋯ ,12 共 11 种基本事件,所以概率P=111剖析以上 11 种基本事件不是等可能的,如点数和 2 只有 (1, 1),而点数之和6 有 (1, 5)、(2, 4)、 (3, 3)、 (4,2)、 (5, 1)共 5 种.事 上, 两枚骰子共有 36 种基本事件,且是等可能的,所以“所得点数之和6”的概率 P= 5.36型二 “互斥 ”与 “ 立 ”混同例 2把 、黑、白、4 牌随机地分 甲、乙、丙、丁4 个人,每个人分得1 ,事件“甲分得 牌”与“乙分得 牌”是()A . 立事件B .不可能事件C .互斥但不 立事件D .以上均不解A剖析 本 的原因在于把 “互斥 ”与 “ 立”混同,二者的 系与区 主要体 在 :(1)两事件 立,必定互斥,但互斥未必 立; (2) 互斥概念适用于多个事件,但 立概念只适用于两个事件; (3) 两个事件互斥只表明 两个事件不能同 生,即至多只能 生其中一个,但可以都不 生;而两事件 立 表示它 有且 有一个 生.事件 “甲分得 牌 ”与 “乙分得 牌 ”是不能同 生的两个事件,两个事件可能恰有一个 生,一个不 生,可能两个都不 生,所以 C .型三 例 3解“互斥 ”与 “独立 ”混同甲投 命中率 O .8,乙投 命中率 0.7,每人投 3 次,两人恰好都命中 2 次的概率是多少 ?“甲恰好投中两次” 事件 A , “乙恰好投中两次” 事件B , 两人都恰好投中两次事件A+B , P(A+B)=P(A)+P(B): c 32 0.820.2 c 32 0.720.3 0.825剖析本 的原因是把相互独立同 生的事件当成互斥事件来考 , 将两人都恰好投中2 次理解 “甲恰好投中两次”与 “乙恰好投中两次 ”的和.互斥事件是指两个事件不可能同 生;两事件相互独立是指一个事件的 生与否 另一个事件 生与否没有影响,它 然都描 了两个事件 的关系,但所描 的关系是根本不同.解:“甲恰好投中两次 ” 事件 A ,“乙恰好投中两次” 事件 B ,且 A , B 相互独立,两人都恰好投中两次 事件A ·B ,于是 P(A ·B)=P(A) ×P(B)= 0.169类型四例 4错解“条件概率 P(B / A)”与“积事件的概率P(A·B)”混同袋中有 6 个黄色、 4 个白色的乒乓球,作不放回抽样,每次任取一球,取 2 次,求第二次才取到黄色球的概率.记“第一次取到白球”为事件A,“第二次取到黄球”为事件B,”第二次才取到黄球”为事件62C,所以 P(C)=P(B/A)=.93剖析本题错误在于 P(A B)与 P(B/A) 的含义没有弄清 , P(A B) 表示在样本空间S 中 ,A 与 B 同时发生的概率;而P( B/A )表示在缩减的样本空间S A中,作为条件的 A 已经发生的条件下事件 B 发生的概率。

2020版高考数学大二轮专题突破文科通用版 课件:6.2.1 统计与统计案例

2020版高考数学大二轮专题突破文科通用版 课件:6.2.1 统计与统计案例

������
∑ xi2
������=1− Nhomakorabeax2.
-6-
2.变量间的相关关系
(1)如果散点图中的点从整体上看大致分布在一条直线的附近,那
么我们说变量x和y具有线性相关关系.
(2)线性回归方程:若变量x与y具有线性相关关系,有n个样本数据
(xi,yi)(i=1,2,…,n),则回归方程为
^ ^ ^ ^ ^ ^ ������
之和为0.5处的横坐标;
(3)平均数������ = ���1���(x1+x2+…+xn).体现在频率分布直方图中是由各小
矩形的宽的中点的横坐标乘以相应小矩形的面积,然后求和得到;
(4)方差
s2=���1���[(x1-������)2+(x2-������)2+…+(xn-������)2]=���1���
由公式:���^���=(2×250+3×30(04++49+×14600++255+×43560)-+5×6×16600)-5×4×400
=85,
a^ =400-85×4=60,∴���^���=85x+60.
(2)由题意:w=-5x2+85x-80,
所以,年平均利润������������
=-5x+85-80=85-5
的平均值
频率、频数分 布表,平均数、 方差
样本估 计总体
分析、计算
频率,频率分布 样本估 直方图;平均数 计总体
观察、分析、 计算,方程思 想
-5-
1.样本的数字特征
(1)众数:是指出现次数最多的数,体现在频率分布直方图中,是指

高考数学二轮复习专题突破—统计与统计案例(含解析)

高考数学二轮复习专题突破—统计与统计案例(含解析)

高考数学二轮复习专题突破—统计与统计案例1.某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y 的频数分布表.(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01) 附:√74≈8.602.2.(2021·江西赣州二模改编)遵守交通规则,人人有责.“礼让行人”是我国《道路交通安全法》的明文规定,也是全国文明城市测评中的重要内容.《道路交通安全法》第47条明确规定:“机动车行经人行横道时,应当减速行驶;遇行人正在通过人行横道,应当停车让行.机动车行经没有交通信号的道路时,遇行人横过道路,应当避让.否则扣3分罚200元”.下表是2021年1至4月份我市某主干路口监控设备抓拍到的驾驶员不“礼让行人”行为统计数据:(1)请利用所给数据求不“礼让行人”驾驶员人数y 与月份x 之间的经验回归方程y ^=b ^x+a ^,并预测该路口2021年10月不“礼让行人”驾驶员的大约人数(四舍五入);(2)交警从这4个月内通过该路口的驾驶员中随机抽查50人,调查驾驶员不“礼让行人”行为与驾龄的关系,得到下表:依据小概率值α=0.10的独立性检验,分析“礼让行人”行为是否与驾龄有关.参考公式:b ^=∑i=1nx i y i -nx y ∑i=1nx i 2-nx2=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2.χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.3.(2021·河北石家庄二模改编)某地区在2020年底全面建成小康社会,随着实施乡村振兴战略规划,该地区农村居民的收入逐渐增加,可支配消费支出也逐年增加.该地区统计了2016~2020年农村居民人均消费支出情况,对有关数据处理后,制作如图1的折线图[其中变量y (单位:万元)表示该地区农村居民人均年消费支出,年份用变量t 表示,其取值依次为1,2,3,…].(1)由图1可知,变量y与t具有很强的线性相关关系,求y关于t的经验回归方程,并预测2021年该地区农村居民人均消费支出;2016~2020年该地区农村居民人均消费支出图1(2)在国际上,常用恩格尔系数(其含义是指食品类支出总额占个人消费支出总额的比重)来衡量一个国家和地区人民生活水平的状况.根据联合国粮农组织的标准:恩格尔系数在40%~50%为小康,30%~40%为富裕.已知2020年该地区农村居民平均消费支出构成如图2所示,预测2021年该地区农村居民食品类支出比2020年增长3%,从恩格尔系数判断2021年底该地区农村居民生活水平能否达到富裕生活标准.2020年该地区农村居民人均消费支出构成图2参考公式:经验回归方程y ^=b ^x+a ^中斜率和截距的最小二乘估计分别为:b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2=∑i=1nx i y i -nx y∑i=1nx i 2-nx 2,a ^=y −b ^x .4.(2021·山东潍坊一模)在对人体的脂肪含量和年龄之间的关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据(x i ,y i )(i=1,2,…,20,25<x i <65),其中x i 表示年龄,y i 表示脂肪含量,并计算得到∑i=120x i 2=48 280,∑i=120y i 2=15 480,∑i=120x i y i =27 220,x =48,y =27,√22≈4.7.(1)请用样本相关系数说明该组数据中y 与x 之间的关系可用线性回归模型进行拟合,并求y 关于x的经验回归方程y ^=a ^+b ^x (a ^,b ^的计算结果保留两位小数);(2)科学健身能降低人体脂肪含量,下表是甲、乙两款健身器材的使用年限(整年)统计表:某健身机构准备购进其中一款健身器材,以使用年限的频率估计概率,请根据以上数据估计,该机构选择购买哪一款健身器材,才能使用更长久?参考公式:样本相关系数r=∑i=1n(x i -x)(y i -y)√∑i=1n (x i -x)2√∑i=1n(y i -y)2=∑i=1nx i y i -nx y√∑i=1nx i 2-nx 2√∑i=1ny i 2-ny 2;对于一组具有线性相关关系的数据(x i ,y i )(i=1,2,…,n ),其经验回归直线y ^=b ^x+a ^的斜率和截距的最小二乘估计分别为:b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2,a ^=y −b ^x .答案及解析1.解 (1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21.产值负增长的企业频率为2100=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)y =1100(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30, s 2=1100[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.029 6, s=√0.029 6=0.02×√74≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17. 2.解 (1)由表中数据易知:x =1+2+3+44=52,y =125+105+100+904=105,则b ^=∑i=14x i y i -4x y∑i=14x i 2-4x2=995−1 05030−25=-11,a ^=y −b ^ x =105-(-11)×52=132.5,故所求经验回归方程为y ^=-11x+132.5.令x=10,则y ^=-11×10+132.5=22.5≈23(人),预测该路口10月份不“礼让行人”的驾驶员大约人数为23. (2)零假设为H 0:“礼让行人”行为与驾龄无关.由表中数据可得χ2=50×(10×12−20×8)218×32×30×20≈0.23<2.706=x 0.10,依据小概率值α=0.10的独立性检验,没有充分证据推断H 0不成立,可以认为H 0成立,即认为“礼让行人”行为与驾龄无关.3.解 (1)由已知数据可求t =1+2+3+4+55=3, y =1.01+1.10+1.21+1.33+1.405=1.21,∑i=15t i 2=12+22+32+42+52=55,∑i=15t i y i =1×1.01+2×1.10+3×1.21+4×1.33+5×1.40=19.16,b ^=19.16−5×3×1.2155−5×32=1.0110=0.101,a ^=1.21-0.101×3=0.907,所求经验回归方程为y ^=0.101t+0.907. 当t=6时,y ^=0.101×6+0.907=1.513(万元),故2021年该地区农村居民人均消费支出约为1.513万元.(2)已知2021年该地区农村居民平均消费支出1.513万元,由图2可知,2020年该地区农村居民食品类支出为4 451元,则预测2021年该地区食品类支出为4 451×(1+3%)=4 584.53元,恩格尔系数=4 584.5315 130×100%≈30.3%∈(30%,40%),所以,2021年底该地区农村居民生活水平能达到富裕生活标准.4.解 (1)x 2=2 304,y2=729,∑i=120x i y i -20x y =1 300,∑i=120x i 2-20x 2=2 200,∑i=1ny i 2-20y 2=900,r=∑i=120x i y i -20x y√∑i=120x i 2-20x 2√∑i=1ny i 2-20y2≈0.92,因为y 与x 的样本相关系数接近1,所以y 与x 之间具有较强的线性相关关系,可用线性回归模型进行拟合.由题可得,b ^=∑i=120(x i -x)(y i -y)∑i=120(x i -x)2=∑i=120x i y i -20x y∑i=120x i 2-20x2=1322≈0.591,a ^=y −b ^ x =27-0.591×48≈-1.37,所以y ^=0.59x-1.37.(2)以频率估计概率,设甲款健身器材使用年限为X (单位:年).E (X )=5×0.1+6×0.4+7×0.3+8×0.2=6.6. 设乙款健身器材使用年限为Y (单位:年).E (Y )=5×0.3+6×0.4+7×0.2+8×0.1=6.1.因为E (X )>E (Y ),所以该健身机构购买甲款健身器材更划算.。

2020版高考数学大二轮复习7.3统计与统计案例学案理

2020版高考数学大二轮复习7.3统计与统计案例学案理

第3讲统计与统计案例考点1 抽样方法1.简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体较少.2.系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多.3.分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成.[例1] (1)[2019·福州市高中毕业班质量检测]为了解某地区的“微信健步走”活动情况,拟从该地区的人群中抽取部分人员进行调查,事先已了解到该地区老、中、青三个年龄段人员的“微信健步走”活动情况有较大差异,而男女“微信健步走”活动情况差异不大.在下面的抽样方法中,最合理的抽样方法是( )A.简单随机抽样 B.按性别分层抽样C.按年龄段分层抽样 D.系统抽样(2)[2019·全国卷Ⅲ]《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( )A.0.5 B.0.6C.0.7 D.0.8【解析】(1)根据分层抽样的特点,应选C.(2)本题主要考查韦恩图的应用与概率问题,考查考生的阅读理解能力,考查的核心素养是数学抽象、逻辑推理、数据分析.根据题意阅读过《红楼梦》《西游记》的人数用韦恩图表示如下:所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为70100=0.7. 【答案】(1)C (2)C(1)随机抽样各种方法中,每个个体被抽到的概率都是相等的; (2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同;(3)分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例.『对接训练』1.[2019·河北枣强中学期末]总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第6个数字开始向右读(每两个连续数字组成一个编号),则选出来的第5个个体的编号为( )21 16 65 08 90 34 20 76 43 81 26 34 91 64 17 50 71 59 45 06 91 27 35 36 80 72 74 67 21 33 50 25 83 12 02 76 11 87 05 26 A .12 B .07 C .15 D .16解析:从随机数表第1行的第6个数字开始由左到右依次选取两个数字中小于20的编号依次为03,07,12,16,07,15,其中第二个和第五个都是07,重复,所以选出的5个个体的编号为03,07,12,16,15,则第5个个体的编号为15.故选C.答案:C2.[2019·惠州市高三第二次调研]某班共有56人,学号依次为1,2,3,…,56,现用系统抽样的方法抽取一个容量为4的样本,已知学号为2,30,44的同学在样本中,则样本中还有一位同学的学号为________.解析:由题意得,需要将56人按学号从小到大分成4组,每组抽取第2个学号对应的同学,所以还有一位同学的学号为1×14+2=16.答案:16考点2 用样本估计总体1.频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率组距.2.频率分布直方图中各小长方形的面积之和为1. 3.利用频率分布直方图求众数、中位数与平均数利用频率分布直方图求众数、中位数和平均数时易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数; (2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.[例2] (1)[2018·江苏卷]已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________;(2)[2017·全国卷Ⅰ]为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg)分别为x 1,x 2,…,xn ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A .x 1,x 2,…,xn 的平均数B .x 1,x 2,…,xn 的标准差C .x 1,x 2,…,xn 的最大值D .x 1,x 2,…,xn 的中位数【解析】 (1)这5位裁判打出的分数分别是89,89,90,91,91,因此这5位裁判打出的分数的平均数为89+89+90+91+915=90.(2)因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.【答案】 (1)90 (2)B众数、中位数、平均数与直方图的关系(1)众数为频率分布直方图中最高矩形的底边中点的横坐标.(2)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标. (3)平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之积的和.『对接训练』3.[2019·河北石家庄模拟]已知甲、乙两名篮球运动员进行罚球训练,每人练习10组,每组罚球40个,每组投中个数的茎叶图如图所示,则下列结论错误的是( )A .甲投中个数的极差是29B .乙投中个数的众数是21C .甲的投中率比乙高D .甲投中个数的中位数是25解析:由茎叶图可知甲投中个数的极差为37-8=29,故A 正确;易知乙投中个数的众数是21,故B 正确;甲的投中率为8+12+13+20+22+24+25+26+27+3740×10=0.535,乙的投中率为9+11+13+14+18+19+20+21+21+2340×10=0.422 5,所以甲的投中率比乙高,C 正确;甲投中个数的中位数为22+242=23,D 不正确.故选D.答案:D4.[2019·河北衡水中学五调]某“跑团”为了解团队每月跑步的平均里程,收集并整理了2018年1月至2018年11月期间“跑团”每月跑步的平均里程(单位:千米)的数据,绘制了下面的折线图.根据折线图,下列结论正确的是( )A .月跑步平均里程的中位数为6月份对应的平均里程数B .月跑步平均里程逐月增加C .月跑步平均里程高峰期大致在8月和9月D .1月至5月的月跑步平均里程相对于6月至11月,波动性更小,变化比较平稳 解析:由折线图知,月跑步平均里程的中位数为5月份对应的平均里程数,A 错;月跑步平均里程不是逐月增加的,B 错;月跑步平均里程高峰期大致在9月和10月,C 错.故选D.答案:D考点3 变量的相关性与统计案例1.线性回归方程方程y ^=b ^x +a ^称为线性回归方程,其中b ^=∑i =1nx i y i -n x -y-∑i =1nx 2i -n x-2,a ^=y --b ^x -;(x -,y -)称为样本中心点.2.随机变量K 2(χ2)=(a +b +c +d )(ad -bc )2(a +b )(c +d )(a +c )(b +d ),若K 2(χ2)>3.841,则有95%的把握说两个事件有关; 若K 2(χ2)>6.635,则有99%的把握说两个事件有关.[例3] [2019·全国卷Ⅰ]某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:(1)(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).【解析】 象概括能力与数据处理能力,重点考查数学抽象、数据分析、数学运算的核心素养;倡导学生关注生活,提高数学应用意识.(1)由调查数据知,男顾客中对该商场服务满意的比率为4050=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为3050=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6.(2)K 2=100×(40×20-30×10)250×50×70×30≈4.762.由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.(1)求回归直线方程的关键①正确理解计算b ^,a ^的公式和准确的计算.②在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.(2)独立性检验的关键①根据2×2列联表准确计算K2,若2×2列联表没有列出来,要先列出此表.②K2的观测值k越大,对应假设事件H0成立的概率越小,H0不成立的概率越大.『对接训练』5.[2019·福建福州二检]中国房地产业协会主办的中国房价行情网调查的一份数据显示,2018年7月,大部分一线城市的房租租金同比涨幅都在10%以上.某部门研究认为,房租支出超过月收入13的租户“幸福指数”低,房租支出不超过月收入13的租户“幸福指数”高.为了了解甲、乙两个小区的租户的“幸福指数”的高低,随机抽取甲、乙两个小区租户各100户进行调查.甲小区租户的月收入(单位:千元)以[0,3),[3,6),[6,9),[9,12),[12,15]分组的频率分布直方图如图.乙小区租户的月收入(单位:千元)的频数分布表如下.(2)若甲、乙两个小区每户的月租费分别为2千元、1千元.请根据条件,完成下面的2×2列联表,并说明能否在犯错误的概率不超过0.001的前提下认为“‘幸福指数’高低与租住的小区有关”.附:K 2=n (ad -(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .解析:(1)设甲小区所抽取的100户租户的月收入的中位数为t , 则0.060×3+(t -3)×0.160=0.5,解得t =5. (2)完成2×2列联表如下.根据2×2可得K 2的观测值k =200×(66×62-38×34)2104×96×100×100≈15.705>10.828,所以能在犯错误的概率不超过0.001的前提下认为“‘幸福指数’高低与租住的小区有关”.课时作业19 统计与统计案例1.[2019·湖南五市十校联考]在某次赛车中,50名参赛选手的成绩(单位:min)全部介于13到18之间(包括13和18),将比赛成绩分为五组:第一组[13,14),第二组[14,15),…,第五组[17,18].其频率分布直方图如图所示,若成绩在[13,15)内的选手可获奖,则这50名选手中获奖的人数为( )A.39 B.35C.15 D.11解析:由频率分布直方图知成绩在[15,18]内的频率为(0.38+0.32+0.08)×1=0.78,所以成绩在[13,15)内的频率为1-0.78=0.22,则成绩在[13,15)内的选手有50×0.22=11(人),即这50名选手中获奖的人数为11,故选D.答案:D2.[2019·湖北黄冈期末]为了调查学生对某项新政策的了解情况,准备从某校高一A,B,C三个班级中抽取10名学生进行调查.已知A,B,C三个班级的学生人数分别为40,30,30.考虑使用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按A,B,C三个班级依次统一编号为1,2,…,100;使用系统抽样时,将学生按A,B,C三个班级依次统一编号为1,2,…,100,并将所有编号依次平均分为10组.如果抽得的号码有下列四种情况:①7,17,27,37,47,57,67,77,87,97;②3,9,15,33,43,53,65,75,85,95;③9,19,29,39,49,59,69,79,89,99;④2,12,22,32,42,52,62,73,83,96.关于上述样本的下列结论中,正确的是( )A.①③都可能为分层抽样 B.②④都不能为分层抽样C.①④都可能为系统抽样 D.②③都不能为系统抽样解析:对于①,既满足系统抽样的数据特征,又满足分层抽样的数据特征,所以可能是分层抽样或系统抽样;对于②,只满足分层抽样的数据特征,所以可能是分层抽样;对于③,既满足系统抽样的数据特征,又满足分层抽样的数据特征,所以可能是分层抽样或系统抽样;对于④,只满足分层抽样的数据特征,所以可能是分层抽样.故选A.答案:A3.[2019·广东惠州一调]已知数据x1,x2,…,x10,2的平均值为2,方差为1,则数据x1,x2,…,x10相对于原数据( )A.一样稳定 B.变得稳定C.变得不稳定 D.稳定性不可以判断解析:数据x 1,x 2,…,x 10,2的平均值为2,方差为1,故111[(x 1-2)2+(x 2-2)2+…+(x 10-2)2+(2-2)2]=1,数据x 1,x 2,…x 10的方差s 2=110[(x 1-2)2+(x 2-2)2+…+(x 10-2)2]>1,故相对于原数据变得不稳定,故选C.答案:C4.[2019·陕西商洛质检]在一次53.5千米的自行车个人赛中,25名参赛选手成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为1~25号,再用系统抽样的方法从中选取5人,已知选手甲的成绩为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为( )A.95 B .96 C .97 D .98解析:由系统抽样法及已知条件可知被选中的其他4人的成绩分别是88,94,99,107,故平均数为88+94+99+1074=97,故选C.答案:C5.[2019·湖北重点高中协作体联考]某镇有A ,B ,C 三个村,它们的人口数量之比为,现在用分层抽样的方法抽出容量为n 的样本,样本中A 村有15人,则样本容量为( )A .50B .60C .70D .80解析:设A ,B ,C 三个村的人口数量分别为3x,4x,7x ,则由题意可得3x 15=3x +4x +7xn ,解得n =70,故选C.答案:C6.[2019·云南昆明诊断]某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:A .利润率与人均销售额成正相关关系B .利润率与人均销售额成负相关关系C .利润率与人均销售额成正比例函数关系D .利润率与人均销售额成反比例函数关系解析:画出利润率与人均销售额的散点图,如图.由图可知利润率与人均销售额成正相关关系.故选A.答案:A7.[2019·河南濮阳摸底]根据如表数据,得到的回归方程为y ^=b ^x +9,则b ^=( )A.2 B .1 C .0 D .-1解析:由题意可得x -=15×(4+5+6+7+8)=6,y -=15×(5+4+3+2+1)=3,因为回归方程为y ^=b ^x +9且回归直线过点(6,3),所以3=6b ^+9,解得b ^=-1,故选D.答案:D8.[2019·宁夏银川一中月考]利用独立性检验的方法调查大学生的性别与爱好某项运动是否有关,通过随机询问110名不同的大学生是否爱好该项运动,得到2×2列联表,并计算可得K 2≈8.806.A .有99.5%以上的把握认为“是否爱好该项运动与性别无关”B .有99.5%以上的把握认为“是否爱好该项运动与性别有关”C .在犯错误的概率不超过0.05%的前提下,认为“是否爱好该项运动与性别有关”D .在犯错误的概率不超过0.05%的前提下,认为“是否爱好该项运动与性别无关” 解析:由于8.806>7.879,所以根据独立性检验的知识可知有99.5%以上的把握认为“是否爱好该项运动与性别有关”,故选B.答案:B9.[2019·安徽六安毛坦厂中学月考]某位教师2017年的家庭总收入为80 000元,各种用途占比统计如下面的折线图.2018年收入的各种用途占比统计如下面的条形图,已知2018年的就医费用比2017年增加了4 750元,则该教师2018年的家庭总收入为( )A .100 000元B .95 000元C .90 000元D .85 000元解析:由已知得,2017年的就医费用为80 000×10%=8 000(元),故2018年的就医费用为8 000+4 750=12 750(元),所以该教师2018年的家庭总收入为12 75015%=85 000(元).故选D.答案:D10.[2019·华中师范大学第一附属中学期末]给出下列结论:①某学校从编号依次为001,002,…,900的900个学生中用系统抽样的方法抽取一个样本,已知样本中有两个相邻的编号分别为053,098,则样本中最大的编号为862;②甲组数据的方差为5,乙组数据为5,6,9,10,5,那么这两组数据中甲组数据比较稳定; ③两个变量的线性相关性越强,则相关系数r 的值越接近于1; ④对A ,B ,C 三种个体按 ::2的比例进行分层抽样调查,若抽取的A 种个体有15个,则样本容量为30.则正确的个数是( ) A .3 B .2 C .1 D .0解析:①中,样本中相邻的两个编号为053,098,则样本组距为98-53=45,所以样本容量为90045=20,则样本中最大的编号为53+45×(20-2)=863,故①错误;②中,乙组数据的平均数为5+6+9+10+55=7,所以乙组数据的方差为15×[(5-7)2+(6-7)2+(9-7)2+(10-7)2+(5-7)2]=4.4<5,那么这两组数据中乙组数据比较稳定,故②错误;③中,两个变量的线性相关性越强,则相关系数r 的绝对值越接近于1,故③错误;④中,易知样本容量为15÷33+1+2=30,故④正确.综上,选C.答案:C11.[2019·福建三明质检]某校为了解学生的身体素质情况,采用按年级分层抽样的方法,从高一、高二、高三年级的学生中抽取一个300人的样本进行调查,已知高一、高二、高三年级的学生人数之比为k ::4,抽取的样本中高一年级的学生有120人,则实数k的值为________.解析:由题意可得,120300=kk +5+4,解得k =6.答案:612.[2019·河北六校联考]在一次53.5千米的自行车个人赛中,25名参赛选手的成绩(单位:分)的茎叶图如图所示,若用简单随机抽样的方法从中选取2人,则这2人成绩的平均数恰为100的概率为________.解析:根据题意知,从25人中选取2人,基本事件的总数为C 225=300,其中这2人成绩的平均数恰为100的基本事件为(100,100),(95,105),(95,105),(95,105),(94,106),(93,107),共6个,所以所求的概率P =6300=150.答案:15013.某炼钢厂废品率x (%)与成本y (元/t)的线性回归方程为y ^=105.492+42.569x .当成本控制在176.5元/t 时,可以预计生产的1 000 t 钢中,约有________t 钢是废品.解析:因为176.5=105.492+42.569x ,所以x ≈1.668,即成本控制在176.5元/t 时,废品率为1.668%.所以生产的1 000 t 钢中,约有1 000×1.668%=16.68 t 钢是废品. 答案:16.6814.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H 0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K 2≈3.918,经查临界值表知P (K 2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.①有95%的把握认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的有效率为5%.解析:K2≈3.918≥3.841,而P(K2≥3.841)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”.要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆.答案:①15.[2019·湖南四校摸底调研]某家电公司销售部门共有200名销售员,每年部门对每名销售员都有 1 400万元的年度销售任务.已知这200名销售员去年的销售额都在区间[2,22](单位:百万元)内,现将其分成5组,第1组、第2组、第3组、第4组、第5组对应的区间分别为[2,6),[6,10),[10,14),[14,18),[18,22],并绘制出如下的频率分布直方图.(1)求a的值,并计算完成年度任务的人数;(2)用分层抽样的方法从这200名销售员中抽取容量为25的样本,求这5组分别应抽取的人数;(3)现从(2)中完成年度任务的销售员中随机选取2名,奖励海南三亚三日游,求获得此奖励的2名销售员在同一组的概率.解析:(1)∵(0.02+0.08+0.09+2a)×4=1,∴a=0.03,∴完成年度任务的人数为2×0.03×4×200=48.(2)第1组应抽取的人数为0.02×4×25=2,第2组应抽取的人数为0.08×4×25=8,第3组应抽取的人数为0.09×4×25=9,第4组应抽取的人数为0.03×4×25=3,第5组应抽取的人数为0.03×4×25=3,(3)在(2)中完成年度任务的销售员中,第4组有3人,记这3人分别为A1,A2,A3;第5组有3人,记这3人分别为B1,B2,B3.从这6人中随机选取2名,所有的基本事件为A1A2,A1A3,A1B1,A1B2,A1B3,A2A3,A2B1,A2B2,A2B3,A3B1,A3B2,A3B3,B1B2,B1B3,B2B3,共有15个基本事件,获得此奖励的2名销售员在同一组所包含的基本事件有6个, 故所求概率P =615=25.16.[2019·河南封一调]近年来我国电子商务行业迎来蓬勃发展的新机遇,2018年双十一期间,某购物平台的成交额为两千亿元人民币之多.与此同时,相关管理部门推出了针对电商的商品和服务的评价体系,现从评价系统中选出200次成功交易,并对其评价进行统计,商品的好评率为60%,服务的好评率为75%,其中对商品和服务都做出好评的交易为80次.(1)完成下面的2×2列联表,并回答是否有99%的把握认为商品好评与服务好评有关.(2)的次数为随机变量X ,求X 的数学期望和方差.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .K 2=200×(150×50×120×80≈11.111>6.635,故有99%的把握认为商品好评与服务好评有关.(2)∵X ~B ⎝ ⎛⎭⎪⎫3,25, ∴E (X )=3×25=65,D (X )=3×25×35=1825.17.[2019·重庆九校联盟一模]某社区为了解该社区退休老人每天的平均户外活动时间,从该社区退休老人中随机抽取了100位老人进行调查,获得了每人每天的平均户外活动时间(单位:时),活动时间按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成样本的频率分布直方图如图所示.(1)求图中a 的值;(2)估计该社区退休老人每人每天的平均户外活动时间的中位数;(3)在[1,1.5),[1.5,2)这两组中采用分层抽样的方法抽取7人,再从这7人中随机抽取2人,求抽取的2人恰好在同一个组的概率.解析:(1)由频率分布直方图,可知平均户外活动时间在[0,0.5)内的频率为0.08×0.5=0.04.同理,平均户外活动时间在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]内的频率分别为0.08,0.20,0.25,0.07,0.04,0.02,由1-(0.04+0.08+0.20+0.25+0.07+0.04+0.02)=0.5a +0.5a , 解得a =0.30. (2)设中位数为m 时.因为前5组的频率之和为0.04+0.08+0.15+0.20+0.25=0.72>0.5, 而前4组的频率之和为0.04+0.08+0.15+0.20=0.47<0.5,所以2≤m <2.5. 所以0.50×(m -2)=0.5-0.47,解得m =2.06.故可估计该社区退休老人每人每天的平均户外活动时间的中位数为2.06时. (3)由题意得平均户外活动时间在[1,1.5),[1.5,2)内的人数分别为15,20,按分层抽样的方法在[1,1.5),[1.5,2)内分别抽取3人、4人,从7人中随机抽取2人,共有C 27=21种方法,抽取的两人恰好都在同一个组有C 24+C 23=9种方法,故抽取的2人恰好在同一个组的概率P =921=37.18.[2019·福建三明月考]统计学中经常用环比、同比来进行数据比较.环比是指本期统计数据与上期比较,如2017年7月与2017年6月相比.环比增长率=本期数-上期数上期数×100%,同比增长率=本期数-同期数同期数×100%.下表是某地区近17个月来的消费者信心指数的统计数据:②除2017年1月外,该地区消费者信心指数月环比增长率为负数的有几个月? (2)由以上数据可判断,序号x 与该地区消费者信心指数y 具有线性相关关系,求出y 关于x 的线性回归方程y ^=b ^x +a ^(a ^,b ^保留2位小数),并依此预测该地区2018年6月的消费者信心指数(结果保留1位小数).参考数据与公式:∑i =117x i y i =18 068.5,∑i =117x 2i=1 785,x -=9,y -≈115,b ^=,a ^=y --b ^x -.解析:(1)①该地区2018年5月消费者信心指数的同比增长率为124-112.6112.6×100%≈10%.②若月环比增长率为负数,则本期数<上期数,从表中可以看出,2017年3月、2017年6月、2017年8月、2018年2月、2018年4月共5个月的月环比增长率为负数.(2)由已知,得,a ^=y --b ^x -=104.56,∴线性回归方程为y ^=1.16x +104.56.当x =18时,y ^=125.4,故该地区2018年6月的消费者信心指数约为125.4.。

2020版高三数学二轮复习(全国理)讲义:专题七第一讲统计与统计案例

2020版高三数学二轮复习(全国理)讲义:专题七第一讲统计与统计案例
2.统计图表
(1)在频率分布直方图中:
①各小矩形的面积表示相应各组的频率.各小矩形的高= ;②各小矩形面积之和等于1;③中位数左右两侧的直方图面积相等.因此可以估计其近似值.
(2)茎叶图
3.样本的数字特征
(1)众数:在样本数据中.出现次数最多的那个数据.
中位数:样本数据中.将数据按大小排列.位于最中间的数据.如果数据的个数为偶数.就取中间两个数据的平均数作为中位数;
[0.4.0.5)
[0.5.0.6)
频数
1
5
13
10
16
5
(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图.
(2)估计该家庭使用节水龙头后.日用水量小于0.35 m3的概率.
(3)估计该家庭使用节水龙头后.一年能节省多少水?(一年按365天计算.同一组中的数据以这组数据所在区间中点的值作代表.)
P
0.050
0.010
0.001
k0
3.841
6.635
10.828
[解析](1)第二种生产方式的效率更高.
理由如下:
方法一:由茎叶图可知:用第一种生产方式的工人中.有75%的工人完成生产任务所需时间至少80 min.用第二种生产方式的工人中.有75%的工人完成生产任务所需时间至多79 min.因此第二种生产方式的效率更高.
『规律总结』
系统抽样与分层抽样的求解方法
(1)系统抽样的最基本特征是“等距性”.每组内所抽取的号码需要依据第一组抽取的号码和组距唯一确定.每组抽取样本的号码依次构成一个以第一组抽取的号码m为首项.组距d为公差的等差数列{an}.第k组抽取样本的号码ak=m+(k-1)d.
(2)分层抽样的关键是根据样本特征差异进行分层.实质是等比例抽样.求解此类问题需先求出抽样比——样本容量与总体容量的比.则各层所抽取的样本容量等于该层个体总数与抽样比的乘积.在每层抽样时.应采用简单随机抽样或系统抽样进行.

2020版高考数学大二轮培优理科通用版能力升级练:(十二) 统计与统计案例

2020版高考数学大二轮培优理科通用版能力升级练:(十二) 统计与统计案例

能力升级练(十二) 统计与统计案例一、选择题1.某班对八校联考成绩进行分析,利用随机数法抽取样本时,先将60个同学按01,02,03,…,60进行编号,然后从随机数表第9行第5列的数开始向右读,则选出的第6个个体的编号是( )(注:下表为随机数表的第8行和第9行)6301 6378 5916 9555 6719 9810 5071 7512 8673 5807 4439 5238 793321 1234 2978 6456 0782 5242 0744 3815 5100 1342 9966 0279 54A.07B.25C.42D.52,依次选出的个体分别是12,34,29,56,07,52,因此选出的第6个个体的编号是52.2.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数.3.(2019云南昆明模拟)AQI(空气质量指数)是报告每日空气质量的参数,描述了空气清洁或污染的程度. AQI共分六级,从一级优(0~50);二级良(51~100);三级轻度污染(101~150);四级中度污染(151~200);直至五级重度污染(201~300);六级严重污染(大于300).如图是昆明市2017年4月份随机抽取10天的AQI 茎叶图,利用该样本估计昆明市2019年4月份空气质量优的天数为( )A.3B.4C.12D.2110天中有4天空气质量为优,所以空气质量为优的频率为,所以估计昆明市410=252019年4月份空气质量为优的天数为30×=12,故选C .254.对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为( )A.5B.7C.10D.50,三等品的频率为1-(0.050 0+0.062 5+0.037 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50.5.(2019广西桂林、百色、梧州、崇左、北海五市联考)如图是2017年第一季度A,B,C,D,E 五省GDP 情况图,则下列陈述正确的是( )①2017年第一季度GDP 总量和增速均居同一位的省只有1个;②与去年同期相比,2017年第一季度五个省的GDP 总量均实现了增长;③去年同期的GDP 总量前三位是D 省、B 省、A 省;④2016年同期A 省的GDP 总量也是第三位.A.①② B.②③④C.②④D.①③④2017年第一季度GDP 总量和增速均居同一位的省有2个,B 省和C 省的GDP 总量和增速分别居第一位和第四位,故①错误;由图知②正确;由图计算2016年同期五省的GDP 总量,可知前三位为D 省、B 省、A 省,故③正确;由③知2016年同期A 省的GDP 总量是第三位,故④正确.故选B .6.某企业开展职工技能比赛,并从参赛职工中选1人参加该行业全国技能大赛.经过6轮选拔,甲、乙两人成绩突出,得分情况如茎叶图所示.若甲、乙两人的平均成绩分别是,则下列说法正确的是( )x 甲,x 乙A .,乙比甲成绩稳定,应该选乙参加比赛x 甲>x 乙B .,甲比乙成绩稳定,应该选甲参加比赛x 甲>x 乙C .,甲比乙成绩稳定,应该选甲参加比赛x 甲<x 乙D .,乙比甲成绩稳定,应该选乙参加比赛x 甲<x 乙=82,≈87,所以=72+78+79+85+86+926x 乙=78+86+88+88+91+936(100+16+9+9+16+100)≈41.67,(81+1+1+1+16+36)≈22.67,因为,所x 甲<x 乙.s 2甲=16s 2乙=16s 2乙<s 2甲以乙成绩比甲成绩稳定,应该选乙参加比赛.7.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C.则抽到的人中,做问卷B 的人数为( )A.7B.9C.10D.15=30,从而区间[451,750]包含的段数为=10,则编号落入区间9603275030‒45030[451,750]的人数为10人,即做问卷B 的人数为10.8.(2019北京燕博园质检)某超市从2018年甲、乙两种酸奶的日销售量(单位:箱)的数据中分别随机抽取100个,并按(0,10],(10,20],(20,30],(30,40],(40,50]分组,得到频率分布直方图如下:记甲种酸奶与乙种酸奶的日销售量(单位:箱)的方差分别为,则频率分布直方图中的a 的值及s 21,s 22的大小关系分别是( )s 21与s 22A.a=0.015, B.a=0.15,s 21<s 22s 21>s 22C.a=0.015, D.a=0.15,s 21>s 22s 21<s 22(0.020+0.010+0.030+a+0.025)×10=1,得a=0.015.根据频率分布直方图,图2中的数据较稳定,则.s 21>s 229.某省二线城市地铁正式开工建设,地铁时代的到来能否缓解该市的交通拥堵状况呢?某社团进行社会调查,得到的数据如下表:男性市民女性市民总计认为能缓解交通拥堵483078认为不能缓解交通拥堵122032总计6050110则下列结论正确的是( )附:K 2=n (ad -bc )2(a +b )(a +c )(b +d )(c +d )P (K 2≥k 0)0.050.0100.0050.001k 03.8416.6357.87910.828A.在犯错误的概率不超过0.05的前提下认为“对能否缓解交通拥堵的认识与性别有关”B.在犯错误的概率不超过0.05的前提下认为“对能否缓解交通拥堵的认识与性别无关”C.在犯错误的概率不超过0.01的前提下认为“对能否缓解交通拥堵的认识与性别有关”D.在犯错误的概率不超过0.01的前提下认为“对能否缓解交通拥堵的认识与性别无关”2×2列联表,可求K 2的观测值k=≈5.288>3.841.110(20×48-12×30)260×50×78×32由统计表P (K 2≥3.841)=0.05,∴在犯错误的概率不超过0.05的前提下认为“对能否缓解交通拥堵的认识与性别有关”.二、填空题10.(2018福建泉州模拟)某厂在生产甲产品的过程中,产量x (吨)与生产能耗y (吨)的对应数据如表:x 30405060y25354045根据最小二乘法求得回归方程为=0.65x+,当产量为80吨时,预计需要生产能耗为 吨.^y ^a,=45,=36.25,代入=0.65x+,可得=7,∴当产量为80吨时,预计需要生产能耗为x y ^y ^a ^a 0.65×80+7=59(吨).11.某同学在高三学年的五次阶段性考试中,数学成绩依次为110,114,121,119,126,则这组数据的方差是 .,方差不变,所以本题中可先对这5个数据同时减去110,得到新的数据分别为0,4,11,9,16,其平均数为8,根据方差公式可得s 2=[(0-8)2+(4-8)2+(11-8)2+(9-158)2+(16-8)2]=30.8..812.从编号为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量是5的样本,若编号为28的产品在样本中,则该样本中产品的最大编号为 .,共有80个产品,抽取5个样品,则可得组距为=16,又其中有1个为28,则805与之相邻的为12和44,故所取5个依次为12,28,44,60,76,即最大的为76.13.给出下列四个命题:①某班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中另一位同学的编号为23;②一组数据1,2,3,3,4,5的平均数、众数、中位数都相同;③若一组数据a ,0,1,2,3的平均数为1,则其标准差为2;④根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为x ,其中^y =^a +^b =2,=1,=3,则=1.^a x y ^b 其中真命题有 (填序号).①中,由系统抽样知抽样的分段间隔为52÷4=13,故抽取的样本的编号分别为7号、20号、33号、46号,故①是假命题;在②中,数据1,2,3,3,4,5的平均数为(1+2+3+3+4+5)=3,中位数为3,众数16为3,都相同,故②是真命题;在③中,因为样本的平均数为1,所以a+0+1+2+3=5,解得a=-1,故样本的方差为[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2,标准差为,故③是假命题;在④中,回归直线方程为152x+2,又回归直线过点(),把(1,3)代入回归直线方程+2,得=1,故④是真命题.^y =^b x ,y ^y =^bx ^b三、解答题14.某校为了解高一学生周末的“阅读时间”,从高一年级中随机抽取了100名学生进行调查,获得了每人的周末“阅读时间”(单位:小时),按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成样本的频率分布直方图如图所示:(1)求图中a 的值;(2)估计该校高一学生周末“阅读时间”的中位数;(3)用样本频率代替概率.现从全校高一年级随机抽取20名学生,其中有k 名学生“阅读时间”在[1,2.5)内的概率为P (X=k ),其中k=0,1,2,…,20.当P (X=k )最大时,求k 的值.由频率分布直方图可知,周末“阅读时间”在[0,0.5)内的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]内的频率分别为0.08,0.20,0.25,0.07,0.04,0.02,所以1-(0.04+0.08+0.20+0.25+0.07+0.04+0.02)=0.5a+0.5a ,解得a=0.30.(2)设该校高一学生周末“阅读时间”的中位数为m 小时.因为前5组的频率之和为0.04+0.08+0.15+0.20+0.25=0.72>0.5,而前4组的频率之和为0.04+0.08+0.15+0.20=0.47<0.5,所以2≤m<2.5.由0.5×(m-2)=0.5-0.47,解得m=2.06.故可估计该校高一学生周末“阅读时间”的中位数为2.06小时.(3)设在取出的20名学生中,周末“阅读时间”在[1,2.5)内的有X 人,则X 服从二项分布,即X~B (20,0.6),所以恰好有k 名学生周末“阅读时间”在[1,2.5)内的概率为P (X=k )=(0.6)k (0.4)20-k ,C k20其中k=0,1,2, (20)设t=,k=1,2, (20)P (X =k )P (X =k -1)=C k 20(0.6)k(0.4)20-k C k -120(0.6)k -1(0.4)21-k=3(21-k )2k若t>1,则k<12.6,P (X=k-1)<P (X=k );若t<1,则k>12.6,P (X=k-1)>P (X=k ).又<1,P (X =13)P (X =12)=3×(21-13)2×13=1213所以当k=12时,P (X=k )最大.所以k 的值为12.15.(2018陕西西安八校联考)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产件数是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100],分别加以统计,得到如图所示的频率分布直方图.25周岁以上(含25周岁)组25周岁以下组(1)根据“25周岁以上(含25周岁)组”的频率分布直方图,求25岁以上(含25周岁)组工人日平均生产件数的中位数的估计值(四舍五入保留整数);(2)规定日平均生产件数不少于80的工人为生产能手,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”.生产能手非生产能手合计25周岁以上(含25周岁)组25周岁以下组合计附:K 2=.n (a d -bc )2(a +b )(c +d )(a +c )(b +d )P (K 2≥k 0)0.1000.0500.0100.001k 02.7063.8416.63510.828,“25周岁以上(含25周岁)组”应抽取工人100×=60(名),“25周岁以下组”300300+200应抽取工人100×=40(名).200300+200(1)由“25周岁以上(含25周岁)组”的频率分布直方图可知,其中位数为70+10×=70+≈73(件).0.5-0.05-0.350.35207综上,25周岁以上(含25周岁)组工人日平均生产件数的中位数的估计值为73件.(2)由频率分布直方图可知,25周岁以上(含25周岁)的生产能手共有60×[(0.020 0+0.005 0)×10]=15(名),25周岁以下的生产能手共有40×[(0.032 5+0.005 0)×10]=15(名),则2×2列联表如下:生产能手非生产能手合计25周岁以上(含25周岁)组15456025周岁以下组152540合计3070100 K 2的观测值k=≈1.786<2.706,所以没有90%的把握认为“生产能手100×(15×25-15×45)260×40×30×70=2514与工人所在的年龄组有关”.。

(典型题)高考数学二轮复习知识点总结统计与统计案例.docx

(典型题)高考数学二轮复习知识点总结统计与统计案例.docx

统计与统计案例1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等; 有时也会在知识交汇点处命题,如概率与统计交汇等.2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题, 都属于屮低档题.1.随机抽样(1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少.(2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多.(3)分层抽样特点是将总体分成儿层,分层进行抽取,适用范围:总体由差异明显的儿部分组成.2.常用的统计图表(1)频率分布直方图、频率①小长方形的面积=组距X 忒=频率;②各小长方形的面积之和等于1;—频率1③小长方形的高=猛,所有小长方形的高的和为丽.(2)茎叶图在样本数据较少时,用茎叶图表示数据的效果较好.3.用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数一一一(2)方差:『=_[(/]—X )2+(A2—x )2------ (乙一x}2}.n标准崔X\— X 2+ X2— X 2 F X n — X 2]. 4. 变量的相关性与最小二乘法(1) 相关关系的概念、正相关和负相关、相关系数.(2) 最小二乘法:对于给定的一组样本数据(xi, yi ),(丸,乃),…,(尢,%),通过求0=工(yi —a —bx )'最小时,得到线性回归方程尸=加+日的方法叫做最小二乘法. /=15. 独立性检验对于取值分别是3,屈和5, y 』的分类变量尤和『,其样本频数列联表是:71Y2 总计ab a+b X2C d c+d 总计a+cb+dn则心宀 U+c W (•其中心++十为样本容量)•考点一抽样方法.例1. (2012・山东)采用系统抽样方法从960人屮抽取32人做问卷调查,为此将他们随机 编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到 的32人中,编号落入区间[1,450]的人做问卷编号落入区间[451, 750]的人做问卷B, 英余的人做问卷C 则抽到的人中,做问卷〃的人数为()9,39,69, 939.落入区间[451,750]的有459,489,729,这些数构成首项为459,公差为30的等差数列,设有刀项,显然有729 = 459+(/7—1)X30,解得刀=10.所以做 问卷〃的有10人.I 冋=f ■在系统抽样的过程屮,要注意分段间隔,需要抽取儿个个体,样本就需要分 成儿个组,则分段间隔即点N 为样本容量),首先确定在第一组中抽取的个体的号码 n数,再从后面的每组屮按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样 方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的, 都等于样本容量和总体容量的比值.A. 7B. 9 答案CC. 10D. 15解析由系统抽样的特点知:抽取号码的间隔为96032= 30,抽取的号码依次为因(1) (2013 •江西)总体由编号为01,02, 19,20的20个个体组成,利用下而的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()A. 08(2)某单位200名职工的年龄分布悄况如图所示,现要从中抽取40名职工作样本.用系统抽样法,将全体职工随机按1〜200编号,并按编号顺序平均分为40组仃〜5号,6〜10号,196〜200号).若第5组抽出的号码为22,则第8组抽出的号码应是.若用分层抽样方法,则40岁以下年龄段应抽収人.答案(1)D (2)37 20解析(1)从第1行第5列、第6列组成的数65开始由左到右依次选出的数为:08, 02, 14,07,01,所以第5个个体编号为01.(2)由分组可「知,抽号的间隔为5,又因为第5组抽出的号码为22,即第〃组抽取的号码为5/7—3,所以第8组抽出的号码为37;40岁以下年龄段的职工数为200X0. 5 = 100,40则应抽取的人数为丽X 100 = 20人.考点二用样本估计总体.例2. (1) (2013・四川)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为「5将数据分组成[0, 5), [5, 10),…,[30, 35), [35, 40] 时,所作的频率分布直方图是()(2) (2013 •江苏)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:坏),结果如下:则成绩较为稳定(方差较小)的那位运动员成绩的方差为_________ .答案(1)A (2)2解析(1)由于频率分布直方图的组距为5,去掉C、D,又[0, 5), [5,10)两组各一人,去掉B,应选A.— 1(2) 一卩==(87 + 91+90 + 89+93)=90,□—— 1x乙==(89 + 90 + 91+88 + 92) =90,b品=占[(87 — 90)?+(91-90)1 2+ (90-90)2+ (89-90)2+ (93-.90)2] =4,5s2=g[(89 —90尸+ (90-90)2+ (91-90)2+ (88-90)2+ (92-90)2] =2.5(1)反映样本数据分布的主要方式有:频率分布表、频率分布直方图、茎叶图.关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小, 高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的均值、众数和中位数、方差等.(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.在“2012魅力新安江”青少年才艺表演评比活动中,参赛选手成绩的茎叶图和频率分布直方图都受到不同程度的破坏,可见部分如图,据此回答以下问题:(2, 4), (2, 5), (2, 6), (3, 4), (3,5), (3, 6), (4, 5), (4, 6), (5, 6),共15 个,其中至少有一个在1 求参赛总人数和频率分布直方图中[80, 90)之间的矩形的高,并完成直方图;2 若要从分数在[80,100]之间任取两份进行分析,在抽取的结果中,求至少有一份分数在[90, 100]之间的概率.解(1)由茎叶图知,分数在[50, 60)之间的频数为2.由频率分布直方图知,分数在[50, 60)之间的频率为0. 008X10 = 0.0&2所以参赛总人数为両=25 (人).分数在[80, 90)之间的人数为25 — 2 — 7—10 — 2=4(人),4分数在[80,90)Z间的频率为亦=0・16,得频率分布直方图中[80, 90)间矩形的高为晋=0. 016.完成直方图,如图.(2)将[80, 90)之间的4个分数编号为1, 2, 3,4;[90, 100]之间的2个分数编号为5和6.则在[80,100]之间任取两份的基本事件为(1,2), (1,3), (1,4), (1,5), (1,6), (2, 3),[90,100]之间的基本事件为(1,5), (1,6), (2,5), (2, 6), (3, 5), (3, 6), (4, 5), (4, 6), (5, 6),共9 个.9 3故至少有一份分数在[90, 100] Z间的概率考点三统计案例.例3. (2013 •重庆)从某居民区随机抽取10个家庭,获得第,个家庭的月收入农(单位:千10 10 10 10元)与月储蓄匕(单位:千元)的数据资料,算得为上=80,为y,=20,为乂匕=1.84,为¥ /=1 /=12=1 2=1 7=720.(1)求家庭的月储蓄y对月收入/的线性回归方程y=bx+a,(2)判断变量龙与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.n _ _^XiYi—n x yi= I _ _____ _______ ___ 附:线性回归方程y= bx+ a中,b= ----------------- , a= y ~b x ,其中x , y为n __匸2 22^x~n x7=1样本平均值,线性回归方程也可写为y=bx+a.__ | n80解⑴由题意知〃=io, / =-yx=—=8, 刀「10又人=工£一〃^ 2=720-10X82 = 80,2 = 1厶》・=1>必一刀x y =184-10X8X2 = 24, /=i由此得力3,a=~-b T=2-0. 3X8=-0. 4,故所求线性回归方程为y=0. 3^-0. 4.(2)由于变量y的值随x值的增加而增加(方=0. 3>0),故/与F 之间是正相关.(3)将x=l 代入回归方程可以预测该家庭的月储蓄为y=0. 3X7-0. 4 = 1. 7(千元). (1)对具有线性相关关系的两个变量.可以用最小二乘法求线性回归方程,求方是关键,X XL X //— y ^Xiy —n x y■ /=1 J=1 其中b= ----------------------- = ---------------n __ n _ V 1 2 P 2 2 , Xi — x 2^Xi —n x /= i /= i⑵在利用统计•变量航进行独立性检验时,应该注意数值的准确代入和正确汁算, 最后把计算的结杲与有关临界值相比较.(1)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:附表:参照附表,得到的正确结论是()A. 在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B. 在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C. 有99%以上的把握认为“爱好该项运动与性別有关”D. 有99%以上的把握认为“爱好该项运动与性别无关”⑵已知x 、y 取值如下表:从所得的散点图分析可知:y 与x 线性相关,且y=0. 95^+a,则日等于()A. 1.30B. 1.45C. 1.65 0. 1.80EX60X50X60X50〜7.&答案(1)C (2)B解析(1)根据独立性检验的定义,由斤(塔)~7.8>6.635可知我们有99%以上的把握认为“爱好该项运动与性别有关”,故选C.—1(2)依题意得,x =^*X (0+1+4 + 5 + 6+8) =4,6—— 1y =-(1. 3 + 1. 8+5. 6 + 6. 1+7. 4 + 9. 3) =5. 25;又直线y=0.95/+自必过样本点中心(匸,~),即点(4, 5. 25),于是有5. 25 = 0. 95X4+日,由此解得曰=1.45.1.用样本估计总体(1)在频率分布直方图中,各小长方形的面积表示相应的频率,各小长方形的面积的和为1.(2)众数、屮位数及平均数的异同众数、屮位数及平均数都是描述一组数据集屮趋势的量,平均数是最重要的量.(3)当总体的个体数较少时,可直接分析总体取值的频率分布规律而得到总体分布;当总体容量很大时,通常从总体中抽取一个样本,分析它的频率分布,以此估计总体分布.—1 “①总体期望的估计,计算样本平均值X②总体方差(标准差)的估计:方差=2若](尢一% )2,标准差=7方差,方差(标准差)较小者较稳定.2.线性回归方程y =b x+a过样本点中心(匚,丁),这为求线性回归方程带来很多方便.3.独立性检验⑴作出2X2列联表.(2)计算随机变量#(疋)的值.(3)查临界值,检验作答.1.经问卷调查,某班学生对摄影分别持“喜欢”、“不喜欢”和“一般”三种态度,其中持“一般”态度的学生比持“不喜欢”的学生多12人,按分层抽样的方法(抽样过程中不需要剔除个体)从全班选出部分学生进行关于摄影的座谈.若抽样得出的9位同学屮有5位持“喜欢”态度的同学,1位持“不喜欢”态度的同学和3位持“一般”态度的同学,则全班持“喜欢”态度的同学人数为 ()A. 6B. 18C. 30D. 54答案C解析 由题意设全班学生为/人,持“喜欢”、“不喜欢”和“一般”态度的学生分别 占全班人数的害、*、所以%(|-|)=12,解得%=54,所以全班持“喜欢”态度的人 数为54X :=30.故选C.2. 某校从参加高三年级期中考试的学生中随机抽取60名学生,将其数学成绩(均为整数) 分成六段[40,50), [50,60),…,[90,100]后得到如图的频率分布直方图,请你根据频 率分布直方图中的信息,估计出本次考试数学成绩的平均分为 _______________ .答案71解析 由频率分布直方图得每一组的频率依次为0. 1, 0. 15, 0. 15, 0. 3, 0. 25, 0. 05,又由 频率分布直方图,得每一组数据的中点值依次为45, 55, 65, 75, 85, 95.所以本次考试数学成绩的平均分为匚=45X0. 1 +55X0. 15 + 65X0. 15 + 75X0.3 +85X0. 25+95X0. 05 = 71.故填71.随机抽取某川学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图.(1) 根据茎叶图判断哪个班的平均身高较高; (2) 计算甲班的样本方差;(3) 现从乙班这10名同学中随机抽取两名身高不低于173 cm的同学,求身高为176 cm 的同学被抽屮的概率.解(1)由茎叶图可知:甲班身高集中于160 cm 〜179 cm 之间,而乙班身高集中于170cm 〜180 cm 之间,因此乙班平均身高高于甲班,其中 — 158+162 + 163+168+168+170+171 + 179+179+182 x 甲== 170, —159+162 + 165+168 + 170+173 + 176+178+179+18110= 171. 1.(2)甲班的样本方差为±[(158 — 170)2+(]62_i70)2+ (163- 170)2+ (168~170)2 + (168-170)2+ (170-170)2+(171-170)2+ (179-170)2+ (179-170)2+ (182-170)2]甲班2 18 9 9 10 17 8 83 216 815 3. 10 乙班10 3 6 8 9 2 5 8 9= 57. 2.(3)设身高为176 cm 的同学被抽中的事件为/L从乙班10名同学中抽取两名身高不低于173 cm 的同学有:(181,173)、(181,176)、(181,178)、(181,179)、(179,173)、(179,176)、(179,178)、(178, 173)、(178,176)、 (176,173),共10个基本事件,而事件含有4个基本事件,(推荐时间:60分钟)一、选择题1. 要完成下列两项调查:①从某肉联厂的火腿肠生产线上抽取L 000根火腿肠进行“瘦 肉精”检测;②从某屮学的15名艺术特长生屮选出3人调查学习负担情况.适合采用 的抽样方法依次为()A. ①用分层抽样,②用简单随机抽样B. ①用系统抽样,②用简单随机抽样C. ①②都用系统抽样D. ①②都用简单随机抽样答案B解析 ①屮总体容量较大,且火腿肠Z 间没有明显差异,故适合采用系统抽样;②屮总 体容量偏小,故适合采用简单随机抽样.2. (2012・四川)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况, 对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为M 其屮 甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为 12, 21,25, 43,则这四个社区驾驶员的总人数艸为()A. 101B. 808C. 1 212D. 2 012答案B12解析由题意知抽样比为花,而四个社区一共抽取的驾驶员人数为12 + 21+25+43 = 101,故有||=¥,解得/V=808.3. (2013 •福建)某校从高一年级学生中随机抽取部分学生.,将他们的模块测试成绩分成6 组:[40,50), [50, 60), [60,70), [70, 80), [80, 90), [90,100]加以统计,得到如图 所示的频率分布直・・・P(A)=£2方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A. 588B. 480C. 450D. 120答案B解析少于60分的学生人数600X (0. 05 + 0. 15) = 120(人),・・・不少于60分的学生人数为480人.4.甲、乙两位运动员在5场比赛的得分情况如茎叶图所示,记甲、乙两人的平均得分分别为匚甲,匚乙,则下列判断正确的是()A.匚甲>7乙;甲比乙成绩稳定甲〉匚乙;乙比甲成绩稳定C. "7甲<7乙;甲比乙成绩稳定乙比甲成绩稳定答案D解析由茎叶图可知—17+16 + 28 + 30 + 34*,1,= 5 斗5,—15 + 28+26 + 28 + 33x乙= z =26,oX甲〈X乙.又昴=g[「(17—25尸+ (16-25)2+ (28-25)2+ (30-25)2+ (34-25)2] =52,s:=£[(15-26)2+ (28-26)2+ (26~26)2+ (28-26)2+ (33-26)2] =35. 6,・・・乙比甲成绩稳定.5.一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{/},若心=8,且越,彷成等比数列,则此样本的平均数和中位数分别是( )A. 13, 12B. 13, 13C. 12, 13D. 13, 14答案B解析设等差数列{/}的公差为〃(件0), $3=8,血戲=£=64, (8 — 2小(8+4小=64, (4 — / (2 +小=& 2〃一扌=0 ,又,故d = 2 ,故样本数据为+ 12 + 14 4,6, & 10, 12, 14, 16, 18,20,22,样本的平均数为------- ----- =13,中位数为一= 13,故选B.6.2011年6月,台湾爆出了食品添加有毒塑化剂的案件,令世人震惊.我国某研究所为此开发了一种用来检测塑化剂的新试剂,把500组添加了该试剂的食品与另外500组未添加该试剂的食品作比较,提出假设弘:“这种试剂不能起到检测出塑化剂的作用”,并计算出635)=0. 01.对此,四名同学做出了以下的判断:P:有99%的把握认为“这种试剂能起到检测出塑化的作用”;q:随意抽出一组食品,它有99%的可能性添加了塑化剂;z、:这种试剂能检测出塑化剂的有效率为99%;s:这种试剂能检测出塑化剂的有效率为1%.则下列命题中为真命题的是()A. p/\qB.絲pf\qC.(綁门/\繍g)/\ (八/s)D・(pV 1^) A (^J s)答案D解析提出假设拄“这种试剂不能起到检测出塑化剂的作用”,并计算出戶(於26. 635)=0.01,因此,在一定程度上说明假设不合理,我们就有99%的把握拒绝假设.由题设可知命题刀,厂为真命题,q, s为假命题,依据复合命题的真值表可知D 为真命题.二、填空题7.(2013 •湖北)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1) ________________________ 直方图屮x的值为;(2) ___________________________________________________ 在这些用户中,用电量落在区间[100, 250)内的户数为__________________________________ .答案(1)0.004 4 (2) 70解析(1)(0.002 4+0. 003 6 + 0. 006 0+x+0. 002 4 + 0. 001 2) X50 = l,・・」= 0.004 4.(2)(0. 003 6 + 0. 004 4+0. 006 0)X50X100=70.8.下表提供了某厂节能减排技术改造后在生产/产品过程屮记录的,产量*吨)与相应的生产能耗y(吨)的几组对应数据:根据上表提供的数据,求出F 关于x 的线性回归方程为y=0.7%+0.35,那么表中广的 值为 . 答案3解析二•样本点屮心为(4.5,耳勺, ・・・斗二=0. 7X4. 5+0. 35,解得 t='3.9. 某校高三考生参加某高校自主招生面试时,五位评委给分如下:9. 0 9. 18.9 9.2 8.8则五位评委给分的方差为 ________ . 答案0.02解析评委给分的平均数为|x (9. 0 + 9. 1 + & 9 + 9. 2 + & 8) =9. 0, □方差为[(9. 0-9. 0)2+ (9. 1 -9. 0)2+ (8. 9-9. 0)2+(9. 2-9. 0)2+ (8. 8-9. 0)2]=50. 1匕~=0. 02. 510. 某校开展“爱我海西、爱我家乡•”摄影比赛,9位评委为参赛作品 A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分 后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中 的x)无法看清,若 记分员计算无误,则数字x 应该是 __________ . 答案1"4, •严+ 刖 + 92 + 9吁92 + 9++90 = 9], •I /=1・三、解答题11. (2013 •陕西)有7位歌手(1至7号)参加一场歌唱比赛,由500名大众评委现场投票决定歌手名次,根据年龄将大众评委分为五组,各组的人数如下:(1)为了调查评委对7位歌手的支持情况,现用分层抽样方法从各组中抽取若干评委, 其中从〃组中抽取了 6人.请将其余各组抽取的人数填入下表.解析 当心时,叭叭吗畀92 + 91 + 9、字切,(2)在(1)中,若力,〃两组被抽到的评委中各有2人支持1号歌手,现从这两组被抽到的评委屮分别任选1人,求这2人都支持1号歌手的概率.解(1)由题设知,分层抽样的抽取比例为6%,所以各组抽取的人数如下表:b\,厶}屮各抽取1人的所有结果为:由以上树状图知所有结果共18种,其中2人都支持1号歌手的冇Si b\,日厶,,观厶4 9共4种,故所求概率7°=—=^.12.(2012 •辽宁)电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时I'可的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷” 有10名女性.(1)根据己知条件完成下面的2X2列联表,并据此资料你是否认为“体育迷”与性别有关?(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.0. 050.01 k3. 8416. 635解 ⑴由频率分布直方图可知,在抽収的100人中「体育迷”有25人,从而完成2X2 列联表如下:非体育迷体育迷 合计男 30 15 45 女 45 10 55 合计7525100将2X2列联表中的数据代入公式计算,得100=33 心3. 030.因为3. 030<3. 841,所以我们没有理由认为“体育迷”与性别有关.(2)由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的基本 事件空间为 Q={@1,戲),仙,3:i) ,(0,辺3),(0,方J , (21, &) , (^2, bl),(臼2, &),(日3, b\),(臼3,Z>2), (bi, &)},其中么表不男性,7 = 1, 2, 3,伤表不女性,j — 1, 2. Q 由10个基本事件组成,而且这些基本事件的出现是等可能的.用ZI 表示“任选2人中,至少有1人是女性”这一事件,则A= {(<<?], Z?l) , (&, bz),(日2, 5),(日2,血),@3, bl) , (t?3, bz) , (Z?l, bl)},事件/7rti 7个基本事件组成,因而P (A )=—附:75X25X45X55。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

专题突破练20 统计与统计案例1.(2019四川成都二模,理18)为了让税收政策更好地为社会发展服务,国家在修订《中华人民共和国个人所得税法》之后,发布了《个人所得税专项附加扣除暂行办法》,明确“专项附加扣除”就是子女教育、继续教育、大病医疗、住房贷款利息、住房租金、赡养老人等费用,并公布了相应的定额扣除标准,决定自2019年1月1日起施行.某企业为了调查内部职员对新个税方案的满意程度与年龄的关系,通过问卷调查,整理数据得如下2×2列联表:(1)根据列联表,能否有99%的把握认为满意程度与年龄有关?(2)为了帮助年龄在40岁以下的未购房的8名员工解决实际困难,该企业拟按员工贡献积分x(单位:分)给予相应的住房补贴y(单位:元),现有两种补贴方案,方案甲:y=1 000+700x;方案乙:y=已知这8名员工的贡献积分为2分,3分,6分,7分,7分,11分,12分,12分,将采用方案甲比采用方案乙获得更多补贴的员工记为“A类员工”.为了解员工对补贴方案的认可度,现从这8名员工中随机抽取4名进行面谈,求恰好抽到3名“A类员工”的概率.附:K2=-,其中n=a+b+c+d.参考数据:2.下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为 … 7 建立模型①;=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为 … 7 建立模型②:=99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.3.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:旧养殖法新养殖法(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).附:K2=-.4.为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:尺寸经计算得x i=9.97,s=-- ≈0.212,-≈18.439,(x i-)(i-8.5)=-2.78,其中x i为抽取的第i个零件的尺寸,i= … .(1)求(x i,i)(i= … 的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(2)一天内抽检零件中,如果出现了尺寸在(-3s,+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①从这一天抽检的结果看,是否需对当天的生产过程进行检查?②在(-3s,+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)--≈0.09.附:样本(x i,y i)(i= … n)的相关系数r=--5.(2019山东实验等四校联考,理19)随着科技的发展,网络已逐渐融入了人们的生活.网购是非常方便的购物方式,为了了解网购在我市的普及情况,某调查机构进行了有关网购的调查问卷,并从参与调查的市民中随机抽取了男女各100人进行分析,从而得到下表(单位:人).(1)完成上表,并根据以上数据判断能否在犯错误的概率不超过0.01的前提下认为我市市民网购与性别有关?(2)①现从所抽取的女市民中利用分层抽样的方法抽取10人,再从这10人中随机选取3人赠送优惠券,求选取的3人中至少有2人经常网购的概率;②将频率视为概率,从我市所有参与调查的市民中随机抽取10人赠送礼品,记其中经常网购的人数为X,求随机变量X的数学期望和方差.参考公式:K2=-,n=a+b+c+d.P(K2≥k0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001k02.072 2.706 3.841 5.024 6.635 7.879 10.8286.随着食品安全问题逐渐引起人们的重视,有机、健康的高端绿色蔬菜越来越受到消费者的欢迎,同时生产—运输—销售一体化的直销供应模式,不仅减少了成本,而且减去了蔬菜的二次污染等问题.(1)在有机蔬菜的种植过程中,有机肥料使用是必不可少的.根据统计某种有机蔬菜的产量与有机肥料的用量有关系,每个有机蔬菜大棚产量的增加量y(百斤)与使用堆沤肥料x(千克)之间对应数据如下表:依据表中的数据,用最小二乘法求出y关于x的线性回归方程x+;并根据所求线性回归方程,估计如果每个有机蔬菜大棚使用堆沤肥料10千克,则每个有机蔬菜大棚产量增加量y是多少百斤?(2)某大棚蔬菜种植基地将采摘的有机蔬菜以每份三斤称重并保鲜分装,以每份10元的价格销售到生鲜超市.“乐购”生鲜超市以每份15元的价格卖给顾客,如果当天前8小时卖不完,则超市通过促销以每份5元的价格卖给顾客(根据经验,当天能够把剩余的有机蔬菜都低价处理完毕,且处理完毕后,当天不再进货).该生鲜超市统计了100天有机蔬菜在每天的前8小时内的销售量(单位:份),制成如下表格(注:x,y∈N*,且x+y=30):若以100天记录的频率作为每日前8小时销售量发生的概率,该生鲜超市当天销售有机蔬菜利润的期望值为决策依据,当购进17份比购进18份的利润的期望值大时,求x的取值范围.-----.附:7.(2019陕西第二次质检,理18)某市场研究人员为了了解产业园引进的甲公司前期的经营状况,对该公司2018年连续6个月的利润进行了统计,并根据得到的数据绘制了相应的折线图,如图所示. (1)由折线图可以看出,可用线性回归模型拟合月利润y(单位:百万元)与月份代码x之间的关系,求y关于x的线性回归方程,并预测该公司2019年3月份的利润;(2)甲公司新研制了一款产品,需要采购一批新型材料,现有采购成本分别为10万元/包和12万元/包的A,B两种型号的新型材料可供选择,按规定每种新型材料最多可使用4个月,但新材料的不稳定性会导致材料损坏的年限不相同,现对A,B两种新型材料对应的产品各100件进行科学模拟测试,得到两种新型材料使用寿命的频数统计如下表:经甲公司测算,平均每包新型材料每月可以带来5万元收入,不考虑除采购成本之外的其他成本,假设每包新型材料的使用寿命都是整数月,且以频率作为每包新型材料使用寿命的概率,如果你是甲公司的负责人,以每包新型材料产生利润的期望值为决策依据,你会选择采购哪款新型材料?参考数据:y i=96,x i y i=371.-----.附:8.(2019山东青岛二模,理20)“爱国,是人世间最深层、最持久的情感,是一个人立德之源、立功之本.”在中华民族几千年绵延发展的历史长河中,爱国主义始终是激昂的主旋律.爱国汽车公司拟对“东方红”款高端汽车发动机进行科技改造,根据市场调研与模拟,得到科技改造投入x(亿元)与科技改造直接收益y(亿元)的数据统计如下:当0<x≤ 7时,建立了y与x的两个回归模型:模型①:=4.1x+11.8;模型②:=21.3-14.4;当x>17时,确定y与x满足的线性回归方程为:=-0.7x+.(1)根据下列表格中的数据,比较当0<x≤ 7时模型①、②的相关指数R2,并选择拟合精度更高、更可靠的模型,预测对“东方红”款汽车发动机科技改造的投入为17亿元时的直接收益.附:刻画回归效果的相关指数R2=1---7≈4.1.(2)为鼓励科技创新,当科技改造的投入不少于20亿元时,国家给予公司补贴收益10亿元,以回归方程为预测依据,比较科技改造投入17亿元与20亿元时公司实际收益的大小;(附:用最小二乘法求线性回归方程x+的系数公式-----)(3)科技改造后,“东方红”款汽车发动机的热效率X大幅提高,X服从正态分布N(0.52,0.012),公司对科技改造团队的奖励方案如下:若发动机的热效率不超过50%,不予奖励;若发动机的热效率超过50%但不超过53%,每台发动机奖励2万元;若发动机的热效率超过53%,每台发动机奖励5万元.求每台发动机获得奖励的数学期望.(附:随机变量ξ服从正态分布N(μ,σ2),则P(μ-σ<ξ<μ+σ)=0.682 6,P(μ-2σ<ξ<μ+2σ)=0.954 4.)参考答案专题突破练20统计与统计案例1.解(1)根据列联表可以求得K2的观测值:11.429>6.635,k=-7故有99%的把握认为满意程度与年龄有关.(2)据题意,该8名员工的贡献积分及按甲乙两种方案所获补贴情况为:由表可知 “A类员工”有5名,设从这8名员工中随机抽取4名进行面谈,恰好抽到3名“A类员工”的概率为P,则P=72.解(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为=-30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为 =99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.(以上给出了2种理由,答出其中任意一种或其他合理理由均可)3.解(1)记B表示事件“旧养殖法的箱产量低于 kg” C表示事件“新养殖法的箱产量不低于kg”.由题意知P(A)=P(BC)=P(B)P(C).旧养殖法的箱产量低于50kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62,故P(B)的估计值为0.62.新养殖法的箱产量不低于50kg的频率为(0.068+0.046+0.010+0.008)×5=0.66,故P(C)的估计值为0.66.因此,事件A的概率估计值为0.62×0.66=0.4092.(2)根据箱产量的频率分布直方图得列联表K2=-15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50kg的直方图面积为(0.004+0.020+0.044)×5=0.34<0.5,箱产量低于55kg的直方图面积为(0.004+0.020+0.044+0.068)×5=0.68>0.5,故新养殖法箱产量的中位数的估计值为50+-52.35(kg).4.解(1)由样本数据得(x i,i)(i= … 的相关系数为---0.18.r=--由于|r|<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小. (2)①由于=9.97,s≈ .212,由样本数据可以看出抽取的第13个零件的尺寸在(-3s,+3s)以外,因此需对当天的生产过程进行检查.②剔除离群值,即第13个数据,剩下数据的平均数为(16×9.97-9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02=16×0.2122+16×9.972≈ .134,剔除第13个数据,剩下数据的样本方差为(1591.134-9.222-15×10.022 ≈ .008,这条生产线当天生产的零件尺寸的标准差的估计值为0.09.5.解(1)合120 80 200计k2=-7 8.333>6.635,故能在犯错误的概率不超过0.01的前提下认为我市市民网购与性别有关.(2)①由题意,所抽取的10名女市民中,经常网购的有107 =7人,偶尔或不用网购的有10-7=3人,所以选取的3人中至少有2人经常网购的概率P=77②由2×2列联表可知,抽到经常网购的市民频率为=0.6.将频率视为概率,从我市所有参与调查的市民中随机抽取1人,恰好抽到经常网购市民的概率为0.6.由题意X~B(10,0.6),E(X)=10×0.6=6,D(X)=10×0.6×(1-0.6)=2.4.6.解(1)=5,=4.x i y i=2×3+4×4+5×4+6×4+8×5=106,=22+42+52+62+82=145,-=0.3,=4-0.3×5=2.5,-所以y关于x的线性回归方程为=0.3x+2.5.当x=10时,=0.3×10+2.5=5.5百斤,所以如果每个有机蔬菜大棚使用堆沤肥料10千克,估计每个有机蔬菜大棚产量的增加量y是5.5百斤.(2)若该超市一天购进17份这种有机蔬菜,Y1表示当天的利润(单位:元),那么Y1的分布列为Y1的数学期望是E(Y1)=65+75+85--;若该超市一天购进18份这种有机蔬菜,Y2表示当天的利润(单位:元),那么Y2的分布列为Y2的数学期望是E(Y2)=60+70+80+907 --;又购进17份比购进18份的利润的期望值大,故--,求得x>24,故x的取值范围是(24,30),x∈N*.7.解(1)由折线图可知统计数据(x i,y i)共6组,即(1,11),(2,13),(3,16),(4,15),(5,20),(6,21),计算可得(1+2+3+4+5+6)=3.5,y i=96=16,-n=12+22+32+42+52+62-6×3.52=17.5.故 7 -7=2,故=16-2×3.5=9,∴x关于y的线性回归方程为=2x+9,故x=11时,则=2×11+9=31,即预测公司2019年3月份(即x=11时)的利润为31百万元.(2)由频率估计概率,A型材料可使用1个月,2个月,3个月、4个月的概率分别为0.2,0.35,0.35,0.1,∴A型材料利润的数学期望为(5-10)×0.2+(10-10)×0.35+(15-10)×0.35+(20-10)×0.1=1.75万元;B型材料可使用1个月,2个月,3个月、4个月的概率分别为0.1,0.3,0.4,0.2,∴B型材料利润的数学期望为(5-12)×0.1+(10-12)×0.3+(15-12)×0.4+(20-12)×0.2=1.50万元; ∵1.75>1.50,∴应该采购A型材料.8.解(1)由表格中的数据,有182.4>79.2,即7-77-,所以模型①的R2小于模型②,说明回归模型②刻画的拟合效果更好.所以当x=17亿元时,科技改造直接收益的预测值为=21.3 7-14. ≈ .3×4.1-14.4=72.93(亿元).(2)由已知可得:-20==3,所以=23,-60=7 =7.2,所以=67.2.所以+0.7=67.2+0.7×23=83.3.所以当x>17亿元时,y与x满足的线性回归方程为:=-0.7x+83.3.所以当x=20亿元时,科技改造直接收益的预测值=-0.7×20+83.3=69.3,所以当x=20亿元时,实际收益的预测值为69.3+10=79.3亿元>72.93亿元,所以科技改造投入20亿元时,公司的实际收益的更大.(3)因为P(0.52-0.02<X<0.52+0.02)=0.954 4,所以P(X>0.50)==0.9772,P(X≤ .50)=-=0.022 8.因为P(0.52-0.01<X<0.52+0.01)=0.682 6,所以P(X>0.53)=-=0.158 7,所以P(0.50<X≤ .53)=0.977 2-0.158 7=0.818 5.设每台发动机获得的奖励为Y(万元),则Y的分布列为:所以每台发动机获得奖励的数学期望为E(Y)=0×0.0228+2×0.8185+5×0.1587=2.4305(万元).。

相关文档
最新文档