2021届新高考数学二轮复习课件:专题四 概率与统计 第1讲 统计与统计案例 课件(共50张PPT)
2021届高考数学二轮复习专题四概率与统计第1讲统计与统计案例课件理

高考定位 1.抽样方法、样本的数字特征、统计图表、回归分析与独立性检验主要 以选择题、填空题形式命题,难度较小;2.注重知识的交汇渗透,统计与概率,回 归分析与概率是近年命题的热点,2021年,2021年和2021年在解答题中均有考察.
真题感悟
1.(2021·全国Ⅰ卷)某地区经过一年的新农村建立,农村的经济收入增加了一倍,实现 翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建立前后 农村的经济收入构成比例,得到如下图的饼图:
(1)分别利用这两个模型,求该地区2021年的环境根底设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由. 解 (1)利用模型①,该地区 2018 年的环境基础设施投资额的预测值为y^=-30.4+ 13.5×19=226.1(亿元). 利用模型②,该地区 2018 年的环境基础设施投资额的预测值为y^=99+17.5×9= 256.5(亿元).
探究提高 1.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但 无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量与总体 容量的比值. 2.在系统抽样的过程中,要注意分段间隔,需要抽取 n 个个体,样本就需要分成 n 个组,则分段间隔即为Nn(n 为样本容量),首先确定在第一组中抽取的个体的号码数, 再从后面的每组中按规则抽取每个个体.
其中符合茎叶图所给数据的结论是( )
A.①②③
B.②③④
C.①②④
D.①③④
解析 由茎叶图知,男生每天锻炼时间差异小,女生差异大,①正确. 男生平均每天锻炼时间超过 65 分钟的概率 P1=150=12,女生平均每天锻炼时间超过
65 分钟的概率 P2=140=25,P1>P2,因此④正确. 设男生、女生两组数据的平均数分别为-x甲,-x乙,标准差分别为 s 甲,s 乙.易求-x甲=65.2, -x乙=61.8,知-x甲>-x乙,②正确. 又根据茎叶图,男生锻炼时间较集中,女生锻炼时间较分散,∴s甲<s乙,③错误, 因此符合茎叶图所给数据的结论是①②④. 答案 C
【2021届高考二轮精品资源-数学】专题五 概率与统计(文理)第1讲 统计与统计案例 教师版

【2021届高考二轮精品资源-数学】专题五 概率与统计(文理) 第1讲 统计与统计案例 教师版1.抽样方法、样本的数字特征、统计图表、回归分析与独立性检验主要以选择题、填空题形式命题,难度较小;2.注重知识的交汇渗透,统计与概率,回归分析与概率是近年命题的热点.1.抽样方法抽样方法包括简单随机抽样、系统抽样、分层抽样,三种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围. 2.统计中的四个数据特征(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.(3)平均数:样本数据的算术平均数,即=n 1(x 1+x 2+…+x n ). (4)方差与标准差. s 2=n 1[(x 1-)2+(x 2-)2+…+(x n -)2],s=[(x1- EMBED Equation.DSMT4 )2+(x2- EMBED Equation.DSMT4 )2+…+(xn - EMBED Equation.DSM 1.3.直方图的两个结论(1)小长方形的面积=组距×组距频率=频率. (2)各小长方形的面积之和等于1. 4.回归分析与独立性检验(1)回归直线^y =^b x +^a 经过样本点的中心点(,),若x 取某一个值代入回归直线方程^y=^b x +^a中,可求出y 的估计值. (2)独立性检验对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是:则K 2=(a +b )(c +d )(a +c )(b +d )n (ad -bc )2(其中n =a +b +c +d 为样本容量).型更合适,并用此模型预测A 超市广告费支出为8万元时的销售额. 参数数据及公式:=8,=42,7x i y i =2 794,7x i 2=708,(1)解析 ∵k ≈3.918>3.841,且P (K 2≥k 0=3.841)=0.05,根据独立性检验思想“这种血清能起到预防感冒的作用”出错的可能性不超过5%. 答案 B(2)解 ①∵=8,=42,7x i y i =2 794,7x i 2=708.因此^a =-^b=42-1.7×8=28.4.所以,y 关于x 的线性回归方程是^y=1.7x +28.4. ②∵0.75<0.97, ∴对数回归模型更合适.当x =8时,^y=12ln 8+22=36ln 2+22=36×0.7+22=47.2万元.∴广告费支出8万元时,预测A超市销售额为47.2万元.1.(2017·全国Ⅰ卷)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数【解题思路】刻画评估这种农作物亩产量稳定程度的指标是标准差.【答案】B2.(2018·全国I卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半【解题思路】首先设出新农村建设前的经济收入为M,根据题意,得到新农村建设后的经济收入为2M,之后从图中各项收入所占的比例,得到其对应的收入是多少,从而可以比较其大小,并且得到其相应的关系,从而得出正确的选项.【答案】设新农村建设前的收入为M,而新农村建设后的收入为2M,则新农村建设前种植收入为0.6M,而新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A项不正确;新农村建设前其他收入我0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B项正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,所以增加了一倍,所以C 项正确;新农村建设后,养殖收入与第三产业收入的综合占经济收入的,所以超过了经济收入的一半,所以D正确;故选A.3.(2018·全国III卷))某公司有大量客户,且不同龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.【解题思路】由题可知满足分层抽样特点【答案】由于从不同龄段客户中抽取,故采用分层抽样,故答案为分层抽样.4.7.(2018·全国II卷)下图是某地区2000年至2016年环境基础设施投资额(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了与时间变量的两个线性回归模型.根据2000年至2016年的数据(时间变量的值依次为)建立模型①:;根据2010年至2016年的数据(时间变量的值依次为)建立模型②:.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.【解题思路】(1)两个回归直线方程中无参数,所以分别求自变量为2018时所对应的函数值,就得结果,(2)根据折线图知2000到2009,与2010到2016是两个有明显区别的直线,且2010到2016的增幅明显高于2000到2009,也高于模型1的增幅,因此所以用模型2更能较好得到2018的预测.【答案】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为=–30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=–30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.点睛:若已知回归直线方程,则可以直接将数值代入求得特定要求下的预测值;若回归直线方程有待定参数,则根据回归直线方程恒过点求参数.1.(2018·内江期末)为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x为()A.64B.96C.144D.160【解题思路】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为,因为共抽出30人,所以总人数为人,即可求出20~30岁年龄段的人数.【答案】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为,因为共抽出30人,所以总人数为人,所以,20~30岁龄段的人有,故选D.2.(2017·全国Ⅲ卷)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳【解题思路】由题图可知,2014年8月到9月的月接待游客量在减少,则A选项错误.【答案】A3.(2017·泉州模拟)某厂在生产甲产品的过程中,产量x(吨)与生产能耗y(吨)的对应数据如表:根据最小二乘法求得回归方程为^=0.65x+^,当产量为80吨时,预计需要生产能耗为________吨.【解题思路】由回归直线方程过样本点中心可得^a.【答案】由题意,=45,=36.25,代入^y=0.65x+^a,可得^a=7,∴当产量为80吨时,预计需要生产能耗为0.65×80+7=59.故填59.4.(2018·全国I卷)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表使用了节水龙头50天的日用水量频数分布表(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)【解题思路】(1)根据题中所给的使用了节水龙头50天的日用水量频数分布表,算出落在相应区间上的频率,借助于直方图中长方形的面积表示的就是落在相应区间上的频率,从而确定出对应矩形的高,从而得到直方图;(2)结合直方图,算出日用水量小于0.35的矩形的面积总和,即为所求的频率;(3)根据组中值乘以相应的频率作和求得50天日用水量的平均值,作差乘以365天得到一年能节约用水多少,从而求得结果.【答案】(1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为.该家庭使用了节水龙头后50天日用水量的平均数为.估计使用节水龙头后,一年可节省水.1.(2017·汉中模拟)已知两个随机变量x,y之间的相关关系如表所示:根据上述数据得到的回归方程为^y =^b x +^a,则大致可以判断( ) A .^a >0,^b >0B .^a >0,^b <0C .^a <0,^b >0D .^a <0,^b <0【解题思路】作出散点图,画出回归直线直观判定^b >0,^a<0. 【答案】C2.(2018·衡水中学)已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据:根据表中的全部数据,用最小二乘法得出y 与x 的线性回归方程为,则表中m 的值为( ) A .45B .50C .55D .70【解题思路】根据回归直线经过样本平均数点,可求得m 的值.【答案】由表可知,,,因为回归直线会经过平均数样本中心点,代入,解得,所以选D .3.为了研究雾霾天气的治理情况,某课题组对部分城市进行空气质量调查,按地域特点把这些城市分成甲、乙、丙三组,已知三组城市的个数分别为4,y ,z ,依次构成等差数列,且4,y ,z +4成等比数列,若用分层抽样抽取6个城市,则乙组中应抽取的城市个数为________.【解题思路】根据等差数列和等比数列的定义列方程组解出y ,z .【答案】由题意可得y2=4(z +4),2y =4+z ,即y2=4z +16,,解得z =12或z =-4(舍去),故y =8. 所以甲、乙、丙三组城市的个数分别为4,8,12. 因为一共要抽取6个城市,所以抽样比为4+8+126=41. 故乙组城市应抽取的个数为8×41=2.故填 2.4.(2017·赤峰二模)微信是腾讯公司推出的一种手机通讯软件,它支持发送语音短信、视频、图片和文字,一经推出便风靡全国,甚至涌现出一批在微信的朋友圈内销售商品的人(被称为微商).为了调查每天微信用户使用微信的时间,某经销化妆品的微商在一广场随机采访男性、女性用户各50名,将男性、女性使用微信的时间分成5组:(0,2],(2,4],(4,6],(6,8],(8,10]分别加以统计,得到如图所示的频率分布直方图.(1)根据女性频率分布直方图估计女性使用微信的平均时间;(2)若每天玩微信超过4小时的用户列为“微信控”,否则称其为“非微信控”,请你根据已知条件完成2×2的列联表,并判断是否有90%的把握认为“微信控”与“性别有关”? 【解题思路】(1)取每组的中间值代表这组,平均数;(2)根据题意列出2×2列联表,并计算K 2.【答案】解 (1)女性平均使用微信的时间为:0.16×1+0.24×3+0.28×5+0.2×7+0.12×9=4.76 (小时).(2)由已知得:2(0.04+a +0.14+2×0.12)=1,解得a =0.08. 由题设条件得列联表∴K 2=(a +b )(c +d )(a +c )(b +d )n (ad =50×50×68×32≈2.941>2.706. 所以有90%的把握认为“微信控”与“性别”有关.。
2021届高考数学【新课改版】二轮专题四概率与统计 统计、统计案例ppt下载

(2)理解样本数据标准差的意义和作用,学会计算数字特征(如 平均数、标准差),并作出合理的解释; (3)体会用样本估计总体的思想,会用样本的频率分布估计总体 分布,会用样本的基本数字特征估计总体的基本数字特征;初 步体会样本频率分布和数字特征的随机性. 3.统计案例 (1)通过收集现实问题中两个有关联变量的数据作出散点图,并 利用散点图直观认识变量间的相关关系.知道最小二乘法的思 想,能根据给出的线性回归方程系数公式建立线性回归方程, 并能初步应用; (2)通过对典型案例(如“肺癌与吸烟有关吗”等)的探究,了解 独立性检验(只要求2×2列联表)的基本思想、方法及初步应用.
频率 频率=组距×组距
频率比 频率分布直方图中各小长方形的面积之和为1,各小 长方形高的比也就是频率比
众数 最高小长方形底边中点的横坐标 平分频率分布直方图的面积且垂直于横轴的直线与
中位数 横轴交点的横坐标 频率分布直方图中每个小长方形的面积乘小长方形
平均数 底边中点的横坐标之和
返回
[跟踪训练] (2020·安徽省部分重点学校联考)由于受到网络电商的冲击, 某品牌的洗衣机在线下的销售受到影响,造成了一定的经济 损失,现将A地区200家实体店该品牌洗衣机的月经济损失统 计如图所示.
Contents
1 考点1 用样本估计总体 2 考点2 统计案例 3 考点3 概率与统计的综合问题 4 专题检测 5 高考5个大题 解题研诀窍
返回
考点1 用样本估计总体
返回
[例1] (2020·全国卷Ⅰ)某厂接受了一项加工业务,加工 出来的产品(单位:件)按标准分为A,B,C,D四个等级.加 工业务约定:对于A级品、B级品、C级品,厂家每件分别收 取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原 料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲 分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂 家为决定由哪个分厂承接加工业务,在两个分厂各试加工了 100件这种产品,并统计了这些产品的等级,整理如下:
2021高考数学复习高考中的概率与统计问题课件理北师大版

经典微课堂 规范答题系列4 高考中的概率与统计问题
2
[命题解读] 从近五年全国卷高考试题来看,在高考的解答题 中,对概率与随机变量及其分布相结合的综合问题的考查既是热点 又是重点,是高考必考的内容,并且常常与统计相结合,常常设计 成包含概率计算、概率分布表、随机变量的数学期望与方差、统计 图表的识别等知识为主的综合题.以考生比较熟悉的实际应用问题 为载体,考查学生应用基础知识和基本方法分析问题和解决问题的 能力.
15
故六月份这种冰激凌一天的需求量 X(单位:桶)的分布列为
X
200 400
600
P
1
2
2
5
5
5
16
(2)由题意得, 当 n≤200 时,EY=2n≤400; 当 200<n≤400 时,EY=15×[200×2+(n-200)×(-2)]+45×n×2 =65n+160∈(400,640]; 当 400<n≤600 时, EY=15×[200×2+(n-200)×(-2)]+25×[400×2+(n-400)×(-2)] +25×n×2=-52n+800∈[560,640);
不会证明:{pi+1-pi}(i= 0,1,2,…,7)为等比数列.
采用累加递推法求解.
11
[通性通法] 随机变量分布列类问题的求解步骤: (1)定元:根据已知条件确定离散型随机变量的取值. (2)定性:明确每个随机变量取值所对应的事件. (3)定型:确定事件的概率模型和计算公式. (4)计算:计算随机变量取每一个值的概率. (5)列表:列出分布列. (6)求解:根据公式求期望.
桶,如果最高气温低于 20 ℃,需求量为 200 桶.为了确定六月份的
高考二轮总复习课件(适用于新高考新教材)数学专题四概率与统计

)
答案 CD
解析 =
1
∑ xi,y
=1
=
1 n
∑
n i=1
数相差 c,故 B 错误;2 =
+ = +c,故 A 错误;两组样本数据的样本中位
1
∑ (xi-)2,2
=1
=
1
∑ [(xi+c)-(+c)]2=2 ,故
=1
x 极差=xmax-xmin,y 极差=(xmax+c)-(xmin+c)=xmax-xmin,故 D 正确.
设离散型随机变量X可能取的不同值为x1,x2,…,xi,…,xn,X取每一个值
xi(i=1,2,…,n)的概率P(X=xi)=pi,则称下表为离散型随机变量X的分布列.
X
x1
x2
x3
…
xi
…
xn
P
p1
p2
p3
…
pi
…
pn
名师点析
1.离散型随机变量的分布列的两个性质
(1)pi≥0(i=1,2,…,n);
C 正确;
6.(2022·全国乙·文19)某地经过多年的环境治理,已将荒山改造成了绿水青
山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每
棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
10
10
10
=1
i=1
=1
并计算得 ∑ xi2 =0.038, ∑ 2 =1.615 8, ∑ xiyi=0.247 4.
B.甲与丁相互独立
C.乙与丙相互独立
D.丙与丁相互独立
)
答案 B
新教材高中数学第4章概率与统计4-1-1条件概率课件新人教B版选择性必修第二册

1.(对接教材 P43 例 3)设某动物由出生算起活到 20 岁的概 率为 0.8,活到 25 岁的概率为 0.4,现有一个 20 岁的这种动物,则它 活到 25 岁的概率是________.
2 3
3 5
[由公式 P(A|B)=PPA∩BB=23,P(B|A)=PPA∩AB=53.]
类型 2 利用基本事件个数求条件概率
在一个坛子中装有 10 个除颜色外完全相同的玻璃球,其中有 2 个红球,8 个黄球.现从中任取一球后(不放回),再取一球,则已知 第一个球为红色的情况下第二个球为黄色的概率为多少?
[解] 设第 1 次抽到舞蹈节目为事件 A,第 2 次抽到舞蹈节目为事 件 B,则第 1 次和第 2 次都抽到舞蹈节目为事件 A∩B.
(1)从 6 个节目中不放回地依次抽取 2 个的事件数为 n(Ω)=A26=30, 根据分步乘法计数原理 n(A)=A14A15=20,于是 P(A)=nnΩA=2300=23. (2)因为 n(A∩B)=A24=12,于是 P(A∩B)=nnA∩ΩB=1320=25.
[由公式 P(A|B)=PPA∩BB=23,P(B|A)=PPA∩AB=53.]
[跟进训练]
1.甲、乙两市都位于长江下游,根据一百多年来的气象记录, 知道一年中下雨天的比例甲市占 20%,乙市占 18%,两地同时下雨 占 12%,记 P(A)=0.2,P(B)=0.18,P(A∩B)=0.12,则 P(A|B)= ________,P(B|A)=________.
[解] 由古典概型的概率公式可知
统计与统计案例PPT课件

走向高考 ·二轮专题复习 ·新课标版 ·数学
用样本估计总体
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
用样本估计总体 (文)某学校为了调查学生平均每周的上网时间(单 位:h)对学习产生的影响,从高三年级随机抽取了 100 名学生, 将所得数据整理后,画出频率分布直方图(如图),其中频率分 布直方图从左到右前 3 个小矩形的面积之比为 1:3:5,试估 计:
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
疑难误区警示 1.当总体数 N 不能被样本容量整除,用系统抽样法剔除 多余个体时,必须随机抽样. 2.注意中位数与平均数的区别,中位数可能不在样本数 据中.
专题七 第一讲
走向高考 ·二轮专题复习 ·新课工厂甲、乙、丙三个车
间生产了同一种产品,数量分别为 120 件,80 件,60 件,为
了解它们的产品质量是否存在显著差异,用分层抽样方法抽
取了一个容量为 n 的样本进行调查,其中从丙车间的产品中
抽取了 3 件,则 n=( )
A.9
B.10
C.12
D.13
[答案] D
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
某市有大型超市 200 家、中型超市 400 家、小型超市 1400 家.为掌握各类超市的营业情况,现按分层抽样方法抽取一个 容量为 100 的样本,应抽取中型超市________家.
[答案] 20
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
[解析] 属简单题,关键是清楚每一层的抽取比例都一样 是Nn .
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
2021高考数学(文)复习课件:板块2 命题区间精讲 精讲4 统计与概率

板块二 高考专项突破——解答 题
命题区间精讲 精讲4 统计与概率
数学文
栏目导航
01 命题点1 02 命题点2 03 命题点3 04 命题点4 05 专题限时集训
01 命题点1 用样本估计总体
总体估计的方法 (1)统计量法:①若数据已知,常借助 x ,s2等量对样本总体做出 估计,其中 x =x1+x2+n …+xn,s2=n1∑i=n1 (xi- x )2. ②若数据未知,如以频率分布直方图形式给出,则应明确直方 图中各统计量的求法.
该产品的质量评价标准规定:鉴定成绩在[90,100)内的产品, 质量等级为优秀;鉴定成绩在[80,90)内的产品,质量等级为良好; 鉴定成绩在[60,80)内的产品,质量等级为合格.将频率视为概率.
(1)完成下列2×2列联表,以产品质量等级是否达到良好以上(含 良好)为判断依据,判断能不能在误差不超过0.05的情况下,认为产 品等级是否达到良好以上(含良好)与生产产品的机器有关;
=1 27332.84-4-5×5×7.72.×2×7.229.64=26086.8.4=3, a^= y -b^ x =29.64-3×7.2=8.04. 所以 y 关于 x 的回归方程为^y=3x+8.04. ②把 x=18 代入①中所求回归方程得 ^y=3×18+8.04=62.04,故预报值为 62.04 万元.
(1)从以上模型中选择更优的回归方程,并用相关系数加以说明; (2)根据(1)的选择结果及表中数据,建立 y 关于 x 的回归方程; (3)已知这种产品的年利润 z 与 x,y 的关系为 z=10y-x.根据(2) 的结果回答下列问题: ①年宣传费 x=20 时,年利润的预报值是多少? ②年宣传费 x 为何值时,年利润的预报值最大?
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
地块中用简单随机抽样的方法抽取 20 个作为样区,调查得到样本数据(xi,yi)(i=1,
2,…,20),其中 xi 和 yi 分别表示第 i 个样区的植物覆盖面积(单位:公顷)和这种野
20
20
20
生动物的数量,并计算得∑ i=1xi=60,i∑=1yi=1
200,∑ i=1
(xi--x)2=80,i∑2=01
考点整合 1.抽样方法
抽样方法包括简单随机抽样、分层抽样,两种抽样方法都是等概率抽样,体现了抽 样的公平性,但又各有其特点和适用范围. 2.统计中的四个数据特征 (1)众数:在样本数据中,出现次数最多的那个数据. (2)中位数:在样本数据中,将数据按大小顺序排列,位于最中间的数据.如果数据 的个数为偶数,就取中间两个数据的平均数作为中位数.
得该样方法,
并说明理由. 附:相关系数 r=
∑ i=n∑i=1n1((xix-i--x-)x)2∑ i(=n1 y(i-y-yi-)-y)2, 2≈1.414.
解 (1)由已知得样本平均数-y=210∑ i2=01yi=60,从而该地区这种野生动物数量的估计值
4.回归分析与独立性检验 (1)回归直线y^=b^ x+a^ 经过样本点的中心(-x,-y),若 x 取某一个值代入回归直线方程y^ =b^ x+a^ 中,可求出 y 的估计值.
(2)独立性检验 对于取值分别是{x1,x2}和{y1,y2}的分类变量 X 和 Y,其样本频数列联表是:
x1 x2 总计
A.中位数
B.平均数
C.方差
D.极差
解析 中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因
而去掉1个最高分和1个最低分,中位数是不变的,平均数、方差、极差均受影响.
答案 A
2.(2020·全国Ⅲ卷)在一组样本数据中,1,2,3,4 出现的频率分别为 p1,p2,p3,p4,
4
且∑ i=1pi=1,则下面四种情形中,对应样本的标准差最大的一组是( ) A.p1=p4=0.1,p2=p3=0.4 B.p1=p4=0.4,p2=p3=0.1 C.p1=p4=0.2,p2=p3=0.3 D.p1=p4=0.3,p2=p3=0.2
解析 X 的可能取值为 1,2,3,4,四种情形的数学期望 E(X)=1×p1+2×p2+3×p3 +4×p4 都为 2.5,方差 D(X)=[1-E(X)]2×p1+[2-E(X)]2×p2+[3-E(X)]2×p3+[4 -E(X)]2×p4,标准差为 D(X).A 选项的方差 D(X)=0.65;B 选项的方差 D(X)= 1.85;C 选项的方差 D(X)=1.05;D 选项的方差 D(X)=1.45.可知选项 B 的情形对应 样本的标准差最大.故选 B. 答案 B
为 60×200=12 000.
(2)样本(xi,yi)(i=1,2,…,20)的相关系数 r=
20
∑
i=1
(xi--x)(yi--y)
20
∑
i=1
(xi--x)2∑ i2=01
(yi--y)2
=
800 80×9
=2 000
3
2≈0.94.
(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样. 理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关性. 由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很 大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样 本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.
(yi--y)2=9 000,
20
∑
i=1
(xi--x)(yi--y)=800.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种
野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01); (3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获
(3)平均数:样本数据的算术平均数,即-x=1n(x1+x2+…+xn). (4)方差与标准差. s2=1n[(x1--x)2+(x2--x)2+…+(xn--x)2], s= 1n[(x1--x)2+(x2--x)2+…+(xn--x)2].
3.直方图的两个结论 (1)小长方形的面积=组距×频 组率 距=频率. (2)各小长方形的面积之和等于 1.
A.10
B.18
C.20
D.36
解析 因为直径落在区间[5.43,5.47)内的频率为0.02×(6.25+5.00)=0.225,所以 个数为0.225×80=18.故选B. 答案 B
4.(2020·全国Ⅱ卷)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所
增加.为调查该地区某种野生动物的数量,将其分成面积相近的 200 个地块,从这些
3.(2020·天津卷)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9 组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下 频 率 分 布 直 方 图 , 则 在 被 抽 取 的 零 件 中 , 直 径 落 在 区 间 [5.43 , 5.47) 内 的 个 数 为 ()
第1讲 统计与统计案例
高考定位 1.抽样方法、样本的数字特征、统计图表、回归分析与独立性检验主要 以选择题、填空题形式命题,难度较小;2.注重知识的交汇渗透,统计与概率、回 归分析与概率是近年命题的热点,2018年、2019年和2020年在解答题中均有考查.
真题感悟
1.(2019·全国Ⅱ卷)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的 成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效 评分与9个原始评分相比,不变的数字特征是( )
y1 a c a+c
y2 b d b+d
总计 a+b c+d
n
则 K2=(a+b)(cn+(da)d-(bac+)c2)(b+d)(其中 n=a+b+c+d 为样本容量).
热点一 抽样方法