高考数学一轮总复习第十章统计与成对数据的统计分析课时规范练48用样本估计总体北师大版
新课标高考数学一轮总复习第十章算法初步统计统计案例用样本估计总体课时规范练理含解析新人教A版

10-3 用样本估计总体课时规范练(授课提示:对应学生用书第339页)A 组 基础对点练1.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x 的值等于( D )A .0.12B .0.012C .0.18D .0.0182.一次数学考试后,某老师从自己所带的两个班级中各抽取5人,记录他们的考试成绩,得到如图所示的茎叶图.已知甲班5名同学成绩的平均数为81,乙班5名同学成绩的中位数为73,则x -y 的值为( D )A .2B .-2C .3D .-33.(2017·长沙适应性考试)某校开展“爱我母校,爱我家乡”摄影比赛,七位评委为甲,乙两名选手的作品打出的分数的茎叶图如图所示(其中m 为数字0~9中的一个),去掉一个最高分和一个最低分后,甲,乙两名选手得分的平均数分别为a 1,a 2,则一定有( B )A .a 1>a 2B .a 2>a 1C .a 1=a 2D .a 1,a 2的大小与m 的值有关解析:由茎叶图知,a 1=80+1+5+5+4+55=84,a 2=80+4+4+6+4+75=85,故选B.4.如图是一组样本数据的频率分布直方图,则依据图形中的数据,可以估计总体的平均数与中位数分别是( B )A .12.5,12.5B .13,13C .13.5,12.5D .13.5,13解析:第1组的频率为0.04×5=0.2,第2组的频率为0.1×5=0.5,则第3组的频率为1-0.2-0.5=0.3,估计总体平均数为7.5×0.2+12.5×0.5+17.5×0.3=13.由题意知,中位数在第2组内,设为10+x ,则有0.1x =0.3,解得x =3,从而中位数是13. 5.某校女子篮球队7名运动员身高(单位:cm)分布的茎叶图如图,已知记录的平均身高为175 cm ,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为x ,那么x 的值为 2 .解析:由题意可知,170+17×(1+2+x +4+5+10+11)=175,即17×(33+x )=5,即33+x =35,解得x =2. 6.在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积和的14,且样本容量为160,则中间一组的频数为 32 .解析:依题意,设中间小长方形的面积为x ,则其余小长方形的面积和为4x ,所以5x =1,x =0.2,中间一组的频数为160×0.2=32.7.第47届联合国大会于1993年1月18日通过193号决议,确定自1993年起,每年的3月22日为“世界水日”,以此推动对水资源进行综合性统筹规划和管理,加强水资源保护,解决日益严重的水问题.某研究机构为了了解各年龄层的居民对“世界水日”的了解程度,随机抽取了300名年龄在[10,60]内的公民进行调查,所得结果统计为如下的频率分布直方图.(1)求抽取的年龄在[30,40)内的居民人数;(2)若按照分层抽样的方法从年龄在[10,20),[50,60]内的居民中抽取6人进行知识普及,并在知识普及后再抽取2人进行测试,求进行测试的居民中至少有1人的年龄在[50,60]内的概率.解析:(1)依题意,知年龄在[30,40)内的频率P =1-(0.02+0.025+0.015+0.01)×10=0.3,故所求居民人数为300×0.3=90.(2)依题意,从年龄在[10,20),[50,60]内的居民中分别抽取4人和2人, 记年龄在[10,20)内的4人为A ,B ,C ,D , 年龄在[50,60]内的2人为1,2,故抽取2人进行测试的所有情况为(A ,B ),(A ,C ),(A ,D ),(A,1),(A,2),(B ,C ),(B ,D ),(B,1),(B,2),(C ,D ),(C,1),(C,2),(D,1),(D,2),(1,2),共15种,其中满足条件的情况为(A,1),(A,2),(B,1),(B,2),(C,1),(C,2),(D,1),(D,2),(1,2),共9种, 故所求概率P =35.B 组 能力提升练1.若数据x 1,x 2,x 3,…,x n 的平均数为x =5,方差s 2=2,则数据3x 1+1,3x 2+1,3x 3+1,…,3x n +1的平均数和方差分别为( C ) A .5,2 B .16,2 C .16,18D .16,92.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x ,则( D )A .m e =m 0=xB .m e =m 0<xC .m e <m 0<xD .m 0<m e <x3.若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( C ) A .8 B .15 C .16D .324.已知样本(x 1,x 2,…,x n )的平均数为x ,样本(y 1,y 2,…,y m )的平均数为y (x ≠y ),若样本(x 1,x 2,…,x n ,y 1,y 2,…,y m )的平均数z =a x +(1-a )y ,其中0<a <12,则n ,m 的大小关系为( A )A .n <mB .n >mC .n =mD .不能确定解析:由题意可得x =x 1+x 2+…+x nn,y =y 1+y 2+…+y mm,z =x 1+x 2+…+x n +y 1+y 2+…+y mn +m=nn +m ·x 1+x 2+…+x n n +m n +m ·y 1+y 2+…+y mm=n n +m·x +m n +m·y =a x +(1-a )y ,所以nn +m=a ,mn +m =1-a ,又0<a <12,所以0<n n +m <12<mn +m,所以n <m .故选A. 5.某学校高二年级共有女生300人,现调查她们每天的课外运动时间,发现她们的课外运动时间介于30分钟到90分钟,如图是统计结果的频率分布直方图,则她们的平均运动时间大约是 56.5 分钟.解析:由题图得35×0.1+45×0.1+55×0.5+65×0.2+75×0.05+85×0.05=56.5(分钟).6.已知甲、乙两组数据如茎叶图所示,若两组数据的中位数相同,平均数也相同,那么m +n = 11 .解析:∵两组数据的中位数相同, ∴m =2+42=3,又∵两组数据的平均数也相同, ∴27+33+393=20+n +32+34+384,∴n =8, ∴m +n =11.7.某家庭记录了未使用节水龙头50天的日用水量数据(单位:m 3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表使用了节水龙头50天的日用水量频数分布表(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于0.35 m 3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)解析:(1)使用了节水龙头50天的日用水量数据的频率分布直方图:(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35 m3的概率的估计值为0.48. (3)该家庭未使用节水龙头50天日用水量的平均数为x1=150(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48. 该家庭使用了节水龙头后50天日用水量的平均数为x2=150(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35. 估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).。
高考数学大一轮复习 第十章 统计 10.2 用样本估计总体教师用书 文 苏教版(2021年最新整理)

(江苏专用)2018版高考数学大一轮复习第十章统计10.2 用样本估计总体教师用书文苏教版编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望((江苏专用)2018版高考数学大一轮复习第十章统计10.2 用样本估计总体教师用书文苏教版)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为(江苏专用)2018版高考数学大一轮复习第十章统计10.2 用样本估计总体教师用书文苏教版的全部内容。
10.2 用样本估计总体1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:将频率分布直方图中各个相邻的矩形的上底边的中点顺次连结起来,就得到频率分布折线图.(2)总体分布的密度曲线:将样本容量取得足够大,分组的组距取得足够小,那么相应的频率折线图趋于一条光滑曲线,称这条光滑曲线为总体分布的密度曲线.3.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.4.标准差和方差(1)标准差是样本数据到平均数的一种平均距离.(2)标准差:s=错误!.(3)方差:s2=1n[(x1-错误!)2+(x2-错误!)2+…+(x n-错误!)2](x n是样本数据,n是样本容量,x是样本平均数).【知识拓展】1.频率分布直方图的特点(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示错误!,频率=组距×错误!。
(2)频率分布直方图中各小长方形的面积之和为1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.2.平均数、方差的公式推广(1)若数据x1,x2,…,x n的平均数为x,那么mx1+a,mx2+a,mx3+a,…,mx n+a的平均数是m错误!+a.(2)数据x1,x2,…,x n的方差为s2.①数据x1+a,x2+a,…,x n+a的方差也为s2;②数据ax1,ax2,…,ax n的方差为a2s2。
人教B版高考总复习一轮数学精品课件 第10章统计与成对数据的统计分析 第3节成对数据的统计分析

=1
=1
=_______________________
来衡量y与x的线性相关性强弱,这里的r称为线性相关系数(简称为相Βιβλιοθήκη 系数).(2)性质
①|r|≤ 1 ,且y与x正相关的充要条件是 r>0 ,y与x负相关的充要条件
是 r<0 ;
②|r|越
小
,说明两个变量之间的线性相关性越
弱
,也就是得出
的回归直线方程越没有价值,即方程越不能反映真实的情况;|r|越 大
r=0.824 5,下列说法正确的是( C )
A.花瓣长度和花萼长度没有相关性
B.花瓣长度和花萼长度呈现负相关
C.花瓣长度和花萼长度呈现正相关
D.若从样本中抽取一部分,则这部分
的相关系数一定是0.824 5
解析 根据散点的集中程度可知,花瓣长度和花萼长度有相关性,A选项错误;
散点的分布是从左下到右上,从而花瓣长度和花萼长度呈现正相关性,B选
床的产品质量有差异?
2
(d-c)
附:χ2=
.
(+)(c+d)(+c)(+d)
α=P(χ2≥k)
k
解
0.05
3.841
0.01
6.635
0.001
10.828
150
(1)由表格数据得甲机床生产的产品中一级品的频率为
200
120
乙机床生产的产品中一级品的频率为
200
=
3
.
5
=
3
;
4
(2)由题意可知
(1)根据散点图推断两个变量是否线性相关.计算相关系数(精确到0.01),并
推断它们的相关程度;
高考数学一轮复习第10章统计与统计案例3成对数据的统计分析课件新人教版

使用相关的统计软件.
3.针对实际问题,会用一元线性回归模型进行预测.
4.通过实例,理解2×2列联表的统计意义,了解2×2列联表独立性检验及其
应用.
备考指导
本节内容在高考选择题、填空题、解答题中均有体现,难度中等.主要体现
在一元线性回归模型的应用和独立性检验的应用.近几年高考中,尤其加强
是( C )
A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强
B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强
C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强
D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强
由样本相关系数r1=0.785 9>0,知x与y正相关,
(1)样本相关系数的公式
r=
∑ (xi -x)(yi -y)
=1
n
∑ ( -)
i=1
2
∑ ( -)
=1
2
=
∑ -
=1
2 2
2
2
∑ - ∑ -
=1
=1
(2)样本相关系数r的取值范围为[-1,1].
.
问题思考
样本相关系数r是如何反映成对样本数据的线性相关程度的?
对点训练1
(1)已知x,y是两个变量,下列四个散点图中,x与y负相关的是( C )
若两个变量负相关,则当一个变量的值增加时,另一个变量的值呈减少的
趋势,故选C.
(2)对四组数据进行统计,获得的散点图如图所示,关于其样本相关系数的
高考数学一轮复习第十章概率、随机变量及其分布课时规范练51随机抽样、用样本估计总体

课时规范练51随机抽样、用样本估计总体基础巩固组1.(2020天津耀华中学高一期末)已知一组数据为4,5,6,7,8,8,40%分位数是()A.8B.7C.6D.52.(多选)(2020江苏泗洪质检)某中学高一年级有20个班,每班50人;高二年级有30个班,每班45人.甲就读于高一,乙就读于高二.学校计划从这两个年级中共抽取235人进行视力调查,下列说法中正确的有()A.应该采用分层随机抽样法B.高一、高二年级应分别抽取100人和135人C.乙被抽到的可能性比甲大D.该问题中的总体是高一、高二年级的全体学生的视力3.(多选)(2020江苏启东高一期末)某人射箭9次,射中的环数依次为7,8,9,7,6,9,8,10,8,关于这组数据,下列说法正确的是()A.这组数据的众数是8B.这组数据的平均数是8C.这组数据的中位数是6D.这组数据的方差是434.将甲、乙两个篮球队10场比赛的得分数据整理成如图所示的茎叶图,由图可知()A.甲队得分的众数是3B.甲、乙两队得分在[30,39)内的频率相等C.甲、乙两队得分的极差相等D.乙队得分的中位数是38.55.(2020陕西榆林高三四模)港珠澳大桥位于中国广东省珠江口伶仃洋海域内,是中国境内一项连接香港、珠海和澳门的桥隧工程,因其超大的建筑规模、空前的施工难度和顶尖的建造技术而闻名世界.2018年10月24日上午9时开通运营后香港到澳门之间4个小时的陆路车程极大缩短.为了解实际通行所需时间,随机抽取了n台车辆进行统计,结果显示这些车辆的通行时间(单位:分钟)都在[35,50]内,按通行时间分为[35,38),[38,41),[41,44),[44,47),[47,50]五组,其中通行时间在[38,47)内的车辆有182台,频率分布直方图如图所示,则n=()A.280B.260C.250D.2006.(2020天津一中高三月考)某社区组织“学习强国”的知识竞赛,从参加竞赛的市民中抽出40人,将其成绩分成以下6组:第1组[40,50),第2组[50,60),第3组[60,70),第4组[70,80),第5组[80,90),第6组[90,100],得到如图所示的频率分布直方图.现采用分层随机抽样的方法,从第2,3,4组中抽取8人,则第2,3,4组抽取的人数依次为()A.1,3,4B.2,3,3C.2,2,4D.1,1,67.(2020山东泰安高一期末)某校从高一新生中随机抽取了一个容量为20的身高样本,数据从小到大排序如下(单位:cm):152,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170,171,x ,174,175,若样本数据的90%分位数是173,则x 的值为.8.(2020北京密云高三质检)某校高一年级三个班共有学生120名,这三个班的男生、女生人数如下表所示,已知在全年级中随机抽取1名学生,抽到二班女生的概率是0.2,则x=.现用分层随机抽样的方法在全年级抽取30名学生,则应在三班抽取的学生人数为.班级一班二班三班女生人数20x y 男生人数2020z 综合提升组9.(多选)(2020山东淄博高三质检)某学校为了调查学生一周内在生活方面的支出情况,抽出了一个容量为n 的样本,其频率分布直方图如图所示,其中支出在[50,60)内的学生有60人,则下列说法正确的是()A.样本中支出在[50,60)内的频率为0.03B.样本中支出不少于40元的人数为132C.n的值为200D.若该校有2000名学生,则定有600人支出在[50,60)内10.在《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱.欲以钱多少衰出之,问各几何?”其译文为:今有甲持560钱,乙持350钱,丙持180钱,甲、乙、丙三人一起出关,关税共100钱,要按照各人带钱多少的比例进行交税,问三人各应付多少税?则下列说法错误的是()A.甲应付5141109钱B.乙应付3224109钱C.丙应付1656109钱D.三者中甲付的钱最多,丙付的钱最少11.(多选)(2020山东嘉祥一中高三月考)在某次高中学科知识竞赛中,对4000名考生的参赛成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间为[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],60分以下视为不及格,若同一组中数据用该组区间中点值作代表,则下列说法中正确的是()A.成绩在[70,80)内的考生人数最多B.不及格的考生人数为1000C.考生竞赛成绩的平均分约为70.5分D.考生竞赛成绩的中位数为75分12.(2020江西九江高三模拟)一组数据中的每一个数据都乘以3,再减去50,得到一组新数据,若求得新的数据的平均数是1.6,方差是3.6,则原来数据的平均数和方差分别是()A.17.2,3.6B.54.8,3.6C.17.2,0.4D.54.8,0.413.(2020福建福州高二期中)为让学生适应新高考的赋分模式,某校在一次校考中使用赋分制给高二年级学生的生物成绩进行赋分,具体方案如下:A等级,排名等级占比7%,分数区间是83—100;B等级,排名等级占比33%,分数区间是71—82;C等级,排名等级占比40%,分数区间是59—70;D等级,排名等级占比15%,分数区间是41—58;E等级,排名等级占比5%,分数区间是30—40.现从全年段的生物成绩中随机抽取100名学生的原始成绩(未赋分)进行分析,其频率分布直方图如图所示:(1)求图中a的值;(2)以样本估计总体的办法,估计该校本次生物成绩原始分不少于多少分才能达到赋分后的C等级及以上(含C等级);(3)若采用分层抽样的方法,从原始成绩在[40,50)和[50,60)内的学生中共抽取5人,查看他们的答题情况来分析知识点上的缺漏,再从中选取2人进行调查分析,求这2人中至少一人原始成绩在[40,50)内的概率.创新应用组14.(多选)(2020重庆巴蜀中学高三月考)气象意义上从春季进入夏季的标志为:“连续5天每天日平均温度不低于22℃”.现有甲、乙、丙三地连续5天日平均温度的记录数据(数据都是正整数,单位:℃)满足以下条件:甲地:5个数据的中位数是24,众数是22;乙地:5个数据的中位数是27,平均数是24;丙地:5个数据有1个是32,平均数是26,方差是10.2,则下列说法正确的是()A.进入夏季的地区至少有2个B.丙地区肯定进入了夏季C.不能肯定乙地区进入夏季D.不能肯定甲地区进入夏季15.如图是某城市100户居民的月平均用电量(单位:度)的频率分布直方图.(1)求频率分布求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?参考答案课时规范练51随机抽样、用样本估计总体1.C因为有6位数,所以6×40%=2.4,所以40%分位数是第三个数6.2.ABD由于各年级的年龄段不一样,因此应采用分层随机抽样法.由于比例为23520×50+30×45=110,因此高一年级1000人中应抽取100人,高二年级1350人中应抽取135人,甲、乙被抽到的可能性都是110,因此只有C不正确,故选ABD.3.ABD数据从小到大排列为6,7,7,8,8,8,9,9,10,所以众数为8,故A正确;中位数为8,故C错误;平均数为6+7+7+8+8+8+9+9+109=8,故B正确;方差为19×[(6-8)2+(7-8)2×2+(8-8)2×3+(9-8)2×2+(10-8)2]=43,故D正确.4.D甲队得分的众数是33和35,故A错误;甲、乙两队得分在[30,39)内的频率分别为25和310,所以甲、乙两队得分在[30,39)内的频率不相等,故B错误;甲队得分的极差为51-24=27,乙队得分的极差为52-22=30,所以甲、乙两队得分的极差不相等,故C错误;乙队得分的中位数是34+432=38.5,故D正确.故选D.5.D由题意可知,通行时间在[38,47)内的频率为1-(0.01+0.02)×3=0.91,所以182=0.91,所以n=200.6.C由图可知第2,3,4组的频率之比为0.15∶0.15∶0.3,所以频数之比为1∶1∶2,现采用分层随机抽样的方法,从第2,3,4组中抽取8人,所以第2,3,4组抽取的人数依次为2,2,4.7.17290%分位数是173,所以r1742=173,x=172.8.249由题意可得120=0.2,解得x=24.三班总人数为120-20-20-24-20=36,用分层随机抽样的方法在全年级抽取30名学生,每个学生被抽到的概率为30120=14,故应从三班抽取的人数为36×14=9.9.BC样本中支出在[50,60)内的频率为1-(0.01+0.024+0.036)×10=0.3,故A错误;样本中支出不少于40元的人数为0.0360.03×60+60=132,故B正确;n=600.3=200,故n的值为200,故C正确;若该校有2000名学生,则可能有0.3×2000=600(人)支出在[50,60)内,故D错误.10.B依题意由分层随机抽样可知,100÷(560+350+180)=10109,则甲应付10109×560=5141109(钱);乙应付10109×350=3212109(钱);丙应付10109×180=1656109(钱).11.ABC由频率分布直方图可得,成绩在[70,80)内的频率最高,因此考生人数最多,故A正确;成绩在[40,60)内的频率为0.01×10+0.015×10=0.25,因此,不及格的人数为4000×0.25=1000,故B 正确;考生竞赛成绩的平均分约为45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5(分),故C正确;因为成绩在[40,70)内的频率为0.45,在[70,80)内的频率为0.3,所以考生竞赛成绩的中位数为70+10×0.050.3≈71.67(分),故D错误.12.C设一组数据为x i(i=1,2,3,…,n),平均数为,方差为12,所得一组新数据为y i(i=1,2,3,…,n),平均数为,方差为22,则y i=3x i-50(i=1,2,3,…,n),=1+2+…+=1.6,即31-50+32-50+…+3-50=1.6,所以3-50=1.6,所以=51.63=17.2.22=1[(y1-)2+(y2-)2+…+(y n-)2]=1[(3x1-50-1.6)2+(3x2-50-1.6)2+…+(3x n-50-1.6)2]=1×9[(x1-17.2)2+(x2-17.2)2+…+(x n-17.2)2]=1×9[(x1-)2+(x2-)2+…+(x n-)2]=3.6,所以912=3.6,所以12=0.4.故选C.13.解(1)由题意(0.010+0.015+0.015+a+0.025+0.005)×10=1,所以a=0.030.(2)由已知等级达到C及以上所占排名等级占比为7%+33%+40%=80%,假设原始分不少于x分可以达到赋分后的C等级及以上,则有(0.005+0.025+0.030+0.015)×10+(60-x)×0.015=0.8,所以x≈57.估计原始分不少于57分才能达到赋分后的C等级及以上.(3)由题知评分在[40,50)和[50,60)内的频率分别为0.1和0.15,则抽取的5人中,评分在[40,50)内的有2人,评分在[50,60)内的有3人,记评分在[50,60)内的3位学生为a,b,c,评分在[40,50)内的2位学生为D,E,则从5人中任选2人的所有可能结果为:(a,b),(a,c),(a,D),(a,E),(b,c),(b,D),(b,E),(c,D),(c,E),(D,E),共10种,其中,这2人中至少一人评分在[40,50)内的可能结果为(a,D),(a,E),(b,D),(b,E),(c,D),(c,E),(D,E),共7种.所以这2人中至少一人评分在[40,50)内的概率为710.14.ABC甲地:5个数据由小到大排,则22,22,24,a,b,其中24<a<b,满足进入夏季的标志;乙地:将5个数据由小到大排,则a,b,27,c,d,其中a≤b≤27≤c≤d,则27+c+d≥81,而a+b+27+c+d=120,故a+b≤39,其中必有一个小于22,故不满足进入夏季的标志;丙地:设5个数据为a,b,c,d,32,且a,b,c,d∈N*,由方差公式可知:(a-26)2+(b-26)2+(c-26)2+(d-26)2+(32-26)2=10.2×5=51,则(a-26)2+(b-26)2+(c-26)2+(d-26)2=15=9+4+1+1,不妨设|a-26|=3,|b-26|=2,|c-26|=|d-26|=1,则a,b,c,d均大于22,满足进入夏季标准.综上,ABC正确.15.解(1)由频率分布直方图得20×(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)=1,解得x=0.0075.(2)由频率分布直方图知众数为230,用电量在[160,220)的频率是20×(0.002+0.0095+0.011)=0.45,用电量在[220,240)的频率为0.0125×20=0.25,设中位数为m,则-22020=0.5-0.450.25,解得m=224,即中位数是224.(3)由频率分布直方图知月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户的频率依次为0.25,0.15,0.1,0.05,则月平均用电量在[220,240)的用户中应抽取户数为0.250.25+0.15+0.1+0.05×11=5,应抽取5户.。
备战2024年高考数学总复习第一轮第十章 统计与成对数据的统计分析第二节 用样本估计总体

)
(2)(多选)(2022·广东茂名二模)小李上班可以选择公交车、自行车两种交
通工具,他分别记录了100次坐公交车和100次骑车所用时间(单位:分钟),得
到下列两个频率分布直方图:
坐公交车时间
骑车时间
基于以上统计信息,则(
)
A.骑车时间的中位数的估计值是22分钟
B.骑车时间的众数的估计值是21分钟
数据中的数;
2.一组数据的某些百分位数可能是同一个数.
2.总体集中趋势的估计
数字特征
概念
众数
不一定唯一,一定是这组
数据中的数
一组数据中出现次数
中位数
唯一,不一定是这组数据
中的数
平均数
最多
的数
把一组数据按从小到大(或从大到小)的顺序排
列,处在
中间
位置的一个数据(或两个数据
的平均数)
如果有 n 个数据 x1,x2,…,xn,那么这 n 个数的平
8
11
)
9
9
10
4
答案 (1)172
(2)C
解析 (1)因为20×90%=18,所以90%分位数是第18和第19个数的平均数,
+174
即
=173,解得
2
x=172.
(2)由50×75%=37.5,故75%分位数为借书数量从小到大排序后的第38人,
又5+8+13+11=37<38<5+8+13+11+9=46,故上四分位数是9.
0.2+0.4+0.25=0.85>0.8,所以80%分位数位于第3个矩形,则80%分位数约为
北师版高考数学一轮总复习课后习题 第十章 统计与成对数据的统计分析 课时规范练48
课时规范练48《素养分级练》P380基础巩固组1.(重庆八中高三开学考试)某单位为了解该单位党员开展学习党史知识活动情况,随机抽取了部分党员,对他们一周的党史学习时间进行了统计,统计数据如下表所示:则该单位党员一周学习党史时间的众数及50%分位数分别是( )A.8,8.5B.8,8C.9,8D.8,9答案:D解析:党员人数一共有6+10+9+7+8=40,学习党史时间为8小时的人数最多,故学习党史时间的众数为8,40×50%=20,那么第50百分位数是第20和21=9.个数的平均数,第20,21个数分别为9,9,所以第50百分位数是9+922.(多选)(江苏苏州模拟)近日,中国最具幸福感城市调查推选活动正式启动,在100个地级及以上候选城市名单中,某市入选.“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[0,10]内的一个数来表示,该数越接近10表示满意度越高.现随机抽取20位该市居民,他们的幸福感指数见下表,则有关这组幸福感指数,下列说法正确的有( )A.这组数据的平均数为7B.这组数据的标准差为3.6C.这组数据的众数为8D.这组数据的80%分位数是8答案:AC解析:对于A,平均数为120×(3+4×2+5+6×3+7×4+8×5+9×2+10×2)=7,所以A正确;对于B,标准差为√120[(3-7)2+2×(4-7)2+(5-7)2+3×(6-7)2+4×(7-7)2+5×(8-7)2+2×( =√3.6,所以B错误;对于C,因为8出现的次数最多,所以这组数据的众数为8,所以C正确;对于D,因为20×0.8=16,所以这组数据的80%分位数是8+9=8.5,所以D错2误.故选AC.3.(全国甲,文2)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图,则( )A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差答案:B解析:对于A,中位数为(70%+75%)÷2=72.5%>70%,A错误;对于B,平均数为89.5%>85%,B正确;对于C,从图中可以看出,讲座前问卷答题的正确率的波动幅度要大于讲座后问卷答题的正确率的波动幅度,故C错误;对于D,讲座后问卷答题的正确率的极差为20%,讲座前问卷答题的正确率的极差为35%,D错误.故选B.4.(多选)(山东潍坊一模)某市共青团委统计了甲、乙两名同学最近十期“青年大学习”答题得分情况,整理成如图所示的茎叶图.则下列说法中正确的是( )A.甲得分的30%分位数是31B.乙得分的众数是48C.甲得分的中位数小于乙得分的中位数D.甲得分的极差等于乙得分的极差答案:BCD解析:对于A,甲得分从小到大排列为27,28,31,39,42,45,55,55,58,66,而10×30%=3,所以甲得分的30%分位数是35,A不正确;对于B,乙的得分中有两个48,其余分数值均只有一个,因此,乙得分的众数是48,B正确;对于C,甲得分的中位数是43.5,乙得分的中位数是45,C正确;对于D,甲得分的极差、乙得分的极差都是39,D正确.故选BCD.5.(多选)(河北唐山一模)有一组互不相等的数组成的样本数据x1,x2,…,x9,其平均数为a(a≠x i,i=1,2,…,9),若插入一个数a,得到一组新的数据,则( )A.两组样本数据的平均数相同B.两组样本数据的中位数相同C.两组样本数据的方差相同D.两组样本数据的极差相同答案:AD解析:由已知可得x1+x2+…+x9=9a.(9a+a)=a,与原数据的平均数相等,A正对于A选项,新数据的平均数为110确;对于B选项,不妨设x1<x2<…<x9,则原数据的中位数为x5,若a<ax{a,x4}+x5)<x5,若a>in{a,x6})>x5,B错误;对于C 选项,新数据的方差为s'2=110[(x 1-a)2+(x 2-a)2+…(x 9-a)2+(a-a)2]<19[(x 1-a)2+(x 2-a)2+…+(x 9-a)2]=s 2,C 错误;对于D 选项,不妨设x 1<x 2<…<x 9,则x 1<a<x 9,故新数据的极差仍为x 9-x 1,D 正确.故选AD.6.(山东济南二模)4月24日是第七个“中国航天日”,今年的主题是“航天点亮梦想”.某校组织学生参与航天知识竞答活动,某班8位同学成绩如下:7,6,8,9,8,7,10,m.若去掉m,该组数据的25%分位数保持不变,则整数m(1≤m≤10)的值可以是 (写出一个满足条件的m 值即可).答案:7或8或9或10(填4个数中任意一个均可)解析:7,6,8,9,8,7,10,m,若去掉m,该组数据从小到大排列为6,7,7,8,8,9,10,则7×0.25=1.75,故25%分位数为第二个数即7,所以7,6,8,9,8,7,10,m,25%分位数为7,而8×0.25=2,所以7为第二个数与第三个数的平均数,所以m(1≤m≤10)的值可以是7或8或9或10. 7.(山东师范大学附中模拟)现有10个数,其平均数是4,且这10个数的平方和是300,那么这组数的标准差是 . 答案:√14解析:设这10个数为x i ,i=1,2,3,…,10,则x =4,则由题可得110(x 1+x 2+…+x 10)=4,所以x 1+x 2+…+x 10=40,x 12+x 22+…+x 102=300,则这组数的标准差是s=√110[(x 1-x )2+(x 2-x )2+…+(x 10-x )2]=√110[(x 12+x 22+…+x 102)-2x (x 1+x 2+…+x 10)+10x 2]=√110(300-2×4×40+10×42)=√14.综合提升组8.(多选)(江苏南通模拟)一组样本数据x 1,x 2,…,x n 的平均数为x(x ≠0),标准差为s.另一组样本数据x n+1,x n+2,…,x 2n 的平均数为3x ,标准差为s.两组数据合成一组新数据x 1,x 2,…,x n ,x n+1,…,x 2n ,新数据的平均数为y ,标准差为s',则 ( )A.y >2xB.y =2xC.s'>sD.s'=s答案:BC 解析:由题意y =nx+n ·3x2n=2x ,故B 正确.ns 2=(x 1-x )2+(x 2-x )2+…+(x n -x )2=∑k=1nx k 2-n x 2,同理ns 2=∑k=n+12nx k 2-n·(3x )2=∑k=n+12nx k 2-9n x 2.两式相加得2ns 2=∑k=12n x k 2-10n x 2,2ns'2=∑k=12n x k 2-2n·(2x )2=∑k=12nx k 2-8n x 2,所以2ns'2>2ns 2,s'>s,故C 正确.9.(山东临沂模拟)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100],得到如图所示的频率分布直方图.已知落在[50,60)的平均成绩是54,方差是7,落在[60,70)的平均成绩为66,方差是4,则两组成绩的总平均数z和总方差s2分别为多少.解:因为所有小矩形的面积之和为1,所以(0.005+0.010+0.020+a+0.025+0.010)×10=1,所以a=0.030.成绩在[50,60)的市民人数为100×0.1=10,成绩在[60,70)的市民人数为100×0.2=20,故z=10×54+66×20=62.10+20设成绩在[50,60)中10人的分数分别为x1,x2,x3, (x10)成绩在[60,70)中20人的分数分别为y1,y2,y3,…,y20,则由题意可得x12+x22+…+x10210-542=7,y12+y22+…+y20220-662=4,所以x12+x22+…+x102=29230,y12+y22+…+y202=87200,所以s2=110+20(x12+x22+…+x102+y12+y22+…+y202)-z2=130(29230+87200)-622=37,所以两组市民成绩的总平均数是62,总方差是37.创新应用组10.(多选)(福建莆田模拟)已知一组数据x1,x2,…,x11是公差不为0的等差数列,若去掉数据x6,则( )A.中位数不变B.平均数变小C.方差变大D.方差变小答案:AC解析:对于选项A,原数据的中位数为x6,去掉x6后的中位数为12(x5+x7)=x6,即中位数没变,故选项A正确;对于选项B,原数据的平均数为x=111(x1+x2+…+x11)=111×11(x1+x11)2=x6,去掉x6后的平均数为x'=110(x1+x2+…+x5+x7+x8+…+x11)=x6=x,即平均数不变,故选项B错误;对于选项C,则原数据的方差为s2=1[(x1-x6)2+(x2-x6)2+…+(x11-x6)2],去掉11[(x1-x6)2+(x2-x6)2+…+(x5-x6)2+(x7-x6)2+…+(x11-x6)2], x6后的方差为s'2=110故s2<s'2,即方差变大,故选项C正确,选项D错误.故选AC.。
2025年高考数学一轮复习-第十章-统计与成对数据的统计分析【课件】
2023年:新高考Ⅱ卷·T19
用样本估 2.体会统计思维与确定性思维
2022年:新高考Ⅱ卷·T19
计总体 的差异、归纳推理与演绎推理
2021年:新高考Ⅰ卷·T9
的差异,通过实际操作,积累数
2021年:新高考Ⅱ卷·T9
据分析的经验.
角度
考查内容
课程标准
高考真题
考题 统计
1.了解相关系数的统计含义;
3.重视数学思想方法的应用 重视数学运算、数据分析、数学建模在解题中的应用,统计是数学思想方法 的重要载体,学习中会经常用到“函数与方程”“分类与整合”“数形结合”“数学建 模”等思想. (1)函数与方程思想 在回归直线方程的应用中,需要利用函数与方程的思想对相关变量进行估计. (2)分类与整合思想 统计中计算中位数时,要分数据个数为偶数和奇数两种情况,含有参数时对 数据进行排序要分类与整合.
变量的相关性与一元 2.了解一元线性回归模型,
线性回归分析
பைடு நூலகம்
并会利用其解决简单的实
际问题.
了解2×2列联表,并会利用 2022年:新高考 列联表与独立性检验
其解决简单的实际问题. Ⅰ卷·T20
角度
考查内容
课程标准
高考真题
1.题型设置:常以选择题、解答题的形式出现; 命题 2.内容考查:本章高考考查的频率较高.常考查样本频率分布直方图、 趋势 列联表与独立性检验、变量的相关性与一元线性回归分析;
(3)数形结合思想 统计中有一类题主要考查读图能力和利用统计图获取信息的能力及处理数 据作出决策的能力,充分体现数形结合思想的作用. (4)数学建模思想 数学建模思想的实质是将实际问题数学化,进而用数学的方法解决统计在实 际问题中的应用,充分体现了数学建模思想的应用.
(适用于新高考新教材)高考数学一轮总复习第十章统计与成对数据的统计分析课时规范练57统计
课时规范练57 统计基础巩固组1.为了解某地区的“健步走”活动情况,拟从该地区的人群中抽取部分人员进行调查.事先已了解到该地区老、中、青三个年龄段人员的“健步走”活动情况有较大差异,而男、女“健步走”活动情况差异不大,在下面的抽样方法中,最合理的抽样方法是()A.抽签法抽样B.按性别分层随机抽样C.按年龄段分层随机抽样D.利用随机数表抽样2.某工厂生产的30个零件编号为01,02,…,19,30,现利用如下随机数表从中抽取5个进行检测.若从表中第1行第5列的数字开始,从左往右依次读取数字,则抽取的第5个零件编号为()A.25B.23C.12D.073.已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层随机抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A.100,40B.100,20C.200,40D.200,204.某高中为调查该校高一年级学生的体育锻炼情况,通过简单随机抽样抽取100名学生,统计其一周的体育锻炼次数,统计数据如图所示,则此100人一周的人均体育锻炼次数为()A.3.9B.4.5C.5.1D.5.55.(2022全国甲,理2)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图,则()A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差6.(多选)(2022山东济宁三模)在某市高三年级举行的一次模拟考试中,某学科共有20 000人参加考试.为了了解本次考试学生的成绩,从中抽取了部分学生的成绩(成绩均为正整数,满分为100分)作为样本进行统计,样本容量为n.按照[50,60),[60,70),[70,80),[80,90),[90,100]的分组作出频率分布直方图,如图所示.其中,成绩落在区间[50,60)内的人数为16.则下列结论正确的是()A.样本容量n=1 000B.图中x=0.030C.估计该市全体学生成绩的平均分为70.6分D.该市要对成绩由高到低前20%的学生授予“优秀学生”称号,则成绩为78分的学生肯定能得到此称号7.某党小组组织开展党史学习教育知识竞赛活动,其中7名党员在这次活动中的成绩统计如图所示.则这7个成绩的中位数所对应的党员是.党史学习教育知识竞赛成绩8.已知某地区人口总数为125万,具体分布如图,近期,卫计委拟针对18到60岁的人群开展疫苗接种工作,抽样发现,他们中有80%的人符合接种的健康要求.截至3月底,已有30%符合健康要求的人接种了第一剂,据要求,这部分人需要在4月份接种第二剂,剩余70%符合健康要求的人需在4月份接种第一剂,5月份接种第二剂.则该地区4月份需要万剂疫苗.综合提升组9.已知数据x1,x2,…,x10,2的平均数为2,方差为1,则数据x1,x2,…,x10相对于原数据()A.一样稳定B.变得比较稳定C.变得比较不稳定D.无法判断其稳定性10.(多选)为了解学生的身体状况,某校随机抽取了100名学生测量体重,经统计,这些学生的体重数据(单位:千克)全部介于45至70之间,将数据整理得到如图所示的频率分布直方图,则()A.频率分布直方图中a的值为0.04B.这100名学生中体重不低于60千克的人数为20C.这100名学生体重的众数约为52.5D.据此可以估计该校学生体重的75%分位数约为61.2511.(多选)有一组样本数据x1,x2,…,x n,由这组数据得到新样本数据y1,y2,…,y n,其中y i=x i+c(i=1,2,…,n),c为非零常数,则()A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同12.为了解某校学生的视力情况,现采用简单随机抽样的方式从该校的A,B两班中各抽4名学生进行视力检测.检测的数据如下:A班:4.1,4.6,4.4,4.9;B班:4.9,4.6,4.2,4.5.(1)分别计算两组数据的平均数,从计算结果看,班的4名学生视力较好;(2)班的4名学生视力方差较大.13.某家水果店的店长为了解本店苹果的日销售情况,记录了近期连续120天苹果的日销售量(单位:千克),并绘制频率分布直方图如下:(1)请根据频率分布直方图估计该水果店苹果日销售量的众数和平均数;(同一组中的数据以这组数据所在区间的中点值作代表)(2)一次进货太多,水果会变得不新鲜;进货太少,又不能满足顾客的需求.店长希望每天的苹果尽量新鲜,又能80%地满足顾客的需求(在10天中,大约有8天可以满足顾客的需求).请问每天应该进多少千克苹果?(精确到整数位)创新应用组14.下图是国家统计局发布的2020年2月至2021年2月全国居民消费价格涨跌幅折线图,则给出下列三个结论:①2020年11月居民消费价格低于2019年同期;②2020年3月至7月居民的消费价格持续增长;③2020年7月的消费价格低于2020年3月的消费价格.其中所有正确结论的序号是.全国居民消费价格涨跌幅折线图说明:1.在统计学中,同比是指本期统计数据与上一年同期统计数据相比较,例如2021年2月与2020年2月相比较;环比是指本期统计数据与上期统计数据相比较,例如2020年4月与2020年3月相比较.2.同比增长率=×100%,环比增长率=×100%.课时规范练57统计1.C解析:根据分层随机抽样的特征知选C.2.C解析:从表中取到的有效数字依次为07,04,08,23,12,则抽取的第5个零件编号为12.故选C.3.D解析:由题图甲可知,学生总数为4500+3500+2000=10000,故抽取的样本容量为10000×2%=200.其中抽取的高中生有200×=40(人).由题图乙可知,高中生近视率为50%,故抽取的高中生近视人数为40×50%=20.故选D.4.C解析:100人一周的人均体育锻炼次数为4×+5×+6×=5.1.故选C.5.B解析:对于A,中位数为(70%+75%)÷2=72.5%>70%,A错误;对于B,平均数为89.5%>85%,B正确;对于C,从图中可以看出,讲座前问卷答题的正确率的波动幅度要大于讲座后问卷答题的正确率的波动幅度,故C错误;对于D,讲座后问卷答题的正确率的极差为20%,讲座前问卷答题的正确率的极差为35%,D错误.故选B.6.BC解析:对于A,因为成绩落在区间[50,60)内的人数为16,所以样本容量n==100,故A不正确;对于B,因为(0.016+x+0.040+0.010+0.004)×10=1,解得x=0.030,故B正确;对于C,学生成绩的平均分为0.016×10×55+0.030×10×65+0.040×10×75+0.010×10×85+0.004×10×95=70.6,故C正确;对于D,因为10×(0.004+0.010)+(8078)×0.040=0.22>0.20,即按照成绩由高到低前20%的学生中不含78分的学生,所以成绩为78分的学生不能得到此称号,故D不正确.故选BC.7.甲解析:根据条形图可知,7名党员的成绩由高到低依次为:庚、丙、戊、甲、丁、己、乙,因此,这7个成绩的中位数所对应的党员是甲.8.70解析:18到60岁的有125×0.7=87.5(万人),其中符合接种的健康要求的有87.5×0.8=70(万人),所以需要70万剂疫苗.9.C解析:由题可得=2,所以x1+x2+…+x10=20,所以平均数为2.由=1得=1.1>1,所以变得比较不稳定,故选C.10.ACD解析:由(0.01+0.07+0.06+a+0.02)×5=1,解得a=0.04,故A正确;体重不低于60千克的频率为(0.04+0.02)×5=0.3,所以这100名学生中体重不低于60千克的人数为0.3×100=30,故B错误;100名学生体重的众数约为=52.5,故C正确;因为体重不低于60千克的频率为0.3,而体重在[60,65)的频率为0.04×5=0.2,所以估计该校学生体重的75%分位数约为60+5×=61.25,故D正确.故选ACD.11.CD解析:x i,+c,故A错误;两组样本数据的样本中位数相差c,故B 错误;(x i)2,[(x i+c)(+c)]2=,故C正确;x极差=x max x min,y极差=(x max+c)(x min+c)=x max x min,故D正确.12.(1)B (2)A 解析:(1)A班数据的平均数×(4.1+4.6+4.4+4.9)=4.5,B班数据的平均数×(4.9+4.6+4.2+4.5)=4.55,从计算结果看,B班的4名学生视力较好.(2)A班数据的方差s2=×[(4.14.5)2+(4.64.5)2+(4.44.5)2+(4.94.5)2]=×(0.42+0.12+0.12+0.42)=0.085,B班数据的方差s'2=×[(4.94.55)2+(4.64.55)2+(4.24.55)2+(4.54.55)2]=×(0.352+0.052+0.352+0.052)=0.0625, 所以A班的4名学生视力方差较大.13.解(1)由题图可知,该水果店苹果日销售量的众数为=85,平均数为=(65×0.0025+75×0.01+85×0.04+95×0.035+105×0.01+115×0.0025)×10=89.75. (2)日销售量在[60,90)内的频率为0.525<0.8,日销量在[60,100)内的频率为0.875>0.8,故所求的量位于[90,100)内.由0.80.525=0.275,得90+≈98,故每天应该进98千克苹果.14.①③解析:对于①,由题图可知2020年11月同比增长率为负值,由同比增长率的计算公式可得,2020年11月居民消费价格低于2019年同期,故①正确;对于②,由题图可知,2020年3月至6月的环比增长率为负,由环比增长率的计算公式可得消费价格下降,故②错误;对于③,设2020年3月居民消费价格为a3,4月消费价格为a4,5月消费价格为a5,6月消费价格为a6,7月消费价格为a7,由题意得×100%=0.9%,解得a4=0.991a3,×100%=×100%=0.8%,解得a5≈0.983a3,×100%≈×100%=0.1%,解得a6≈0.982a3,×100%≈×100%=0.6%,解得a7≈0.988a3,所以a7<a3,所以2020年7月消费价格低于2020年3月消费价格,故③正确.。
(福建专版)高考数学一轮复习课时规范练49用样本估计总体(文)
课时规范练49 用样本估计总体基础巩固组1.一组数据分别为12,16,20,23,20,15,28,23,则这组数据的中位数是()A.19B.20C.21.5D.232.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是()A.甲B.乙C.丙D.丁3.(2017广西南宁一模)某仪器厂从新生产的一批零件中随机抽取40个检测,如图是根据抽样检测后零件的质量(单位:克)绘制的频率分布直方图,样本数据分8组,分别为[80,82),[82,84),[84,86),[86,88),[88,90),[90,92),[92,94),[94,96],则样本的中位数在()A.第3组B.第4组C.第5组D.第6组〚导学号24190795〛4.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为()A.2B.3C.4D.55.在某次测量中得到的甲样本数据如下:42,43,46,52,42,50,若乙样本数据恰好是甲样本每个数据都减5后所得数据,则甲、乙两个样本的下列数字特征对应相同的是()A.平均数B.标准差C.众数D.中位数6.若数据x1,x2,…,x n的平均数为x,方差为s2,则2x1+3,2x2+3,…,2x n+3的平均数和方差分别为()A.x和s2B.2x+3和4s2C.2x+3和s2D.2x+3和4s2+12s+97.(2017辽宁大连一模,文13)某班级有50名同学,一次数学测试平均成绩是92,如果学号为1号到30号的同学平均成绩为90,那么学号为31号到50号同学的平均成绩为.8.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩在[16,18]的学生人数是.〚导学号24190796〛9.某市运动会期间30名志愿者年龄数据如下表:(1)求这30名志愿者年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这30名志愿者年龄的茎叶图;(3)求这30名志愿者年龄的方差.综合提升组10.若一组数据2,4,6,8的中位数、方差分别为m,n,且ma+nb=1(a>0,b>0),则1x +1x的最小值为()A.6+2√3B.4+3√5C.9+4√5D.2011.已知样本(x1,x2,…,x n)的平均数为x,样本(y1,y2,…,y m)的平均数为x(x≠x),若样本(x1,x2,…,x n,y1,y2,…,y m)的平均数x=αx+(1-α)x,其中0<α<12,则n,m的大小关系为() A.n<m B.n>mC.n=mD.不能确定12.(2017山西晋中一模)设样本数据x1,x2,…,x2 017的方差是4,若y i=2x i-1(i=1,2,…,2 017),则y1,y2,…,y2 017的方差为.13.(2017河北邯郸二模,文18)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.〚导学号24190797〛创新应用组14.某学校随机抽取20个班,调查各班有网上购物经历的人数,所得数据的茎叶图如图所示,以5为组距将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是()〚导学号24190798〛15.(2017河北邯郸一模,文18)某校为指导学生合理选择文理科的学习,根据数理综合测评成绩,按6分为满分进行折算后,若学生成绩小于m分建议选择文科,不低于m分则建议选择理科(这部分学生称为候选理科生).现从该校高一随机抽取500名学生的数理综合成绩作为样本,整理得到分数的频率分布直方图(如图所示).(1)求直方图中t的值;(2)根据此次测评,为使80%以上的学生选择理科,整数m至多定为多少?(3)若m=4,试估计该校高一学生中候选理科学生的平均成绩.(精确到0.01)答案:1.B把该组数据按从小到大的顺序排列如下:12,15,16,20,20,23,23,28,排在中间的两个数是20,20,故这组数据的中位数为20+202=20.故选B.2.C由题目表格中数据可知,丙的平均环数最高,且方差最小,说明丙的技术稳定,且成绩好,故选C.3.B由题图可得,前第四组的频率为(0.037 5+0.062 5+0.075+0.1)×2=0.55,则其频数为40×0.55=22,且第四组的频数为40×0.1×2=8,即中位数落在第4组,故选B.4.B依题意可得10×(0.005+0.01+0.02+a+0.035)=1,则a=0.03.所以身高在[120,130),[130,140),[140,150]三组内的学生人数比例为3∶2∶1.所以从身高在[140,150]内的学生中选取的人数应为13+2+1×18=3.5.B设样本甲中的数据为x i(i=1,2,…,6),则样本乙中的数据为y i=x i-5(i=1,2,…,6),则样本乙中的众数、平均数和中位数与甲中的众数、平均数和中位数都相差5,只有标准差没有发生变化,故选B.6.B原数据乘2加上3得到一组新数据,则由平均数、方差的性质可知得到的新数据的平均数、方差分别是2x+3和4s2.7.95设学号为31号到50号同学的平均成绩为x,则92×50=90×30+20x,解得x=95,故答案为95.8.54成绩在[16,18]的学生人数所占比例为6+31+3+7+6+3=920,所以成绩在[16,18]的学生人数为120×920=54.9.解 (1)众数为19,极差为21.(2)茎叶图如图.(3)年龄的平均数为19×7+21×2+28×3+30×4+31×5+32×3+40×630=29,故这30名志愿者年龄的方差为130[(19-29)2×7+2×(21-29)2+3×(28-29)2+4×(30-29)2+(31-29)2×5+(32-29)2×3+(40-29)2×6]=2685.10.D ∵数据2,4,6,8的中位数是5,方差是14(9+1+1+9)=5,∴m=5,n=5.∴ma+nb=5a+5b=1(a>0,b>0).∴1x +1x =(1x +1x )(5a+5b )=5(2+x x +xx )≥20(当且仅当a=b 时等号成立),故选D .11.A 由题意知样本(x 1,…,x n ,y 1,…,y m )的平均数为x =xx +xx x +x=x x +x x +xx +xx .又x =αx +(1-α)x ,即α=xx +x ,1-α=xx +x .因为0<α<12,所以0<x x +x <12,即2n<m+n , 所以n<m ,故选A.12.16 根据题意,设样本数据x 1,x 2,…,x 2 017的平均数为x ,又由其方差为4,则x x 2=12 017[(x 1-x )2+(x 2-x )2+(x 3-x )2+…+(x 2 017-x )2]=4.对于数据y i =2x i -1(i=1,2,…,2 017), 其平均数x =12 017(y 1+y 2+…+y 2 017)=12 017[(2x 1-1)+(2x 2-1)+…+(2x 2 017-1)]=2x -1,其方差x x 2=12 017[(y 1-x )2+(y 2-x )2+(y 3-x )2+…+(y 2 017-x )2]=42 017[(x 1-x )2+(x 2-x )2+(x 3-x )2+…+(x 2 017-x )2]=16,故答案为16.13.解 (1)依题意,得10(2a+0.02+0.03+0.04)=1,解得a=0.005.(2)这100名学生语文成绩的平均分为:55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73(分).(3)数学成绩在[50,60)的人数为:100×0.05=5, 数学成绩在[60,70)的人数为:100×0.4×12=20, 数学成绩在[70,80)的人数为:100×0.3×43=40, 数学成绩在[80,90)的人数为:100×0.2×54=25,所以数学成绩在[50,90)之外的人数为:100-5-20-40-25=10.14.A由组距可知选项C,D不对;由茎叶图可知[0,5)有1人,[5,10)有1人,故第一、二小组频率相同,频率分布直方图中矩形的高应相等,可排除B.故选A.15.解 (1)根据频率分布直方图,得0.15×1+t×1+0.30×1+t×1+0.15×1=1,解得t=0.2.(2)为使80%以上的学生选择理科,则0.15+0.2+0.3<0.8<0.15+0.2+0.3+0.2,故满足条件的m值为2.(3)当m=4时,4.5×0.2×1×500+5.5×0.15×1×5000.2×1×500+0.15×1×500≈4.93,估计该校高一学生中候选理科学生的平均成绩为4.93分.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课时规范练48
基础巩固组
1.(2023·重庆八中高三开学考试)某单位为了解该单位党员开展学习党史知识活动情况,随机抽取了部分党员,对他们一周的党史学习时间进行了统计,统计数据如下表所示:
党史学习时间/小时7 8 9 10 11
党员人数 6 10 9 7 8
则该单位党员一周学习党史时间的众数及50%分位数分别是()
A.8,8.5
B.8,8
C.9,8
D.8,9
答案:D
解析:党员人数一共有6+10+9+7+8=40,学习党史时间为8小时的人数最多,故学习党史时间的众数为8,40×50%=20,那么第50百分位数是第20和21个数的平均数,第20,21个数分别为9,9,所以
第50百分位数是=9.
2.(多选)(2023·江苏苏州模拟)近日,2022年中国最具幸福感城市调查推选活动正式启动,在100个地级及以上候选城市名单中,某市入选.“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[0,10]内的一个数来表示,该数越接近10表示满意度越高.现随机抽取20位该市居民,他们的幸福感指数见下表,则有关这组幸福感指数,下列说法正确的有()
居民编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 幸福感指数 3 4 4 5 6 6 6 7 7 7 7 8 8 8 8 8 9 9 10 10
.6
D.这组数据的80%分位数是8
答案:AC
解析:对于A,平均数为×(3+4×2+5+6×3+7×4+8×5+9×2+10×2)=7,所以A正确;
对于B,标准差为
=,所以B错误;
对于C,因为8出现的次数最多,所以这组数据的众数为8,所以C正确;
对于D,因为20×0.8=16,所以这组数据的80%分位数是=8.5,所以D错误.故选AC.
3.(2022·全国甲,文2)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图,则()
A.讲座前问卷答题的正确率的中位数小于70%
B.讲座后问卷答题的正确率的平均数大于85%
答案:B
解析:对于A,中位数为(70%+75%)÷2=72.5%>70%,A错误;
对于B,平均数为89.5%>85%,B正确;
对于C,从图中可以看出,讲座前问卷答题的正确率的波动幅度要大于讲座后问卷答题的正确率的波动幅度,故C错误;
对于D,讲座后问卷答题的正确率的极差为20%,讲座前问卷答题的正确率的极差为35%,D错误.故选B.
4. (多选)(2022·山东潍坊一模)某市共青团委统计了甲、乙两名同学最近十期“青年大学习”答题得分情况,整理成如图所示的茎叶图.则下列说法中正确的是()
A.甲得分的30%分位数是31
答案:BCD
解析:对于A,甲得分从小到大排列为27,28,31,39,42,45,55,55,58,66,而10×30%=3,所以甲得分的30%分位数是35,A不正确;
对于B,乙的得分中有两个48,其余分数值均只有一个,因此,乙得分的众数是48,B正确;
对于C,甲得分的中位数是43.5,乙得分的中位数是45,C正确;
对于D,甲得分的极差、乙得分的极差都是39,D正确.故选BCD.
5.(多选)(2022·河北唐山一模)有一组互不相等的数组成的样本数据x1,x2,…,x9,其平均数为
a(a≠x i,i=1,2,…,9),若插入一个数a,得到一组新的数据,则()
答案:AD
解析:由已知可得x1+x2+…+x9=9a.
对于A选项,新数据的平均数为(9a+a)=a,与原数据的平均数相等,A正确;
对于B选项,不妨设x1<x2<…<x9,则原数据的中位数为x5,若a<x5,则中位数为(max{a,x4}+x5)<x5, 若a>x5,则中位数为(x5+min{a,x6})>x5,B错误;
对于C选项,新数据的方差为s'2=[(x1-a)2+(x2-a)2+…(x9-a)2+(a-a)2]<[(x1-a)2+(x2-a)2+…+(x9-a)2]=s2,C错误;
对于D选项,不妨设x1<x2<…<x9,则x1<a<x9,故新数据的极差仍为x9-x1,D正确.故选AD.
6.(2022·山东济南二模)2022年4月24日是第七个“中国航天日”,今年的主题是“航天点亮梦想”.某校组织学生参与航天知识竞答活动,某班8位同学成绩如下:7,6,8,9,8,7,10,m.若去掉m,该组数据的25%分位数保持不变,则整数m(1≤m≤10)的值可以是(写出一个满足条件的m值即可).
答案:7或8或9或10(填4个数中任意一个均可)
解析: 7,6,8,9,8,7,10,m,若去掉m,该组数据从小到大排列为6,7,7,8,8,9,10,则7×0.25=1.75,故25%分位数为第二个数即7,所以7,6,8,9,8,7,10,m,25%分位数为7,而8×0.25=2,所以7为第二个数与第三个数的平均数,所以m(1≤m≤10)的值可以是7或8或9或10.
7.(2023·山东师范大学附中模拟)现有10个数,其平均数是4,且这10个数的平方和是300,那么这组数的标准差是.
答案:
解析:设这10个数为x i,i=1,2,3,…,10,则=4,则由题可得(x1+x2+…+x10)=4,所以
x1+x2+…+x10=40,+…+=300,则这组数的标准差是s=
=
.
综合提升组
8.(多选)(2023·江苏南通模拟)一组样本数据x1,x2,…,x n的平均数为≠0),标准差为s.另一组样本数据x n+1,x n+2,…,x2n的平均数为3,标准差为s.两组数据合成一组新数据
x1,x2,…,x n,x n+1,…,x2n,新数据的平均数为,标准差为s',则()
A.>2
B.=2
C.s'>s
D.s'=s
答案:BC
解析:由题意=2,故B正确.
ns2=(x1-)2+(x2-)2+…+(x n-)2=-n,
同理ns2=-n·(3)2=-9n.
两式相加得2ns2=-10n,2ns'2=-2n·(2)2=-8n,所以2ns'2>2ns2,s'>s,故C正
确.
9.(2023·山东临沂模拟)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100],得到如图所示的频率分布直方图.
已知落在[50,60)的平均成绩是54,方差是7,落在[60,70)的平均成绩为66,方差是4,则两组成绩的总平均数和总方差s2分别为多少.
解:因为所有小矩形的面积之和为1,
所以(0.005+0.010+0.020+a+0.025+0.010)×10=1,所以a=0.030.
成绩在[50,60)的市民人数为100×0.1=10,成绩在[60,70)的市民人数为100×0.2=20,故
=62.
设成绩在[50,60)中10人的分数分别为x1,x2,x3, (x10)
成绩在[60,70)中20人的分数分别为y1,y2,y3,…,y20,则由题意可得-
542=7,-662=4,所以+…+=29230,+…+=87200,所以
s2=+…++…+)-(29230+87200)-622=37,所以两组市民成绩的总
平均数是62,总方差是37.
创新应用组
10.(多选)(2023·福建莆田模拟)已知一组数据x1,x2,…,x11是公差不为0的等差数列,若去掉数据x6,则()
答案:AC
解析:对于选项A,原数据的中位数为x6,去掉x6后的中位数为(x5+x7)=x6,即中位数没变,故选项A 正确;
对于选项B,原数据的平均数为(x1+x2+…+x11)==x6,去掉x6后的平均数为
'=(x1+x2+…+x5+x7+x8+…+x11)=x6=,即平均数不变,故选项B错误;
对于选项C,则原数据的方差为s2=[(x1-x6)2+(x2-x6)2+…+(x11-x6)2],去掉x6后的方差为s'2=[(x1-x6)2+(x2-x6)2+…+(x5-x6)2+(x7-x6)2+…+(x11-x6)2],故s2<s'2,即方差变大,故选项C正确,选项D错误.故选AC.。