最新数学一轮复习精品试题第48讲随机抽样、用样本估计总体、变量间的相互关汇总
2019版高考数学文科一轮复习:11.2 随机抽样、用样本估计总体

13
考点四 统计与概率
1.(2018北京,17,13分)电影公司随机收集了电影的有关数据,经分类整理得到下表:
电影类型 第一类
第二类
第三类
第四类
第五类
第六类
电影部数
140
50
300
200
800
510
好评率
0.4
0.2
0.15
0.25
0.2
0.1
好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.
2019/8/12
遇上你是缘分,愿您生活愉
6
思路分析 第(1)问,需要计算该市居民月用水量在各区间内的频率,根据样本的频率分布直方 图即可获解. 第(2)问,由月用水量的频率分布直方图和w=3可得居民该月用水费用的数据分组与频率分布 表,由此可估计该市居民该月的人均水费.
难点突破 第(2)问本质上是考查加权平均数的概念,这个权重就是频率,所以结合第(1)问和 加权平均数的概念,就可以算出人均水费.
厨余垃圾 可回收物 其他垃圾
“厨余垃圾”箱 400 30 20
“可回收物”箱 100 240 20
“其他垃圾”箱 100 30 60
2019/8/12
遇上你是缘分,愿您生活愉
11
(1)试估计厨余垃圾投放正确的概率; (2)试估计生活垃圾投放错误的概率; (3)假设厨余垃圾在“厨余垃圾”箱、“可回收物”箱、“其他垃圾”箱的投放量分别为a,b, c,其中a>0,a+b+c=600.当数据a,b,c的方差s2最大时,写出a,b,c的值(结论不要求证明),并求此时s2 的值.
方法总结 在频率分布直方图中,各小长方形的面积表示相应各组的频率,所有小长方形的面 积的和等于1.
(整理)年数学一轮复习精品试题第48讲随机抽样、用样本估计总体、变量间的相互关.

第四十八讲随机抽样、用样本估计总体、变量间的相互关系、统计案例班级________姓名________考号________日期________得分________一、选择题:(本大题共6小题,每小题6分,共36分,将正确答案的代号填在题后的括号内.)1.一个单位有职工160人,其中业务人员96人,管理人员40人,后勤服务人员24人,为了了解职工的收入情况,要从中抽取一个容量为20的样本,如何去抽取?解法一:将160人从1至160编号,然后将用白纸做成有1~160号的160个号签放入箱内搅匀,最后从中取20个签,与签号相同的20个人被选出.解法二:将160人从1至160编号,按编号顺序分成20组,每组8人,令1~8号为第一组,9~16号为第二组,…,153~160号为第20组.从第一组中用抽签方式抽到一个为k号(1≤k≤8),其余组是(k+8n)号(n=1,2,3,…,19),如此抽到20人.解法三:按=的比例,从业务员中抽取12人,从管理人员中抽取5人,从后勤人员中抽取3人,都用简单随机抽样法从各类人员中抽取所需人数,他们合在一起恰好抽到20人.以上的抽样方法,依次是简单随机抽样、分层抽样、系统抽样的顺序是()A.解法一、解法二、解法三B.解法二、解法一、解法三C.解法一、解法三、解法二D.解法三、解法一、解法二解析:解法二为简单随机抽样,解法二为系统抽样,解法三为分层抽样,故选C.答案:C2.一个样本a,3,5,7的平均数是b,且a、b是方程x2-5x+4=0的两根,则这个样本的方差是()A.3B.4C.5 D.6解析:x2-5x+4=0的两根是1,4.当a=1时,a,3,5,7的平均数是4,当a=4时,a,3,5,7的平均数不是1.∴a=1,b=4.则方差s2=14×[(1-4)2+(3-4)2+(5-4)2+(7-4)2]=5,故选C.答案:C3.为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图所示,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力从4.6到5.0之间的学生数为b,则a,b的值分别为()A.0.27,78 B.0.27,83C.2.7,78 D.2.7,83解析:由图知共有9组,故后6组的频率是以2.7×0.1=0.27为首项,d为公差的等差数列,又各组频率之和为0.01+0.03+0.09+0.27×6+15d=1,故d=-0.05.所以各组的频率依次为0.01,0.03,0.09,0.27,0.22,0.17,0.12,0.07,0.02,故a=0.27,b=(0.27+0.22+0.17+0.12)×100=78,故选A.答案:A4.下列有关线性回归的说法,不正确的是()A.相关关系的两个变量不是因果关系B.散点图能直观地反映数据的相关程度C.回归直线最能代表线性相关的两个变量之间的关系D.任一组数据都有回归方程解析:根据两个变量属相关关系的概念,可知A正确;散点图能直观地描述呈相关关系的两个变量的离散程度,且回归直线最能代表它们之间的相关关系,所以B、C正确;只有线性相关的数据才有回归直线,所以D不正确.答案:D5.利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅下表来确定断信“X和Y有关系”的可信度.如果k>5.024,那么就有把握认为“X和Y有关系”的百分比为()C.2.5% D.97.5%解析:∵k>5.024时,“X和Y无关系”的可信度0.025,所以“X和Y有关系”百分比97.5%.答案:D6.下面是一个2×2列联表则表中a ,bA .94,96B .52,50C .52,54D .54,52解析:∵a +21=73,∴a =52. 又∵a +2=b 知b =54,故选C. 答案:C二、填空题:(本大题共4小题,每小题6分,共24分,把正确答案填在题后的横线上.) 7.某企业三月中旬生产A 、B 、C 三种产品共3000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:由于不小心,表格中A 产品的样本容量比C 产品的样本容量多10.根据以上信息,可得C 产品的数量是________件.解析:设样品的容量为x ,则x 3000×1300=130,所以x =300.所以A 产品和C 产品在样本中共有300-130=170(件).设C 产品的样本容量为y ,则y +(y +10)=170,所以y =80.所以C 产品的数量为3000300×80=800(件).答案:8008.已知总体的各个体的值由小到大依次为2,3,3,7,a ,b,12,13.7,18.3,20,且总体的中位数为10.5,若要使该总体的方差最小,则a ,b 的取值是________和________.解析:由题意a +b =21,故平均数x -=10. 欲使方差最小,只需使(a -10)2+(b -10)2最小,又∵(a -10)2+(b -10)2=a 2+b 2-20(a +b )+200=a 2+b 2-220=(a +b )2-2ab -220=221-2ab ≥221-2⎝ ⎛⎭⎪⎫a +b 22,当且仅当a =10.5,b =10.5时最小,故a =10.5,b =10.5时,s 2最小.答案:10.5 10.59.某地教育部门为了调查学生在数学答卷中的有关信息,从上次考试的10000名考生的数学试卷中用分层抽样的方法抽取500人,并根据这500人的数学成绩画出样本的频率分布直方图(如图),则10000人的数学成绩在[140,150]段的约是________人.解析:设500人的数学成绩在[140,150]段的人数为x,10000人的数学成绩在[140,150]段的人数为n .由样本频率分布直方图知数学成绩在[140,150]段的频率最小矩形的面积,即为0.008×10=0.08=x 500,∴x =40.又样本的个数占总个数的120,即每组的抽样比为120,∴120=40n,∴n =800. ∴10000人的数学成绩在[140,150]段的约是800人. 答案:80010.某肉食鸡养殖小区某种病的发病鸡只数呈上升趋势,统计近4个月这种病的新发病鸡只数的线性回归分析如下表所示:如果不加控制,仍按这个趋势发展下去,请预测从9月初到12月底的4个月时间里,该养殖小区这种病的新发病鸡总只数约为________.解析:由上表可得:y ^=94.7x +1924.7,当x 分别取9,10,11,12时,得估计值分别为:2777,2871.7,2966.4,3061.1,则总只数约为2777+2871.7+2966.4+3061.1≈11676.答案:11676三、解答题:(本大题共3小题,11、12题13分,13题14分,写出证明过程或推演步骤.)11.一个地区共有5个乡镇30000人,其中人口比例为,要从这30000人中抽取300个人进行某种传染病分析,因考虑该传染病与不同地理位置及水土有关,问应采取什么样的抽样方法?写出抽样过程.解:应采用分层抽样的方法. 具体抽样过程如下:(1)计算抽样比:30030000=1100;(2)计算各乡镇人口数分别为:315×30000=6000,215×30000=4000,515×30000=10000,115×30000=2000,415×30000=8000; (3)计算各乡镇抽取的人口数分别为:6000×1100=60,4000×1100=40,10000×1100=100,2000×1100=20,8000×1100=80;(4)用系统抽样的方法依次从五个乡镇中抽出60人,40人,100人,20人,80人; (5)将抽取的个体合在一起,就构成所要抽取的一个样本. 12.据报道,某公司的33名职工的月工资(以元为单位)如下:(2)假设副董事长的工资从5000元提升到20000元,董事长的工资从5500元提升到30000元,那么新的平均数、中位数、众数又是什么?(精确到元)(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法.解:(1)平均数是x -=1500+4000+3500+2000×2+1500+1000×5+500×3+0×2033≈1500+591=2091(元).中位数是1500元,众数是1500元. (2)平均数是x -′=1500+28500+18500+2000×2+1500+1000×5+500×3+0×2033≈1500+1788=3288(元).中位数是1500元,众数是1500元.(3)在这个问题中,中位数或众数均能反映该公司员工的工资水平.因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差数大,所以平均数不能反映这个公司员工的工资水平.13.要分析学生初中升学的数学成绩对高一年级数学学习有什么影响,在高一年级学生中随机抽选10名学生,分析他们入学的数学成绩和高一年级期末数学考试成绩,如下表所示:(1)画出散点图; (2)求回归直线方程;(3)若某学生王明亮的入学数学成绩为80分,试预测他在高一年级期末考试中的数学成绩为多少?解:(1)作出散点图如图所示,从散点图可以看出,这两个变量具有线性相关关系.(2)可求得x -=110(63+67+…+76)=70,y -=110(65+78+…+75)=75.b =54284-10×70×7551474-10×702≈0.721,∴a =75-0.721×70≈24.53. 所求的线性回归方程为 y -=0.721x +24.53.(3)若王明亮入学数学成绩为80分,代入上面的线性回归方程 y -=0.721x +24.53可得y -≈82分.。
2025届高中数学一轮复习课件《随机抽样、用样本估计总体》ppt

高考一轮总复习•数学
第21页
(3)(2024·江西吉安模拟)总体由编号为 00,01,02,…,48,49 的 50 个个体组成,利用下面 的随机数表选取 6 个个体,选取方法是从随机数表第 6 行的第 9 列和第 10 列数字开始从
数字 3. 数字 3. 左到右依次选取两个数字,则选出的第 3 个个体的编号为 ( )
高考一轮总复习•数学
第10页
2.总体方差和总体标准差 (1)一般式:如果总体中所有个体的变量值分别为 Y1,Y2,…,YN,总体平均数为 Y ,则
总体方差 S2=N1i=N1 (Yi- Y )2.
(2)加权式:如果总体的 N 个变量值中,不同的值共有 k(k≤N)个,不妨记为 Y1,Y2,…,
Yk,其中 Yi 出现的频数为 fi(i=1,2,…,k),则总体方差为 S2=N1i=k1fi(Yi- Y )2.
高考一轮总复习•数学
第12页
3.简单随机抽样样本平均数、方差的计算公式的推广 (1)若数据 x1,x2,…,xn 的平均数为 x ,则数据 mx1+a,mx2+a,mx3+a,…,mxn +a 的平均数是 m x +a; (2)若数据 x1,x2,…,xn 的方差为 s2,则数据 ax1+b,ax2+b,…,axn+b 的方差为 a2s2. 4.分层随机抽样样本均值、方差的计算公式的推广 如果将总体分为 k 层,第 j 层抽取的样本量为 nj,样本均值为 x j,样本方差为 s2j ,j=
高考一轮总复习•数学
第24页
(3)按随机数法,从随机数表第 6 行的第 9 列和第 10 列数字开始从左到右依次选取两个数 字,超出 因为编号由 2 个数字组成.
00~49 及重复的不选,则编号依次为 33,16,20,38,49,32,…,则选出的第 3 个个体的编 号为 20.故选 D.
2025版高考数学一轮总复习素养提升第9章第1讲随机抽样用样本估计总体(含答案)

高考数学一轮总复习素养提升:几种常见的统计图形一、扇形图(饼状图)——用一个圆表示总体,圆中各扇形分别代表总体中的不同部分,每个扇形的大小反映所表示的那部分占总体的百分比的大小,这样的一种表示和分析数据的统计图称为扇形图.(多选题)(2024·南京师大附中阶段测试)某中学为了解学生数学史知识的积累情况,随机抽取150名同学参加数学史知识测试,测试题共5道,每答对一题得20分,答错得0分,得分不少于60分记为及格,不少于80分记为优秀,测试成绩百分比分布图如图所示,则( AC )A.该次数学史知识测试及格率超过90%B.该次数学史知识测试得满分的同学有15名C.该次测试成绩的中位数大于测试成绩的平均数D.若该校共有1 500名学生,则数学史知识测试成绩能得优秀的同学大约有720名[解析]由图知,及格率为1-8%=92%>90%,故A正确;该测试满分同学的百分比为1-8%-32%-48%=12%,即有12%×150=18名,故B错误;由图知,中位数为80分,平均数为40×8%+60×32%+80×48%+100×12%=72.8分,故C正确;由题意,1 500名学生成绩能得优秀的同学有1 500×(48%+12%)=900,故D错误.故选AC.二、条形图(柱状图)——建立直角坐标系,用横轴(横轴上的数字)表示样本数据类型,用纵轴上的单位长度表示一定的数量,根据每个样本(或某个范围内的样本)的数量多少画出长短不同的等宽矩形,然后把这些矩形按照一定的顺序排列起来,这样一种表达和分析数据的统计图称为条形图.(2023·安徽蚌埠质检)已知某地区中小学生人数如图甲所示,为了解该地区中小学生的近视情况,卫生部门根据当地中小学生人数,用分层抽样的方法抽取了10%的学生进行调查,调查数据如图乙所示,则估计该地区中小学生的平均近视率为( D )A .50%B .32%C .30%D .27%[解析] 根据题意,抽取的样本容量为(3 500+4 500+2 000)×10%=1 000,其中小学生、初中生、高中生抽取人数分别为:350,450,200,根据图乙知抽取的小学生、初中生、高中生中,近视的人数分别为:35,135,100,所以该地区学生的平均近视率为35+135+1001 000×100%=27%,故选D.三、折线图——建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应各点,然后把各点用线段顺次连接,得到一条折线,用这种折线表示出样本数据的情况,这样的一种表示和分析数据的统计图称为折线图.折线图主要用于描述数据随时间的变化趋势.(多选题)(2024·湖湘名校联合体联考)某学校校医对生病的甲、乙两名同学一周的体温进行了统计,其结果如图所示,则下列说法正确的有( AC )A .甲同学的体温的平均值为36.4 ℃B .甲同学的体温的方差为0.2C .乙同学的体温的众数、中位数都为36.4 ℃D .乙同学的体温的极差为0.3 ℃[解析] 甲同学体温的平均值为17×(36.4+36.2+36.5+36.2+36.6+36.4+36.5)=36.4 ℃,故A 正确;由方差计算公式可知17×(02+0.22+0.12+0.22+0.22+02+0.12)=0.02,故B 错误;乙同学体温按从小到大排列为:36.3 ℃,36.3 ℃,36.4 ℃,36.4 ℃,36.4 ℃,36.5 ℃,36.5 ℃,故乙同学体温的众数、中位数都为36.4 ℃,故C 正确;由上述排列可知,乙同学体温的极差为0.2 ℃,故D 错误.故选AC.四、雷达图(网络图、蜘蛛图)——一种能够直观地展示多维度的类目数据对比情况的统计图.1.(2024·广东实验中学阶段测试)2025年某省将实行“3+1+2”模式的新高考,其中“3”表示语文、数学和英语这三门必考科目,“1”表示必须从物理和历史中选考一门科目,“2”表示要从化学、生物、政治和地理中选考两门科目.为帮助甲、乙两名高一学生应对新高考,合理选择选考科目,将其高一年级的成绩综合指标值(指标值满分为5分,分值越高成绩越优)整理得到如下的雷达图,则下列选择最合理的是( D )A.选考科目甲应选物理、化学、历史B.选考科目甲应选化学、历史、地理C.选考科目乙应选物理、政治、历史D.选考科目乙应选政治、历史、地理[解析]根据雷达图,甲同学按照科目综合指标值从高到低顺序为:物理、历史(化学)、地理、生物、政治,乙同学按照科目综合指标值从高到低顺序为:历史、物理(政治)、地理、生物、化学,根据新高考选科模式规则,选考科目甲应选物理、化学、地理;选考科目乙应选历史、政治、地理.故选D.2.(多选题)(2024·湖南名校联合体联考)如图所示是世界人口变化情况的三幅统计图:则下列结论正确的是( ABC )A.从折线图能看出世界人口的总量随着年份的增加而增加B.2050年亚洲人口将比其他各洲人口的总和还要多C.2050年南美洲及大洋洲人口之和将与欧洲人口基本持平D.1957年到2050年各洲中北美洲人口增长速度最慢[解析]从折线图能看出世界人口的总量随着年份的增加而增加,故A正确;从扇形图中能够明显地看出2050年亚洲人口将比其他各洲人口的总和还要多,故B正确;从条形图中能够明显地看出2050年南美洲及大洋洲人口之和将与欧洲人口基本持平,故C正确;由题中三幅统计图并不能得出从1957年到2050年中哪个洲人口增长速度最慢,故D错误.故选ABC.。
2025高考数学一轮复习-第45讲-随机抽样的方法、用样本估计总体【课件】

举题说法
百分位数的估计
1 (1) 现有一组数据:663,664,665,668,671,664,656,674
,651,653,652,656.则这组数据的第85百分位数是
( C)
A.652
B.668
C.671
D.674
【解析】 由题意,这组数据共12个,则12×85%=10.2.将这组数据按从小到大的顺序 排列为651,652,653,656,656,663,664,664,665,668,671,674,故这组 数据的第85百分位数为第11个数,即671.
【解析】对于 A,设 x2,x3,x4,x5 的平均数为 m,x1,x2,…,x6 的平均数为 n,则 n-m=x1+x2+x3+6 x4+x5+x6-x2+x3+4 x4+x5=2(x1+x6)-(x122+x3+x4+x5),因为无 法确定 2(x1+x6),x2+x3+x4+x5 的大小关系,所以无法判断 m,n 的大小,如 1,2, 3,4,5,6,可得 m=n=3.5;如 1,1,1,1,1,7,可得 m=1,n=2;如 1,2, 2,2,2,2,可得 m=2,n=161,故 A 错误. 对于 B,不妨设 x1≤x2≤x3≤x4≤x5≤x6,可知 x2,x3,x4,x5 的中位数等于 x1,x2,…, x6 的中位数,均为x3+2 x4,故 B 正确.
【解答】 x =110×(545+533+551+522+575+544+541+568+596+548)=552.3, y =110×(536+527+543+530+560+533+522+550+576+536)=541.3,z = x - y =552.3-541.3=11,zi=xi-yi 的值分别为 9,6,8,-8,15,11,19,18,20,12, 故 s2=110×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+0+(19-11)2+ (18-11)2+(20-11)2+(12-11)2]=61.
高考数学一轮总复习课件:随机抽样、用样本估计总体

6.(2020·天津)从一批零件中抽取 80 个,测量其直径(单位: mm),将所得数据分为 9 组:[5.31,5.33),[5.33,5.35),…,[5.45, 5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽 取的零件中,直径落在区间[5.43,5.47)内的个数为( B )
n 的样本进行调查,其中从丙车间的产品中抽取了 3 件,则 n=
(D ) A.9
B.10
C.12
D.13
【解析】 由分层抽样可得630=2n60,解得 n=13.
【讲评】 进行分层抽样的相关计算时,常利用以下关系式 巧解:
①总样体本的容个量数nN=该层该抽层取的的个个体体数数; ②总体中某两层的个体数之比等于样本中这两层抽取的个 体数之比.
5.对某商店一个月内每天的顾客人数进行了统计,得到样本 的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( A )
A.46,45,56 B.46,45,53 C.47,45,56 D.45,47,53
解析 从茎叶图中可以看出样本数据的中位数为中间两个数的 平均数,即45+2 47=46,众数是 45,极差为 68-12=56,故选择 A.
状元笔记
(1)一个抽样试验能否用抽签法,关键看两点:一是制签是否 方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都 较小时可用抽签法.
(2)在使用随机数表时,如遇到取两位数或三位数,可从选择 的随机数表中的某行某列的数字计起,每两个或每三个作为一个 单位,自左向右选取,有超过总体号码或出现重复号码的数字舍 去.
个最高分、1 个最低分,得到 7 个有效评分.7 个有效评分与 9 个
原始评分相比,不变的数字特征是( A )
高三数学一轮复习:0103随机抽样、用样本估计总体
6.(2020·天津)从一批零件中抽取 80 个,测量其直径(单位:mm),将所得数据分为 9 组: [5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图, 则在被抽取的零件中,直径落在区间[5.43,5.47]内的个数为( )
ห้องสมุดไป่ตู้32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42 84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04 32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45 若从表中第 6 行第 6 列开始向右依次读取 3 个数据,则得到的第 5 个样本数据为( ) A.578 B.324 C.535 D.522
随机抽样、用样本估计总体
1.随机抽样 (1)简单随机抽样:一般地,从个体数为 N 的总体中逐个不放回地取出 n 个个体作为样本(n<N), 如果每个个体都有相同的机会被取到,那么这样的抽样方法称为简单随机抽样. (2)分层抽样:一般地,当总体由差异明显的几个部分组成时,常常将总体中的个体按不同的 特点分成层次比较分明的几个部分,然后按各个部分在总体中所占的比实施抽样,这种抽样 方法叫分层抽样,所分成的各个部分称为“层”.
2025高考数学一轮复习课件 随机抽样、用样本估计总体
夯实双基
1.判断下面结论是否正确(打“√”或“×”). (1)不放回简单随机抽样是从总体中逐个不放回地抽取样本.
答案 √
(2)分层随机抽样是将每层各抽取相同的个体数构成样本,分层随机抽样 为保证各个个体等可能入样,必须进行每层等可能抽样.
答案 ×
(3)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论. 答案 ×
总体集中趋势与离散程度的估计
(1)众数:一组数据中出现次数最多的数.
(2)中位数:将数据从小到大(或从大到小)排列,若有奇数个数,则最中
间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.
(3)平均数:
-x
x1+x2+…+xn
=________n_______________,反映了一组数据的平均水
霸”A.√抽样表明,该校有一半学生为“阅读
B.该校只有 50 名学生不喜欢阅读 C.该校只有 50 名学生喜欢阅读 D.抽样表明,该校有 50 名学生为“阅读霸”
解析 根据频率分布直方图可列下表:
阅读时
[0,
间(分钟)
10)
[10, 20)
[20, 30)
[30, 40)
[40, 50)
[50, 60]
A√.3
1 C.4
B.4 1
D.3
【解析】 由题意知 x1+x2+…+xm=m-x , y1+y2+…+yn=n-y , -z =(x1+x2+…+xm)m++(n y1+y2+…+yn) =m-xm+ +nn-y =mm+-xn+mn+-y n=14-x +43-y ,所以m+m n=14,m+n n=34,可得
3m=n,所以mn =13.
状元笔记
(1)简单随机抽样、分层随机抽样中,总体中每个个体入样的可能性是 相同的.
2020届高考数学(理)一轮复习精品特训专题十一:概率与统计(6)随机抽样与用样本估计总体.pdf
2,
2
x
,
y 这 4 个数据的平均数为
1,
则y
1
的最小值为 __________
x
14、如图是某班级 10 名男生引体向上的测试成绩的茎叶图,
则这组数据的方差是 ________.
15、“累积净化量( CCM)”是空气净化器质量的一个重要衡量指标,它是指空气净化器从开
始使用到净化效率为 50%时对颗粒物的累积净化量,以克表示,根据
计图,假设该月温度的中位数为 mc ,众数为 m0 ,平均数为 x ,则( )
A. mc m0 x B. mc m0 x
C. mc m0 x D. m0 mc x
10、某校进行了一次创新作文大赛, 共有 100 名同学参赛,经过评判, 这 100 名参赛者的得
分都在 [40,90] 之间,其得分的频率分布直方图如图,则下列结论错误的是(
5、某校数学教研组为了解学生学习数学的情况
, 采用分层抽样的方法从高一 600 人、高二
780 人、高三 n 人中 , 抽取 35人进行问卷调查 , 已知高二被抽取的人数为 13 人 , 则 n 等于
()
A.660
B.720
C.780
D.800
6、某校选修乒乓球课程的学生中 , 高一年级有 30 名 , 高二年级有 40 名 , 现用分层抽样的方法
3204 9234 4935 8200 3623 4869 6938 7481
A.08
B.07
C.02
D.01
2、某中学有高中生 3500人 , 初中生 1500人 , 为了解学生的学习情况 , 用分层抽样的方法从
该校学生中抽取一个容量为 n 的样本 , 已知从高中生中抽取 70 人 , 则 n 为 (
2025年高考数学一轮复习-抽样方法、统计图表、用样本估计总体-专项训练【含答案】
2025年高考数学一轮复习-抽样方法、统计图表、用样本估计总体-专项训练基础巩固练1.(2023连云港期中)下列一组数据的第30百分位数是()2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6.A.3.0B.3.2C.3.3D.4.42.从某中学抽取10名同学,得到他们的数学成绩(单位:分)如下:88,85,82,92,90,92,96,92,96,98.这10名同学数学成绩的众数、中位数分别为()A.92,92B.92,96C.96,92D.92,903.(2023宿迁月考)统计某样本数据得到的频率分布直方图如图所示,已知该样本容量为300,则样本数据落在[6,14)内的频数为()A.68B.170C.204D.2404.如图,这是某市2023年国庆节假期的楼房认购量与成交量的折线图,小明同学根据折线图对这7天的认购量(单位:套)与成交量(单位:套)作出如下判断,则下列判断正确的为()A.日成交量的中位数是16B.日成交量超过日平均成交量的有2天C.10月7日认购量的增幅大于10月7日成交量的增幅D.日认购量的方差大于日成交量的方差5.(多选题)在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本.方法1:采用简单随机抽样的方法,将零件分别编号为00,01,02,…,99,用抽签法抽取20个.方法2:采用分层随机抽样的方法,从一级品中随机抽取4个,从二级品中随机抽取6个,从三级品中随机抽取10个.对于上述问题,下列说法正确的是()A.无论采用哪种抽样方法,这100个零件中每一个零件被抽到的可能性都是15B.采用不同的方法,这100个零件中每一个零件被抽到的可能性各不相同C.在上述两种抽样方法中,方法2抽到的样本比方法1抽到的样本更能反映总体的特征D.在上述两种抽样方法中,方法1抽到的样本比方法2抽到的样本更能反映总体的特征6.(多选题)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()甲乙A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的平均数等于乙的成绩的平均数C.甲的成绩的第80百分位数等于乙的成绩的第80百分位数D.甲的成绩的极差等于乙的成绩的极差7.在一次竞选中,规定一个人获胜的条件如下:(1)在竞选中得票最多;(2)得票数不低于总票数的一半.在计票时,周鹏得票的数据丢失.候选人赵明钱红孙华李丽周鹏得票数3001003060x如果周鹏获胜,那么周鹏的得票数x的最小值为.8.(2023盐城调研)已知某8个数据的平均数为5,方差为3,现又加入一个新数据5,此时这9个数据的方差为.9.某大学艺术专业400名学生参加某次测评,根据男、女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成[20,30),[30,40),…,[80,90]七组,并整理得到如图所示的频率分布直方图:(1)从样本中随机抽取一人,求其分数小于70的频率.(2)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男、女生人数相等.试估计总体中男生和女生人数的比.综合提升练10.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量,并得到频率分布直方图如图:则这20名工人一天生产该产品的数量的中位数为()A.65B.64C.62.5D.6011.一组数据的平均数为a,方差为b,将这组数据的每个数都乘m(m>0)后得到一组新数据,则下列说法正确的是()A.这组新数据的平均数为aB.这组新数据的平均数为a+mC.这组新数据的方差为mbD.这组新数据的方差为m2b12.(多选题)(2023徐州质检)在第一次全市高三年级统考后,数学老师为了解本班学生的本次数学考试情况,将全班50名学生的数学成绩绘制成了频率分布直方图.已知该班级学生的数学成绩(单位:分)全部介于65到145之间(满分150分),将数学成绩按如下方式分成八组:第一组[65,75),第二组[75,85),…,第八组[135,145].按上述分组方法得到的频率分布直方图的一部分如图所示,则下列结论正确的是()A.第七组的频率为0.008B.该班级数学成绩的中位数的估计值为101C.该班级数学成绩的平均分的估计值大于95D.该班级数学成绩的方差的估计值大于2613.已知甲、乙两组数据如下表所示,其中a,b∈N*,若甲、乙两组数据的平均数相等,要使甲组数据的方差小于乙组数据的方差,则(a,b)为.(只需填一组)甲12ab10乙12471114.某校从高一年级中随机抽取部分学生,将他们的期末数学测试成绩分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]6组加以统计,得到如图所示的频率分布直方图.据此统计,期末数学测试成绩不少于第60百分位数的分数至少为.15.6月17日是联合国确定的“世界防治荒漠化和干旱日”,为增强全社会对防治荒漠化的认识与关注,聚焦联合国2030年可持续发展目标——实现全球土地退化零增长.自2004年以来,我国荒漠化和沙化状况呈现整体遏制、持续缩减、功能增强、成效明显的良好态势.治理沙漠离不开优质的树苗,现从苗圃中随机地抽测了200株树苗的高度(单位:cm),得到如图所示的频率分布直方图.(1)求频率分布直方图中a的值及众数、中位数.(2)已知树高为185cm及以上的是可以移栽的合格树苗.①求合格树苗的平均高度(结果精确到个位);②从样本中按分层抽样的方法抽取20株树苗进一步研究,不合格树苗、合格树苗分别应抽取多少株?创新应用练16.某小区毗邻一条公路,为了解交通噪声,有关部门连续25天监测噪声值(单位:分贝),得到频率分布直方图(图1),发现噪声污染严重,采取了在公路旁加装隔声板等治理措施,而后,再连续25天监测噪声值,得到频率分布直方图(图2).图1图2同一组中的数据用该组区间的中点值作代表,请解答下列问题:(1)根据上面两个频率分布直方图,估计治理后比治理前的平均噪声值降低了分贝.(2)国家“城市区域环境噪声”规定:重度污染:>65分贝;中度污染:60~65分贝;轻度污染:55~60分贝;较好:50~55分贝;好:≤50分贝.把上述两个样本数据的频率视为概率,根据图1估算出该小区噪声治理前一年内(365天)噪声中度污染及以上的天数为277,根据图2估计一年内(365天)噪声中度污染及以上的天数比治理前减少了天.(精确到1天)参考答案1.C2.A3.C4.D5.AC6.BCD7.4908 839.解(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以从样本中随机抽取一人,其分数小于70的频率为0.4.(2)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60 12=30,所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比为60∶40=3∶2.所以根据分层抽样原理,估计总体中男生和女生人数的比为3∶2.10.C11.D12.BCD13.(4,8)或(5,7)或(6,6)或(7,5)或(8,4)(填其中一个即可)14.7415.解(1)∵(0.0015+0.0110+0.0225+0.0300+a+0.0080+0.0020)×10=1,∴a=0.0250.众数为185+1952=190.设中位数为x,∵(0.0015+0.0110+0.0225)×10=0.35<0.5,(0.0015+0.0110+0.0225+0.030)×10=0.65>0.5,∴185<x<195,(0.0015+0.0110+0.0225)×10+0.030(x-185)=0.5,∴x=190.(2)∵树苗高度为185cm及以上的频率是(0.0300+0.0250+0.0080+0.0020)×10=0.65, =[190×(0.030×10)+200×(0.0250×10)+210×(0.0080×10)+220×(0.002 0×10)]÷0.65≈197(cm).(3)应抽取不合格的树苗20×0.35=7(株),合格的树苗20×0.65=13(株),故不合格树苗、合格树苗分别应抽取7株和13株.16.(1)2.56(2)138。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2012年数学一轮复习精品试题第48讲随机抽样、用样本估计总体、变量间的相互关第四十八讲 随机抽样、用样本估计 总体、变量间的相互关系、统计案例班级________ 姓名________ 考号________ 日期________ 得分________ 一、选择题:(本大题共6小题,每小题6分,共36分,将正确答案的代号填在题后的括号内.)1.一个单位有职工160人,其中业务人员96人,管理人员40人,后勤服务人员24人,为了了解职工的收入情况,要从中抽取一个容量为20的样本,如何去抽取?解法一:将160人从1至160编号,然后将用白纸做成有1~160号的160个号签放入箱内搅匀,最后从中取20个签,与签号相同的20个人被选出.解法二:将160人从1至160编号,按编号顺序分成20组,每组8人,令1~8号为第一组,9~16号为第二组,…,153~160号为第20组.从第一组中用抽签方式抽到一个为k 号(1≤k ≤8),其余组是(k +8n )号(n =1,2,3,…,19),如此抽到20人.解法三:按20160=18的比例,从业务员中抽取12人,从管理人员中抽取5人,从后勤人员中抽取3人,都用简单随机抽样法从各类人员中抽取所需人数,他们合在一起恰好抽到20人.以上的抽样方法,依次是简单随机抽样、分层抽样、系统抽样的顺序是( ) A .解法一、解法二、解法三 B .解法二、解法一、解法三 C .解法一、解法三、解法二 D .解法三、解法一、解法二解析:解法二为简单随机抽样,解法二为系统抽样,解法三为分层抽样,故选C. 答案:C2.一个样本a,3,5,7的平均数是b ,且a 、b 是方程x 2-5x +4=0的两根,则这个样本的方差是( )A .3B .4C .5D .6解析:x 2-5x +4=0的两根是1,4.当a =1时,a,3,5,7的平均数是4,当a =4时,a,3,5,7的平均数不是1. ∴a =1,b =4.则方差s 2=14×[(1-4)2+(3-4)2+(5-4)2+(7-4)2]=5,故选C.答案:C3.为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图所示,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力从4.6到5.0之间的学生数为b,则a,b的值分别为()A.0.27,78 B.0.27,83C.2.7,78 D.2.7,83解析:由图知共有9组,故后6组的频率是以2.7×0.1=0.27为首项,d为公差的等差数列,又各组频率之和为0.01+0.03+0.09+0.27×6+15d=1,故d=-0.05.所以各组的频率依次为0.01,0.03,0.09,0.27,0.22,0.17,0.12,0.07,0.02,故a=0.27,b=(0.27+0.22+0.17+0.12)×100=78,故选A.答案:A4.下列有关线性回归的说法,不正确的是()A.相关关系的两个变量不是因果关系B.散点图能直观地反映数据的相关程度C.回归直线最能代表线性相关的两个变量之间的关系D.任一组数据都有回归方程解析:根据两个变量属相关关系的概念,可知A正确;散点图能直观地描述呈相关关系的两个变量的离散程度,且回归直线最能代表它们之间的相关关系,所以B、C正确;只有线性相关的数据才有回归直线,所以D不正确.答案:D5.利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅下表来确定断信“X和Y有关系”的可信度.如果k>5.024,那么就有把握认为“X和Y有关系”的百分比为()C.2.5% D.97.5%解析:∵k>5.024时,“X和Y无关系”的可信度0.025,所以“X和Y有关系”百分比97.5%.答案:D6.下面是一个2×2列联表则表中a,bA.94,96 B.52,50C.52,54 D.54,52解析:∵a+21=73,∴a=52.又∵a+2=b知b=54,故选C.答案:C二、填空题:(本大题共4小题,每小题6分,共24分,把正确答案填在题后的横线上.)7.某企业三月中旬生产A、B、C三种产品共3000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:由于不小心,表格中A产品的样本容量比C产品的样本容量多10.根据以上信息,可得C产品的数量是________件.解析:设样品的容量为x,则x3000×1300=130,所以x=300.所以A产品和C产品在样本中共有300-130=170(件).设C产品的样本容量为y,则y+(y+10)=170,所以y=80.所以C产品的数量为3000300×80=800(件).答案:8008.已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5,若要使该总体的方差最小,则a,b的取值是________和________.解析:由题意a+b=21,故平均数x-=10.欲使方差最小,只需使(a-10)2+(b-10)2最小,又∵(a-10)2+(b-10)2=a2+b2-20(a+b)+200=a2+b2-220=(a+b)2-2ab-220=221-2ab ≥221-2⎝ ⎛⎭⎪⎫a +b 22,当且仅当a =10.5,b =10.5时最小,故a =10.5,b =10.5时,s 2最小.答案:10.5 10.59.某地教育部门为了调查学生在数学答卷中的有关信息,从上次考试的10000名考生的数学试卷中用分层抽样的方法抽取500人,并根据这500人的数学成绩画出样本的频率分布直方图(如图),则10000人的数学成绩在[140,150]段的约是________人.解析:设500人的数学成绩在[140,150]段的人数为x,10000人的数学成绩在[140,150]段的人数为n .由样本频率分布直方图知数学成绩在[140,150]段的频率最小矩形的面积,即为0.008×10=0.08=x 500,∴x =40.又样本的个数占总个数的120,即每组的抽样比为120,∴120=40n,∴n =800. ∴10000人的数学成绩在[140,150]段的约是800人. 答案:80010.某肉食鸡养殖小区某种病的发病鸡只数呈上升趋势,统计近4个月这种病的新发病鸡只数的线性回归分析如下表所示:如果不加控制,仍按这个趋势发展下去,请预测从9月初到12月底的4个月时间里,该养殖小区这种病的新发病鸡总只数约为________.解析:由上表可得:y ^=94.7x +1924.7,当x 分别取9,10,11,12时,得估计值分别为:2777,2871.7,2966.4,3061.1,则总只数约为2777+2871.7+2966.4+3061.1≈11676.答案:11676三、解答题:(本大题共3小题,11、12题13分,13题14分,写出证明过程或推演步骤.)11.一个地区共有5个乡镇30000人,其中人口比例为32514,要从这30000人中抽取300个人进行某种传染病分析,因考虑该传染病与不同地理位置及水土有关,问应采取什么样的抽样方法?写出抽样过程.解:应采用分层抽样的方法. 具体抽样过程如下:(1)计算抽样比:30030000=1100;(2)计算各乡镇人口数分别为:315×30000=6000,215×30000=4000,515×30000=10000,115×30000=2000,415×30000=8000;(3)计算各乡镇抽取的人口数分别为:6000×1100=60,4000×1100=40,10000×1100=100,2000×1100=20,8000×1100=80;(4)用系统抽样的方法依次从五个乡镇中抽出60人,40人,100人,20人,80人; (5)将抽取的个体合在一起,就构成所要抽取的一个样本. 12.据报道,某公司的33名职工的月工资(以元为单位)如下: 职务 董事长 副董事长董事 总经理 经理 管理员 职员 人数 1 1 2 1 5 3 20 工资5500500035003000250020001500(2)假设副董事长的工资从5000元提升到20000元,董事长的工资从5500元提升到30000元,那么新的平均数、中位数、众数又是什么?(精确到元)(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法.解:(1)平均数是x -=1500+4000+3500+2000×2+1500+1000×5+500×3+0×2033≈1500+591=2091(元).中位数是1500元,众数是1500元. (2)平均数是x -′=1500+28500+18500+2000×2+1500+1000×5+500×3+0×2033≈1500+1788=3288(元).中位数是1500元,众数是1500元.(3)在这个问题中,中位数或众数均能反映该公司员工的工资水平.因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差数大,所以平均数不能反映这个公司员工的工资水平.13.要分析学生初中升学的数学成绩对高一年级数学学习有什么影响,在高一年级学生中随机抽选10名学生,分析他们入学的数学成绩和高一年级期末数学考试成绩,如下表所示:x 63 67 45 88 81 71 52 99 58 76 y65785282828973985675(1)画出散点图; (2)求回归直线方程;(3)若某学生王明亮的入学数学成绩为80分,试预测他在高一年级期末考试中的数学成绩为多少?解:(1)作出散点图如图所示,从散点图可以看出,这两个变量具有线性相关关系.(2)可求得x -=110(63+67+…+76)=70,y -=110(65+78+…+75)=75.b =54284-10×70×7551474-10×702≈0.721, ∴a =75-0.721×70≈24.53. 所求的线性回归方程为 y -=0.721x +24.53.(3)若王明亮入学数学成绩为80分,代入上面的线性回归方程 y -=0.721x +24.53可得y -≈82分.。