[推荐学习]全国通用2018高考数学一轮复习第9章算法初步统计与统计案例第2节随机抽样教师用书文新人
高考数学一轮复习 第9章 算法初步、统计与统计案例课

上一页
返回首页
下一页
3.从命题思路上看: (1)求程序框图的执行结果. (2)确定条件结构中的条件与循环结构中的控制变量,完善程序框图. (3)随机抽样中的系统抽样与分层抽样. (4)样本的平均数、频率、中位数、众数、方差;频率分布直方图、茎叶图; 变量间的相关关系中的线性回归分析及独立性检验的基本思想及其初步应用.
全国卷 Ⅱ·T18
全国卷Ⅰ·T18 全国卷Ⅱ·T19
变量间的相 关关系与统 全国卷Ⅲ·T18 计案例
全国卷 Ⅰ·T19
2013 年
全国卷Ⅰ·T7 全国卷Ⅱ·T7
全国卷Ⅰ·T3
全国卷Ⅰ·T18 全国卷Ⅱ·T19
2012 年 全国 卷·T6
全国 卷·T18
全国 卷·T3
[重点关注] 综合近 5 年全国卷高考试题,我们发现高考命题在本章呈现以下规律: 1.从考查题型看:一般有 1 个客观题,1 个解答题;从考查分值看,在 17 分左右.基础题主要考查对基础知识和基本方法的掌握,中档题主要考查数据 的处理能力和综合应用能力. 2.从考查知识点看:主要考查程序框图、简单随机抽样、用样本估计总体、 变量间的相关关系与统计案例.突出对数形结合思想、转化与化归思想、分类 讨论思想以及探究、创新能力的考查.
第九章 算法初步、统计与统计案例
[五年考情]
考点
2016 年
2015 年
2014 年
算法、程序 框图、基本 算法语句
全国卷Ⅰ·T10 全国卷Ⅱ·T9 全国卷Ⅲ·T8
全国卷Ⅰ·T9 全国卷Ⅱ·T8
全国卷Ⅰ·T9 全国卷Ⅱ·T8
随机抽样
用样本估计 总体
全国卷Ⅰ·T19 全国卷Ⅱ·T18 全国卷Ⅲ·T4
上一页
高考总动员高考数学大一轮复习 第9章 统计与统计案例学案 文 新人教版-新人教版高三全册数学学案

第九章 统计与统计案例第一节 随机抽样 [基础知识深耕]一、简单随机抽样1.设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.简单随机抽样的常用方法最常用的简单随机抽样有抽签法和随机数法:(1)抽签法:把总体中的N 个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n 次,就得到一个容量为n 的样本.(2)随机数法:利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫做随机数法. 二、系统抽样假设要从容量为N 的总体中抽取容量为n 的样本. 1.先将总体的N 个个体编号.2.确定分段间隔k ,对编号进行分段,当N n 是整数时,取k =N n ,当N n不是整数时,随机从总体中剔除余数,再取k =⎣⎢⎡⎦⎥⎤N n . 3.在第1段用简单随机抽样确定第一个个体编号l (l ≤k ).4.按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号(l +k ),再加k 得到第3个个体编号(l +2k ),依次进行下去,直到获取整个样本.这种抽样方法是一种系统抽样. 三、分层抽样1.定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样.2.应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样. 【方法技巧】 分层抽样中的比例关系 (1)抽样比=样本容量个体总量=各层样本容量各层个体数量;(2)层1的数量∶层2的数量∶层3的数量=样本1的容量∶样本2的容量∶样本3的容量.[基础能力提升]1.给出下列命题正确的是( )①简单随机抽样是一种不放回抽样;②简单随机抽样每个个体被抽到的机会不一样,与先后有关;③系统抽样在起始部分抽样时采用简单随机抽样;④要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平;⑤分层抽样中,每个个体被抽到的可能性与层数及分层有关.A.①②③④⑤B.①②④⑤C.①③④⑤D.①③【解析】简单随机抽样是不放回地、等可能抽样,故②④⑤错误.【答案】 D2.将参加英语口语测试的1 000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,则抽取的第35个编号为( ) A.700 B.669C.695 D.676【解析】第35个编号为15+(35-1)×20=695.【答案】 C3.要完成下列两项调查:①从某社区125户高收入家庭,280户中等收入家庭,95户低收入家庭中选出100户调查社会购买力的某项指标;②从某中学的15名艺术特长生中选出3人调查学习负担情况.宜采用的抽样方法依次为( )A.①简单随机抽样法,②系统抽样法B.①分层抽样法,②简单随机抽样法C.①系统抽样法,②分层抽样法D.①②都用分层抽样法【解析】①中由于收入差别较大,宜于用分层抽样,②中个数较少,宜于用简单随机抽样.【答案】 B4.某工厂生产A、B、C三种不同型号的产品,产品数量之比依次为2∶3∶5,现用分层抽样方法抽出一个容量为n的样本,样本中A 型产品有16件,那么此样本容量n=________.【解析】依题意A、B、C三种不同型号样本个数之比为2∶3∶5,∴样本中B型产品有24件,C型产品有40件,∴n=16+24+40=80.【答案】80三种抽样方法的区别与联系类别共同点各自特点相互联系适用范围简单随机抽样①抽样过程中每个个体被抽到的可能性相等;②每次抽出个体后不再放回,即不放回抽样从总体中逐个抽取最基本的抽样方法总体中的个体数较少系统抽样将总体均分成几部分,按事先确定的规则在各部分抽取在起始部分抽样时采用简单随机抽样总体中的个体数较多分层抽样将总体分成几层,按比例分层进行抽取在每一层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成第二节用样本估计总体[基础知识深耕]一、用样本的频率分布估计总体分布1.频率分布表与频率分布直方图频率分布表与频率分布直方图的绘制步骤如下:(1)求极差,即求一组数据中最大值与最小值的差. (2)确定组距与组数. (3)将数据分组.(4)列频率分布表.落在各小组内的数据的个数叫做频数,每小组的频数与数据总数的比值叫做这一小组的频率.计算各小组的频率,列出频率分布表.(5)画频率分布直方图.依据频率分布表画频率分布直方图,其中纵坐标(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组上的小长方形的面积,即每个小长方形的面积=组距×频率组距=频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小,各个小长方形面积的总和等于1. 2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.3.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数. 用茎叶图刻画数据有两个优点: a .所有的信息都可以从图中得到;b .茎叶图便于数据的记录和表示,能够展示数据的分布情况. 但当样本数据较多或数据位数较多时,茎叶图就显得不太方便. 二、用样本的数字特征估计总体的数字特征 1.众数、中位数、平均数定义特点众数在一组数据中出现次数最多的数据体现了样本数据的最大集中点,不受极端值的影响,而且不唯一中位数将一组数据按大小顺序依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)中位数不受极端值的影响,仅利用了排在中间数据的信息,只有一个平均数样本数据x 1,x 2,…,x n 的算术平均数x =x 1+x 2+…+x nn与每一个样本数据有关,只有一个2.标准差和方差(1)标准差是样本数据到平均数的一种平均距离. (2)标准差:s =1n[x 1-x2+x 2-x2+…+x n -x2].(3)方差:s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2](x n 是样本数据,n 是样本容量,x 是样本平均数).【拓展延伸】 平均数、方差的公式推广(1)若数据x1,x2,…,x n的平均数为x,那么mx1+a,mx2+a,mx3+a,…,mx n+a的平均数是m x+a.(2)数据x1,x2,…,x n的方差为s2.①数据x1+a,x2+a,…,x n+a的方差也为s2;②数据ax1,ax2,…,ax n的方差为a2s2.[基础能力提升]1.给出下列命题,正确的是( )①在频率分布直方图中,小矩形的高表示频率;②频率分布直方图中各个长方形的面积之和为1;③茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次;④在频率分布直方图中,最高的小长方形底边中点的横坐标是众数;⑤在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.A.①②③④⑤B.①②C.②③④D.②④【解析】只有②④正确,①③⑤均错误.【答案】 D2.某雷达测速区规定:凡车速大于或等于70 km/h的汽车视为“超速”,并将受到处罚.如图是某路段的一个检测点对200辆汽车的车速进行检测所得结果的频率分布直方图,则从图921中可以看出被处罚的汽车大约有( )A.30辆B.40辆 C.60辆D.80辆图921【解析】由题图可知,车速大于或等于70 km/h的汽车的频率为0.02×10=0.2,则将被处罚的汽车大约有200×0.2=40(辆).【答案】 B3.若某校高一年级8个班参加合唱比赛的得分如茎叶图922所示,则这组数据的中位数图922和平均数分别是( )A.91.5和91.5B.91.5和92C.91和91.5D.92和92【解析】 这组数据由小到大排列为87,89,90,91,92,93,94,96. ∴中位数是91+922=91.5.平均数x =87+89+90+91+92+93+94+968=91.5.【答案】 A4.某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s 2=________. 【解析】 x =10+6+8+5+65=7,s 2=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=165=3.2.【答案】 3.21.两点注意(1)频率分布直方图与条形统计图不同.(2)①众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质.②标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大. 2.三个特征利用频率分布直方图估计样本的数字特征:(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数值. (2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和. (3)众数:最高的矩形的中点的横坐标.第三节 变量间的相关关系、统计案例[基础知识深耕]一、相关关系与回归方程 1.相关关系的分类(1)正相关:从散点图上看,点散布在从左下角到右上角的区域内. (2)负相关:从散点图上看,点散布在从左上角到右下角的区域内. 2.线性相关关系从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线. 3.回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫最小二乘法.(2)回归方程:两个具有线性相关关系的变量的一组数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程为y ^=b ^x +a ^,则b ^=∑ni =1x i -x y i -y∑ni =1x i -x 2=∑ni =1x i y i -n x y∑ni =1x 2i -n x2,a ^=y -b ^x ,其中,b ^是回归方程的回归系数,a ^是在y 轴上的截距,(x ,y )是样本点的中心.4.样本相关系数r =∑ni =1x i -xy i -y∑ni =1x i -x2∑ni =1y i -y2,用它来衡量两个变量间的线性相关关系.(1)当r >0时,表明两个变量正相关; (2)当r <0时,表明两个变量负相关;(3)r 的绝对值越接近1,表明两个变量的线性相关性越强;r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r |>0.75时,认为两个变量有很强的线性相关关系.二、独立性检验 1.2×2列联表假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称2×2列联表)为:y 1 y 2 总计x 1 a b a +b x 2c d c +d 总计a +cb +da +b +c +d2.K 2统计量K 2=n ad -bc 2a +bc +d a +cb +d(其中n =a +b +c +d 为样本容量).[基础能力提升]1.已知x ,y 的取值如表所示:如果y 与x 呈线性相关,且回归方程为y ^=b ^x +72,则b ^等于( )A .-12 B.12 C .-110 D.110【解析】 ∵x =2+3+43=3,y =5+4+63=5. ∴5=3b ^+72,∴b ^=12.【答案】 B2.两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的R 2如下,其中拟合效果最好的模型是( )A.模型1【解析】 ∵0.98>0.80>0.50>0.25, ∴模型1最好. 【答案】 A3.下面是2×2列联表:则表中a ,b 的值分别为( ) A .94,72 B .52,50 C .52,74D .74,52【解析】 ∵a +21=73,∴a =52. 又a +22=b ,∴b =74. 【答案】 C4.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算K 2的观测值k =27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的(填“有关”或“无关”).【解析】 ∵k =27.63>6.635,∴有99%的把握认为“打鼾与患心脏病有关”.【答案】有关1.一个区别——相关关系与函数关系函数关系是一种确定性关系,体现的是因果关系;而相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关系.2.三点注意——回归分析与独立性检验的有效性(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.(2)根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.(3)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.。
2018高考数学(文理通用版)一轮复习-综合过关规范限时检测 第九章 算法初步、统计、统计案例

第九章 综合过关规范限时检测(时间:120分钟 满分150分)一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中只有一个是符合题目要求的)1.下列四个散点图中点的分布状态,可以直观上判断两个变量之间具有线性相关关系的是导学号 30072882( B )A .①②B .③C .②③D .②③④[解析] ①中的点无规律分布,范围很广,表明两个变量之间的相关程度很小;②中所有的点都在同一条直线上,是函数关系;③中的点分布在一条带状区域上,即点分布在一条直线的附近,是线性相关关系;④中的点分布在一条带状区域内,但不是线性的,而是一条曲线附近,所以不是线性相关关系.故选B .2.(2016·辽宁抚顺模拟)某商场有四类食品,粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是导学号 30072883( C )A .4B .5C .6D .7[解析] 四类食品的每一种被抽到的概率为2040+10+30+20=15,所以植物油类与果蔬类食品被抽到的种数之和为(10+20)×15=6.故选C .3.(2016·辽宁沈阳模拟)某班共有52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本.已知3号、29号、42号学生在样本中,那么样本中还有一个同学的学号是导学号 30072884( D )A .10B .11C .12D .16[解析] 由题意,应把52人分成4组,每组13人,故两个序号之间应该相差13,所以与3号相差13的是16号.故选D .4.(2016·河北衡水中学二调)执行如图所示的程序框图,输出的结果是导学号 30072885( B )A.5 B.6 C.7 D.8[解析]第一次循环,得n=8,i=2;第二次循环,得n=4×8-1=31,i=3;第三次循环,得n=4×31-1=123,i=4;第四次循环,得n=123-4=119,i=5;第五次循环,得n=4×119-1=475>123,i=6,此时满足判断框内的条件,退出循环,输出i的值为6.故选B.5.(2017·江西省师大附中等五校高三第一次联考数学理试题)某教研机构随机抽取某校20个班级,调查各班关注汉字听写大赛的学生人数,根据所得数据的茎叶图,以组距为5将数据分组成[0,5),[5,10),[10,15),[15,20),[20,25),[25,30),[30,35),[35,40]时,所作的频率分布直方图如图所示,则原始茎叶图可能是导学号30072886(A)[解析]由图表选A.6.(2017·河北省承德实验中学高三上学期期中数学试题)已知甲、乙两组数据如图茎叶图所示,若它们的中位数相同,平均数也相同,则图中的m ,n 的比值m n =导学号 30072887( A )A .38B .13C .29D .1[解析] 由茎叶图性质及甲、乙两组数据的中位数相同,平均数也相同,列出方程组,能求出m ,n ,由此能求出结果.解:甲、乙两组数据如图茎叶图所示,∵它们的中位数相同,平均数也相同,∴⎩⎨⎧20+m =22+24213(17+20+m +29)=14(10+n +22+24+28),解得m =3,n =8,∴m n =38.故选A .7.某样本中共有5个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为导学号 30072888( D )A .65B .56C . 2D .2[解析] 由a +0+1+2+35=1,得a =-1,所以s 2=15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.故选D .8.(2016·贵州贵阳模拟)某车间加工零件的数量x (单位:个)与加工时间y (单位:min)的统计数据见下表:现已求得上表数掘的回归方程y =b x +a 中b =0.9,则据此回归模型可以预测,加工90个零件所需要的加工时间约为导学号 30072889( A )A .93 minB .94 minC .95 minD .96 min[解析] 由表格,得x =20,y =30.因为(x ,y )在回归直线上,代入得a ^=12,所以回归直线为y ^=0.9x +12,当x =90时,y ^=93.故选A .9.某数学教师随机抽取50名学生进行是否喜欢数学课程的情况调查,得到如下列联表(单位:名):根据表中数据求得K 2的值约为导学号 30072890( A ) A .5.059B .6.741C .8.932D .10.217[解析] 根据表中数据,得K 2=50×(18×15-8×9)226×24×23×27≈5.059.故选A .10.某中学有学生270人,其中高一年级有108人,高二、三年级各有81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270,使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250; ②5,9,100,107,111,121,180,195,200,265; ③11,38,65,92,119,146,173,200,227,254; ④30,57,84,111,138,165,192,219,246,270.关于上述样本的下列结论中,正确的是导学号 30072891( D ) A .②,③都不能为系统抽样 B .②,④都不能为分层抽样 C .①,④都可能为系统抽样D .①,③都可能为分层抽样[解析] 因为③可以为系统抽样,所以选项A 不对;因为②可以为分层抽样,所以选项B 不对;因为④不能为系统抽样,所以选项C 不对,故选D .11.给出以下三幅统计图及四个命题: ①从折线统计图能看出世界人口的变化情况 ②2050年非洲人口大约将达到15亿③2050年亚洲人口比其他各洲人口的总和还要多 ④从1957年到2050年各洲中北美洲人口增长速度最慢 其中命题正确的是导学号 30072892( B )A .①②B .①③C .①④D .②④[解析] ①显然正确;从条形统计图可得到,2050年非洲人口大约将达到18亿,②错;从扇形统计图中能够明显地得到结论:2050年亚洲人口比其他各洲人口的总和还要多,③正确;由上述三幅统计图并不能得出1957年到2050年中哪个洲人口增长速度最慢,故④错误.12.为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a ,视力在4.6到5.0之间的学生数为b ,则a 、b 的值分别为导学号 30072893( A )A .0.27,78B .0.27,83C .2.7,78D .2.7,83[解析] 由频率分布直方图知组距为0.1. 4.3-4.4间的频数为100×0.1×0.1=1. 4.4-4.5间的频数为100×0.1×0.3=3. 又前4组的频数成等比数列,∴公比为3. 从而4.6-4.7间的频数最大,且为1×33=27. ∴a =0.27.根据后6组频数成等差数列,且共有100-13=87人. 设公差d ,则6×27+6×52d =87.∴d =-5,从而b =4×27+4×32(-5)=78. 二、填空题(本大题共4小题,每小题5分,共20分.把答案填在题中的横线上) 13.已知某单位有40名职工,现要从中抽取5名.将全体职工随机按1~40编号,并按编号顺序平均分成5组.按系统抽样方法在各组内抽取一个号码.导学号 30072894(1)若第1组抽出的号码为2,则所有被抽出职工的号码为_2,10,18,26,34__;(2)分别统计这5名职工的体重(单位:kg ),获得体重数据的茎叶图如图所示.则该样本的方差为_62__.[解析] 由题意知抽取职工的号码为2,10,18,26,34.由茎叶图知5名职工体重的平均数x =59+62+70+73+815=69,则方差s 2=15×[(59-69)2+(62-69)2+(70-69)2+(73-69)2+(81-69)2]=62.14.(2016·吉林摸底)某市统计局就本地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示月收入在[1 000,1 500),单位:元).导学号 30072895(1)估计居民月收入在[1 500,2 000)的概率为_0.2__; (2)根据频率分布直方图估计样本数据的中位数为_2_400__.[解析] (1)由题意知,居民月收入在[1 500,2 000)的概率约为1-(0. 000 1+0. 000 2+0. 0003+0.000 5×2)×500=1-0.001 6×500=1-0.8=0.2.(2)由频率分布直方图知,中位数在[2 000,2 500)中,设中位数为x ,则0.000 2×500+0.2+0. 000 5(x -2 000)=0.5,解得x =2 400.15.如图所示的程序框图,该算法的功能是_计算(1+2+3+…+n )+(20+21+22+…+2n -1)的值__.导学号 30072896[解析]初始值k=1,S=0,第1次进入循环体,S=1+20,k=2;当第2次进入循环体时,S=1+20+2+21,k=3;…;给定正整数n,当k=n时,最后一次进入循环体,则有S=1+20+2+21+…+n+2n-1,k=n+1,退出循环体,输出S=(1+2+3+…+n)+(20+21+22+…+2n-1).16.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查对临界值表知P(K2≥3.841)≈0.05.对此,四名同学作出了以下的判断:p:有95%的把握认为“这种血清能起到预防感冒的作用”;q:若某人未使用该血清,则他在一年中有95%的可能性得感冒;r:这种血清预防感冒的有效率为95%;s:这种血清预防感冒的有效率为5%.则下列结论中,正确结论的序号是_①④__.(把你认为正确的命题序号都填上)导学号30072897①p∧¬q;②¬p∧¬q;③(¬p∧¬q)∧(r∨s);④(p∨¬r)∧(¬q∨s)[解析]本题考查了独立性检验的基本思想及常用逻辑用语.由题意,得K2≈3.918,P(K2≥3.841)≈0.05,所以,只有第一位同学的判断正确,即有95%的把握认为“这种血清能起到预防感冒的作用”.由真值表知①④为真命题.三、解答题(本大题共6个小题,共70分,解答应写出文字说明,证明过程或演算步骤)17.(本小题满分10分)(2016·辽宁沈阳质检)某学校的三个学生社团的人数分布见下表(每名学生只能参加一个社团):导学号30072898取18人,结果拳击社被抽取了6人.(1)求拳击社女生有多少人;(2)从围棋社指定的3名男生和2名女生中随机选出2人参加围棋比赛,求这2名学生是1名男生和1名女生的概率.[解析] (1)由于按分层抽样的方法从三个社团成员中抽取18人,拳击社被抽取了6人, 所以628+m =1820+40+28+m ,所以m =2.(2)设“这2名同学是1名男生和1名女生”为事件A ,方法一:设3名男生分别为A 1,A 2,A 3,女生为B 1,B 2以5人中任选两个共有:A 1A 1,A 1A 3,A 1B 1,A 1B 2,A 2A 3,A 2B 1,A 2B 2,A 3B 1,A 3B 2,B 1B 2,共10种,其中1男1女有A 1B 1,A 1B 2,A 2B 1,A 2B 2,A 3B 1,A 3B 2,6种,P (A )=610=35.方法二:P (A )=C 13·C 12C 25=35.18.(本小题满分12分)(2016·河南郑州预测)每年的3月12日,是中国的植树节.林管部门为保证树苗的质量,都会在植树前对树苗进行检测.现从甲、乙两种树苗中各抽测了10株树苗的高度,规定高于128 cm 的树苗为“良种树苗”,测得高度如下(单位:cm):导学号 30072899甲:137,121,131,120,129,119,132,123,125,133; 乙:110,130,147,127,146,114,126,110,144,146.(1)根据抽测结果,画出甲、乙两种树苗高度的茎叶图,并根据画出的茎叶图,对甲、乙两种树苗的高度作比较,写出对两种树苗高度的统计结论;(2)设抽测的10株甲种树苗高度平均值为x,将这10株树苗的高度依次输入,按程序框图进行运算(如图),则输出的S大小为多少?并说明S的统计学意义.[解析](1)茎叶图如图所示:统计结论:①甲种树苗的平均高度小于乙种树苗的平均高度;②甲种树苗比乙种树苗长得整齐;③甲种树苗高度的中位数为127,乙种树苗高度的中位数为128.5;④甲种树苗的高度基本上是对称的,而且大多数集中在均值附近,乙种树苗的高度分布较为分散.(2)依题意,x=127,S=35.S表示10株甲种树苗高度的方差,是描述树苗高度的离散程度的量.S值越小,表示树苗长得越整齐;S值越大,表示树苗长得越参差不齐.19.(本小题满分12分)(2016·四川,12分)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.导学号30072900(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.[解析](1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[2,5.3),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a +0.20+0.26+0.5×a +0.06+0.04+0.02=1,解得a =0. 30.(2)由(1)可知,100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12. 由以上样本的频率,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85, 而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85, 所以2.5≤x <3.由0.3×(x -2.5)=0.85-0.73, 解得x =2.9.所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准. 20.(本小题满分12分)为了解春季昼夜温差大小与某种子发芽多少之间的关系,现在从4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天100颗种子浸泡后的发芽数,得到如下表格:导学号 30072901(1)25”的概率;(2)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另3天的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?参考公式:b ^= ni =1x i y i -n x y ni =1x 2i -n x 2,a ^=y -b ^x . [解析] (1)所有的基本事件为(23,25),(23,30),(23,26).(23,16),(25.30),(25,26),(25,1 6),(30,26),(30,16).(26,16),共10个.设“m ,n 均不小于25”为事件A ,则事件A 包含的基本事件为(25,30),(25,26),(30,26),共3个.所以P (A )=310.(2)由数据得,另3天的平均数x =12,y =27,3x y =972, 3x 2=432, 3i =1x i y i =977, 3i =1x 2i =434, 所以b ^=977-972434-432=52,a ^=27-52×12=-3,所以y 关于x 的线性同归方程为y ^=52x -3.(3)依题意得,当x =10时,y ^=22,|22-23|<2;当x =8时,y ^=17,|17-16|<2, 所以(2)中所得到的线性回归方程是可靠的.21.(本小题满分12分)(2016·全国卷Ⅰ,12分)某公司计划购买1台机器,该种机器使用三年后即被淘汰,机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:导学号 30072902记x 表示1台机器在三年使用期内需更换的易损零件数,y 表示1台机器在购买易损零件上所需的费用(单位:元),n 表示购机的同时购买的易损零件数.(1)若n =19,求y 与x 的函数解析式;(2)若要求“需更换的易损零件数不大于n ”的频率不小于0.5,求n 的最小值; (3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?[解析] (1)当x ≤19时,y =3 800;当x >19时,y =3 800+500(x -19)=500x -5 700. 所以y 与x 的函数解析式为y =⎩⎪⎨⎪⎧3 800,x ≤19500x -5 700,x >19(x ∈N ).(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n的最小值为19.(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800,20台的费用为4 300,10台的费用为4 800,因此这100台机器在购买易损零件上所需费用的平均数为1100×(3 800×70+4 300×20+4 800×10)=4 000.若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000,10台的费用为4 500,因此这100台机器在购买易损零件上所需费用的平均数为1100×(4 000×90+4 500×10)=4 050.比较两个平均数可知,购买1台机器的同时应购买19个易损零件.22.(本小题满分12分)(2016·大连双基测试)某食品厂为了检查甲、乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本,并称出它们的重量(单位:克),重量值落在[495,510]内的产品为合格品,否则为不合格品.统计结果如下:导学号30072903甲流水线样本的频数分布表(1)求甲流水线样本合格的频率;(2)从乙流水线上重量值落在[505,515]内的产品中任取2件产品,求这2件产品中恰好只有一件合格的概率;(3)由以上统计数据完成下面2×2列联表,并回答有多大的把握认为产品的包装质量与两条自动包装流水线的选择有关.附:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),n =a +b +c +d .[答案] (1)0.75 (2)815 (3)有90%的把握认为产品的包装质量与两条自动包装流水线的选择有关[解析] (1)由表知甲流水线样本中合格品的个数为8+14+8=30,故甲流水线样本中合格品的频率为3040=0.75.(2)乙流水线上重量值落在[505,515]内的合格产品件数为0.02×5×40=4,不合格产品件数为0.01×5×40=2.设合格产品的编号为A 1,A 2,A 3,A 4,不合格产品的编号为B 1,B 2,抽取2件产品的基本事件空间为Ω1={(A 1,A 2),(A 1,A 3),(A 1,A 4),(A 1,B 1),(A 1,B 2),(A 2,A 3),(A 2,A 4),(A 2,B 1),(A 2,B 2),(A 3,A 4),(A 3,B 1),(A 3,B 2),(A 4,B 1),(A 4,B 2),(B 1,B 2)},共15个.2件产品中恰好只有一件合格的基本事件空间为Ω2={(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(A 4,B 1),(A 4,B 2)},共8个,故所求概率P =815.(3)由(1)知甲流水线样本中合格品的个数为30,乙流水线样本中合格品的个数为0.9×40=36.2×2列联表如下:∵K 2的观测值k =80×(120-360)66×14×40×40≈3.117>2.706,∴有90%的把握认为产品的包装质量与两条自动包装流水线的选择有关.。
最新-2018年高考数学一轮复习 第9章算法、推理与证明、复数复数课件 精品

*对应演练*
设等比数列z1,z2,z3,…,zn,….其中 z1=1,z2=a+bi,z3=b+ai(a,b∈R且a>0). (1)求a,b的值; (2)试求使z1+z2+…+zn=0的最小自然数n; (3)对(2)中的自然数n,求z1·z2·…·z12的值.
返回目录
(1)∵z1,z2,z3成等比数列,
返回目录
*对应演练*
设z=log2(m2-3m-3)+ilog2(m-3)(m∈R),若z对应的点
在直线x-2y+1=0上,则m的值是
.
15 (∵z对应的点为(log2(m2-3m-3),log2(m-3)),又∵ 其在直线x-2y+1=0上,∴log2(m2-3m-3)-2log2(m3)+1=0,整理得
当n≠4k(k∈N)时,
原式= 1 - i2 001n 1- in
1 - i2 000n·in = 1-in
1- in = 1-in
=1
返回目录
【评析】(1)在计算过程中常出现一些比较有特
点的式子.如(1±i)2=±2i, 要抓住这一特点快速运算.
1 + i = i,
1-i
1 - i = -i 等,
(3) z1 = z2
a + bi c + di =
(ac bd)(bc - ad)i c2 d2 .
z z ·z (4)zm·zn=
m+n ,(zm)n= zmn ,(z1·z2)n=
n 1
n 2
(其中m,n∈Z);
返回目录
(5)z
n 1
=(a+bi)n=
2018届高考数学一轮复习第九章算法初步、统计、统计案例9.1定点、定值、探索性问题课件理

3.了解几种基本算法语句——输入语句、 2016,全国卷Ⅲ,7,5分(循环次数的计 输出语句、赋值语句、条件语句、循 环语句的含义。 算) 2016,四川卷,6,5分(程序框图与九章 算术)
微知识
小题练
教材回扣 基础自测
• 自|主|排|查
• 1.三种基本逻辑结构 名称 内容
顺序结构
条件结构
循环结构 从某处开始,按照一 反复执行 定的条件_________ 某些步骤的情况,反 复执行的步骤称为 循环体 _______
微考点
大课一 【典例 1】 一算法的程序框图如图,若输出的 y=2,则输入的 x
的值可能为( A.-1 B.0 C.1 D.5 )
π sin6x,x≤2 1 x 【解析】 由程序框图知 y= x 当 x>2 时,y=2 =2, 2 ,x>2。
π 1 解得 x=-1(舍去);当 x≤2 时,y=sin 6x =2,解得 x=12k+1(k∈Z)或 x=12k+5(k∈Z),当 k=0 时,x=1 或 x=5(舍去),所以输入的 x 的值可 能是 1。故选 C。 【答案】 C
微点提醒 1. 循环结构中必有条件结构, 其作用是控制循环进程, 避免进入“死 循环”,是循环结构必不可少的一部分。 2.条件语句主要有两种形式的格式,但是不管是这两种格式的哪一 种,IF 与 END IF 必须同时出现,可以没有 ELSE,但是必须有 END IF。 3.解决程序框图问题要注意几个常用变量 (1)计数变量:用来记录某个事件发生的次数,如 i=i+1。 (2)累加变量:用来计算数据之和,如 S=S+i。 (3)累乘变量:用来计算数据之积,如 p=p×i。
• • • •
4.条件语句 (1)算法中的 条件结构 与条件语句相对应。 (2)条件语句的格式及框图。 ①IF—THEN格式:
2018届高考数学理科全国通用一轮总复习课件:第九章 算法初步、统计、统计案例 9.1 精品

A.s 3 ? 4
B.s 5 ? 6
C.s 11 ? 12
D.s 25 ? 24
【解题导引】根据循环结构中输出k的值以及循环结束 时s的值,结合各选项可以判断出判断框中的条件.
【规范解答】选C.执行第一次循环时,k=2, s 1,
2
执行第二次循环时,k=4, s 1 1 3,
24 4
【规范解答】(1)选C.此程序先将A的值赋给X,故X=5; 再将B的值赋给A,故A=8;再将X+A的值赋给B,即将原来 的A与B的和赋给B,故B=5+8=13.
(2)由已知中的算法语句,模拟程序的运行过程可得: i=1时,i<8,s增大为3,i增大为4; 当i=4时,i<8,s增大为5,i增大为7; 当i=7时,i<8,s增大为7,i增大为10; 当i=10时,i<8不成立,不满足继续循环的条件,故输出 结果为7. 答案:7
4.执行如图所示的程序框图,若输出的结果是8,则输入
的数是
.
【解析】由a≥b得x2≥x3,解得x≤1,所以当x≤1时,输出 a=x2;当x>1时,输出b=x3. 当x≤1时,由a=x2=8,解得x 8 2 2; 当x>1时,b=x3=8,解得x=2. 所以输入的数为2或 2 2. 答案:2或 2 2
C.按从小到大排列
D.按从大到小排列
【解题导引】(1)根据程序框图的功能进行运行即可.
(2)根据各判断框的功能进行判断或取特殊值运行后判
断.
【规范解答】(1)选B.a=2,b=4,则S=2 4=2.5.
42
(2)选B.两个条件结构都是挑选较小的值,故输出a的值
是三个数中的最小值.
【一题多解】解答本例题(2),你知道几种解法? 解答本题,还有以下解法: 不妨设a,b,c的值分别为8,5,6,运行程序框图: 因为a>b成立,故将b的值赋给a得a=5,又a>c不成立, 故直接输出a的值为5,再结合选项知B成立.
2018版高考一轮总复习数学文课件 第9章 统计、统计案
解
(1) 因 为 样 本 容 量 与 总 体 中 的 个 体 数 的 比 是
6 1 = , 50+150+100 50 所以样本中包含三个地区的个体数量分别是: 1 1 1 50× =1,150× =3,100× =2,所以 A,B,C 三 50 50 50 个地区的商品被选取的件数分别为 1,3,2.
解析 概率相等.
随机抽样包括:简单随机抽样,系统随机抽样
和分层随机抽样.随机抽样的特点就是每个个体被抽到的
2.[2017· 东北三校联考]某工厂生产甲、乙、丙三种型 号的产品,产品数量之比为 3∶5∶7,现用分层抽样的方法 抽出容量为 n 的样本,其中甲种产品有 18 件,则样本容量 n=( ) A.54 C.45 B.90 D.126 3 依题意得 ×n=18, 解得 n=90, 即样本 3+5+7
6.[2015· 福建高考]某校高一年级有 900 名学生,其中 女生 400 名, 按男女比例用分层抽样的方法, 从该年级学生 中抽取一个容量为 45 的样本,则应抽取的男生人数为 25 ________ .
解析 =25. 45 x 设男生抽取 x 人,则有 = ,解得 x 900 900-400
解析
将 1~200 编号分为 40 组,则每组的间隔为 5,
其中第 5 组抽取号码为 22,则第 8 组抽取的号码应为 22+ 3×5=37;由已知条件 200 名职工中 40 岁以下的职工人数 为 200×50%=100,设在 40 岁以下年龄段中应抽取 x 人, 40 x 则 = ,解得 x=20. 200 100
7.200 名职工年龄分布如图所示,从中随机抽取 40 名 职工作样本,采用系统抽样方法,按 1~200 编号分为 40 组,分别为 1~5,6~10,„,196~200,第 5 组抽取号码为 22,第 8 组抽取号码为________ .若采用分层抽样,40 岁 37 以下年龄段应抽取________ 人. 20
2018版高考数学一轮总复习第9章统计统计案例及算法初步9.3变量相关关系与统计案例课件文
板块二 典例探17· 洛阳模拟]为研究语文成绩和英语成绩之间
是否具有线性相关关系, 统计某班学生的两科成绩得到如图 所示的散点图(x 轴、 y 轴的单位长度相同), 用回归直线方程 ^ y =bx+a 近似地刻画其相关关系,根据图形,以下结论最 有可能成立的是( )
考点 3
独立性检验
1.独立性检验的有关概念 (1)分类变量 可用变量的不同“值”表示个体所属的 不同类别 的 变量称为分类变量.
(2)2×2 列联表 假设有两个分类变量 X 和 Y,它们的取值分别为{x1, x2}和{y1,y2},其样本频数列联表(称为 2×2 列联表)为 y1 x1 x2 总计 a c y2 b d 总计 a+b c+d a+b+c+d
【变式训练 2】
PM2.5 是指空气中直径小于或等于 2.5
微 米 的 颗粒 物 ( 也称 可 入肺 颗 粒物 ) . 为 了探 究 车流 量 与 PM2.5 的浓度是否相关, 现采集到某城市周一至周五某一时 间段车流量与 PM2.5 浓度的数据如下表: 时间 车流量 x(万辆) PM2.5 的浓度 y(微克/立方米) 周一 周二 周三 周四 周五 100 78 102 80 108 84 114 88 116 90
[双基夯实] 一、疑难辨析 判断下列结论的正误. ( 正确的打“√”,错误的打 “×”) 1.相关关系与函数关系都是一种确定性的关系,也是 一种因果关系.( × ) 2.只有两个变量有相关关系,所得到的回归模型才有 预测价值.( √ )
3. 某同学研究卖出的热饮杯数 y 与气温 x(℃)之间的关 ^ 系,得到回归方程y=-2.352x+147.767,则气温为 2 ℃时, 一定可卖出 143 杯热饮.( × ) 4.事件 X,Y 关系越密切,则由观测数据计算得到的 K2 的观测值越大.( √ ) 5. 由独立性检验可知, 在犯错误的概率不超过 1%的前 提下认为物理成绩优秀与数学成绩有关,某人数学成绩优 秀,则他有 99%的可能物理优秀.( × )
最新-2018届高考数学一轮复习 第9章第一节 算法初步与统计课件 文 精品
4.(2011年启东中学联考)阅读下列伪代码,如 果输入x=-2,则输出的结果为________.
答案:3-π
考点探究·挑战高考
考点突破 算法的顺序结构和选择结构
1.顺序结构是最简单的算法结构,语句与语 句之间、框与框之间是按从上到下顺序进行 的.流程图中一定包含顺序结构.
2.解决分段函数的求值问题时,一般采用选 择结构设计算法.利用选择结构解决算法问 题时,要引入判断框,要根据题目的要求引 入一个或多个判断框.而判断框内的条件不 同,对应的下一图框中的内容和操作要相应 地进行变化,故要逐个分析判断框内的条件.
_E__n_d__I_f _
7.循环语句 (1)While循环 当循环次数不能确定时,可用“While”语句来 实现循环. “While”语句的一般形式为: While p
循环体 End While
(2)For循环 当循环的次数已经确定,可用“For”语句实现 循环,“For”语句的一般形式为: For I From “初值” To “终值” Step “步长”
【答案】 63 【名师点评】 读懂算法流程图,可以依次查 找循环的结果.算法与中学的许多内容联系密 切,如数列、函数、统计与概率等,因此,我 们在复习这一部分的时候还要注意算法与这些 知识的结合.
名师预测
1.已知某流程图如图所示,则执行该程序后输 出的结果是________.
1 解析:当 a=2 时,赋值 a←1- a ,循环赋值 得出的数分别为12,-1,2,12,-1,2,…,当 i=2011 时,此循环结构共循环了 2010 次,由 2010=2007+3 可得,其输出的值为周期数列 中的第三项 2.
方法感悟 方法技巧 1.给出一个问题,设计算法时应注意: (1)认真分析问题,联系解决此问题的一般数 学方法; (2)综合考虑此类问题中可能涉及的各种情况; (3)将解决问题的过程划分为若干个步骤; (4)用简练的语言将各个步骤表示出来.
2018高考数学文全国大一轮复习课件:第九篇 统计与统
知识梳理
1.简单随机抽样 (1)定义:一般地,设一个总体含有N个个体,从中 逐个不放回地 抽取n个 个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会 都 相等 ,就把这种抽样方法叫做简单随机抽样. (2)方法: 抽签法 和随机数法. (3)简单随机抽样的特点:①被抽取样本的总体个数N是有限的;②样本是 从总体中逐个抽取的;③是一种不放回抽样;④是等可能抽取.
解析:产品的编号为3位号码,故每次的读数取三位数,第一个三位数为 217,依次取出符合条件的号码为217,157,245,206,故第4个个体的编号 为206.
4.某学校三个社团的人员分布如表(每名同学只参加一个社团): 合唱社 高一 高二 45 15 文学社 30 10 书法社 a 20 . .
第 1节
随机抽样
最新考纲
1.理解随机抽样的必要性和重要性.
2.会用简单随机抽样方法从总 体中抽取样本;了解分层抽样和
系统抽样方法.
知识链条完善 考点专项突破 经典考题研析
知识链条完善
【教材导读】
把散落的知识连起来
1.把总体中的个体编号后, 使用系统抽样方法抽取到的样本号码一定成 等差数列吗? 提示:不一定,各段中可以按不同的抽取方法抽取. 2.简单随机抽样、系统抽样、分层抽样中每个个体被抽的机会均等吗? 提示:均等,三种抽样都是等概率抽样.
2.系统抽样 系统抽样是将总体中的个体进行编号,等距分组,在第一组中按照简单随
机抽样抽取第一个样本,然后按分组的间隔(称为抽样距)抽取其他样本,
这种抽样方法有时也叫等距抽样或机械抽样. 要从容量为N的总体中抽取容量为n的样本,可采取以下步骤: (1)先将总体的N个个体编号.
(2)确定抽样距 k,对编号进行分段,当
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生活的色彩就是学习 K12的学习需要努力专业专心坚持 第二节 随机抽样 ———————————————————————————————— [考纲传真] 1.理解随机抽样的必要性和重要性.2.会用简单随机抽样方法从总体中抽取样本.3.了解分层抽样和系统抽样方法.4.会用随机抽样的基本方法解决一些简单的实际问题.
1.简单随机抽样 (1)定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样. (2)最常用的简单随机抽样的方法:抽签法和随机数法. 2.系统抽样的步骤 假设要从容量为N的总体中抽取容量为n的样本. (1)先将总体的N个个体编号.
(2)确定分段间隔K,对编号进行分段,当Nn是整数时,取k=Nn,当Nn不是整数时,随机
从总体中剔除余数,再取k=N′n(N′为从总体中剔除余数后的总数). (3)在第1段用简单随机抽样确定第一个个体编号l(l≤k). (4)按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本. 3.分层抽样 (1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样. (2)分层抽样的应用范围: 当总体由差异明显的几个部分组成时,往往选用分层抽样.
1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”) (1)简单随机抽样中每个个体被抽到的机会不一样,与先后有关.( ) (2)系统抽样在起始部分抽样时采用简单随机抽样.( ) (3)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.( ) 生活的色彩就是学习 K12的学习需要努力专业专心坚持 (4)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( ) [答案] (1)× (2)√ (3)× (4)× 2.(教材改编)在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是( ) A.总体 B.个体 C.样本的容量 D.从总体中抽取的一个样本 A [从5 000名居民某天的阅读时间中抽取200名居民的阅读时间,样本容量是200,抽取的200名居民的阅读时间是一个样本,每名居民的阅读时间就是一个个体,5 000名居民的阅读时间的全体是总体.] 3.(2015·广东高考)为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( ) A.50 B.40 C.25 D.20
C [根据系统抽样的特点分段间隔为1 00040=25.] 4.(2015·四川高考)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( ) A.抽签法 B.系统抽样法 C.分层抽样法 D.随机数法 C [根据年级不同产生差异及按人数比例抽取易知应为分层抽样法.] 5.(2017·福州检测)某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________.
25 [设男生抽取x人,则有45900=x900-400,解得x=25.]
简单随机抽样 (1)下列抽取样本的方式属于简单随机抽样的个数为( ) ①盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里; ②从20件玩具中一次性抽取3件进行质量检验; 生活的色彩就是学习 K12的学习需要努力专业专心坚持 ③某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛. A.0 B.1 C.2 D.3 (2)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( ) 7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481 A.08 B.07 C.02 D.01 (1)A (2)D [(1)①②③中都不是简单随机抽样,这是因为:①是放回抽样,②中是“一次性”抽取,而不是“逐个”抽取,③中“指定个子最高的5名同学”,不存在随机性,不是等可能抽样. (2)由随机数表法的随机抽样的过程可知选出的5个个体是08,02,14,07,01,所以第5个个体的编号是01.] [规律方法] 1.简单随机抽样是从含有N(有限)个个体的总体中,逐个不放回地抽取样本,且每次抽取时总体内的各个个体被抽到的机会都相等. 2.(1)一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法. (2)随机数法适用于总体中个体数较多的情形.其中随机数表法的操作要点:编号,选起始数,读数,获取样本. [变式训练1] 下面的抽样方法是简单随机抽样的为( ) 【导学号:31222358】 A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖 B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格 C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见 D.用抽签方法从10件产品中选取3件进行质量检验 D [A,B选项中为系统抽样,C为分层抽样.] 系统抽样及其应用 (1)(2015·湖南高考)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图921所示. 生活的色彩就是学习 K12的学习需要努力专业专心坚持 图921 若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( ) A.3 B.4 C.5 D.6 (2)(2017·郑州调研)从编号为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量为5的样本,若编号为28的产品在样本中,则该样本中产品的最大编号为________. 【导学号:31222359】 (1)B (2)76 [(1)抽样间隔为35÷7=5,因此可将编号为1~35的35个数据分成7组,每组有5个数据,在区间[139,151]上共有20个数据,分在4个小组中,每组取1人,共取4人.
(2)由系统抽样知,抽样间隔k=805=16, 因为样本中含编号为28的产品, 则与之相邻的产品编号为12和44. 故所取出的5个编号依次为12,28,44,60,76,即最大编号为76.]
[规律方法] 1.如果总体容量N能被样本容量n整除,则抽样间隔为k=Nn,否则,可随机地从总体中剔除余数,然后按系统抽样的方法抽样.特别注意,每个个体被抽到的机会均是nN. 2.系统抽样中依次抽取的样本对应的号码就是一个等差数列,首项就是第1组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码. [变式训练2] (1)(2017·唐山模拟)为规范学校办学,某省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是( ) A.13 B.19 C.20 D.51 (2)(2017·烟台模拟)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到生活的色彩就是学习 K12的学习需要努力专业专心坚持 的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为( ) A.7 B.9 C.10 D.15
(1)C (2)C [(1)由系统抽样的原理知抽样的间隔为524=13,故抽取的样本的编号分别为7,7+13,7+13×2,7+13×3,即抽取的编号为7,20,33,46. (2)抽取号码的间隔为96032=30,落入区间[451,750]的“段”数有750-451+130=10. 故做问卷B的应有10人.] 分层抽样及应用 (1)(2015·北京高考)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( ) A.90 B.100 C.180 D.300 类别 人数 老年教师 900 中年教师 1 800 青年教师 1 600 合计 4 300 (2)某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为________.
(1)C (2)100 [(1)设该样本中的老年教师人数为x,由题意及分层抽样的特点得x900
=3201 600,故x=180.
(2)法一:由题意可得70n-70=3 5001 500,解得n=100. 法二:由题意,抽样比为703 500=150,总体容量为3 500+1 500=5 000,故n=5 000×150
=100.] [规律方法] 1.分层抽样中分多少层,如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠. 2.为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即ni∶Ni=n∶N.分层抽样的有关