2018年高考数学课标通用(理科)一轮复习配套课件:第十章 统计与统计案例10-1
教育最新K12课标通用2018年高考数学一轮复习第十章统计与统计案例10.1随机抽样学案理

§10.1随机抽样考纲展示►1.理解随机抽样的必要性和重要性.2.会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样.考点1 简单随机抽样1.定义:设一个总体含有N个个体,从中________抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都________,就把这种抽样方法叫做简单随机抽样.答案:逐个不放回地相等2.最常用的简单随机抽样的方法:________和________.答案:抽签法随机数法(1)[教材习题改编]在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是( )A.总体B.个体C.样本的容量D.从总体中抽取的一个样本答案:A解析:由题目条件知,5 000名居民的阅读时间的全体是总体;其中1名居民的阅读时间是个体;从5 000名居民某天的阅读时间中抽取的200名居民的阅读时间是从总体中抽取的一个样本,样本容量是200.(2)[教材习题改编]2017年1月6日~8日某重点中学在毕业班进行了一次模拟考试,为了了解全年级1 000名学生的考试成绩,从中随机抽取了100名学生的成绩单,下面说法:①1 000名学生是总体;②每名学生是个体;③1 000名学生的成绩是一个个体;④样本的容量是100.其中正确的序号是__________.答案:④解析:1 000名学生的成绩是总体,每名学生的成绩是个体,被抽取的100名学生的成绩是一个样本,其样本的容量是100.频数问题:频数=样本容量×频率.[2017·湖北武汉武昌区模拟]已知某地区中小学生人数和近视情况如下表所示.则:(1)样本容量为________;(2)抽取的高中生中,近视的人数为________.答案:(1)200 (2)20解析:由题意可得,总人数为10 000,因为抽取2%的学生进行调查,所以样本容量为10 000×2%=200,则抽取的高中生有200×2 00010 000=40,其中近视的人数为40×50%=20.[典题1] (1)老师在班级50名学生中,依次抽取学号为5,10,15,20,25,30,35,40,45,50的学生进行作业检查,这种抽样方法是( )A.随机抽样B.分层抽样C.系统抽样D.以上都不是[答案] C[解析]因为抽取学号是以5为公差的等差数列,故采用的抽样方法应是系统抽样.(2)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )A.08 B.07C.02 D.01[答案] D[解析]从第1行第5列和第6列组成的数65开始由左到右依次选出的数为08,02,14,07,01,所以第5个个体的编号为01.(3)下列抽取样本的方式不属于简单随机抽样的有________.(填序号)①从无限多个个体中抽取100个个体作为样本.②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.③从20件玩具中一次性抽取3件进行质量检验.④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.[答案]①②③④[解析]①不是简单随机抽样.因为被抽取样本的总体的个数是无限的,而不是有限的.②不是简单随机抽样.因为它是有放回抽样.③不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.④不是简单随机抽样.因为不是等可能抽样.[点石成金] 1.一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.2.在使用随机数表时,如遇到三位数或四位数时,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.考点2 系统抽样系统抽样(1)定义:在抽样时,将总体分成________的几个部分,然后按照________的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样(也称为机械抽样).(2)适用范围:适用于________很多且________总体抽样.答案:(1)均衡事先确定(2)元素个数均衡的(1)[教材习题改编]为规范学校办学,省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应为( )A .13B .19C .20D .51 答案:C解析:抽样间隔为46-33=13,故另一位同学的编号为7+13=20,故选C.(2)[教材习题改编]为了检查某超市货架上的饮料是否含有塑化剂,要从编号依次为1到50的塑料瓶装饮料中抽取5瓶进行检验,用系统抽样的方法确定所选取的5瓶饮料的编号可能是__________.(填序号)①5,10,15,20,25 ②2,4,8,16,32 ③1,2,3,4,5 ④7,17,27,37,47 答案:④解析:利用系统抽样,把编号分为5段,每段10个,每段抽取1个,号码间隔为10.只有④正确.[典题2] (1)为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( )A .50B .40C .25D .20 [答案] C[解析] 由系统抽样的定义知,分段间隔为1 00040=25.(2)[2017·东北三省哈尔滨、长春、沈阳、大连四市联考]将高一·九班参加社会实践编号为1,2,3,…,48的48名学生,采用系统抽样的方法抽取一个容量为4的样本,已知5号、29号、41号学生在样本中,则样本中还有一名学生的编号是________.[答案] 17[解析] 根据系统抽样的概念,所抽取的4个样本的编号应成等差数列,因为在这组数中的间距为41-29=12,所以所求的编号为5+12=17.[点石成金] 解决系统抽样问题的两个关键步骤(1)分组的方法应依据抽取比例而定,即根据定义每组抽取一个样本.(2)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定了.考点3 分层抽样分层抽样(1)定义:在抽样时,将总体________的层,然后按照________,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体是由________几个部分组成时,往往选用分层抽样. 答案:(1)分成互不交叉 一定的比例 (2)差异明显的(1)[教材习题改编]一支田径队共有运动员98人,其中女运动员42人,用分层抽样的方法抽取一个样本,每名运动员被抽到的概率都是27,则应抽取男运动员________人.答案:16解析:设应抽取男运动员x 人,则x 98-42=27,解得x =16.(2)[教材习题改编]某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________.答案:25解析:由题意知,男生共有500名,根据分层抽样的特点,在容量为45的样本中男生应抽取的人数为45×500900=25.分层抽样:差异明显;按比例抽样.某工厂生产A ,B ,C 三种不同型号的产品,产品数量之比依次为k ∶5∶3,现用分层抽样的方法抽出一个容量为120的样本,已知A 种型号的产品共抽取了24件,则C 种型号产品抽取的件数为__________.答案:36解析:∵A ,B ,C 三种产品的数量之比依次为k ∶5∶3, ∴由kk +3+5=24120,解得k =2,则C 种型号产品抽取的件数为120×310=36.[典题3] (1)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )[答案] C[解析] 设该样本中的老年教师人数为x ,由题意及分层抽样的特点,得x 900=3201 600,故x =180.(2)[2017·云南统一复习检测]某公司员工对户外运动分别持“喜欢”“不喜欢”和“一般”三种态度,其中持“一般”态度的比持“不喜欢”态度的多12人,按分层抽样方法从该公司全体员工中选出部分员工座谈户外运动,如果选出的人有6位对户外运动持“喜欢”态度,有1位对户外运动持“不喜欢”态度,3位持“一般 ”态度.那么这个公司全体员工中对户外运动持“喜欢”态度的人数为( )A .36B .30C .24D .18 [答案] A[解析] 设持“不喜欢”态度的有x 人,则持“一般”态度的有(x +12)人. 按分层抽样方法,可得1x =3x +12.解得x =6.∴持“喜欢”态度的有6×6=36(人).故选A.[点石成金] 进行分层抽样的相关计算时,常利用以下关系式巧解:(1)样本容量n 总体的个数N =该层抽取的个体数该层的个体数; (2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.[方法技巧] 三种抽样方法中简单随机抽样是最基本的抽样方法,是其他两种方法的基础,适用范围不同,要根据总体的具体情况选用不同的方法;它们的共同点都是等概率抽样,即抽样过程中每个个体被抽取的概率相等,体现了这三种抽样方法的客观性和公平性,若样本容量为n ,总体的个体数为N ,则用这三种方法抽样时,每一个个体被抽到的概率都是nN.[易错防范] 应用分层抽样应遵循的三点:(1)分层,将相似的个体归为一类,即为一层,分层要求每层的各个个体互不交叉,即不重复不遗漏.(2)分层保证每个个体等可能被抽取,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等.(3)若各层应抽取的个体数不都是整数,则应当调整样本容量,先剔除“多余”的个体.真题演练集训1.[2016·山东卷]某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A .56B .60C .120D .140 答案:D解析:由频率分布直方图可知,这200名学生每周的自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,故这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140.故选D.2.[2015·湖北卷]我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1 534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( )A .134石B .169石C .338石D .1 365石 答案:B解析:设1 534石米内夹谷x 石,则由题意知x 1 534=28254,解得x ≈169.故这批米内夹谷约为169石.3.[2015·新课标全国卷Ⅱ]根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关 答案:D解析:对于A 选项,由图知从2007年到2008年二氧化硫排放量下降得最多,故A 正确.对于B 选项,由图知,由2006年到2007年矩形高度明显下降,因此B 正确.对于C 选项,由图知从2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以C 正确.由图知2006年以来我国二氧化硫年排放量与年份负相关,故选D.4.[2014·天津卷]某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.答案:60解析:设应从一年级本科生中抽取x 名学生,则x300=44+5+5+6,解得x =60. 5.[2015·湖南卷]在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.答案:4解析:对数据进行分组,在区间[139,151]上,有几组就有几个运动员.35÷7=5,因此可将编号为1~35的35个数据分成7组,每组有5个数据,在区间[139,151]上共有20个数据,分在4个小组中,每组取一人,共取4人.课外拓展阅读分层抽样与其他知识的综合分层抽样是历年高考的重要考点之一,高考中常把分层抽样、频率分布、概率综合起来进行考查,反映了当前高考的命题方向,这类试题难度不大,但考查的知识面较为宽广,在解题中要注意准确使用所学知识,不然在一个点上的错误就会导致整体失误.[典例1] 从1,2,…,500这500个号中用系统抽样的方法抽取一个容量为10的样本,已知样本中最小号为15,从样本中随机抽出3个号,至少有两个号能被3整除的抽法种数为('')A.60 B.40C.120 D.36[思路分析] 先根据系统抽样的定义求出样本间隔,然后根据排列组合进行求解即可.[解析]样本间隔为500÷10=50,若样本中最小号为15,则抽取的样本号满足a n=15+50(n-1)=50n-35(n∈N*).对应的号码为15,65,115,165,215,265,315,365,415,465,其中不能够被3整除的号码为65,115,215,265,365,415,有6个,能被3整除的号码有4个.从样本中随机抽出3个号,有两个号能被3整除的抽法种数为C24C16=36,有3个号能被3整除的抽法种数为C34=4.则至少有两个号能被3整除的抽法种数为36+4=40.[答案] B[典例2] 某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如下表:将该样本看成一个总体,从中任取2人,求至少有1人学历为研究生的概率;(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N 个人,其中35岁以下48人,50岁以上10人,再从这N 个人中随机抽取1人,此人的年龄为50岁以上的概率为539,求x ,y 的值. [思路分析][解] (1)用分层抽样的方法在35~50岁年龄段的专业技术人中抽取一个容量为5的样本,设抽取学历为本科的人数为m ,所以3050=m5,解得m =3.抽取的样本中有研究生2人,本科生3人,分别记作S 1,S 2;B 1,B 2,B 3.从中任取2人的所有等可能基本事件共有10个:(S 1,B 1),(S 1,B 2),(S 1,B 3),(S 2,B 1),(S 2,B 2),(S 2,B 3),(S 1,S 2),(B 1,B 2),(B 1,B 3),(B 2,B 3).其中至少有1人的学历为研究生的基本事件有7个:(S 1,B 1),(S 1,B 2),(S 1,B 3),(S 2,B 1),(S 2,B 2),(S 2,B 3),(S 1,S 2).所以从中任取2人,至少有1人学历为研究生的概率为710.(2)由题意,得10N =539,解得N =78.所以35~50岁中被抽取的人数为78-48-10=20, 所以4880+x =2050=1020+y ,解得x =40,y =5. 即x ,y 的值分别为40,5. 温馨提示分层抽样与概率结合的题目多与实际问题紧密联系,计算量和阅读量都比较大,且会有图表,求解时容易造成失误,平时需注意多训练此类型的题目.。
2018高三大一轮复习数学(文)课件:第十章 统计与统计案例 10-1

解析
①不是简单随机抽样.
②不是简单随机抽样.由于它是放回抽样. ③不是简单随机抽样. 因为这是“一次性”抽取, 而不是“逐 个”抽取. ④不是简单随机抽样.因为指定个子最高的 5 名同学是 56 名 中特指的,不存在随机性,不是等可能抽样.
答案 ①②③④
[方法引航]
应用简单随机抽样应注意的问题
基础 考点
知识导航 典例领航
智能
提升反航
课时规范训练
§ 10.1
随机抽样
[知识梳理] 1.抽样调查 (1)抽样调查 通常情况下,从调查对象中按照一定的方法抽取一部分,进 行
调查或观测
,获取数据,并以此对调查对象的某项指标作
出 推断 ,这就是抽样调查.
(2)总体和样本 调查对象的 全体 称为总体,被抽取的
一部分
称为样本.
(3)抽样调查与普查相比有很多优点,最突出的有两点: ①
迅速、及时
;
②节约人力、物力和财力.
2.简单随机抽样 (1)简单随机抽样时,要保证每个个体被抽到的概率 相同 . (2)通常采用的简单随机抽样的方法: 抽签法和随机数法 3.分层抽样 (1)定义: 将总体按其属性特征分成若干类型(有时称作层), 然 后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方 法通常叫作分层抽样,有时也称为类型抽样. (2)分层抽样的应用范围: 当总体是由差异明显的几个部分组成时,往往选用分层抽样. .
A.33 人,34 人,33 人 C.20 人,40 人,30 人
解析:选 B.因为 125∶280∶95=25∶56∶19, 所以抽取人数分别为 25 人,56 人,19 人.
2.(2015· 高考四川卷)某学校为了了解三年级、六年级、九年 级这三个年级之间的学生视力是否存在显著差异,拟从这三个年 级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是 ( ) A.抽签法 C.分层抽样法 B.系统抽样法 D.随机数法
【小初高学习】课标通用2018年高考数学一轮复习第十章统计与统计案例10.3变量间的相关关系统计案例

§10.3 变量间的相关关系、统计案例考纲展示►1.会作两个相关变量的散点图,会利用散点图认识变量之间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归系数公式建立线性回归方程. 3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用. 4.了解回归分析的基本思想、方法及其简单应用.考点1 变量间的相关关系1.常见的两变量之间的关系有两类:一类是函数关系,另一类是________;与函数关系不同,________是一种非确定性关系.答案:相关关系 相关关系2.从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为________,点散布在左上角到右下角的区域内,两个变量的相关关系为________.答案:正相关 负相关对回归系数的理解:解释变量;预报变量.某工厂工人月工资y (元)依劳动产值x (万元)变化的回归直线方程为y ^=900x +600,下列判断正确的是__________.①劳动产值为10 000元时,工资为500元; ②劳动产值提高10 000元时,工资提高1 500元; ③劳动产值提高10 000元时,工资提高900元; ④劳动产值为10 000元时,工资为900元. 答案:③解析:回归系数b ^的意义为:解释变量每增加1个单位,预报变量平均增加b 个单位.[典题1] (1)下列四个散点图中,变量x 与y 之间具有负的线性相关关系的是( )A BC D[答案] D[解析] 观察散点图可知,只有D 选项的散点图表示的是变量x 与y 之间具有负的线性相关关系.(2)四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^=-3.476x +5.648; ③y 与x 正相关且y ^=5.437x +8.493; ④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④ D .①④ [答案] D[解析] 由回归方程y ^=b ^x +a ^知,当b ^>0时,y 与x 正相关,当b ^<0时,y 与x 负相关,∴①④一定错误.[点石成金] 相关关系的直观判断方法就是作出散点图,若散点图呈带状且区域较窄,说明两个变量有一定的线性相关性,若呈曲线型也是有相关性,若呈图形区域且分布较乱则不具备相关性.考点2 线性回归分析1.回归分析对具有________的两个变量进行统计分析的方法叫回归分析.其基本步骤是:(ⅰ)画散点图;(ⅱ)求________;(ⅲ)用回归直线方程作预报.答案:相关关系 回归直线方程 2.回归直线如果散点图中点的分布从整体上看大致在________附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.答案:一条直线3.回归直线方程的求法——最小二乘法设具有线性相关关系的两个变量x ,y 的一组观察值为(x i ,y i )(i =1,2,…,n ),则回归直线方程y ^=b ^x +a ^的系数为:⎩⎪⎨⎪⎧b ^=∑i =1nx i-x y i-y ∑i =1nx i-x2= ,a ^=y -b ^x ,其中x =1n ∑i =1n x i ,y =1n ∑i =1ny i ,(x ,y )称为样本点的________.答案:∑i =1nx i y i -n x y∑i =1nx 2i -n x 2中心4.相关系数当r >0时,表明两个变量________; 当r <0时,表明两个变量________.r 的绝对值越接近于1,表明两个变量的线性相关性________.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.答案:正相关 负相关 越强[教材习题改编]已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程为__________.答案:y ^=1.23x +0.08解析:设回归直线方程为y ^=1.23x +a ^, 因为回归直线必过样本点的中心(x ,y ), 将点(4,5)代入回归直线方程得a ^=0.08, 所以所求方程为y ^=1.23x +0.08.变量的相关关系:散点图;回归直线过(x ,y ).某工厂经过技术改造后,生产某种产品的产量x (吨)与相应的生产能耗y (吨标准煤)有如下几组样本数据.0.7,那么当产量x =10吨时,估计相应的生产能耗为__________吨标准煤.答案:7.35解析:先求得x =4.5,y =3.5,由y ^=0.7x +a ^过点(x ,y ),得a ^=0.35, 所以回归直线方程是y ^=0.7x +0.35.当x =10吨时,y ^=7+0.35=7.35(吨标准煤).[典题2] (1)已知x ,y 的取值如下表,从散点图可以看出y 与x 线性相关,且回归方程为y ^=0.95x +a ^,则a ^=( )A.3.25 C .2.2D .0[答案] B[解析] 由已知得x =2,y =4.5, 因为回归方程经过点(x ,y ), 所以a ^=4.5-0.95×2=2.6.(2)由某种设备的使用年限x i (年)与所支出的维修费y i (万元)的数据资料算得如下结果,∑i =15x 2i =90,∑i =15x i y i =112,∑i =15x i =20,∑i =15y i =25.①求所支出的维修费y 对使用年限x 的线性回归方程y ^=b ^x +a ^; ②(ⅰ)判断变量x 与y 之间是正相关还是负相关; (ⅱ)当使用年限为8年时,试估计支出的维修费是多少.附:在线性回归方程y ^=b ^x +a ^中,b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a ^=y -b ^x ,其中x ,y 为样本平均值.[解] ①∵∑i =15x i =20,∑i =15y i =25,∴x =15∑i =15x i =4,y =15∑i =15y i =5,∴b ^=∑i =15x i y i -5x y∑i =15x 2i -5x 2=112-5×4×590-5×42=1.2, a ^=y -b ^x =5-1.2×4=0.2.∴线性回归方程为y ^=1.2x +0.2. ②(ⅰ)由①知,b ^=1.2>0, ∴变量x 与y 之间是正相关.(ⅱ)由①知,当x =8时,y ^=9.8,即使用年限为8年时,支出维修费约是9.8万元. [点石成金] 1.正确理解计算b ^,a ^的公式和准确的计算是求线性回归方程的关键.2.回归直线方程y ^=b ^x +a ^必过样本点的中心(x ,y ).3.在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求年需求量与年份之间的回归直线方程y =b x +a ; (2)利用(1)中所求出的回归直线方程预测该地2016年的粮食需求量.解:(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程,为此对数据预处理如下:x =0,y =3.2,b ^=--+--+2×19+4×29-5×0×3.2-2+-2+22+42-5×02=26040=6.5,a ^=y -b ^x =3.2. 由上述计算结果知,所求回归直线方程为 y ^-257=b ^(x -2 010)+a ^=6.5(x -2 010)+3.2, 即y ^=6.5×(x -2 010)+260.2.(2)利用(1)中所求回归直线方程,可预测2016年的粮食需求量为6.5×(2 016-2 010)+260.2=6.5×6+260.2=299.2(万吨).考点3 独立性检验1.分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.2.列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表:K2=(其中n=________为样本容量),则利用独立性a +b a+c b+d c+d检验判断表来判断“X与Y的关系”.答案:a+b+c+d(1)[教材习题改编]为调查中学生的近视情况,测得某校150名男生中有80名近视,140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,最有说服力的方法是________.(填序号)①回归分析;②期望与方差;③独立性检验;④概率.答案:③解析:“近视”与“性别”是两个分类变量,其是否有关,应该用独立性检验来判断.(2)[教材习题改编]在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得出“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,有下列四种说法:①100个吸烟者中至少有99人患有肺癌;②1个人吸烟,那么这人有99%的概率患有肺癌;③在100个吸烟者中一定有患肺癌的人;④在100个吸烟者中可能一个患肺癌的人也没有.其中正确说法的序号是________.答案:④对独立性检验的理解:K2的计算;对P(K2≥k0)的解释.[2017·湖南张家界模拟]某高校教“统计初步”课程的教师随机调查了选该课程的一些学生的情况,具体数据如下表:k=-223×27×20×30≈4.844.因为k>3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________.附表:解析:∵k>3.841,查临界值表,得P(K2≥3.841)=0.05,故这种判断出错的可能性为5%.[典题3] (1)为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:已知PP(K2≥5.024)≈0.025.根据表中数据,得到K2=-223×27×20×30≈4.844,则认为选修文理科与性别有关系出错的可能性约为________.[答案]5%[解析]由K2≈4.844>3.841.故认为选修文理科与性别有关系出错的可能性约为5%.(2)[2017·江西九江模拟]某校数学课外兴趣小组为研究数学成绩是否与性别有关,先统计本校高三年级每个学生一学期数学成绩平均分(采用百分制),剔除平均分在40分以下的学生后,共有男生300名,女生200名.现采用分层抽样的方法,从中抽取了100名学生,按性别分为两组,并将两组学生的成绩分为6组,得到如下所示的频数分布表.数学成绩与性别是否有关;②规定80分以上为优分(含80分),请你根据已知条件作出2×2列联表,并判断是否有90%以上的把握认为“数学成绩与性别有关”.K2=.a +b c+d a+c b+d[解]①x男=45×0.05+55×0.15+65×0.3+75×0.25+85×0.1+95×0.15=71.5,x女=45×0.15+55×0.1+65×0.125+75×0.25+85×0.325+95×0.05=71.5,从男、女生各自的平均分来看,并不能判断数学成绩与性别有关.②由频数分布表可知,在抽取的100名学生中,“男生组”中的优分有15人,“女生组”中的优分有15人,据此可得2×2列联表如下:≈1.79,可得K2=60×40×30×70因为1.79<2.706,所以没有90%以上的把握认为“数学成绩与性别有关”.[点石成金] 1.独立性检验的关键是正确列出2×2列联表,并计算出K2的值.2.弄清判断两变量有关的把握性与犯错误概率的关系,根据题目要求作出正确的回答.[2017·广西玉林、贵港联考]某市地铁即将于2015年6月开始运营,为此召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了50人,他们的收入与态度如下;“认为价格偏高者”的月平均收入的差距是多少(结果保留2位小数);(2)由以上统计数据填写下面的2×2列联表分析是否有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.附:K 2=a +bc +d a +c b +d. 解:x 1=20×1+30×2+40×3+50×5+60×3+70×41+2+3+5+3+4≈50.56.“认为价格偏高者”的月平均收入为x 2=20×4+30×8+40×12+50×5+60×2+70×14+8+12+5+2+1=38.75,∴“赞成定价者”与“认为价格偏高者”的月平均收入的差距是x 1-x 2=50.56-38.75=11.81(百元).(2)根据条件可得2×2列联表如下:K 2=10×40×18×32≈6.27<6.635,∴没有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.[方法技巧] 1.求回归方程,关键在于正确求出系数a ^,b ^,由于a ^,b ^的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误.(注意线性回归方程中一次项系数为b ^,常数项为a ^,这与一次函数的习惯表示不同.)2.回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程.[易错防范] 1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.2.独立性检验中统计量K 2的观测值k 的计算公式很复杂,在解题中易混淆一些数据的意义,代入公式时出错,而导致整个计算结果出错.真题演练集训1.[2015·福建卷]为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元 答案:B解析:由题意知,x =8.2+8.6+10.0+11.3+11.95=10,y =6.2+7.5+8.0+8.5+9.85=8,∴ a ^=8-0.76×10=0.4,∴ 当x =15时,y ^=0.76×15+0.4=11.8(万元).2.[2016·新课标全国卷Ⅲ]下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1-7分别对应年份2008-2014.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,i =17y i -y2=0.55,7≈2.646.参考公式:相关系数r=∑i =1nt i -ty i -y∑i =1nt i -t2∑i =1n y i -y2,回归方程y ^=b ^t +a ^中斜率和截距的最小二乘估计公式分别为b ^=∑i =1nt i -ty i -y∑i =1nt i -t2,a ^=y -b ^t .解:(1)由折线图中数据和附注中参考数据,得t =4,∑i =17 (t i -t )2=28,∑i =17y i -y2=0.55,∑i =17 (t i -t)(y i -y )=∑i =17t i y i -t∑i =17y i =40.17-4×9.32=2.89,r ≈ 2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1),得b ^=∑i =17t i -ty i -y∑i =17t i -t2=2.8928≈0.103, a ^=y -b ^t ≈1.331-0.103×4≈0.92.所以,y 关于t 的回归方程为y ^=0.92+0.10t . 将2016年对应的t =9代入回归方程,得 y ^=0.92+0.10×9=1.82.所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.3.[2015·新课标全国卷Ⅰ]某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i =x i ,w =18∑i =18x i .(1)根据散点图判断,y =a +bx 与y=c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程.(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+β u 的斜率和截距的最小二乘估计分别为β^=∑i =1nu i -uv i -v∑i =1nu i -u2,α^=v -β^u .解:(1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程.由于d ^=∑i =18w i -wy i -y∑i =18w i -w2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w , 因此y 关于x 的回归方程为y ^=100.6+68x . (3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6,年利润z 的预报值z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值 z ^=0.2(100.6+68x )-x =-x +13.6x +20.12.所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.4.[2014·新课标全国卷Ⅱ]某地区2007年至2013年农村居民家庭人均纯收入y (单位:千元)的数据如下表:(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:b ^=∑i =1nt i -ty i -y∑i =1nt i -t2,a ^=y -b ^t .解:(1)由所给数据计算得t =17×(1+2+3+4+5+6+7)=4,y =17×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,∑i =17(t i -t )2=9+4+1+0+1+4+9=28,∑i =17(t i -t)(y i -y )=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,b ^=∑i =17t i -ty i -y∑i =17t i -t2=1428=0.5, a ^=y -b ^t =4.3-0.5×4=2.3.所求回归方程为y ^=0.5t +2.3.(2)由(1)知,b ^=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号t =9代入(1)中的回归方程,得 y ^=0.5×9+2.3=6.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元.课外拓展阅读 统计案例问题的规范答题[典例] [2013·福建卷]某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?附:K 2=a +bc +d a +cb +d.[审题视角] 由频率分布直方图列举基本事件,结合古典概型,求概率.利用独立性检验公式计算K 2.[解] (1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A 1,A 2,A 3;25周岁以下组工人有40×0.05=2(人),记为B 1,B 2.从中随机抽取2名工人,所有的可能结果共有10种,它们是(A 1,A 2),(A 1,A 3),(A 2,A 3),(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(B 1,B 2).其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(B 1,B 2).故所求的概率P =710.(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有60×0.25=15(人),“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如下:所以K 2=a +bc +d a +cb +d=-260×40×30×70=2514≈1.79. 因为1.79<2.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”. [答题模板] 第1步:由分层抽样计算两组工人的数目; 第2步:由频率分布直方图计算两组不足60件的人数; 第3步:列举5人抽取2人的基本事件数; 第4步,由古典概型计算概率;第5步:统计生产能手与非生产能手,列2×2列联表; 第6步:由公式计算K 2,确定答案. 归纳总结(1)分层抽样比为100500=15,故25周岁以上有300×15=60(人),25周岁以下的200×15=40(人),然后再根据频率计算“不足60件”的人数,并设定符号.(2)列2×2列联表时,其中的数字应先由频率分布直方图算出后再列表.。
2018版高考数学大一轮复习第十章统计与统计案例103变量间的相关关系统计案例课件文北师大版

×
考点自测
1.(2015·湖北)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是
A.x与y正相关,x与z负相关
B.x与y正相关,x与z正相关 C.x与y负相关,x与z负相关
答案
解析
D.x与y负相关,x与z正相关
因为y=-0.1x+1,-0.1<0,所以x与y负相关. 又y与z正相关,故可设z=by+a(b>0), 所以z=-0.1bx+b+a,-0.1b<0,所以x与z负相关.故选C.
a =___y ___b_x____.
3.回归分析
(1)定义:对具有
的两个变相量关进关行系统计分析的一种常用方法.
(2)样本点的中心
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn)中,(
)称为样本点的中心.
x,y
(3)相关系数
①r=
n
∑ xi- x yi- y
i=1
关于年宣传费 x 的回归方程类型?(给出判断即可,不必说明理由)
解答
由散点图可以判断,y=c+d x适宜作为年销售量 y 关于年宣传费 x 的 回归方程类型.
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
解答
令 w= x,先建立 y 关于 w 的线性回归方程,由于
8
i=1
d=
wi- w
利用统计量χ2来判断“两个分类变量有关系”的方法称为独立性检验. 当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的; 当χ2>2.706时,有90%的把握判定变量A,B有关联; 当χ2>3.841时,有95%的把握判定变量A,B有关联; 当χ2>6.635时,有99%的把握判定变量A,B有关联.
2018高考数学大一轮复习第十章算法初步统计统计案例第四节变量间的相关关系统计案例课件文

1.易混淆相关关系与函数关系,两者的区别是函数关系是一种 确定的关系,而相关关系是一种非确定的关系,函数关系是 一种因果关系,而相关关系不一定是因果关系,也可能是伴 随关系. 2.回归分析中易误认为样本数据必在回归直线上,实质上回归 直线必过(- x ,- y )点,可能所有的样本数据点都不在直线上. 3.利用回归方程分析问题时,所得的数据易误认为是准确值, 而实质上是预测值(期望值).
解析:注意到回归直线必经过样本中心点. 答案:C
(
)
B.l1 与 l2 必定重合
考点一
相关关系的判断
[题组练透]
1.(2015· 湖北高考)已知变量 x 和 y 满足关系 y=-0.1x+1, 变量 y 与 z 正相关.下列结论中正确的是 A.x 与 y 正相关,x 与 z 负相关 B.x 与 y 正相关,x 与 z 正相关 C.x 与 y 负相关,x 与 z 负相关 D.x 与 y 负相关,x 与 z 正相关 ( )
第四节
变量间的相关关系 统计案例
1.变量间的相关关系 (1)常见的两变量之间的关系有两类: 一类是函数关系, 另一
相关关系 ;与函数关系不同, _________ 相关关系 是一种非 类是__________
确定性关系. (2)从散点图上看, 点散布在从左下角到右上角的区域内, 两
正相关 , 个变量的这种相关关系称为________ 点散布在左上角到 负相关 . 右下角的区域内,两个变量的相关关系为_______
解析:由于线性回归方程中 x 的系数为 0.85,因此 y 与 x 具有正的线性相关关系,故 A 正确.又线性回归方程必过 样本中心点( x , y ),因此 B 正确.由线性回归方程中系数 的意义知,x 每增加 1 cm,其体重约增加 0.85 kg,故 C 正确. 当某女生的身高为 170 cm 时, 其体重估计值是 58. 79 kg,而不是具体值,因此 D 不正确. 答案:D
2018版高考数学大一轮复习第十章统计与统计案例10.3变量间的相关关系统计案例课件文新人教版

表(称为2×2列联表)为
2×2列联表 y1 y2 总计
x1
x2
a
c
b
d
a+b
c+d
总计
a+c
b+d
a+b+c+d
构造一个随机变量K2=
nad-bc2 a+bc+da+cb+d ,其中n=
a+b+c+d 为样本容量.
^
5.(2016· 玉溪一中月考)利用独立性检验来判断两个分类变量X和Y是否
有关系,通过查阅下表来确定“X和Y有关系”的可信度.为了调查用
电脑时间与视力下降是否有关系,现从某地网民中抽取100位居民进
95 行调查 . 经过计算得 K2≈3.855 ,那么就有 ________% 的把握认为用电
脑时间与视力下降有关系. P(K2≥k0)
量(单位:亿吨)的折线图.
注:年份代码17分别对应年份2008-2014. (1) 由折线图看出,可用线性回归模型拟合 y 与 t 的关系,请用相关系数 加以说明; 解答
(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾 无害化处理量. 附注:
7 7 7
参考数据: yi=9.32, tiyi=40.17,
(2)变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4), (13,5) ; 变 量 U 与 V 相 对 应 的 一 组 数 据 为 (10,5) , (11.3,4) , (11.8,3) , (12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与 U之间的线性相关系数,则 A.r2<r1<0 C.r2<0<r1
2018年高考数学(人教理科)总复习配套课件:第十章 算法初步、统计与统计 10.4

考点自测
3.独立性检验 (1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类 变量称为分类变量. (2)2×2列联表:假设有两个分类变量X和Y,它们的值域分别为 {x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为:
y1 x1 x2 总计 K2= a c a+c y2 b d b+d 合计 a+b c+d a+b+c+d
10.4
变量间的相关关系、统计案例
考情概览备考定向
必备知识预案自诊
关键能力学案突破
-2-
知识梳理
考点自测
1.变量间的相关关系 (1)定义:当自变量取值一定时,因变量的取值带有一定随机性的 两个变量之间的关系叫做相关关系.与函数关系不同,相关关系是 一种 非确定性关系 . (2)散点图:表示具有相关关系的两个变量的一组数据的图形叫做 散点图,它可直观地判断两个变量的关系是否可以用线性关系表示. 若这些散点分布在从左下角到右上角的区域,则称两个变 量 正相关 ;若这些散点分布在从左上角到右下角的区域,则 称两个变量 负相关 . (3)线性相关关系、回归直线:如果散点图中点的分布从整体上看 一条直线附近 大致在 ,就称这两个变量之间具有线 性相关关系,这条直线叫做回归直线.
������=� -������������
2
,
������ = ������- ������ ������ .
������ ������ =1
^
(3)通过求 Q= ∑ (yi-bxi-a)2 的最小值而得到回归直线的方法,即 使得样本数据的点到回归直线的距离的平方和最小的方法叫做最 小二乘法.
考情概览备考定向
必备知识预案自诊
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
为了解该地区中小学生近视形成的原因, 用分层抽样的方法 抽取 2%的学生进行调查,则:
200 (1)样本容量为________ ; 20 (2)抽取的高中生中,近视的人数为________ .
解析:由题意可得,总人数为 10 000,因为抽取 2%的学生 进行调查, 所以样本容量为 10 000×2% = 200 ,则抽取的高中生有 2 000 200× =40, 10 000 其中近视的人数为 40×50%=20.
④ 个个体;④样本的容量是 100.其中正确的序号是__________ .
解析:1 000 名学生的成绩是总体,每名学生的成绩是个体, 被抽取的 100 名学生的成绩是一个样本,其样本的容量是 100.
频数问题:频数=样本容量×频率. [2017· 湖北武汉武昌区模拟 ] 已知某地区中小学生人数和近 视情况如下表所示. 年级 小学 初中 高中 人数 3 500 4 500 2 000 近视率 10% 30% 50%
依次选出的数为 08,02,14,07,01,所以第 5 个个体的编号为 01.
(3) 下 列 抽 取 样 本 的 方 式 不 属 于 简 单 随 机 抽 样 的 有
①②③④ .(填序号) ____________
①从无限多个个体中抽取 100 个个体作为样本. ②盒子里共有 80 个零件,从中选出 5 个零件进行质量检 验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把 它放回盒子里. ③从 20 件玩具中一次性抽取 3 件进行质量检验. ④某班有 56 名同学,指定个子最高的 5 名同学参加学校组 织的篮球赛.
[解析]
①不是简单随机抽样.因为被抽取样本的总体的个
数是无限的,而不是有限的. ②不是简单随机抽样.因为它是有放回抽样. ③不是简单随机抽样.因为这是 “ 一次性 ” 抽取,而不是 “逐个”抽取. ④不是简单随机抽样.因为不是等可能抽样.
[点石成金]
1.一个抽样试验能否用抽签法,关键看两点:
一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量 和样本容量都较小时可用抽签法. 2.在使用随机数表时,如遇到三位数或四位数时,可从选 择的随机数表中的某行某列的数字计起, 每三个或四个作为一个 单位,自左向右选取,有超过总体号码或出现重复号码的数字舍 去.
解析:由题目条件知,5 000 名居民的阅读时间的全体是总 体;其中 1 名居民的阅读时间是个体;从 5 000 名居民某天的阅 读时间中抽取的 200 名居民的阅读时间是从总体中抽取的一个 样本,样本容量是 200.
(2)[教材习题改编]2017 年 1 月 6 日~8 日某重点中学在毕业 班进行了一次模拟考试,为了了解全年面说法:①1 000 名学生是总体;②每名学生是个体;③1 000 名学生的成绩是一
[典题 1]
(1)老师在班级 50 名学生中,依次抽取学号为
5,10,15,20,25,30,35,40,45,50 的学生进行作业检查,这种抽样 方法是( C ) A.随机抽样 C.系统抽样 B.分层抽样 D.以上都不是
[解析]
因为抽取学号是以 5 为公差的等差数列,故采用的
抽样方法应是系统抽样.
C.20 D.51
解析:抽样间隔为 46-33=13, 故另一位同学的编号为 7+13=20,故选 C.
(2)[ 教材习题改编 ] 为了检查某超市货架上的饮料是否含有 塑化剂,要从编号依次为 1 到 50 的塑料瓶装饮料中抽取 5 瓶进 行检验, 用系统抽样的方法确定所选取的 5 瓶饮料的编号可能是
必考部分
第十章
统计与统计案例
§10.1 随机抽样
考纲展示► 1.理解随机抽样的必要性和重要性. 2.会用简单随机抽样方法从总体中抽取样本,了解分层抽样 和系统抽样.
考点 1
简单随机抽样
逐个不放回地 1.定义: 设一个总体含有 N 个个体, 从中__________________
抽取 n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个
相等 , 体被抽到的机会都________ 就把这种抽样方法叫做简单随机抽
样.
随机数法 . 抽签法 和__________ 2.最常用的简单随机抽样的方法:________
(1)[教材习题改编]在“世界读书日”前夕,为了了解某 地 5 000 名居民某天的阅读时间,从中抽取了 200 名居民的 阅读时间进行统计分析. 在这个问题中, 5 000 名居民的阅读 时间的全体是( A ) A.总体 B.个体 C.样本的容量 D.从总体中抽取的一个样本
(2)总体由编号为 01,02,„,19,20 的 20 个个体组成, 利用下面的随机数表选取 5 个个体,选取方法是从随机数表 第 1 行的第 5 列和第 6 列数字开始由左到右依次选取两个数 字,则选出来的第 5 个个体的编号为( D )
A.08 C.02
B.07 D.01
[解析]
从第 1 行第 5 列和第 6 列组成的数 65 开始由左到右
考点 2 系统抽样
系统抽样
均衡 的几个部分,然后 (1)定义:在抽样时,将总体分成________ 事先确定 的规则,从每一部分抽取一个个体,得到所需 按照____________
要的样本,这种抽样方法叫做系统抽样(也称为机械抽样).
均衡的 总体抽 元素个数 很多且 ________ (2) 适用范围:适用于 ____________
样.
(1)[教材习题改编]为规范学校办学,省教育厅督察组对 某所高中进行了抽样调查. 抽到的班级一共有 52 名学生, 现 将该班学生随机编号,用系统抽样的方法抽取一个容量为 4 的样本,已知 7 号、33 号、46 号同学在样本中,那么样本中 还有一位同学的编号应为( C ) A.13 B.19
④ __________ .(填序号)
①5,10,15,20,25 ③1,2,3,4,5
②2,4,8,16,32
④7,17,27,37,47
解析:利用系统抽样,把编号分为 5 段,每段 10 个,每段 抽取 1 个,号码间隔为 10.只有④正确.