高中数学-系统抽样
高中数学《系统抽样》课件

号,…,发票上的销售金额组成一个调查样本.这种抽取样
本的方法是( )
A.抽签法
B.随机数法
C.系统抽样法 D.以上都不对
11
课前自主预习
课堂互动探究
随堂达标自测
课后课时精练
数学 ·必修3
(2)为了解 1200 名学生对学校某项教改试验的意见,打 算从中抽取一个容量为 30 的样本,考虑采用系统抽样,则 分段的间隔 k=___4_0____.
7
课前自主预习
课堂互动探究
随堂达标自测
课后课时精练
数学 ·必修3
(2)(教材改编 P59T3)校团委会把全校同学中学号末位是 0 的同学召集起来,开座谈会,这是运用了__系__统____抽样.
解析 结合抽样的特征可知,该抽样为系统抽样.
8
课前自主预习
课堂互动探究
随堂达标自测
课后课时精练
数学 ·必修3
6
课前自主预习
课堂互动探究
随堂达标自测
课后课时精练
数学 ·必修3
2.做一做 (1)在一次抽样活动中,采取系统抽样的方法,若第一 组抽取的是 2 号,第二组抽取的是 12 号,则第三组抽取的 是( ) A.21 号 B.22 号 C.23 号 D.24 号
解析 ∵第一组抽取的是 2 号,第二组抽取的是 12 号, ∴组距为 10,故第三组抽取的是 2+10×2=22 号,故选 B.
数学 ·必修3
第二章 统计
2.1 随机抽样 2.1.2 系统抽样
1
课前自主预习
课堂互动探究
随堂达标自测
课后课时精练
数学 ·必修3
课前自主预习
2
课前自主预习
课堂互动探究
高中数学课件-分层抽样和系统抽样

知识探究(一):分层抽样的基本思想
某地区有高中生2400人,初中生10800人, 小学生11100人.当地教育部门为了了解本地 区中小学生的近视率及其形成原因,要从本 地区的中小学生中抽取1%的学生进行调查.
问应采用怎样的抽样方法?
分析:考察对象的特点是由具有明显差异的几部分组成。
当已知总体由差异明显的几部分组成时,为了 使样本更充分地反映总体的情况,常将总体分 成几个部分,然后按照各部分所占的比例进行 抽样,这种抽样叫做“分层抽样”,其中所分 成的各部分叫做“层”。
从而使得系统抽样操作简单、方便。 3.简单随机抽样是基础,系统抽样与分层抽样是补充和
发展,三者相辅相成,对立统一。
2.2分层抽样与系统抽样
1.什么是简单随机抽样? 设一个总体的个数为N.如果通过逐个抽取的
方法从中抽取一个样本,且每次抽取时各个个 体被抽到的概率相等,就称这样的抽样方法为 简单随机抽样. 2.什么样的总体适合简单随机抽样? 适用范围:总体的个体数不多时.
分层抽样与系统抽样
导入:
设计科学、合理的抽样方法,其核 心问题是保证抽样公平,并且样本具有 好的代表性.如果要调查我校高一学生 的平均身高,由于男生一般比女生高, 故用简单随机抽样,可能使样本不具有 好的代表性.对于此类抽样问题,我们 需要一个更好的抽样方法来解决,这就 是本节课我们研究的问题
分层抽样与系统抽样
具代表性,在实际应用中更为广泛.
思考:分层抽样如何保证每个个体被抽到的概率 相同? 提示:分层抽样中要将总体层次分明的几部分分层 按比例抽取,其中“比例”一词可从两个方面理解. 一是所抽样本中各层个体数之比与总体中各层个 体数之比相同;二是每层所抽个体数与该层个体总 数之比等于样本容量与总体容量之比.这样就保证 了每个个体被抽到的概率相同.
高中数学统计抽样方法精选题目(附答案)

高中数学统计抽样方法精选题目(附答案)一、抽样方法1.简单随机抽样(1)特征:①一个一个不放回的抽取;②每个个体被抽到可能性相等.(2)常用方法:①抽签法;②随机数表法.2.系统抽样(1)适用环境:当总体中个数较多时,可用系统抽样.(2)操作步骤:将总体平均分成几个部分,再按照一定方法从每个部分抽取一个个体作为样本.3.分层抽样(1)适用范围:当总体由差异明显的几个部分组成时可用分层抽样.(2)操作步骤:将总体中的个体按不同特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样.1.(1)采用系统抽样方法从960人中抽取32人做问卷调查.为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为()A.7B.9C.10 D.15(2)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取________所学校,中学中抽取________所学校.[解析](1)从960人中用系统抽样方法抽取32人,则每30人抽取一人,因为第一组抽到的号码为9,则第二组抽到的号码为39,第n组抽到的号码为a n=9+30(n-1)=30n-21,由451≤30n-21≤750,得23615≤n≤25710,所以n=16,17,…,25,共有25-16+1=10人.(2)小学中抽取30×150150+75+25=18所学校;从中学中抽取30×75150+75+25=9所学校.[答案](1)C(2)189注:1.系统抽样的特点(1)适用于元素个数很多且均衡的总体. (2)各个个体被抽到的机会均等.(3)总体分组后,在起始部分抽样时采用的是简单随机抽样. (4)如果总体容量N 能被样本容量n 整除,则抽样间隔为k =Nn . 2.与分层抽样有关问题的常见类型及解题策略(1)确定抽样比.可依据各层总数与样本数之比,确定抽样比.(2)求某一层的样本数或总体个数.可依据题意求出抽样比,再由某层总体个数(或样本数)确定该层的样本(或总体)数.(3)求各层的样本数.可依据题意,求出各层的抽样比,再求出各层样本数. 2.某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )A .抽签法B .系统抽样法C .分层抽样法D .随机数法解析:选C 根据年级不同产生差异及按人数比例抽取易知应为分层抽样法. 3.某学校高一、高二、高三3个年级共有430名学生,其中高一年级学生160名,高二年级学生180名,为了解学生身体状况,现采用分层抽样方法进行调查,在抽取的样本中高二学生有32人,则该样本中高三学生人数为________.解析:高三年级学生人数为430-160-180=90,设高三年级抽取x 人,由分层抽样可得32180=x90,解得x =16. 答案:164.某单位有职工960人,其中青年职工420人,中年职工300人,老年职工240人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为14人,则样本容量为________.解析:因为分层抽样的抽样比应相等,所以420960=14样本容量,样本容量=960×14420=32.答案:32二、用样本的频率分布估计总体的频率分布1.频率分布直方图2.茎叶图5.(1)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5].样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.(2)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].①求图中a的值;②根据频率分布直方图,估计这100名学生语文成绩的平均分;③若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.分数段[50,60)[60,70)[70,80)[80,90)x∶y 1∶12∶13∶44∶5 [为50×0.18=9.答案:9(2)解:①由频率分布直方图可知(0.04+0.03+0.02+2a)×10=1.所以a=0.005.②该100名学生的语文成绩的平均分约为x=0.05×55+0.4×65+0.3×75+0.2×85+0.05×95=73.③由频率分布直方图及已知的语文成绩、数学成绩分布在各分数段的人数比,可得下表:分数段[50,60)[60,70)[70,80)[80,90)x 5403020x∶y 1∶12∶13∶44∶5y 5204025100-(5+20+40+25)=10.注:与频率分布直方图有关问题的常见类型及解题策略(1)已知频率分布直方图中的部分数据,求其他数据,可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据.(2)已知频率分布直方图,求某种范围内的数据,可利用图形及某范围结合求解.6.如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为()A.0.2 B.0.4C.0.5 D.0.6解析:选B由茎叶图可知数据落在区间[22,30)内的频数为4,所以数据落在区间[22,30)内的频率为410=0.4,故选B.7.为了了解某学校学生的身体发育情况,抽查了该校100名高中男生的体重情况,根据所得数据画出样本的频率分布直方图如图所示.根据此图,估计该校2 000名高中男生中体重大于70.5公斤的人数为()A .300B .360C .420D .450解析:选B 样本中体重大于70.5公斤的频率为: (0.04+0.034+0.016)×2=0.090×2=0.18.故可估计该校2 000名高中男生中体重大于70.5公斤的人数为:2 000×0.18=360(人). 8.某商场在庆元宵节促销活动中,对元宵节9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为________万元.解析:总销售额为2.50.1=25(万元),故11时至12时的销售额为0.4×25=10(万元).答案:10三、用样本的数字特征估计总体的数字特征有关数据的数字特征9.(1)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A .46,45,56B .46,45,53C .47,45,56D .45,47,53(2)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差(3)由正整数组成的一组数据x 1,x 2,x 3,x 4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)[解析] (1)从茎叶图中可以看出样本数据的中位数为中间两个数的平均数,即45+472=46,众数为45,极差为68-12=56,故选择A.(2)由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 对;甲、乙的成绩的极差均为4,D 错.故选C.(3)假设这组数据按从小到大的顺序排列为x 1,x 2,x 3,x 4,则⎩⎨⎧x 1+x 2+x 3+x44=2,x 2+x32=2,∴⎩⎪⎨⎪⎧x 1+x 4=4,x 2+x 3=4, 又s = 14[(x 1-2)2+(x 2-2)2+(x 3-2)2+(x 4-2)2] =12(x 1-2)2+(x 2-2)2+(x 3-2)2+(x 4-2)2=122[(x 1-2)2+(x 2-2)2]=1, ∴(x 1-2)2+(x 2-2)2=2. 同理可求得(x 3-2)2+(x 4-2)2=2.由x 1,x 2,x 3,x 4均为正整数,且(x 1,x 2),(x 3,x 4)均为圆(x -2)2+(y -2)2=2上的点,分析知x 1,x 2,x 3,x 4应为1,1,3,3.[答案] (1)A (2)C (3)1,1,3,3 注:平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.10.为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) A .①③ B .①④ C .②③D .②④解析:选B 法一:∵x 甲=26+28+29+31+315=29,x 乙=28+29+30+31+325=30,∴x 甲<x 乙,又s 2甲=9+1+0+4+45=185,s 2乙=4+1+0+1+45=2,∴s 甲>s 乙.故可判断结论①④正确.法二:甲地该月14时的气温数据分布在26和31之间,且数据波动较大,而乙地该月14时的气温数据分布在28和32之间,且数据波动较小,可以判断结论①④正确,故选B.11.甲和乙两个城市去年上半年每月的平均气温(单位:℃)用茎叶图记录如图所示,根据茎叶图可知,两城市中平均温度较高的城市是__________,气温波动较大的城市是__________.解析:根据题中所给的茎叶图可知,甲城市上半年的平均温度为9+13+17×2+18+226=16,乙城市上半年的平均温度为12+14+17+20+24+276=19,故两城市中平均温度较高的是乙城市,观察茎叶图可知,甲城市的温度更加集中在峰值附近,故乙城市的温度波动较大.答案:乙 乙12.甲、乙两台机床同时加工直径为100 mm 的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位:mm):甲:99,100,98,100,100,103; 乙:99,100,102,99,100,100.(1)分别计算上述两组数据的平均数和方差;(2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求. 解:(1)x 甲=99+100+98+100+100+1036=100(mm),x 乙=99+100+102+99+100+1006=100(mm),s 2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73(mm 2), s 2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1(mm 2).(2)因为s 2甲>s 2乙,说明甲机床加工零件波动比较大,因此乙机床加工零件更符合要求.四、线性回归1.两个变量的线性相关(1)散点图:将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形.(2)正相关与负相关:①正相关:散点图中的点散布在从左下角到右上角的区域. ②负相关:散点图中的点散布在从左上角到右下角的区域. 2.回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)线性回归方程:方程y ^=b ^x +a ^是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的线性回归方程,其中a ,b 是待定参数.⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n(x i-x )2=∑i =1nx i y i-n x y ∑i =1nx 2i-n x 2,a ^=y -b x .13.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)[解] (1)由于x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y =16(90+84+83+80+75+68)=80.所以a ^=y -b ^x =80+20×8.5=250,从而回归直线方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得 L =x (-20x +250)-4(-20x +250) =-20x 2+330x -1 000 =-20(x -8.25)2+361.25.当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润. 注:(1)线性回归分析就是研究两组变量间线性相关关系的一种方法,通过对统计数据的分析,可以预测可能的结果,这就是线性回归方程的基本应用,因此利用最小二乘法求线性回归方程是关键,必须熟练掌握线性回归方程中两个重要估计量的计算.(2)回归直线方程恒过点(x ,y ).14.某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:回归方程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻两个月的概率;(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?解:(1)将6组数据按月份顺序编号为1,2,3,4,5,6,从中任取两组数据,基本事件构成的集合为Ω={(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)}共15个基本事件,设抽到相邻两个月的事件为A ,则A ={(1,2),(2,3),(3,4),(4,5),(5,6)}共5个基本事件,∴P (A )=515=13.(2)由表中数据求得x =11,y =24,∑i =14x i y i =1 092,∑i =14x 2i =498.代入公式可得b ^=187.再由a ^=y -b ^x ,求得a ^=-307,所以y 关于x 的线性回归方程为 y ^=187x -307.(3)当x =10时,y ^=1507,⎪⎪⎪⎪1507-22=47<2; 同样,当x =6时,y ^=787,⎪⎪⎪⎪787-12=67<2. 所以该小组所得线性回归方程是理想的.。
高中数学《系统抽样》导学案

第二章统计2.1.2 系统抽样(第1课时)一、学习目标1.理解系统抽样的概念2.掌握系统抽样的一般步骤,会利用系统抽样抽取样本3.理解系统抽样与简单抽样的关系,能够灵活应用系统抽样的方法解决统计问题【重点、难点】系统抽样的概念及其灵活应用;应用系统抽样的方法解决统计问题二、学习过程1.系统抽样的概念:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成_____的若干部分,然后按照预先制定的规则,从每一部分抽取_____个体,得到所需要的样本,这种抽样的方法叫做系统抽样.2.系统抽样的特点:(1)(2)(3)(4)3.系统抽样的一般步骤:(1)(2).(3)(4)不是整数,应如何处理?4.在系统抽样中,若Nn答:【典型例题】例1.某市场想通过检查发票及销售记录的2%来快速估计每月的销量总额.采取如下方法:从某本发票的存根中随机抽一张,如15号,然后按顺序往后将65号,115号,165号,…抽出,发票上的销售额组成一个调查样本.这种抽取样本的方法是 ( ).A.抽签法 B.随机数法C.系统抽样法D.其他的抽样方法例2.某校高中二年级有253名学生,为了了解他们的视力情况,准备按1∶5的比例抽取一个样本,试用系统抽样方法进行抽取,并写出过程.【变式拓展】1. 下列抽样方法不是系统抽样的是 ( ).A.从标有1~15号的15个球中,任选三个作样本,按从小号到大号的顺序,随机选起点i0,以后选i0+5,i0+10(超过15则从1再数起)号入选B.工厂生产的产品用传送带将产品送入包装车间前,在一天时间内检验人员从传送带上每隔五分钟抽一件产品进行检验C.做某项市场调查,规定在商场门口随机抽一个人进行询问调查,直到达到事先规定的调查人数为止D.电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈三、学习总结系统抽样与简单随机抽样的区别与联系:四、随堂检测1.系统抽样适用的总体应是( )A.容量较少的总体B.总体容量较多C.个体数较多但均衡的总体D.任何总体2.某厂从50件产品中,依次抽取到编号为4,8,12,16,20,24,28,32,36,40,44,48的产品进行质检,这种抽样方法最有可能是( )A.随机数表法B.抽签法C.系统抽样D.以上都不是3.要从某学校的10 000个学生中抽取100个进行健康体检,采用何种抽样方法较好?并写出过程.。
高中数学概率统计知识点总结大全

概率统计一,统计初步1.简单随机抽样简单随机抽样是不放回抽样,被抽取样本的个体数有限,从总体中逐个地进行抽取,使抽样便于在实践中操作.每次抽样时,每个个体等可能地被抽到,保证了抽样的公平性.实施方法主要有抽签法和随机数法.2.系统抽样(1)定义:当总体元素个数很大时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方法叫做系统抽样,也称作等距抽样.(2)系统抽样的步骤:①编号.采用随机的方式将总体中的个体编号.②分段.先确定分段的间隔k.当Nn(N为总体中的个体数,n为样本容量)是整数时,k=Nn;当Nn不是整数时,通过从总体中随机剔除一些个体使剩下的总体中个体总数N′能被n整除,这时k=N′n.③确定起始个体编号.在第1段用简单随机抽样确定起始的个体编号S.④按照事先确定的规则抽取样本.通常是将S加上间隔k,得到第2个个体编号S +k,再将(S+k)加上k,得到第3个个体编号S+2k,这样继续下去,获得容量为n 的样本.其样本编号依次是:S,S+k,S+2k,…,S+(n-1)k.3.分层抽样(1)定义:当总体由有明显差别的几部分组成时,按某种特征在抽样时将总体中的各个个体分成互不交叉的层,然后按照各层在总体中所占的比例,从各层独立地抽取一定数量的个体合在一起作为样本,这种抽样的方法叫做分层抽样.分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体中所占比例抽取.分层抽样要求对总体的内容有一定的了解,明确分层的界限和数目,分层要恰当.(2)分层抽样的步骤①分层;②按比例确定每层抽取个体的个数;③各层抽样(方法可以不同);④汇合成样本.(3)分层抽样的优点分层抽样充分利用了己知信息,充分考虑了保持样本结构与总体结构的一致性.使样本具有较好的代表性,而且在各层抽样时,可以根据具体情况采取不同的抽样方法,因此分层抽样在实践中有着非常广泛的应用.4.绘制频率分布直方图把横轴分成若干段,每一段对应一个组距,然后以线段为底作一矩形,它的高等于该组的频率组距,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率.这些矩形就构成了频率分布直方图.在频率分布直方图中,纵轴表示“频率/组距”,数据落在各小组内的频率用小矩形的面积表示,各小矩形的面积总和等于1.5.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图.茎是指中间的一列数,叶是从茎的旁边生长出来的数.在样本数据较少、较为集中,且位数不多时,用茎叶图表示数据的效果较好,它较好的保留了原始数据信息,方便记录与表示,但当样本数据较多时,茎叶图就不太方便.6.平均数、中位数和众数(1)平均数:一组数据的总和除以数据的个数所得的商就是平均数.(2)中位数:如果将一组数据按从小到大的顺序依次排列,当数据有奇数个时,处在最中间的一个数是这组数据的中位数;当数据有偶数个时,处在最中间两个数的平均数,是这组数据的中位数.(3)众数:出现次数最多的数(若有两个或几个数据出现得最多,且出现的次数一样,这些数据都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数).(4)在频率分布直方图中,最高小长方形的中点所对应的数据值即为这组数据的众数.而在频率分布直方图上的中位数左右两侧的直方图面积应该相等,因而可以估计其近似值.平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.7.方差、标准差(1)设样本数据为x1,x2,…,x n样本平均数为x-,则s2=1n[(x1-x-)2+(x2-x-)2+…+(x n-x-)2]=1n[(x12+x22+…+x n2)-n x2]叫做这组数据的方差,用来衡量这组数据的波动大小,一组数据方差越大,说明这组数据波动越大.把样本方差的算术平方根叫做这组数据的样本标准差.(2)数据的离散程度可以通过极差、方差或标准差来描述,其中极差反映了一组数据变化的最大幅度.方差则反映一组数据围绕平均数波动的大小.8.两个变量的线性相关(1)散点图将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,表示具有相关关系的两个变量的一组数据的图形叫做散点图.利用散点图可以判断变量之间有无相关关系.(2)正相关、负相关如果散点图中各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.反之,如果两个变量的散点图中点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.9.回归分析对具有相关关系的两个变量进行统计分析的方法叫回归分析.其基本步骤是:①画散点图,②求回归直线方程,③用回归直线方程作预报.(1)回归直线:观察散点图的特征,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归直线方程的求法——最小二乘法.设具有线性相关关系的两个变量x、y的一组观察值为(x i,y i)(i=1,2,…,n),则回归直线方程y^=a^+b^x的系数为:⎩⎪⎪⎪⎪⎨⎪⎪⎪⎪⎧ b ^=∑i =1n x i y i -n x ·y ∑i =1n x i 2-n x 2=∑i =1n (x i -x -)(y i -y -)∑i =1n (x i -x -)2a^=y --b ^x 其中x -=1n ∑i =1n x i ,y -=1n ∑i =1n y i ,(x -,y -)称作样本点的中心. a ^,b ^表示由观察值用最小二乘法求得的a ,b 的估计值,叫回归系数.10.独立性检验(1)若变量的不同“值”表示个体所属的不同类别,则这些变量称为分类变量.(2)两个分类变量X 与Y 的频数表,称作2×2列联表.二.随机事件的概率1.随机事件和确定事件:在一定的条件下所出现的某种结果叫做事件.(1)在条件S 下,一定会发生的事件叫做相对于条件S 的必然事件.(2)在条件S 下,一定不会发生的事件叫做相对于条件S 的不可能事件.(3)必然事件与不可能事件统称为确定事件.(4)在条件S 下可能发生也可能不发生的事件,叫做随机事件.(5)确定事件和随机事件统称为事件,一般用大写字母,,,A B C 表示. 2.频率与概率(1)在相同的条件S 下重复n 次试验,观察某一事件A 是否出现,称n 次试验中事件A 出现的次数A n 为事件A 出现的频数,称事件A 出现的比例()A n n f A n=为事件A 出现的频率. (2)对于给定的随机事件A ,如果随着试验次数的增加,事件A 发生的频率()n f A 稳定在某个常数上,把这个常数记作()p A ,称为事件A 的概率,简称为A 的概率.3.互斥事件与对立事件互斥事件的定义:在一次试验中,不可能同时发生的两个事件叫做互斥事件.即A B 为不可能事件(A B φ=),则称事件A 与事件B 互斥,其含义是:事件A 与事件B 在任何一次试验中不会同时发生.一般地,如果事件12,,,n A A A 中的任何两个都是互斥的,那么就说事件12,,,n A A A 彼此互斥.对立事件:若不能同时发生,但必有一个发生的两个事件叫做互斥事件;即A B 为不可能事件,而A B 为必然事件,那么事件A 与事件B 互为对立事件,其含义是:事件A 与事件B 在任何一次试验中有且仅有一个发生.互斥事件和对立事件的区别和联系:对立事件是互斥事件,但是互斥事件不一定是对立事件.两个事件互斥是两个事件对立的必要非充分条件.4.事件的关系与运算 B 或A B +) B (或AB ) B 为不可能事件B φ= B 为不可能事件B 为必然事件与事件B 互为对立事件 B φ=且B =Ω5.随机事件的概率事件A 的概率:在大量重复进行同一试验时,事件A 发生的频率nm 总接近于某个常数,在它附近摆动,这时就把这个常数叫做事件A 的概率,记作()p A . 由定义可知()01p A ≤≤,显然必然事件的概率是1,不可能事件的概率是0.5.概率的几个基本性质(1)概率的取值范围:()01p A ≤≤.(2)必然事件的概率:()1p A =.(3)不可能事件的概率:()0p A =.(4)互斥事件的概率加法公式:①()()()p A B p A p B =+(,A B 互斥),且有()()()1p A A p A p A +=+=. ②()()()()1212n n p A A A p A p A p A =+++ (12,,,n A A A 彼此互斥).(5)对立事件的概率:()()1P A P A =-.三.古典概型1. 一次试验连同其中可能出现的每一个结果称为一个基本事件,通常此试验中的某一事件A 由几个基本事件组成.如果一次试验中可能出现的结果有n 个,即此试验由n 个基本事件组成,而且所有结果出现的可能性都相等,那么每一基本事件的概率都是n 1.如果某个事件A 包含的结果有m 个,那么事件A 的概率P (A )=n m . 基本事件的特点(1)任何两个基本事件是互斥的.(2)任何事件都可以表示成基本事件的和(除不可能事件).2.古典概型:具有以下两个特点的概率模型称为古典概率模型,简称古典概型. ①试验中所有可能出现的基本事件只有有限个,即有限性.②每个基本事件发生的可能性相等,即等可能性.概率公式:P (A )=A 包含的基本事件的个数基本事件的总数.四.几何概型1.(1)随机数的概念:随机数是在一定范围内随机产生的数,并且得到这个范围内任何一个数的机会是均等的.(2)随机数的产生方法①利用函数计算器可以得到0~1之间的随机数;②在Scilab 语言中,应用不同的函数可产生0~1或a~b 之间的随机数.2.几何概型(1)定义:如果某个事件发生的概率只与构成该事件区域的长度(面积或体积等)成比例,则称这样的概率模型为为几何概率模型,简称几何概型.(2)特点:①无限性:在一次试验中,可能出现的结果有无限多个; ②等可能性:每个结果的发生具有等可能性.(3)几何概型的解题步骤:首先是判断事件是一维问题还是二维、三维问题(事件的结果与一个变量有关就是一维的问题,与两个变量有关就是二维的问题,与三个变量有关就是三维的问题);接着,如果是一维的问题,先确定试验的全部结果和事件A 构成的区域长度(角度、弧长等),最后代公式()p A =构成事件A 的区域长度面积或体积试验的全部结果所构成的区域长度面积或体积;如果是二维、三维的问题,先设出二维或三维变量,再列出试验的全部结果和事件A 分别满足的约束条件,作出两个区域,最后计算两个区域的面积或体积代公式.(4)求几何概型时,注意首先寻找到一些重要的临界位置,再解答.一般与线性规划知识有联系.3.几种常见的几何概型(1)设线段l 是线段L 的一部分,向线段L 上任投一点.若落在线段l 上的点数与线段L 的长度成正比,而与线段l 在线段l 上的相对位置无关,则点落在线段l 上的概率为:P=l 的长度/L 的长度(2)设平面区域g 是平面区域G 的一部分,向区域G 上任投一点,若落在区域g 上的点数与区域g 的面积成正比,而与区域g 在区域G 上的相对位置无关,则点落在区域g 上概率为:P=g 的面积/G 的面积(3)设空间区域上v 是空间区域V 的一部分,向区域V 上任投一点.若落在区域v 上的点数与区域v 的体积成正比,而与区域v 在区域v 上的相对位置无关,则点落在区域V 上的概率为:P=v 的体积/V 的体积。
《系统抽样》课件

所以抽取的号码是63.
因第7组抽取的号码个位数字应是3,
解析:依编号顺序平均分成的10个小组分别为0~9, 10~19, 20~29, 30~39, 40~49,50~59,60~69,
70~79,80~89,90~99.
这个样本的号码依次是6,18,29,30,41,52,63,74,85,96.
思考:
(1)下列抽样中不是系统抽样的是 ( ) A、从标有1~15号的15个小球中任选3个作为样本,先在1~5号球中用抽签法抽出l号,再将号码为l+5,l+10的球也抽出 ; B、工厂生产的产品,用传送带将产品送入包装车间的过程中,检验人员从传送带上每隔五分钟抽一件产品检验 ; C、搞某市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止. D、电影院调查观众的某一指标,邀请每排(每排人数相等)座位号为14的观众留下来座谈。
C
系统
2
3
4
1
数学运用
例5、某单位在岗职工共624人,为了调查工人用于上班途中的时间,决定抽取10%的工人进行调查。试采用系统抽样方法抽取所需的样本.
解:
将624名职工用随机方式进行编号;
从总体中剔除4人(剔除方法可以用随机数表法),将剩余的620名职工重新编号(分别为000,001,002,…, ,并分成62段;
有
系统抽样比简单随机抽样的应用范围更广.
系统抽样比简单随机抽样更容易实施,可节约抽样成本;
系统抽样与简单随机抽样比较,有何优、缺点?
点评:
系统抽样的效果会受个体编号的影响,而简单随机抽样的效果不受个体编号的影响;系统抽样所得样本的代表性和具体的编号有关,而简单随机抽样所得样本的代表性与个体的编号无关.如果编号的个体特征随编号的变化呈现一定的周期性,可能会使系统抽样的代表性很差.例如学号按照男生单号女生双号的方法编排,那么,用系统抽样的方法抽取的样本就可能会是全部男生或全部女生.
(完整版)高中数学概率统计知识点总结

高中数学概率统计知识点总结一、抽样方法1.简单随机抽样 2.简单随机抽样常用的方法:(1)抽签法;⑵随机数表法.3.系统抽样:K (抽样距离)=N (总体规模)/n (样本规模)4.分层抽样:二、样本估计总体的方式1、用样本的频率分布估计总体分布(1)频率分布直方图的画法;(2)频率的算法;(3)频率分布折线图;(4)总体密度曲线;(5)茎叶图。
化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。
2、用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数的算法;(2)标准差、方差公式.3、样本均值:nx x x x n +++= 21 4、.样本标准差:n x x x x x x s s n 222212)()()(-++-+-==三、两个变量的线性相关1、正相关2、负相关正相关:自变量增加,因变量也同时增加(即单调递增) 负相关:自变量增长,因变量减少(即单调递减)四、概率的基本概念(1)必然事件(2)不可能事件(3)确定事件(4)随机事件(5)频数与频率(6)频率与概率的区别与联系必然事件和不可能事件统称为确定事件1他们都是统计系统各元件发生的可能性大小;2、频率一般是大概统计数据经验值,概率是系统固有的准确值; 3频率是近似值,概率是准确值4、频率值一般容易得到,所以一般用来代替概率进行定量分析,首先要知道系统各元件发生故障的频率或概率.事件的频率与概率是度量事件出现可能性大小的两个统计特征数.频率是个试验值,或使用时的统计值,具有随机性,可能取多个数值。
因此,只能近似地反映事件出现可能性的大小概率是个理论值,是由事件的本质所决定的,只能取唯一值,它能精确地反映事件出现可能性的大小虽然概率能精确反映事件出现可能性的大小,但它通过大量试验才能得到,这在实际工作中往往是难以做到的.所以,从应用角度来看,频率比概率更有用,它可以从所积累的比较多的统计资料中得到需要指出的是用频率代替概率,并不否认概率能更精确、更全面地反映事件出现可能性的大小,只是由于在目前的条件下,取得概率比取得频率更为困难。
实验高一系统抽样与分层抽样人教版

(3)利用简单随机抽样或系统抽样的方法,从各年龄段分别抽取25,56,19人,然后合在一起,就是所抽取的样本。
(2)利用抽样比确定各年龄段应抽取的个体数,依次为 ,即25,56,19。
01
分层抽样是等可能抽样,它也是公平的。用分层抽样从个体为N的总体中抽取一个容量为n的样本时,在整个抽样过程中每个个体被抽到的可能相等 为n/N。
变式训练:
课堂总结: 三种抽样方法的比较
当堂检测
1、在下列问题中,各采用什么抽样方法抽取样本较适合?
(1)从20台电脑中抽取4台进行质量检测; (2)从2004名同学中,抽取一个容量为20的样本 (3)某中学有180名教工,其中业务人员136名,管理人员20名,后勤人员24名,从中抽取一个容量为15的样本。
3
按3确定的数目在各层中随机抽取个体,合在一起得到容量为n的样本
4
分层
5
求比
6
定数
7
抽样
8
分层抽样的抽取步骤:
9
某中学高中学生有900名。为了考察他们的体重情况,打算抽取样本容量为45的一个样本。已知高一有400名学生,高二有300名学生,高三有200名学生.采用分层抽样应该怎么样抽取呢?
如果高一,高二,高三的学生数分别为402,296,202应该怎样抽取呢?
2
2
1
例1:某单位在岗职工共624人,为了调查工人用于上班途中的时间,决定抽取62个工人进行调查。如何采用系统抽样方法完成这一抽样?
分析:因为624的10%约为62,624不能被62整除,为了保证“等距”分段,应先剔除4人。
例题分析:
2、采用系统抽样的方法,从个体数为1003的总体中抽取一个容量50的样本,则在抽样过程中,被剔除的个体数为( ),抽样间隔为( )。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样; ③百货商场的抓奖活动是抽签法; ④整个抽样过程中,每个个体被抽取的机会相等.
A.1
B.2
C.3
D.4
解析:①③④是正确的,②不正确.系统抽样分组后,在第一组中 采用简单随机抽样,其它组加分组间隔,不再用简单随机抽样. 答案:A
4.老师从全班50名同学中抽取学号为6,16,26,36,46的五名同
解析:由题意知,抽取的样本号码首项为3,间隔为6,依次取10 个.
8.某工厂有1003名工人,从中抽取10人参加体检,试用系统抽 样进行具体实施. 分析:由于总体容量不能被样本容量整除,需先剔除3名工人,
使得总体容量能被样本容量整除,取 k 1000 100, 然后 10
再利用系统抽样的方法进行. 解:(1)将每个人编一个号由0001至1003; (2)利用随机数表法找到3个号将这3名工人排除; (3)将剩余的1000名工人重新编号0001至1000;
(3)确定起始个体编号l(在第1段采用简单随机抽样来确定); (4)按照事先确定的规则抽取样本(通常是将l加上k,得到第2个 编号l+k,再将(l+k)加上k,得到第3个编号l+2k,这样继续下去, 直到获取整个样本.
说明:在系统抽样中,总体中的个数如果正好能被样本容量整 除,则可用它们的比值作为进行系统抽样的间隔;如果不能被 整除,则可用简单随机抽样的方法在总体中剔除若干个个体, 其个数为总体中的个体数除以样本容量所得的余数.然后再 编号、分段,确定第一段的起始号,继而确定整个样本. 上述过程中,总体中的每个个体被剔除的可能性相等,也就是 每个个体不被剔除的可能性相等,可知在整个抽样过程中每 个个体被抽取的可能性仍然相等.
答案:B
技能演练
基础强化
1.从2009名志愿者中选取50名组成一个志愿团,若采用下面
的方法选取;先用简单随机抽样从2009人中剔除9人,余下的
2000人再按系统抽样的方法进行选取,则每人入选的机会( )
A.不全相等
B.均不相等
C.都相等
D.无法确定
解析:系统抽样是公平的,所以每个个体被抽到的可能性都相
50
解:第一步,按生产时间将一天分为50个时
间段,也就是说,每
个时间段大约生产
(件)产品.这
第二步,将一天中生产的机器零件按生产时间进行顺序编号. 比如,第一个生产出的零件就是0号,第二个生产出的零件就是 1号等等. 第三步,从第一个时间段中按照简单随机抽样的方法,抽取一 个产品,比如是k号零件. 第四步,按顺序抽取编号为下面数字的零 件:k+200,k+400,k+600,…,k+9800.
第二步:先用简单随机抽样的方法从这些书中抽取2册,不进行 检验; 第三步:将剩下的书进行编号,编号分别为0,1,…,359; 第四步:从第一组(编号为0,1,…,8)的书中用简单随机抽样的方 法,抽取1册书,比如说,其编号为k; 第五步:按顺序抽取编号分别为下面的数 字:k,k+9,k+18,k+27,…,k+39×9.这样总共就抽取了40个样本.
所带的号码,如学号、准考证号、门牌号等;
(2)__确_定_分_段_间_隔_k_____,对编号进行分段.当 (n是N样本容量)
是整数时,取k=_____Nn___;
n
(3)在第1段用_____简_单_随_机_抽_样____确定第一个个体编号l(l≤k);
(4)按照一定的规则抽取样本.通常是将l__加_上__k ___得到第2个 个体编号____(l_+k_) __,再_____加_上_k_得到第3个个体编号 __(l+_2_k)____,依次进行下去,直到获取整个样本. 2.当总体中元素个数较少时,常采用_____简_单__随_机_抽_样___;当总体 中元素个数较多时,常采用___系_统_抽_样__.
名师讲解
1.系统抽样的概念 当总体中的个数较多时,可将总体分成均衡的几个部分,然后 按照预先定出的规则,从每一部分抽取一个个体,得到所需要 的样本,这种抽样叫做系统抽样. 2.系统抽样的步骤 (1)编号(在保证编号的随机性的前提下,可以直接利用个体所 带有的号码); (2)分段(确定分段间隔k,注意剔除部分个体时要保证剔除的 随机性和客观性);
个体为样本,抽样距为n
(取整数部分),从第
一段1,2,…,k个号码中随机抽取一个号码i0,则i0+k,…,i0+(n-1)k 号码均被抽取构成样本,所以每个个体被抽到的可能性是( )
A.相等的
B.不相等的
C.与i0有关
D.与编号有关
解析:系统抽样对每个个体来说都是公平的,因此,每个个体被
抽取的可能性是相等的.
3.系统抽样与简单随机抽样的区别 (1)总体容量较大,抽取样本较多时,系统抽样比简单随机抽样 更易实施,可节约成本; (2)系统抽样所得到的样本的代表性和个体的编号有关,而简 单随机抽样所得到的样本的代表性与个体编号无关.如果编 号的特征随编号的变化呈现一定的周期性,可能会使系统抽 样的代表性很差.例如,如果学号按男生单号,女生双号的方法 编排,那么用系统抽样得到的样本可能全部是男生或女生;
学了解学习情况,其最有可能用到的抽样方法是( )
A.简单随机抽样
B.抽签法
C.随机数法
D.系统抽样
解析:由样本数据的特点知,两数之间的间隔均为10,为等距抽
样.
答案:D
5.总体容量为203,若采用系统抽样法抽样,当抽样间距为多少
时,不需要剔除个体.( )
A.4
B.5
C.6
D.7
答案:D
6.某厂将在64名员工中用系统抽样的方法抽取4名参加2010 年职工劳技大赛,将这64名员工编号为1~64,若已知8号、24号
(3)系统抽样比简单随机抽样的应用范围更广.
典例剖析
题型一 系统抽样的概念
例1:为了解1200名学生对学校某项教改试验的意见,打算从
中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间
隔k为( ) A.40 C.20
k
N n
123000B.3400.
D.12
解析:N=1200,n=30,∴
2.1.2 系统抽样
自学导引
1.理解系统抽样的概念. 2.掌握系统抽样的一般步骤. 3.正确理解系统抽样与简单随机抽样的关系. 4.能用系统抽样解决实际问题.
课前热身
1.一般地,假设要从容量N的总体中抽取容量为n的样本 ,我们
可以按下列步骤进行系统抽样:
(1)先将总体的N个个体_____编__号_,有时可直接利用个体自身
D.电影院调查观众的某一指标,通知每排(每排人数相等)的座 号为14的观众留下来座谈 分析:本题考查系统抽样的概念,系统抽样适用于个体数较多 但均衡的总体. 解析:因C选项事先不知道总体,抽样方法不能保证每个个体 按事先规定的机会抽取. 答案:C
变式训练2:系统k抽 [样N又] 称为等距抽样,从N个个体中抽取n个
题型三 随机抽样的实际应用 例4:下面给出某村委会调查本村各户收入情况作的抽样,阅读 并回答问题.本村人口:1 200,户数300,每户平均人口数4人; 应抽户数:30; 抽样间隔:1 200/30=40; 确定随机数字:取一张人民币,后两位数为12; 确定第一样本户:编号12的户为第一样本户; 确定第二样本户:12+40=52,52号为第二样本户. ……
答案:A
N
规律技巧:n当
取
(n是样本容k 量 Nn).是整数时,
需要剔除个体时,原则上要剔除的个体数尽 量少.
变式训练1:为了了解参加一次知识竞赛的1252名学生的成绩,
决定采用系统抽样的方法抽取一个容量为50的样本,那么总
体中应随机剔除的个体数目是( )
A.2
B.4
C.5
D.6
解析:因为1252=50×25+2,所以应随机剔除2个个体.
0000~9999)中,有关部门按照随机抽样的方式确定后两位是
68的号码为中奖号码.这是运用哪种抽样方式来确定号码的
()
A.抽签法
B.系统抽样法
C.随机数表法
D.其他抽样方法
解析:本题主要考查了系统抽样方法的步骤及意义.由题意可 知,中奖号码分别为0068,0168,0268,…,9968,显然这是将 10000个中奖号码平均分成100组,从第一组抽取了0068号,其 余号码在此基础上加上100的倍数得到的.可见这是用的系统 抽样方法. 答案:B
N
k 规[ N律]([ N技] 巧:用N系统抽样n 抽取样本,当
nn
n
数时,取
不是整
表示 总体中剔除
的整数部分),即需先在
N-nk个个体,且剔除多余的个体不会影响抽样的 公平性.
变式训练3:某工厂平均每天生产某种零件大约10000件,要求 产品检验员每天抽取50个零件,检查其质量状况.假设一天的 生产时间中,生产机器零件的件数是均匀的,请你设计一个抽 样方案. 分析:分段→编号→10取00样0 . 200
(4)分段,取间隔 k 1000 100,
10
每组含100个工人;
将机抽样产生编号l;
(6)按编号将l,100+l,200+l,…,900+l共10个号选出.
这10个号所对应的工人组成样本.
能力提升
9.(2010·河北模拟)在10000个有机会中奖的号码(编号为
等,与是否剔除无关.
答案:C
2.中央电视台的动画城节目为了对本周的热心小观众给予奖
励,要从确定编号的一万名小观众中抽取十名幸运小观众,现
采用系统抽样的方法抽取,其组容量为( )
A.10 C.1000
10000 1000. B.100 10 D.10000
解析:其组容量为