第十章第1讲 随机抽样
随机抽样方法

随机抽样方法
随机抽样方法是一种常用的统计学方法,它通过随机抽取样本来代表整体总体,从而进行统计分析和推断。
在实际应用中,随机抽样方法被广泛运用于调查研究、市场调研、医学实验等领域。
本文将介绍随机抽样方法的定义、特点、常见类型以及应用注意事项。
首先,随机抽样方法是指在总体中,每个个体被抽取为样本的概率是相等的,
且相互独立。
这意味着每个个体都有被抽取为样本的机会,从而能够代表整体总体。
随机抽样方法的特点是能够减小抽样误差,提高样本的代表性和可靠性。
随机抽样方法有多种类型,常见的包括简单随机抽样、分层随机抽样、整群随
机抽样等。
简单随机抽样是指从总体中随机抽取样本,每个个体被抽到的概率相等,相互独立。
分层随机抽样是将总体按照某种特征分成若干层,然后在每一层中进行简单随机抽样。
整群随机抽样是将总体按照某种特征分成若干群,然后随机抽取若干群作为样本。
不同类型的随机抽样方法适用于不同的研究对象和目的,研究者需要根据实际情况选择合适的抽样方法。
在应用随机抽样方法时,需要注意一些事项。
首先,抽样前需要对总体进行充
分的了解,包括总体特征、分布规律等。
其次,抽样时需要保证样本的代表性和随机性,避免抽样偏差。
最后,对于不同类型的随机抽样方法,需要根据实际情况进行灵活运用,选择最适合的抽样方法。
总之,随机抽样方法是一种重要的统计学方法,它能够有效地代表总体,提高
统计分析的准确性和可靠性。
在实际应用中,研究者需要根据实际情况选择合适的抽样方法,并注意抽样过程中的各项细节,以确保研究结果的科学性和可信度。
随机抽样知识点总结

随机抽样知识点总结随机抽样是统计学中的重要概念,它是指从总体中随机选择一部分个体进行观察与研究的一种方法。
在实际应用中,随机抽样常常被用来代表总体,以便进行统计推断和决策分析。
下面我们来总结一下关于随机抽样的一些重要知识点。
一、随机抽样的定义随机抽样是指从总体中以一定的概率分布随机选择一个或多个个体作为样本的过程。
在进行随机抽样时,要确保每个个体有相等的机会被选入样本,从而保证样本的代表性和可靠性。
二、随机抽样的方法1. 简单随机抽样:从总体中以相等的概率随机选择样本的方法,保证每个个体被选入样本的概率相等。
2. 分层随机抽样:将总体按照某种特定的特征分成若干个层次,然后在每个层次中进行简单随机抽样。
3. 系统抽样:按照一定的规律从总体中选择个体作为样本,例如每隔k个个体选择一个个体作为样本。
4. 整群抽样:将总体分成若干个互不相交的群体(或群组),然后从中随机选择若干个群作为样本。
5. 多阶段抽样:将总体层次化,先进行群组抽样,再在抽样所得的群组内进行简单随机抽样。
三、随机抽样的特点1. 代表性:通过随机抽样,样本能够尽可能代表总体的特征和变异性,从而使得对总体的推断更加准确。
2. 可靠性:在一定的置信水平下,通过对样本数据的分析和推断,可以得出关于总体的可靠性结论。
3. 实用性:随机抽样是一种简单、有效的统计抽样方法,能够在相对较小的成本和时间内获得对总体的有效信息。
四、随机抽样的应用1. 民意调查:随机抽样被广泛应用于民意调查中,通过对选民的随机抽样,可以得出对全国范围内的选民意见的推断。
2. 商品抽检:在商品生产过程中,可以通过随机抽样对产品进行抽检,保证产品质量的可靠性和稳定性。
3. 医学实验:在医学研究中,可以通过随机抽样的方式选择研究对象,以保证研究结论的有效性和可靠性。
4. 企业调查:在市场调研、消费者满意度调查等方面,也常常运用随机抽样的方法进行样本选择,以获得对总体的准确推断。
随机抽样简单随机抽样ppt课件

与被调查者进行面对面交流,收集口头信息。
数据收集途径及注意事项
观察法
直接观察被调查者的行为、态度等,记录相关信息。
实验法
通过控制实验条件,收集实验数据。
数据收集途径及注意事项
注意事项
明确调查目的和对象,选择合适的数据收集方法 。
设计合理的问卷或访谈提纲,避免引导性问题和 歧义。
数据收集途径及注意事项
06
抽样方法:不同的抽样方法会导致不同的 抽样误差。
置信区间构建方法与意义
确定置信水平
通常选择95%或99%的置信水平。
计算样本统计量
根据样本数据计算样本均值、样本比例等统计量。
置信区间构建方法与意义
确定抽样分布
根据中心极限定理,当样本量足够大 时,样本统计量的分布近似于正态分 布。
计算置信区间
04
4. 根据生成的随机数, 从总体中选取对应编号 的家庭作为调查对象。
03
抽样误差与置信区间
抽样误差来源及影响因素
抽样误差来源
01
04
影响因素
随机性:由于抽样是随机的,每次抽样结 果可能会有所不同。
02
05
总体分布:总体分布越离散,抽样误差越 大。
样本量:样本量的大小会影响抽样误差的 大小。
03
独立性
一个样本的选取不影响其他样 本的选取。
代表性
当样本量足够大时,样本能够 很好地代表总体。
实现过程与步骤
1. 确定总体
明确要研究的对象范围,即总体。
3. 随机选择样本
采用随机数表、计算机程序等方法从总体中 随机选择样本。
2. 确定样本量
根据研究目的、总体规模、误差要求等因素 确定合适的样本量。
随机抽样教案

随机抽样教案一、引言:随机抽样在教育研究中被广泛使用,它能够帮助研究者从总体中有效地获取代表样本。
本文将介绍随机抽样教案的编写,以帮助教育从业者更好地理解和应用随机抽样方法。
二、教案目标:通过本教案,学员将能够:1. 理解随机抽样的概念及其重要性;2. 掌握常见的随机抽样方法;3. 学会合适地使用随机抽样教学资源。
三、教学步骤:1. 理解随机抽样的概念与重要性随机抽样是从总体中选择样本的一种方法,通过使每个元素被选中的概率相等,确保了样本的代表性。
随机抽样能够减小抽样误差,提高研究的可靠性和有效性。
2. 常见的随机抽样方法2.1 简单随机抽样简单随机抽样是指每个样本都有相等的机会被选中,通常通过随机数发生器进行样本选择。
2.2 系统抽样系统抽样是按照一定的间隔,从总体中选择样本。
例如,对于总体中的N个元素,我们可以每隔K个元素选取一个。
2.3 分层抽样分层抽样将总体分为若干层次,然后从每个层次中随机选择样本,以确保每个层次都得到适当的代表。
2.4 整群抽样整群抽样是将总体分成若干群体,然后随机选择几个群体作为样本。
3. 合适地使用随机抽样教学资源教学资源的选择和使用对于教学效果至关重要。
教师应根据教学目标和学生特征,合理地运用随机抽样的原则,选择和设计合适的教学资源。
3.1 笔记、习题与案例教师可以使用随机抽样的原则,从大量的笔记、习题和案例中,抽取一部分作为教学资源,以提高学生的学习兴趣和参与度。
3.2 互动讨论与小组活动在互动讨论和小组活动中,教师可以运用随机抽样的方法,随机选择学生参与讨论或组队,以促进学生间的互动和合作。
四、教学效果评估:通过课堂讨论和练习,教师可以对学生对随机抽样的理解和应用能力进行评估。
可以采用以下方式进行评估:1. 选择题:考察学生对常见随机抽样方法的理解;2. 设计问题:要求学生应用随机抽样的原则,选择合适的教学资源;3. 小组讨论:观察学生在小组活动中是否能够合理运用随机抽样方法。
第10章 第1节 随机抽样-2023届高三一轮复习数学精品备课(新高考人教A版2019)

[巩固演练] 1.下列抽样试验中,适合用抽签法的有( B ) A.从某厂生产的 5000 件产品中抽取 600 件进行质量检验 B.从某厂生产的两箱(每箱 18 件)产品中抽取 6 件进行质 量检验 C.从甲、乙两厂生产的两箱(每箱 18 件)产品中抽取 6 件 进行质量检验 D.从某厂生产的 5000 件产品中抽取 10 件进行质量检验
解析 (2)该地区中小学生总人数为 3 500+2 000+4 500=10 000, 则样本容量为 10 000×2%=200, 其中抽取的高中生近视人数为 2 000×2%×50%=20.
课时三省
课堂回眸
思维升华
误区防范
1.抽样方法 有哪几种?
1.两种抽样方法的共同点都是等概 率抽样,体现了这两种抽样方法的
►规律方法 应用简单随机抽样应注意以下两点
(1)一个抽样试验能否用抽签法,关键看两点:一是抽 签是否方便;二是号签是否易搅匀.一般地,当总体容量和 样本容量都较小时可用抽签法.
(2)应用随机数表法的两个关键点:一是确定以表中的 哪个数(哪行哪列)为起点,以哪个方向为读数的方向;二是 读数时注意结合编号特点进行读取,若编号为两位数字,则 两位两位地读取,若编号为三位数字,则三位三位地读取.
(2)福利彩票“双色球”中红球的号码可以从 01,02, 03,…,32,33 这 33 个两位号码中选取,小明利用如下所 示的随机数表选取红色球的 6 个号码,选取方法是从第 1 行 第 9 列的数字开始,从左到右依次读取数据,则第四个被选 中的红色球号码为( C )
81 47 23 68 63 93 17 90 12 69 86 81 62 93 50 60 91 33 75
[自主解答] 因为高一年级抽取学生的比例为 1224000=15,所以k+5k+3=15,解得 k=2, 故高三年级抽取的人数为 1 200×2+35+3=360.
第一讲 简单随机抽样一

第一讲简单随机抽样新知探究1.统计的相关概念(1)总体:统计中所考察对象的某一数值指标的全体构成的集合全体叫做总体.(2)个体:总体中的每一个元素叫做个体.(3)样本:从总体中抽出的若干个个体组成的集合叫做样本.(4)样本容量:样本的个体的数目叫做样本容量.(5)随机抽样:满足每一个个体都可能被抽到且被抽到的机会是均等的抽样.2.简单随机抽样(1)定义:从元素个数为N的总体中不放回地抽取容量为n的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.(2)常用方法:抽签法、随机数表法.抽签法的5个步骤随机数表法抽样的3个步骤(1)编号:这里的所谓编号,实际上是新编数字号码.(2)确定读数方向:为了保证选取数字的随机性,应在面对随机数表之前就指出开始数字的纵横位置,然后确定读数方向.(3)获取样本:读数在总体编号内的取出,而读数不在总体编号内的和已取出的不算,依次下去,直至得到容量为n的样本.(3)抽签法的优缺点: ①优点:简单易行. ②缺点:当总体的容量非常大时,费时、费力又不方便;如果标号的纸片或小球搅拌得不均匀,可能导致抽样的不公平.(4)随机数表法⎩⎨⎧ 随机数表计算器或计算机产生的随机数小试牛刀1.在简单随机抽样中,某一个个体被抽到的可能性( )A .与第几次抽样有关,第一次抽到的可能性最大B .与第几次抽样有关,第一次抽到的可能性最小C .与第几次抽样无关,每一次抽到的可能性相等D .与第几次抽样无关,与样本容量也无关解析:选C 由简单随机抽样的定义知C 正确.2.为了了解全校240名高一学生的身高情况,从中抽取40名学生进行测量.下列说法正确的是( )A .总体是240名学生B .个体是每一个学生C .样本是40名学生D .样本容量是40 解析:选D 在这个问题中,总体是240名学生的身高,个体是每个学生的身高,样本是被抽取的40名学生的身高,样本容量是40.因此选D.3.下列抽样试验中,适合用抽签法的有( )A .从某厂生产的3 000件产品中抽取600件进行质量检验B .从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验C .从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验D .从某厂生产的3 000件产品中抽取10件进行质量检验解析:选B A 、D 中总体的个数较大,不适于用抽签法;C 中甲,乙两厂生产的两箱产品性质可能差别较大,因此未达到搅拌均匀的条件,也不适于用抽签法;B 中个体数和样本容量均较小,且同厂生产的两箱产品,性质差别不大,可以看做是搅拌均匀了,故选B.4.用抽签法进行抽样有以下几个步骤:①制签;②抽签;③将签摇匀;④编号;⑤将抽取的号码对应的个体取出,组成样本.这些步骤的正确顺序为________.答案:④①③②⑤典型例题[典例] 下面抽样方法是简单随机抽样的是( )A.从平面直角坐标系中抽取5个点作为样本B.可口可乐公司从仓库中的1 000瓶可乐中一次性抽取20瓶进行质量检查C.某连队从200名战士中,挑选出50名最优秀的战士去参加抢险救灾活动D.从10个手机中不放回地随机抽取2个进行质量检验(假设10个手机已编好号,对编号随机抽取)[解析] A中平面直角坐标系中有无数个点,这与要求总体中的个体数有限不相符,故错误;B中一次性抽取不符合简单随机抽样逐个抽取的特点,故错误;C中50名战士是最优秀的,不符合简单随机抽样的等可能性,故错误.[答案] D简单随机抽样的判断策略判断一个抽样能否用简单随机抽样,关键是看它是否满足四个特点:①总体的个体数目有限;②从总体中逐个进行抽取;③是不放回抽样;④是等可能抽样.同时还要注意以下几点:①总体的个体性质相似,无明显的层次;②总体的个体数目较少,尤其是样本容量较小;③用简单随机抽样法抽出的样本带有随机性,个体间无固定的距离.[活学活用]下列问题中,最适合用简单随机抽样方法抽样的是( )A.某电影院有32排座位,每排有40个座位,座位号是1~40,有一次报告会坐满了听众,报告会结束后为听取意见,要留下32名听众进行座谈B.从10台冰箱中抽出3台进行质量检查C.某学校有在编人员160人,其中行政人员16人,教师112人,后勤人员32人,教育部门为了解在编人员对学校机构改革的意见,要从中抽取一个容量为20的样本D.某乡农田有:山地800公顷,丘陵1 200公顷,平地2 400公顷,洼地400公顷,现抽取农田48公顷估计全乡农田平均每公顷产量解析:选B A的总体容量较大,用简单随机抽样法比较麻烦;B的总体容量较少,用简单随机抽样法比较方便;C由于学校各类人员对这一问题的看法可能差异很大,不宜采用简单随机抽样法;D总体容量大,且各类田地的差别很大,也不宜采用简单随机抽样法.[典例] 某师范大学为支援西部教育事业发展,计划从应届毕业生中选出一批志愿者.现从符合报名条件的18名志愿者中,选取6人组成志愿小组,请用抽签法设计抽样方案.[解] 第一步,将18名志愿者编号,号码为1,2,3, (18)第二步,将号码分别写在18张大小、形状都相同的纸条上,揉成团,制成号签.第三步,将制好的号签放入一个不透明的袋子中,并搅拌均匀.第四步,从袋子中依次抽取6个号签,并记录上面的编号.第五步,所得号码对应的志愿者就是志愿小组的成员.[活学活用]学校举办元旦晚会,需要从每班选10名男生,8名女生参加合唱节目.某班有男生32名,女生28名,试用抽签法确定该班参加合唱的同学.解:第一步,将32名男生从0到31进行编号;第二步,用相同的纸条做成32个号签,在每个号签上写上这些编号;第三步,将写好的号签放在一个容器内摇匀,不放回地逐个从中抽出10个号签;第四步,相应编号的男生参加合唱;第五步,用相同的办法从28名女生中选出8名参加合唱.[典例] 为适应山东2016年体育高考,舜耕中学从800名应届毕业生中,抽取60名学生进行身体素质测试,请设计抽样方法.[解] (1)将800名同学进行编号,可以编为000,001,002,003, (799)(2)在教材的随机数表中任选一个数,例如选出第3行第4列数5.(3)从选定的数开始向右读(读数的方向也可以是向左、向上、向下等,每次读3个数),得到一个号码593,由于593<799,将它取出,继续向右读,得到907,由于907>799,将它去掉,继续向右读,得到379,242,203,722,…,依次下去,直到取出60个号码,取出这60个号码对应的学生,就得到一个容量为60的样本.[活学活用]现有一批编号为10,11,…,99,100,…,600的元件,打算从中抽取一个容量为6的样本进行质量检验,如何用随机数表法设计抽样方案?解:第一步,将元件的编号调整为010,011,012,...,099,100, (600)第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第6行第7个数3.第三步,从数3开始,向右读,每次读取三位,凡不在010~600中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到321,273,279,600,552,254.第四步,以上这6个号码所对应的6个元件就是所要抽取的对象.(答案不唯一)[层级一学业水平达标]1.为抽查汽车排放尾气的合格率,其环保局在一路口随机抽查,这种抽查是( )A.简单随机抽样B.抽签法抽样C.随机数法抽样D.有放回抽样解析:选D 这是有放回抽样,而不是简单随机抽样.故选D.2.某次考试有70 000名学生参加,为了了解这70 000名考生的数学成绩,从中抽取1 000名考生的数学成绩进行统计分析,下列说法正确的是( ) A.1 000名考生是总体的一个样本B.70 000名考生是总体C.样本容量是1 000D.以上说法都不对解析:选C 由于考察的对象是考生的数学成绩,因此A、B错误,抽取的样本数为样本容量,因此C正确.故选C.3.已知下列抽取样本的方式:①从无限多个个体中抽取100个个体作为样本;②盒子里共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出1个零件进行质量检验后再把它放回盒子里;③从20件玩具中一次性抽取3件进行质量检验;④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.其中,不是简单随机抽样的是________(填序号).解析:①不是简单随机抽样,因为被抽取的总体的个体数是无限的,而不是有限的;②不是简单随机抽样,因为它是放回抽样;③不是简单随机抽样,因为这是“一次性”抽取,而不是“逐个”抽取;④不是简单随机抽样,因为指定个子最高的5名同学是56名同学中特指的,不存在随机性,不是等可能抽样.答案:①②③④4.某中学高一年级有400人,高二年级有320人,高三年级有280人,若每人被抽到的可能性为20%,用随机数法在该中学抽取容量为n的样本,则n等于________.解析:由n400+320+280=20%,解得n=200.答案:200[层级二应试能力达标] 1.下列抽样方法是简单随机抽样的是( ) A.从50个零件中一次性抽取5个做质量检验B.从50个零件中有放回地抽取5个做质量检验C.从实数集中随机抽取10个分析奇偶性D.运动员从8个跑道中随机选取一个跑道解析:选D A不是,因为“一次性”抽取与“逐个”抽取含义不同;B不是,因为是有放回抽样;C不是,因为实数集是无限集.2.抽签法中确保样本代表性的关键是( )A.抽签B.搅拌均匀C.逐一抽取D.抽取不放回解析:选B 逐一抽取,抽取不放回是简单随机抽样的特点,但不是确保样本代表性的关键,一次抽取与有放回抽取(个体被重复取出可不算再放回)也不影响样本的代表性,抽签也一样.3.某工厂的质检人员对生产的100件产品,采用随机数表法抽取10件检查,对100件产品采用下面的编号方法①1,2,3,...,100;②001,002,...,100;③00,01,02,...,99;④01,02,03, (100)其中正确的序号是( )A.②③④B.③④C.②③D.①②解析:选C 根据随机数表法的步骤可知,①④编号位数不统一,②③正确.4.用简单随机抽样方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性和“第二次被抽到”的可能性分别是( )A.110,110B.310,15C.15,310D.310,310解析:选A 简单随机抽样中每个个体被抽取的机会均等,都为1 10 .5.高一(1)班有60名学生,学号从01到60,数学老师在上统计课时,利用随机数表法选5名学生提问,老师首先选定从随机数表的倒数第5行(下表为随机数表的最后5行)第6列的“4”开始,向右读依次选学号提问,则被提问的5个学生的学号为________.33021 44709 79262 33116 80907 77689 69696 4842077713 32822 64679 94095 95735 84535 74703 8289025853 30963 76729 87613 65538 68978 13157 7883464145 71516 11716 58309 89501 59717 56086 3745968585 22783 22621 54263 41128 12663 82362 61855解析:依据选号规则,选取的5名学生的学号依次为:44,33,11,09,07,48.答案:44,33,11,09,07,486.某校有50个班,每班50人,现抽查250名同学进行摸底考试,则每位同学被抽到的可能性为________.解析:根据简单随机抽样的特征,总量为50×50=2 500人.∴每位同学被抽到的可能性为2502 500=1 10.答案:1 107.为了了解参加运动会的2 000名运动员的年龄情况,从中抽取20名运动员的年龄进行统计分析.就这个问题,下列说法中正确的有________.①2 000名运动员是总体;②每个运动员是个体;③所抽取的20名运动员是一个样本;④样本容量为20;⑤这个抽样方法可采用随机数法抽样;⑥采用随机数法抽样时,每个运动员被抽到的机会相等.解析:①2 000名运动员不是总体,2 000名运动员的年龄才是总体;②每个运动员的年龄是个体;③20名运动员的年龄是一个样本.答案:④⑤⑥8.上海某中学从40名学生中选1人作为上海男篮拉拉队的成员,采用下面两种选法:选法一将这40名学生从1~40进行编号,相应地制作1~40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的学生幸运入选;选法二将39个白球与1个红球(球除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名学生逐一从中摸取一球,摸到红球的学生成为拉拉队成员.试问这两种选法是否都是抽签法?为什么?解:选法一满足抽签法的特征是抽签法,选法二不是抽签法,因为抽签法要求所有的号签编号互不相同,而选法二中39个白球无法相互区分.。
人教版初中数学七年级下册第十章 课题:10.1统计调查--抽样调查

当调查对象个数较多, 调查不宜进行,或调 查具有破坏性时,一 般用抽样调查.
课堂练习
练习一:
下面几个问题,应该做全面调查还是抽样调查? (1)要调查市场上某种食品添加剂是否符合国
家标准; 抽样调查 (2)检测某城市的空气质量;抽样调查 (3)调查一个村子所有家庭的收入;全面调查 (4)调查人们对保护环境的意识;抽样调查
解:设这批零件有x个不合格
5 由题意可列:
x
100 ≈ 10000
x ≈ 500
答:设这批零件约有500个不合格
爸爸:“你滚出去!”
3
导入
探究一:为调查一导弹的杀伤半径,应采取 怎样的方式进行调查?要将所有的导弹都试 射吗?
知识讲解
抽样调查:
只抽取一部分对象进行调查,然 后根据调查数据推断全体对象的情况, 这种调查方法叫做抽样调查.
课堂练习
2010年,为了更加准确了解全国人口 数量,采用___全__面__调__ 调查方式
课堂练习练习二:
1、说明在以下问题中,总体、个 体、样本、样本的容量各指什么。
(1)为了检查一批保险丝的安全 性,从成品中随机抽取10根进行 实验。
(2)为了解我国职工的收入情况, 对我国不同省市、不同工种的 10000名职工的收入进行调查。
导入 探究二
为了了解伊宁市老年人的健康 状况,你准备采用什么方式收集数 据?
查
课堂练习
为了了解一批灯泡的寿命,应采用 ____抽_样__调_查_调查方式
课堂练习
想了解一个铁矿的含铁量 ,采用什么 调查方法?抽样调查
课堂练习
2018年4月,《奔跑吧第二季》开播,为 了了解该电视节目的收视率,应采用 抽_样_重,
随机抽样知识讲解

随机抽样【学习目标】1、了解简单随机抽样的概念,掌握实施简单随机抽样的常用方法:抽签法和随机数表法;2、了解系统抽样的意义,并会用系统抽样的方法从总体中抽取样本;3、了解分层抽样的概念与特征,清楚简单随机抽样、系统抽样、分层抽样的区别和联系.【要点梳理】要点一、简单随机抽样简单随机抽样是一种最简单、最基本的抽样方法.抽样中选取个体的方法有两种:放回和不放回.我们在抽样调查中用的是不放回抽取.1、简单随机抽样的概念:一般地,从元素个数为N的总体中不放回地抽取容量为n的样本,如果每一次抽取时总体中的各个个体被抽到的可能性是相同的,那么这种抽样方法叫简单随机抽样,这样抽取的样本,叫做简单随机样本.2、简单随机抽样的特点:(1)被抽取样本的总体个数N是有限的;(2)简单随机样本数n小于等于样本总体的个数N;(3)从总体中逐个进行抽取,使抽样便于在实践中操作;(4)它是不放回抽取,这使其具有广泛应用性;(5)每一次抽样时,每个个体等可能的被抽到,保证了抽样方法的公平性.3、实施抽样的方法:(1)抽签法:抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力又不方便,若标号的纸片或小球搅拌得不均匀还可能导致抽样的不公平.抽签法的一般步骤:①将总体中的N个个体编号;②把这N个号码写在形状、大小相同的号签上;③将号签放在同一箱中,并搅拌均匀;④从箱中每次抽取一个号签,连续抽取n次;⑤将总体中与抽到的号签的编号一致的n个个体取出.(2)随机数表法:要理解好随机数表,即表中每个位置上等可能出现0,1,2,…,9这十个数字的数表.随机数表中各个位置上出现各个数字的等可能性,决定了利用随机数表进行抽样时抽取到总体中各个个体序号的等可能性.随机数表法的步骤:①将总体的个体编号(每个号码的位数一致);②在随机数表中任选一个数字作为开始;③从选定的数开始按一定的方向读下去,若得到的数码在编号中,则取出;若得到的号码不在编号中或前面已经取出,则跳过,如此继续下去,直到取满为止.注意:①选定开始数字,要保证所选数字的随机性;②确定读数方向获取样本号码时,读数方向可向左、向右、向上、向下,样本号码不能重复,否则舍去.要点诠释:1、简单随机抽样是一种最简单、最基本的抽样方法,简单随机抽样有两种选取个体的方法:放回和不放回,我们在抽样调查中用的是不放回抽样,常用的简单随机抽样方法有抽签法和随机数法.2、抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型.3、简单随机抽样每个个体入样的可能性都相等,均为Nn ,但是这里一定要将每个个体入样的可能性、第n 次每个个体入样的可能性、特定的个体在第n 次被抽到的可能性这三种情况区分开来,避免在解题中出现错误.要点二、系统抽样1、系统抽样的概念:当总体中的个体比较多时,将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分中抽取一个个体,得到所需要的样本,这样的抽样方法称为系统抽样,也称作等距抽样.2、系统抽样的特征:(1)当总体容量N 较大时,采用系统抽样;(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样;(3)预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号.3、系统抽样的一般步骤:(1)采用随机的方法将总体中的N 个个体编号;(2)将编号按间隔k 分段,当N n 是整数时,取N k n =,当N n不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数'N 能被n 整除,这时取'N k n =,并将剩下的总体重新编号; (3)在第一段用简单随机抽样确定起始个体的编号()l l N l k ∈≤,;(4)按照一定的规则抽取样本,通常是将编号为2(1)l l k l k l n k +++-,,,,的个体取出. 要点诠释:1、从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学转化思想.2、系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均分后的每一段中进行抽样时,采用的是简单随机抽样.要点三、分层抽样1、分层抽样的概念:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,可将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.2、分层抽样的特点:(1)适用于总体是由有明显差别的几部分组成时的情况;(2)分层抽样对各个个体来说被抽取的可能性相同.3、分层抽样的优点:(1)样本具有较强的代表性;(2)在各层抽样时,可灵活地选用不同的抽样方法.4、分层抽样的步骤:(1)将总体按一定的标准分层;(2)计算各层的个体数与总体的个体数的比;(3)按各层个体数占总体的个体数的比确定各层应抽取的样本容量;(4)在每一层进行抽样(各层可以按简单随机抽样或系统抽样的方法抽取)要点诠释:1、应用分层抽样应遵循以下要求:(1)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则.(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等.2、分层抽样是当总体有差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:(1)分层抽样中分多少层,如何分层要视具体情况而定,总的原则是,层内样本的差异要小,而层之间的样本差异要大,且互不重叠.(2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样.(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.3、分层抽样的优点是:使样本具有较强的代表性,并且抽样过程中可综合选用各种抽样方法,因此分层抽样是一种实用、操作性强、应用比较广泛的抽样方法.要点四、三种抽样方法的比较【典型例题】类型一:简单随机抽样例1.下列抽取样本的方式是否属于简单随机抽样?说明理由.(1)从无限多个个体中抽取100个个体作样本;(2)盒子里共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意抽出1个零件进行质量检验后再把它放回盒子里.【解析】(1)不是简单随机抽样,因为总体的个数是无限的.(2)不是简单随机抽样,因为它是放回抽样.【总结升华】简单随机抽样的四个特点:(1)总体的个数有限;(2)逐个抽取;(3)是不放回的抽取;(4)每个个体被抽到的可能性必须是相同的.举一反三:【变式1】下面的抽样方法是简单随机抽样吗?为什么?(1)某班45名同学,指定个子最高的5名同学参加学校组织的某项活动.(2)从20个零件中一次性抽出3个进行质量检验.(3)一小孩从玩具箱中的20件玩具中随意拿出一件来玩.玩后放回再拿下一件,连续玩了5件.【解析】(1)不是简单随机抽样.因为这不是等可能抽样.(2)不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.(3)不是简单随机抽样.因为这是有放回抽样.例2.某工厂有112件产品,产品的编号为1,2,…,112.用随机数表法抽取一个容量为10的样本,写出抽样过程.【解析】解法一:第一步,将这112件产品原有的编号调整为001,002,003, (112)第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向,例如,选第9行第7列的数“3”,向右读;第三步,从“3”开始,向右读,每次读出三位,凡不在001~112中的数跳过去不读,前面已经读过的数也跳过去不读,依次可得到074,100,094,052,080,003,105,107,083,092;第四步,产品原来的编号为74,100,94,52,80,3,105,107,83,92的那10件就是被抽取出来的产品.解法二:第一步,将这112件产品原来的编号调整为101,102,103, (212)第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向,例如,选第9行第7列的数“3”,向右读;第三步,从“3”开始,向右读,每次读出三位,凡不在101~212中的数跳过去不读,前面已经读过的数也跳过去不读,依次可得到155,134,174,180,165,196,206,105,160,201;第四步,对应原来编号为55,34,74,80,65,96,106,5,60,101的产品就是要抽取的对象.【总结升华】本例中,112件产品原有的编号1,2,…,112的位数不统一,有1位数,有2位数,还有3位数.为了解决这一矛盾,解法一采用了“在位数少的数前面加0”的处理方法,例如,1变为001,11变为011;解法二采用了“把原来的数加上10的倍数”的处理方法.例如,2变为102,12变为112.解法一、解法二所采用的处理方法都达到了凑齐位数的效果.举一反三:【变式1】某校有学生1200人,为调查某种情况,打算抽取一个样本容量为50的样本,则此样本采用简单随机抽样将如何获得?【解析】解法一:(抽签法)①把该校学生编号,号码为0001,0002,0003,…,1200;②做大小、形状相同的号签;③将这些号签放在同一个箱子里,进行均匀搅拌;④抽签时,每次从中抽出1个号签,连续抽出50个号签,就得到了一个容量为50的样本.解法二:(随机数表法)①把该校学生编号,号码为0001,0002,0003,…,1200;②在随机数表中选定一个起始位置,假如起始位置是表中第5行第9列的数字6;③从6开始向右连续取数字,以4个数为一组,取到一行末尾时转到下一行从左到右继续读取,所得数字如下:6438,5482,4622,3162,4309,9006,1844,3253,2383,0130,3016……所取得的4位数字如果小于或等于1200,则对应此号的学生就是被抽取的个体.如果所取得的4位数字大于1200而小于2400则减去1200,剩余数字即是被抽取的号码.如果遇到相同号码,则只留第一次取得的数字,其余的舍去,经此处理,被抽取的学生号码如下:0438,0682,1022,0762,0709,0606,0644,0853,1183,0130,0616……一直取够50人止.【变式2】要从10架钢琴中抽取4架进行质量检验,请你设计抽样方案.【解析】解法一:(随机数表法)第一步,将10架钢琴编号,号码是0,1, (9)第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第3行第6列的数“2”,向右读.第三步,从数“2”开始,向右读,每次读取1位,重复数字只记录一次,依次可得到2,7,6,5.第四步,以上号码对应的4架钢琴就是要抽取的对象.解法二:(抽签法)第一步,将10架钢琴编号,号码是0,1, (9)第二步,将号码分别写在一张纸条上,揉成团,制成号签第三步,将得到的号签放入一个不透明的袋子中,并充分搅匀.第四步,从袋子中逐个抽取4个号签,并记录上面的编号.第五步,所得号码对应的4架钢琴就是要抽取的对象.【总结升华】(1)将钢琴编号从0开始,10架钢琴用0—9就可表示,这样总体中的所有个体可用一位数表示,便于使用随机数表.(2)用抽签法抽样关键是将号签搅匀.类型二:系统抽样例3.下列抽样中,最适宜用系统抽样法的是()A.某市的4个区共有2000名学生,且4个区的学生人数之比为3∶8∶8∶2,从中抽取200名学生做样本B.从某厂生产的2000个电子元件中随机抽取5个做样本C.从某厂生产的2000个电子元件中随机抽取200个做样本D.从某厂生产的20个电子元件中随机抽取5个做样本【答案】 C【解析】A中各区学生有区别,不好分成均衡的几部分,不适宜,B中抽取样本容量太小,不适宜.D 中总体个数较少,不适宜.故选C【总结升华】系统抽样适合总体容量较大且个体间差异较小的情况.举一反三:【变式1】下列抽样中不是系统抽样的是().A.从号码为1~15的15个球中任选3个作为样本,先在1~5号球中用抽签法抽出i0号,再将号码为i0+5,i0+10的球也抽出B.工厂生产的产品,用传送带将产品送入包装车间的过程中,检查人员从传送带上每5 min抽取一件产品进行检验C.弄某项市场调查,规定在商店门口随机地抽一个人进行询问,直到调查到事先规定的调查人数为止D.某电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈【答案】C【解析】本题的判定依据是系统抽样方法的特征:系统抽样适用于个体数目较多但均衡的总体.判断一种抽样是不是系统抽样,首先看是否在抽样前知道总体是由什么构成的,抽样的方法能否保证每个个体按事先规定的条件等可能入样,再看抽样过程中是否将总体分成了几个均衡的部分,是否在每个部分中进行简单随机抽样.本题C显然不是系统抽样,因为事先不知道总体,抽样方法也不能保证每个个体等可能入样,总体也没有分成均衡的几部分,故C不是系统抽样.【总结升华】系统抽样的特点:①适用于总体容量较大的情况;②剔除多余个体及第一段抽样都用简单随机抽样,因而与简单随机抽样有密切联系;③是等可能抽样,每个个体被抽到的可能性都是n/N.例4.为了了解参加某种知识竞赛的1 003名学生的成绩,抽取一个容量为50的样本,选用什么抽样方法比较恰当?简述抽样过程.【思路点拨】因为总体容量较大,且个体差异不大,适宜选用系统抽样.【解析】抽样过程如下:(1)随机地将这l 003个个体编号为1,2,3, (1003)(2)利用简单随机抽样,先从总体中随机剔除3个个体,剩下的个体数1000能被样本容量50整除,然后将1000个个体重新编号为1,2,3, (1000)(3)将总体按编号顺序均分成50部分,每部分包括20个个体.(4)在编号为1,2,3,…,20的第一部分个体中,利用简单随机抽样抽取一个号码,比如是18.(5)以18为起始号码,每间隔20抽取一个号码,这样得到一个容量为50的样本:18,38,58,…,978,998.【总结升华】(1)总体中的每个个体被剔除的概率相等都是31003,也就是每个个体不被剔除的概率相等都是10001003.采用系统抽样时每个个体被抽取的概率都是501000,所以在整个抽样过程中每个个体被抽取的可能性仍然相等,都是10005050 100310001003⨯=.(2)系统抽样是建立在简单随机抽样的基础之上的,在总体中剔除若干个个体时,采用的是简单随机抽样;当将总体均分后对第一部分进行抽样时,采用的也是简单随机抽样.举一反三:【变式1】从某厂生产的802辆轿车中抽取80辆测试某项性能.请合理选择抽样方法进行抽样,并写出抽样过程.【解析】因为802不能整除80,为了保证“等距”分段,应先剔除2个个体.由于总体及样本中的个体数较多,且无明显差异,因此采用系统抽样的方法,步骤如下:第一步,先从802辆轿车中剔除2辆轿车(剔除方法可用随机数表法);第二步,将余下的800辆轿车编号为1,2,…,800,并均匀分成80段,每段含8001080k==个个体;第三步,从第1段即1,2,…,10这10个编号中,用简单随机抽样的方法抽取一个号(如5)作为起始号;第四步,从5开始,再将编号为15,25,…,795的个体抽出,得到一个容量为80的样本.【总结升华】用系统抽样法抽取样本,当Nn不为整数时,取Nkn⎡⎤=⎢⎥⎣⎦,即先从总体中用简单随机抽样的方法剔除N-nk个个体,且剔除多余的个体不影响抽样的公平性.【变式2】某服装厂平均每小时大约生产服装362件,要求质检员每小时抽取40件服装检验其质量状况,请你设计一个调查方案.【解析】因为总体中的个体数较多,并且总体是由没有明显差异的个体组成,所以本题宜采用系统抽样法.第一步:把这些服装分成40组,由于36240的商是9,余数是2,所以每个组有9件服装还剩2件服装,这时分段间隔就是9.第二步:先用简单随机抽样的方法从这些服装中抽取2件服装不进行检验.第三步:将剩下的服装进行编号,编号分别为0,1,2, (359)第四步:从第一组(编号分别为0,1,…,8)的服装中按照简单随机抽样的方法抽取1件服装,比如,编号为k.第五步:依次抽取编号分别为下面数字的服装k,k+9,k+18,k+27,…,k+39×9,这样就抽取了一个容量为40的样本.类型三:分层抽样例5.在下列问题中,各采用什么抽样方法抽取样本?(1)从20台彩电中抽取4台进行质量检验;(2)科学会堂有32排座位,每排有40个座位(座号为1~40),一次报告会坐满了听众,会后为听取意见留下了座号为18的所有32名听众进行座谈;(3)光远中学有180名教职工,其中教师136名,管理人员20名,后勤服务人员24名,为征求某项意见,现从中抽取一个容量为15的样本.【答案】(1)简单随机抽样;(2)系统抽样;(3)分层抽样.【解析】(1)所述问题中总体中的个体数和样本容量均较少,故宜用简单随机抽样法;(2)所述问题具有总体中的个体数较多,且每个个体无明显差异的特点,所以适宜用系统抽样法;(3)所述问题的总体中的个体具有明显差异,即出现了3个层次,因此适宜用分层抽样法.【总结升华】总体容量较小宜用抽签法;总体容量较大,而样本容量较小宜用随机数表法;总体容量较大,样本容量也较大的宜用系统抽样法;总体是由差异明显的几个层次组成,宜用分层抽样法.举一反三:【变式1】一个单位有职工160人,其中业务人员96人,管理人员40人,后勤服务人员24人,为了了解职工的收入情况,要从中抽取一个容量为20的样本,如何去抽取?方法一:将160人从1到160编上号,然后将用白纸做成的有1~160号的160个号签放入箱内搅匀,最后从中抽取20个签,与签号相同的20个人被选出.方法二:将160人从1至160编号,按编号顺序分成20组,每组8人,令1~8号为第一组,9~16号为第二组,……,153~160号为第20组.从第一组中用抽签方式抽到一个为k号(1≤k≤8),其余组是(k+8n)号(n=1,2,3,…,19),以此抽取20人.方法三:按20∶160=1∶8的比例,从业务员中抽取12人,从管理人员中抽取5人,从后勤服务人员中抽取3人,都用简单随机抽样法从各类人员中抽取所需人数,他们合在一起恰好抽到20人.以上的抽样方法,依次是简单随机抽样、分层抽样、系统抽样的顺序是().A.方法一、方法二、方法三B.方法二、方法一、方法三C.方法一、方法三、方法二D.方法三、方法一、方法二【答案】C【变式2】某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250;②5,9,100,107,111,121,180,195,200,265;③11,38,65,92,119,146,173,200,227,254;④30,57,84,111,138,165,192,219,246,270;关于上述样本的下列结论中,正确的是A.②、③都不能为系统抽样B.②、④都不能为分层抽样C.①、④都可能为系统抽样D.①、③都可能为分层抽样【答案】D例6【思路点拨】先采用分层抽样法确定出此地区城市、县镇、农村应被抽取的个体数,再用分层抽样法将城市应抽取的个体数分配到小学、初中、高中.同理可以完成县镇、农村的分配.【解析】第一步,确定城市、县镇、农村应抽取的个体数.城市、县镇、农村的学生数分别为:357000+226200+11000=695200(人),221600+134200+43300=399100(人),258100+11290+6300=275690(人).因为样本容量与总体容量的比为1∶1000,所以样本中包含的各部分个体数分别为:16952006951000⨯≈(人),13991003991000⨯≈(人),12756902761000⨯≈(人). 第二步,将城市应抽取的个体数分配到小学、初中、高中.因为城市小学、初中、高中的人数比为:357000∶226200∶112000=3570∶2262∶1120=1785∶1131∶560,1785+1131+560=3476,所以城市小学、初中、高中应抽取的人数分别为:69517853572476⨯≈(人),69511312263476⨯≈(人),6955601123476⨯≈(人). 第三步,将县镇应抽取的个体数分配到小学、初中、高中.因为县镇小学、初中、高中的人数比为:221600∶134200∶43300∶2216∶1342∶433,2216+1342+433=3991,所以县镇小学、初中、高中应抽取的人数分别为:39922162223991⨯≈(人),39913421343991⨯≈(人),399433433991⨯≈(人). 第四步,使用同样的方法将农村应抽取的个体数分配到小学、初中、高中.可得农村小学、初中、高中应抽取的人数分别为:258(人),11(人),6(人).第五步,再用合适的方法在对应的各个部分中抽取个体.在各层中所抽取的个体数如下表所示(单位:人):按照上表数目在各层中用合适的方法抽取个体,合在一起形成所需样本.【总结升华】 本题交错使用了分层抽样的方法,像这样比较复杂的问题,在解答的时候可以先将问题分成几个部分,再对各个部分具体解决.举一反三:【变式1】一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人,为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?【解析】 用分层抽样来抽取样本,步骤是:(1)分层.按年龄将职工分成三层:不到35岁的职工;35岁至49岁的职工;50岁及50岁以上的职工.(2)确定每层抽取个体的个数.抽样比为10015005=,则在不到35岁的职工中抽125×15=25(人); 在35岁至49岁的职工中抽280×15=56(人);在50岁及50岁以上的职工中抽95×15=19(人).(3)在各层分别按抽签法或随机数表法抽取样本.(4)综合每层抽样,组成样本.【总结升华】分层后,各层的个体数较多时,可采用系统抽样或随机数表法抽取出各层中的个体,一定要注意按比例抽取.例7.为了考察某校的教学水平,现抽查这个学校高一年级部分学生的本学年考试成绩进行分析.为了全面地反映实际情况,采取以下三种方式进行抽查(已知该校高一年级共有20个班,并且所有学生都已经按随机方式编好了学号,假定该校每班人数都相同):①从全年级20个班中任意抽取一个班,再从该班中任意抽取20人,考察这20个学生的考试成绩;②每个班都抽取1人,共计20人,考察这20个学生的考试成绩;③把该校高一年级的学生按成绩分成优秀、良好、普通三个级别,从中抽取100名学生进行考察(已知按成绩分,该校高一学生中成绩优秀的学生有150名,良好的学生有600名,普通的学生有250名).根据上面的叙述,试回答下列问题:(1)上面三种抽取方式中,其总体、个体、样本分别指什么?每一种抽取方式抽取的样本中,其样本容量分别是多少?(2)上面三种抽取方式中,各自采用何种抽样方法?(3)试分别写出上面三种抽取方式各自抽取样本的步骤.【思路点拨】依据总体和个体的特点,选择抽取样本的方法.【答案】(1)高一年级全体学生的本学年考试成绩,高一年级每个学生本学年的考试成绩,抽取的20名学生本学年的考试成绩.(2)简单随机抽样法,系统抽样法和简单随机抽样法,分层抽样法和简单随机抽样法.(3)略【解析】(1)这三种抽取方式中,其总体都是指该校高一年级全体学生的本学年考试成绩,个体都是指高一年级每个学生本学年的考试成绩.其中第①种抽取方式中样本为所抽取的20名学生本学年的考试成绩,样本容量为20;第②种抽取方式中样本为所抽取的20名学生本学年的考试成绩,样本容量为20;第③种抽取方式中样本为所抽取的100一名学生本学年的考试成绩,样本容量为100.(2)上面三种抽取方式中,第①种方式采用的方法是简单随机抽样法;第②种方式采用的方法是系统抽样法和简单随机抽样法;第③种方式采用的方法是分层抽样法和简单随机抽样法.(3)第①种方式抽样的步骤如下:第一步:首先在这20个班中用抽签法任意抽取一个班.第二步:然后在这个班中按学号用随机数表法或抽签法抽取20名学生,考察其考试成绩.第②种方式抽样的步骤如下:第一步:首先在第一个班中,用简单随机抽样法任意抽取一个学号为n的学生.第二步:在其余的19个班中,选取学号为a+nk(n=1,2,…,19,k为各班人数)的学生,共计19人第三步:前两步所抽个体组成样本.第③种方式抽样的步骤如下:第一步:分层.因为若按成绩分,其中优秀学生共150人,良好学生共600人,普通学生共250人,所以在抽取样本时,应该把全体学生分成三个层次.第二步:确定各个层次抽取的人数.因为样本容量与总体的个体数比为100∶1000=1∶10,所以在每个层次抽取的个体数依次为等,等,哿,即15,60,25.第三步:按层次分别抽取.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.(2015·高考四川卷)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )A .抽签法B .系统抽样法C .分层抽样法D .随机数法C [解析] 根据年级不同产生差异及按人数比例抽取易知应为分层抽样法.2.为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( )A .50B .40C .25D .20C [解析] 根据系统抽样的特点可知分段间隔为1 00040=25,故选C. 3.某地区高中分三类,A 类学校共有学生2 000人,B 类学校共有学生3 000人,C 类学校共有学生4 000人,若采取分层抽样的方法抽取900人,则A 类学校中的学生甲被抽到的概率为( )A.110 B .920C.12 000D .12A [解析] 利用分层抽样,每个学生被抽到的概率是相同的,故所求的概率为9002 000+3 000+4 000=110.4.假设要考察某公司生产的500克袋装牛奶的三聚氰胺是否超标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从随机数表第7行第8列的数开始向右读,则得到的第4个样本个体的编号是________.(下面摘取了随机数表第7行至第9行)84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54[答案] 068简单随机抽样[学生用书P215][典例引领]下面的抽样方法是简单随机抽样的是( ) A .在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为 2 709的为三等奖B .某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C .某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见D .用抽签法从10件产品中选取3件进行质量检验 【解析】 A 、B 是系统抽样,因为抽取的个体间的间隔是固定的;C 是分层抽样,因为总体的个体有明显的层次;D 是简单随机抽样.【答案】D抽签法与随机数法的适用情况(1)抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.(2)一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.[通关练习]1.下列抽样试验中,适合用抽签法的是( )A .从某厂生产的5 000件产品中抽取600件进行质量检验B .从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验C .从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验D .从某厂生产的5 000件产品中抽取10件进行质量检验B [解析] 因为A ,D 中总体的个体数较大,不适合用抽签法;C 中甲、乙两厂生产的产品质量可能差别较大,因此未达到搅拌均匀的条件,也不适合用抽签法;B 中总体容量和样本容量都较小,且同厂生产的产品可视为搅拌均匀了.2.(2017·江西新余第一中学期末)某班对八校联考成绩进行分析,利用随机数表法抽取容量为7的样本时,先将70个同学按01,02,03,…,70进行编号,然后从随机数表第9行第9列的数开始向右读,则选出的第7个个体的编号是( )(注:下面为随机数表的第8行和第9行)63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54A .07B .44C .15D .51 B [解析] 从第9行第9列的数开始,按2位数向右读,大于70和重复的去掉.选出的数依次为29,64,56,07,52,42,44,故第7个个体的编号是44.故选B .系统抽样[学生用书P216][典例引领]采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9,抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C ,则抽到的人中,做问卷B 的人数为( )A .7B .9C .10D .15【解析】 从960人中用系统抽样方法抽取32人,则将整体分成32组,每组30人,因为第一组抽到的号码为9,则第二组抽到的号码为39,第n 组抽到的号码为a n =9+30·(n -1)=30n -21,由451≤30n -21≤750,得23615≤n ≤25710,所以n =16,17,…,25,共有25-16+1=10(人).【答案】C若本例中条件变为“若第5组抽到的号码为129”,求第1组抽到的号码.[解] 设第1组抽到的号码为x ,则第5组抽到的号码为x +(5-1)×30,由x +(5-1)×30=129,解得x =9,因此第1组抽到的号码为9.系统抽样的特点(1)适用于元素个数很多且均衡的总体. (2)各个个体被抽到的机会均等.(3)总体分组后,在起始部分抽样时采用的是简单随机抽样.(4)如果总体容量N 能被样本容量n 整除,则抽样间隔为k =Nn.[通关练习]1.为规范学校办学,某省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是( )A .13B .19C .20D .51C [解析] 由系统抽样的原理知抽样的间隔为524=13,故抽取的样本的编号分别为7,7+13,7+13×2,7+13×3,从而可知选C.2.(2015·高考湖南卷)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.[解析] 35÷7=5,因此可将编号为1~35的35个数据分成7组,每组有5个数据,在区间[139,151]上共有20个数据,分在4个小组中,每组取一人,共取4人.[答案] 4分层抽样[学生用书P216][典例引领](1)(2017·安徽“江南十校”联考)2016年1月1日我国全面二孩政策实施后,某中学的一个学生社团组织了一项关于生育二孩意愿的调查活动.已知该中学所在的城镇符合二孩政策的已婚女性中,30岁以下的约2 400人,30岁至40岁的约3 600人,40岁以上的约6 000人.为了解不同年龄层的女性对生育二孩的意愿是否存在显著差异,该社团用分层抽样的方法从中抽取了一个容量为N 的样本进行调查,已知从30岁至40岁的女性中抽取的人数为60,则N =________.(2)一支田径队有男运动员56人,女运动员m 人,用分层抽样抽出一个容量为n 的样本,在这个样本中随机取一个当队长的概率为128,且样本中的男队员比女队员多4人,则m =________.【解析】 (1)由题意可得3 6002 400+3 600+6 000=60N,故N =200.(2)由题意知n =28,设其中有男队员x 人,女队员有y 人.则错误!解得x =16,y =12,m =42. 【答案】 (1)200(2)42分层抽样问题的解题策略(1)确定抽样比.可依据各层总数与样本数之比,确定抽样比.(2)求某一层的样本数或总体个数.可依据题意求出抽样比,再由某层总体个数(或样本数)确定该层的样本数(或总体数).(3)求各层的样本数.可依据题意,求出各层的抽样比,再求出各层样本数.某企业三月中旬生产A 、B 、C 三种产品共3 000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:看不清楚,统计员记得A产品的样本容量比C 产品的样本容量多10,根据以上信息,可得C 的产品数量是________.[解析] 设样本容量为x ,则x3 000×1 300=130,所以x =300.所以A 产品和C 产品在样本中共有300-130=170(件).设C 产品的样本容量为y ,则y +y +10=170,所以y =80.所以C 产品的数量为3 000300×80=800(件). [答案] 800[学生用书P313(独立成册)]1.对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( )A .p 1=p 2<p 3B .p 2=p 3<p 1C .p 1=p 3<p 2D .p 1=p 2=p 3 D [解析] 由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p 1=p 2=p 3.2.利用简单随机抽样,从n 个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为13,则在整个抽样过程中,每个个体被抽到的概率为( )A.14 B .13C.514D .1027C [解析] 根据题意,9n -1=13,解得n =28.故每个个体被抽到的概率为1028=514.3.某班共有52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号、29号、42号同学在样本中,那么样本中还有一个同学的学号是( )A .10B .11C .12D .16D [解析] 因为29号、42号的号码差为13,所以3+13=16,即另外一个同学的学号是16.4.某校高一、高二、高三学生共有1 290人,其中高一480人,高二比高三多30人,为了解该校学生健康状况,现采用分层抽样方法进行调查,在抽取的样本中有高一学生96人,则该样本中的高三学生人数为( )A .84B .78C .81D .96 B [解析] 因为高一480人,高二比高三多30人,所以设高三有x 人,则x +x +30+480=1 290,解得x =390,故高二420人,高三390人,若在抽取的样本中有高一学生96人,则该样本中的高三学生人数为96480×390=78人.5.(2017·广东肇庆三模)一个总体中有100个个体,随机编号为0,1,2,…,99.依编号顺序平均分成10个小组,组号依次为1,2,…,10.现抽取一个容量为10的样本,规定如果在第1组中随机抽取的号码为m ,那么在第k 组中抽取的号码的个位数字与m +k 的个位数字相同.若m =6,则在第7组中抽取的号码是( )A .63B .64C .65D .66A [解析] 由题设知,若m =6,则在第7组中抽取的号码个位数字与13的个位数字相同,而第7组中数字编号依次为60,61,62,63,…,69,故在第7组中抽取的号码是63.故选A.6.将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样的方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在A 营区,从301到495在B 营区,从496到600在C 营区,则三个营区被抽中的人数依次为( )A .26,16,8B .25,17,8C .25,16,9D .24,17,9 B [解析] 依题意及系统抽样的意义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k (k ∈N *)组抽中的号码是3+12(k -1).令3+12(k -1)≤300,得k ≤1034,因此A 营区被抽中的人数是25;令300<3+12(k -1)≤495,得1034<k ≤42,因此B 营区被抽中的人数是42-25=17.结合各选项知B 正确.7.(2017·河北省“五校联盟”质量检测)某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________.[解析] 设男生抽取x 人,则有45900=x 900-400,解得x =25.[答案] 25 8.(2017·青岛模拟)某班级有50名学生,现要采取系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号1~50号,并分组,第一组1~5号,第二组6~10号,…,第十组46~50号,若在第三组中抽得号码为12的学生,则在第八组中抽得号码为________的学生.[解析] 因为12=5×2+2,即第三组抽出的是第二个同学,所以每一组都应抽出第二个同学,所以第8组中抽出的号码为5×7+2=37号.[答案] 379.一汽车厂生产A ,B ,C 三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):按类型用分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A 类轿车10辆.则z 的值为________.[解析] 设该厂这个月共生产轿车n 辆,由题意得50n =10100+300,所以n =2 000,则z =2 000-100-300-150-450-600=400. [答案] 40010.某报社做了一次关于“什么是新时代的雷锋精神”的问卷调查,在A ,B ,C ,D 四个单位回收的问卷数依次成等差数列,且共回收1 000份,因报道需要,再从回收的问卷中按单位分层抽取容量为150的样本,若在B 单位抽取30份,则在D 单位抽取的问卷是________份.[解析] 由题意依次设在A ,B ,C ,D 四个单位回收的问卷数分别为a 1,a 2,a 3,a 4,在D 单位抽取的问卷数为n ,则有30a 2=1501 000,解得a 2=200,又a 1+a 2+a 3+a 4=1 000,即3a 2+a 4=1 000,所以a 4=400,所以n400=1501 000,解得n =60. [答案] 6011.某初级中学共有学生2 000名,各年级男、女生人数如下表:已知在全校学生中随机抽取1名,抽到初二年级女生的概率是0.19.(1)求x 的值;(2)现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名?[解] (1)因为x2 000=0.19,所以x =380.(2)初三年级人数为y +z =2 000-(373+377+380+370)=500,现用分层抽样的方法在全校抽取48名学生,应在初三年级抽取的人数为482 000×500=12(名).1.在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是( )A .总体B .个体C .样本的容量D .从总体中抽取的一个样本A [解析] 调查的目的是“了解某地5 000名居民某天的阅读时间”,所以“5 000名居民的阅读时间的全体”是调查的总体.2.(2015·高考重庆卷)重庆市2013年各月的平均气温(℃)数据的茎叶图如图,则这组数据的中位数是( )A .19B .20C .21.5D .23B [解析] 由茎叶图可知这组数据由小到大依次为8,9,12,15,18,20,20,23,23,28,31,32,所以中位数为20+202=20.3.(2017·郑州第一次质量预测)我市某校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生人数是________.[解析] 依题意得,成绩低于60分的相应的频率等于(0.005+0.01)×20=0.3,所以该班的学生人数是15÷0.3=50.[答案] 50 4.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为________和________.[解析] 由茎叶图可知甲的平均数为19+18+20+21+23+22+20+31+31+3510=24.乙的平均数为19+17+11+21+24+22+24+30+32+3010=23.[答案] 24 23频率分布直方图(高频考点)[学生用书P218]频率分布直方图是高考的热点,选择题、填空题、解答题都有可能出现.难度一般较小.高考对频率分布直方图的考查主要有以下三个命题角度:(1)求样本的频率、频数;(2)求样本的平均数、众数、中位数;(3)与概率结合考查某区间内的个体被选中的概率.[典例引领](2016·高考四川卷)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x (吨),一位居民的月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.【解】(1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得a=0.30.(2)由(1)可知,100位居民每人的月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x<3.由0.3×(x-2.5)=0.85-0.73,解得x=2.9.所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.(1)频率、频数、样本容量的计算方法①频率组距×组距=频率.②频数样本容量=频率,频数频率=样本容量,样本容量×频率=频数.(2)利用频率分布直方图估计样本的数字特征的思想①中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值.②平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.③众数:在频率分布直方图中,众数是最高矩形的底边中点的横坐标.[题点通关]角度一求样本的频率、频数1.(2016·高考山东卷)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120 D.140D[解析] 由频率分布直方图可知,这200名学生每周的自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,故这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140.故选D.角度二求样本的平均数、众数、中位数2.(2017·贵州省适应性考试)一组样本数据的频率分布直方图如图所示,试估计此样本数据的中位数为()A.13B.12C.11.52 D.1009D[解析] 由频率分布直方图可得第一组的频率是0.08,第二组的频率是0.32,第三组的频率是0.36,则中位数在第三组内,估计样本数据的中位数为10+0.10.36×4=1009,选项D正确.角度三与概率结合考查某区间内的个体被选中的概率3.某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工.根据这50名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为:[40,50),[50,60),…,[80,90),[90,100].(1)求频率分布直方图中a的值;(2)估计该企业的职工对该部门评分不低于80的概率;(3)从评分在[40,60)的受访职工中,随机抽取2人,求此2人的评分都在[40,50)的概率.[解] (1)因为(0.004+a+0.018+0.022×2+0.028)×10=1,所以a =0.006.(2)由所给频率分布直方图知,50名受访职工评分不低于80的频率为(0.022+0.018)×10=0.4,所以该企业职工对该部门评分不低于80的概率的估计值为0.4.(3)受访职工中评分在[50,60)的有:50×0.006×10=3(人),记为A 1,A 2,A 3;受访职工中评分在[40,50)的有:50×0.004×10=2(人),记为B 1,B 2.从这5名受访职工中随机抽取2人,所有可能的结果共有10种,它们是{A 1,A 2},{A 1,A 3},{A 1,B 1},{A 1,B 2},{A 2,A 3},{A 2,B 1},{A 2,B 2},{A 3,B 1},{A 3,B 2},{B 1,B 2}.又因为所抽取2人的评分都在[40,50)的结果有1种,即{B 1,B 2},故所求的概率为110.茎叶图[学生用书P219][典例引领](2017·贵州遵义航天高中模拟)某学生在一门功课的22次考试中,所得分数茎叶图如图所示,则此学生该门功课考试分数的极差与中位数之和为()A .117B .118C .118.5D .119.5【解析】 22次考试中,所得分数最高的为98,最低的为56,所以极差为98-56=42,将分数从小到大排列,中间两数为76,76,所以中位数为76,所以此学生该门功课考试分数的极差与中位数之和为42+76=118.【答案】B茎叶图中的三个关注点(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.(2)重复出现的数据要重复记录,不能遗漏.(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.[通关练习]1.(2017·合肥市第一次教学质量检测)一次数学考试后,某老师从自己所带的两个班级中各抽取5人,记录他们的考试成绩,得到如图所示的茎叶图.已知甲班5名同学成绩的平均数为81,乙班5名同学成绩的中位数为73,则x -y 的值为()A .2B .-2C .3D .-3D [解析] 由题意得,72+77+80+x +86+905=81⇒x =0,易知y =3,所以x -y =-3,故选D .2.为了了解某校教师使用多媒体进行教学的情况,现采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示,如图所示.据此可估计上学期该校400名教师中,使用多媒体进行教学的次数在[16,30)内的人数为()A .100B .160C .200D .280B [解析] 由茎叶图可知在20名教师中,上学期使用多媒体进行教学的次数在[16,30)内的人数为8,据此可以估计400名教师中,使用多媒体进行教学的次数在[16,30)内的人数为400×820=160.样本的数字特征及其应用[学生用书P220][典例引领](2017·贵阳市监测考试)在某校科普知识竞赛前的模拟测试中,得到甲、乙两名学生的6次模拟测试成绩(百分制)的茎叶图.若从甲、乙两名学生中选择一人参加该知识竞赛,你会选哪位?请运用统计学的知识说明理由.【解】学生甲的平均成绩x甲=68+76+79+86+88+956=82,学生乙的平均成绩x 乙=71+75+82+84+86+946=82,又s 2甲=16×[(68-82)2+(76-82)2+(79-82)2+(86-82)2+(88-82)2+(95-82)2]=77,s 2乙=16×[(71-82)2+(75-82)2+(82-82)2+(84-82)2+(86-82)2+(94-82)2]=1673,则x 甲=x 乙,s 2甲>s 2乙,说明甲、乙的平均水平一样,但乙的方差小,即乙发挥更稳定,故可选择学生乙参加知识竞赛.样本数字特征及公式推广(1)平均数和方差都是重要的数字特征,是对总体的一种简明的阐述.平均数、中位数、众数描述总体的集中趋势,方差和标准差描述波动大小.(2)平均数、方差公式的推广若数据x 1,x 2,…,x n 的平均数为x ,方差为s 2,则数据mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m x +a ,方差为m 2s 2.[通关练习]1.(2015·高考广东卷)已知样本数据x 1,x 2,…,x n的均值x =5,则样本数据2x 1+1,2x 2+1,…,2x n +1的均值为________.[解析] 由条件知x =x 1+x 2+…+x n n =5,则所求均值x 0=2x 1+1+2x 2+1+…+2x n +1n=2(x 1+x 2+…+x n )+nn=2x +1=2×5+1=11.[答案] 11 2.(2017·南昌第一次模拟)若1,2,3,4,m 这五个数的平均数为3,则这五个数的方差为________.[解析] 由1+2+3+4+m5=3得m =5,所以这五个数的方差为15[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2.[答案] 2[学生用书P220]——用样本的数字特征估计总体数字特征(本题满分12分)(2017·东北四市联考(二))某小学对五年级的学生进行体质测试,已测得五年级一班30名学生的跳远成绩(单位:cm)用茎叶图统计如图.男生成绩在175 cm 以上(包括175 cm)定义为“合格”,成绩在175 cm 以下(不包括175 cm)定义为“不合格”,女生成绩在165 cm 以上(包括165 cm)定义为“合格”,成绩在165 cm 以下(不包括165 cm)定义为“不合格”.(1)求男生跳远成绩的中位数;(2)如果用分层抽样的方法从男、女生中共抽取5人,求抽取的5人中女生人数;(3)若从男、女生测试成绩“合格”的同学中选取2名参加复试,用X 表示男生被选中的人数,求X 的分布列和数学期望.[思维导图](1)男生跳远成绩的中位数为176+1782=177(cm).(2分)(2)用分层抽样的方法,每个人被抽中的概率是 530=16,(4分) 根据茎叶图,女生共18人,所以抽取的女生有18×16=3(人).(6分)(3)依题意,男、女生测试成绩“合格”的分别有8人、10人.(7分)X 的取值为0,1,2,则P (X =0)=C 210C 218=517,P (X =1)=C 18C 110C 218=80153,P (X =2)=C 28C 218=28153,(10分)X(11分)所以E (X )=89.(12分)(1)解决此类问题要注意审题,理清题中数据,如本例中男女生人数各是多少,合格人数是多少,解答步骤要规范.(2)解决中位数、平均数与方差等问题,不要盲目求解,要先观察数据的特征,寻找运算的捷径,做到事半功倍.[学生用书P378(独立成册)]1.把样本容量为20的数据分组,分组区间与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上的数据的频率是( )A .0.05B .0.25C .0.5D .0.7D [解析] 由题知,在区间[10,50)上的数据的频数是2+3+4+5=14,故其频率为1420=0.7.2.如图茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( )A .2,5B .5,5C .5,8D .8,8C [解析] 由于甲组数据的中位数为15=10+x , 所以x =5.又乙组数据的平均数为9+15+(10+y )+18+245=16.8,所以y =8.所以x ,y 的值分别为5,8. 3.(2017·北京朝阳期末)在一段时间内有2 000辆车通过高速公路上的某处,现随机抽取其中的200辆进行车速统计,统计结果如图所示.若该处高速公路规定正常行驶速度为90~120 km/h ,试估计这2 000辆车中,以正常速度通过该处的汽车有()A .30辆B .300辆C .170辆D .1 700辆D [解析] 直方图中速度为90~120 km/h 的频率为0.03×10+0.035×10+0.02×10=0.85.用样本估计总体,可知2 000辆车中,以正常速度通过该处的汽车约有0.85×2 000=1 700(辆).故选D .4.(2017·邢台摸底考试)样本中共有五个个体,其值分别为0,1,2,3,m .若该样本的平均值为1,则其样本方差为( )A.105B .305C. 2 D .2D [解析] 依题意得m =5×1-(0+1+2+3)=-1,样本方差s 2=15(12+02+12+22+22)=2,即所求的样本方差为2.5.如图是依据某城市年龄在20岁到45岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在[30,35),[35,40),[40,45]的上网人数呈现递减的等差数列分布,则年龄在[35,40)的网民出现的频率为( )A .0.04B .0.06C .0.2D .0.3 C [解析] 由频率分布直方图的知识得,年龄在[20,25)的频率为0.01×5=0.05,[25,30)的频率为0.07×5=0.35,设年龄在[30,35),[35,40),[40,45]的频率为x ,y ,z ,又x ,y ,z 成等差数列,所以可得⎩⎪⎨⎪⎧x +y +z =1-0.05-0.35,x +z =2y ,解得y =0.2,所以年龄在[35,40)的网民出现的频率为0.2.6.如图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为x A 和x B ,样本标准差分别为s A 和s B ,则( )A .x A >xB ,s A >s B B .x A <x B ,s A >s BC .x A >x B ,s A <s BD .x A <x B ,s A <s B B [解析] x A =2.5+10+5+7.5+2.5+106=37.56,x B =15+10+12.5+10+12.5+106=706,显然x A <x B ;s 是标准差,反映的是数据的波动程度,波动程度越大,s 越大,由图可知,样本A 中的数据波动较大,而样本B 中的数据波动较小,故选B .7.为了解学生课外阅读的情况,随机统计了n 名学生的课外阅读时间,所得数据都在[50,150]中,其频率分布直方图如图所示.已知在[50,75)中的频数为100,则n的值为________.[解析] 由图知100n =0.004×25,所以n =1 000.[答案] 1 0008.已知一组数据:a 1,a 2,a 3,a 4,a 5,a 6,a7构成公差为d 的等差数列,且这组数据的方差等于1,则公差d 等于________.[解析] 这组数据的平均数为a 1+a 2+a 3+a 4+a 5+a 6+a 77=7a 47=a 4,又因为这组数据的方差等于1,所以17[(a 1-a 4)2+(a 2-a 4)2+(a 3-a 4)2+(a 4-a 4)2+(a 5-a 4)2+(a 6-a 4)2+(a 7-a 4)2]=9d 2+4d 2+d 2+0+d 2+4d 2+9d 27=1,即4d 2=1,解得d =±12.[答案] ±129.在样本的频率分布直方图中,共有4个小长方形,这4个小长方形的面积由小到大构成等比数列{a n },已知a 2=2a 1,且样本容量为300,则小长方形面积最大的一组的频数为________.[解析] 因为小长方形的面积由小到大构成等比数列{a n },且a 2=2a 1,所以样本的频率构成一个等比数列,且公比为2,所以a 1+2a 1+4a 1+8a 1=15a 1=1,所以a 1=115, 所以小长方形面积最大的一组的频数为300×8a 1=160.[答案] 16010.已知x 是1,2,3,x ,5,6,7这七个数据的中位数且1,2,x 2,-y 这四个数据的平均数为1,则y -1x的最小值为________.[解析] 1+2+x 2-y =4,所以y =x 2-1.由中位数定义知,3≤x ≤5,所以y -1x =x 2-1-1x .当x ∈[3,5]时,函数y =x 2-1与y =-1x 均为增函数,所以y =x 2-1-1x 为增函数,所以⎝⎛⎭⎫y -1x min =8-13=233. [答案]23311.寒假期间,很多同学都喜欢参加“迎春花市摆档口”的社会实践活动,下表是今年某个档口某种精品的销售数据.回厂家.(1)画出表中10个销售数据的茎叶图,并求出这组数据的中位数和平均数;(2)明年花市期间甲、乙两位同学想合租一个摊位销售同样的精品,其中甲、乙分别承包白天、晚上的精品销售,承包时间段内销售所获利润归承包者所有.如果其他条件不变,以今年的数据为依据,甲、乙两位同学应如何分担租金才较为合理?[解] (1)以十位数为茎,个位数为叶,画出茎叶图,如图所示:这组数据的中位数是43+462=44.5,平均数是35+46+32+42+43+50+39+52+51+6010=45.(2)由题意,今年花市期间该摊位所售精品的销售量与时间段有关,明年合租摊位的租金较为合理的分摊方法是根据今年的平均销售量按比例分担,因为今年白天的平均销售量为35+32+43+39+515=40(件/天),今年晚上的平均销售量为46+42+50+52+605=50(件/天),所以甲同学应分担的租金为900×4040+50=400(元),乙同学应分担的租金为900×5040+50=500(元).12.(2016·高考北京卷)某市居民用水拟实行阶梯水价.每人月用水量不超过w 立方米的部分按4元/立方米收费,超出w 立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:。