第43讲 抽样方法、用样本估计总体

合集下载

抽样方法、正态分布

抽样方法、正态分布

抽样方法、正态分布本页仅作为文档封面,使用时可以删除This document is for reference only-rar21year.March抽样方法、正态分布重点、难点讲解:1.抽样的三种方法:简单随机抽样、系统抽样、分层抽样。

后两种方法是建立在第一种方法基础上的。

2.了解如何用样本估计总体: 用样本估计总体的主要方法是用样本的频率分布来估计总体分布,主要有总体中的个体取不同数值很少和较多甚至无限两种情况。

3.正态曲线及其性质:N(),其正态分布函数:f(x)=, x∈(-∞,+∞)。

把N(0,1)称为标准正态分布,相应的函数表达式:f(x)=, x∈(-∞,+∞)。

正态图象的性质:①曲线在x轴的上方,与x轴不相交。

②曲线关于直线x=μ对称。

③曲线在x=μ时位于最高点。

④当x<μ时,曲线上升;当x>μ时,曲线下降,并且当曲线向左、右两边无限延伸时,以x轴为渐近线,向它无限靠近。

⑤当μ一定时,曲线的形状由确定,越大,曲线越“矮胖”,表示总体的分布越分散;越小,曲线越“瘦高”,表示总体的分布越集中。

4.一般正态分布与标准正态分布的转化对于标准正态分布,用表示总体取值小于x0的概率,即=p(x<x0),其几何意义是由正态曲线N(0,1),x轴,直线x=x0所围成的面积。

又根据N(0,1)曲线关于y轴的对称性知,,并且标准正态总体在任一区间(a,b)内取值概率。

任一正态总体N(),其取值小于x的概率F(x)=。

5.了解“小概率事件”和假设检验的思想。

知识应用举例:例1.从503名大学一年级学生中抽取50名作为样本,如何采用系统抽样方法完成这一抽样思路分析:因为总体的个数503,样本的容量50,不能整除,故可采用随机抽样的方法从总体中剔除3个个体,使剩下的个体数500能被样本容量50整除,再用系统抽样方法。

解:第一步:将503名学生随机编号1,2,3,……,503第二步:用抽签法或随机数表法,剔除3个个体,剩下500名学生,然后对这500名学生重新编号。

第53讲 抽样方法、用样本估计总体与正态分布

第53讲 抽样方法、用样本估计总体与正态分布

第53讲 抽样方法、用样品估计总体与正态分布【考点解读】1.了解抽样方法、用样品估计总体的意义。

2.了解正态分布的意义及主要性质.【知识扫描】1.利用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样的方法.(1)一般地,设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。

(2)一般地,要从容量为N 的总体中抽取容量为n 的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。

(3)当已知总体由差异明显的几部分组成时,为了使样本更客观地反映总体的情况,常将总体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫“层”.2.(1)用样本的频率分布估计总体的分布:频率分布表、频率分布直方图、频率折线图、茎叶图 (2)用样本的数字特征估计总体的特征:平均数、中位数、众数、极差、方差、标准差 3.正态分布(1)如果随机变量ξ的概率密度为 φμ,σ(xx ∈(-∞,+∞)其中μ、σ分别表示总体的平均数与标准差,称ξ服从参数为μ、σ的正态分布,记作ξ~N (μ,σ2),函数图象称为正态密度曲线,简称正态曲线.φμ,σ(x )dx ,则称ξ的分一般的,如果对于任何实数a <b ,随机变量ξ满足P (a <ξ≤b )= 布为正态分布(2)标准正态分布在正态分布中,当μ=0,σ=1时,正态总体称为标准正态总体,正态分布N (0,1),称为标准正态分布,记作ξ~N (0,1).(3)正态曲线的性质(ⅰ)曲线在x 轴的上方,与x 轴不相交; (ⅱ)曲线关于直线x =μ对称; (ⅲ)曲线在x =μ时位于最高点;(ⅳ)当x <μ时,曲线上升;当x >μ时,曲线下降,并且当曲线向左、右两边无限延伸时,以x 轴为渐近线向它无限靠近;(ⅴ)当μ一定时,曲线的形状由σ确定,σ越大,曲线越“矮胖”,表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中.(4)若ξ~N (μ,σ2),则E ξ=μ,D ξ=σ2.(5)若X ~N (μ,σ2),则P (μ-σ<X ≤μ+σ)=0.6826, P (μ-2σ<X ≤μ+2σ)=0.9544, P (μ-3σ<X ≤μ+3σ)=0.9974.(6)通常认为服从正态分布N (μ,σ2)的随机变量X 只取(μ-3σ,μ+3σ)之间的值 ,并简称之为3σ原则.22()2x μσ--ba⎰【考计点拔】牛刀小试:1.从编号为150 的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是( )()5,10,15,20,25A ()3,13,23,33B ()1,2,3,4,C ()2,4,6,16,32D 【答案】B2.设随机变量ξ服从正态分布N (2,9),若P (ξ>c +1)=P (ξ<c -1),则c =( )A .1B .2C .3D .4【解析】:选B.∵μ=2,由正态分布的定义知其函数图象关于x =2对称,于是c +1+c -12=2,∴c =2.故选B.3.(2011四川高考)有一个容量为66的样本,数据的分组及各组的频数如下: [11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 1l [31.5,35.5) 12 [35.5.39.5) 7 [39.5,43.5) 3 根据样本的频率分布估计,数据落在[31.5,43.5)的概率约是 (A)16 (B)13 (C)12 (D )23答案:B解析:从31.5到43.5共有22,所以221663P ==。

用样本估计整体的基本步骤

用样本估计整体的基本步骤

用样本估计整体的基本步骤
用样本估计整体的基本步骤通常包括以下几个部分:
1.确定研究目标和总体:首先确定你想要估计的总体,即你
希望得到关于整体特征的估计值。

2.定义样本和抽样方法:确定你将要使用的样本大小和抽样
方法。

样本应该以代表性的方式从总体中选择,以确保估计的结果具有统计学上的可靠性。

3.收集数据:采用所选择的抽样方法从总体中抽取样本,并
收集样本数据。

确保采样过程是随机的,以避免样本选择上的偏差。

4.数据整理和分析:对收集到的样本数据进行整理和分析。

这包括描述性统计分析、计算样本统计量等。

5.估计总体参数:根据样本数据,计算出所需的总体参数的
估计值。

例如,估计总体均值、总体比例等。

这通常涉及到对样本统计量的计算和推断。

6.确定估计的精度和置信水平:评估估计结果的精度和可靠
性。

这可以通过计算估计值的置信区间来完成,确定估计结果所在的范围。

7.结果解释和推断:将估计结果解释给目标受众。

解释估计
结果的含义、置信水平以及可能的限制。

8.结论和报告:根据估计结果,得出结论并撰写报告。

将报
告中包含所采用的方法、数据分析流程、估计结果和相关
的解释。

在用样本估计整体时,确保使用恰当的统计方法和技术,并遵循相关的统计学原则和假设。

此外,维护数据的质量和准确性也是十分重要的,以确保估计结果的可靠性和有效性。

抽样方法与总体分布的估计

抽样方法与总体分布的估计

抽样方法与总体分布的估计●知识梳理1.简单随机抽样:一样地,设一个总体的个体数为N ,假如通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称如此的抽样为简单随机抽样.2.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情形,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样.3.两种抽样方法的比较(略).4.总体:在数理统计中,通常把被研究的对象的全体叫做总体.5.频率分布:用样本估量总体,是研究统计问题的差不多思想方法,样本中所有数据(或数据组)的频数和样本容量的比,确实是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.能够用样本频率表、样本频率分布条形图或频率分布直方图来表示.6.总体分布:从总体中抽取一个个体,确实是一次随机试验,从总体中抽取一个容量为n 的样本,确实是进行了n 次试验,试验连同所显现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布.●点击双基1.为调查参加运动会的1000名运动员的年龄情形,从中抽查了100名运动员的年龄,就那个问题来说,下列说法正确的是A.1000名运动员是总体B.每个运动员是个体C.抽取的100名运动员是样本D.样本容量是1002.一个总体中共有10个个体,用简单随机抽样的方法从中抽取一个容量为3的样本,则某特定个体入样的概率是A.310C 3B.89103⨯⨯C.103 D.101 3.一个容量为n 的样本,分成若干组,已知某数的频数和频率分别为40、0.125,则n 的值为 A.640 B.320 C.240 D.1604.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,在简单随机抽样、系统抽样、分层抽样这三种方法中较合适的抽样方法是___________.那么分数在[100,110)中的频率和分数不满110分的累积频率分别是______________、_______(精确到0.01).●典例剖析【例1】 (2004年湖南,5)某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情形,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情形,记这项调查为②.则完成①、②这两项调查宜采纳的抽样方法依次是A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法【例2】 (2004年福建,15)一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定假如在第1组随机抽取的号码为m ,那么在第k 小组中抽取的号码个位数字与m +k 的个位数字相同.若m =6,则在第7组中抽取的号码是___________.【例3】 把容量为100的某个样本数据分为10组,并填写频率分布表,若前七组的累积频率为0.79,而剩下三组的频数成公比大于2的整数等比数列,则剩下三组中频数最高的一组的频数为___________.(1)列出频率分布表;(2)画出频率分布直方图和累积频率分布图;(3)估量电子元件寿命在100~400 h 以内的概率; (4)估量电子元件寿命在400 h 以上的概率.剖析:通过本题可把握总体分布估量的各种方法和步骤. 解:(1)频率分布表如下:(2)频率分布直方图如下:100 200 300 400 500 600 寿命(h )寿命(h )1.000.800.600.400.20累(3)由累积频率分布图能够看出,寿命在100~400 h 内的电子元件显现的频率为0.65,因此我们估量电子元件寿命在100~400 h 内的概率为0.65.(4)由频率分布表可知,寿命在400 h 以上的电子元件显现的频率为0.20+0.15=0.35,故我们估量电子元件寿命在400 h 以上的概率为0.35.评述:画频率分布条形图、直方图时要注意纵、横坐标轴的意义. ●闯关训练 夯实基础1.(2004年江苏,6)某校为了了解学生的课外阅读情形,随机调查了50名学生,得到他们在某一天各自课外阅读所用时刻的数据,结果用下面的条形图表示,依照条形图可得这50名学生这一天平均每人的课外阅读时刻为2015105人数(人)时间(h )0 0.5 1.0 1.5 2.0A.0.6 hB.0.9 hC.1.0 hD.1.5 h 2.某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上的人,用分层抽样法从中抽取20人,各年龄段分别抽取的人数为A.7,5,8B.9,5,6C.6,5,9D.8,5,73.某单位共有N 个职工,要从N 个职工中采纳分层抽样法抽取n 个样本,已知该单位的某一部门有M 个职员,那么从这一部门中抽取的职工数为___________.4.下图是容量为100的样本的频率分布直方图,试依照图形中的数据填空:组距0.00.00.02样本数据(1)样本数据落在范畴[6,10)内的频率为___________; (2)样本数据落在范畴[10,14)内的频数为___________; (3)总体在范畴[2,6)内的概率约为___________.●思悟小结1.采纳什么抽样方法,要视情形来定:当总体中的个体较少时,一样可用随机抽样;当总体中的个体较多时,一样可用系统抽样;当总体由差异明显的几部分组成时,一样可用分层抽样.2.用样本估量总体,是研究统计问题的一个差不多思想方法.用样本估量总体,本节要紧研究在整体上用样本的频率分布估量总体的分布.教学点睛1.常用的抽样方法有三种:简单随机抽样、系统抽样、分层抽样,其中第一种是最简单、最差不多的抽样方法.三种抽样方法的共同点:差不多上等概率抽样,表达了抽样的公平性;三种抽样方法各有其特点和适用的范畴.2.总体分布反映了总体在各个范畴内取值的概率.当总体中所取不同数值比较少时,常用条形图表示相应样本的频率分布;否则,常用频率分布直方图表示相应样本的频率分布.3.系统抽样的步骤:(1)将总体中的个体随机编号;(2)将编号分段;(3)在第1段中用简单随机抽样确定起始的个体编号;(4)按照事先研究的规则抽取样本.4.分层抽样的步骤:(1)分层;(2)按比例确定每层抽取个体的个数;(3)各层抽样(方法能够不同);(4)汇合成样本.5.解决总体分布估量问题的一样程序如下:(1)先确定分组的组数(最大数据与最小数据之差除以组距得组数);(2)分别运算各组的频数及频率(频率=总数频数);(3)画出频率分布直方图,并作出相应的估量.6.条形图是用其高度表示取各值的频率;直方图是用图形面积的大小表示在各区间内取值的频率;累积频率分布图是一条折线,利用任意两端值的累积频率之差表示样本数据在这两点值之间的频率.。

知识卡片-用样本估计总体

知识卡片-用样本估计总体

用样本估计总体
能量储备
● 在现实生活中,由于人力、物力和时间等因素的限制,常采用抽样调查的方法来了解总体,用样本估计总体的思想是统计中一个重要的内容,在进行抽样调查时,样本抽取是否得当,直接关系到对总体估计的准确程度,为了获得较为准确的调查结果,抽样时要注意所选取的样本要具有代表性。

● 样本估计总体是指通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况.
通关宝典
★ 基础方法点
方法点1:利用样本的相关统计量去估计总体的对应统计量
例1 某鱼塘放养鱼苗10万条.根据这几年的经验知道,鱼苗成活率为95%.一段时间后准备打捞出售.第一次网出40条,称得平均每条鱼重2.5 kg ,第二次网出25条,称得平均每条鱼重2.2 kg ,第三次网出35条,称得平均每条鱼重 2.8 kg ,鱼塘中的鱼总质量大约是________万千克(精确到万位).
分析:先算出三次网得鱼的平均质量,然后估计出鱼塘中鱼的总质量.
解:由题意得三次网得的鱼的平均质量为40×2.5+25×2.2+35×2.840+25+35
=2.53,∴ 鱼塘中的鱼总质量大约是2.53×10×95%=24.035≈24(万千克).
答案:24
蓄势待发
考前攻略
考查用样本估计总体,利用样本的相关统计量去估计总体的对应统计量是统计中的常用方法.常见题型有选择题、填空题,也有解答题,不过难度都不大.
完胜关卡。

《用样本估计总体》 讲义

《用样本估计总体》 讲义

《用样本估计总体》讲义在我们的日常生活和各种科学研究中,常常需要从部分数据(样本)来推断整体的情况(总体)。

这就好像我们通过观察一小部分苹果的质量,来推测整批苹果的质量好坏;或者根据部分学生的考试成绩,来估计整个班级的学习水平。

这种用样本估计总体的方法,是统计学中非常重要的一种手段。

一、为什么要用样本估计总体首先,我们来思考一下,为什么不能直接研究总体呢?这往往是因为总体的数量太大、获取全部数据的成本太高或者根本就不可能获取到全部数据。

比如说,要调查全国所有成年人的身高,这几乎是不可能完成的任务。

但如果我们抽取一部分具有代表性的成年人作为样本,通过对这些样本的测量和分析,就能够对全国成年人的身高情况做出一个相对准确的估计。

用样本估计总体还有一个重要的原因,那就是能够节省时间和资源。

想象一下,如果要对一个大型工厂生产的所有零件进行质量检测,那需要耗费大量的人力、物力和时间。

而通过抽取一定数量的零件作为样本进行检测,就能在较短的时间内,以较小的成本对整批零件的质量有一个大致的了解。

二、样本与总体的关系样本是从总体中抽取出来的一部分个体或观测值。

总体则是我们所关心的研究对象的全体。

样本应该具有代表性,也就是说,样本的特征应该能够反映总体的特征。

举个例子,如果要研究一个城市居民的收入水平,不能只抽取高收入人群作为样本,也不能只抽取低收入人群,而应该按照一定的比例,从不同收入层次的人群中抽取样本,这样得到的样本才能较好地代表总体的收入情况。

样本的大小也会影响估计的准确性。

一般来说,样本越大,估计的准确性就越高。

但样本大小也不是越大越好,因为过大的样本会增加调查的成本和难度。

所以,在实际应用中,需要根据具体情况,选择合适的样本大小。

三、抽样方法为了获得具有代表性的样本,我们需要采用合适的抽样方法。

常见的抽样方法有简单随机抽样、分层抽样和系统抽样。

简单随机抽样是最基本的抽样方法,就是从总体中随机地抽取个体,每个个体被抽取的概率相等。

第一节 抽样方法、用样本估计总体

第一节  抽样方法、用样本估计总体

6.样本的数字特征
返回
(1)众数、中位数、平均数
数字特征
概念
优点与缺点
众数 中位数 平均数
众数通常用于描述变量的值出现
一组数据中重复出 次数最多的数.但显然它对其他
现次数 最多 的数 数据信息的忽视使它无法客观地
反映总体特征
把一组数据按 从小 中位数等分样本数据所占频率,
到大的 顺序排列, 它不受少数几个极端值的影响,
返回
[小题纠偏] 1.已知某商场新进 3 000 袋奶粉,为检查其三聚氰胺是否超标,
现采用系统抽样的方法从中抽取 150 袋检查,若第一组抽出 的号码是 11,则第六十一组抽出的号码为________. 解析:每组袋数:d=3105000=20, 由题意知这些号码是以 11 为首项,20 为公差的等差数列. a61=11+60×20=1 211. 答案:1 211
返回
[由题悟法] 1.茎叶图中的 3 个关注点 (1)“叶”的位置只有一个数字,而“茎”的位置的数字 位数一般不需要统一. (2)重复出现的数据要重复记录,不能遗漏. (3)给定两组数据的茎叶图,估计数字特征,茎上的数字 由小到大排列,一般“重心”下移者平均数较大,数据集中 者方差较小.
返回
2.由频率分布直方图进行相关计算时,需掌握的 2 个关 系式
答案:8
返回
2.(2018·海安质量测试)某校高一年级共有 800 名学生,根据 他们参加某项体育测试的成绩得到了如图所示的频率分 布直方图,则成绩不低于 80 分的学生人数为________.
解析:由题设中提供的频率分布直方图可以看出:不低于 80 分的学生人数为(0.02+0.01)×10×800=240. 答案:240
返回

用样本估算总体

用样本估算总体

用样本估算总体
◎ 用样本估算总体的定义
用样本估计总体的两个手段:
(1)用样本的频率分布估计总体的分布;
(2)用样本的数字特征估计总体的数字特征,需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本的容量越大,估计的结果也就越精确。

◎ 用样本估算总体的知识扩展
用样本估计总体的两个手段:
(1)用样本的频率分布估计总体的分布;
(2)用样本的数字特征估计总体的数字特征,需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本的容量越大,估计的结果也就越精确。

◎ 用样本估算总体的教学目标
1、通过实例,体会用样本估计总体的思想。

2、能够根据统计结果作出合理的判断和推测,能与同学进行交流,用清晰的语言表达自己的观点。

3、根据有关问题查找资料或调查,用随机抽样的方法选取样本,能用样本的平均数和方差,从而对总体有个体有个合理的估计和推测。

◎ 用样本估算总体的考试要求
能力要求:了解
课时要求:40
考试频率:选考
分值比重:2。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第七章概率与统计知识体系【p98】第43讲抽样方法、用样本估计总体夯实基础【p98】【学习目标】1.了解三种抽样方法:简单随机抽样、分层抽样、系统抽样.2.掌握“一表三图”:频率分布表、频率分布直方图、折线图、茎叶图.3.会求“六种数”:众数、中位数、平均数、极差、方差、标准差.【基础检测】1.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是() A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法【解析】显然,调查②为简单随机抽样,而对于调查①,因地区不同产品的销售情况会有差异,因此要采取分层抽样,故选B.【答案】B2.某校1 000名学生中,O型血有450人,A型血有200人,B型血有200人,AB型血有150人,为了研究血型与血弱的关系,从中抽取容量为40的样本,按照分层抽样的方法抽取样本,则O型血,A型血,B型血,AB型血的人应分别抽取的人数为() A.16、10、10、4 B.18、8、8、6C.18、10、10、2 D.15、8、8、9【解析】分层抽样为按比例抽样,则O型血抽取的人数为40×4501 000=18;A型血抽取的人数为40×2001 000=8;B型血抽取的人数为40×2001 000=8;AB型血抽取的人数为40×1501 000=6.故本题答案选B.【答案】B3.滴滴公司为了调查消费者对滴滴打车出行的真实评价,采用系统抽样方法从2 000人中抽取100人做问卷调查,为此将他们随机编号1,2,…,2 000,适当分组后在第一组采用简单随机抽样的方法抽到的号码为9,抽到的100人中,编号落入区间[1,820]的人做问卷A,编号落入区间[821,1 520]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷C的人数为()A.23 B.24 C.25 D.26【解析】若采用系统抽样方法从2 000人中抽取100人做问卷调查,则需要分为100组,每组20人,若第一组抽到的号码为9,则以后每组应抽取的号码分别为29,49,69,89,109,…,所以抽到的号码构成以9为首项,20为公差的等差数列,此等差数列的通项公式为a n=9+20(n-1)=20n-11.由题意可知,落在区间[1 521,2 000]的有:1 521≤20n-11≤2 000,n∈Z,解得:76.6≤n≤100.55,n∈Z,所以77≤n≤100,n∈Z.编号落入区间[1 521,2 000]的有24(人),故选B.【答案】B4.为了解某校高二1 000名学生的体能情况,随机抽查部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是()A.该校高二学生1分钟仰卧起坐的次数超过30次的人数约有200人B.该校高二学生1分钟仰卧起坐的次数少于20次的人数约有20人C.该校高二学生1分钟仰卧起坐的次数的中位数为25.25次D.该校高二学生1分钟仰卧起坐的次数的众数为27.5次【解析】图象的纵坐标是频率比组距,故仰卧起坐的次数超过30次的频率为0.04×5=0.2,故人数有0.2×1 000=200,A是正确的;同理次数少于20次的频率为0.1,人数为100人,故B 是错误的;高二学生1分钟仰卧起坐的次数的中位数为25+x ,则0.1+0.3+0.4×x =0.5,x =0.25.故得到中位数为:25.25,故C 是正确的;众数即出现最多的次数,频率最大的,在25到30之间,取中间值27.5即可,故D 也是正确的.故选B.【答案】B【知识要点】1.抽样方法(1)抽样要具有随机性、等可能性,这样才能通过对样本的分析和研究更准确地反映总体的情况,常用的抽样方法有__简单随机抽样__、__分层抽样__、__系统抽样__.(2)简单随机抽样是指一个总体的个数为N(较小的有限数),通过逐个抽取一个样本,且每次抽取时每个个体被抽取的概率相等.简单随机抽样的两种常用方法为__抽签法和随机数表法__.(3)分层抽样是总体由差异明显的几部分组成,常将总体按差异分成几个部分,然后__按各部分所占的比值进行抽样__,其中所分成的各部分叫作__层__.(4)系统抽样是当总体中的个数较多时,将总体均分成几部分,按事先__确定的规则__在各部分抽取.2.总体分布的估计(1)作频率分布直方图的步骤:①求极差(即一组数据中最大值与最小值的差)②决定组距与组数③将数据分组,以每个组距为底,以各频率除以组距的商为高,分别画矩形,共得k 个矩形,这样得到的图形叫作__频率分布直方图__.频率分布直方图的性质:①第i 个矩形的面积等于样本值落入区间[t i -1,t i )的频率;②由于f 1+f 2+…+f k =1,所以所有小矩形的面积的和为1. (2)连接频率分布直方图中各小长方形上边的中点,就得到频率分布折线图,随着样本容量的增加,折线图会越来越近似于一条光滑曲线,称之为__总体密度曲线__.(3)统计中还有一种被用来表示数据的图叫茎叶图,茎是__中间的一列数__,叶是从__茎旁边上长出来的数__.用茎叶图表示数据有两个突出的优点:一是从统计图上没有原始信息的损失,所有的数据信息都可以从茎叶图中得到;二是茎叶图可以在比赛时随时记录,方便记录与表示.3.平均数和方差的计算(1)如果有n 个数据x 1,x 2,…,x n ,则x =__1n(x 1+x 2+…+x n )__叫作这组数据的平均数,s 2=__1n[(x 1-x)2+(x 2-x)2+…+(x n -x)2] 叫作这组数据的方差,而s 叫作标准差. (2)公式s 2=__1n[(x 21+x 22+…+x 2n )-nx 2] . (3)当一组数据x 1,x 2,…,x n 中各数较大时,可以将各数据减去一个适当的常数a ,得到x 1′=x 1-a ,x 2′=x 2-a ,…,x n ′=x n -a ,则s 2=__1n[(x′21+x′22+…+x′2n )-nx ′2] .4.利用频率分布直方图估计样本的数字特征(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数值.(2)平均数:平均数的估计值等于每个小矩形的面积与矩形底边中点横坐标的乘积之和.(3)众数:最高的矩形的中点的横坐标.(4)极差=最大数-最小的数.典例剖析【p99】考点1频率分布直方图及应用例1某公司对夏季室外工作人员规定如下:当气温超过35 ℃时,室外连续工作时间严禁超过100分钟;不少于60分钟的,公司给予适当补助.随机抽取部分工人调查其高温室外连续工作时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中工作时间范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100].(1)求频率分布直方图中x的值;(2)根据频率分布直方图估计样本数据的中位数;(3)用这个样本的频率分布估计总体分布,将频率视为概率;用分层抽样的方法从享受补助人员和不享受补助人员中抽取25人的样本,检测他们健康状况的变化,那么这两种人员应该各抽取多少人?【解析】(1)由直方图可得:20×(x+0.025 0+0.006 5+0.003 0+0.003 0)=1,解得x=0.012 5.(2)设中位数为t,则20×0.012 5+(t-20)×0.025 0=0.5,得t=30.样本数据的中位数估计为30分钟.(3)享受补助人员占总体的12%,不享受补助人员占总体的88%.因为共抽取25人,所以应抽取享受补助人员25×12%=3人,抽取不享受补助人员25×88%=22人.【小结】从直方图中估计(1)平均数:各组的平均数(矩形底边的中点)×本组的频率(本矩形的面积);(2)众数:最高矩形的底边的中点;(3)中位数:以中位数为界把直方图分成左右两部份,每部分的面积各为0.5.考点2茎叶图及应用例2某厂分别用甲、乙两种工艺生产同一种零件,尺寸在[223,228]内(单位:mm)的零件为一等品,其余为二等品.在两种工艺生产的零件中,各随机抽取10个,其尺寸的茎叶图如图所示:(1)分别计算抽取的两种工艺生产的零件尺寸的平均数;(2)已知甲工艺每天可生产300个零件,乙工艺每天可生产280个零件,一等品利润为30元/个,二等品利润为20元/个.视频率为概率,试根据抽样数据判断采用哪种工艺生产该零件每天获得的利润更高?【解析】(1)x 甲=110(217+218+222+225+226+227+228+231+233+234)=226.1; x 乙=110(218+219+221+224+224+225+226+228+230+232)=224.7. (2)由抽取的样本可知,应用甲工艺生产的产品为一等品的概率为25,二等品的概率为35,故采用甲工艺生产该零件每天取得的利润:w 甲=300×25×30+300×35×20=7 200元; 应用乙工艺生产的产品为一等品、二等品的概率均为12,故采用乙工艺生产该零件每天取得的利润:w 乙=280×12×30+280×12×20=7 000元. 因为w 甲>w 乙,所以采用甲工艺生产该零件每天取得的利润更高.【小结】本题主要考查了统计知识的综合应用,认真审题,同时熟记数据平均数的计算公式和概率的应用,求解甲乙两种工艺生产的利润是解答的关键,着重考查了分析问题和解决问题的能力.考点3 统计图表与概率综合例3经国务院批复同意,重庆成功入围国家中心城市,某校学生社团针对“重庆的发展环境”对20名学生进行问卷调查打分(满分100分),得到如图所示茎叶图:(1)计算男生、女生打分的平均分,并用茎叶图的数字特征评价男生、女生打分谁更分散;(2)如图按照打分区间[50,60)、[60,70)、[70,80)、[80,90)、[90,100]绘制的直方图中,求最高矩形的高h ;(3)从打分在70分以下(不含70分)的同学中抽取3人,求有女生被抽中的概率.【解析】(1)男生打分平均数为110(53+55+62+65+70+71+73+74+81+86)=69, 女生打分平均数为110(68+69+70+75+76+78+79+82+87+96)=78, s 2男>s 2女,说明男生打分数据比较分散(通过观察茎叶图或者众数中位数说明,理由充分即可).(2)h =920÷10=0.045. (3)设“有女生被抽中”为事件A ,打分在70分以下(不含70分)的同学中女生有2人设为a ,b ,男生有4人设为c ,d ,e ,f.基本事件有:abc ,abd ,abe ,abf ,acd ,ace ,acf ,ade ,adf ,aef ,bcd ,bce ,bcf ,bde ,bdf ,bef ,cde ,cdf ,cef ,def 共20种,其中有女生的有16种,所以P (A )=1620=45. 考点4 用数字特征估计总体例4某工厂36名工人的年龄数据如下表.到的年龄数据为44,列出样本的年龄数据;(2)计算(1)中样本的均值x 和方差s 2;(3)36名工人中年龄在x -s 与x +s 之间的有多少人?所占的百分比是多少(精确到0.01%)?【解析】(1)44,40,36,43,36,37,44,43,37.(2)x =44+40+36+43+36+37+44+43+379=40. s 2=19[(44-40)2+(40-40)2+(36-40)2+(43-40)2+(36-40)2+(37-40)2+(44-40)2+(43-40)2+(37-40)2]=1009. (3)40-103=1103,40+103=1303在⎝⎛⎭⎫1103,1303的有23个,占63.89%. 【小结】平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.【能力提升】例5已知某单位有50名职工,现要从中抽取10名职工,将全体职工随机按1~50编号,并按编号顺序平均分成10组,按各组内抽取的编号依次增加5进行系统抽样.(1)若第5组抽出的号码为22,写出所有被抽出职工的号码;(2)分别统计这10名职工的体重(单位:公斤),获得体重数据的茎叶图如图所示,求该样本的方差;(3)在(2)的条件下,从这10名职工中随机抽取两名体重不轻于73公斤(≥73公斤)的职工,求体重为76公斤的职工被抽取到的概率.【解析】(1)由题意,第5组抽出的号码为22.因为k +5×(5-1)=22,所以第1组抽出的号码应该为2,抽出的10名职工的号码分别为2,7,12,17,22,27,32,37,42,47.(2)因为这10名职工的平均体重为x -=110(81+70+73+76+78+79+62+65+67+59)=71, 所以样本方差为:s 2=110(102+12+22+52+72+82+92+62+42+122)=52. (3)从这10名职工中随机抽取两名体重不轻于73公斤的职工,共有10种不同的取法:(73,76),(73,78),(73,79),(73,81),(76,78),(76,79),(76,81),(78,79),(78,81),(79,81).记“体重为76公斤的职工被抽取”为事件A ,它包括的事件有(73,76),(76,78),(76,79),(76,81)共4个.故所求概率为P (A )=410=25.方 法 总 结 【p 101】1.三种抽样方法易混淆,请分清.系统抽样即均分分组,分层抽样例如分男、女层,简单随机抽样例如抽签.2.频率分布直方图中,各组频率是求各矩形的面积.3.理解记忆中位数、众数、平均数的估计方法.走 进 高 考 【p 101】1.(2018·全国卷Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m 3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表(2)估计该家庭使用节水龙头后,日用水量小于0.35 m 3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)【解析】(1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m 3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35 m 3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为x 1=150(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48. 该家庭使用了节水龙头后50天日用水量的平均数为x 2=150(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35. 估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m 3).。

相关文档
最新文档